生命情報科学

インターネット上のデータベースを利用して遺伝子について調べる

ライフサイエンス統合データベースサイト

よく使われるバイオインフォマティクスツールサイト

ファイル形式について
FASTA形式 (FASTA format)
一行目が　>　で始まるコメント行
二行目からはテキスト形式のデータ行

＜例＞
>sp:ACMA_LACLA [Q9CIT4] Probable N-acetylmuramidase precursor
MPVSRIKVKNRHLKKKAKKPLAFYKPATKFAGAVLIAGTLTTTHELLLQQTSPMVQAATN
STEAFIESIAASAKPVADSNGLYPSVMIAQAILESNWGSSQLSRAPYYNLFGIQGTYQGK

＜未知配列からどのような情報が得られるか。＞

ステップ	目的	使用するサイト
ステップ 1	未知の塩基配列が与えられる。（今回はmRNAの配列であることは既知とする。）	未知配列
ステップ 2	塩基配列をアミノ酸配列に変換する	EBI ORF finder Translate
ステップ 3	得られたアミノ酸配列（タンパク質）はどのようなタンパク質か。類似タンパク質をデータベース検索する（ステップ２で配列が得られなかった場合はここからコピー）	BLAST（ゲノムネット） BLAST（遺伝研） BLAST (NCBI)
ステップ 4	類似タンパク質の配列を比較する	Clustal W（ゲノムネット） Clustal W（遺伝研）
ステップ 5-1	モチーフを調べる1	Motif
ステップ 5-2	モチーフを調べる2	InterProScan
ステップ 5-3	モチーフを調べる3	pfam (France) pfam (UK)
ステップ 6	ドメインを調べる	PROSITE
ステップ 7	膜蛋白質を調べる	SOSUI
ステップ 8	局在性を調べる	SLPFA
ステップ 9	立体構造を調べる	PDB PDBj