ファイル形式について
FASTA形式 (FASTA format)
一行目が > で始まるコメント行
二行目からはテキスト形式のデータ行
<例>
>sp:ACMA_LACLA [Q9CIT4] Probable N-acetylmuramidase precursor
MPVSRIKVKNRHLKKKAKKPLAFYKPATKFAGAVLIAGTLTTTHELLLQQTSPMVQAATN
STEAFIESIAASAKPVADSNGLYPSVMIAQAILESNWGSSQLSRAPYYNLFGIQGTYQGK
ステップ | 使用するサイト | |
ステップ 1 | 未知の塩基配列が与えられる。(今回はmRNAの配列であることは既知とする。) | 未知配列 |
ステップ 2 | 塩基配列をアミノ酸配列に変換する | EBI ORF finder Translate |
ステップ 3 | 得られたアミノ酸配列(タンパク質)はどのようなタンパク質か。類似タンパク質をデータベース検索する (ステップ2で配列が得られなかった場合はここからコピー) | BLAST(ゲノムネット) BLAST(遺伝研) BLAST (NCBI) |
ステップ 4 | 類似タンパク質の配列を比較する | Clustal W(ゲノムネット) Clustal W(遺伝研) |
ステップ 5-1 | モチーフを調べる1 | Motif |
ステップ 5-2 | モチーフを調べる2 | InterProScan |
ステップ 5-3 | モチーフを調べる3 | pfam (France) pfam (UK) |
ステップ 6 | ドメインを調べる | PROSITE |
ステップ 7 | 膜蛋白質を調べる | SOSUI |
ステップ 8 | 局在性を調べる | SLPFA |
ステップ 9 | 立体構造を調べる | PDB PDBj |
この授業の最終目標は、自分の興味がある事項に関して、
を明らかにすることである。(最後にレポートとして提出する)
最初に準備するもの
例えば
病気: disease, syndrom
肥満:obesity
ガン:cancer
腫瘍:tumor
などを用意する。(英語のみ、ゲノムネットのLSD辞書を利用すると良い)
最初は例に従って遺伝子を探してみる。