BH16.12/Proteome
提供:TogoWiki
- 参加者:守屋、吉沢、田中、河野、高見
jPOST
- Isoform, variant, PTM, ペプチドマッチ 等、配列とアノテーションのRDFでの格納方法
- DNAと一緒にできるところをやる。vg とか?
- UniProt の isoform は元配列に対する座標が uniprot:annotation で記述してあるが、ID が書いてないので rdfs:comment 内の名前で対応取る必要がある
- protein isoform の座標系と peptide マッチの座標系
- DNAと一緒にできるところをやる。vg とか?
- 定量データのRDF格納
- jPOST データベースのstanzaを用いたvisualization
- PTMブラウザ
- jPOST のペプチドマッチからタンパク質推定をする部分の開発
- (DBに蓄えるのはペプチドの情報だが、大多数のユーザーがまず見たいのはタンパク質なので)
- pepsearch
- suffix arrayによってインデキシングしたタンパク質配列DBを作成し、「入力した配列タグ(ペプチド配列)を含むタンパク質配列」を検索するツールを開発した
- GGRNAのようなもんです
- もとの配列DBは、例えばUniProtのhuman Fastaファイル
- 検索はOR検索が可能
- suffix arrayによってインデキシングしたタンパク質配列DBを作成し、「入力した配列タグ(ペプチド配列)を含むタンパク質配列」を検索するツールを開発した
- protein grouping
- jPOST の再解析から出たペプチド配列のリストから、上記の pepearch を利用して、ペプチドを共有するタンパク質グループを探索し、isoform を考慮して parsimony でタンパク質を推定するスクリプトを書いた
その他
- アノテーションツール
- TogoTable, KEGG OC RDF等を利用してオーソログの推定とアノテーション情報の取得
- 配列IDの変換
- コラボ:質量分析データを使っているところ(メタボローム、グライコーム?)との何か
- メタボローム
- ピークリストに SPLASH つける
- 複数のソフトを用いるので、スペクトルにピークリストが複数できる。要対応
- メタボローム解析をやっているときに「タンパク質のピーク」を(事前に)探知する方法、及びその逆
- (プロテオームの場合)「DB検索で有意な結果が得られなかったらタンパク質じゃない」と判断するのが一般的だが…
- 今後定期的に情報交換?
- ピークリストに SPLASH つける
- グライコーム
- 糖タンパク質、糖ペプチドを jPOST レポジトリに入れる
- 糖タンパク質のコンプリートサブミッションに対応したら、(jPOSTがProteomeXchangeの)「糖タンパク質分野の」推奨レポジトリになる
- 再解析は難しいかも
- 詳細 15日
- 糖タンパク質、糖ペプチドを jPOST レポジトリに入れる
- メタボローム
- タンパク質絶対定量の比較ツール開発
- アノテーションのバージョンアップと管理を考える