BH16.12/Proteome

提供:TogoWiki

2016年12月15日 (木) 05:32時点におけるAcyshzw (トーク | 投稿記録)による版
移動: 案内, 検索
  • 参加者:守屋、吉沢、田中、河野、高見

jPOST

  • Isoform, variant, PTM, ペプチドマッチ 等、配列とアノテーションのRDFでの格納方法
    • DNAと一緒にできるところをやる。vg とか?
      • UniProt の isoform は元配列に対する座標が uniprot:annotation で記述してあるが、ID が書いてないので rdfs:comment 内の名前で対応取る必要がある
      • protein isoform の座標系と peptide マッチの座標系
  • 定量データのRDF格納
  • jPOST データベースのstanzaを用いたvisualization
    • PTMブラウザ
  • jPOST のペプチドマッチからタンパク質推定をする部分の開発
    • (DBに蓄えるのはペプチドの情報だが、大多数のユーザーがまず見たいのはタンパク質なので)
    • pepsearch
      • suffix arrayによってインデキシングしたタンパク質配列DBを作成し、「入力した配列タグ(ペプチド配列)を含むタンパク質配列を検索するツール」を開発した
        • もとの配列DBは、例えばUniProtのhuman Fastaファイル
        • 検索はOR検索が可能
    • protein grouping
      • jPOST の再解析から出たペプチド配列のリストから、上記の pepearch を利用して、ペプチドを共有するタンパク質グループを探索し、isoform を考慮して parsimony でタンパク質を推定するスクリプトを書いた

その他

  • アノテーションツール
    • TogoTable, KEGG OC RDF等を利用してオーソログの推定とアノテーション情報の取得
    • 配列IDの変換
  • コラボ:質量分析データを使っているところ(メタボローム、グライコーム?)との何か
    • メタボローム
      • ピークリストに SPLASH つける
        • 複数のソフトを用いるので、スペクトルにピークリストが複数できる。要対応
      • メタボロームをやっているときに「タンパク質のピーク」を(事前に)探知する方法、及びその逆
        • 今後定期的に情報交換?
    • グライコーム
      • a
  • タンパク質絶対定量の比較ツール開発
  • アノテーションのバージョンアップと管理を考える
個人用ツール