BH16.12/Proteome

提供:TogoWiki

移動: 案内, 検索
  • 参加者:守屋、吉沢、田中、河野、高見

jPOST

  • Isoform, variant, PTM, ペプチドマッチ 等、配列とアノテーションのRDFでの格納方法
    • DNAと一緒にできるところをやる。vg とか?
      • protein isoform の座標系と peptide マッチの座標系のすり合わせ
        • isoform は isoform 1番に対する座標
        • peptide は各 isoform へ直接マッチさせた座標
      • UniProt の isoform は元配列に対する座標が uniprot:annotation で記述してあるが、isoform ID が入ってない (コメントに rdfs:comment "in isoform Gamma." のように名前はあるが、、、)。なので諦めてペプチドマッピング情報は isoform 毎に扱う
  • 定量データのRDF格納
  • jPOST データベースのstanzaを用いたvisualization
    • PTMブラウザ
  • jPOST のペプチドマッチからタンパク質推定をする部分の開発
    • (DBに蓄えるのはペプチドの情報だが、大多数のユーザーがまず見たいのはタンパク質なので)
    • pepsearch
      • suffix arrayによってインデキシングしたタンパク質配列DBを作成し、「入力した配列タグ(ペプチド配列)を含むタンパク質配列」を検索するツールを開発した
        • GGRNAのようなもんです
        • もとの配列DBは、例えばUniProtのhuman Fastaファイル
        • 検索はOR検索が可能
    • protein grouping
      • jPOST の再解析から出たペプチド配列のリストから、上記の pepsearch を利用して、ペプチドを共有するタンパク質グループを探索し、isoform を考慮して推定数が最小となるようにタンパク質を推定するスクリプトを書いた

その他

  • アノテーションツール
    • TogoTable, KEGG OC RDF等を利用してオーソログの推定とアノテーション情報の取得
    • 配列IDの変換
      • 主にTogoGenome ID Converterを使う
      • IPI → UniProtの変換は(配列類似性などを使う)方法を検討中。結果はLinkDBにも提供?
    • KEGG OC RDF
      • OC介して近縁種のUniProt経由でアノテーションを取ってくる。MBGD も使おうと思ったら落ちてた
  • コラボ:質量分析データを使っているところ(メタボローム、グライコーム?)との何か
    • メタボローム
      • ピークリストに SPLASH つける
        • 複数のソフトを用いるので、スペクトルにピークリストが複数できる。要対応
      • メタボローム解析をやっているときに「タンパク質のピーク」を(事前に)探知する方法、及びその逆
        • (プロテオームの場合)「DB検索で有意な結果が得られなかったらタンパク質じゃない」と判断するのが一般的だが…
        • 今後定期的に情報交換?
    • グライコーム
      • 糖タンパク質、糖ペプチドを jPOST レポジトリに入れる
        • 糖タンパク質のコンプリートサブミッションに対応したら、(jPOSTがProteomeXchangeの)「糖タンパク質分野の」推奨レポジトリになる
      • 再解析は難しいかも
      • 詳細 15日
  • タンパク質絶対定量の比較ツール開発
  • アノテーションのバージョンアップと管理を考える
/mw/BH16.12/Proteome」より作成