BH16.12/Proteome

提供:TogoWiki

2016年12月15日 (木) 16:18時点におけるAcyshzw (トーク | 投稿記録)による版
移動: 案内, 検索
  • 参加者:守屋、吉沢、田中、河野、高見

jPOST

  • Isoform, variant, PTM, ペプチドマッチ 等、配列とアノテーションのRDFでの格納方法
    • DNAと一緒にできるところをやる。vg とか?
      • protein isoform の座標系と peptide マッチの座標系のすり合わせ
        • isoform は isoform 1番に対する座標
        • peptide は各 isoform へ直接マッチさせた座標
      • UniProt の isoform は元配列に対する座標が uniprot:annotation で記述してあるが、isoform ID が入ってない (コメントに rdfs:comment "in isoform Gamma." のように名前はあるが、、、)。なので諦めてペプチドマッピング情報は isoform 毎に扱う
  • 定量データのRDF格納
  • jPOST データベースのstanzaを用いたvisualization
    • PTMブラウザ
  • jPOST のペプチドマッチからタンパク質推定をする部分の開発
    • (DBに蓄えるのはペプチドの情報だが、大多数のユーザーがまず見たいのはタンパク質なので)
    • pepsearch
      • suffix arrayによってインデキシングしたタンパク質配列DBを作成し、「入力した配列タグ(ペプチド配列)を含むタンパク質配列」を検索するツールを開発した
        • GGRNAのようなもんです
        • もとの配列DBは、例えばUniProtのhuman Fastaファイル
        • 検索はOR検索が可能
    • protein grouping
      • jPOST の再解析から出たペプチド配列のリストから、上記の pepearch を利用して、ペプチドを共有するタンパク質グループを探索し、isoform を考慮して parsimony でタンパク質を推定するスクリプトを書いた

その他

  • アノテーションツール
    • TogoTable, KEGG OC RDF等を利用してオーソログの推定とアノテーション情報の取得
    • 配列IDの変換
      • 主にTogoGenome ID Converterを使う
      • IPI → UniProtの変換は(配列類似性などを使う)方法を検討中。結果はLinkDBにも提供?
    • KEGG OC RDF
      • OC介してGO取ってくる。MBGD も使おうと思ったら落ちてた
PREFIX orth: <http://purl.jp/bio/11/orth#>
PREFIX uniprot: <http://purl.uniprot.org/core/>
PREFIX dct: <http://purl.org/dc/terms/>

SELECT ?tax REPLACE (STR(?go), "http://purl.obolibrary.org/obo/", "") ?go_label COUNT (?go) AS ?count
WHERE {
  ?oc orth:member/orth:member/orth:crossReference <http://identifiers.org/uniprot/Q16181> ;
      a orth:OrthologGroup ;
      orth:taxonRangeName ?tax ;
      orth:member+ ?genes .
  ?genes a orth:Gene ;
         orth:crossReference/rdfs:seeAlso ?uniprot .
  FILTER( REGEX( ?uniprot, 'uniprot'))
  SERVICE <http://dev.togogenome.org/sparql-test> {
    GRAPH <http://togogenome.org/graph/uniprot> {
      ?uniprot uniprot:classifiedWith ?go .
        FILTER (REGEX (?go, "GO_"))
        ?go rdfs:label ?go_label
    }
  }
}
ORDER BY DESC(?count)
  • コラボ:質量分析データを使っているところ(メタボローム、グライコーム?)との何か
    • メタボローム
      • ピークリストに SPLASH つける
        • 複数のソフトを用いるので、スペクトルにピークリストが複数できる。要対応
      • メタボローム解析をやっているときに「タンパク質のピーク」を(事前に)探知する方法、及びその逆
        • (プロテオームの場合)「DB検索で有意な結果が得られなかったらタンパク質じゃない」と判断するのが一般的だが…
        • 今後定期的に情報交換?
    • グライコーム
      • 糖タンパク質、糖ペプチドを jPOST レポジトリに入れる
        • 糖タンパク質のコンプリートサブミッションに対応したら、(jPOSTがProteomeXchangeの)「糖タンパク質分野の」推奨レポジトリになる
      • 再解析は難しいかも
      • 詳細 15日
  • タンパク質絶対定量の比較ツール開発
  • アノテーションのバージョンアップと管理を考える
個人用ツール