BH16.12/Proteome

提供:TogoWiki

(版間での差分)
移動: 案内, 検索
(その他)
(その他)
32行: 32行:
*** IPI → UniProtの変換は(配列類似性などを使う)方法を検討中。結果はLinkDBにも提供?
*** IPI → UniProtの変換は(配列類似性などを使う)方法を検討中。結果はLinkDBにも提供?
** [http://dev.jpost.org/keggoc/ KEGG OC RDF]
** [http://dev.jpost.org/keggoc/ KEGG OC RDF]
-
*** OC介してGO取ってくる。MBGD も使おうと思ったら落ちてた
+
*** OC介して近縁種のUniProt経由でアノテーションを取ってくる。MBGD も使おうと思ったら落ちてた
-
<pre>
+
-
PREFIX orth: <http://purl.jp/bio/11/orth#>
+
-
PREFIX uniprot: <http://purl.uniprot.org/core/>
+
-
PREFIX dct: <http://purl.org/dc/terms/>
+
-
SELECT ?tax REPLACE (STR(?go), "http://purl.obolibrary.org/obo/", "") ?go_label COUNT (?go) AS ?count
 
-
WHERE {
 
-
  ?oc orth:member/orth:member/orth:crossReference <http://identifiers.org/uniprot/Q16181> ;
 
-
      a orth:OrthologGroup ;
 
-
      orth:taxonRangeName ?tax ;
 
-
      orth:member+ ?genes .
 
-
  ?genes a orth:Gene ;
 
-
        orth:crossReference/rdfs:seeAlso ?uniprot .
 
-
  FILTER( REGEX( ?uniprot, 'uniprot'))
 
-
  SERVICE <http://dev.togogenome.org/sparql-test> {
 
-
    GRAPH <http://togogenome.org/graph/uniprot> {
 
-
      ?uniprot uniprot:classifiedWith ?go .
 
-
        FILTER (REGEX (?go, "GO_"))
 
-
        ?go rdfs:label ?go_label
 
-
    }
 
-
  }
 
-
}
 
-
ORDER BY DESC(?count)
 
-
</pre>
 
* コラボ:質量分析データを使っているところ(メタボローム、グライコーム?)との何か
* コラボ:質量分析データを使っているところ(メタボローム、グライコーム?)との何か
** メタボローム
** メタボローム

2016年12月16日 (金) 01:22時点における版

  • 参加者:守屋、吉沢、田中、河野、高見

jPOST

  • Isoform, variant, PTM, ペプチドマッチ 等、配列とアノテーションのRDFでの格納方法
    • DNAと一緒にできるところをやる。vg とか?
      • protein isoform の座標系と peptide マッチの座標系のすり合わせ
        • isoform は isoform 1番に対する座標
        • peptide は各 isoform へ直接マッチさせた座標
      • UniProt の isoform は元配列に対する座標が uniprot:annotation で記述してあるが、isoform ID が入ってない (コメントに rdfs:comment "in isoform Gamma." のように名前はあるが、、、)。なので諦めてペプチドマッピング情報は isoform 毎に扱う
  • 定量データのRDF格納
  • jPOST データベースのstanzaを用いたvisualization
    • PTMブラウザ
  • jPOST のペプチドマッチからタンパク質推定をする部分の開発
    • (DBに蓄えるのはペプチドの情報だが、大多数のユーザーがまず見たいのはタンパク質なので)
    • pepsearch
      • suffix arrayによってインデキシングしたタンパク質配列DBを作成し、「入力した配列タグ(ペプチド配列)を含むタンパク質配列」を検索するツールを開発した
        • GGRNAのようなもんです
        • もとの配列DBは、例えばUniProtのhuman Fastaファイル
        • 検索はOR検索が可能
    • protein grouping
      • jPOST の再解析から出たペプチド配列のリストから、上記の pepearch を利用して、ペプチドを共有するタンパク質グループを探索し、isoform を考慮して parsimony でタンパク質を推定するスクリプトを書いた

その他

  • アノテーションツール
    • TogoTable, KEGG OC RDF等を利用してオーソログの推定とアノテーション情報の取得
    • 配列IDの変換
      • 主にTogoGenome ID Converterを使う
      • IPI → UniProtの変換は(配列類似性などを使う)方法を検討中。結果はLinkDBにも提供?
    • KEGG OC RDF
      • OC介して近縁種のUniProt経由でアノテーションを取ってくる。MBGD も使おうと思ったら落ちてた
  • コラボ:質量分析データを使っているところ(メタボローム、グライコーム?)との何か
    • メタボローム
      • ピークリストに SPLASH つける
        • 複数のソフトを用いるので、スペクトルにピークリストが複数できる。要対応
      • メタボローム解析をやっているときに「タンパク質のピーク」を(事前に)探知する方法、及びその逆
        • (プロテオームの場合)「DB検索で有意な結果が得られなかったらタンパク質じゃない」と判断するのが一般的だが…
        • 今後定期的に情報交換?
    • グライコーム
      • 糖タンパク質、糖ペプチドを jPOST レポジトリに入れる
        • 糖タンパク質のコンプリートサブミッションに対応したら、(jPOSTがProteomeXchangeの)「糖タンパク質分野の」推奨レポジトリになる
      • 再解析は難しいかも
      • 詳細 15日
  • タンパク質絶対定量の比較ツール開発
  • アノテーションのバージョンアップと管理を考える
個人用ツール