BH11.11/糖鎖

提供:TogoWiki

移動: 案内, 検索

目次

糖鎖の課題

糖鎖オントロジー
糖鎖の表現方法
糖鎖関連データベースのRDF化
国際連携

糖鎖オントロジー


糖鎖化学のオントロジー(を作るとしたら)に求められること

化学構造が明確な糖鎖(SGP)は化合物と同様に扱う?(化合物オントロジー検討会議[1]
曖昧な部分構造を含む糖鎖が文献レベルで存在する(1次元MS分析などで頻出)
化学構造が不確定な糖鎖(ケラタン硫酸[2]など)が文献レベルで存在する


糖鎖生物学で利用できるオントロジーについて
  • 既存のオントロジー
    • taxonomy: NCBI taxonomy [3]
    • cel line: Cell line ontology
    • pheno type:
    • 必要なものを追記


  • 既存の糖鎖オントロジー[4]
    • GlycO(The Glycomics Ontology)[5]
    • EnzyO(enzymes and enzyme-catalyzed reactions)[6]
    • ReactO
    • ReferO
    • ChEBI[7]
    • 必要なものを追記
糖鎖オントロジー実施事項
  • MIRAGEで記述すべき項目のオントロジーについて、HUPO[8]を参考にマッピングを実施する。

糖鎖統合DBでの方針
  • 分類体系としてのオントロジー開発はしない
  • データベース上に存在する化学構造式を持つ糖鎖を表現できる記述言語を開発する
  • 化学構造の不確定な糖鎖について生化学的な分類名を採用
  • すべての糖鎖にURIを割り振って提供する

糖鎖の表現方法


既存の糖鎖構造の表記法

  • GlydeII[9]
    • 問題点を書く
  • GlycoCT[10]; pubmed
    • 問題点を書く
  • KCF[11]
    • 問題点を書く
  • LINUCS[12]; pubmed
    • linear notation for unique description of carbohydrate sequences. Carbohydr Res. 336:1-11, 2001.
    • 問題点を書く
  • CabosML[13]
    • 問題点を書く
  • SMILES like ? [14]
    • 問題点を書く
  • CFG[15]
    • linear: NeuAcα2-3Galβ1-4(Fucα1-3)GlcNAcβ1-2Manα1-R
    • 2D:
    • 問題点を書く
  • Linear Code®[16] <-- PDF参考になる?
  • Modified Condensed IUPAC, Glycominds Linear Code[17]
    • 問題点を書く
  • IUPAC




問題点

  • 曖昧な構造&混合物を表現できる統一フォーマットがない
    • 修飾糖鎖、何%までわかってる混合物の表現
    • ~グラフ構造の組み合わせで表現できないか検討~


解決する課題など

  • すべての天然糖鎖へ対応可能なフォーマットを新規に開発
  • 既存の主な糖鎖構造の表記法との相互変換システムを新規に開発(MIRAGE ?)
  • 単糖、Linkage、修飾構造(SO3, Ac ...)、修飾部位、などを正規化
    • 正規化すべき項目の列挙


  • 新規フォーマットの種類
    • linear: URIとして利用可能なもの
    • 2D:文字列による糖鎖Tree
    • Picture: SVG, GIF, JPG, PNG, ...:人間用?
    • 必要なものを追記

糖鎖関連データベースのRDF化

国際連携等

  • ACGG-DB
  • MIRAGE[18]:標準化を推進
  • UniProtのようなハブとなるサイト(DB)が無い。=> 糖鎖構造はJCGGDBで構築してMIRAGEなどと連携
  • 糖鎖構造以外(例えばレクチンデータ)のRDF化 ?

今後の予定

  • 新規に正規化された糖鎖表記フォーマットを開発
  • GlycoEpitope[19]内の構造不確定糖鎖に関するデータのRDF化の検討(tool)
  • UniProtのRDFの検証
  • 課題の優先順位をきめる。
  • 役割分担&担当者を決める?


参考

  • Modular Ontology Design Using Canonical Building Blocks in the Biochemistry Domain [20]
  • CFG [21]
  • IUPAC Nomenclature of Carbohydrates [22]

正規化(normalization)

  • Morgan Method: => Morgan, H. L.: J. Chem. Doc. 5, 107 (1965)
  • Extended connectivity in chemical graphs: [23]

Member

加藤雅樹 木下聖子 河野信 澤木弘道 山田一作 鹿内俊秀


Tousa1.JPG Tousa2.JPG Tousa3.JPG

個人用ツール