BH13.13/glycodb

提供:TogoWiki

2014年1月30日 (木) 07:09時点におけるIssaku (トーク | 投稿記録)による版
移動: 案内, 検索

目次

糖鎖データベース

糖鎖のRDF化

  • プロテイン名からUniprotのIDを調べるSPARQL

エンドポイントURL: http://beta.sparql.uniprot.org/

SELECT ?uniprot_id 
WHERE
{
 ?id ?label "ConA" .
 ?uniprot_id ?p ?id .
 ?uniprot_id a <http://purl.uniprot.org/core/Protein>
}

糖鎖の連携

メタボロームと糖鎖

目的

金谷Gの糖質が含まれる可能性のある低分子データ(フラボノイド、KNApSAcK)をMolfileToWURCS(Molfile形式からWURCSへ変換するソフト: java)でWURCSに変換し、どの程度糖質が含まれるか調査する。
MolfileToWURCSのデバッグを実施する。
WURCS:糖鎖(質)の線形文字列表記

2014/1/27

有田さんのフラボノイド(FL)のMolfileをWURCSへ変換(Molfile: 有田→山田)。
現時点のWURCS生成プログラムでは、FLの表記法によりMolfileの単糖の種類(立体)を考慮できない問題がある。

2014/1/28 & 30

フラボノイドIDとWURCSをローカルDBへ登録
結果:
フラボノイド分子数 5479
WURCSが生成されたフラボノイドID 3246
生成されたWURCS(糖質) 3963
WURCS(糖質)の種類 1435
例)
FL1A1AGM0001        WURCS=1.0/1,0/[1X11Xm|1,5]
FL7AAAGL0052        WURCS=1.0/5,4/[12X2Xh|1,5][1X12Xh|1,5][1X12Xh|1,5][12X2Xh|1,5][1X12Xh|1,5]1+1-2,2+6-1*OCC=^EC(C^ECC^ZCC^ZC$6)/9O/8O*/3=O|2+1-2,5+6-1*OCC=^EC(CC^ECC^ECC^Z$6)/9O*/8O/3=O|3+1-2,4+6-1*OCC=^EC(CC^ECC^ECC^Z$6)/9O/8O*/3=O|4+1,5+2
http://metabolomics.jp/wiki/FL1A1AGM0001
http://metabolomics.jp/wiki/FL7AAAGL0052


KAApSAcKデータの中の糖質を見つける
金谷さんのKNApSAcKの5万件(1000分子毎に分割)molデータをMol2WURCSソフトでWURCSへ変換(Molfile: 金谷→山田)

結果:
KS_00Kmol~KS_08Kmol => OK
KS_09Kmolで以下の分子からWURCS生成に問題がありそう?
http://kanaya.naist.jp/knapsack_jsp/information.jsp?word=C00009344
KS_09Kmolは、C00009344以外はOK(~999)
KS_10Kmol~KS_33Kmol => OK
KS_34KmolでWURCS生成に時間がかかっているので強制終了。(~52/1000)
http://kanaya.naist.jp/knapsack_jsp/information.jsp?word=C00034052
KS_35KmolでWURCS生成に時間がかかっているので強制終了。(~350/1000)
http://kanaya.naist.jp/knapsack_jsp/information.jsp?word=C00035350
KS_36Kmol~KS_50Kmol => OK

2014/1/29

KS_34Kmolは、C00034052は2時間30分でWURCS生成できた。
KS_35Kmolは、C00035350は1時間以内でWURCS生成できた。
KS_09Kmolの、C00009344は2時間30分でWURCS生成できた。


結果:KNApSAcKのMolfileでWURCSのルールで糖質とみなす構造をすべてWURCSへ変換することができた。

2014/1/30

KNApSAcKから生成されたWURCSをローカルDBへ登録(山田)
KNApSAcK分子数 50000?
WURCSが生成されたKNApSAcK-ID 17207
生成されたWURCS(糖質) 19623
WURCS(糖質)の種類 11050
C00040128
WURCS=1.0/9,8/[12211m|1,5][1211h|1,4][adXdXXdm|1*=O|6*C][adXdXXdm|1*=O|6*C][122h|1,4|3*CO|3*O][X212h|1,5][12122h|1,5][12211m|1,5][12112m|1,5]1+1,2+2|2+1,3+5|3+1,4+5|4+1,9+3|5+1,6+3|6+1,8+4|7+1,8+3|8+1,9+2
同一の糖質部分構造を持つKNApSAcKデータの例:

KNApSAcK-ID     WURCS

C00033248        WURCS=1.0/5,4/[1212h|1,5][1211h|1,5][12122h|1,5][12211m|1,5][12112h|1,5]1+1,3+3|2+1,3+2|3+1,5+4|4+1,5+2
C00033249        WURCS=1.0/5,4/[1212h|1,5][1211h|1,5][12122h|1,5][12211m|1,5][12112h|1,5]1+1,3+3|2+1,3+2|3+1,5+4|4+1,5+2
C00041869        WURCS=1.0/5,4/[1212h|1,5][1211h|1,5][12122h|1,5][12211m|1,5][12112h|1,5]1+1,3+3|2+1,3+2|3+1,5+4|4+1,5+2
C00041870        WURCS=1.0/5,4/[1212h|1,5][1211h|1,5][12122h|1,5][12211m|1,5][12112h|1,5]1+1,3+3|2+1,3+2|3+1,5+4|4+1,5+2
http://kanaya.naist.jp/knapsack_jsp/information.jsp?word=C00041870
同一の糖質部分構造を持つフラボノイドデータの例:

ID                                 WURCS

FL5FACGS0045        WURCS=1.0/1,0/[1XX2Xa|1,5]
FL5FFCGS0007        WURCS=1.0/1,0/[1XX2Xa|1,5]

FL3FACGS0068        WURCS=1.0/1,0/[1XX2Xa|1,5|3*OCC/3=O]
                                                                                   ↑ 上記単糖に”3*OCC/3=O”が修飾されている構造の例


メタボロームデータのアノテーションツールとしての可能性を検討

疾患と糖鎖

担当:新町&奥田

目的

細菌が生産する糖鎖構造の多様性を調べるためのスキームを作成する。

BCSDB(バクテリアが持つ糖鎖構造のDB)とPDO(感染症のオントロジー)との連携
BCSDB
バクテリアが生産する糖鎖構造とその生物種の対応関係
生物種名と疾患名との関係 <- PDOで置き換える

2014/1/27、28

BCSDBから、生物種と糖鎖構造、生物種とその疾患との関係を取得
BCSDBに登録されている疾患の記述とPDOの記述に対応付けを実施
半自動的にプログラムで対応を取った後、手作業ですべてチェック

2014/1/29、30

疾患から糖鎖構造を推測するためのSPARQLの開発
糖鎖構造??種類、バクテリア??種 <- 今ここ

2014/1/31

各疾患毎の糖鎖構造のプロファイルを調べる
糖鎖構造のリストから部分構造抽出

環境微生物と糖鎖

担当:新町&奥田

目的

環境中で合成される糖鎖構造の多様性について調べるためのスキーム開発

「疾患と糖鎖」で作成したスキームでのPDOの部分を環境微生物の情報に置き換えて対応
環境とそこに棲息する微生物種の対応関係

糖鎖構造標準化

脂質

脂質の表記方法はある程度決まっているが国際標準化はない(有田さんから)
文献に記載されている脂質の構造情報もこれまで蓄積された実験的な事実を考慮して記載されている場合が多いらしい。

back to BH13.13

個人用ツール