BH13.13/glycodb

提供:TogoWiki

2014年1月29日 (水) 06:40時点におけるIssaku (トーク | 投稿記録)による版
移動: 案内, 検索

目次

糖鎖データベース

糖鎖のRDF化

  • プロテイン名からUniprotのIDを調べるSPARQL

エンドポイントURL: http://beta.sparql.uniprot.org/

SELECT ?uniprot_id 
WHERE
{
 ?id ?label "ConA" .
 ?uniprot_id ?p ?id .
 ?uniprot_id a <http://purl.uniprot.org/core/Protein>
}

糖鎖の連携

メタボロームと糖鎖

目的
金谷Gの糖質が含まれる可能性のある低分子データをMolfile形式からMolfileToWURCSソフトでWURCSに変換し、どの程度糖質が含まれるか調査すると同時に、MolfileToWURCSソフトのデバッグを実施する。
2014/1/27

有田さんのフラボノイド(FL)のMolfileをWURCSへ変換(Molfile: 有田→山田)。
現時点のWURCS精製プログラムでは、FLのMolfileの単糖の種類(立体)を考慮できない問題がある。

2014/1/28

フラボノイドのIDとWURCSをDBへ登録(山田)
結果:
1444種類のWURCSが生成確認(山田)
例)WURCS=1.0-BH13.13/2,1/[1X1Xh|1,5|3*OCC/3=O][1X12Xh|1,5]1+1,2+6
2635個のFLidが見つかった(山田)
3775個のFLidからWURCSが生成された(山田)


KAApSAcKデータの中の糖質を見つける(山田)
金谷さんのKNApSAcKの5万件のmolデータをMol2WURCSソフトでWURCSへ変換(Molfile: 金谷→山田)
結果:

KS_00Kmol~KS_08Kmol => OK
KS_09Kmolで以下の分子からWURCS生成に問題がありそう?
http://kanaya.naist.jp/knapsack_jsp/information.jsp?word=C00009344
KS_09Kmolは、C00009344以外はOK(~999)
KS_10Kmol~KS_33Kmol => OK
KS_34KmolでWURCS生成に時間がかかっているので強制終了。(~52/1000)
http://kanaya.naist.jp/knapsack_jsp/information.jsp?word=C00034052
KS_35KmolでWURCS生成に時間がかかっているので強制終了。(~350/1000)
http://kanaya.naist.jp/knapsack_jsp/information.jsp?word=C00035350
KS_36Kmol~KS_50Kmol => OK

2014/1/29

KS_34Kmolは、C00034052は2時間30分でWURCS生成できた。
C00034052:
WURCS=1.0-BH13.13/3,2/[hXXXXW|4-1,5-3,6:x-2*OC(C^ECC^ECC^ECC^ZC$6/5C^ZCC^EC$4)/15O/14O/13O/11O/10O/9O/8*/7CO*/25=O/3=O|1-1,3-2*OC(CCC^ECC^ECC^ZC$6/5^ECC^ZCC^E$4)/15O/14O/13O/11O/10O/9O/7CO*/24=O/3=O|2*OC(CC^ECCCC$4)/8O/7O/6O/3=O][hXXXXW|4-1,5-3,6:x-2*OC(C^ECC^ECC^ECC^ZC$6/5C^ZCC^EC$4)/15O/14O/13O/11O/10O/9O/8*/7CO*/25=O/3=O|2*OC(CC^ECCCC$4)/8O/7O/6O/3=O][UXXXXh|1-2,2-3,3-1*OC(C^ECC^ECC^ECC^ZC$6/5C^ZCC^EC$4)/15O/14O/13O/11O/10O/9O/8*/7CO*/25=O/3=O|1*O|5*OC(CC^ECCCC$4)/8O/7O/6O/3=O]1+6:x-2,2+1-3,2+3-1*OC(CCC^ECC^ECC^ZC$6/5^ECC^ZCC^E$4)/15O/14O/13O/11O/10O/9O/8*/7CO*/25=O/3=O|2+6:x-2,3+4-1,3+6-3*OC(CCC^ZCC^ECC^ZC$6/5^ECC^ZCC^E$4)/15O/14O/13O/11O/10O/9O/8*/7CO*/25=O/3=O
KS_35Kmolは、C00035350は以外はOK(~999)
KS_09Kmolの、C00009344は2時間30分でWURCS生成できた。
C00009344:
WURCS=1.0-BH13.13/3,2/[h1121W|2-1,4-4,5-3,6:1-2*OC(C^ECCC^ECCC^ECC^ZCC^E$9/8C^ZCC^E$6/5C^ZCC^EC$4)/22O/21O/20O/18O/17O/16O/14O/13O/12O/11*/10CO*/35=O/7CO*/39=O/3=O|1-1,3-2*OC(CCC^ECC^ECC^ZC$6/5^ECC^ZCC^E$4)/15O/14O/13O/11O/10O/9O/7CO*/24=O/3=O][h1121W|2-1,4-4,5-3,6:1-2*OC(C^ECCC^ECCC^ECC^ZCC^E$9/8C^ZCC^E$6/5C^ZCC^EC$4)/22O/21O/20O/18O/17O/16O/14O/13O/12O/11*/10CO*/35=O/7CO*/39=O/3=O][U1H|1*(C)]1+6:1-2,2+1-3,2+3-1*OC(C^ECCC^ECC^ZCC^E$6/5C^ZCC^EC$4)/15O/14O/13O/11O/10O/9O/8*/7CO*/25=O/3=O|2+6:1-3,3+1-1,3+3-2*O(CC^ECC^ECC^E$3)/8*/7O/5O/4*


メタボロームデータのアノテーションツールとしての可能性を検討

疾患と糖鎖

BCSDB(バクテリアが持つ糖鎖構造のDB)とPDO(感染症のオントロジー)との連携(新町、奥田)
BCSDBから、生物種と糖鎖構造、生物種とその疾患との関係を取得
BCSDBに登録されている疾患の記述とPDOの記述に対応付けを実施
半自動的にプログラムで対応を取った後、手作業ですべてチェック
疾患から糖鎖構造を推測するためのSPARQLの開発

メタゲノムと糖鎖

「疾患と糖鎖」で作成したスキームで、PDOを環境微生物の情報に置き換えて対応

糖鎖構造標準化

脂質


back to BH13.13

個人用ツール