BH13.13/glycodb
提供:TogoWiki
(版間での差分)
(→メタボロームと糖鎖) |
(→メタボロームと糖鎖) |
||
57行: | 57行: | ||
:結果:KNApSAcKのMolfileでWURCSのルールで糖質とみなす構造をすべてWURCSへ変換することができた。<br> | :結果:KNApSAcKのMolfileでWURCSのルールで糖質とみなす構造をすべてWURCSへ変換することができた。<br> | ||
'''2014/1/30'''<br> | '''2014/1/30'''<br> | ||
- | : | + | : KNApSAcKから生成されたWURCSをローカルDBへ登録(山田)<br> |
+ | ::{| | ||
+ | | KNApSAcK分子数 || 50000? | ||
+ | |- | ||
+ | | WURCSが生成されたKNApSAcK-ID || 17207 | ||
+ | |- | ||
+ | | 生成されたWURCS(糖質) || 19623 | ||
+ | |- | ||
+ | | WURCS(糖質)の種類 || 11050 | ||
+ | |} | ||
+ | |||
<br> | <br> | ||
メタボロームデータのアノテーションツールとしての可能性を検討<br> | メタボロームデータのアノテーションツールとしての可能性を検討<br> |
2014年1月30日 (木) 00:30時点における版
目次 |
糖鎖データベース
糖鎖のRDF化
- プロテイン名からUniprotのIDを調べるSPARQL
エンドポイントURL: http://beta.sparql.uniprot.org/
SELECT ?uniprot_id WHERE { ?id ?label "ConA" . ?uniprot_id ?p ?id . ?uniprot_id a <http://purl.uniprot.org/core/Protein> }
糖鎖の連携
メタボロームと糖鎖
目的
- 金谷Gの糖質が含まれる可能性のある低分子データ(フラボノイド、KNApSAcK)をMolfileToWURCS(Molfile形式からWURCSへ変換するソフト: java)でWURCSに変換し、どの程度糖質が含まれるか調査する。
- MolfileToWURCSのデバッグを実施する。
2014/1/27
- 有田さんのフラボノイド(FL)のMolfileをWURCSへ変換(Molfile: 有田→山田)。
- 現時点のWURCS生成プログラムでは、FLの表記法によりMolfileの単糖の種類(立体)を考慮できない問題がある。
2014/1/28 & 30
- フラボノイドIDとWURCSをローカルDBへ登録
- 結果:
フラボノイド分子数 5479 WURCSが生成されたフラボノイドID 3246 生成されたWURCS(糖質) 3963 WURCS(糖質)の種類 1435
- 例)
WURCS=1.0-BH13.13/2,1/[1X1Xh|1,5|3*OCC/3=O][1X12Xh|1,5]1+1,2+6<<br>
- ”-BH13.13”の文字列は、BH13.13用に追加した文字列で、本来の形式は、"WURCS=1.0/2,1/[1X1Xh|1,5|3*OCC/3=O][1X12Xh|1,5]1+1,2+6" です。
- ”-BH13.13”の文字列は、BH13.13用に追加した文字列で、本来の形式は、"WURCS=1.0/2,1/[1X1Xh|1,5|3*OCC/3=O][1X12Xh|1,5]1+1,2+6" です。
- 例)
KAApSAcKデータの中の糖質を見つける
金谷さんのKNApSAcKの5万件(1000分子毎に分割)molデータをMol2WURCSソフトでWURCSへ変換(Molfile: 金谷→山田)
- 結果:
- KS_00Kmol~KS_08Kmol => OK
- KS_09Kmolで以下の分子からWURCS生成に問題がありそう?
- http://kanaya.naist.jp/knapsack_jsp/information.jsp?word=C00009344
- KS_09Kmolは、C00009344以外はOK(~999)
- http://kanaya.naist.jp/knapsack_jsp/information.jsp?word=C00009344
- KS_10Kmol~KS_33Kmol => OK
- KS_34KmolでWURCS生成に時間がかかっているので強制終了。(~52/1000)
- KS_35KmolでWURCS生成に時間がかかっているので強制終了。(~350/1000)
- KS_34KmolでWURCS生成に時間がかかっているので強制終了。(~52/1000)
- KS_36Kmol~KS_50Kmol => OK
- KS_00Kmol~KS_08Kmol => OK
2014/1/29
- KS_34Kmolは、C00034052は2時間30分でWURCS生成できた。
- KS_35Kmolは、C00035350は1時間以内でWURCS生成できた。
- KS_09Kmolの、C00009344は2時間30分でWURCS生成できた。
- KS_34Kmolは、C00034052は2時間30分でWURCS生成できた。
- 結果:KNApSAcKのMolfileでWURCSのルールで糖質とみなす構造をすべてWURCSへ変換することができた。
2014/1/30
- KNApSAcKから生成されたWURCSをローカルDBへ登録(山田)
KNApSAcK分子数 50000? WURCSが生成されたKNApSAcK-ID 17207 生成されたWURCS(糖質) 19623 WURCS(糖質)の種類 11050
メタボロームデータのアノテーションツールとしての可能性を検討
疾患と糖鎖
- BCSDB(バクテリアが持つ糖鎖構造のDB)とPDO(感染症のオントロジー)との連携(新町、奥田)
- BCSDBから、生物種と糖鎖構造、生物種とその疾患との関係を取得
- BCSDBに登録されている疾患の記述とPDOの記述に対応付けを実施
- 半自動的にプログラムで対応を取った後、手作業ですべてチェック
- 疾患から糖鎖構造を推測するためのSPARQLの開発 <- 今ここ
メタゲノムと糖鎖
- 「疾患と糖鎖」で作成したスキームで、PDOを環境微生物の情報に置き換えて対応
糖鎖構造標準化
脂質
- 脂質の表記方法はある程度決まっているが国際標準化はない(有田さんから)
- 文献に記載されている脂質の構造情報もこれまで蓄積された実験的な事実を考慮して記載されている場合が多いらしい。
back to BH13.13