TogoWS, TogoDB の開発

提供:TogoWiki

2010年10月20日 (水) 06:21時点におけるKtym (トーク | 投稿記録)による版
移動: 案内, 検索

目次

TogoWS, TogoDB の開発

TogoWS

DDBJ, PDBj のキーワード検索

http//togows.dbcls.jp/search で ddbj, pdbj に対応できていないのは、 オリジナルサイトでキーワード検索用の API がどれかよくわかっていなかったから。

PDBj のキーワード検索

SQL を POST すると ID が返るサービスがある(金城)ということなので、これを利用する。

たとえば、"alcohol dehydrogenase" というキーワードで検索するには以下のSQLを投げます。

 SELECT pdbid FROM brief_summary where plainto_tsquery('alcohol dehydrogenase') @@ tsv

REST API (SQL Search) はこちらを参照:http://www.pdbj.org/doc/help.cgi?PDBj%20Mine%3aREST%20API

DDBJ のキーワード検索

該当 API があるかどうか確認する。

糖鎖対応

本家 KEGG GLYCAN, AIST JCGGDB に頼むことは難しいため、TogoWS 経由で GLYCAN と JCGGDB の糖鎖検索に Informatics: Cross-Database Search (WGGDS) / Protocol に基づいて対応したい。

GLYDE-II と KCF の変換

GLYDE-II → KCF は木下コンバータ (Perl スクリプト) を利用。

KCF → GLYDE-II は難しいが、BioMoby には変換サービスがある。 BioMoby を bl02 (togows.dbcls.jp) で動かすにはインストールやメンテのオーバーヘッドが大きくなる。 G-language REST API でできないか?

KEGG

使用する KEGG API は search_glycans_by_composition, search_glycans_by_mass, search_glycans_by_kcam の3つ (他の関連APIは convert_mol_to_kcf, search_glycans_by_nameなど)。

JCGGDB

鹿肉

NCBI, EBI, DDBJ, PDBj のサービス全対応を確認

http://togows.dbcls.jp/entry/ の対応データベース

ncbi-nuccore	nuccore
ncbi-nucest	nucest
ncbi-nucgss	nucgss
ncbi-nucleotide	nucleotide
ncbi-protein	protein
ncbi-gene	gene
ncbi-omim	omim
ncbi-homologene	homologene
ncbi-snp	snp
ncbi-mesh	mesh
ncbi-pubmed	pubmed
ebi-embl	embl
ebi-uniprot	uniprot
ebi-uniparc	uniparc
ebi-uniref100	uniref100
ebi-uniref90	uniref90
ebi-uniref50	uniref50
ddbj-ddbj	ddbj
ddbj-dad	dad
pdbj-pdb	pdb
kegg-compound	compound
kegg-drug	drug
kegg-enzyme	enzyme
kegg-genes	genes
kegg-glycan	glycan
kegg-orthology	orthology
kegg-reaction	reaction
kegg-module	module
kegg-pathway	pathway

こらについて、http://togows.dbcls.jp/site/en/rest.html

  • 実例があるかどうか
  • 各データベースでフィールド対応がどれくらいできているか

を調査し、不十分な部分はコーディングし、rest.html に追記する。

また、rest.html が長くなりすぎているのでプロバイダ毎にページを分けて整理する。


TogoDB

個人用ツール