BH13.13/DDBJ/RefGS

提供:TogoWiki

移動: 案内, 検索

RefGS : Reference Genome Suggest

http://tga.nig.ac.jp/refgs/

入力された配列、ID (taxonomy, BioSample ID, SRX ID) から、Reference Genome (BioProject ID) を返すサービスです。

活用例 ) DNApod : DNA Polymorphism Annotation Database SRAのNGS配列から、マッピングベースでSNPを検出し既知遺伝子構造などのアノテーションを付与したデータベースと解析ワークフロー。 この中で、マッピングに使用するリファレンスの提案に使用しています。

DNApod.jpg


問題 ) 現在、リファレンスの提案を塩基配列をクエリに、RefSeqから作られたRefGS reference geneデータベースに相当性検索を行うことで 提案しているのですが、リファレンスをユニークに提案できていない。 そのため、メタデータ (taxonomy ID, BioSample IDなど) と配列とを使用することで、リファレンスに重み付け (アノテーションが揃っているものなど) をして 提案できないかと考えている。 配列からの提案は、ほぼ開発ができている。 IDからの提案は、未実装。 そのため、BH13.13では、IDからの提案部分の開発をしたい。

また、Referenceの提案部分のstanzaの作成をすることで、RDF,SPARQL,stanzaの理解を深めたい。

RefGS.jpg


やること。

REFストア  BioSampleIDの階層情報 ・・・今後taxonomyはspecies単位 までの管理になる?taxonomyの階層情報の拡張版としてstrainレベルでの系統管理ができているデータベースが欲しい。

                                               Taxonomy ID から BioSample ID への移行対応のディスカッションに参加

SPARQL, STANZAの開発

個人用ツール