BH13.13/DDBJ/RefGS
提供:TogoWiki
RefGS : Reference Genome Suggest
入力された配列、ID (taxonomy, BioSample ID, SRX ID) から、Reference Genome (BioProject ID) を返すサービスです。
活用例 ) DNApod : DNA Polymorphism Annotation Database SRAのNGS配列から、マッピングベースでSNPを検出し既知遺伝子構造などのアノテーションを付与したデータベースと解析ワークフロー。 この中で、マッピングに使用するリファレンスの提案に使用しています。
問題 )
現在、リファレンスの提案を塩基配列をクエリに、RefSeqから作られたRefGS reference geneデータベースに相当性検索を行うことで
提案しているのですが、リファレンスをユニークに提案できていない。
そのため、メタデータ (taxonomy ID, BioSample IDなど) と配列とを使用することで、リファレンスに重み付け (アノテーションが揃っているものなど) をして
提案できないかと考えている。
配列からの提案は、ほぼ開発ができている。
IDからの提案は、未実装。
そのため、BH13.13では、IDからの提案部分の開発をしたい。
また、Referenceの提案部分のstanzaの作成をすることで、RDF,SPARQL,stanzaの理解を深めたい。
やること。
REFストア BioSampleIDの階層情報 ・・・今後taxonomyはspecies単位 までの管理になる?taxonomyの階層情報の拡張版としてstrainレベルでの系統管理ができているデータベースが欲しい。
Taxonomy ID から BioSample ID への移行対応のディスカッションに参加
SPARQL, STANZAの開発