BH11.11/セマンティックゲノムアノテーションデータベースの試作

提供:TogoWiki

2011年11月22日 (火) 05:12時点におけるTfuji (トーク | 投稿記録)による版
移動: 案内, 検索

目次

目的

  • DBCLSでのゲノムデータベースの開発 -ktym, so
    • 環境などの様々なデータを取り込む上でRDFを利用する
    • アノテーション編集できるようにしたい
  • MicrobeConf (CyanoBase/RhizoBaseのデータソース)のturtle形式でtranscriptなど未対応なデータ表現の対応 -tf

作業手順

  1. ゲノムDB毎のゲノム情報レポートを構成する要素(Stanza)の調査および整理
    1. UniProtとCyanoBaseから抽出したstanza確認
    2. stanza洗い出しのために確認するDB調査
    3. Stanzaを構成する元情報のリストおよびRDF要素をKeynoteにまとめ
  2. Stanzaを構成するRDF設計
  3. Visualizationの設計

ゲノムDB毎のゲノム情報レポートを構成する要素(Stanza)の調査および整理

  • UniProtとCyanoBaseから抽出したstanza確認 - 事前調査済 -ktym, so
    Typical constitution of seq DBs
    -11/21
    1. General summary of organisms
    2. General summary
    3. Genomic context
    4. Transcript attributes
    5. Protein attributes
    6. Protein-protein interactions
    7. Visual annotation format
    8. Table annotation format
    9. Homologs (in NR)
    10. Homologs (in selected orgs)
    11. Gene annotation (GO etc.)
    12. References
    13. External links
    14. Mutants
    15. Revision history
    16. API

セマンティックゲノムアノテーションデータベースで表現したいデータタイプ

  • gene (SO:0000704)
    • gene_member_region (SO:0000831) - transcript (SO:0000673)
    • ncRNA_gene (SO:0001263)
    • protein_coding_gene (SO:0001217)
    • pseudogene (SO:0000336)
    • predicted_gene (SO:0000996)
    • fusion_gene (SO:0000287)
    • gene_with_polycistronic_transcript (SO:0000690)
    • gene_with_trans_spliced_transcript (SO:0000459)
  • mobile_genetic_element (SO:0001037)


参考

調査対象のDB

Stanzaを構成するRDF設計

Visualizationの設計

メンバ

  • ktym
  • so
  • tf

個人用ツール