BH11.11/セマンティックゲノムアノテーションデータベースの試作
提供:TogoWiki
目次 |
目的
- DBCLSでのゲノムデータベースの開発 -ktym, so
- 環境などの様々なデータを取り込む上でRDFを利用する
- アノテーション編集できるようにしたい
- MicrobeConf (CyanoBase/RhizoBaseのデータソース)のturtle形式でtranscriptなど未対応なデータ表現の対応 -tf
作業手順
- ゲノムDB毎のゲノム情報レポートを構成する要素(Stanza)の調査および整理
- UniProtとCyanoBaseから抽出したstanza確認 -11/21
- stanza洗い出しのために確認するDB調査
- Stanzaを構成する元情報のリストおよびRDF要素をKeynoteにまとめ
- Stanzaを構成するRDF設計
- Visualizationの設計
ゲノムDB毎のゲノム情報レポートを構成する要素(Stanza)の調査および整理
- UniProtとCyanoBaseから抽出したstanza確認 - 事前調査済 -ktym, so
- General summary of organisms
- General summary
- Genomic context
- Transcript attributes
- Protein attributes
- Protein-protein interactions
- Visual annotation format
- Table annotation format
- Homologs (in NR)
- Homologs (in selected orgs)
- Gene annotation (GO etc.)
- References
- External links
- Mutants
- Revision history
- API
セマンティックゲノムアノテーションデータベースで表現したいデータタイプ
- gene (SO:0000704)
- gene_member_region (SO:0000831) - transcript (SO:0000673)
- ncRNA_gene (SO:0001263)
- protein_coding_gene (SO:0001217)
- pseudogene (SO:0000336)
- predicted_gene (SO:0000996)
- fusion_gene (SO:0000287)
- gene_with_polycistronic_transcript (SO:0000690)
- gene_with_trans_spliced_transcript (SO:0000459)
- mobile_genetic_element (SO:0001037)
参考
調査対象のDB
- RDF表現の調査
- UniProt -ktym
- DDBJ, GTPS - 重元さん
- CyanoBase, RhizoBase - tf
- 参考DB
- Refseq
- ensembl, UCSC -内藤さん siRNA、犬田 SRA
- WormBase -GFF3
Stanzaを構成するRDF設計
Visualizationの設計
メンバ
- ktym
- so
- tf