BH11.11/セマンティックゲノムアノテーションデータベースの試作

提供:TogoWiki

(版間での差分)
移動: 案内, 検索
(作業手順)
(作業手順)
8行: 8行:
# ゲノムDB毎のゲノム情報レポートを構成する要素(Stanza)の調査および整理
# ゲノムDB毎のゲノム情報レポートを構成する要素(Stanza)の調査および整理
## UniProtとCyanoBaseから抽出したstanza確認 -11/21
## UniProtとCyanoBaseから抽出したstanza確認 -11/21
-
## stanza洗い出しのために確認するDB調査
+
## RDF表現のDB調査
## Stanzaを構成する元情報のリストおよびRDF要素をKeynoteにまとめ
## Stanzaを構成する元情報のリストおよびRDF要素をKeynoteにまとめ
# Stanzaを構成するRDF設計
# Stanzaを構成するRDF設計
# Visualizationの設計
# Visualizationの設計
 +
== 作業項目 ==
=== ゲノムDB毎のゲノム情報レポートを構成する要素(Stanza)の調査および整理 ===
=== ゲノムDB毎のゲノム情報レポートを構成する要素(Stanza)の調査および整理 ===
* UniProtとCyanoBaseから抽出したstanza確認 - 事前調査済 -ktym, so [[ファイル:JSBi-poster-page05.png|thumb|right|600px|Typical constitution of seq DBs]]
* UniProtとCyanoBaseから抽出したstanza確認 - 事前調査済 -ktym, so [[ファイル:JSBi-poster-page05.png|thumb|right|600px|Typical constitution of seq DBs]]
31行: 32行:
*# Revision history
*# Revision history
*# API
*# API
 +
 +
=== RDF表現のDB調査 ===
 +
* RDF表現の調査
 +
*# [http://wiki.lifesciencedb.jp/mw/index.php?title=BH11.11/%E3%82%BB%E3%83%9E%E3%83%B3%E3%83%86%E3%82%A3%E3%83%83%E3%82%AF%E3%82%B2%E3%83%8E%E3%83%A0%E3%82%A2%E3%83%8E%E3%83%86%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9%E3%81%AE%E8%A9%A6%E4%BD%9C/UniProt UniProt] -ktym
 +
*# [http://wiki.lifesciencedb.jp/mw/index.php?title=BH11.11/%E3%82%BB%E3%83%9E%E3%83%B3%E3%83%86%E3%82%A3%E3%83%83%E3%82%AF%E3%82%B2%E3%83%8E%E3%83%A0%E3%82%A2%E3%83%8E%E3%83%86%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9%E3%81%AE%E8%A9%A6%E4%BD%9C/DDBJ_GTPS DDBJ, GTPS] - 重元さん
 +
*# [http://wiki.lifesciencedb.jp/mw/index.php?title=BH11.11/%E3%82%BB%E3%83%9E%E3%83%B3%E3%83%86%E3%82%A3%E3%83%83%E3%82%AF%E3%82%B2%E3%83%8E%E3%83%A0%E3%82%A2%E3%83%8E%E3%83%86%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9%E3%81%AE%E8%A9%A6%E4%BD%9C/CyanoBase CyanoBase, RhizoBase]  - tf
 +
 +
* その他の参考DB
 +
*# Refseq
 +
*# ensembl, UCSC -内藤さん siRNA、犬田 SRA
 +
*# WormBase -GFF3
=== セマンティックゲノムアノテーションデータベースで表現したいデータタイプ ===
=== セマンティックゲノムアノテーションデータベースで表現したいデータタイプ ===
44行: 56行:
* '''mobile_genetic_element (SO:0001037)'''
* '''mobile_genetic_element (SO:0001037)'''
-
 
+
==== 参考 ====
-
 
+
-
=== 参考 ===
+
* [http://sequenceontology.org/ Sequence Ontology]
* [http://sequenceontology.org/ Sequence Ontology]
* [http://insdc.org/rna_vocab.html Controlled vocabulary for ncRNA classes@INSDC]
* [http://insdc.org/rna_vocab.html Controlled vocabulary for ncRNA classes@INSDC]
* [http://sequenceontology.org/resources/mapping/FT_SO.html FT SO mapping]
* [http://sequenceontology.org/resources/mapping/FT_SO.html FT SO mapping]
-
=== 調査対象のDB ===
+
 
-
* RDF表現の調査
+
-
*# [http://wiki.lifesciencedb.jp/mw/index.php?title=BH11.11/%E3%82%BB%E3%83%9E%E3%83%B3%E3%83%86%E3%82%A3%E3%83%83%E3%82%AF%E3%82%B2%E3%83%8E%E3%83%A0%E3%82%A2%E3%83%8E%E3%83%86%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9%E3%81%AE%E8%A9%A6%E4%BD%9C/UniProt UniProt] -ktym
+
-
*# [http://wiki.lifesciencedb.jp/mw/index.php?title=BH11.11/%E3%82%BB%E3%83%9E%E3%83%B3%E3%83%86%E3%82%A3%E3%83%83%E3%82%AF%E3%82%B2%E3%83%8E%E3%83%A0%E3%82%A2%E3%83%8E%E3%83%86%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9%E3%81%AE%E8%A9%A6%E4%BD%9C/DDBJ_GTPS DDBJ, GTPS] - 重元さん
+
-
*# [http://wiki.lifesciencedb.jp/mw/index.php?title=BH11.11/%E3%82%BB%E3%83%9E%E3%83%B3%E3%83%86%E3%82%A3%E3%83%83%E3%82%AF%E3%82%B2%E3%83%8E%E3%83%A0%E3%82%A2%E3%83%8E%E3%83%86%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9%E3%81%AE%E8%A9%A6%E4%BD%9C/CyanoBase CyanoBase, RhizoBase]  - tf
+
-
* 参考DB
+
-
*# Refseq
+
-
*# ensembl, UCSC -内藤さん siRNA、犬田 SRA
+
-
*# WormBase -GFF3
+
=== Stanzaを構成するRDF設計 ===
=== Stanzaを構成するRDF設計 ===

2011年11月22日 (火) 05:58時点における版

目次

目的

  • DBCLSでのゲノムデータベースの開発 -ktym, so
    • 環境などの様々なデータを取り込む上でRDFを利用する
    • アノテーション編集できるようにしたい
  • MicrobeConf (CyanoBase/RhizoBaseのデータソース)のturtle形式でtranscriptなど未対応なデータ表現の対応 -tf

作業手順

  1. ゲノムDB毎のゲノム情報レポートを構成する要素(Stanza)の調査および整理
    1. UniProtとCyanoBaseから抽出したstanza確認 -11/21
    2. RDF表現のDB調査
    3. Stanzaを構成する元情報のリストおよびRDF要素をKeynoteにまとめ
  2. Stanzaを構成するRDF設計
  3. Visualizationの設計

作業項目

ゲノムDB毎のゲノム情報レポートを構成する要素(Stanza)の調査および整理

  • UniProtとCyanoBaseから抽出したstanza確認 - 事前調査済 -ktym, so
    Typical constitution of seq DBs
    1. General summary of organisms
    2. General summary
    3. Genomic context
    4. Transcript attributes
    5. Protein attributes
    6. Protein-protein interactions
    7. Visual annotation format
    8. Table annotation format
    9. Homologs (in NR)
    10. Homologs (in selected orgs)
    11. Gene annotation (GO etc.)
    12. References
    13. External links
    14. Mutants
    15. Revision history
    16. API

RDF表現のDB調査

  • その他の参考DB
    1. Refseq
    2. ensembl, UCSC -内藤さん siRNA、犬田 SRA
    3. WormBase -GFF3

セマンティックゲノムアノテーションデータベースで表現したいデータタイプ

  • gene (SO:0000704)
    • gene_member_region (SO:0000831) - transcript (SO:0000673)
    • ncRNA_gene (SO:0001263)
    • protein_coding_gene (SO:0001217)
    • pseudogene (SO:0000336)
    • predicted_gene (SO:0000996)
    • fusion_gene (SO:0000287)
    • gene_with_polycistronic_transcript (SO:0000690)
    • gene_with_trans_spliced_transcript (SO:0000459)
  • mobile_genetic_element (SO:0001037)

参考


Stanzaを構成するRDF設計

Visualizationの設計

メンバ

  • ktym
  • so
  • tf

個人用ツール