TPP-onami
提供:TogoWiki
| 研究開発課題名 | 生命動態システム科学のデータベースの統合化 |
| 研究代表者 | 大浪 修一 |
| 所属・役職 | 理化学研究所 生命システム研究センター 発生動態研究チーム チームリーダー |
| 概 要 | 生命動態システム科学は「生命を動的システムとして理解し操作する生命科学」であり、新たな生命科学の潮流として21世紀の科学全体への大きな影響が期待されています。この分野の研究では、さまざまな生命現象を対象に、時空間情報の数値化を実現した新しい様式の計測データが大量に生産されています。そのため、本課題ではデータの大規模な集積に向けて、この分野の全てのデータベースの開発と並行してデータベースが統合化される体制を構築します。 |
目次 |
参加メンバー
- 京田 耕司(理研)
- 遠里 由佳子(理研)
検討課題
- 時空間情報を数値として含む動態データのメタ情報のRDF化
- 顕微鏡画像のメタ情報のRDF化
SPARQLthon33 (2015/06/22, 23)での進捗
RDF化の方針
- SSBDの時空間動態定量データのメタデータのRDF化の方針の決定。
RDF化の手順
- RIKENメタデータベースを基盤として利用する。
- メタデータに対するExcel表を作成する。
- RDFTableConvertor.jarを利用してTurtle形式のRDFデータを作成する。
- RIKENメタデータベースに登録する。
SPARQLthon30 (2015/03/12, 13)での進捗
RDF/オントロジーに関する情報
ミッション
利用するオントロジー候補
- 生物種:taxonomy ontologyの階層を利用 <organism> :taxon <http://identifiers.org/taxonomy/ 【taxid】>
taxid例: Caenorhabditis elegans 6329, Mus musculus 10090
- 文献:<xxx> :xxx <http://identifiers.org/pubmed/ 【PMid】or http://identifiers.org/doi/ 【doi】>
PMid例: BDML 25414366
- プロセス:<xxx> :xxx <http://identifiers.org/go/ 【go】>
go例: embryogenesis GO:0009790
- もの:<xxx> :xxx <http://identifiers.org/go/ 【go】>
go例: male pronucleus GO:0001940, cell GO:0005623l, nucleus GO:0005634
- 単位:<xxx> :xxx <http://identifiers.org/unit/ 【unit】>
unit例: second UO:0000010, micrometer UO:0000017
- ライセンス <xxx> :xxx <http://creativecommons.org/licenses/ 【type】/4.0/
type例:cc-by: by
RDF化にむけて
- IDを記述
dcterms:identifier “df2a9568-9c33-4b48-b138-46548bccff6d”
- URLの紐付け
xsd:anyURI "http://ssbd.qbic.riken.jp/search/df2a9568-9c33-4b48-b138-46548bccff6d"
- データ→画像への紐付け: FOAFを使用
xmlns:foaf="http://xmlns.com/foaf/0.1/" foaf:depiction
OBOメモ
OBO の内訳 http://www.ontobee.org/index.php
NCBITaxon NCBI organismal classification SAO Subcellular anatomy ontology BSPO Biological Spatial Ontology (ex. anterior-posterior axis BSPO_0000013) WBbt C. elegans gross anatomy WBls C. elegant development WBPhenotype C. elegans phenotype IAO Information Artifact Ontology UO Units of measurement (ex. UO_0000002 質量単位 UO:UO_0000003 時間単位 UO_0000036 単位)
BioAssay Ontology (ex. cellular quality, molecular quality ..)
Turtle/RDF記述
Nuclear division dynamics in B0336.10(RNAi) embryo (rpl-23(RNAi) embryo) of C. elegans を例に ( Link to SSBD database )
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . @prefix owl: <http://www.w3.org/2002/07/owl#> . @prefix xsd: <http://www.w3.org/2001/XMLSchema#> . @prefix dcterms: <http://purl.org/dc/terms/> @prefix obo: <http://purl.obolibrary.org/obo/> . @prefix foaf: <http://xmlns.com/foaf/0.1> . @prefix vcard: <http://www.w3.org/2001/vcard-rdf/3.0#> . @prefix ssbd: <http://ssbd.qbic.riken.jp/> . @prefix ssbd_summary: <http://ssbd.qbic.riken.jp/summary/> . ssbd_summary:df2a9568-9c33-4b48-b138-46548bccff6d a ssbd:quantitative_data ; rdfs:label "nuclear division dynamics" ; # ssbd:dynamics obo:RO_0002162 <http://identifiers.org/go/GO:0005634> ; # RO?? nucleus rdfs:label "wt(N2)030131_01" ; rdfs:comment "Nuclear division dynamics in B0336.10(RNAi) embryo (rpl-23(RNAi) embryo)" ; dcterms:identifier "df2a9568-9c33-4b48-b138-46548bccff6d" ; obo:RO_0002162 <http://identifiers.org/taxonomy/6329> ; # RO:in taxon # ssbd:coautor ssbd:coautor_001 ; # ssbd:contributor ssbd:contributor_001 ; foaf:depiction <http://ssbd.qbic.riken.jp/WEB_static/WEB/th_images/img_26256.jpg> ; dcterms:license <http://creativecommons.org/licenses/by/3.0/> ; dcterms:source <http://ssbd.qbic.riken.jp/data/source/Ce_KK_P002/wt_N2_030131_01.zip> . # 0.105 x 0.105 x 0.5 (micrometer), 40.0 (second) <http://identifiers.org/unit/UO:0000017> ssbd:coauthor_001 a ssbd:corresponding_author ; rdfs:label "Shuichi Onami" vCard:Family "Onami" ; vCard:Given "Shuichii" ; vCard:EMAIL "xxx(at)qbic(dot)riken(dot)jp" ; vCard:Orgname" "RIKEN Quantitative Biology Center" . ssbd:contributour_001 a ssbd:contributor ; rdfs:label "Kyoda Koji" ; vCard:Family "Kyoda" ; vCard:Given "Koji" ; vCard:EMAIL "xxx(at)qbic(dot)riken(dot)jp" ; vCard:Orgname" "RIKEN Quantitative Biology Center" .
BDML内のRDF記述
Nuclear division dynamics in B0336.10(RNAi) embryo (rpl-23(RNAi) embryo) of C. elegans を例に ( Link to SSBD database )
<bdmlDocument>
<info metaid="_00001">
<annotation>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dcterm="http://purl.org/dc/terms/"
xmlns:cc="http://creativecommons.org/ns#" />
<rdf:Description rdf:about="#_00001">
<dcterms:created rdf:parseType="Resource">
<dcterms:W3CDTF>2014-xx-xx</dcterms:W3CDTF>
</dcterms:created>
<cc:license rdf:resource="http://creativecommons.org/licenses/by-nc-sa/4.0/" />
</rdf:Description>
</annotation>
.....
</info>
<summary metaid="_00002">
<annotation>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:vcard="http://www.w3.org/2001/vcard-rdf/3.0#"
xmlns:bqbiol="http://biomodels.net/biology-qualifiers/" />
<rdf:Description rdf:about="#_00002">
<bqbiol:isVersionOf>
<rdf:Bag>
<rdf:li rdf:resource="http://identifiers.org/go/GO:0009790" />
</rdf:Bag>
</bqbiol:isVersionOf>
<bqbiol:hasTaxon>
<rdf:Bag>
<rdf:li rdf:resource="http://identifiers.org/taxonomy/6329" />
</rdf:Bag>
</bqbiol:hasTaxon>
<dc:contributor>
<rdf:Bag>
<rdf:li rdf:parseType="Resource">
<vCard:N rdf:parseType="Resource">
<vCard:Family>Kyoda</vCard:Family>
<vCard:Given>Koji</vCard:Given>
</vCard:N>
<vCard:EMAIL>xxx(at)qbic(dot)riken(dot)jp</vCard:EMAIL>
<vCard:ORG rdf:parseType="Resource">
<vCard:Orgname>RIKEN Quantitative Biology Center</vCard:Orgname>
</vCard:ORG>
</rdf:li>
<rdf:li rdf:parseType="Resource">
<vCard:N rdf:parseType="Resource">
<vCard:Family>XXXX</vCard:Family>
<vCard:Given>XXXXXXXX</vCard:Given>
</vCard:N>
<vCard:EMAIL>xxxx(at)qbic(dot)riken(dot)jp</vCard:EMAIL>
<vCard:ORG rdf:parseType="Resource">
<vCard:Orgname>RIKEN Genomic Sciences Center</vCard:Orgname>
</vCard:ORG>
</rdf:li>
.....
</rdf:Bag>
</dc:contributor>
<bqbiol:isDescribedBy>
<rdf:Bag>
<rdf:li rdf:resource="http://identifiers.org/pubmed/23172286" />
</rdf:Bag>
</bqbiol:idDescribedBy>
</rdf:Description>
</annotation>
.....
</summary>
<contact metaid="_00003">
<annotation>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:vcard="http://www.w3.org/2001/vcard-rdf/3.0#" />
<rdf:Description rdf:about="#_00003">
<dc:creator>
<rdf:Bag>
<rdf:li rdf:parseType="Resource">
<vCard:N rdf:parseType="Resource">
<vCard:Family>Shuichi</vCard:Family>
<vCard:Given>Onami</vCard:Given>
</vCard:N>
<vCard:EMAIL>xxxxx(at)qbic(dot)riken(dot)jp</vCard:EMAIL>
<vCard:ORG rdf:parseType="Resource">
<vCard:Orgname>RIKEN Quantitative Biology Center</vCard:Orgname>
</vCard:ORG>
</rdf:li>
</rdf:Bag>
</dc:creator>
</rdf:Description>
</annotation>
.....
</contact>
<methods metaid="_00004">
<annotation>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:foaf="http://xmlns.com/foaf/0.1" />
<rdf:Description rdf:about="#_00004">
<dcterms:source rdf:resource="http://ssbd.qbic.riken.jp/data/source/Ce_KK_P002/RNAi_B0336.10_040518_01.zip" />
<foaf:depiction>
<rdf:Bag>
<rdf:li rdf:resource="一枚一枚の画像....." />
.....
</rdf:Bag>
</foaf:depiction>
</rdf:Description>
</annotation>
.....
</methods>
<data>
.....
<object metaid="_00005">
<annotation>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:bqbiol="http://biomodels.net/biology-qualifiers/" />
<rdf:Description rdf:about="#_00005">
<bqbiol:is>
<rdf:Bag>
<rdf:li rdf:resource="http://identifiers.org/go/GO:0005634" />
</rdf:Bag>
</bqbiol:is>
</rdf:Description>
</annotation>
.....
</object>
.....
</data>
</bdmlDocument>
今後の課題
- RDFで記述できる情報の確認
- micrometer per pixel, time intervalなどをどう記述するか: なければOntologyつくる?
- 全メタ情報のRDF化(SSBD & BDML)
- RDFデータ登録、SPARQLエンドポイント設定(SSBD)
- Virtuoso