TPP-onami
提供:TogoWiki
研究開発課題名 | 生命動態システム科学のデータベースの統合化 |
研究代表者 | 大浪 修一 |
所属・役職 | 理化学研究所 生命システム研究センター 発生動態研究チーム チームリーダー |
概 要 | 生命動態システム科学は「生命を動的システムとして理解し操作する生命科学」であり、新たな生命科学の潮流として21世紀の科学全体への大きな影響が期待されています。この分野の研究では、さまざまな生命現象を対象に、時空間情報の数値化を実現した新しい様式の計測データが大量に生産されています。そのため、本課題ではデータの大規模な集積に向けて、この分野の全てのデータベースの開発と並行してデータベースが統合化される体制を構築します。 |
目次 |
参加メンバー
- 京田 耕司(理研)
- 遠里 由佳子(理研)
検討課題
- 時空間情報を数値として含む動態データのメタ情報のRDF化
- 顕微鏡画像のメタ情報のRDF化
SPARQLthon33 (2015/06/22, 23)での進捗
RDF化の方針
- SSBDの時空間動態定量データのメタデータのRDF化の方針の決定。
RDF化の手順
- RIKENメタデータベースを基盤として利用する。
- メタデータに対するExcel表を作成する。
- RDFTableConvertor.jarを利用してTurtle形式のRDFデータを作成する。
- RIKENメタデータベースに登録する。
SPARQLthon30 (03/12, 13)での進捗
RDF/オントロジーに関する情報
ミッション
利用するオントロジー候補
- 生物種:taxonomy ontologyの階層を利用 <organism> :taxon <http://identifiers.org/taxonomy/ 【taxid】>
taxid例: Caenorhabditis elegans 6329, Mus musculus 10090
- 文献:<xxx> :xxx <http://identifiers.org/pubmed/ 【PMid】or http://identifiers.org/doi/ 【doi】>
PMid例: BDML 25414366
- プロセス:<xxx> :xxx <http://identifiers.org/go/ 【go】>
go例: embryogenesis GO:0009790
- もの:<xxx> :xxx <http://identifiers.org/go/ 【go】>
go例: male pronucleus GO:0001940, cell GO:0005623l, nucleus GO:0005634
- 単位:<xxx> :xxx <http://identifiers.org/unit/ 【unit】>
unit例: second UO:0000010, micrometer UO:0000017
- ライセンス <xxx> :xxx <http://creativecommons.org/licenses/ 【type】/4.0/
type例:cc-by: by
RDF化にむけて
- IDを記述
dcterms:identifier “df2a9568-9c33-4b48-b138-46548bccff6d”
- URLの紐付け
xsd:anyURI "http://ssbd.qbic.riken.jp/search/df2a9568-9c33-4b48-b138-46548bccff6d"
- データ→画像への紐付け: FOAFを使用
xmlns:foaf="http://xmlns.com/foaf/0.1/" foaf:depiction
OBOメモ
OBO の内訳 http://www.ontobee.org/index.php
NCBITaxon NCBI organismal classification SAO Subcellular anatomy ontology BSPO Biological Spatial Ontology (ex. anterior-posterior axis BSPO_0000013) WBbt C. elegans gross anatomy WBls C. elegant development WBPhenotype C. elegans phenotype IAO Information Artifact Ontology UO Units of measurement (ex. UO_0000002 質量単位 UO:UO_0000003 時間単位 UO_0000036 単位)
BioAssay Ontology (ex. cellular quality, molecular quality ..)
Turtle/RDF記述
Nuclear division dynamics in B0336.10(RNAi) embryo (rpl-23(RNAi) embryo) of C. elegans を例に ( Link to SSBD database )
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . @prefix owl: <http://www.w3.org/2002/07/owl#> . @prefix xsd: <http://www.w3.org/2001/XMLSchema#> . @prefix dcterms: <http://purl.org/dc/terms/> @prefix obo: <http://purl.obolibrary.org/obo/> . @prefix foaf: <http://xmlns.com/foaf/0.1> . @prefix vcard: <http://www.w3.org/2001/vcard-rdf/3.0#> . @prefix ssbd: <http://ssbd.qbic.riken.jp/> . @prefix ssbd_summary: <http://ssbd.qbic.riken.jp/summary/> . ssbd_summary:df2a9568-9c33-4b48-b138-46548bccff6d a ssbd:quantitative_data ; rdfs:label "nuclear division dynamics" ; # ssbd:dynamics obo:RO_0002162 <http://identifiers.org/go/GO:0005634> ; # RO?? nucleus rdfs:label "wt(N2)030131_01" ; rdfs:comment "Nuclear division dynamics in B0336.10(RNAi) embryo (rpl-23(RNAi) embryo)" ; dcterms:identifier "df2a9568-9c33-4b48-b138-46548bccff6d" ; obo:RO_0002162 <http://identifiers.org/taxonomy/6329> ; # RO:in taxon # ssbd:coautor ssbd:coautor_001 ; # ssbd:contributor ssbd:contributor_001 ; foaf:depiction <http://ssbd.qbic.riken.jp/WEB_static/WEB/th_images/img_26256.jpg> ; dcterms:license <http://creativecommons.org/licenses/by/3.0/> ; dcterms:source <http://ssbd.qbic.riken.jp/data/source/Ce_KK_P002/wt_N2_030131_01.zip> . # 0.105 x 0.105 x 0.5 (micrometer), 40.0 (second) <http://identifiers.org/unit/UO:0000017> ssbd:coauthor_001 a ssbd:corresponding_author ; rdfs:label "Shuichi Onami" vCard:Family "Onami" ; vCard:Given "Shuichii" ; vCard:EMAIL "xxx(at)qbic(dot)riken(dot)jp" ; vCard:Orgname" "RIKEN Quantitative Biology Center" . ssbd:contributour_001 a ssbd:contributor ; rdfs:label "Kyoda Koji" ; vCard:Family "Kyoda" ; vCard:Given "Koji" ; vCard:EMAIL "xxx(at)qbic(dot)riken(dot)jp" ; vCard:Orgname" "RIKEN Quantitative Biology Center" .
BDML内のRDF記述
Nuclear division dynamics in B0336.10(RNAi) embryo (rpl-23(RNAi) embryo) of C. elegans を例に ( Link to SSBD database )
<bdmlDocument> <info metaid="_00001"> <annotation> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dcterm="http://purl.org/dc/terms/" xmlns:cc="http://creativecommons.org/ns#" /> <rdf:Description rdf:about="#_00001"> <dcterms:created rdf:parseType="Resource"> <dcterms:W3CDTF>2014-xx-xx</dcterms:W3CDTF> </dcterms:created> <cc:license rdf:resource="http://creativecommons.org/licenses/by-nc-sa/4.0/" /> </rdf:Description> </annotation> ..... </info> <summary metaid="_00002"> <annotation> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:vcard="http://www.w3.org/2001/vcard-rdf/3.0#" xmlns:bqbiol="http://biomodels.net/biology-qualifiers/" /> <rdf:Description rdf:about="#_00002"> <bqbiol:isVersionOf> <rdf:Bag> <rdf:li rdf:resource="http://identifiers.org/go/GO:0009790" /> </rdf:Bag> </bqbiol:isVersionOf> <bqbiol:hasTaxon> <rdf:Bag> <rdf:li rdf:resource="http://identifiers.org/taxonomy/6329" /> </rdf:Bag> </bqbiol:hasTaxon> <dc:contributor> <rdf:Bag> <rdf:li rdf:parseType="Resource"> <vCard:N rdf:parseType="Resource"> <vCard:Family>Kyoda</vCard:Family> <vCard:Given>Koji</vCard:Given> </vCard:N> <vCard:EMAIL>xxx(at)qbic(dot)riken(dot)jp</vCard:EMAIL> <vCard:ORG rdf:parseType="Resource"> <vCard:Orgname>RIKEN Quantitative Biology Center</vCard:Orgname> </vCard:ORG> </rdf:li> <rdf:li rdf:parseType="Resource"> <vCard:N rdf:parseType="Resource"> <vCard:Family>XXXX</vCard:Family> <vCard:Given>XXXXXXXX</vCard:Given> </vCard:N> <vCard:EMAIL>xxxx(at)qbic(dot)riken(dot)jp</vCard:EMAIL> <vCard:ORG rdf:parseType="Resource"> <vCard:Orgname>RIKEN Genomic Sciences Center</vCard:Orgname> </vCard:ORG> </rdf:li> ..... </rdf:Bag> </dc:contributor> <bqbiol:isDescribedBy> <rdf:Bag> <rdf:li rdf:resource="http://identifiers.org/pubmed/23172286" /> </rdf:Bag> </bqbiol:idDescribedBy> </rdf:Description> </annotation> ..... </summary> <contact metaid="_00003"> <annotation> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:vcard="http://www.w3.org/2001/vcard-rdf/3.0#" /> <rdf:Description rdf:about="#_00003"> <dc:creator> <rdf:Bag> <rdf:li rdf:parseType="Resource"> <vCard:N rdf:parseType="Resource"> <vCard:Family>Shuichi</vCard:Family> <vCard:Given>Onami</vCard:Given> </vCard:N> <vCard:EMAIL>xxxxx(at)qbic(dot)riken(dot)jp</vCard:EMAIL> <vCard:ORG rdf:parseType="Resource"> <vCard:Orgname>RIKEN Quantitative Biology Center</vCard:Orgname> </vCard:ORG> </rdf:li> </rdf:Bag> </dc:creator> </rdf:Description> </annotation> ..... </contact> <methods metaid="_00004"> <annotation> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:foaf="http://xmlns.com/foaf/0.1" /> <rdf:Description rdf:about="#_00004"> <dcterms:source rdf:resource="http://ssbd.qbic.riken.jp/data/source/Ce_KK_P002/RNAi_B0336.10_040518_01.zip" /> <foaf:depiction> <rdf:Bag> <rdf:li rdf:resource="一枚一枚の画像....." /> ..... </rdf:Bag> </foaf:depiction> </rdf:Description> </annotation> ..... </methods> <data> ..... <object metaid="_00005"> <annotation> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:bqbiol="http://biomodels.net/biology-qualifiers/" /> <rdf:Description rdf:about="#_00005"> <bqbiol:is> <rdf:Bag> <rdf:li rdf:resource="http://identifiers.org/go/GO:0005634" /> </rdf:Bag> </bqbiol:is> </rdf:Description> </annotation> ..... </object> ..... </data> </bdmlDocument>
今後の課題
- RDFで記述できる情報の確認
- micrometer per pixel, time intervalなどをどう記述するか: なければOntologyつくる?
- 全メタ情報のRDF化(SSBD & BDML)
- RDFデータ登録、SPARQLエンドポイント設定(SSBD)
- Virtuoso