SPARQLthon20/dbcatalog
提供:TogoWiki
目次 |
目的
IntegbioデータベースカタログのRDFデータの作成、公開
- SPARQLthon18の続き
/mw/index.php/SPARQLthon18/DBcatalog
HCLS dataset description guidelineを参考に作成した前回までのサンプルについてDCAT (Data Catalog Vocabulary) http://www.w3.org/TR/vocab-dcat/ をもとに再設計する。
DCATをもとにRDFサンプルを再設計する。
- RDFサンプル 5/19/14 ver.
https://docs.google.com/document/d/1a7nlztjD2Y9suf2D_5Fff4v28tcPinnGLOByTTIfkzE/edit?usp=sharing
- RDFスキーマ (作成中) 5/19/14 ver.
https://docs.google.com/spreadsheet/ccc?key=0An9f3gertKxTdG5fQ3BScEEzdWlNS01ickFpbEp4S1E&usp=sharing
dcat:Catalog
<http://integbio.jp/resource/dbcatalog/> a dcat:catalog; dct:title “Integbio Database Catalog”@en; dct:title “Integbioデータベースカタログ”@ja; rdfs:label “Integbio Database Catalog”@en; rdfs:label “Integbioデータベースカタログ”@ja; foaf:homepage <http://integbio.jp/dbcatalog/>; dct:publisher _:a01; dct:language <http://id.loc.gov/vocabulary/iso639-1/en>, <http://id.loc.gov/vocabulary/iso639-1/ja>. _:a01 a foaf:Organization; rdfs:label “Japan Science and Technology Agency National Bioscience Database Center"@en; rdfs:label "独立行政法人科学技術振興機構 バイオサイエンスデータベースセンター"@ja.
dcat:Dataset
<http://integbio.jp/resource/dbcatalog/nbdc01381#dataset> a dcat:Dataset ; dct:identifier "NBDC01381"^^xsd:string; dct:title "Strawberry GARDEN"@en; dct:title "Strawberry GARDEN"@ja; dct:alternative "Strawberry Genome And Resource Entry"@en; dct:alternative "Strawberry Genome And Resource Entry"@ja; dcat:landingPage <http://strawberry-garden.kazusa.or.jp/>; dct:publisher _:b01; dct:description "in preparation"@en; dct:description "食用イチゴのゲノムに関するデータベースです。栽培品種であるFragaria x ananassaのゲノムを近縁野生種4種と比較し、公開されている1品種のゲノム上にマップして得られた遺伝子の、シーケンスやアノテーション情報を収 録しています。データはキーワードやBLASTによる検索が可能です。マーカーリストのデータベースも含んでいます。"@ja; dcat:theme _:c01; dcat:theme _:c02; dcat:theme _:c03; dcat:theme _:c04; dcat:theme _:c05; dcat:theme _:c06; dcat:keyword "Genome"@en; dcat:keyword "Tag sequence (nucleic acid)"@en; dcat:keyword "Organism"@en; dcat:keyword "Sequence"@en; dcat:keyword "ゲノム"@ja; dcat:keyword "タグ配列 (核酸)"@ja; dcat:keyword "個体/種"@ja; dcat:keyword "配列"@ja; cito:citesAsAuthority <http://identifiers.org/pubmed:24282021>; dct:language <http://id.loc.gov/vocabulary/iso639-1/en>; dct:available "Active"@en; dct:available "稼働中"@ja; rdfs:seeAlso http://dbarchive.biosciencedbc.jp/jp/knapsack/desc.html; rdfs:seeAlso http://medals.jp/list/detail/131; _:b01 a foaf:Organization; rdfs:label "Kazusa DNA Research Institute"@en; rdfs:label "かずさディー・エヌ・エー研究所"@ja; rdfs:seeAlso <http://ns.jst.go.jp/id/200905053958299809>; dbpedia:country <http://dbpedia.org/resource/Japan>; _:c01 a skos:Concept ; a sio:SIO_010000; seeAlso <http://identifiers.org/taxonomy/3747>. _:c02 a skos:Concept ; a sio:SIO_010000; seeAlso <http://identifiers.org/taxonomy/64939>. _:c03 a skos:Concept ; a sio:SIO_010000; seeAlso <http://identifiers.org/taxonomy/101012>. _:c04 a skos:Concept ; a sio:SIO_010000; seeAlso <http://identifiers.org/taxonomy/60188>. _:c05 a skos:Concept ; a sio:SIO_010000; seeAlso <http://identifiers.org/taxonomy/101013>. _:c06 a skos:Concept ; a sio:SIO_010000; seeAlso <http://identifiers.org/taxonomy/57918>.
dcat:CatalogRecord
- Japanese
<http://integbio.jp/resource/dbcatalog/nbdc01381#ja_record> a dcat:CatalogRecord; dct:language <http://id.loc.gov/vocabulary/iso639-1/ja>; dct:issued "2014-01-20T00:00:00Z"^^xsd:dateTime; dct:modified "2014-01-20T00:00:00Z"^^xsd:dateTime; foaf:primaryTopic <http://integbio.jp/dbcatalog/record/nbdc01381>.
- English
<http://integbio.jp/resource/dbcatalog/nbdc01381#en_record> a dcat:CatalogRecord; dct:language <http://id.loc.gov/vocabulary/iso639-1/en>; dct:issued "2014-01-20T00:00:00Z"^^xsd:dateTime; dct:modified "2014-01-20T00:00:00Z"^^xsd:dateTime; foaf:primaryTopic <http://integbio.jp/dbcatalog/record/nbdc01381>.
生物種 (NCBI taxonomy IDの記述)
_:c01 a skos:Concept ; a sio:SIO_010000; seeAlso <http://identifiers.org/taxonomy/3747>.
DBCLSのendpoint (テスト環境)にロード、クエリを投げてチューニング
- テスト環境
http://dba.dbcls.jp/sparql グラフ名 http://integbio.jp/dbcatalog
残りの課題
- リソースのURI設計
- 多言語化問題再燃 graphを分ける?
- 他、、
参考
- HCLS dataset description guideline http://htmlpreview.github.io/?https://github.com/joejimbo/HCLSDatasetDescriptions/blob/master/Overview.html
- DCAT (Data Catalog Vocabulary) http://www.w3.org/TR/vocab-dcat/