PubChemRDF

提供:TogoWiki

(版間での差分)
移動: 案内, 検索
(FTP サイト)
(語彙)
15行: 15行:
-
= 語彙 =
+
= 語彙とオントロジーにもとづくデータ統合 =
= URI の構造 =
= URI の構造 =
= PubChemRDF サブドメイン =
= PubChemRDF サブドメイン =

2014年2月5日 (水) 12:40時点における版

PubChemRDF の解説を行ないます。PubChemRDF は2014/01/31に公開されました。内容についてはリリースノースに詳しい解説があります。


目次

データの取得

PubChemRDFはFTPサイトREST APIで配布され、ユーザはRDFを取得してRDFストアに格納後SPARQLクエリを実行することができるようになりました。いままでは、XMLやSDFの配布物をFTPサイトもしくはウェブサービスからダウンロードしてから扱っていました。SDFを格納するデータベースはありますが、XMLについては汎用的すぎて、定番の処理は無かったと思います。RDF化によってPubChemの内容を手元で扱うのが手軽になったといえます。

FTP サイト

FTPサイト ftp://ftp.ncbi.nlm.nih.gov/pubchem/RDF/ のデータは週一回更新される。VoID ファイルが ftp://ftp.ncbi.nlm.nih.gov/pubchem/RDF/void.ttl にあり、配布されているデータの量やファイルのリストなどのPubChemRDFのメタデータについて知ることができる。

配布しているRDFは ttl.gz 拡張しのあるTurtle形式をgzip圧縮したものである。

データは分割され、一ファイルに含まれる開始ID xxx から終止ID yyy までのファイル名 xxx_yyy.ttl.gz となっている。

RESTful API

語彙とオントロジーにもとづくデータ統合

URI の構造

PubChemRDF サブドメイン

個人用ツール