BH13.13/bioresource
提供:TogoWiki
目次 |
概要
実験動物のデータフォーマットをRDFにより共通化し,相互にデータ利用が可能となるデータの記述方法を作成する。
データ
- LODに対応しているデータがダウンロードできる理研のページ - http://ja.biolod.org/class/cria315s1i/Mouse_Strain
- 実際に公開されているウェブページ (理研)- http://www2.brc.riken.jp/lab/animal/detail.php?brc_no=RBRC02507
- 実際に公開されているウェブページ(医薬基盤研) - http://animal.nibio.go.jp/j_11prom-cre
進捗
2014-01-27
既に公開されているRDF形式(ここでは,ttl)のデータを参考にして,基盤研の実験動物研究資源バンクのデータをRDF化したサンプルデータをもとに, 理研と基盤研で1対1マッピング出来ないデータや,predicateの使い方に悩む例について高月さんと相談した。(真和吏)
- RDF化を試みたデータの公開されているウェブページ - http://animal.nibio.go.jp/e_11prom-cre.html
<http://purl.jp/bio/13/nbio128/cria315s1ria315u10000000128> #Q. Subjectをどうするのかも,相談した方が良さそうである。 #A. 理研の場合,purlはNBDCの方針を入れて,Property IDを対応させているらしい。 rdf:type BioLOD_class_cria315s1i:Mouse_Strain ; rdfs:label "11Prom-Cre"@en ; cc:attributionURL <http://animal.nibio.go.jp/e_11prom-cre.html> ; BioLOD_property_pria315s15i:Depositor "Noriyuki Tsumaki"@en; BioLOD_property_pria315s19i:description "11Prom-Cre mice specifically express Cre in chondrocytes after the late stage of proliferative chondrocytes. This str BioLOD_property_pria315s13i:taxon <http://purl.jp/bio/13/10090/crib166u26rib166u10090i> ; BioLOD_property_pria315s8i:reference_of_the_resource <http://www.ncbi.nlm.nih.gov/pubmed/18644788>; #Q.文献もpurlの方が良いのだろうか。 #A. PubMed IDがあるものは,purlを使用してリンクを繋げていおり,ないものはテキストで書いている。 BioLOD_property_pria315s14i:BRC_ID "nbio128"@en; #Q. BRC_IDではない方が良いかも。理研ではないので。BioResource IDなら良いのかも。 #A.理研のバイオリソース専門のIDなので,基盤研は基盤研で,語彙体系を作るべき。 BioLOD_property_pria315s16i:Institute_Depositor <http://purl.jp/bio/13/Univ._Osaka/crio2046s1rio2046u1263i> ; #Q. 阪大以上に学部等細かく指定するにはどうすれば良いのか。自動化には何が必要か。ある意味当然だが医薬基盤研究所が入っていなかったので,機関一覧に追加して頂けるだろうか。 #A. 基盤研のマウスであることを明示すれば良い。URIをテキストに戻すかもしれない。 BioLOD_property_pria315s3i:BRC_Strain_Type "mutant"; #Q. 理研のような, <http://purl.jp/bio/13/Targeted_Knock-in/cria314s1ria314s15i> は見つからなかった。 #A. 基盤研のデータの分類がおおまかなので,今後書く時に理研の分類を使ってもらえれば良いのではないか。 BioLOD_property_pria315s5i:Background_strain ""; #今回の例はデータが無かった。理研では,http://purl.jp/bio/13/JAX_Registry_000664/cria107s1ria107u3028467i BioLOD_property_pria315s4i:Nomenclature_of_Mouse_Strains ""; #今回の例はデータが無かった。理研では,"B6;129P2-Ahrtm1(AHR)Mym/MymRbrc"@en ; BioLOD_property_pria315s6i:BRC_Mouse_strain_status <http://purl.jp/bio/13/Frozen_sperm/cria314s2ria314s3i> , <http://purl.jp/bio/13/Frozen_embryos/cria314s2ria314s2i>, #Q. 凍結精子,卵子,生体が可能かということと,提供期間を分けて書いているが,綺麗な方法ではないような気がする。(歴史的な経緯?) #A. 元の表形式を変更しない方が望ましいらしい。 BioLOD_property_pria315s7i:BRC_Mouse_strain_availability <http://purl.jp/bio/13/Cryopreserved_sperm_will_be_provided_within_1_month/cria314s3ria314s6i> #Q. Approx. 2monthsに該当するものが無いので,暫定的に文字列で記述した。 #A. 該当するものをこちらでの対応させていけば良いのではないのか
見にくいので抜粋。
<http://purl.jp/bio/13/nbio128/cria315s1ria315u10000000128>
- Q. Subjectをどう表現するのが良いのだろうか。。
- A. 理研の場合,purlはNBDCの方針を入れて,Property IDを対応させているらしい。
BioLOD_property_pria315s8i:reference_of_the_resource <http://www.ncbi.nlm.nih.gov/pubmed/18644788>;
- Q.文献もpurlの方が良いのだろうか。
- A. PubMed IDがあるものは,purlを使用してリンクを繋げていおり,ないものはテキストで書いている。
- Q. BRC_IDではない方が良いかも。理研ではないので。BioResource IDなら良いのかも。
- A.理研のバイオリソース専門のIDなので,基盤研は基盤研で,語彙体系を作った方が良い。
- Q. 理研のような, <http://purl.jp/bio/13/Targeted_Knock-in/cria314s1ria314s15i> は見つからなかった。
- A. NIBIOのデータがざっくりしすぎらしい。今後書く時に理研の分類を使ってもらえれば,良いのではないか。
- Q. 阪大以上に学部等細かく指定するにはどうすれば良いのか。自動化には何が必要か。ある意味当然だが医薬基盤研究所が入っていなかったので,機関一覧に追加して頂けるだろうか。
- A. 実はきちんと網羅したInstituteのデータが無いという現状がある。従って,基盤研のマウスであることを明示すれば良い。理研でもURIをテキストに戻すかもしれない。
2014-01-30
BioLOD_property_pria315s6i:BRC_Mouse_strain_status <http://purl.jp/bio/13/Frozen_sperm/cria314s2ria314s3i> , <http://purl.jp/bio/13/Frozen_embryos/cria314s2ria314s2i>, BioLOD_property_pria315s7i:BRC_Mouse_strain_availability <http://purl.jp/bio/13/Cryopreserved_sperm_will_be_provided_within_1_month/cria314s3ria314s6i>
- Q.凍結精子,卵子,生体が可能かということと,提供期間を分けて書いているが,綺麗な方法ではないような気がする。(歴史的な経緯?)
- A.元の表形式を変更しない方が望ましいという経緯でこのような表現になったらしい。ただ,提供期間を分散して書くということは理研の方で検討してくださることに。
- Q. Approx. 2monthsに該当するものが無いので,暫定的に文字列で記述したがそれで良いのだろうか。
- A. 該当するものを基盤研での対応させていけば良いのではないのか
- 厳密に区別する必要がある時には,commentを意味するRDFを付け加えると良いかも。
- Q.基盤研のデータにはアレルのデータが無いのだが,理研のデータと対応付けるためには,どうすれば良いのか。
- A.現状,もとのデータにアレルの情報が無いので,書くことは出来ない。暫定的に,遺伝子情報だけでも良いのではないだろうか。ただ情報はあったほうが,IMSRやMGI のデータに登録しやすくなるという利点があるので,今後のデータ登録時に配慮する価値はあるのではないか。
2014-01-31
今までの経緯を参考にして,ttl形式のデータサンプルを作る。 グラフ化ツールや,RDF Validatorでグラフ構造や ミスが無いかチェック。
2014-02-01
基盤研のサーバーのendpointで動作をチェック。
メンバー
- 伊藤真和吏 医薬基盤研究所 バイオインフォマティクスプロジェクト
- 高月照江 理化学研究所 バイオリソースセンター マウス表現型知識化研究開発ユニット