BH11.11/ヒト・環境メタゲノムメタデータのオントロジー整備とRDF化/ontology mapping manual

提供:TogoWiki

移動: 案内, 検索

目次

メタデータ-オントロジーマッピング作業マニュアル 更新履歴

  • Ver. 0.4 Last update 2011-11-25
    • 2011-11-25 Ver. 0.4 データ取得からマッピング作業までのフローを記述
    • 2011-11-24 Ver. 0.3 ターム生成ワークフローの整理、オントロジーの追加
    • 2011-11-22 Ver. 0.2 skos:closeMatchとしていた例題をskos:exactMatchに昇格
    • 2011-11-22 Ver. 0.1 リリース. skosの採用、マニュアルに関しては加藤さんに相談した

環境メタゲノム(採取場所、生育場所)メタデータのオントロジーマッピング作業マニュアル

  1. SRAよりサンプルデータを取得(手動)
  2. メタゲノムのデータの選抜(手動)
    • キーワード検索による選抜(metagenom, environment, rRNA)
  3. 選抜データのゴミ取り(手動)
    • 今回のファイル 11434語
  4. メタデータの抜き出し(自動)
    • htmlパーサ(perlスクリプト)
    • 4054サンプル, 627カテゴリーのファイル
  5. 生育場所情報の記述されたカテゴリーの選抜(手動)
    • ゆくゆくは設定ファイル化したい
  6. 選抜データのゴミ取り(手動)
  7. 生育場所を表す語をマニュアルでNERする
  8. マッピング作業(手動)
    • 環境メタゲノム(採取場所、生育場所)メタデータタームをEnvO, FMA, PO, GAZETTER, Tax_IDのタームにマッピングする
    • predicateはskosのマッピングプロパティーをつかう
    • マッピング支援ツール(オントロジー検索) -kim


ワークフロー(ポストパッド)

SKOS マッピングプロパティー

SKOSマッピング・プロパティー語彙

predicate 説明
skos:closeMatch 一部の情報検索アプリケーションで交換して使用できるほど同じである2つの概念をリンクするために用いられます。2つ以上の概念体系にまたがるマッピングを結合するときには、「複合エラー」の可能性を避けるために、skos:closeMatchは、推移的なプロパティーであると宣言されません。
skos:exactMatch 2つの概念をリンクするために用いられ、その概念は幅広い情報検索アプリケーションにまたがって交換して使用できるほどの高い信頼性を示します。skos:exactMatchは、推移的なプロパティーであり、skos:closeMatchのサブプロパティーです。
skos:broadMatch 2つの概念間の階層マッピング・リンクを記述るために用いられる
skos:narrowMatch 2つの概念間の階層マッピング・リンクを記述るために用いられる
skos:relatedMatch 2つの概念間の関連マッピング・リンクを記述するために用いられる

skos:exactMatch

  • 表記ゆれの範囲は, skos:exactMatchとする
GOLD term EnvO ID predicate EnvO term
Salinewater Node( <http://purl.org/obo/owlapi/envo#ENVO_00002010> ) skos:exactMatch saline water
Salt marsh Node( <http://purl.org/obo/owlapi/envo#ENVO_00000054> ) skos:exactMatch saline marsh
Sand Node( <http://purl.org/obo/owlapi/envo#ENVO_01000017> ) skos:exactMatch sand
Sea water Node( <http://purl.org/obo/owlapi/envo#ENVO_00002149> ) skos:exactMatch sea water

skos:narrowMatch

GOLD term EnvO ID predicate EnvO term
Root nodule Node( <http://purl.org/obo/owlapi/envo#ENVO_01000171> ) skos:narrowMatch indeterminate root nodule nitrogen fixation zone
Self-heated organic materials Node( <http://purl.org/obo/owlapi/envo#ENVO_00002207> ) skos:narrowMatch self-heating coal mine waste
Fruits Node( <http://purl.org/obo/owlapi/envo#ENVO_00003877> ) skos:narrowMatch plant fruit food product

skos:broadMatch

GOLD term EnvO ID predicate EnvO term
Human airways Node( <http://purl.org/obo/owlapi/envo#ENVO_00009003> ) skos:broadMatch human-associated habitat
Human fecal Node( <http://purl.org/obo/owlapi/envo#ENVO_00009003> ) skos:broadMatch human-associated habitat
Human intestinal microflora Node( <http://purl.org/obo/owlapi/envo#ENVO_00009003> ) skos:broadMatch human-associated habitat
Human nasopharyngeal microflora Node( <http://purl.org/obo/owlapi/envo#ENVO_00009003> ) skos:broadMatch human-associated habitat
Human oral microflora Node( <http://purl.org/obo/owlapi/envo#ENVO_00009003> ) skos:broadMatch human-associated habitat
Human skin Node( <http://purl.org/obo/owlapi/envo#ENVO_00009003> ) skos:broadMatch human-associated habitat
Human stomach Node( <http://purl.org/obo/owlapi/envo#ENVO_00009003> ) skos:broadMatch human-associated habitat

skos構造

skos:semanticRelation
 |
 +- skos:related
 |   |
 |   +- skos:relatedMatch
 |
 +- skos:broaderTransitive
 |   |
 |   +- skos:broader
 |       |
 |       +- skos:broadMatch
 |
 +- skos:narrowerTransitive
 |   |
 |   +- skos:narrower
 |       |
 |       +- skos:narrowMatch
 |
 +- skos:mappingRelation
     |
     +- skos:closeMatch
     |   |
     |   +- skos:exactMatch
     |
     +- skos:relatedMatch
     |
     +- skos:broadMatch
     |
     +- skos:narrowMatch

試しの作業結果

MeO term skos EnvO term EnvO ID
soil metagenome	skos:broaderMatch	soil	ENVO:00001998
terrestrial biome	skos:exactMatch	terrestrial biome	ENVO:00000446
anthropogenic habitat	skos:exactMatch	anthropogenic habitat	ENVO:00002031
oil contaminated soil	skos:exactMatch	oil contaminated soil	ENVO:00002875
soil	skos:exactMatch	soil	ENVO:00001998
greenhouse soil	skos:exactMatch	greenhouse soil	ENVO:00005780
marine metagenome			
arch/bact biological mat from diffuse flow sample alphanumeric			
arch/bact rock sample from active sulfide chimney alphanumeric			
arch/bact rock sample from active sulfide flange alphanumeric			
arch/bact sample from active sulfide chimney alphanumeric			
arch/bact sample from active sulfide flange alphanumeric			
vents Alphanumeric	skos:closeMatch	geyser	ENVO:00000050
NW Rota Background Seawater Alphanumeric			
Background seawater Alphanumeric			
Forecast Background Seawater on ROV ascent Alphanumeric			
Top Vent Alphanumeric	skos:closeMatch	geyser	ENVO:00000050
Nikko Background seawater Alphanumeric	skos:broaderMatch	sea water	ENVO:00002149
Axial Background seawater Alphanumeric	skos:broaderMatch	sea water	ENVO:00002150
Peles Pit Background Seawater Alphanumeric	skos:broaderMatch	sea water	ENVO:00002151
Background seawater Alphanumeric	skos:broaderMatch	sea water	ENVO:00002152
bact/arch rock sample of active sulfide chimney-bottom alphanumeric	skos:broaderMatch	rock	
bact/arch rock sample of active sulfide chimney-top alphanumeric	skos:broaderMatch	rock	
Biofilm sample alphanumeric	skos:broaderMatch	biofilm	ENVO:00002034
Coastal lagoon waters alphanumeric	skos:broaderMatch	lagoon	ENVO:00000038

アドバイス

  • 加藤さん
    • マッピング作業のpredicateの開発は現在も議論がある(論文2009 )harry halpin
    • owl sameAsでは強いのでskos mappingが作られている経緯がある
    • scindicaなどでも利用できている
    • skos:relatedMatchはrdfs:seeAlso(プロパティー名を決められないとき)を用いる感じに近いかもしれない