BH11.11/ヒト・環境メタゲノムメタデータのオントロジー整備とRDF化/ontology mapping manual
提供:TogoWiki
(版間での差分)
(→環境メタゲノム(採取場所、生育場所)メタデータのオントロジーマッピング作業マニュアル) |
(→環境メタゲノム(採取場所、生育場所)メタデータのオントロジーマッピング作業マニュアル) |
||
23行: | 23行: | ||
#* [/mw/index.php/BH11.11/山本作業記録 bigramに対してphonetic (発音の頻度)を比較するアルゴリズム] → 427語(自動)-yy | #* [/mw/index.php/BH11.11/山本作業記録 bigramに対してphonetic (発音の頻度)を比較するアルゴリズム] → 427語(自動)-yy | ||
# 生育場所を表す語をマニュアルでNERする | # 生育場所を表す語をマニュアルでNERする | ||
- | #* [/mw/index.php/BH11.11/山本作業記録 | + | #* [/mw/index.php/BH11.11/山本作業記録 任意のオントロジー語辞書に対して完全マッチする語を抽出しマッピングするアルゴリズム](自動)-yy |
# マッピング作業(手動) | # マッピング作業(手動) | ||
#* 環境メタゲノム(採取場所、生育場所)メタデータタームをEnvO, FMA, PO, GAZETTER, Tax_IDのタームにマッピングする | #* 環境メタゲノム(採取場所、生育場所)メタデータタームをEnvO, FMA, PO, GAZETTER, Tax_IDのタームにマッピングする | ||
#* predicateはskosのマッピングプロパティーをつかう | #* predicateはskosのマッピングプロパティーをつかう | ||
+ | #* マッピング支援ツール(オントロジー検索) -kim | ||
2011年11月25日 (金) 05:04時点における最新版
目次 |
メタデータ-オントロジーマッピング作業マニュアル 更新履歴
- Ver. 0.4 Last update 2011-11-25
- 2011-11-25 Ver. 0.4 データ取得からマッピング作業までのフローを記述
- 2011-11-24 Ver. 0.3 ターム生成ワークフローの整理、オントロジーの追加
- 2011-11-22 Ver. 0.2 skos:closeMatchとしていた例題をskos:exactMatchに昇格
- 2011-11-22 Ver. 0.1 リリース. skosの採用、マニュアルに関しては加藤さんに相談した
環境メタゲノム(採取場所、生育場所)メタデータのオントロジーマッピング作業マニュアル
- SRAよりサンプルデータを取得(手動)
- メタゲノムのデータの選抜(手動)
- キーワード検索による選抜(metagenom, environment, rRNA)
- 選抜データのゴミ取り(手動)
- 今回のファイル 11434語
- メタデータの抜き出し(自動)
- htmlパーサ(perlスクリプト)
- 4054サンプル, 627カテゴリーのファイル
- 生育場所情報の記述されたカテゴリーの選抜(手動)
- ゆくゆくは設定ファイル化したい
- 選抜データのゴミ取り(手動)
- "ID", "notitle" の除去
- habitatの情報の入っていないものを除去
- uniq → 401語
- bigramに対してphonetic (発音の頻度)を比較するアルゴリズム → 427語(自動)-yy
- 生育場所を表す語をマニュアルでNERする
- マッピング作業(手動)
- 環境メタゲノム(採取場所、生育場所)メタデータタームをEnvO, FMA, PO, GAZETTER, Tax_IDのタームにマッピングする
- predicateはskosのマッピングプロパティーをつかう
- マッピング支援ツール(オントロジー検索) -kim
SKOS マッピングプロパティー
- http://www.asahi-net.or.jp/~ax2s-kmtn/internet/skos/REC-skos-reference-20090818.html#mapping
- http://www.kanzaki.com/memo/2008/01/29-1
SKOSマッピング・プロパティー語彙
predicate | 説明 |
---|---|
skos:closeMatch | 一部の情報検索アプリケーションで交換して使用できるほど同じである2つの概念をリンクするために用いられます。2つ以上の概念体系にまたがるマッピングを結合するときには、「複合エラー」の可能性を避けるために、skos:closeMatchは、推移的なプロパティーであると宣言されません。 |
skos:exactMatch | 2つの概念をリンクするために用いられ、その概念は幅広い情報検索アプリケーションにまたがって交換して使用できるほどの高い信頼性を示します。skos:exactMatchは、推移的なプロパティーであり、skos:closeMatchのサブプロパティーです。 |
skos:broadMatch | 2つの概念間の階層マッピング・リンクを記述るために用いられる |
skos:narrowMatch | 2つの概念間の階層マッピング・リンクを記述るために用いられる |
skos:relatedMatch | 2つの概念間の関連マッピング・リンクを記述するために用いられる |
skos:exactMatch
- 表記ゆれの範囲は, skos:exactMatchとする
GOLD term | EnvO ID | predicate | EnvO term |
---|---|---|---|
Salinewater | Node( <http://purl.org/obo/owlapi/envo#ENVO_00002010> ) | skos:exactMatch | saline water |
Salt marsh | Node( <http://purl.org/obo/owlapi/envo#ENVO_00000054> ) | skos:exactMatch | saline marsh |
Sand | Node( <http://purl.org/obo/owlapi/envo#ENVO_01000017> ) | skos:exactMatch | sand |
Sea water | Node( <http://purl.org/obo/owlapi/envo#ENVO_00002149> ) | skos:exactMatch | sea water |
skos:narrowMatch
GOLD term | EnvO ID | predicate | EnvO term |
---|---|---|---|
Root nodule | Node( <http://purl.org/obo/owlapi/envo#ENVO_01000171> ) | skos:narrowMatch | indeterminate root nodule nitrogen fixation zone |
Self-heated organic materials | Node( <http://purl.org/obo/owlapi/envo#ENVO_00002207> ) | skos:narrowMatch | self-heating coal mine waste |
Fruits | Node( <http://purl.org/obo/owlapi/envo#ENVO_00003877> ) | skos:narrowMatch | plant fruit food product |
skos:broadMatch
GOLD term | EnvO ID | predicate | EnvO term |
---|---|---|---|
Human airways | Node( <http://purl.org/obo/owlapi/envo#ENVO_00009003> ) | skos:broadMatch | human-associated habitat |
Human fecal | Node( <http://purl.org/obo/owlapi/envo#ENVO_00009003> ) | skos:broadMatch | human-associated habitat |
Human intestinal microflora | Node( <http://purl.org/obo/owlapi/envo#ENVO_00009003> ) | skos:broadMatch | human-associated habitat |
Human nasopharyngeal microflora | Node( <http://purl.org/obo/owlapi/envo#ENVO_00009003> ) | skos:broadMatch | human-associated habitat |
Human oral microflora | Node( <http://purl.org/obo/owlapi/envo#ENVO_00009003> ) | skos:broadMatch | human-associated habitat |
Human skin | Node( <http://purl.org/obo/owlapi/envo#ENVO_00009003> ) | skos:broadMatch | human-associated habitat |
Human stomach | Node( <http://purl.org/obo/owlapi/envo#ENVO_00009003> ) | skos:broadMatch | human-associated habitat |
skos構造
skos:semanticRelation | +- skos:related | | | +- skos:relatedMatch | +- skos:broaderTransitive | | | +- skos:broader | | | +- skos:broadMatch | +- skos:narrowerTransitive | | | +- skos:narrower | | | +- skos:narrowMatch | +- skos:mappingRelation | +- skos:closeMatch | | | +- skos:exactMatch | +- skos:relatedMatch | +- skos:broadMatch | +- skos:narrowMatch
試しの作業結果
MeO term | skos | EnvO term | EnvO ID |
soil metagenome skos:broaderMatch soil ENVO:00001998 terrestrial biome skos:exactMatch terrestrial biome ENVO:00000446 anthropogenic habitat skos:exactMatch anthropogenic habitat ENVO:00002031 oil contaminated soil skos:exactMatch oil contaminated soil ENVO:00002875 soil skos:exactMatch soil ENVO:00001998 greenhouse soil skos:exactMatch greenhouse soil ENVO:00005780 marine metagenome arch/bact biological mat from diffuse flow sample alphanumeric arch/bact rock sample from active sulfide chimney alphanumeric arch/bact rock sample from active sulfide flange alphanumeric arch/bact sample from active sulfide chimney alphanumeric arch/bact sample from active sulfide flange alphanumeric vents Alphanumeric skos:closeMatch geyser ENVO:00000050 NW Rota Background Seawater Alphanumeric Background seawater Alphanumeric Forecast Background Seawater on ROV ascent Alphanumeric Top Vent Alphanumeric skos:closeMatch geyser ENVO:00000050 Nikko Background seawater Alphanumeric skos:broaderMatch sea water ENVO:00002149 Axial Background seawater Alphanumeric skos:broaderMatch sea water ENVO:00002150 Peles Pit Background Seawater Alphanumeric skos:broaderMatch sea water ENVO:00002151 Background seawater Alphanumeric skos:broaderMatch sea water ENVO:00002152 bact/arch rock sample of active sulfide chimney-bottom alphanumeric skos:broaderMatch rock bact/arch rock sample of active sulfide chimney-top alphanumeric skos:broaderMatch rock Biofilm sample alphanumeric skos:broaderMatch biofilm ENVO:00002034 Coastal lagoon waters alphanumeric skos:broaderMatch lagoon ENVO:00000038
アドバイス
- 加藤さん
- マッピング作業のpredicateの開発は現在も議論がある(論文2009 )harry halpin
- owl sameAsでは強いのでskos mappingが作られている経緯がある
- scindicaなどでも利用できている
- skos:relatedMatchはrdfs:seeAlso(プロパティー名を決められないとき)を用いる感じに近いかもしれない