BH13.13/hierarchy
提供:TogoWiki
目次 |
概要
病気・薬の階層分類を利用して病気間の距離・薬間の距離のそれぞれを計算できるようにします。このとき,RDFを利用して階層分類を表現します。
目的
- 階層分類(taxonomy)を使ってノード同士の距離(or 類似度)を計算できるようにする
- 例:
- 病気,薬,生物種,単語,…
- 1型糖尿病と2型糖尿病はどれくらい離れている?
- 注意:
- 距離の計算方法は他にもいくつかある(共起頻度や文章間の距離を使う,など)
- 階層分類を使った病気の距離計算に関する論文はたくさんある(1989年〜)
- 例:
目標
- 現状を把握する(1月27日)
- 階層分類を使って距離を計算できるようにする(1月28〜29日)
- 計算方法はたくさん提案されているが,まずは単純な方法で
- 主要な階層分類をRDF化する(1月30日〜)
- 病気:ICD-10 (International Statistical Classification of Diseases and Related Health Problems, 10th Edition)
- WHOによって策定
- 世界各国で統計や保険請求などのために用いられている
- 4階層
- BioPortalにRDFあり -- http://bioportal.bioontology.org/ontologies/ICD10/
- 薬:薬効分類
- 国内で使用されているすべての処方薬に番号が付与されている
- 4階層
- 病気:ICD-10 (International Statistical Classification of Diseases and Related Health Problems, 10th Edition)
- RDFをどこかで公開する(Not yet)
- TogoDB -- http://togodb.org
- 公開は,WHOや厚労省などの権利関係を明らかにしてから
メモ
- BioPortalのICD-10で使われている主なpredicate
- skos:prefLabel -- 病名
- rdfs:subClassOf -- 上の階層
- rdf:type -- すべてowl:Class
- skos:notation -- 病気のID(URIの末尾と同じ)
Future work
- 計算方法の拡充
- RDF化する階層分類の拡充
- 病気の分類は,ICD-10に紐付けることができるものに限る(自分の研究の都合上)
- RDFをTogoDBに登録・公開する
メンバー
- 森田瑞樹(東京大学,mizuki@sict.i.u-tokyo.ac.jp)