BH13.13/hierarchy

提供:TogoWiki

移動: 案内, 検索

目次

概要

病気・薬の階層分類を利用して病気間の距離・薬間の距離のそれぞれを計算できるようにします。このとき,RDFを利用して階層分類を表現します。


目的

  • 階層分類(taxonomy)を使ってノード同士の距離(or 類似度)を計算できるようにする
    • 例:
      • 病気,薬,生物種,単語,…
      • 1型糖尿病と2型糖尿病はどれくらい離れている?
    • 注意:
      • 距離の計算方法は他にもいくつかある(共起頻度や文章間の距離を使う,など)
      • 階層分類を使った病気の距離計算に関する論文はたくさんある(1989年〜)


目標

  1. 現状を把握する(1月27日)
  2. 階層分類を使って距離を計算できるようにする(1月28〜29日)
    • 計算方法はたくさん提案されているが,まずは単純な方法で
  3. 主要な階層分類をRDF化する(1月30日〜)
    • 病気:ICD-10 (International Statistical Classification of Diseases and Related Health Problems, 10th Edition)
    • 薬:薬効分類
      • 国内で使用されているすべての処方薬に番号が付与されている
      • 4階層
  4. RDFをどこかで公開する(Not yet)
    • TogoDB -- http://togodb.org
    • 公開は,WHOや厚労省などの権利関係を明らかにしてから


メモ

  • BioPortalのICD-10で使われている主なpredicate
    • skos:prefLabel -- 病名
    • rdfs:subClassOf -- 上の階層
    • rdf:type -- すべてowl:Class
    • skos:notation -- 病気のID(URIの末尾と同じ)


Future work

  • 計算方法の拡充
  • RDF化する階層分類の拡充
    • 病気の分類は,ICD-10に紐付けることができるものに限る(自分の研究の都合上)
  • RDFをTogoDBに登録・公開する


メンバー

  • 森田瑞樹(東京大学,mizuki@sict.i.u-tokyo.ac.jp)
個人用ツール