BH15.15/TrialofDevelopmentOfValueOntology

提供:TogoWiki

(版間での差分)
移動: 案内, 検索
2行: 2行:
-
*概要
+
== 概要 ==
RDFガイドラインの「単位つき数値」を膨らませて、定量値、定性値の書き方まで、一般的に広くカバーするオントロジーを改めて考えてみて、このコミュニティ(TPP、RDFでデータを書きたい人たち)で共通的に使えるような方向性を考える。
RDFガイドラインの「単位つき数値」を膨らませて、定量値、定性値の書き方まで、一般的に広くカバーするオントロジーを改めて考えてみて、このコミュニティ(TPP、RDFでデータを書きたい人たち)で共通的に使えるような方向性を考える。
-
*ニーズ
+
== ニーズ ==
**そもそもニーズをちゃんと理解できていないところがあるが・・・潜在的に大きいはず。
**そもそもニーズをちゃんと理解できていないところがあるが・・・潜在的に大きいはず。
**染色体の長さ、物理位置の記述(数値はゲノムバージョンに依存)
**染色体の長さ、物理位置の記述(数値はゲノムバージョンに依存)
15行: 15行:
-
*既存の仕事/研究
+
== 既存の仕事/研究==
**基本的に「性質」の記述の範疇に入ると思われる
**基本的に「性質」の記述の範疇に入ると思われる
**OBI: BFOに準拠。最近BFO2.0で値の記述に対応したかもしれない。
**OBI: BFOに準拠。最近BFO2.0で値の記述に対応したかもしれない。
28行: 28行:
-
*コンセプト(どんなオントロジーにしたいか)
+
== コンセプト(どんなオントロジーにしたいか)==
**RDFガイドラインの数値記述の項を満たしながら、定性値の記述にも対応する。
**RDFガイドラインの数値記述の項を満たしながら、定性値の記述にも対応する。
***『値』は数学的に性質を扱う科学に不可欠な基盤=び、尺度水準(https://www.google.com/search?client=safari&rls=en&q=%E5%B0%BA%E5%BA%A6%E6%B0%B4%E6%BA%96&ie=UTF-8&oe=UTF-8 )と捉えて、定量値/定性値を一般的に扱える。
***『値』は数学的に性質を扱う科学に不可欠な基盤=び、尺度水準(https://www.google.com/search?client=safari&rls=en&q=%E5%B0%BA%E5%BA%A6%E6%B0%B4%E6%BA%96&ie=UTF-8&oe=UTF-8 )と捉えて、定量値/定性値を一般的に扱える。
56行: 56行:
-
*オントロジー試作
+
== オントロジー試作 ==
** https://filebin.riken.jp/public/qM2wQAPffwvA1M0BZUBTvF190F-SQY9bdSmE1Vl5SfCi  (一時的)
** https://filebin.riken.jp/public/qM2wQAPffwvA1M0BZUBTvF190F-SQY9bdSmE1Vl5SfCi  (一時的)
** とりあえずオレオレのクラスとプロパティのrenge, domainで作ったもの
** とりあえずオレオレのクラスとプロパティのrenge, domainで作ったもの
66行: 66行:
-
*例1 染色体の長さ(バージョン依存)をどのように記述するか
+
== 例1 ==
 +
*染色体の長さ(バージョン依存)をどのように記述するか
**「真の染色体の長さ」は1つと考える。バージョン依存の位置が変わっても不変。(図の空白ノードB)
**「真の染色体の長さ」は1つと考える。バージョン依存の位置が変わっても不変。(図の空白ノードB)
**その「真の染色体の長さ」に対して、Sequence version xxx 依存の値の体系:Mbp value depend on version xxx が存在すると考える。
**その「真の染色体の長さ」に対して、Sequence version xxx 依存の値の体系:Mbp value depend on version xxx が存在すると考える。
72行: 73行:
**問題点2: 数値と単位だけでは同等性の判断はできず、クラスの参照も必要。(特に問題とはならないかも)
**問題点2: 数値と単位だけでは同等性の判断はできず、クラスの参照も必要。(特に問題とはならないかも)
[[ファイル:Schemavalueont3.jpg]]
[[ファイル:Schemavalueont3.jpg]]
-
*例2 染色体の長さ(バージョン依存)の書き方
+
== 例2==
 +
*染色体の長さ(バージョン依存)の書き方
**測定結果というInformational entity: Measurement result xxx of chromosome Aを記述する。下記の例は、Entity, Attribute, Value型の記述(桝屋プロジェクトでの標準の書き方)したもの
**測定結果というInformational entity: Measurement result xxx of chromosome Aを記述する。下記の例は、Entity, Attribute, Value型の記述(桝屋プロジェクトでの標準の書き方)したもの
**EAV記述では、性質のインスタンスは記述してもあまり意味がないので、クラスへのリンクとしている(本来OWL2のPunning機能を使う)
**EAV記述では、性質のインスタンスは記述してもあまり意味がないので、クラスへのリンクとしている(本来OWL2のPunning機能を使う)
80行: 82行:
-
*このオントロジーがどう貢献するか
+
== このオントロジーがどう貢献しうるか ==
**より体系的/一般的な考え方は示している。
**より体系的/一般的な考え方は示している。
**バージョン依存的な書き方に一般的な指針を示せているのかどうか。
**バージョン依存的な書き方に一般的な指針を示せているのかどうか。
87行: 89行:
-
*その他課題/問題点など
+
== その他課題/問題点など ==
**実際的な部分:
**実際的な部分:
***個々のUnitは本来インスタンスなのに、Unit Ontologyの最下層がクラス<=太田さんがUOに対してIssueを上げてくれました。
***個々のUnitは本来インスタンスなのに、Unit Ontologyの最下層がクラス<=太田さんがUOに対してIssueを上げてくれました。

2016年3月16日 (水) 08:31時点における版

値(定性値、定量値)記述のためのオントロジーを考えてみる(桝屋)


目次

概要

RDFガイドラインの「単位つき数値」を膨らませて、定量値、定性値の書き方まで、一般的に広くカバーするオントロジーを改めて考えてみて、このコミュニティ(TPP、RDFでデータを書きたい人たち)で共通的に使えるような方向性を考える。


ニーズ

    • そもそもニーズをちゃんと理解できていないところがあるが・・・潜在的に大きいはず。
    • 染色体の長さ、物理位置の記述(数値はゲノムバージョンに依存)
    • 実験結果の記述等
    • 「量」の記述全般
    • 「使える」ガイドラインまでうまく落とし込むことがニーズ?


既存の仕事/研究


コンセプト(どんなオントロジーにしたいか)

    • RDFガイドラインの数値記述の項を満たしながら、定性値の記述にも対応する。


      • 概念階層はこんな感じ(ラフ)

Schemavalueont2.png

      • 各概念についてのオントロジー的な説明
      • GenericQuality: モノが持つ性質。生物で言えば「形質」。bfo:Quality、PATO:Qualityとほぼ同義。(なので、名前はQualityで良かったかも。Valueは入らないよという意味でこの名前)インスタンスは、「マウスAの持つ体長」Qualityのクラス階層は、<重さor長さ>、<体長 or 胴囲>等の区別を受け持つ。ただし、1匹のマウスが成長した場合、10cmも12cmも「マウスAの持つ体長」インスタンスであるため、値が変化したことが記述できない(Mizoguchi 2010)。
      • QualityValue: 値、量。性質の「大きさ」的なものを示す概念。科学における性質記述に必須。具体的な値("10cm"など)はインスタンス。1mと100cmはsameAsと考えたい(文字列表現ではない)。SameAsの判定は、数と単位とで判定する。値がdependent entity(性質的なもの)なのか、情報モデル的なものなのかは個人的にはよくわからないが、マイナスとか虚数とか、現実世界にマッピングしにくい値も扱えるよう、「数学的モデル」と考えたほうがいいのかもしれない。(YAMATO, DOLCEではdependent entityとなっている)
        • QuantitativeValue: 定量値:数と単位で構成される。Countなど、単位の無い定量値もある。
          • Rational scale 四則演算が可能。普通の定量値
          • Nominal scale 加減演算のみ意味がある。セルシウス度の温度など、特殊な定量値。
        • QualitativeValue定性値:通常テキストで表現される。
          • Ordinal scale value 順番のみで定量性が無い
          • Nominal scale 順番さえない
        • 上記の分類の他に、順序あり/なし、間隔が定量的/定性的、四則演算可能/加減のみ可能という分類もできる(こちらが本質的かもしれない)が、統計計算においては、NominalとOrdinalの扱いがほとんど同じらしいので上記分類とした。
      • Unit: 単位。根本的意味は「単位量」で値の一種と考えられる。
      • Continuant:(性質を持っている)モノ。 (bfo:continuant, sio:object, yamato:continuant)
      • SingletonEAV_styledData: 計測値などのデータとして例2のために作ったクラス。
    • 概念間のリンクはこんな感じ

Schemavalueont1.jpg


オントロジー試作



例1 

  • 染色体の長さ(バージョン依存)をどのように記述するか
    • 「真の染色体の長さ」は1つと考える。バージョン依存の位置が変わっても不変。(図の空白ノードB)
    • その「真の染色体の長さ」に対して、Sequence version xxx 依存の値の体系:Mbp value depend on version xxx が存在すると考える。
    • 問題点1:真実の記述になっている。と思う。計測データであることを明示するには、下の方がいいかもしれない。
    • 問題点2: 数値と単位だけでは同等性の判断はできず、クラスの参照も必要。(特に問題とはならないかも)

Schemavalueont3.jpg

例2

  • 染色体の長さ(バージョン依存)の書き方
    • 測定結果というInformational entity: Measurement result xxx of chromosome Aを記述する。下記の例は、Entity, Attribute, Value型の記述(桝屋プロジェクトでの標準の書き方)したもの
    • EAV記述では、性質のインスタンスは記述してもあまり意味がないので、クラスへのリンクとしている(本来OWL2のPunning機能を使う)
    • 測定結果にバージョンへの依存性をかけるので、値のレベルでのバージョン依存性を書く必要があまりない気がする。

Schemavalueont4.jpg


このオントロジーがどう貢献しうるか

    • より体系的/一般的な考え方は示している。
    • バージョン依存的な書き方に一般的な指針を示せているのかどうか。
    • とりあえずガイドラインで用は成している?


その他課題/問題点など

    • 実際的な部分:
      • 個々のUnitは本来インスタンスなのに、Unit Ontologyの最下層がクラス<=太田さんがUOに対してIssueを上げてくれました。
      • UOにない単位が結構沢山ある。
      • exterm:unitsはプロパティが決まっていないという意味なので、きちんと決めたほうがいい。
    • 哲学的な部分
      • セルシウス温度とケルビン温度、SameAsで結びたいが、両者の尺度は異なる。尺度を跨いだ単位変換ではSameAsしない等、何らかの制限が必要。
      • 数学の勉強が必要。
    • その他
個人用ツール