SPARQLthon32/MSVのオーバーラップ問題

提供:TogoWiki

移動: 案内, 検索

[SPARQLthon32へ戻る]

目次

担当

  • 黒川研-鈴木

問題点

  • 細菌群集のメタデータはSRS IDに対して、MSVというタスクオントロジーを使用して記述されている
    • MSVのProperty例: msv:pH, msv:temperature msv:depthなど
  • MDBのデータを更新する上で、サンプルによってはシーケンスする物体+周辺環境の両方のパラメータを記述しているものがあるので、既存のMSV構造+RDF構造では対応できない
    • そもそも現状のMSVで既に、msv:temperatureとmsv:hostbodyTemperatureが分離されている→統合すべき?

対策

  • オントロジーで対応
    • 環境ごとに「msv:seaTemperature rdfs:subPropertyOf msv:teperature」のように作成する
    • 泥沼なので避けたい
  • データ構造で対応
    • いいデータ構造が思いつかない→川島さんに相談

調べたこと

  • さしあたり温度について複数のパラメータ値を持つものを調べた
    • データ更新に使用する予定の、SRAから昨年5月に取得したTSVファイルにgrep -i temp AllSRSMeta.xml.info |grep -v temperate|cut -f2|sort|uniq -c|sort -nr|less→出たIDをSRAで検索
    • 結果
      • 173サンプル発見
SRS iD parameter1 & paremeter2 environment
SRS006696 ctd_temp & theta(potential temp) env=marine
SRS006695 ctd_temp & theta(potential temp) env=marine
SRS006694 ctd_temp & theta(potential temp) env=marine
SRS006693 ctd_temp & theta(potential temp) env=marine
SRS006692 ctd_temp & theta(potential temp) env=marine
SRS006691 ctd_temp & theta(potential temp) env=marine
SRS006690 ctd_temp & theta(potential temp) env=marine
SRS006687 ctd_temp & theta(potential temp) env=marine
SRS006686 ctd_temp & theta(potential temp) env=marine
SRS006685 ctd_temp & theta(potential temp) env=marine
SRS006684 ctd_temp & theta(potential temp) env=marine
SRS006683 ctd_temp & theta(potential temp) env=marine
SRS006682 ctd_temp & theta(potential temp) env=marine
SRS006681 ctd_temp & theta(potential temp) env=marine
SRS006680 ctd_temp & theta(potential temp) env=marine
SRS006679 ctd_temp & theta(potential temp) env=marine
SRS006678 ctd_temp & theta(potential temp) env=marine
SRS006677 ctd_temp & theta(potential temp) env=marine
SRS006676 ctd_temp & theta(potential temp) env=marine
SRS006675 ctd_temp & theta(potential temp) env=marine
SRS006674 ctd_temp & theta(potential temp) env=marine
SRS006673 ctd_temp & theta(potential temp) env=marine
SRS006672 ctd_temp & theta(potential temp) env=marine
SRS006671 ctd_temp & theta(potential temp) env=marine
SRS006670 ctd_temp & theta(potential temp) env=marine
SRS006669 ctd_temp & theta(potential temp) env=marine
SRS006668 ctd_temp & theta(potential temp) env=marine
SRS006667 ctd_temp & theta(potential temp) env=marine
SRS006666 ctd_temp & theta(potential temp) env=marine
SRS006665 ctd_temp & theta(potential temp) env=marine
SRS006664 ctd_temp & theta(potential temp) env=marine
SRS006663 ctd_temp & theta(potential temp) env=marine
SRS006662 ctd_temp & theta(potential temp) env=marine
SRS006661 ctd_temp & theta(potential temp) env=marine
SRS006660 ctd_temp & theta(potential temp) env=marine
SRS006659 ctd_temp & theta(potential temp) env=marine
SRS006658 ctd_temp & theta(potential temp) env=marine
SRS006657 ctd_temp & theta(potential temp) env=marine
SRS006656 ctd_temp & theta(potential temp) env=marine
SRS006655 ctd_temp & theta(potential temp) env=marine
SRS006654 ctd_temp & theta(potential temp) env=marine
SRS006653 ctd_temp & theta(potential temp) env=marine
SRS006652 ctd_temp & theta(potential temp) env=marine
SRS006651 ctd_temp & theta(potential temp) env=marine
SRS006650 ctd_temp & theta(potential temp) env=marine
SRS006649 ctd_temp & theta(potential temp) env=marine
SRS006648 ctd_temp & theta(potential temp) env=marine
SRS006216 temperature % bottom_temperature env=marine
SRS006215 temperature % bottom_temperature env=marine
SRS006214 temperature % bottom_temperature env=marine
SRS006213 temperature % bottom_temperature env=marine
SRS006212 temperature % bottom_temperature env=marine
SRS006211 temperature % bottom_temperature env=marine
SRS006210 temperature % bottom_temperature env=marine
SRS006209 temperature % bottom_temperature env=marine
SRS006208 temperature % bottom_temperature env=marine
SRS006207 temperature % bottom_temperature env=marine
SRS006206 temperature % bottom_temperature env=marine
SRS006205 temperature % bottom_temperature env=marine
SRS006204 temperature % bottom_temperature env=marine
SRS006203 temperature % bottom_temperature env=marine
SRS006202 temperature % bottom_temperature env=marine
SRS006201 temperature % bottom_temperature env=marine
SRS005782 temperature & ctd_temperature env=marine
SRS005781 temperature & ctd_temperature env=marine
SRS005772 temperature & ctd_temperature env=marine
SRS005771 temperature & ctd_temperature env=marine
SRS005770 temperature & ctd_temperature env=marine
SRS005769 temperature & ctd_temperature env=marine
SRS005768 temperature & ctd_temperature env=marine
SRS005767 temperature & ctd_temperature env=marine
SRS006020 temperature & air temperature env=marine
SRS006019 temperature & air temperature env=marine
SRS006018 temperature & air temperature env=marine
SRS006017 temperature & air temperature env=marine
SRS006016 temperature & air temperature env=marine
SRS006015 temperature & air temperature env=marine
SRS006014 temperature & air temperature env=marine
SRS006013 temperature & air temperature env=marine
SRS006012 temperature & air temperature env=marine
SRS006011 temperature & air temperature env=marine
SRS006010 temperature & air temperature env=marine
SRS006009 temperature & air temperature env=marine
SRS006008 temperature & air temperature env=marine
SRS006007 temperature & air temperature env=marine
SRS006006 temperature & air temperature env=marine
SRS006005 temperature & air temperature env=marine
ERS176000 tunneltemp & porttemp env=sebum
ERS175999 tunneltemp & porttemp env=sebum
ERS175998 tunneltemp & porttemp env=sebum
ERS175997 tunneltemp & porttemp env=sebum
ERS175996 tunneltemp & porttemp env=sebum
ERS175995 tunneltemp & porttemp env=sebum
ERS175994 tunneltemp & porttemp env=sebum
ERS175993 tunneltemp & porttemp env=sebum
ERS175992 tunneltemp & porttemp env=sebum
ERS175991 tunneltemp & porttemp env=sebum
ERS175990 tunneltemp & porttemp env=sebum
ERS175989 tunneltemp & porttemp env=sebum
ERS175988 tunneltemp & porttemp env=sebum
ERS175987 tunneltemp & porttemp env=sebum
ERS175986 tunneltemp & porttemp env=sebum
ERS175985 tunneltemp & porttemp env=sebum
ERS175984 tunneltemp & porttemp env=sebum
ERS175983 tunneltemp & porttemp env=sebum
ERS175982 tunneltemp & porttemp env=sebum
ERS175981 tunneltemp & porttemp env=sebum
ERS175980 tunneltemp & porttemp env=sebum
ERS175979 tunneltemp & porttemp env=sebum
ERS175978 tunneltemp & porttemp env=sebum
ERS175977 tunneltemp & porttemp env=sebum
ERS175976 tunneltemp & porttemp env=sebum
ERS175975 tunneltemp & porttemp env=sebum
ERS175974 tunneltemp & porttemp env=sebum
ERS175973 tunneltemp & porttemp env=sebum
ERS175972 tunneltemp & porttemp env=sebum
ERS175971 tunneltemp & porttemp env=sebum
ERS175970 tunneltemp & porttemp env=sebum
ERS175969 tunneltemp & porttemp env=sebum
ERS175968 tunneltemp & porttemp env=sebum
ERS175967 tunneltemp & porttemp env=sebum
ERS175966 tunneltemp & porttemp env=sebum
ERS175965 tunneltemp & porttemp env=sebum
ERS175963 tunneltemp & porttemp env=sebum
ERS175962 tunneltemp & porttemp env=sebum
ERS175961 tunneltemp & porttemp env=sebum
ERS175960 tunneltemp & porttemp env=sebum
ERS175959 tunneltemp & porttemp env=sebum
ERS175958 tunneltemp & porttemp env=sebum
ERS175957 tunneltemp & porttemp env=sebum
ERS175956 tunneltemp & porttemp env=sebum
ERS175954 tunneltemp & porttemp env=sebum
ERS175953 tunneltemp & porttemp env=sebum
ERS175952 tunneltemp & porttemp env=sebum
ERS175951 tunneltemp & porttemp env=sebum
ERS175950 tunneltemp & porttemp env=sebum
ERS175949 tunneltemp & porttemp env=sebum
ERS175948 tunneltemp & porttemp env=sebum
ERS175947 tunneltemp & porttemp env=sebum
ERS175946 tunneltemp & porttemp env=sebum
ERS175945 tunneltemp & porttemp env=sebum
ERS175944 tunneltemp & porttemp env=sebum
ERS175943 tunneltemp & porttemp env=sebum
ERS175942 tunneltemp & porttemp env=sebum
ERS175941 tunneltemp & porttemp env=sebum
ERS175940 tunneltemp & porttemp env=sebum
ERS175939 tunneltemp & porttemp env=sebum
ERS175938 tunneltemp & porttemp env=sebum
ERS175937 tunneltemp & porttemp env=sebum
ERS175936 tunneltemp & porttemp env=sebum
ERS175935 tunneltemp & porttemp env=sebum
ERS175934 tunneltemp & porttemp env=sebum
ERS175933 tunneltemp & porttemp env=sebum
ERS175932 tunneltemp & porttemp env=sebum
ERS175931 tunneltemp & porttemp env=sebum
ERS175930 tunneltemp & porttemp env=sebum
ERS175929 tunneltemp & porttemp env=sebum
ERS175928 tunneltemp & porttemp env=sebum
ERS175927 tunneltemp & porttemp env=sebum
ERS175926 tunneltemp & porttemp env=sebum
ERS175925 tunneltemp & porttemp env=sebum
ERS175924 tunneltemp & porttemp env=sebum
ERS175923 tunneltemp & porttemp env=sebum
ERS175922 tunneltemp & porttemp env=sebum
ERS175921 tunneltemp & porttemp env=sebum
ERS175920 tunneltemp & porttemp env=sebum
ERS175919 tunneltemp & porttemp env=sebum
ERS175918 tunneltemp & porttemp env=sebum
ERS175917 tunneltemp & porttemp env=sebum
ERS175916 tunneltemp & porttemp env=sebum
ERS175915 tunneltemp & porttemp env=sebum
ERS175914 tunneltemp & porttemp env=sebum
ERS175913 tunneltemp & porttemp env=sebum
  • pHについて調べると、次のようなデータも存在した。これはMEOでは対応出来ない。時間についてのResourceを探した上で対応する必要がある。
ERS451299 pH_AM & pH_PM env=pond
ERS451300 pH_AM & pH_PM env=pond
ERS451301 pH_AM & pH_PM env=pond
ERS451302 pH_AM & pH_PM env=pond
ERS451303 pH_AM & pH_PM env=pond
ERS451304 pH_AM & pH_PM env=pond
ERS451305 pH_AM & pH_PM env=pond
ERS451306 pH_AM & pH_PM env=pond
ERS451307 pH_AM & pH_PM env=pond
ERS451308 pH_AM & pH_PM env=pond
ERS451309 pH_AM & pH_PM env=pond
ERS451310 pH_AM & pH_PM env=pond
ERS451311 pH_AM & pH_PM env=pond
ERS451312 pH_AM & pH_PM env=pond
ERS451313 pH_AM & pH_PM env=pond
ERS451314 pH_AM & pH_PM env=pond
ERS451315 pH_AM & pH_PM env=pond
ERS451316 pH_AM & pH_PM env=pond
ERS451317 pH_AM & pH_PM env=pond
ERS451318 pH_AM & pH_PM env=pond
ERS451319 pH_AM & pH_PM env=pond
ERS451320 pH_AM & pH_PM env=pond
ERS451321 pH_AM & pH_PM env=pond
ERS451322 pH_AM & pH_PM env=pond
ERS451323 pH_AM & pH_PM env=pond
ERS451324 pH_AM & pH_PM env=pond
ERS451325 pH_AM & pH_PM env=pond
ERS451326 pH_AM & pH_PM env=pond
ERS451327 pH_AM & pH_PM env=pond
ERS451328 pH_AM & pH_PM env=pond
ERS451329 pH_AM & pH_PM env=pond
ERS451330 pH_AM & pH_PM env=pond
ERS451331 pH_AM & pH_PM env=pond
ERS451332 pH_AM & pH_PM env=pond
ERS451333 pH_AM & pH_PM env=pond
ERS451334 pH_AM & pH_PM env=pond
ERS451335 pH_AM & pH_PM env=pond
ERS451336 pH_AM & pH_PM env=pond
ERS451337 pH_AM & pH_PM env=pond
ERS451338 pH_AM & pH_PM env=pond
ERS451339 pH_AM & pH_PM env=pond

結果

  • 同じ種類のメタデータを複数持つ場合にはRDFのブランクノードにrdf:typeを記述して対応する案を採用予定RDFizingDatabaseGuideline
    • ただし、この方法はオントロジーで表現のぶれを吸収できないため、RDF化する際に複数のパラメータが存在するのを判断しtypeを付ける作業を人力で行なう必要がある。
  • MSVに表記ブレを記載しておき、これを参考にしてRDF化し、一つのIDに対して複数の同一パラメーターがアノテーションされる際には例外処理(人力)という形式となるだろう。