BH13.13/bioarchaeology

提供:TogoWiki

移動: 案内, 検索

1/28 写真撮影後から。

目次

背景

モチベーション

メンバー:松前、大田、仲里

  • 考古学で得られた試料(人骨、動物骨、植物種子、メタゲノム)から破壊分析(DNA、タンパク、元素)を分析する。破壊分析により、他のデータを失いたくない。
    • メタデータ(サンプルの種類、遺跡情報など)
    • 形態学的データ
    • 破壊分析によって得られる分子的なデータ
  • 考古学や形態学(形態人類学・動物考古学・植物考古学・古生物学etc)と分子レベルの分析では、データ共有の仕組みがない
  • 個人的なモチベーション(過去の経験から)
    • マニュアルキュレーションは大変。あとから変更するのはもっと大変。
    • データベースユーザ側としてもいびつなデータは使えない。
    • できるラボが少ない、n=1,2,3,....
    • パラメータが多すぎる
    • メタデータと、形態と、分子情報が繋がっていて欲しい理由(使用例1〜4)
    • 将来的にどういうデータが追加されるかわからないので、ほどほどに緩いシンプルなデータ構造にしたい

データの種類

  • メタデータ
    • 遺跡の名前、位置、時代、文献(DOIあり・なし)、層位(地層)、など... 遺跡そのものの情報化は別の研究分野(情報考古学とか)
  • 標本の画像データとそこに含まれる形態学的な情報
    • 三次元スキャンをしたいけど、どういう方法で、どういうデータが出てくるのか?また精度は?
  • 標本の分子レベルの分析をしたときのデータ
    • ゲノムなどの既存のデータと既存のバイオ系DBとリンク可能な分子データ(DNA配列、タンパク質、文献情報)
    • その他の分子データ(元素分析)

1月28日(火)

成果

  • 背景の問題から、基本的なデータ構造を検討
  • Project ID (Submission ID)
    • Sample ID (メタデータ)
      • Analysis ID (Encyclopedia of Life format?)
        • Result ID
        • Protocol ID
        • external links (SRA, GenBank, Reference)
      • Morphological ID (画像など、DarwinCore format?)
        • Protocol ID (画像データの作成方法と、元となるデータの実験的なプロトコル)

課題

  • BioSample IDの当て方
  • 多 Morpho ID に対して 多 Analysis ID
  • Sample IDの親子関係についての記述方法
  • メタゲノムの枠組みが使えるか?(使用例2において。)
  • 形態データの取り方について(おまけ)
  • オントロジーをちゃんとしたほうがいいらしい

つづき

  • 外部リンクと紐付ける分には、Metabolonote のフォーマットが使えそうなので導入してみる。
個人用ツール