SPARQLthon23/EP-autodoc

提供:TogoWiki

2014年8月19日 (火) 08:48時点におけるTazro inutano ohta (トーク | 投稿記録)による版
(差分) ←前の版 | 最新版 (差分) | 次の版→ (差分)
移動: 案内, 検索

目次


RDF EndPoint AutoDocumentation

EP-autodoc(仮)

動機

RDFモデルの図を描画するの面倒なので自動化したい.RDF Endpointのドキュメントを書くのも面倒くさいのでついでに勝手に生成されてほしい.

戦略

EPに対してSPARQLを実行し,クラスやプロパティについての情報を集める.集めた情報を元にRDFモデルの図を描画し,ドキュメントも自動生成する.

関連するプロジェクト

SPARQL Builder

  • by 小林さん、山口さん他
  • SPARQLクエリ自動生成のために各EPの情報を収集する
  • SPARQL Builder Metadata (sbm) として設計されたRDFモデルに基いてメタデータはRDF形式で管理される

Triple Data Profiler

  • by 山本さん
  • Document自動生成のために実装されたツール
  • endpointのURLを引数に与えるとテキストで出力してくれる
Docker container 作った🐶✨
$ docker run -i -t inutano/tripledataprofiler
/# tripledataprofiler "http://togogenome.org/sparql-dev"

シェルのコマンドと同じように実行して標準出力に結果を得たいけどうまくいかないので格闘中

課題いろいろ

脱・車輪の再発明

Endpointに対してSPARQLを実行して情報を集める部分は重複しているところがありそう,今後実装を進める上で生産性が無駄にはならないか?

  • 内部で使っているSPARQLのセットを共有しましょう
  • SPARQL単体で実行できる,使い回しができる

アウトプットの互換性について

Endpointの情報を集めるのは数時間単位で時間がかかる

  • Builderではあらかじめ情報を集めてキャッシュしている
  • キャッシュしたデータはRDF形式で内部に持っている
    • 現状ではEBIのRDF Endpoint*5についてキャッシュ済み
  • Triple Data Profilerでも同じモデルのRDFで出力できるようにしたい
    • Builder側でキャッシュされていないものはTDPで実行して取得
    • 同じモデルのRDFであれば共用できるのでそれも共有する

ToDo

  • SPARQL Builder MetadataのRDFモデル,サンプルデータを共有する
  • Triple Data Profilerの出力をSBM互換にする
  • モデルの描画とドキュメントの生成はSBM-RDFをベースにする
    • owlファイルの描画はまた別ものとして考える
/mw/SPARQLthon23/EP-autodoc」より作成