BH12.12/ConvRDF
提供:TogoWiki
ConvRDF
巨大なRDF/XMLファイルをN-Triplesに変換するツール
10億トリプルレベルのRDF/XMLファイルをN-Triplesに変換したい時に、既存のrapperなどのツールではメモリーが溢れて実用に堪えません。 そこで、XMLをパーズしながら結果を出力するApache JenaのPipedRDFStreamクラスを利用し、メモリ使用量が最小限で、入力ファイルのトリプル数に依存しない変換ツールを作りました。
本ツールを使い、86億トリプルあるUniProt RDF Distributionのuniprot.rdf.gzを変換できました。
BH16.12での更新
それまでのRDF/XML形式にくわえ、Turtle形式の入力にも対応。また、実行形式jarファイルの配布。