BH12.12/ConvRDF

提供:TogoWiki

2013年10月23日 (水) 13:21時点におけるYayamamo (トーク | 投稿記録)による版
移動: 案内, 検索

ConvRDF

巨大なRDF/XMLファイルをN-Triplesに変換するツール

10億トリプルレベルのRDF/XMLファイルをN-Triplesに変換したい時に、既存のrapperなどのツールではメモリーが溢れて実用に堪えません。 そこで、XMLをパーズしながら結果を出力するApache JenaのPipedRDFStreamクラスを利用し、メモリ使用量が最小限で、入力ファイルのトリプル数に依存しない変換ツールを作りました。

本ツールを使い、86億トリプルあるUniProt RDF Distributionのuniprot.rdf.gzを変換できました。


BH12.12/SPARQLthon13

/mw/BH12.12/ConvRDF」より作成