C++ NATIVE SDK

PDFを「構成オブジェクト」に分解し、
構造情報を抽出する。

PDFの構成オブジェクトだけでなく、構造解析した文字・図形・画像の位置や描画範囲(Bounding Box)を含めた詳細データを抽出します。抽出したベクター図形は画像データへの変換も可能です。
RAG/LLMへのAI用前処理やセキュアな帳票解析システムなど種々のPDF解析に利用できる開発基盤です。

無料評価版をダウンロード導入相談・お見積もり依頼

※ダウンロードをクリックすると、詳細エリアが展開します。

① アドレス登録なしで今すぐ14日間お試し

ダウンロードを開始した時点で、ソフトウェア使用許諾契約に同意したものとみなされます。

無料評価版(ZIP)をダウンロード

② 検証期間30日間の試用版ライセンスキー（無料）

自社システムへの組み込みなど、じっくり検証したい開発者向けに、30日間使える「試用版ライセンスキー」をメール送信します。

WHY CHOOSE US

選ばれる3つの理由

PDFを構成する最小単位のオブジェクトだけではなく、ページを構成するテキスト・図形・画像要素を詳細な属性情報と共に抽出

PDFを構成するオブジェクトやテキスト・図形・画像を抽出

PDFを構成する全てのオブジェクトを抽出しますので、正確な解析ができます。抽出したオブジェクトを使えば独自のPDFパーサーを構築することができます。
さらに、PDFの内部構造を解析してページの構成要素としてのテキストや図形・画像を抽出します。

位置・サイズ・境界データ(属性情報)を抽出

PDFの内部構造解析では各要素が「どこに」「どのサイズで」配置されているかの座標情報、フォント名や色などと共に抽出
複雑なページレイアウトの解析はもちろん、特定のエリアを指定した高度なデータ抽出システムを容易に構築できます。

図形(ベクターパス)の抽出と画像化

線や塗りつぶしといったベクター図形情報をパスコマンドで(パスステータス)属性情報と共に抽出
さらに、抽出した図形データをそのまま画像(PNGやピクセルデータ等)へ変換して取得できます。LLM（マルチモーダルAI）への高精度なデータインプットに大きな威力を発揮します。

SAMPLE CODES

サンプルコード

pdf_primitive_sample.cs

// ライブラリの初期化
using (var stc = new Structure("license-key")
// PDFファイル オープン
using (var prm = stc.GetPrimitiveInterface("in.pdf")
// ページ指定
using (var page = prm.GetPageInterface(1/*先頭ページ*/)
{
	// ページからの抽出
	using (var cont = page.GetContentInterface())
	{
		// 各文書内容を抽出
		AnyContentsObject res = cont.FirstContentObject;
		while(res != null)
		{
			switch(res.ContentType)
			{
			case 1: PrintTextData(res); break;
			case 2: PrintImageData(res); break;
			case 3: PrintPathData(res); break;
			default: System.Environment.Exit(0);
			}
			res = cont.NextContentObject;
		}
	}
}

pdf_primitive_sample.c

int main()
{
	// ライブラリの初期化
	MlpInitializeA("license-key");
	// PDFファイル オープン
	PRIMITIVE_HANDLE prm = MlpGetPrimitiveInterfaceFileA("in.pdf", NULL);
	// ページ指定
	PrmPageInterface* paj = PrmGetPageInterface(prm, 1/*先頭ページ*/);
	// ページからの抽出
	PrmContentsInterface* coj = PrmGetContentsInterface(paj);
	// 文書内容を抽出
	PrmAnyContentsObject* res = PrmGetFirstContentsObject(coj);
	while (res)
	{
		switch (PrmGetContentType(res))
		{
		case 1: print_text_data(res); break;
		case 2: print_image_data(res); break;
		case 3: print_path_data(res); break;
		default: return 0;
		}
		res = PrmGetNextContentsObject(coj);
	}
}

PRICING PLANS