文書情報(Document Information)ディクショナリ
PDF構文 [PDF Syntax ISO 32000-2]
PDF1.7は、ISO技術委員会によって2008年1月に“ISO 32000-1規格”として承認されました。2017年7月にはPDF2.0の規格ISO3200-2が承認され、2020年12月にはそれが第二稿に更新されました。
ここでは32000-2規格に基づいたPDF2.0の構文(構造)について説明しています。
PDFファイルは8-bitデータを単位として構成されていて一般の文書編集アプリケーションで開くことができその内容を読取ることができます。ただし、バイナリのデータもそのまま(表示可能な文字に変換されずに)格納されていますので文字化けしているように表示されますが、これはPDFの仕様です。
ここではそのデータの一部を読み解くことでPDF文書へのデータ追加などPDF再構成の意味を説明しPDF StructureやPdftools SDKでのPDFデータ解析や編集をより詳細にできるようにします。
ここでは32000-2規格に基づいたPDF2.0の構文(構造)について説明しています。
PDFファイルは8-bitデータを単位として構成されていて一般の文書編集アプリケーションで開くことができその内容を読取ることができます。ただし、バイナリのデータもそのまま(表示可能な文字に変換されずに)格納されていますので文字化けしているように表示されますが、これはPDFの仕様です。
ここではそのデータの一部を読み解くことでPDF文書へのデータ追加などPDF再構成の意味を説明しPDF StructureやPdftools SDKでのPDFデータ解析や編集をより詳細にできるようにします。
「PDF 構文 メタデータ」<<< >>>「PDF 構文 オブジェクト ストリーム」
「PDF 構文 メタデータ」<<<
>>>「PDF 構文 オブジェクト ストリーム」
9. 文書情報(Document Information) ディクショナリ
文書情報(Document Information) ディクショナリは、PDFのトレイラーでInfo項目に記載された情報です。
ドキュメント インフォメーション ディクショナリには、以下の項目が含まれます。
キー | タイプ | 値 |
---|---|---|
Title | text string | (オプション)文書のタイトル |
Author | text string | (オプション)文書を作成した人の名前 |
Subject | text string | (オプション)文書のサブジェクト |
Keyword | text string | (オプション)文書に関するキーワード |
Creator | text string | (オプション)PDF以外の形式から変換した場合に、そのオリジナルの作成ツール |
Producer | text string | (オプション)PDF以外の形式から変換した場合に、その変換ツール |
CreateDate | 日付 | (オプション)文書が生成された日時(人が読める形式) |
ModDate | 日付 | (オプション)文書が更新された最終の日時 |
Trapped | name | (オプション)文書がトラッピング情報を含むように変更されたかどうかを示す名前オブジェクト |
オブジェクトのタイプは「2.5オブジェクト」を参照してください。
以下は、文書情報の例です。
2 0 obj << /ModDate (D:20251008901234) /Producer (PDF Creator Trust Software System) >> endobj
PDF Imager-LP(無償版)で「文書情報」を表示するソースコード
C# | C/C++ | Python |
「PDF 構文 メタデータ」<<< >>>「PDF 構文 オブジェクト ストリーム」
「PDF 構文 メタデータ」<<<
>>>「PDF 構文 オブジェクト ストリーム」