トラスト・ソフトウェア・システム
ホーム > PDF Tools トップ > PDF Tools ライト > PDF 構文

PDF構文 (PDF Syntax ISO 32000-1)

PDF1.7は、ISO技術委員会によって2008年1月に“ISO 32000-1規格”として承認されました。
ここでは、その規格で説明されているPDFの構文(構造)について説明しています。 PDFファイルは、8-bitデータを単位として構成されていて一般の文書編集アプリケーションで開くことができ、その内容を読取ることができます。ただし、バイナリのデータもそのまま(表示可能な文字に変換されずに)格納されていますので文字化けしているように表示されますが、これはPDFの仕様です。
ここでは、そのデータの一部を読み解くことで、PDF文書へのデータ追加など、PDF再構成の意味を説明し、PDF-ToolsでのPDFデータ解析や編集をより詳細にできるようにします。

PDF文書のナビゲーション」へ <<< >>>「オブジェクト ストリーム」へ


6.メタデータ (Metadata)

PDF文書は、メタデータとして一般的な情報を格納しています。メタデータは、例えば、タイトル、作成者、作成および変更の日時などです。これらのデータをPDF文書は、メタデータ(Metadata)ストリームまたは、文書情報(Document Information)ディクショナリに記録します。
文書情報ディクショナリは、レイラーInfo項目にあります。


6.1 メタデータ(Metadata)ストリーム

この場合のメタデータは、ストリーム(Stream)に記載されます。このストリームを「メタデータ ストリーム」といいます。
ストリームを持ったオブジェクトですので、このオブジェクトのタイプは「ディクショナリ」です。メタデータ ストリームは、通常のストリーム ディクショナリに加えて、以下のエントリが追加されます

キータイプ
Typename(必須)"Metadata"を指定
Subtypename(必須)"XML"

オブジェクトのタイプは「2.5オブジェクト」を参照してください。


なお、メタデータは圧縮や暗号化されることはありません。

以下は、メタデータの例です。

<?xpacket begin="..." id="W5M0MpCehiHzreSzNTczkc9d"?>
  <x:xmpmeta xmlns:x="adobe:ns:meta/" x:xmptk="Adobe XMP Core 5.2-c001 63.139439, 2010/09/27-13:37:26 ">
    <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">
      <rdf:Description rdf:about="" xmlns:xmp="http://ns.adobe.com/xap/1.0/">
         ...省略...
      </rdf:Description>
      <rdf:Description rdf:about="" xmlns:pdf="http://ns.adobe.com/pdf/1.3/">
         <pdf:Producer>PDF Tools</pdf:Producer>
      </rdf:Description>
      <rdf:Description rdf:about="" xmlns:dc="http://purl.org/dc/elements/1.1/">
         <dc:format>application/pdf</dc:format>
      </rdf:Description>
      <rdf:Description rdf:about="" xmlns:xmpMM="http://ns.adobe.com/xap/1.0/mm/">
         ...省略...
      </rdf:Description>
   </rdf:RDF>
</x:xmpmeta>


6.2 文書情報(Document Information) ディクショナリ

文書情報(Document Information) ディクショナリは、PDFのトレイラーInfo項目に記載された情報です。

ドキュメント インフォメーション ディクショナリには、以下の項目が含まれます。

キータイプ
Titletext string(オプション)文書のタイトル
Authortext string(オプション)文書を作成した人の名前
Subjecttext string(オプション)文書のサブジェクト
Keywordtext string(オプション)文書に関するキーワード
Creator text string(オプション)PDF以外の形式から変換した場合に、そのオリジナルの作成ツール
Producertext string(オプション)PDF以外の形式から変換した場合に、その変換ツール
CreateDate日付(オプション)文書が生成された日時(人が読める形式)
ModDate日付(オプション)文書が更新された最終の日時
Trappedname(オプション)文書がトラッピング情報を含むように変更されたかどうかを示す名前オブジェクト

オブジェクトのタイプは「2.5オブジェクト」を参照してください。


PDF文書のナビゲーション」へ <<< >>>「オブジェクト ストリーム」へ


ご質問、お問い合わせ

メールで support@TrustSS.co.jp 宛てにお送りください。
または、質問のページからお送りいただくようお願いします。ご要望も承っております。(匿名で送れます。)




スリーソフト作者の方へ

PDF Easy Parseライブラリを無償で利用できるプログラムがあります。
こちらを参照してください。