PDF 構文 メタデータ

PDF構文 (PDF Syntax ISO 32000-1)

PDF1.7は、ISO技術委員会によって2008年1月に“ISO 32000-1規格”として承認されました。(2017年7月にはPDF2.0の規格ISO3200-2が承認されています。)
ここでは32000-1規格で説明されているPDF1.7の構文(構造)について説明しています。
PDFファイルは8-bitデータを単位として構成されていて一般の文書編集アプリケーションで開くことができその内容を読取ることができます。ただし、バイナリのデータもそのまま(表示可能な文字に変換されずに)格納されていますので文字化けしているように表示されますが、これはPDFの仕様です。
ここではそのデータの一部を読み解くことでPDF文書へのデータ追加などPDF再構成の意味を説明し、PDF-ToolsでのPDFデータ解析や編集をより詳細にできるようにします。

6.メタデータ (Metadata)

PDF文書はメタデータとして一般的な情報を格納しています。メタデータは例えば、タイトル、作成者、作成および変更の日時などです。 これらのデータをPDF文書はメタデータ(Metadata)ストリームまたは、PDF文書の各コンポーネント関連情報に付加して格納できます。
PDF文書に関連した情報はカタログディクショナリMetadeta要素にあります。
メタデータはプレーンな(圧縮や暗号化されていない)テキストです。

6.1 メタデータ(Metadata)ストリーム

メタデータはストリーム(Stream)に記載されます。このストリームを「メタデータ ストリーム」といいます。
ストリームを持ったオブジェクトですのでこのオブジェクトのタイプは「ディクショナリ」です。メタデータ ストリームは通常のストリーム ディクショナリに加えて以下のエントリが追加されます。

キータイプ
Typename(必須)"Metadata"を指定
Subtypename(必須)"XML"

オブジェクトのタイプは「2.5オブジェクト」を参照してください。

メタデータは圧縮や暗号化されることはありません。以下は、メタデータの例です。

<?xpacket begin="..." id="W5M0MpCehiHzreSzNTczkc9d"?>
  <x:xmpmeta xmlns:x="adobe:ns:meta/" x:xmptk="Adobe XMP Core 5.2-c001 63.139439, 2010/09/27-13:37:26 ">
    <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">
      <rdf:Description rdf:about="" xmlns:xmp="http://ns.adobe.com/xap/1.0/">
         ...省略...
      </rdf:Description>
      <rdf:Description rdf:about="" xmlns:pdf="http://ns.adobe.com/pdf/1.3/">
         <pdf:Producer>PDF Tools</pdf:Producer>
      </rdf:Description>
      <rdf:Description rdf:about="" xmlns:dc="http://purl.org/dc/elements/1.1/">
         <dc:format>application/pdf</dc:format>
      </rdf:Description>
      <rdf:Description rdf:about="" xmlns:xmpMM="http://ns.adobe.com/xap/1.0/mm/">
         ...省略...
      </rdf:Description>
   </rdf:RDF>
</x:xmpmeta>
指定PDFファイルのメタデータを抽出します。
(このブラウザでは機能しません。)

6.2 文書情報(Document Information) ディクショナリ

文書情報(Document Information) ディクショナリは、PDFのトレイラーInfo項目に記載された情報です。

ドキュメント インフォメーション ディクショナリには、以下の項目が含まれます。

キータイプ
Titletext string(オプション)文書のタイトル
Authortext string(オプション)文書を作成した人の名前
Subjecttext string(オプション)文書のサブジェクト
Keywordtext string(オプション)文書に関するキーワード
Creator text string(オプション)PDF以外の形式から変換した場合に、そのオリジナルの作成ツール
Producertext string(オプション)PDF以外の形式から変換した場合に、その変換ツール
CreateDate日付(オプション)文書が生成された日時(人が読める形式)
ModDate日付(オプション)文書が更新された最終の日時
Trappedname(オプション)文書がトラッピング情報を含むように変更されたかどうかを示す名前オブジェクト

オブジェクトのタイプは「2.5オブジェクト」を参照してください。

ご質問 ・ お問い合わせ

 メールで support@TrustSS.co.jp 宛てに、または 質問のページからお送りいただくようお願いします。
ご要望も受け付けております。


PDF Toolsライト

PDF 構文解説

(ISO32000-1より)

PDF Tools製品概要