Excel 2007のファイル形式(xlsx)をひも解く

2007.04.03 Author: ぴ

Office 2007から、ファイル保存形式が変更になりました。
Excel 2007を例にとると、ファイルの拡張子が以下のように4文字に変更されました。

  • xlsx: Excelブック
  • xltx: Excelテンプレート

また、データ形式自体も変更になり、xlsxファイル自体はzipで圧縮されたファイルになっています。そのため、Windows付属のzipファイル等でファイルの展開を行うことも可能です。

zipで展開すると、

\docProps
\xl
\_rels
[Content_Types].xml
といったディレクトリ・ファイルがあることが分かります。
ちなみに、この中にあるファイルは、ほとんどがxml形式のファイルで、画像等のデータは\xl\media以下に実体のファイルとして保存されるようになっています。

このうち、docPropsディレクトリには、

\app.xml
\core.xml
の2つのファイルがあることが分かります(初期状態で)。
今回は、core.xml について解説します。

core.xmlは、ファイルの属性情報が保存されるファイルです。このファイルを編集することによって、さまざまな属性を設定することが可能です。具体的には、

dc:creator作成者
dc:lastModifiedBy前回保存者
dc:titleタイトル
dc:subject表題
cp:keywordsキーワード(Vistaではタグ検索に利用)
dcterms:createdコンテンツの作成日時
dcterms:modified前回保存日時
cp:lastPrinted前回印刷日
のような要素をいじれば、上記属性を変更することが可能です。