SharePoint/Search Server で PDF をクロール対象に追加する
SharePoint Server 2007 や Windows SharePoint Services, Search Server 2008 のドキュメント検索では、既定では PDF ファイルは検索対象に含まれません。検索対象に PDF を追加するための手順は以下のサポート技術情報に説明されています。
Icons are not displayed for Adobe PDF documents that are listed in the search results when you search your portal site in SharePoint Portal Server 2003 or in SharePoint Server 2007 (英語)
http://support.microsoft.com/kb/832809/en-us
上記では、Adobe PDF IFilter をインストールする方法が解説されていますが、Adobe 社のダウンロードページによると、Acrobat Reader 7.0.5 以降には IFilter も同梱されているそうです。確かに Acrobat Reader をインストールすると、デスクトップサーチで PDF も検索できるようになります。
今回は、より新しいバージョンの IFilter を使うために、Acrobat Reader に含まれているものを利用することにします。(上記サポート情報の 1~4 の手順が変わります) 以下の作業はすべて、WSS やインデックスサーバーがインストールされているマシンでおこなってください。
- Adobe Acrobat Reader の最新版を入手、インストール
- 以下の記事にある手順を参照し、IFilter の登録、環境変数の設定をおこなう
- 検索結果のリストに表示されるアイコンを追加
以前投稿した記事「エンタープライズサーチ: Search Server 2008 Express」では、この手順で PDF ファイルのクロールを行っています。
追加情報:2007 Office の新しいファイル形式や、Zip ファイルなどに対応したフィルターパックもリリースされています。
2007 Office System Converter: Microsoft Filter Pack (英語)
http://www.microsoft.com/downloads/details.aspx?
FamilyID=60c92a37-719c-4077-b5c6-cac34f4227cc&DisplayLang=en
How to register Microsoft Filter Pack with SharePoint Server 2007 and with Search Server 2008 (英語)
http://support.microsoft.com/kb/946336/en-us