■ DocCat導入事例 - 日本ペイント
-- 現在DocCatをどのようにお使いですか。 日本ペイントの技術系ナレッジデータベース“Echo3”の構成部品として使っています。以前は、テキストのみが検索対象でしたが、DocCat を組み込むことで、Word 、Excel 、PPT などのOffice 系のファイルやPDF ファイルのテキストも検索できるようになりました。 社内ポータルを使って技術情報を探すときに、「探したい情報のキーワードははっきりしているのだが、ナレッジデータベースのどこにあるのかは分からない」という場合がよく分かります。そんな時には全文検索がたいへん便利です。 DocCat はコマンドラインプログラムなので、取り回しが良いと思います。 フィルタの感覚でアプリケーションに組み込むことができました。社内検索システムへの新機能の追加が短時間で実現できました。 ナレッジデータベースの画面例は以下の通りです。 (クリックで拡大) (クリックで拡大) その他、DocCatが入ったことで、ナレッジデータベースに社内から情報が集まりやすくなったことも導入効果の一つです。
-- なぜDocCatがあると、社内から情報が集まりやすくなるのでしょうか。 DocCatの導入により、情報登録のめんどうさが減るからです。 システム部門の立場からいえば、DocCatなしでも検索システムを運用していくことは可能です。ExcelやPDFの中身も元はテキストですから、そのテキストの部分を情報の登録の際に貼り込んでもらえばよい。 しかし、そうした面倒な手順を強いたのでは、情報の登録が活発化しないと予測されます。検索システムにおいては、情報を探す側には、「その情報が何としても欲しい」というはっきりした意志がありますが、情報を登録する側には、そういう切実な動機はありません。 ということは、情報登録がめんどうなシステムには、情報の登録が進まないと予測されます。 DocCatの導入により、ExcelやPDFの登録は、そのファイルを「放り込む」だけで済むようになります。このようなシンプルなシステムにしておけば、情報登録も自然に増えてくるのではないかと期待されます。
-- 日本ペイントのナレッジデータベース"Echo3"とはどのようなものですか。 冒頭にも述べたとおり、Echo3とは、開発部門や技術サポート部門など技術系 の部署のためのナレッジデータベースです。各部門からの各種の報告書、つまり「こういう実験をしてこういう結果が出ました」という実験報告や技術レポート、「こういう製品にこういうクレームが出ました」というクレーム報告、「こういう製品をこのよう に使ったらこのように上手くいきました」という事例報告などをデータベースにまとめたものです。他にも原材料に関する情報、コールセンターに寄せられた情報、社内外のイベントで発表された資料、なども格納されています。 Echoは約30年前から始まったシステムです。以下のとおり三世代あります。
-- 最初のEchoでの「コード検索」とは具体的には。
当時は情報分類を示すコードを入力して検索していました。例えば“経時劣化”に関する情報が知りたい場合は、分厚いコードブックをめくって、"経時劣化”のコードが"A1173"であることをつきとめ、そしてA1173を入力して検索していました。当時は当たり前と思ってましたが、振り返ってみると面倒なことをしてたものです。
そういうことです。現在のWebシステムになったのは、1995年頃からです。当初はNamazu+Perlで実装。現在は、SAVVY+DocCat+Perlという実装形態です。
システムに組み込んでしまっているので、単独の使用感は特にありませんが、 確実にテキストの抽出を行ってくれているので助かります。 PDFは仕様が公開されていますし、Excelもパースするモジュールをときおり見 かけたりしますけど、Wordは文書の変更履歴なども残っているようで手強いと 思うのですが、うまくやってくれているようですね。 -- 今後のデ変研に期待することをお知らせください。 「どんなファイルも」、「確実に」、「高速に」 変換できるという基礎力を今後も継続改善して欲しいと思います。「よくこんなことができるな」と感心し続けられる、高い技術の会社であり続けて欲しいと思います。 -- 今日は貴重なお話しを有り難うございました。 ※ 日本ペイントのWebサイト ※ 取材日時 2006年7月 |