事例・レポート

現在位置
トップ > 事例・レポート > ホワイトペーパー 『VISION』 > GoogleでNotesを検索するには?
吉田健一

吉田 健一
(よしだ けんいち)

取締役
戦略コンサルティング会社を経て、リアルコム社BCGディレクター。KM・情報共有・企業変革コンサルティングをソニー、NTT、丸紅等の国内外の大手企業に対して手がける。

松本崇志

松本 崇志
(まつもと たかし)

プリンシパル
米系ソフトウェア企業にて、新規事業立ち上げに従事。またプリセールスコンサルタントとして製薬・化学・食品等業界向けにコンサルティングを実施。リアルコムでは主に電力・製薬等の大企業向けにコンサルティングを実施している 。

>>VISION トップへ

GoogleでNotesを検索するには?
~ GSA Extender for Notesで実現する2.0時代のエンタープライズサーチ ~

------------------------------------------------------
取締役
吉田 健一
マーケットデペロップメントグループ プリンシパル
松本 崇志

 Notesでは柔軟なデータベースの設計や複雑なアクセス権の設定が可能である反面、アクセス権の設定を考慮しながら適切なパフォーマンスで検索を行うことが難しい。強力な検索機能を持つGoogle検索アプライアンスにREALCOM GSA Extender for Notesをアドオンすることで、複雑なアクセス権の設定を考慮したうえで、高速なNotes検索を実現することができる。本稿ではGoogle検索アプライアンスとGSA Extender for Notesの組み合わせによるNotes検索の仕組みについて紹介する。

1.Notesユーザーにとってのエンタープライズサーチの難しさ

NotesDBの洪水に溺れて

 エンタープライズサーチ。この言葉がブームになって久しいが、ことNotesユーザーにとって、理想と現実のギャップがこれほど大きい言葉はない。

 90年代から爆発的に普及したLotus Notesは、現在大手企業の半数近くに導入されている統合情報基盤である。メール、スケジュール等のグループウェア機能に加え、情報共有やアプリケーションのデータベースを容易に構築できるという強みを生かし、企業内の情報共有は大いに加速された。その結果、今日のNotesユーザーの多くは社内に膨大なNotesデータベースを蓄積するに至っている。このことは情報共有の加速という正の効果を実現する一方で、「データベースが乱立し、何がどこにあるかわからない」「必要な情報にたどり着くのに時間がかかり、非効率となっている」「情報はたくさんあるが情報が探せないため、活用度は低い」という負の側面をもたらすことになってしまった。

 こうしたNotesユーザーにとって、企業内の情報を一気に検索するという「エンタープライズサーチ」は、希望の光なのである。

Notes検索の難しさ

 しかし、Notesユーザーにとってその道のりは険しい。エンタープライズサーチを標榜する検索エンジンは世に数多く存在するが、その多くはファイルサーバーやイントラネットウェブサイトなどあまり複雑ではないデータを対象としており、Notesに対応していないことが多い。また、スペック上はNotesに対応していると記載されているが、実際に導入してみるとまったく使い物にならない、というケースが多い。

 例えば、あるNotesユーザー企業ではファイルサーバー検索のためにA社製の検索エンジンを導入した。A社製検索エンジンがNotes検索に対応していたため、その後検索対象をNotesにも拡大しようとしたところ問題が発生した。ファイルサーバーのみを検索していたときと比べてNotes検索時には大幅な検索パフォーマンスの低下が見られたのである。また、夜間にインデックス作成のためのバッチ処理を実行させていたが、このパフォーマンスも低下するとともに、他の夜間バッチ処理の実行とも衝突してしまった。こうした結果から、このNotesユーザー企業ではA社製検索エンジンの適用範囲はファイルサーバーのみに限定し、Notes検索は断念することとなってしまった。

 なぜNotesの検索は難しいのか。それには前述のNotesユーザー企業での例にもある通り、大きく2つの構造的な理由がある。

(1)ACL(アクセス権限設定)の複雑さ

 一つ目はACLの複雑さである。NotesはDB単位、文書単位、セクション単位という単位で、組織別、ロール別、個人別のきめ細かいACLを設定できるところが特徴である。こうしたACLを反映させたまま検索結果を表示することは技術的にきわめて困難である。一般的にACLを保持した検索を行う場合、検索結果を表示するため1文書毎にその文書を表示してよいかをDominoサーバーに問い合わせる。しかし、この方式だと検索結果が10,000文書だったら10,000回Dominoと通信をする必要があり、パフォーマンスが現実的でないレベルに劣化してしまう。同時に、Dominoにかかる負荷も馬鹿にならない。かといって、複雑に設定されたACLを無視して、検索結果を公開することもできない。このACLのジレンマがNotesエンタープライズ検索を困難にしている大きな要因である。

(2)パフォーマンス・スケーラビリティ

 もう一つはACLと裏表となるパフォーマンスやスケーラビリティの問題である。前述のとおりACLを維持しつつパフォーマンスを劣化させない仕組みを実現しなければならないのだが、そもそも膨大なデータを扱わなければならないことが、もう一つの課題である。

 Notesユーザーは少なくとも数百DB、多ければ数千DBを保有していることが多い。そうすると、数十万から数百万文書を検索対象にしなければならず、インデックスを作成するときに大量の文書を素早く、Dominoに負荷をかけずにデータを収集する仕組みが必要となる。また、検索は全ユーザーが頻繁に利用する機能であり、高いレスポンススピードを維持することが欠かせない。「膨大なデータ」「高いユーザー利用率」「高いレスポンススピード」この3つを高いレベルで実現させることが、Notes検索の困難のレベルを上げている。