What's New!
2009.10.23 創薬研究エリアにおけるMS Office文書ファイルデータベース化ソリューションセミナーを開催しました
2009.7.29 ドキュメント・インテリジェンス活用手法ご紹介セミナーを開催しました
ドキュメント・インテリジェンスのしくみ
ドキュメント・インテリジェンスは、以下の4種類のソフトウェア・モジュールによって構成されています。
[画像のクリックで拡大表示]
クローラー
クローラーは、蓄積対象とするドキュメントを収集するソフトウェア・モジュールです。
ドキュメントや情報の管理形態に応じたモジュールを利用する。ファイルサーバの場合は、ファイルサーバ上の収集対象のディレクトリ下に新規作成または更新されたファイルを自動的に収集します。
アノテーションツール
アノテーションツールは、クローラーが収集したドキュメントからメタデータを抽出し、インデックスデータベースへの登録するソフトウェア・モジュールです。
メタデータの抽出方法には、「テンプレート読取方式」(体裁が標準化されたドキュメントからメタデータを読み取る方法)や「テキストマイニング方式」(自然文の文脈を解析することでメタデータを抽出する方法)など、複数の方法があり、対象となるドキュメントの形式やメタデータの利用目的に応じた方法を利用します。なお、インデックスデータベースを、多目的に利用できるようにするには、高い精度でメタデータを抽出する必要があります。そのため、メタデータの抽出方式には「テンプレート読取方式」が適しています。
[画像のクリックで拡大表示]
インデックスデータベース
インデックスデータベースは、ドキュメントから抽出したテキストデータおよびメタデータのインデックスを生成し、照会要求に対して即座に該当データを検出するソフトウェア・モジュールです。
インデックスデータベースに蓄積できる情報は、ドキュメント由来の情報だけではなく、DBMSやグループウェアなどの外部データソース上の情報も取り込むことができます。ドキュメントと関連する外部データソース上の情報をインデックスデータベース内に仮想的に統合することで、情報ソース間の情報を組み合わせて参照することができます。

データビューア
データビューアは、インデックスデータベースの情報を、利用者の目的に応じた形式で表示するソフトウェア・モジュールです。
ドキュメント・インテリジェンスのデータビューアは、利用形態に応じた三種類に分類できます。
|
データビューア |
説明 |
用途 |
|
サーチャー (情報検索) |
キーワード検索にメタデータを組合わせることで、検索対象の絞込みや検索結果の分類、ランキングコントロールを行い、目的の情報を的確に探し出すことができます。 |
・利用者のナレッジの向上 ・情報収集に要する時間短縮 |
|
ナビゲーター (情報管理) |
情報に関連・類似する情報を自動的に探し出し、利用者に推薦することができます。また、情報の管理や統制など、目的に合わせた構成で情報を表示することでドキュメントの「見える化」を行い、情報管理の負荷軽減や気づきを促すことで管理精度の向上を図ります。 |
・利用者のナレッジの向上 ・気づきによるケアレスミスの防止
|
|
レポーター (情報分析) |
蓄積されたドキュメントをメタデータによって分類・集計・分析することで、 ドキュメントが保持する情報の定量化やモニタリングを行います。 |
・情報管理に要する時間短縮 ・気づきによるケアレスミスの防止
|
ドキュメント・インテリジェンス・ツール
ツール概要
ドキュメント・インテリジェンス・ツール (Powered by ConceptBase) は、ドキュメント・インテリジェンスの概念を ConceptBase Enterprise Search を用いて実現した、ドキュメント・インテリジェンスのアプリケーション実装基盤です。自動登録ツールは、ファイルサーバから自動収集(=クローラー)したドキュメントファイルより、メタデータの抽出とインデキシング(=アノテーションツール)までを自動的に行います。インデックスには、メタデータと合わせてドキュメントのテキスト検索用情報がインデックス化されており、利用者は情報検索のほか、情報管理や情報分析を行うことができます。

ConceptBase Enterprise Search
ConceptBase Enterprise Search は、ドキュメント・インテリジェンスの概念を実現したシステム基盤です。ConceptBase Enterprise Searchの詳細については、こちらをご覧ください。


