Page   | 1  | 2  | 3  |

東芝ソリューション XML-DB「TX1 V2」
 
翔泳社『DBマガジン』2007年5月号
「Product Focus Special」に弊社コンサルタントが寄稿
 
高橋嗣/伊奈正剛/西澤晶

【意味のある単語で索引を作成する/形態素解析方式で全文検索の精度を向上/RDBデータとも容易に連携】
2005年4月より出荷が開始され、テラバイト級の大容量データを高速に扱えるXMLデータベース(以下、XML-DB)として注目を浴びたTX1が、2006年11月にV2にバージョンアップした。テラバイト級の大容量データを高速に扱える基本性能はそのままに、検索精度の向上やアプリケーション開発の効率化を支援する機能の強化が施された。本稿では、TX1 V2の企業情報システムへの効果的な適用パターンを、具体的な活用例を示しながら説明する。

活用パターンに見るTX1 V2の適用

TX1 V2の機能的特長を確認したところで、次にこれを企業システムに効果的に活用するパターンとして、以下の例を紹介しよう。

活用パターン①:半定型文書の閲覧と活用
活用パターン②:Webアプリケーション開発の効率化
活用パターン③:企業内データの統合

いずれもRDBでは実現が難しく、XML-DBであるTX1 V2が力を発揮する分野だ。ここでは各パターンについて、具体的な例を挙げながら説明していく。

活用パターン①:半定型文書の閲覧と活用

XML-DBの活用が最も期待される領域の1つがオフィスでの半定型文書の処理である。半定型の文書とは、RDBで管理されるテーブルほど定型的(データ項目が固定)ではないが、何らかのデータ構造に従って処理を行なえる程度には規定されている文書のことである。最初に紹介するTX1の活用パターンは、この半定型文書の一元管理を目指すシステムである。

図3は、金融商品を扱う会社で使用されることを想定した業務マニュアル閲覧システムのイメージである。このシステムでは、金融商品の商品情報データを元に作成した商品説明マニュアルなどの業務マニュアルをXMLデータ化し、TX1のデータベースに格納。本社の各業務部門によって登録された各種商品情報データに販売時の注意事項や販売手順を付けることで作成される商品説明マニュアルなどは、全国の支社や代理店からWebブラウザを使って参照可能にする。また、顧客企業に合わせて商品情報データから作成する商品説明書を、自動組版システムを使って印刷する機能も加えた。

図3:業務マニュアル閲覧システム
(※法人向け金融商品説明書など、特定用途のためにカスタマイズされている)

この業務マニュアル閲覧システムは、次のような特徴を持つことになる。

半定型文書の処理

業務マニュアルを管理する際に問題となるのが保守作業だ。例えば商品説明マニュアルの場合、新商品の開発や商品内容の改訂に伴って商品情報データの新規作成/更新や販売手順などに変更があるたび、それらを反映させなければならない。

こうしたマニュアル類はWord文書として作成されているケースもある。しかし、すべての商品説明と販売手順を記載した新しいWord文書をただ単に配布したのでは、変更された商品内容や販売時の注意点、販売手順の確認に手間がかかり、営業担当者らに大きな負担をかけてしまう。必然的に、現場からは「変更された箇所だけをまとめて見たい」という要求が挙がるだろう。

図3の業務マニュアル閲覧システムは、マニュアルをXML化することで、これらの問題を解決することを意図している。

商品説明マニュアルは図4のように、階層構造として表現できる。その中では見出しや項目などが繰り返し現われるのだが、それぞれの階層の深さは異なる上、任意の階層に販売時の注意点を記述する必要があり、さらに場合に応じて表や図も含まれる。このように一定しない項目や階層構造を持つ半定型文書をRDBで扱うのは難しい。このシステムでは、ウェルフォームドXMLに対応したTX1を採用することで項目の追加/変更といった編集の自由度を高くしながら、「変更された注意点」などの条件に該当する項目だけの参照も実現する。

図4:XML化した商品説明マニュアルの階層構造

1つのXMLデータをさまざまな用途で利用

また、このシステムの要件には、商品内容の変更が発生するたび、顧客企業に改訂内容を印刷物で伝えることも含めている。そのため、商品情報データを改訂した場合には、修正した商品説明書を印刷して顧客企業に郵送する必要がある。しかし、印刷業者とのやり取りや文書校正にも多くの時間と労力を費やさねばならず、商品説明書の改訂作業が商品情報データの改訂頻度に追いつかないことも予想される。

そこで業務マニュアル閲覧システムでは、TX1にXMLデータとして格納されている商品情報データを元にしたデータの印刷に、XMLデータに対応した組版システムを利用。これにより、手間やコストを削減し、顧客企業に合わせた商品説明書の作成/印刷も可能にする。全国の支社や代理店には、XSLT(注2)の構造変換を使ってXMLデータをHTMLに変換し、Webページで商品説明マニュアルを公開できる。

高度な日本語全文検索

業務マニュアルはサイズが大きく複雑な文書である上、数多くの金融商品ごとに用意され、それぞれに関連するマニュアルがあるため、管理する文書はかなりの数になる。実際の業務では、その中から特定の単語や文を含む項目やマニュアルを探し出す機能が必要になる。さらに、該当する文書全体ではなく、見たい項目だけを取り出せることが重要である。

このシステムでは、そのためにTX1の全文検索機能を使用し、複雑な構造を持つ大量のマニュアルデータ検索を高速化している。また、検索漏れをなくしたい場合にはN-gram方式を、文の単位で探したい場合には形態素解析方式を使うことで、取り出したい文書/項目の特性に合わせた効率的な検索も実現できる。

 

(注2)XSL Transformations。XML文書の構造やタグなどを変換するための標準仕様。

Page   | 1  | 2  | 3  |

このサイトについてプライバシーポリシーサイトマップ

お問合わせ

Copyright (C) 2000-2011 UL Systems, Inc. All Rights Reserved.