リンクのない企業内情報を高い妥当性で検索するIDOL
●編集部 具体的にインターウォーブンの製品とどう統合されたのでしょうか。
●アンソニー オートノミーのIDOL(アイドル)というエンジンをインターウォーブンの製品に統合するという道をとりました。IDOLとはIntelligent Data Operating Layer(知能的データ操作レイヤー)の頭文字をとったもので、意味理解の処理を行うエンジンです。インターウォーブンと合併して最初に行ったのは、インターウォーブンの「TeamSite」にIDOLを組み込むことです。
●編集部 「TeamSite」は近々バージョンアップを予定しているそうですが、オートノミー製品を利用可能にするためのものでしょうか。
●熊代 オートノミーの技術を利用するにあたっては、「TeamSite」がまったくがらりと変わるというわけではなく、モジュールで連携するというのがメインになりますので、モジュールを追加するという形で考えています。今年末くらいのタイミングで「TeamSite」の新しいバージョンをリリースさせていただきますが、これは通常のバージョンアップで、これまでのようにバージョン間での互換性は保持します。
●編集部 「TeamSite」とIDOLが統合したことにより、ユーザーにはどのようなメリットがありますか。
●アンソニー IDOLのテクノロジーを利用することで、企業はユーザーの動向や広告の効果を深く理解できるようになります。IDOLは「意味ベースマーケティング」のメインエンジンのようなものですから、顧客とのやり取りを変革します。顧客に対して、どのようにWebを配信するかというレベルの話ではなく、Webよる収入を増やしたいとか、コンバージョンを上げたいといったビジネスの重大な問題について提案できるということです。
インターウォーブンの顧客がオートノミーの製品を使いたいという場合、以前は手作業でTeamSiteとの統合をしなければなりませんでしたがそれが不要になりました。また、インターウォーブンが財務的により巨大になり安定したというのも、メリットとして挙げていいと思います。それぞれの顧客ネットワークを統合したことにより、市場で大きな地位を占めることになりました。
コンテンツ管理と各種Webサイト最適化製品を統合して提供する
- 概念的プロファイル、およびセグメンテーション
- アダプティブターゲティング
- 自動クエリーガイダンス
- ダイレクトナビゲーション
- クロスチャネル最適化
- スピーカー認識
- レコメンデーション
- UGC
- 自動言語認識
- カテゴライズ・クラスタリング
- メロディー認識
- 動的タクソノミー
- 要約(サマリー)生成
- 動画のインデックス
- Webサイトアーカイブ・コンプライアンス
- ソーシャルメディア・モニタリング
- マルチチャネル・インタラクション
リンクのない企業内情報を高い妥当性で検索するIDOL
●編集部 IDOLについてもう少し詳しく教えてください。
●アンソニー ベイズ理論やシャノンの理論といった数学的な確率論を使っています。創業者二人はケンブリッジの教授で、パターンマッチングの世界的権威です。コアテクノロジーは独自技術で、企業買収によって得たものではありません。
数千のデータソースを見る能力があり、これを自動的にカテゴライズして、どのデータが新しいか、どの情報がホットな話題かを自動的に判断します。ハイパーリンクについての能力もあります。検索をして得た情報に、他のソースへのリンクを張るのですが、別の用語であっても同じことについての情報であればリンクを張ります。
●編集部 関連性の追求は、この分野では永久課題でグーグルも挑戦していますが、それをしのぐ技術なのでしょうか。
●アンソニー グーグルのアプローチとはアーキテクチャが違います。
当初、検索といえばキーワード検索のことでした。「dog」で検索すれば、「dog」という単語の含まれるドキュメントが検索結果として出てくる。しかし現在、どのドキュメントが重要なのかを判断するのに、重み付けをするようになりました。たまたま「d・o・g」という文字列が含まれているのではなく、本当に犬についての内容であるかどうかを前後の関係から読み取って点数を付け、点数が高いものが検索結果としてより正しいと判断するということです。たとえばドッグショーのドキュメントであれば、最初のパラグラフに「dog」という単語が2回出てきて、次のパラグラフには犬の種類について述べてあるなど、これは明らかに犬についての文書だとわかりますね。このようにして妥当性をランキングするのです。
インターネット時代になって、グーグルがPageRankというおもしろい方法を編み出しました。たとえば、私が「madonna」でインターネット検索したとしましょう。「madonna」というのはブルックリンのパン屋さんなのですが、それは出てきませんね。そのパン屋さんのサイトにリンクしている人は20人くらいでしょうか。しかし、歌手のマドンナのサイトにリンクしているのは60億人ですから、検索結果としてはそちらが上に表示される。インターネットのコンテンツを探すのならそれで正しいわけですが、エンタープライズにおけるドキュメント検索では、それは有効ではないでしょう。
理由は2つあって、1つはエンタープライズのドキュメントは、互いにリンクし合っていません。ですが我々の技術では、パラメトリックサーチのおかげで、パラメータをドリルダウンすることで別の種類のドキュメントを探すことができますし、あるいはクエリによる串刺し検索ができます。3~4の検索エンジンを連携しているのです。ここに、確率を使います。各検索エンジンの結果をどのように評価するかのアルゴリズムがあるのです。
もう1つは、検索エンジンのページランキングは言語に依存しているということです。キーワードによって判断しているので、オートノミーの数学モデルのIDOLによる意味理解というアプローチとは違う。IDOLは非構造化データを解析するための500の機能を持っていて、それによって情報の意味理解を可能にします。さらに、ビデオライブラリのアーカイブとサーチができますし、大量データの処理も可能で、理論値としての上限はありません。情報量の増加にともなって対応できます。
●編集部 大量データの処理が得意ということは、大企業向けの技術なのでしょうか。
●アンソニー 中堅・中小の企業のアプリケーションでも利用されていますよ。非構造化されたものも含めた情報の管理を手助けするというのが、この技術で実現することです。企業の規模ではなく、管理したいデータがどのくらいあり、どのくらい早く精密なピックアップがしたいかということに関係します。たとえば、法律事務所での利用は多くて、中堅の法律事務所でも使われています。法律事務所では、裁判をすることが決まったら短時間で大量のドキュメントから証拠資料を用意する必要がありますからね。
●編集部 実際にオートノミーの技術を利用する際に、ユーザー側にはどの程度の準備や導入のための作業が発生するのでしょうか。たとえば、カテゴリの設定や辞書の作成といった作業が必要なのかということですが。
●熊代 基本的にはありません。Webサイトをどのように見せたらいいかという点について、導入のときチューニングするという程度の作業量です。AI(人工知能)とまでは言わないまでも、どういうドキュメントがあるか、どういうコンテンツがあるかを分析して、自動でカテゴリを作ります。特殊な言語であったとしても同様で、ローカライズもいりません。あとはサイトをどう見せたいか、レコメンデーションなどをどうしたいかといったような、まさにチューニングになります。
●編集部 モジュールがいくつかありましたが、こういう利用を想定しているというようなものはありますか。
●熊代 ユーザーの方が一番興味を持たれるのは、パーソナライゼーションやレコメンデーションの機能ですね。今は本当に手作業でレコメンデーションを作っていますので、我々の技術でそれを自動化するといったことには期待をされています。
●編集部 今後の予定について教えてください。
●アンソニー 技術的には今後インターウォーブン製品にさまざまに機能を統合し、その機能もどんどん増やしていくつもりです。たとえば、昨四半期には.Netバージョンを発売しました。また、「意味ベースマーケティング」構想の普及にも努めていきます。我々は企業における情報の管理や検索について根本的な変化をもたらしました。これは非常に価値あることだったと思っています。
●編集部 ありがとうございました。
オートノミー・インターウォーブン
- 所在地 ● 米国 カリフォルニア州 サンノゼ
- 設立 ● 1995年
- URL ● http://www.interwoven.com/
- 事業内容 ● エンタープライズコンテンツ管理ソフトウェア製品の開発および販売、保守、コンサルティング業務
オートノミー株式会社
※2009年10月1日、インターウォーブン・ジャパン株式会社から社名変更
- 所在地 ● 東京都港区新橋2-2-9 KDX新橋ビル3階
- 代表取締役 ● 熊代 悟
- 設立 ● 2000年8月
- URL ● http://www.interwoven.co.jp/
- 事業内容 ● 日本国内におけるオートノミー・インターウォーブン製品(TeamSite Suite)および周辺ソフトウェアの販売、サポート、教育およびコンサルティング業務
ソーシャルもやってます!