日本電気(NEC)は、ブログやアンケートなど、企業のブランドや商品などに対する評判情報を含む文章を分析する技術として、個人の主観や感情を表す「意見文」、特定の話題に関連した「トピック関連文」を文章全体の中から抽出する際の網羅性を向上する「文特性分布計算方式」を開発した、と4月14日に発表した。
文特性分布計算方式は、意見文やトピック関連文にあてはまるかを判定するため、話題の連続性に着目。前後の複数の文で“意見文らしさ”または“関連文らしさ”を計算する。これにより、単文で判定する従来方式に比べ、網羅性を示す指標の再現率を21%向上、対象となる文章中からより多くの意見文や関連文を抽出できるようになったという。
同方式では同じ話題が連続して書かれる傾向に着目し、複数の文の中に含まれる意見文を学習してルールを抽出して評価を行う。また、文章全体での意見文らしさ、関連文らしさの分布も算出して判定する。同社がこれまでに開発した技術と文特性分布計算方式を組み合わせることで、ブログ、電子掲示板などのCGM情報、アンケートデータ、コールセンターでの問合せの記録などから、より多くの意見や要望を把握するのに役立つという。
ソーシャルもやってます!