ディープラーニングで音声から感情を読み取る技術「音声感情認識AI」の無償提供を開始
ユーザーローカル、「平穏」「幸福」「怒り」「悲しみ」「恐怖」「嫌悪」「驚き」に分類
2020/11/20 7:02 その他 | 便利ツール/サービス
AI(人工知能)・ビッグデータ分析技術開発のユーザーローカルは、解析AIがディープラーニング(深層学習)で音声から感情を読み取る技術「音声感情認識AI」の無償提供を11月19日に始めた、と同日発表した。大量の音声データを学習したAIが「平穏」「幸福」「怒り」「悲しみ」「恐怖」「嫌悪」「驚き」の各感情に分類する。
マイクが付いたパソコンを使ってウェブブラウザでサイトにアクセスし、数秒の声を録音することで利用できる。認識可能な音声の長さは1~30秒。マイクでの音声入力に加え、声が入った「WAV」「MP3」のファイルのアップロードにも対応している。AIが各感情に分類し、それぞれの成分を数値化したりグラフ化したりできる。
アニメやテレビドラマの登場人物のせりふで実験したところ、アニメ映画「鬼滅の刃」の煉獄杏寿郎の「よもやよもやだ 柱として不甲斐なし」は嫌悪35%。幸せ29%と判定。テレビドラマ「半沢直樹」大和田暁の「死んでも嫌だね」は、怒り41%、恐怖25%となった。ユーザーローカルは今後、ウェブAPIでの提供も検討する。
ソーシャルもやってます!