NEWS新着情報

新着情報

2019/09/19 NEWSPRESS

感情分析AIは日本語のニュアンスをどこまで理解する?CINCの最新モデルを使ってみた

株式会社CINC(シンク)は、9月18日にディープラーニングを用いた感情分析AIの開発を発表しました。
CINCが人のように気持ちを察する感情分析AIを開発
創業時から、独自に自然言語処理の研究を進めてきたCINC。研究・開発の成果をWebマーケティングの調査・分析ツール「Keywordmap」などのソリューションとしてクライアント様へ提供してきました。
今回CINCが開発したAIの特徴は、主に2つです。

・「怒り」「恐れ」「好き」「喜び」「悲しみ」「ニュートラル」という6つの感情を分析できること
・日本語の微妙なニュアンスを精度高く判定できること

この記事では、こうした感情分析AIの特徴に加え、広報担当のAsuka. Nが実際にさまざまな例文(類似表現やSNSの投稿、交通ニュース、方言…などなど)を用いて検証した結果をお伝えします。

文章をみじん切り!日本語の微妙なニュアンスを察するAIを開発

感情分析AIの開発でハードルとなったことの一つに、日本語の構造の複雑さが挙げられます。日本語は英語と違って単語が分割されていません。文節の区切りがわかりにくいため、テキストからの感情分析は比較的困難とされているそうです。

一般的に、テキストでの感情分析AIの開発には、日本語の文節を分けて機械学習をさせる形態素解析が取り入れられます。しかし、日本語は文節の変化だけでなく、ひらがなや記号の一字レベルで言葉の印象が変わる言語です。例えば、「面白くない」に、「面白くない?」と「?」が一つ加わるだけで、受け手に与える印象が変化します。
 そこでCINCは、形態素解析よりもさらに細かい文字情報をAIに学習させることで、日本語独自のニュアンスを理解させようと試みました。

AI開発担当者に聞いたところ、より日本語を精度高く理解させるために、「日本語をみじん切りにして、AIに学習させた」ということです。細かな文字情報を与えることで、結果、日本語のちょっとした違いも分析できる感情分析AIの開発に至りました。

実際に、「面白くない」と「面白くない?」の分析結果を見てみましょう。

「面白くない」

「悲しみ」の数値が大きく跳ね上がり、「好き」「喜び」「中立」の数値は低く判定されています。個人の意見や感想として、「面白くない」という事実が述べられていることが読み取れます。


「面白くない?」

「好き」の数値が飛びぬけて高くなっています。「面白くない」の後に、「?」が続くことで、同意を求めるポジティブな意味合いに変わると、AIが理解していることが読み取れます。

CINC開発の感情分析AIを使ってみた

ではさっそく、いちユーザーとして、CINCのAIがどれだけ感情を推測できるのか、検証してみたいと思います。
類似表現、SNSやブログの投稿、交通ニュース、故事・ことわざ、方言…など、豊富な表現で、本AIの可能性を探っていきます。
※以下の検証はあくまでAsuka. Nの主観です。ご了承ください。

・大丈夫シリーズ

まず、AIはどこまで日本語のニュアンスを理解するのか、類似した表現で分析してみたいと思います。ここでは、「大丈夫」にまつわる表現で試してみます。

「大丈夫ですか」

「恐れ」と「中立」が高く判定されています。相手を心配している意思を読み取っていることがわかります。

 「大丈夫って言ってたじゃないですか」

怒りの数値が高くなりました。「大丈夫って言ってたじゃないですか」と、やや相手を責めるニュアンスが加わったことに反応しているようです。

「大丈夫じゃないじゃないですか」

感情の種類が広がり、わずかに「好き」の感情も芽生えました。確かに、「大丈夫じゃないじゃないですか」は、心配や怒りだけでなく、相手を気遣うような、優しさも感じられる表現です。AIも判定に迷いつつ、繊細に分析しているような印象を受けます。

・SNS、ブログなどの投稿

続いて、SNS、ブログなどで投稿されているユーザーの投稿を用いて検証していきたいと思います。日常のコミュニケーションで使用される、フランクな表現も分析させてみます。

「会いたいがすぎる」

「好き」の数値が、ニョキっと高く判定されています。やや「悲しみ」が確認できることから、「切なさ」とも分析できる感情であることがわかります。造語に近い表現ですが、AIはしっかりとその意を汲み取っているようです。

「どちゃくそかわいい」

インターネットを中心に使用されている、「とても、すごく」を意味する「どちゃくそ」。この、ある種逆説的な強調表現をどう読み取るか…?と試してみましたが、はっきり「好き」を指してくれました。賢い。

「そんな意地悪ある??」

「ないよね?」と続けたくなるような、付加疑問形の怒り表現です。こうした婉曲的な表現も、ブレることなく「怒り」「恐れ」と判定しました。

「新体制を発表してからのスピード感がえぐい!!」

最後に、CINC社員のある日の日報の文章を分析してみました。組織体制変更後、新たな目標達成に向けて湧いた部署の中で、ある社員が記載したテキストです。「えぐい」をどう分析するか…?と思っていたのですが、ネガティブな感情には振れず、どちらかというと「好き」や「中立」といったポジティブな数値が計測されました。

 

・交通ニュース

開発担当者から、事実を伝えることを目的とするニュースの文言は、「中立」と判定されることが多いと聞きました。交通ニュースで試してみたいと思います。

「東海道新幹線は停電の影響で、静岡県の掛川駅と愛知県の豊橋駅との間で上下線の運転を見合わせています。」

確かに、「中立」が高く跳ね上がっています。「見合わせ」という言葉からでしょうか。少し「恐れ」も計測されています。

 

故事、ことわざ

「ことわざは暗記物。中立と分析されることが多いです」と、開発担当者から聞いていました。ここでは「三つ子の魂百まで」で(理由なし)、試してみたいと思います。

「三つ子の魂百まで」

ぴったり22時の方角、「中立」を指しました。「子」という言葉からでしょうか。「好き」も計測されています。本AIは、「三つ子の魂百まで」をしっかり暗記できているようです。

 

・方言(関西弁)

最後に、方言を検証してみたいと思います。ここでは関西弁で、どこまで正確に判定してくれるのか試してみます。

「えらいこっちゃ」

少々こぶりな分析結果となりました。若干「怒り」の数値が高くなっています。特に大きく感情は振れていません。もしかすると、関西人は大して深刻な状況でなくとも、軽く「えらいこっちゃ」と口にしていると分析しているのでしょうか。

「ごっつええ感じ」

こちらも有名な関西弁ワードと言えるでしょう。「とても」→「ごっつ」、「いい感じ」→「ええ感じ」を理解できるか…?と心配しましたが、「好き」を高く判定しています。方言による表現の変化もおおよそ理解できているようです。

「ほんまそれ!!もうほんま嫌やねんけど」

最後に、SNSの投稿を参考に、関西人がリアルに口にしていそうな苦言を判定してみました。「ほんまそれ!!」や「~やねんけど」など、こちらも関西特有のニュアンスが含まれていますが、本AIは迷うことなく「怒り」を指しています。

 

SNS、ブログ、アンケートなど、感情分析AIの用途はいろいろ

今回、実際に感情分析AIを試してみて、日本語の構造の複雑さを再認識すると同時に、AIの進歩を感じさせられました。本AIを使用することで、おおまかな書き手の感情を予測することができそうです。例えば、SNS投稿やアンケートなど、膨大な量のテキストデータから、おおまかなニーズを把握したいときに、本AIの活用が効果を発揮しそうと感じます。
CINCは現在、近日中に皆さまにもご使用いただける形で本AIを発表できるよう、開発を進めています。リリースの際には、ぜひお試しいただけますと幸いです。