NEWS新着情報

新着情報

2019/10/09 NEWSSERVICEPRESS

【開発ストーリー】SNSマーケティングを前進させる、感情分析AIが誕生

AIを、マーケティングソリューションの新たな核心へ。
創業から自然言語処理の研究を進めてきたCINCは、2019年8月に6次元の感情(「怒り」「恐れ」「好き」「喜び」「悲しみ」「中立」)を分析できる感情分析AIの開発を発表。本AIの機能は弊社が2019年10月1日に発表した「Keywordmap for SNS」に実装されています。

Twitterから顧客の声や動向を多角的に分析できる! ソーシャルメディアマーケティングの調査・分析・プラニングツール 「Keywordmap for SNS」をリリース

Webサイトの調査・分析ツール「Keywordmap」は、ユーザーの検索行動や、自社・競合サイトの動向を調査できる強力なツールとして、数々のクライアント様にご支持いただいてきました。感情分析機能を実装したことで、さらに独自性・競合優位性の高い、パワフルなツールへ成長を遂げたと言えます。

感情分析機能によってできることは多数あります。ユーザーのSNS投稿からダイレクトに感情シグナルを読み解いてマーケットリサーチをしたり、特定のテーマでポジティブなコメントが増える時期を調査してブームの発端を探ったりと、用途は多様です。
可能性に満ちた感情分析AIですが、リリースに至るまでは幾度も紆余曲折があり、試行錯誤が繰り返されました。

「リリースできるかどうか、最後までわからなかった」

感情分析AIの開発に従事してきた開発部のTakeshi. Sは言います。Takeshi. Sは、大学で教鞭を執りながら、2018年春からCINCにジョインし、AI開発に携わってきました。大学での研究分野から、CINCとの出会い、感情分析AI誕生に至るまでの道のりについてTakeshi. Sに聞きました。

 

念願のリリース!最後のロングシュートが決まった(笑)

――感情分析AIのリリース、おめでとうございます。初めに、感情分析AIを無事に発表でいた感想を聞かせてください。
いやぁ、ホッとしています。
本来はデータ収集をどなたかにお願いして、私がモデルを開発するなど、分業にすべきでしたが、リソース的に難しかったですね。サッカーで言うと、時間がないのでロングシュートを蹴ったら何とか決まった、という感じです(笑)

ーーTakeshi. Sさんは大学で講師をされながらCINCの開発を担われていますが、専門分野について教えてください。大学生の頃からAI研究に携わっていたのですか?

私の専門分野は心理学です。学生の頃は、実験心理学から統計処理全般、その後、乱数を使った研究もしていました。乱数とは、無作為な数字と言いますか、サイコロを振るとランダムに現れる数字の仕組みに関する研究で、シミュレーションをして統計モデルを作成するときなどにも役立ちます。

こうした知識は直接AI開発の技術に直結するわけではないのですが、僕自身は地続きにあるととらえています。開発にあたり、モデリングをしていく上で、乱数を使用する機械学習の方法も多く存在するからです。
AI開発については、個人的に興味を持っていて、チャレンジしたいという気持ちを抱いていました。

技術力の高さと業務内容に惹かれてCINCへジョイン

――CINCとの出会いについて聞かせてください。

大学の講義がない曜日に働ける会社を探していました。
「技術力が高い会社がある」
転職エージェントの方から、そう紹介いただいたのがCINCです。

面接で伺った業務内容が具体的で、入社を考え出しました。そのとき、お話を頂いたのが「単語をベクトル化し、クラスタリングをしていく」というミッションです。私自身、クラスタリングを実用レベルでモデル化した経験は全くなかったわけですが、最近、自然言語領域でよく使用される「Word2Vec」は取り組めばツールの開発も可能だろうと思われ、CINCへの入社を決めました。

――入社後の仕事内容、感情分析AI開発に至るまでの流れを教えてください。

2018年春に入社し、初めは面接で話が上がったクラスタリングの開発に携わっていました。本機能も、テーマ別にSNSの投稿を分類するクラスタリング分析機能としてKeywordmap に実装されています。

その後、2018年秋には感情分析AIの開発が本格始動しました。背景の一つに、SNSマーケティングの需要の高まりがあります。数ある投稿から感情を測定できれば、ユーザーの反響や行動特性をスピーディに読み解くことができ、マーケティングの可能性が一気に広げられます。クオリティの高い感情分析をリリースしている企業は限られていましたし、チャレンジする価値はありました。

 

CINC独自のプロダクトとして、アイデンティティを模索

――感情分析AI開発のプロセスを教えてください。

初めは試行錯誤の連続でした。おおよそフレームワークはあるものの、機械にどのように学習させるか方向性が定まらず、右往左往する時期が続きました。研究開発ではすべてのプロセスで及第点以上を取らなければ、それがネックとなってゼロからやり直しということも多々あります。その点では、多種多様な方法を試してみる、というスタンスで続けました。

感情分析AI自体は、AI開発の教科書に載っているような技術で、さほど難しくはありません。性能の質を問わなければ簡単に開発できます。しかし、日本語の理解をビジネスレベルのクオリティに仕上げようとすると多少話は違ってきます。参考書をなぞるだけでは、シンプルでわかりやすいデータをAIに与えるだけになることが多く、結果もワンパターンになりがちです。ビジネスレベルのプロダクトを開発する上では、参考書に書かれていないことがポイントになってきます。

加えて、参考書に載っている方法はたいてい英語のコーパスを題材にしているため、日本語に置き換えて考える必要がありました。そして、日本語を想定した開発のコツはどこにも書かれていないわけで、自分で道筋を見つけていかなければなりません。感情を2次元から6次元へと変動させたり、機械にラベルを与えてあげたりなど、CINCオリジナルのプロダクトとしてのアイデンティティを確立するために、思いつく限りのパターンを当てはめて試行錯誤を重ねました。

日本語のニュアンスをAIに理解させるため、文章をみじん切りに

――感情分析AIの強みを構築する上で、特に注力したことは何ですか?

ビジネスプロダクトのクオリティと競合優位性を担保するために、いかに他社のプロダクトをしのぐか、という点に注力しました。中でも、特にこだわったのは日本語の微妙なニュアンスを解析できるAIを開発することです。

一般的に、感情分類機を開発する際は「形態素解析」という技術が用いられますが、それだけでは日本語が表す細やかな感情の機微を分析することは難しいと判断しました。例えば、「何度も言ってるだろ」と「何度も言ってるだろう」「何度も言ってるだろうが」。たったこれだけの語尾の違いで、この3つは、与える印象が大きく変わります。

そのため、基本的な形態素解析は用いるものの、それに頼りすぎない開発を心がけました。ここが、CINCのAI開発の独自性の一つと言えます。形態素解析は、一般的に単語を区切り、品詞として名詞、動詞、助詞、助動詞に分け、さらに接尾辞など、もっと細かいものも出てきます。これらを、文字の単位でみじん切りにした言葉を学習させるアプローチを取りました。文章の区切りがわかりにくい日本語を分析するという点では、苦肉の策ですが、必要なプロセスと考えたからです。
具体的には、CNN(Convolutional neural networkm、畳み込みニューラルネットワーク)や、古典的なやり方と組み合わせつつ、日本語を解析する上で理想的なAIの性能に近づけられるよう尽力しました。

※感情分析AIの詳しい性能についてはこちらをご参照ください。

感情分析AIは日本語のニュアンスをどこまで理解する?CINCの最新モデルを使ってみた

 

AI開発のレッドオーシャンで勝ち抜くために、競合調査は必須

競合他社のAIにも多数触れて、その精度を検証しました。CINCが開発するうちにも新しいAIが発表されたり、既存のAIがバージョンアップされたりという状況が続きます。そのたびプロダクトのリリースに求められるレベルがどんどん高まっていくわけです。初めは「楽勝じゃん」と感じても、そう言っているうちに他社が急進的な技術革新を遂げることも多々あります。他社と同じレベルのAIをリリースしても意味がないので、どうすれば競合を越えられるか、という点でも試行錯誤を重ねました。そんなことを2018年秋から続けて、2019年春にはようやく見通しが立ってきました。

リリース見送りは絶対に回避。AIの性能の高さを結果で示すべく奔走

――特に苦労したことはいかがでしょう?

2019年春以降は、リリースできるかどうか瀬戸際の状態が続き、焦りの募る毎日でした。なかなかAIの性能が安定せず、リリース見送り目前まで追い込まれたこともありました。このまま開発を続けても、AIの性能は改善しないという見方もあったのです。

ゼロからイチを生み出すとき、組織内に専門知識を持っている人が少ないケースは珍しくありません。今回の感情分析AIについても、ディープラーニングの深い中身について客観的な評価を下せる人は少ない状況でした。「もう少し頑張れば理想的なAIを開発できるかもしれない」と思っていても、根拠を示すことができず、心理的に追い込まれた状況が続きました。ですから、結果で証明するために、完成目前の最後の1カ月は必死でAIの性能向上に努めました。

――何がリリースの契機となったのでしょうか?

AIに与えるデータのパラメータを調整しました。そうすることで格段に精度が上がり、クオリティ面で不安視していた問題が解消されたのです。一言でいうと、オーバーフィッティング(過学習)で、人間で言えば太りすぎていた状態。そこで与えるパラメータ量の調整、中身の見直しを行いました。最終的に、評価用のデータをセットして突き合わせたところ、判定結果が改善され、一定のクオリティが担保されるようになりました。クオリティチェックに数万件は用意したと思います。

――アナログでのチェックもされたのですか?

はい。アナログでのチェックはどこかで絶対に必要ですね。今回開発したAIは、「Keywordmap fo SNS」のTwitter投稿の感情分析ツールに活かされています。実際のツイートをAIで判定させ、正解率と照合し、目視でチェックしました。

80点以上の感情分析が、何万件も一括で行える

――さっそく感情分析AIが、Keywordmapに実装されました。感情分析機能にはどのような可能性があると思いますか?

本AIは、人間が綿密に文章を読むレベルまでには達していません。しかし、本AIの強みは何万件もの膨大なテキストデータを読み込み、一定の正確性をもって解析ができるという点にあります。何万件も80点以上の分析が行うことができるのです。

当然、CINCがクライアント様に提供しているようなマーケティングとの相性は良いですし、個人の人が書いているアンケート、報告書、ブログなどから感情を測ることもできるでしょう。

「消費税」で調査した際のKeywordmap for SNS検索結果(2019年10月4日時点)

9月上旬から徐々にツイート数が増加し、10月1日に大きく数字が跳ね上がっている

感情分析AIは、「消費税」を含む投稿は「怒り」「悲しみ」「恐れ」というネガティブな感情の割合が高いと判断している

 

既存のプロダクトを磨きつつ、画像認識の分野にも挑戦したい

――今後のAI開発の展望を教えてください。

AIそのもののトレンドに注目すると、現在では画像を使った深層学習が圧倒的に多く、独壇場といった印象を受けます。画像認識とAIはとても相性がいいんです。一枚の画像には隅々まで多くの情報が詰まっていて、パッと見で様々な識別も可能と言われています。ですから、AI開発においては既存のプロダクトを磨きつつ、今後、画像認識の技術を活かしていきたいと考えています。その際も、既存のプロダクトの物真似では意味がないので、CINCが持つ圧倒的なデータ、開発・分析力をいかして革新的なサービスの実現に寄与していきます。