Word2Vecによる意味の足し引きとマーケティング的な向き合い方
2016/03/18
普段から調査分析をやっていると足元をすくわれやすいのが機能の説明です。
プレゼンなどで説明のしやすさから新しい種類のグラフを使ってみたり、定性的な調査を取り入れていらっしゃる方であれば「この結果はどうやって出したのかね」とやたら聞かれることがありませんか?
そんな時、あなたならすべて答えを出していますか? それとも分かる範疇にとどめていますか?
今回はWord2Vecという仕組みを例に「マーケティングを語る上ではいかに良い技術でもすべてを説明しようとしたり使おうとすると活用できているとは言えない」といった内容になります。
説明する範囲を明確にして、いかに分かりやすい範疇に収めるかを考えていきましょう。
早速ですが、以下のように意味の足し引きができる機能があります。
Word2Vecとは?
意味の足し引きって何っていう前にWord2Vecとは? とハテナマークを浮かべる方も多いと思うので簡単に紹介させていただくと、Word=単語、2=to、Vec=ベクトルという単語をベクトルに変換する仕組みです。
米Googleの研究者Tomas Mikolov(現在はGoogleではない?)氏によって提案され、オープンソース実装されました。
ベクトルは方向や大きさなどいろいろな捉え方ができますが、ようするに単語から意味意図を拾うための材料を何百次元かの数値で表したものとなります。
その数値はニューラルネットワークという人間の脳をコンピューターの計算によって表現しようとする仕組みによって利用され、数値の足し引きで単語の意味的なものを出力することができるという画期的な実装です。
意味の足し引きについては、Word2Vecを語る上で有名な実例として挙げられるのが、単語ベクトルにおいて王様から男を引いて女を足すと女王になる(King – Men + Woman = Queen)というものです。
これは言語学上革命的なことなのです。何に使えるの? といった素朴なギモンについては身近な例だとAI(人工知能)などへの応用でしょうか。
現状、マーケティングにおいては足す方は使っても引く方はあまり使いません。それについては後半説明します。
SeeSでの実装のリリース記事はこちら。
意味の足し引きについて、猫を例にあげてみる
先日、猫の記事を書くときに作ったコーパス(辞書)をベースにWord2Vecで多次元ベクトルを作成し、出力された結果を利用して例を出力します。
読者の方の大半はWord2Vecのパラメーターや作り方、考え方に興味が無いと思うので省きます。
ちょっと伝わりにくいかもしれないのですが、足し引きを言い換えると
「猫のことで頭がいっぱいの人に聞いてみる」というイメージです。
もっと具体的にすると、「猫について検索してみて、その結果を全部覚えたマニアックな人に聞いてみる」と言ったほうが伝わりやすいかもしれません。
そこら辺は先程のword2vecとは?で出てきたニューラルネットワークを擬似的な脳と考えていただければ早いかなと思います。
そこで、この画像イメージを維持してもらいたいがために、仮に猫子さんと名づけます。
猫カフェについてWord2Vecに聞いてみた
SeeSでは以下の様な画面から出力を行います。
直感的にわかりやすくするため、足すほうを「ポジティブ」、引く方を「ネガティブ」としてチェックボックスにしてあります。
上記の画像では猫カフェに対してポジティブな反応を期待しています。
この状態で出力ボタンを押すと以下の様な内容になります。類似度は1に近いほど結果が近くになります。
猫マニアの猫子さんは猫カフェについて想定できる「店名」「場所」「猫の種類」「業態」を語ったということでしょう。
「猫カフェと言ったら○○でしょ!」と店の名前や猫カフェがあるおすすめ地域を連呼しつつ「ブリティッシュショートヘアがたまらないの!!あそこの店長がねぇ……猫カフェといったら喫茶店でしょ!」とリアルにまくし立てられると若干ウザいですが、単純に結果だけをみるルーチンより、そういった想像しながら肉付けを行うと少しテンションが上ります。
表の色については以下のような主成分分析にクラスターを付加すると分類が少し楽になるということで対応させています。丸の大きさは類似度で大きさを決定しています。補助的なものとお考えください。
(主成分分析、クラスターのベクトル処理についてはR言語を経由しています)
こういった画像は他の記事でもよく使っていますので、お時間があれば見て回ってやってくださいね!
猫カフェに人間を足してみる
ここでさらに猫カフェに対して人間という要素をポジティブに選択します。
すると、以下のような出力になります。
人間からみたちょっとした主観のような内容ですね。
ちょっとざっくりしていますが、引く方もやりたかったのでこちらを選んだ次第です。
猫カフェから人間を引いてみる
猫カフェについて人間という要素をネガティブに設定します。
猫子さんが「土地とか店でしょ」とぶっきらぼうに答えている感じです。
足した時に出てきた主観的なところを無くすとこういったことになるのですね。
猫カフェ単体で調べた時に比べても情報の方向性がしっかりしています。
あれ? 引くのもありなのでは?
ここまでWord2Vecの足し引きについて見てきましたが、冒頭で引く方はあまり使わないと言っているのに引く方のほうが情報としてきちんとまとまってない? と思われるかたも多いのではないでしょうか。
ただ、そもそもこの意味の足し引きという考え方ですが、足すのは「特定の事を検索する」といったように馴染みやすいのですが、引くという考えは意外と説明が難しいです。
例えば仕事において「ナニソレについて調べておいて」というザックリした指示の出し方と、「ナニソレを調べる上でナニナニを省いて意味は似ているものを探して」となると調べ物を投げ出してしまいそうになります。
しかも、引き算という数学的な考え方が何を指しているのかわからない方のほうが圧倒的に多いのではないでしょうか。
その点でマーケティングコンサル的な側面を考えると、基本的には相手があって成立するので、レポートを納品したり説明したりするときに、「意味を引いたのですよー」を納得させるためにWord2Vecの説明を1から10まで説明した上で有意性を語るのは若干本末転倒な気もしますし、これに限らずそういった事は結構起こります。
ビジネスにおいて最良のグラフを選んで出した結果について、グラフのカタチについて何故それを選んだのか説明を求められて答えたは良いけどグダグダになることはありませんか?
ドイツの文豪、ゲーテが
「人はみな、わかることだけを聞いている」という名言を残していますが、新しいものの考え方や出し方をいかに日常に近いところにおけるか、今後の取り組み方についてもしっかり考えていく必要があります。
まとめ
- Word2Vecは意味の足し引き的なことができる革命的な仕組み
- 人が話しているというイメージを思い浮かべると解釈しやすくなる
- すごさと認知のバランスが取れないと使うシーンが限られてしまう
今後もWord2Vecと向き合いながら、なるべく面白くマーケティングに取り組んでいけるよう精進いたします。
最後までお読み下さりありがとうございました。