行動予測

ECと ディープラーニング


最近はちょっとした人工知能ブームです。
人工知能を扱った映画や書籍、ブログや記事などもかなり増えてきています。

人工知能ブームの背景

なぜ人工知能がブームなのか、その一つの理由に ディープラーニング (深層学習)という新しいアプローチというか手法が登場し、それが脚光を浴びているからというものがあります。
AIや人工知能というワードは以前からありますし、若干SFじみている、もしくはちょっと胡散臭い?ような印象があります。

これに対して ディープラーニング というのは新しいキーワードで、それもなんかちょっと良い響きだというのがポイントなのではないかと思います。
クラウド、ビッグデータ、オムニチャネルなどもなんとなく「良さげ」なキーワードというのがブームになった一因だと私は思います。

それにディープ(深層)という表現は、なんとなく「深く」考えるような印象を与えます。
ただ実際にはこのディープ(深層)というのは、処理を多段に深くできる手法という意味にすぎません。
ところがこれがなんとなく、ディープにラーニングする(深く学んでいく)ような人工知能にぴったりの誤解を与えやすいというのも、またその一因でしょう。

本質から外れた要素でブームになってしまうと、いわゆるバズワード化して、その後にガッカリ感というか期待はずれな印象が出てしまうというデメリットがあります。
「 ディープラーニング って知ってる?今までより深く考える人工知能なんだぜ」みたいな会話は、既にそこらで交わされているような気がしてなりません。

ディープラーニング 活用の現状

人工知能というのは人工の知能であり、それが意味するところは大変広いと言えます。
学術的というか研究的には、それは「自分で考えることが出来るコンピュータ」というのが目標というか目的だと思います。
それが実現すればすごいことで、また一つの産業革命を起こすことは間違いないでしょう。
まだまだそれは先の話です。

でもこうした中に、産業に活用できる要素があることは多いものです。
ディープラーニング というのは一つのアプローチです。
前述したように「多段(多層)にすることが出来る」というのが大きなポイントです。
それによってこれまでより高度な処理ができることが期待されています。

ただ現在のところ、 ディープラーニング について理論ではなく手軽にやってみたような事例としては画像認識の話題がほとんどです。
それは元々 ディープラーニング という手法が脚光を浴びた大きな要因が、画像認識のコンテストにおける圧倒的な結果であるというせいかもしれません。

ディープラーニング 自体は多層にニューラルネットワークを重ねることができるという、言わば考え方であり計算手法そのものではありません。
コンピュータが処理するのですから、最後はなんらかの計算に落としこむ必要があります。
そして今のところ ディープラーニング における計算手法は、画像を扱いやすいという傾向があります。

また画像はサンプルデータを入手しやすいですし、結果が良いか悪いかもパッと見てわかります。
画像以外で現在 ディープラーニング で扱いやすいデータに音声がありますが、音声はサンプルデータを入手し難いですし、結果を確認するには実時間を取られます。
100枚の画像を見るのは一瞬でも、100個の音声を聞くのは結構大変です。

ブログで「こんないい感じの音声の分類処理を ディープラーニング で実装しました」という記事を書いても、それだと見る人が音声を聞かないといけないのであんまり話題にはならないでしょう。

ところが画像だと、「おおー、すごい」と思われやすいので、チャレンジするモチベーションも上がりますし話題にもなりやすいので、現在はお手軽な ディープラーニング といえば画像が扱いやすいというのが実状です。
ストレートにいえば画像はWebという媒体に向いていて、話題になりやすいのです。

そして話題になりやすいので、ネットにはそうした記事がすでに沢山あります。
ちょっと腕に覚えのあるエンジニアなら、環境を作って設定ファイルを書いて、実際に画像認識をやってみるということが比較的簡単でかつ短時間で出来るでしょう。
そしてその成果を発表すればまたそれが話題になって、という繰り返しです。

別に ディープラーニング の計算根拠が理解できなくても画像認識はできるような下地が整っているのです。

ECとディープラーニング

ゼロスタートはEC向けマーケティングソリューションを提供しているため、この ディープラーニング がECに活用できないかという視点から研究をしています。

ECとAIというとちょっと違和感があるように思いますが、ECというのはそもそも機械学習が最も良く扱われている分野の一つです。

人工知能でECのコンバージョンを向上!というとすごく胡散臭い気がしますが、最新の機械学習の手法でECのコンバージョンを向上!というとまともに聞こえます。

実際のところ、ECというかコマースにおける ディープラーニング の事例というのはすでにいくつかあります。
ただそのほとんどが、実際には画像認識をコマースで活用しているだけです。

例えばアパレルで画像認識によってコーディネートを推薦するとか、実際の店舗で来店者の顔を認識するとか、結局のところやっているのは画像認識です。

私はECというかコマースにおける ディープラーニング の活用の本命は消費者と商品の分類だと思います。

そもそもコマース分野における機械学習は消費者と商品の分類のために使われています。

ディープラーニング によって膨大なデータから消費者や商品を分類することで、消費者に最適な商品を提案する事ができれば、これはかなり良いアプローチになることでしょう。

実際のところ、マーケティングや金融工学というのは現状でも既に ディープラーニング による成果が見込める分野と期待されています。

マーケティングの本質は何かというと、それは消費者の行動予測です。

これまでこのコラムでも何度も触れたように、ゼロスタートのサイト内検索エンジン「ZERO ZONE SEARCH」は、単純な検索クエリによる商品マッチングではなく、検索クエリを元にして消費者の購買予測をし、それに最適な商品を検索結果として表示するというのがそのアプローチです。

良い購買予測ができるのであれば、そしてそれが得られる収益より安いコストで実現できるのであれば、これはECにおいては絶対役に立ちます。

事業化と費用対効果

元々ゼロスタートではレコメンドエンジン自体を2007年にリリースしたのがECソリューションの始まりです。

このレコメンドエンジンでは、ルールベースや相関といったよく使われていたアプローチに加えて、ベイズ分類器という機能を搭載していました。

当時はECでベイズというのはほとんど事例がなく、「なんでベイズなんですか」というような反応が多かったことを思い出します。

それから8年経って、今ではベイズの理論を元にした手法はかなり一般的になってきましたが、当時はベイズの理論を活用した産業の事例というとスパムフィルターくらいしかなく、それをレコメンドエンジンに登載しようとすると文献や参考資料もなくて大変苦労したのを覚えています。

これと同じように、今「 ディープラーニング をECに活用」というと「なんで ディープラーニング なんですか」という反応が多いであろうことは容易に予測できます。

ただ私は ディープラーニング はECにとっても有用であろうと、現時点ですでに考えています。

問題は、前述した「それで得られる収益を下回るコストで」実現できるかということです。
研究と産業の一番の違いはここにあります。

ECの収益が10%増えます、コストは10倍になります、というエンジンを出しても絶対に売れません。

この収益とコストのどちらが上か、簡単にいえば損益分岐点を上回れるかどうかというのは、産業というか事業においては決定的に重要な意味を持っています。

それがいわゆる費用対効果というものです。

粗利はプラスでなくては駄目なのです。
粗利をプラスにできるのであれば、そこにはどんどんお金が流入してきます。

ディープラーニング を消費者の行動予測に活用すること自体はできます。
これは間違いありません。

つまりECで ディープラーニング を活用すること自体は原理的にはできるのです。

問題はそこではなくて、費用対効果を上げられるかどうかです。
そして単純にプラスというだけでは駄目で、他の手法よりも費用対効果が高くなければなりません。

他のすでに存在する機械学習のアプローチのほうが費用対効果がどんなケースでも高ければ、やはりそれは駄目です。

行動の数値化と予測

ところでゼロスタートではすでに8年にわたって、ECにおける消費者の行動予測をサイト内検索エンジンレコメンドエンジンという形で提供してきました。

いつもお客様との話で出てくるのが、「重要なのは計算ではなく数値化です」というものです。
計算自体はデータが揃えば出来ます。

問題は、計算根拠となるデータをどう抽出するかのほうです。

世の中の多くのレコメンドエンジンは、そこはあまり重視していません。
購買履歴を1として扱って、0か1かで相関分析をしているだけです。

それによって「Aを買っている人はBも買っています」というレコメンドを行います。
ただ、これはこれで結構良い結果が出るのです。
そして元のデータが二値なので計算コストも低く抑えることが出来ます。

つまり「費用対効果が高い」のです。

ゼロスタートは製品戦略として、ハイエンド側をターゲットにしています。
エンジンは提供価格が高いですが、それを上回る収益を実現するというものです。
このため搭載しているロジックも大変複雑で多岐にわたっています。

その際に重要になってくるのが、前述した「数値化」です。
買った買わないを1と0で数値化するのは簡単です。

では閲覧履歴をそこに混ぜるとすれば、0.1にするのが妥当なのか0.5くらいがいいのか、いや見て買わなかったらむしろマイナスなのか、無視するほうがいいのか、正直正解はありません。

この「現象を数値化する」という点こそが、ゼロスタートが長年取り組んできてノウハウを蓄積してきた部分の一つです。

私が ディープラーニング をECに活用できると考えている理由の一つは、「現象を数値化する部分自体を計算できる」可能性を秘めているという点です。

膨大なデータを入力して学習させれば、その結果として「どの行動をどう数値化すればいいか」についての精度を上げていくことが可能になるかもしれません。

数値化の精度が上がれば、それを元にした相関の計算結果もより費用対効果の高いものになるでしょう。
ただしもちろんこれには膨大な計算が必要で、そのコストを上回る効果になるかどうかについてはまだまだ研究中です。

この製品コラムでは、いつももっと具体的な「ECではこうしたほうがいい」というトピックを扱っています。

なぜ今回こうした研究中のテーマを持ちだしたかといえば、それはいずれどこかのタイミングでECとAI、ECと ディープラーニング というテーマを打ち出してくるソリューションが出てくると思っているからです。

それも現在すでにある、画像認識をECの一機能として使ってみました、というものではなく、消費者の行動予測というもっと根本的な部分を扱うソリューションです。

行動予測

「人工知能でECのコンバージョンをアップ」というと話題にはなりますが、その実情は単に ディープラーニング による画像認識というだけでは、正直あまり面白くありません。

ベイズフィルターでECのコメントスパムを弾いているだけで「ベイズによってECの効率を向上」とアピールするようなものです。

もちろんそうした消費者の行動予測を ディープラーニング で実現するというソリューションを最初に提供できるようにしたい、というのもありますが、せめて「 ディープラーニング がECでよく扱われているから真似したんではないか」と思われないように、今回はこうした記事を書いてみました。

次回以降はまた、もっと具体的なトピックに戻したいと思います。

 

– 前の記事 –
サイト内検索 と商品検索の違い

– 次の記事 –
サジェスト とレコメンド

■関連記事■
人工知能と検索 エンジン
ECにおける人工知能と特徴量の抽出
人工知能 ブームの功罪
空気のように当たり前となるレコメンド
検索の 入力 と出力の重要性

 

>その他のコラムを読む

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
【著者情報】
株式会社ゼロスタート
代表取締役社長 山崎 徳之

【連載紹介】
[Biz/Zine]テクノロジービジネスの幻想とリアル
[ECZine]人工知能×ECことはじめ
[ECのミカタ]ECの役割
[ネットショップ担当者フォーラム]検索とレコメンドで実現するEC時代の接客術
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

vector graphics and icons designed by Freepik (http://jp.freepik.com)