ミン・スン
投稿日: 2019年7月11日

人間の学習能力を超えた
「深層強化学習」

今日、史上最年少プロ棋士の誕生で脚光をあびる囲碁ですが、囲碁のルールはシンプルなのに、とても奥の深いゲームです。棋士は囲碁を打つたび、2 x 10 の170乗におよぶ打ち手を検討します。経験豊かな棋士は、長年の対戦経験の中でどの手が有効なのかを学習していきます。これを強化学習と呼びます。(英語資料

囲碁のプロ棋士同士の数千におよぶ対戦情報をAIに学習させると、AlphaGoが成し遂げたように、人間のトップランクの棋士を打ち破ります。これは深層学習によるものです。AIは数百万回の対戦データから自ら学習し、何通りもの対戦データを生成し、最も有効な打ち手を分析します。人間が学習するように、間違いと正解から、よりよい結果が出せるように打ち手を調整するのです。複数のAI同士で数百万回の対戦をさせれば、学習の規模も速度も人間の能力を大きく超えるレベルになります。

深層強化学習は構造の内部を深く分析します。囲碁の対戦と同様に、マーケティングにおいても深層強化学習で使われるAIは、これまでのキャンペーンに基づく分析に併せて、将来予測についても自らの経験の中で学習しており、戦略や活動目標を達成できるように支援します。

またキャンペーン中も学習を継続し、何が有効で、何が有効でないか考えることができます。収益性についても分析し、獲得リード毎のコストを低下させたり、より有益なユーザーをターゲットにするなど、将来のキャンペーンを最適化することが可能になります。

例えば、アプリのインストール数を最大化させるためのキャンペーンを検討しているとしましょう。あなたの目標は与えられた予算内でインストール数を最大にすることです。そして予算配分や入札価格などを決めていくことになります。AIは深層強化学習手法を使うことで、予算や市場環境を考慮し、最適なプラットフォームや入札価格、タイミングを提案し、あなたのマーケティング活動の最適化を支援します。また市場環境に変化があった場合には、マーケターが行うよりも迅速に対処することができます。

マーケティングでは複雑な人の行動を分析する必要がありますが、このような環境において、深層強化学習は理想的なツールといえます。間違いから学習し、迅速に最適化を導くところはとても優れています。

 
 
 
「ディープラーニングが自然言語処理に最適な理由」