「ディープラーニングの進化」

AI(人工知能)テクノロジー企業のAppier(エイピア、共同創業者/CEO:チハン・ユー)のチーフAIサイエンティストであるミン・スンは、どのようにディープラーニングが進化を遂げたかについて、以下の通り発表しました。

昨今、検索エンジンのアルゴリズムの改善に「ニューラルネットワーク」が使われたとの報道もあり、ディープラーニングの社会実装は活発化しております。今回、ミン・スンは、ディープラーニングのこれまでの進化を振り返るとともに、活用に際して提言をいたします。

顔認識を可能にするディープラーニング

コンピュータビジョンとは、ディープラーニングを使用し、対象の物体や画像を見せるだけで、その対象を認識するようにコンピュータに教えることを意味します。

従来の「機械学習」を使用した「画像認識」では、特定のオブジェクト(特定数のエッジ、特定のカラーパターン、特定の形状など)を認識するために、何を探すかをコンピュータに教える必要がありました。特徴量エンジニアリングと呼ばれるこのプロセスは、時間と労力を要するにも関わらず、結果はあまり正確ではありませんでした。

しかし、コンピュータビジョンでは、人間がこれらの機能を手動で設計する必要はなく、コンピュータはオブジェクトの特徴的な機能を自動的に学習します。

今日、コンピュータビジョンで最も一般的なのが、顔認識です。顔認識を使用すれば、スマートフォンを見るだけでロックを解除することができます。一部の国境警備チームは、パスポートのスキャンと同様に顔認識を使用しています。また、アクティビティを認識することができることから、監視カメラを使用して人々を追跡するためにも使用されます。他に身近な例では、キャッシュレスのAmazon Goで、バスケットに入れる製品を認識するために使用し、アイテムをスキャンせずにいくら請求すればよいかを認識しています。

人間の脳に見立てた人工ニューラルネットワークが、「学習の深さ」を可能にする

上記で説明したコンピュータビジョンは、ディープラーニングを活用することで実現します。ディープラーニングは「機械学習」が進化したもので、意思決定プロセスの数を増やし、「より深い」学習を達成するための手法です。従来の「機械学習」では、ある時点まで到達すると学習が飽和状態となり停止してしまいます。

「より深い」学習を実現するディープラーニングでは、「人工ニューラルネットワーク」というモデルが必要です。「人工ニューラルネットワーク」では、人間の脳がどのように機能するかを模倣しています。人間の脳は、数十億のシナプスを持つニューロンが複雑に接続されて構成されています。

人間の知能は、この複雑なニューロンの接続により実現しています。今のところ、人間の脳がどのように機能しているかの全容は解っていないのですが、シンプルなコンポーネントが複雑な方法で接続されて、人間の知能を導いていると推測されます。

現在、複数の層にまたがって複雑な方法で接続する人工ニューロンの開発が進められています。ニューロンを接続する層が多いほど、人工ニューラルネットワークはより深い学習を可能にします。ニューロンを接続する層が多いほど、最終的にはより多くのデータを処理できるのです。

現在、複数の層にまたがって複雑な方法で接続する人工ニューロンの開発が進められています。ニューロンを接続する層が多いほど、人工ニューラルネットワークはより深い学習を可能にします。ニューロンを接続する層が多いほど、最終的にはより多くのデータを処理できるのです。