スポンサーリンク

ディープラーニングとは

ディープラーニングとは、機械学習の手法の1種です。まずは、機械学習とは何かを説明し、その後、ディープラーニングとは何かを説明したいと思います。

機械学習とは

まず、ルールベースと機械学習の違いを説明します。

ルールベースとは、Aの場合はXをして、Bの場合はYをして、のように人間が条件をもとにプログラムを行い、それに従って処理が行われることを指します。それに対して、機械学習とは、人間が条件をプログラムするのではなく、機械が学習によって処理内容を獲得し、その獲得した処理内容に従って処理が行われることを指します。

簡単な例を挙げると、「店にりんごがある場合はりんごを買い、りんごがない場合はみかんを買う」という決め事を人間が設定し、それに基づいて行動するのがルールベースです。反対に、猫の画像をたくさん学習させた後、「この画像は猫が写っているか、写っていないかを判断する」という処理を行うのが機械学習です。
猫が写っている画像かを判断するのに、画像のある座標のピクセルの色が白だった場合と、そうじゃない場合と、というような条件分岐を人間がたくさん指示するのは、現実的ではありません。そのため、画像分類の問題では、よく機械学習が用いられます。

ディープラーニングとは

ディープラーニングとは、機械学習の手法の1つで、層の深いニューラルネットワークを用いた技術を指します。

ニューラルネットワークとは、人間の脳のニューロンの動きにヒントを得た機械学習手法で、ニューロンに当たるものを、層状に重ねて処理を行います。

上記の図のように、一昔前は、3層のニューラルネットワークが主流でした。計算機の速度の問題等で、3層の学習を行うのがやっとだったために、3層で打ち止めになっていました。

近年は、計算機の演算速度の向上や、計算技術の進化があり、上記の図のように4層以上のニューラルネットワークの学習が可能となりました。4層以上のニューラルネットワークのことをDNN(ディープニューラルネットワーク)と言います。DNNは、画像分類の分野で他を圧倒する性能をたたき出し、一躍表舞台に登場しました。その後、研究が進み、画像分類だけではなく、物体検出、セグメンテーション、自然言語処理、時系列データ処理など、様々なことに利用できることがわかり、現在も研究が続いており、日々進化しています。

今までの機械学習と、ディープラーニングの違い

ディープラーニングと今までの機械学習で大きな違いがいくつかあります。

性能が段違い

ディープラーニングは、今までの機械学習よりも性能が大きく上回っていることが多いです。今までできなかったことが、一気にできるようになり、産業構造が変わろうとしています。例を挙げると、自動運転技術の進化などがわかりやすいと思います。

取り扱いが比較的簡単

ディープラーニングの技術は、今までの機械学習より取り扱いが比較的簡単です。今までは、機械学習の手法1つ1つを理解してプログラムを組む必要がありました。それに対し、ディープラーニングは、正直あまり理解していなくても、フレームワーク(TensorFlow等)を使えば比較的簡単にプログラムを組むことができます。

特徴量設計や分類器設計を行う必要がない

今までの機械学習では、人間が特徴量と分類器を設計する必要がありました。特徴量とは、分類等を行うために有用なデータ形式のことであり、入力データを処理して特徴量データに変換するという処理を最初に行うことになります。分類器は、特徴量を使って、それが何であるかを判断する処理のことです。
それに対し、ディープラーニングでは、特徴量と分類器を人間が設計する必要がありません。特徴量と分類器は、学習時に勝手に最適なものが内部で作成されます。ディープラーニングで人間が行わなければならないことは、ネットワーク設計くらいになりました。
さらに、現在は、ネットワーク設計も機械がやってしまおうというNAS(Neural Architecture Search)の研究が盛んであり、そのうちネットワーク設計すら人間がやる必要がなくなるかもしれません。

学習の計算量が莫大

今までの機械学習に比べると、ディープラーニングの方が学習の計算量が大きいです。現在は、主にNvidiaの高性能GPUを使って学習を行わせることが多いですが、それでも学習に数日かかったりするものが多いです。

学習用データがたくさん必要

今までの機械学習に比べると、ディープラーニングの方が学習用のデータの数がたくさん必要になります。解こうとする問題にもよりますが、数万というデータが必要になるのは、よくあることです。なので、良質なデータをたくさん持っている企業が、ディープラーニング技術を有効に利用できることになります。

まとめ

ディープラーニングは、今までの機械学習に比べて、性能が段違いに高く、産業構造を変革する力があります。取り扱いは比較的簡単ですが、学習させるたくさんのデータと学習させるための高性能なGPUが必要になります。これから先は、GPUの性能はどんどん高くなっていくと思われるので、重要なのは良質な学習用データセットの方になります。良質な学習用データセットを持っているか否かが、結果の成否を分けることになることになるでしょう。

フェイスブックなんかは、たくさんの良質な個人データを握っていることを考えると、ビジネスで成功できる理由がよくわかります。良質なデータを持つ企業が、これからも強くなっていく流れは加速するのではないでしょうか。

タイトルとURLをコピーしました