●ビッグデータとパターン認識
前半では、アルゴリズム革命ということを強調するとともにプラットフォーマーという話もしてきました。このアルゴリズム革命を体化したところが、シリコンバレー発のGAFAのような巨大IT企業の強みです。もう一つは、プラットフォーマーというビジネスモデルを自分のものにしたことです。ここで、この二つについて、詳しくお話をしてみたいと思います。
近年、コンピュータの演算能力が幾何級数的に高まっています。掛け算というより、乗数がどんどん高まっていくわけです。グーグルのコンピュータ・センターの容量は10の21乗だそうですから、とんでもないサイズです。こうしてデータサイズが大きくなったことからビッグデータが登場するわけです。
しかし、ビッグデータもそれだけではゴミの山で、コンピュータが認識しなければ意味がありません。ビッグデータそのものは全く認識できないですから、まず「パターン認識」ということを行うわけです。パターン認識は、コンピュータが図形や自然言語を認識、理解することです。グーグルの創業者たちが「構造化されていないデータをどう解読するか」と言っているのは、このことです。
構造化されるというのは、数字化されてデジタルになったものです。人の名前や絵などは、構造化されていないゴミの山です。リンゴやミカン(の絵)、手書き文字などは人間なら一瞬で理解できるものですが、コンピュータは、これまで構造化されたデジタルデータしか理解できませんでした。
だから、パターン認識はコンピュータには無理だといわれていたのですが、AIの能力が非常に発達したため、パターン認識が実用化したのです。パターン認識はどのように行うかというと、ニューラルネットワークという情報処理の方法に基づいています。
●ニューラルネットワークと機械学習
ニューラルネットワークのモデルは、人間の神経細胞です。人体の最小の細胞は「ニューロン」という神経細胞です。このニューロンに似た働きをする仕組みをニューラルネットワークといいます。これをコンピュータの中でつくり、大量のデータを用いて、情報処理方法を習熟させるわけです。
人間の脳の中にある膨大な数のニューロンは互いに信号を送り合い、情報処理を行って、さまざま...