●科学方法論の大転換
こういうこと(アルゴリズム革命)が何をもたらしたかというと、科学方法論が大転換してしまいました。
これまでは何が一番すぐれた科学かというと、物理学でした。「理論駆動型科学」といわれるそうですが、ガリレオは太陽の動きを観察して、「地球が太陽の周りを回っている」と言いました。ニュートンは物が落ちるのを見て、それに関する理論を挙げました。
その後、アインシュタインに至るいろいろな理論が出てきますが、彼らに共通しているのは「理論のないデータはクズだ」ということです。ニュートンは3本の方程式で宇宙のあらゆる現象の説明に成功しています。
しかし、そのために非常に単純化もしているということはあります。学問上の論争はモデルの正しさをめぐって行われます。モデルと違った結果が得られたら、そのモデルは破棄される。だから、理論というのは、捨てられなかったモデルの体系だといいます。つまり、最後まで生き残った理論のかたまりがモデルであり、(本質を理解するための)道具だということです。
今日この動画を視聴している方は、ほとんどご経験があると思いますが、科学するときには、例えば世界中の人口や日本の人口が相手では莫大で手が出ません。何百人か何千人かのサンプルを拾ってきて、大きな理論を理論仮説から作業仮説に下ろし、実証研究するわけです。統計的に優位かどうか。優位であれば、そこで意味されることは政策に使われるし、生産管理に使われる。そのようにわれわれは科学を習ってきました。
ところが、その全部がアルゴリズム革命により不要になってしまったのです。ですから、世代による大きな違いが、今や出てきています。極端にいうと、ニュートンもアインシュタインも要らなくなったということかもしれません。
●データ駆動型の機序となったヒトゲノム解読計画
なぜそれができたかというと、ヒトゲノムの解読計画があったからです。覚えている人もいるかもしれませんが、1990年代にアメリカ政府が全力を掛けて、アメリカ人の全遺伝情報を解析すると言ったことがあります。
ゲノム解析で行うのは、人の全遺伝情報であるDNA分子をシークエンサー配列解読機にかけて読み取る作業です。これには15年は必要だろう、1990年のプロジェクトだから、達成できるのは2005年頃かと想定されていました。
ところが、そこにジョン・クレイグ・ヴェンター氏という人が入ってきます。彼はコンピュータの専門家ではなく分子生物学者で、いわば感染症の研究者のような人です。型破りの天才なので、公的資金のプロジェクトには参加しません。セレーラ・ジェノミクスという会社を自分でつくって、一匹狼として自力でゲノムの解読作業を始めます。
ヴェンター氏はシークエンサーを使わず、全ゲノムショットガン配列解読法を開発しました。ひと言でいうと、バラバラにしたデータをコンピュータが勝手に判断しながら組み立て直していく。ショットガン方式は要するにコンピュータの力づくの方法なので、確かに速い。しかし、それは単なる無秩序であり、解析は不可能だろうと言う人が多かったのです。
ヴェンター氏は、莫大な資金を集め、300台のシークエンサー配列解読機をフル稼働します。高価なスパコンを何十台も揃え、解読作業を始めて、1年もたたない1999年の9月にアメリカ人のヒトゲノムの全部を解読終了します。2000年、ビル・クリントン大統領がヒトゲノムの解読作業の終了を宣言したのが、人類の科学の方法論が変わった歴史的瞬間なのだそうです。
●確立されるデータサイエンス
したがって、大量のデータと超高速のコンピュータがあれば、モデルがなくても正しい結果が得られることが分かります。そのために必要なのは適切なアルゴリズムの開発だけです。
データ駆動型では、データを用いて現象を説明できるモデルを人間が考えるのではなく、コンピュータが自動推定します。モデルをぐんぐん収斂計算している中、「このモデルでいい」とコンピュータが考えるわけです。人間がモデルをつくるのが難しい現象もいくつもあり、これが可能になると、研究者の想像を超える新しい発見が可能になることも理論的にはあり得るわけです。
したがって、特定の分野においては、パターン認識が人間の能力を超えるまでになってきます。
一つの例でいうと、グーグルの傘下に「ディープマインド社」があり、2016年にこの会社のAIに囲碁をやらせます。もちろん囲碁のルールを覚え込ませたのですが、組み合わせを考えていくと何億問いう組み合わせが...