【歴史】ベイズ推定は現代社会を豊かにするのに必須だが、実は誕生から200年間嫌われ続けた:『異端の統計学 ベイズ』

目次

はじめに

この記事で取り上げる本

著:シャロン・バーチェ・マグレイン, 翻訳:冨永 星
¥1,672 (2022/02/17 06:19時点 | Amazon調べ)
\楽天ポイント4倍セール!/
楽天市場
\ポイント5%還元!/
Yahooショッピング

この本をガイドにしながら記事を書いていきます

この記事の3つの要点

  • 「過去1度も起こったことのない出来事の発生確率」をどう算出すればいいか?
  • 「人間の直感」を組み込んだために、科学の世界でメチャクチャ嫌われ続けた
  • 難題に直面し解決を求められた人々が、緊急避難的に「ベイズ推定」を使い続けたことで、その真価が認められるようになった

1つの科学理論が認められ、受け入れられるまでに、これほどの歴史が存在するのだと感動させられる

自己紹介記事

どんな人間がこの記事を書いているのかは、上の自己紹介記事をご覧ください

現代社会に無くてはならない「ベイズ推定」は、200年以上嫌われ続けたなんて、『異端の統計学ベイズ』を読むまで知らなかった

まずは、現在ベイズ推定がどのように使われているのかが短くまとまっている文章を引用しよう。

今ではベイジアン・スパム・フィルタが、ポルノ・メールや詐欺メールをすばやくコンピュタのゴミ箱に運ぶ。どこかで船が沈んだら、沿岸警備隊は生存者が何週間も大海原を漂流しなくてすむように、ベイズ推定を使ってその居場所を探り出す。さらに科学者たちは、遺伝子がいかに調整され、規制されているかを突き止める。ベイズ派からはノーベル賞受賞者も出ており、オンラインの世界では、ウェブで情報を広く集めたり歌や映画を売るのにベイズの法則が使われ、コンピュータ・サイエンスや人工知能や機械学習、ウォールストリートや天文学や物理学、安全保障省やマイクロソフトやグーグルにまでベイズの法則が浸透している。この法則のおかげで、コンピュータによる言語の翻訳が可能となり、何千年にもわたって立ちはだかってきたバベルの塔が瓦解しようとしている。ベイズの手法は人間の脳が学習したり機能したりする様子を示す比喩となり、著名なベイズ派の人々は、政府の各部署におけるエネルギーや教育や研究の助言者となっている。

ベイズ推定がいかに現代社会に必要不可欠なものか、この文章でイメージできるだろう。ざっくりとまとめれば、「これまで不可能だと思われていたことが、ベイズ推定のお陰で可能になった」ぐらいのインパクトがあると言っていい。引用中の「バベルの塔が瓦解しようとしている」という表現は象徴的だ。日本では「ポケトーク」が有名だろうが、既に世界中の言語を瞬時に翻訳する技術が様々に存在しており、そこにベイズ推定が使われているのである。

しかしベイズ推定は、誕生から200年近く、学問の世界では嫌われ続けた。かなり長いこと”異端”の考え方だったのだ。そんなベイズ推定が、いかにして現在の地位を得るまでに至ったのか。本書ではその過程が明らかにされる。

ベイズ推定とは何なのか?「頻度分析派」となぜ対立したのか?

ベイズ推定を簡単に説明すると、「一度も起こったことのない出来事の発生確率を導き出す手法」だと言える。

例えば、東日本大震災以前の日本で、「原子力発電所でメルトダウンが起こる確率」について考えたいとしよう。我々は既に東日本大震災を経験しているので、「原子力発電所でメルトダウンが起こる」という事実を知っている。しかし、東日本大震災以前の日本でメルトダウンは一度も起こっていなかった。

さてこの状態で、どのように「原子力発電所でメルトダウンが起こる確率」を算出すればいいだろうか? この問いに答えるための手法が「ベイズ推定」である。

それではまず、一般的な確率の出し方についておさらいしておこう。そんなの分かっている、という人は飛ばしてほしい。

例えば、「サイコロを1回振って5が出る確率」は1/6だ。サイコロの目は6個あり、どの目も同じ確率で出るとされているのだから、1~6のどの目が出る確率も1/6となる。

ただしこれは、理論上の話だ。実際にサイコロを何度も振った場合、「5・5・4・5・5・1・3・5」のように、とても等確率で目が出ているとは思えない結果になることも多い。では計算ではなく、実際にサイコロを振ることで「各目が出る確率は1/6である」と確かめたい場合、どうすればいいだろうか

正解は、「とにかくたくさんサイコロを振る」である。例えば頑張って1万回ぐらいサイコロを振れば、どの目も1/6ぐらいの確率で出ていると確認できるだろう。試行回数を増やせば増やすほど、より正確な結果が分かるというわけだ。統計学の世界ではこれを「大数の法則」と呼んでいる。

これが、一般的な確率の出し方だ。このように、「実際に起こった回数を元に確率を算出する手法」を「頻度分析」と呼ぶ

統計学においては、この「頻度分析」派が長らく主流であり、彼らはひたすらに「ベイズ的なもの」を批判し続けたのだ。その批判の仕方は多岐に渡る。本書に載っている、「ベイズ的なもの」への反応を2つだけ抜き出してみよう。

アメリカの数学者ジュリアン・L・クーリッジもまた、「わたしたちはベイズの公式を、今のところ手に入る唯一のものとしてため息混じりに使う」と述べている。

だからベイズの法則はまちがいなのだ……実際に機能するという事実を別にすれば。

ニュアンスが伝わるだろうか? つまり「ベイズ的なもの」を、「有用だとは思うが、正しいはずがないし、使いたくもない」と捉える者も多くいたというわけだ。もちろん、「『ベイズ的なもの』なんか絶対に使わない」と頑なだった者もいるのだが、一方で、「正しい結果が出ることは分かっているが、こんなやり方に頼りたくはない」という忸怩たる思いを持つ者もいたのである。

そう、「ベイズ的なもの」は、「便利なのに嫌われていた」のだ。

「ベイズ推定」はなぜ嫌われていたのか?

では何故「ベイズ推定」はこれほどの拒絶反応を生んだのだろうか? その理由は「事前確率」という考え方にある。「ベイズ推定」を行うために、「事前確率」の設定が必須なのだ。一般的に「ベイズ推定」では「事前確率」から計算をスタートさせ、算出された計算結果を再帰的に取り込んで何度も計算を行うことで正しい答えを導き出すのだ。

問題は「事前確率」とは何なのかである。これは、平たく言えば「人間の直感」のことを指す。

「ベイズ推定」は、一度も起こっていない出来事の発生確率を導くのに使われると書いた。そして「事前確率」は、「これまで一度も起こっていない出来事が起こる確率を人間がなんとなく予想したもの」というイメージでいい。

なんとなく「ベイズ推定」が嫌われていた理由が分かってきただろう。本書にはこう書かれている。

答えはしごく単純で、ベイズの法則の核となるものが、科学者の心に深く根ざした「近代科学には正確さと客観性が求められる」という信条に反していたからだ。ベイズの法則では、信念が尺度となる。この法則によると、欠けているデータや不適切なデータ、さらには近似や無知そのものからも何かがわかるのだ。

「人間の直感」は、「正確さ」「客観性」からかけ離れていると言っていいだろう。だから「ベイズ的なもの」は、「そんなものとても『科学』とは呼べない」という理由で批判され続けたのだ。

しかし一方で、科学的な裏付けはともかくとして、「ベイズ的なもの」が「正しい結果」を導く力を持っていることは理解されていた。だから本書では、「ベイズ的なもの」を上手く使ったこんなスタンスも紹介されている。

チャーノフはベイズ派ではなかったが、当時研究者として第一歩を踏み出したばかりだった統計学者スーザン・ホルムズに、難しい問題に直面したときの構えを次のように説いている。「その問題について、まずベイズ流のやり方で考えてみる。すると正解が得られるから、あとはそれが正しいことを、好みの方法で証明すればよろしい」

つまり、「『ベイズ的なもの』を使ってまず『正解』を知る。ただ、『ベイズ的なもの』は科学的に正しいと認められてはいないから、『ベイズ的なもの』を使って導き出した『正解』を、科学的に正しいとが認められている別の方法で証明する」というわけだ。どれだけ「ベイズ的なもの」が嫌われていたか、そして、「正しい答えを導き出すもの」として認められていたかが分かる記述だろう。

またこの背景には、「『ベイズ的なもの』を使うと『頻度分析』派から批判される」という事情もあったようだ。だから、「ベイズ的なもの」は使うが、表向きそれを使っていないように見せなければならないのである。

本当に、ここまで嫌われた理論がよくもまあ現在に至るまで生き残ったものだと思う。実際「ベイズ推定」の歴史は、「成果が埋もれる/認められない/知られない」ことの連続だ。それでもなんとか細々と生き残ったお陰で、その恩恵を現在我々は受けることができているのである。

「ベイズ推定」の来歴

ここからは、「ベイズ推定」がどのように生まれ、どのような歴史を辿って現在まで受け継がれてきたのかに触れていこう。

まず、「ベイズ推定」の名前の通り、ベイズという人物が核となる法則を発見した。しかし、その法則を定式化し使えるものに整えた人物は別にいる。「ラプラスの悪魔」などで有名なフランスの巨人・ラプラスだ。彼はベイズとは別に法則を導き出し、さらにそれを方程式にまとめた。アイデアこそベイズの方が先だが、実質的な生みの親はラプラスと考えていいだろう。

しかし残念ながら、ベイズとラプラスの業績は評価されなかった。それどころかラプラスは、「ベイズ推定」を生み出したことで中傷を受けてしまうことになる。当時はやはり「頻度分析」派の力が主流であり、「人間の直感」を組み込む「ベイズ推定」など到底受け入れられなかったのだ。

彼らの発見は、そのまま埋もれてしまってもおかしくはなかった。しかし第二次世界大戦で再び注目される。歴史上非常に有名な暗号機「エニグマ」の解読に使われたのだ。

あの「エニグマ」解読に有用だったとなれば、「ベイズ推定」の威力が一気に知られてもおかしくないはずだ。しかし残念ながらそうはならなかった。これは暗号の歴史における必然なのだが、「エニグマ」解読に関する一切が機密扱いになってしまったため、「『エニグマ』解読に『ベイズ推定』が使われた」という事実も、機密解除されるまで広く知られることがなかったのだ。

その後も「ベイズ推定」は、細々とながら使われた。それらはどれも、「どうにかして確率を導き出したり、問題解決をしなければならないが、『頻度分析』ではまったく太刀打ちできない状況」である。例えば、各国が核兵器を保有するようになったことで、「これまで一度も起こったことがない水爆事故が起こる確率」を導き出さなければならなくなった。また、「僅差と目されていたアメリカ大統領選挙の勝敗予測」に使われたこともある。

学問的にはまったく評価されなかったが、実際上の問題を抱えている人が「ベイズ推定」の力を活用していたというわけだ。そしてそのような流れから、ビジネスの世界でも徐々に注目されるようになる。

ビジネスの世界では、「不確実な情報を元に決断を下す」という場面が多い。それは、「ベイズ推定」を活用すべき環境だとも言える。当時はまだ科学的な厳密さが認められていなかったが、厳密さよりも実際上の有用さの方が重要だと考えたシュレイファーという人物が率先する形で、「『ベイズ推定』をビジネスにどう活かすか」が考えられるようになっていく。

このように、「実際上の問題を解決する」という形で「ベイズ推定」の評価は少しずつ変わっていくのである。

その際に重要だったのが、技術の向上だ。「ベイズ推定」は、再帰的な計算を何度も繰り返す必要があり、コンピュターの性能に大きく依存するのである。また、計算を単純化する「マルコフ連鎖モンテカルロ法」という強力な計算手法が開発されたことで、「ベイズ推定」をより扱いやすくもなった。

このような技術面の進化もあって、「ベイズ推定」を活用できる場面が広がっていくことになる。

ベイズの法則のおかげで、アメリカでは労働者のための労災保険が無事スタートし、ベル電話会社のシステムは1907年の金融恐慌を何とか生き延びることができ、アルフレッド・ドレフュスは監獄から解き放たれ、連合軍の砲手はドイツ軍のユーボートの所在を突きとめて砲撃することができるようになり、ついには地震の震源地を突き止めることができるようになった。

そのため冷戦下では行方不明になった水爆やアメリカやロシアの潜水艦を探索するのに使われ、あるいは原子力発電所の安全性を調べたりスペースシャトル・チャレンジャーの悲劇を予測するのに使われた。さらに、喫煙が肺がんを引き起こすことや、コレステロールが高いと心臓発作が起きることを示す際にも、そしてテレビでいちばん人気のニュース番組で大統領選の勝者を予測する際にも使われたのだった。

このように、それまでの科学的知見では解決不可能だった問題に取り組むことができるようになり、「ベイズ推定」の威力を様々な人が実感するようになっていくのである。

「ベイズ推定」は「正しく問いを立てる」ことに価値がある

そして次第に、学問的にも受け入れられるようになっていく。そこには、このような理由もあった。

そして今や、基本原理に厳密にこだわり続けなくてはと言い張ってきた理論家ですら、1950年代のジョン・チューキーの観点を受け入れている。曰く、「正しい問いへの近似的な解のほうが……まちがった問いへの正確な答えよりもはるかによい」

これは、「頻度分析」の限界を示し、その限界を「ベイズ推定」が補えると示唆するものである。

「頻度分析」は、正確な答えを理論的に導き出すことが可能だ。しかし問題は、「正しく問いを立てる」ことが難しい、という点にある。「頻度分析」では、問いさえ立てられない問題も多く存在するのだ。繰り返しになるが、「過去1度も起こったことがない出来事の発生確率を求めること」は、「頻度分析」の手法では不可能なのである。

一方「ベイズ推定」は、確かに100%正しい答えを導き出せるわけではない。しかし、現実的な問題に対して「正しく問いを立てる」ことができるという点が理解されるようになっていく。そして、様々な領域で「ベイズ推定」の威力が確かめられることにより、「ベイズ推定」は学問的にも受け入れられる素地が生まれていくのである。

また、脳研究の進歩により、脳という器官がベイズ的な働き方をしていると分かるようになってきた。

脳は広範囲の可能性を記憶として蓄積する一方で、それらにさまざまな確率を割りふる。実際、色覚がこのような方法で機能していることはすでにわかっていて、わたしたちは赤い色を感知したと思っているが、実は色のスペクトル全体を見て、赤にもっとも高い確率を割りふっているのだ。しかもそのうえで、じつはピンクだったり紫だったりする可能性を念頭に置いておく。
ウォルバートは、話すことから行動することまで、人間のあらゆる行動の基本にベイズ的思考法があると考えている。生物の脳は、ベイズ的に考えることで世界の不確かさを最小限にするように進化してきた。早い話が、今も増え続けている数々の証拠は、我々の脳がベイズ的であることを指し示しているのだ。

つまり、「ベイズ推定」を通じて、我々自身の脳の理解にも繋がっていくというわけだ。統計学という領域を飛び出して新たな知見に繋がる可能性があり、非常にスリリングな話だと感じる。

このように「ベイズ推定」は、何度も消えそうになりながらもなんとか復活し、現在では我々のを便利にする様々なものに使われているのだ。人工知能の機械学習にも使われているそうなので、今後ますます重要度が高まるとも言えるだろう。

著:シャロン・バーチェ・マグレイン, 翻訳:冨永 星
¥1,672 (2022/02/17 06:21時点 | Amazon調べ)
\楽天ポイント4倍セール!/
楽天市場
\ポイント5%還元!/
Yahooショッピング

最後に

原註まで含めると、文庫本で650ページを超える大著であり、なかなか手が伸びないかもしれない。しかし、我々の生活に非常に重要でありながら、ここまで蛇蝎のごとく嫌われてきた科学理論もなかなかないはずで、その歴史は非常にスリリングで面白い。

思わず一気読みさせられてしまう作品だと思うので、ぜひ臆せずに手に取ってみてほしい。

次にオススメの記事

この記事を読んでくれた方にオススメのタグページ

タグ一覧ページへのリンクも貼っておきます

シェアに値する記事でしょうか?
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

CAPTCHA


目次