昼間、カンファレンスでさんざんAIというかニューラルネットワークとかマシンラーニングの話を聞いて、頭からこぼれそうなところに、日本よりちょっと遅れてドクターXの「大門未知子がAIに勝つ」という回をやっていたので、ちょっとツッコんでみたくなりました。番組見てない方はググってあらすじ読んでください。以下、ネタバレ大あり。なお、私はAI専門家ではなく、文系人間のレベルで勉強中です。
なぜ「ヒポクラテス」なる医療AIが、脳に寄生虫がいるという診断ができず、脳膿瘍なる病気だと言ったのか。
まず、ドラマで最初のほうに、「X線画像から予想できる病名と、それぞれの確率分布」のグラフが示されます。外科医のブログ(http://keiyouwhite.com/doctorx5-5)によると、この分布は間違っていないそうですが、ここまでならAIではなく、単なるデータベースサーチとデータの可視化に過ぎません。
本来ならば、そこで大門未知子がやったように、体の他の部分の状態、行動に関する質問、海外渡航歴などの項目を埋めていき、decision treeをたどっていくのだと思います。それが間違ったということは:
- decision treeがそもそも間違い?こんな基本的な質問もしないでいいの?
- データセットの中にこの症例がなかった?データのラベリングなどが不完全でクリーンじゃない?
- 不完全なデータセットを前提としたenforced learningだとすると、シミュレーションが足りなくて空白が埋まっていない?
- そもそもこういうのって、どうやってシミュレーションするんでしょう?ロボットの作業指示なら、ロボットをずら~っと並べて延々とシミュレーションすればいいのだけれど、病気の場合は動物実験でもするのかな?
など、つい考えてしまいました。
現在のところ、AIを作るのは膨大なデータと人手が必要で、効果的に使えるのは「特定の目的」に限って深く多くデータを投入したりシミュレーションしたりできるところに限られる、というのが私の理解です。IBM Watsonも、「なんでも診断」ではなく、癌に限りますよね?それでも「使えねー」と中止させられちゃったりしてますよね?その理解で正しい?ヒポクラテス君もやはり癌専門だったから、寄生虫がわからなかった?
まぁ、ドラマは近未来の「ナンデモ診断」ができる時代のお話だとして(今のところ、チェスと碁はAIが勝ってますが、将棋はまだ←取った相手の駒を使うという部分が難しいとききました)、それでも上記のようなことを考えると、「AIがポンコツなのは、作った人間がポンコツ」(decision treeとかトレーニングの仕方とかシミュレーションの仕方とかが間違っているまたは足りない)ということでおk?その頃にはAIの研究者が、上記のような不完全性を克服するやり方を考え出してすでに実装しているはず?ヒポクラテス君は、作った人がお金をケチってちゃんと作られていない?
AI専門家のご意見を読みたいと思ったのですが、ざっとサーチしただけでは出てこなかったので、与太話を書いてみました。これへのツッコミ、歓迎いたします。