Members Column メンバーズコラム

AIのハルシネーションと子どもの嘘

野中 暁 (株式会社Webis)  Vol.797

娘がこの春6歳になった。

彼女はお菓子が大好物だ。家の規律により食べる時間・量は厳しく規制されているので、こっそりとお菓子を食べては母親に叱られていた。

あるとき、「おままごとやから」とプラスチックの野菜や果物をパクパクとエアで食べるふりをしていた。私はふと気づく。おままごと用のおもちゃの中にリアルお菓子がいつの間にか混入されているではないか。

もぐもぐとする彼女に尋ねる。

「あれ、ほんとに食べてる?」

ー「食べてへん。おままごとやから」

「本物のお菓子混ざってない?」

ー「混ざってへん。おままごとやから」

いやいや、絶対お菓子食うてるやん。とは言わず、私は何と無邪気に浅はかな嘘をつくのだろうと微笑ましく思ってしまったのだが何やら既視感を覚える。一点の曇りもなき眼で堂々と間違い、無理筋を通そうとする存在がいたような気がする。

 

AIのハルシネーション(幻覚)

 

AIだ。「この嘘つき!そんなんすぐ分かる嘘やん」とAIの返答を受けて心中叫ぶ。ハルシネーション(Hallucination)とは、AIが事実に基づかない情報を、さも真実であるかのように堂々と、もっともらしく回答してしまう現象を指す。

例えば、実在しない歴史上の人物の功績をスラスラと捏造したり、存在しない法律の条文を引用したりする。タチが悪いのは、AIが「嘘をつこう」と意図しているわけではない点だ。AIはただ、膨大な学習データの中から、統計的に「次に続く確率が高い言葉」を繋ぎ合わせているに過ぎない。

娘の嘘も、これに共通している点がある。彼女には「お父さんを騙してやろう」という悪意はない。ただ、「お菓子を食べたい」という目的と、「怒られたくない(リスク回避)」という力学の中で、その場を最も円滑に収めるための「確率的に正しい物語」を脳内で演算した結果、「おままごと」の中にお菓子をステルスさせ、「お菓子は食べていない。あくまでおままごとだ」という回答にたどり着いたのだ。

 

人間であれAIであれ、ハルシネーションが発生する背景には二つの大きなベクトルがあると考えている。一つは「自己の利益の最大化」、もう一つは「不利益(ペナルティ)の最小化」だ。

娘の場合、お菓子を食べるという直接的な報酬系が作動している。しかし、ただ「食べた」と白状すれば、お菓子を取り上げられ、説教を受けるという強烈なペナルティが待っている。そこで彼女は、おままごとという「安全な遊びの世界」の中に、こっそり本物のご褒美(お菓子)を紛れ込ませるという、なんとも知恵の回る作戦を編み出した。

まさに、叱られるリスクを最小限に抑えつつ、最大限の喜びを得ようとする彼女なりの「リスク管理」なのだ。

これはAIの強化学習のプロセスにも似ている。特定の目的を達成するために、モデルはしばしば人間が予想もしないような「近道(ショートカット)」を見つけ出す。それが時として、倫理や事実を無視したハルシネーションとして表出するのだ。

 

成長・進化の果て、ハルシネーションは克服されるのか

 

娘もあと数年もすれば、こんな見え透いた嘘はつかなくなるだろう。成長するにつれて、彼女は「事実」と「虚構」の境界線をより正確に引き、社会の中で摩擦を起こさないための振る舞いを覚えていく。それは知性の洗練であり、同時に、あの自由で突飛な「おままごとステルスお菓子」という発想が失われていく過程でもあるのかもしれない。

一方、私たちが向き合っているAIはどうだろうか。

現在、世界中の技術者が、AIからハルシネーションを取り除くために心血を注いでいる。より正確なデータを、より厳密な論理を。AIが「事実」のみを語る完璧な道具になる日は、そう遠くないのかもしれない。

 

「正解」の先にあるもの。不完全さを愛でるコミュニケーション

 

子どもは成長し、嘘をつかなくなることで大人になる(はずだ)。AIは進化し、ハルシネーションを抑え込むことで「信頼できるインフラ」になる(はずだ)。それはどちらも正しく、必要な進化である。

しかし、ふと思うことがある。正解、最善手のみを選択しうる存在は果たして私たちにとって「愛せる」のだろうか。「面白い」のだろうか。もし完璧な返答ができるAIが開発されたら、その次はいかにして「間違える」ことができるのか、という方向で私たちの生活に溶け込むようになるのではないか。

ときおり嘘をつき、間違える。それをどう飲み込むのかもまた人としての感受性なのではないかと思う。

 

今日も帰りが遅くなりそうだ。いっぱいだけ酒を飲んでから…ではない。もちろん仕事が立て込んでいるからである。

 

 

 

PAGE TOP