人間とAIの「時間の感じ方」は同じか?AI時間構造学の提案
Ryota Takatsuki, Shosuke Nishimoto
はじめに
今後、人間とAIが協調しながら社会のさまざまな場面で共存していくことが予想されます。そのとき重要になるのが、「AIがどのように世界をとらえているのか」を人間側が理解しておくことです。
たとえば、音声で指示を与える半自動運転車を想定してみます。
「あの白い小型犬の前で車を停めてください」
と人間は指示したつもりでも、その犬がヒョウ柄の服を着ていた場合、従来型の画像認識AIは「形」よりも「テクスチャ」に強く反応することが知られており、人間とは異なる判断をしてしまう可能性があります。
視覚に関しては、こうしたバイアスの違いが多く研究されており、近年の視覚トランスフォーマでは、人間に近い形状バイアスを示すことも報告されています。
では、視覚に加えて、「時間のとらえ方」についてはどうでしょうか。
人間とAIの時間知覚:prediction と postdiction
人間は、「いま何が見えているか」だけでなく、
直前に何が起きたか
これから何が起こりそうか
といった時間的な情報を統合しながら世界を理解しています。このとき重要になる概念が、
prediction:これから起こる事象を先読みする働き
postdiction:あとから入ってきた情報を元に、すでに起こった事象を振り返る働き
です。
視覚心理学の領域では、たとえば「バックワードマスキング」のように、ある画像を一瞬呈示した直後に別の画像を呈示すると、最初の画像が見えなくなる現象が知られています。
これは、あとから入ってくる情報が、先に入った情報の知覚に影響するという意味で、 postdiction の一例とみなせます。
このような時間知覚の「構造」は、人間については多くの研究蓄積がありますが、AIにおいて同様の現象がどのように現れるのかについては、まだ十分に検討されていません。
なぜ時間知覚の違いを理解する必要があるのか
現代のAIは、人間の行動データや環境データを学習して構築されますが、その内部構造(アーキテクチャや学習則)は、人間の脳とは大きく異なります。そのため、
多くの場面では人間と近い判断をする一方で、
特定の条件では人間からみて予想外の振る舞いを示す
ということが起こりえます。
とりわけ、脳とAIの、先読みと振り返りのバランスの違いによって生じる誤解やミス は、実社会で大きなリスクになりえます。たとえば、
自動運転において、人間が振り返りに重きを置いた音声指示を出しているのに、AIが先読みを優先してしまい噛み合わない
医療支援AIが、検査データの時間的なプロセッシングの結果、人間ではありえないような診断ミスを犯してしまう
といった事態が想定されます。
事前に、人間とAIの「時間の感じ方・扱い方の違い」 を定量的に理解しておくことで、
危険なパターンの早期検出
インターフェース設計による誤解の低減
モデル側の設計・学習プロセスの調整
など、より安全で信頼性の高い人間–AI協調のための設計指針を得ることができると考えています。
academist Prize 採択と今後の展望
本プロジェクト「AI時間構造学の創成:心理実験を用いたAIの視覚時間特性の解明」は、academist Prize 第5期に採択 され、約240人のサポーターの方々にご支援をいただいております。
また、本プロジェクトのビジョンはALIGNの掲げるビジョンと非常に強く共鳴します。そのため、本プロジェクトをALIGNの「AIと人間の希望ある未来を先導する活動」の一環として位置付け、研究資金管理等でALIGNにサポートしていただく形で研究を進めていくこととしました。
直近としては、次トークン予測をするように訓練されたトランスフォーマー型大規模言語モデルにおけるpostdictionに着目して、研究を進めていく予定です。
人間とAIが同じ世界・同じ時間のなかで協調的に働く未来を実現するために、その基盤となる「時間の構造」の理解を、AI時間構造学を通じて少しずつ深めていきたいと考えています。