フィジカルAIの熱力学的限界:論文「Thermodynamic Limits of Physical Intelligence」公表

高橋恒一(ALIGN、理研)と林祐輔(ALIGN)は、フィジカルインテリジェンス(実世界知能)のエネルギー効率に関する新しい論文を公開しました(arXiv:2602.05463)。本ブログ記事ではこの論文の内容を解説します。

はじめに——知能の「燃費」を測る

ChatGPTやGemini、Claudeなどの大規模AIモデルは、驚くべき能力を発揮する一方で膨大な電力を消費します。最先端モデルの訓練には数十メガワット時の電力が必要とされ、「AIの電力問題」として社会的関心が高まっています。一方、人間の脳はわずか約20ワット、つまりLED電球1個分程度で高度な思考を実現しています。

この桁違いの差は何を意味するのでしょうか?そもそも「知能のエネルギー効率」とは何でしょうか?自動車に燃費(km/L)があるように、知能にも「燃費」のような指標を定義できるのでしょうか?

本論文は、この問いに対して物理学の基本法則に基づいた答えを与えます。知能の効率を「1ジュールのエネルギーで何ビットの情報を処理できるか」という「ビット毎ジュール(bits/J)」指標で定量化することを提案しています。

「フィジカルインテリジェンス」とは何か

本論文では、「フィジカルインテリジェンス(Physical Intelligence、実世界知能)」という概念を導入します。これは、物理世界に実体を持ち、エネルギーを消費しながら動作するすべての知能システムを指します。

フィジカルインテリジェンスには、AIと生き物の知能両方が含まれます。

  • 人工知能(AI):データセンターで稼働する言語モデル、ロボット、自動運転車など

  • 生物知能:人間の脳、動物の神経系 (仮想的には宇宙人の知能も含まれる)

近年のAI業界では「フィジカルAI」という用語が、主にロボティクスや自動運転車など物理世界と直接インタラクションする身体性を持ったAI(embodied AI)を指して使われています。この意味でのフィジカルAIも、もちろんフィジカルインテリジェンスの一部です。しかし本論文の射程はより広く、クラウド上の言語モデルであっても、物理的なサーバーで電力を消費し熱を発生させながら動作している以上、フィジカルインテリジェンスとして捉えます。

なぜこのような広い視点が必要なのでしょうか?それは、どのような形態の知能であっても、現実に動作する以上は物理法則——特に熱力学——の制約から逃れられないからです。本論文は、この「物理的実体としての知能」という観点から、エネルギー効率の究極的な限界を探求します。

論文の内容

知能の二つの側面:「学ぶ」と「働きかける」

本論文の核心は、フィジカルインテリジェンスを二つの相補的な軸で捉えることにあります。

認識と学習:世界を理解する能力

知的システムは、環境との相互作用を通じて世界の構造や規則性を学びます。例えば、言語モデルは大量のテキストから文法や知識を学習し、ロボットはセンサー情報から環境の物理法則を学習します。

論文では、この「世界を理解する能力」を「エピプレキシティ(epiplexity)」という概念で捉えます。エピプレキシティとは、データ中の「構造的情報」——ノイズや冗長性を除いた、環境の法則性を表す情報——がどれだけシステムの内部状態に符号化されているかを測る指標です。この概念は、Finzi et al.(2026)が計算量制約付きの最小記述長(MDL)理論に基づいて定式化したもので(arXiv:2601.03220)、従来の情報量やエントロピーとは異なり、計算資源の制約の下で「意味のある構造」だけを抽出することを目指しています。

本論文では、このエピプレキシティを熱力学と接続し、「熱力学的エピプレキシティ毎ジュール」を学習のエネルギー効率として定義します。簡単に言えば、「1ジュールのエネルギーを使って、世界についてどれだけ多くのことを学べるか」という指標です。

制御と行動:世界に影響を与える能力

知的システムは学ぶだけでなく、行動によって世界に働きかけることもできます。ロボットが物を動かしたり、AIが意思決定を支援したりするのがその例です。

論文では、この「世界に影響を与える能力」を「エンパワメント(empowerment)」という概念で捉えます。これは「自分の行動によって将来の状態をどれだけ多様に変化させられるか」を測る指標で、情報理論における「チャネル容量」として定義されます。例えば、ロボットアームが10通りの区別可能な位置に物を置けるなら、エンパワメントは log₂(10) ≈ 3.3 ビットです。行動が何の影響も持たなければ0ビット、影響力が大きいほどビット数は増えます。

補足: エンパワメントの理論的背景については、林・高橋(2025)が、ベイズ最適なユニバーサルAIエージェントがエンパワメントを最大化する傾向を持つことを示しています(ALIGNブログ解説)。

本論文では、「エンパワメント毎ジュール」を制御のエネルギー効率として定義します。ここで重要なのは、エネルギーコストの「会計」を適切に行うことです。例えば、エージェントが「何もせずに待つ」だけでも、環境が自律的に変化すれば見かけ上の情報伝達が生じ、ゼロコストで無限の効率が出てしまう「フリーコントロール」のアーティファクトが起こり得ます。論文では、こうした問題を避けるため、「何もしない」状態のベースラインエネルギーと、制御のために追加で消費されるエネルギーを分けて報告する方法を提案しています。

なぜ二軸が必要なのか

学習と制御は知能の両輪です。どれだけ世界を理解していても、行動できなければ何も変えられません。逆に、行動能力があっても、世界を理解していなければ適切な行動を選べません。この二つを分けて評価することで、例えば「学習は効率的だが制御は非効率」といったシステムの特性を把握できます。また、閉ループで動作するエージェント(学習と行動を繰り返すシステム)では、両者がエネルギー予算を共有するため、どのようなトレードオフがあるかを分析できます。

物理法則が定める究極の限界

ランダウアー限界とは

コンピュータの消費電力には、物理法則による根本的な下限があります。1961年にロルフ・ランダウアーが示した原理によれば、1ビットの情報を不可逆的に消去するには、最低でも k_B T ln 2 ジュールのエネルギーが必要です(k_B はボルツマン定数、T は温度)。室温では約 3×10^-21 ジュール、つまり約 3.5×10^20 bits/J が理論上の限界となります。

現代の計算機のスイッチングエネルギーはおよそ 10^-17〜10^-18 J 程度であり、ランダウアー限界まであと3〜4桁程度の余地があります。一方、人間の脳については、一部の推定によればランダウアー限界から2〜3桁程度しか離れていない可能性があるとされています(具体的な値は推定方法に依存しますが)。もしこの推定が正しければ、生物の進化がいかに効率的なフィジカルインテリジェンスを生み出したかを示唆しています。

閉サイクルでの学習効率限界

論文の重要な理論的貢献は、確率的熱力学の知見を用いて、学習効率にもランダウアー限界が適用される条件を明らかにしたことです。

具体的には、有限のメモリを繰り返し使用する「閉サイクル」条件下では、新しい知識を獲得するには古い情報を消去する必要があり、そこでランダウアー限界が効いてきます。論文では、この条件下での学習効率の上限を数学的に導出しています。

量子計算と可逆計算の位置づけ

では、量子計算や可逆計算はこの限界を突破できるのでしょうか?論文では、この点について明確な結論を示しています。

量子計算は熱力学的限界を「破る」手段にはならない。量子計算の利点は、(i)計算の大部分を可逆的(ユニタリ)な軌跡に沿って実行できること、(ii)特定の問題クラスで必要な論理ステップ数を削減できることにあります。しかし、量子ビットの初期化、測定、フォールトトレランスに必要なリセット/リフレッシュステップを会計境界に含めれば、ランダウアー限界は依然として適用されます。

つまり、量子計算は熱力学的限界に近づくことはできますが、限界を突破することはできないのです。

「会計」の重要性

ただし、ここには重要な注意点があります。もしシステムの「外部」から初期化済みのメモリ(まっさらな状態のハードディスクのようなもの)が無制限に供給されるなら、その供給コストを計上しない限り、見かけ上の効率は無限大になり得ます(論文中の命題1)。論文では、外部から供給された白紙のメモリに対してXOR(排他的論理和)演算で環境情報をコピーするという単純な構成で、境界内の消費エネルギーをいくらでも小さくしながら情報を獲得できることを示しています。もちろん、その「白紙のメモリ」を準備するコストはどこかで支払われている——それを計上していないだけなのです。

これは会計の問題に似ています。企業の利益を評価するとき、原材料費を計上しなければ見かけの利益は大きくなりますが、それは実態を反映しません。同様に、フィジカルインテリジェンスのエネルギー効率を評価するとき、何を計算に含め、何を含めないかを明示することが不可欠です。論文では、この「会計境界」の設定方法を明確化し、公正な比較のための指針を示しています。

実用に向けた統一フレームワーク

報告すべき項目のチェックリスト

異なるシステムのエネルギー効率を公正に比較するため、論文は以下の項目を報告することを推奨しています:

  • 会計境界:計算、センサー、アクチュエータ、冷却など、どの範囲のエネルギーを含むか

  • ベースライン:「何もしない」状態の消費電力をどう扱うか

  • 解像度:情報量を測定する際の粒度

  • 時間軸:評価期間とリセットの扱い

  • 推定方法:情報量をどのように計算・推定したか

これらを明示することで、研究者間での比較が可能になり、技術の進歩を客観的に追跡できるようになります。

スケーリング則との関係

現在のAI開発では、モデルを大きくし、データを増やし、計算量を増やせば性能が向上するという「スケーリング則」が広く認識されています(スケーリング競争の動向についてはここちらの記事(part1)も参照)。しかし、この法則の下では、性能向上あたりのエネルギー消費は加速度的に増大します。

論文では、このスケーリング則をエネルギー効率の観点から分析する方法を示しています。追加投入エネルギーあたりの性能向上(限界効率)は、スケーリングが進むほど低下します。これは「収穫逓減」の法則であり、どこかで異なるアプローチが必要になることを示唆しています。

---

示唆とインパクト

知能爆発論の量的精緻化——2018年論文との接続

本論文は、2018年に人工知能学会誌に掲載された論文「将来の機械知性に関するシナリオと分岐点」で展開した議論を、より量的に精緻化するものです。

2018年論文では、機械知性の将来シナリオを4つに分類し、それぞれへの分岐を決定する要因を検討しました:

  • 上限シナリオ:工学的に実現可能な知能に根本的限界があり、変革的なレベルに達しない

  • 生態系シナリオ:複数のエージェントが相互依存的なネットワークとして共存し、境界が曖昧で創発的な振る舞いを示す(インターネットインフラや生態系に類似)

  • 多極シナリオ:明確な境界を持つ複数の超知能エージェントが均衡状態にあり、交渉・抑止・軍拡競争などの戦略的ダイナミクスが生じる(国際関係に類似)

  • シングルトンシナリオ:単一のエージェントが決定的戦略的優位性(decisive strategic advantage)を獲得する

この中で、知能爆発(再帰的自己改良による急速な能力向上)の発生条件として、認知アーキテクチャの問題に加えて、計算の熱力学的効率や光速の上限といった物理的制約が重要な役割を果たすことを論じました。

再帰的自己改良には二つの方向性があります:

- 内向きの改良:既存の資源でより効率的に計算する(ハードウェア・アルゴリズムの改善)

- 外向きの改良:より多くの資源を獲得する(計算資源、エネルギー、空間的拡大)

内向きの改良には熱力学的制約(つまりランダウアー限界)が効き、外向きの改良には局所性制約(光速による調整遅延)が効きます。どちらの方向にも物理的な壁があるのです。

特に、熱力学的制約については、ランダウアー限界が能力向上に根本的な上限を課す可能性を指摘しつつも、当時は量子計算や可逆計算がこの限界を突破する可能性を残していました。2018年論文では次のように述べていました:「純粋な観測により量子状態が破壊されないような種類の量子計算や、情報が失われない分子機械を用いた可逆的過程を用いる場合にはこの限界は局所的には適用されない」。

今回の論文では、熱力学的制約についてより厳密な形式で展開し、量子計算は熱力学限界に近づくことはできるが、限界を突破することはできないという結論を導きました。これにより、内向きの改良には、原理上の上限が存在することが明確になりました。

(外向きの改良に対する局所性制約については、2018年論文で詳しく論じています。)

AIアライメント研究との接点

AIアライメント研究の観点からも、フィジカルインテリジェンスの限界を理解することは重要です。2018年論文で論じたように、シングルトンシナリオ(単一のAIが決定的戦略的優位性を獲得するシナリオ)の実現可能性は、AIの能力向上にどのような物理的上限があるかに依存します。

本論文が示す熱力学的限界は、知能爆発のペースや到達点に関する定量的な制約を与えます。これは、AI安全性の議論において「最悪ケース」を見積もる際の重要な入力となります。

また、本論文の二軸評価(学習と制御)は、2018年論文で論じた「決定的戦略的優位性」の獲得条件とも整合しています。決定的戦略的優位性には、学習能力(環境や他エージェントの予測)と制御能力(行動による影響力の行使)の両方が必要であり、それぞれにエネルギー効率の限界が存在するのです。

持続可能なAI開発への貢献

AIの電力消費は急速に増大しています。ある試算では、2030年までにAI関連の電力需要が現在の数倍に達するとも言われています。気候変動対策が求められる中、AIの発展と環境負荷のトレードオフをどう考えるかは、政策上の重要な論点となっています。

しかし、現状では異なるAIシステムのエネルギー効率を公正に比較する標準的な方法がありません。「このモデルは効率的だ」と言っても、何をもって効率的と言うのか、その基準が曖昧なのです。本論文が提案する効率指標と報告チェックリストは、この問題に対する一つの解答を与えます。

政策・社会への示唆

本論文の枠組みは、AIシステムのエネルギー効率を標準化された方法で報告するための基盤を提供します。これにより、以下のような政策的取り組みが可能になります:

- AI製品・サービスのエネルギー効率ラベリング

- データセンターの効率基準の策定

- 研究開発投資の優先順位付け

家電製品に省エネラベルがあるように、AIサービスにも効率ラベルがつく未来が考えられます。

---

おわりに

本論文は、「フィジカルインテリジェンス(実世界知能)のエネルギー効率」という問いに対して、物理学に基づいた厳密な枠組みを提供しました。

提案された二軸の評価指標——学習効率(エピプレキシティ毎ジュール)と制御効率(エンパワメント毎ジュール)——は、知能の「燃費」を測るための理論的基盤となります。そして、閉サイクル条件下でのランダウアー限界との接続は、技術がどこまで進歩し得るかの究極的な指標を与えます。

2018年論文で提起した知能爆発の発生条件に関する議論は、本論文によってより量的に精緻化されました。特に、量子計算を含むいかなる計算技術も熱力学的限界を突破できないという結論は、将来の機械知性の能力上限に関する議論に明確な制約を与えるものです。

現在のAIシステムは、この理論的限界から桁違いに離れています。この事実は、エネルギー効率の改善に大きな余地があることを示す一方で、いかなる技術革新をもってしても超えられない究極の壁が存在することも意味しています。

AIの持続可能な発展、そしてAIと人類の共生を考える上で、フィジカルインテリジェンスのエネルギー効率という観点は今後ますます重要になるでしょう。本論文が、その議論の共通基盤となることを期待しています。

---

興味を持たれた方は、ぜひ元論文にも目を通してみてください。

リンク:

Next
Next

人間とAIの「時間の感じ方」は同じか?AI時間構造学の提案