自由エネルギー原理(FEP)と情報理論:
自由エネルギー原理(Free Energy Principle; FEP)は、生物やエージェントが観測のサプライザル(驚きの情報量)を直接は扱わず、変分自由エネルギー(Variatinal Free Energy; VFE)という上界を最小化することで、知覚・学習・行動を説明しようとする枠組みである。情報理論(エントロピー、KLダイバージェンス、相互情報量)と変分ベイズ推論の等式変形が中核にあり、数式としては「確率モデルの証拠(evidence)下限=ELBO」と同型である。
参考ドキュメント
Friston, K. (2010). The free-energy principle: a unified brain theory? Nature Reviews Neuroscience.
https://www.nature.com/articles/nrn2787Friston, K. et al. (2016). Active inference and learning. (PubMed Central)
https://pmc.ncbi.nlm.nih.gov/articles/PMC5167251/磯村拓哉 (2018). 自由エネルギー原理の解説:知覚・行動・他者の思考の推論. 日本神経回路学会誌 25(3), 71–85.
https://www.jstage.jst.go.jp/article/jnns/25/3/25_71/_pdf
1. なぜ「自由エネルギー」と「情報理論」が結び付くのか
FEPの「自由エネルギー」は、熱力学のヘルムホルツ自由エネルギー
- 観測
の生起確率 (モデル証拠)を高めたいが、厳密な周辺化 が困難である - そこで事後分布
を近似する分布 を導入し、扱いやすい上界(変分自由エネルギー)を最小化する - このとき、上界の構成にKLダイバージェンスとサプライザルが現れ、情報理論と密接に接続される
ここで
2. 情報理論の基礎
2.1 サプライザル(Shannon surprisal)とエントロピー
ある事象
で定義される。対数底を2にすればビット、自然対数ならナット(nat)である。
確率変数
FEPの直観的説明では「生物は驚きを小さく保つ」などと述べられることがあるが、厳密には「長期平均のサプライザル(あるいはエントロピー)に関わる量を、扱える上界で抑える」と理解すると数学的に誤解が少ない。
2.2 KLダイバージェンス
分布
であり、常に
2.3 相互情報量と情報獲得
相互情報量(mutual information)は
とも書ける。また、観測による事後更新の観点では「情報獲得=事後と事前のKLの期待値」として
が重要である。能動推論(Active Inference)の「探索(情報を取りに行く)」は、この量と深く結び付く。
3. 変分自由エネルギー:定義、上界性、ELBOとの一致
3.1 生成モデルと近似事後分布
観測
とする。真の事後分布は
3.2 変分自由エネルギーの定義
変分自由エネルギー(variational free energy; VFE)を
と定義する。
この定義は、統計機械学習でいう負のELBO(Evidence Lower Bound)の形そのものである。すなわち
である。したがって
3.3 上界性:サプライザル(負の対数証拠)の上界
ベイズの定理を用いて
ここで
が成り立つ。右辺
3.4 「複雑さ」と「データ適合」
と分解できる。前者は観測再現の良さ、後者は信念が事前からどれだけ逸脱したかを測る。変分推論・VAE・FEPの共通骨格がここにある。
4. 自由エネルギー原理(FEP)の主張
FEPのコアは次のように要約できる。
- エージェント(生物)は観測
を受け取る - 内部状態(信念)を近似分布
により表し、 を下げる方向に更新する を下げることは、事後 に近づく( を減らす)ことを含む - 同時に
が の上界であるため、観測のサプライザルを抑えることに結び付く
この段階では「行動」が未登場であり、主として知覚・推論(perceptual inference)の説明である。行動が入るのが能動推論である。
5. 能動推論と期待自由エネルギー
5.1 なぜ「期待」自由エネルギーが必要か
知覚は「すでに得られた観測
5.2 将来観測に対する変分量
政策(行動系列)を
である。文献により表記や条件づけが異なるが、本質は「将来に関する予測分布の下で、自由エネルギー型の量を評価し、それを小さくする
5.3 好み(リスク)と情報獲得(相互情報量)
能動推論(Active Inference)では、生成モデルの中に「望ましい観測」の事前分布
- 好みと一致する観測を得る(リスクを下げる)
- 不確実性を減らす観測を得る(情報を得る)
情報理論の観点で重要なのは、後者が「情報獲得=相互情報量」に一致する形で現れることである。代表的には
という項が出現し、これは
5.4 曖昧さとリスク
能動推論の説明では、しばしば
- 曖昧さ(ambiguity):状態が分かっても観測が不確か(
のエントロピーが大きい) - リスク(risk):得られる観測が好みから外れる(
に対して低確率)
として語られる。曖昧さは条件付きエントロピー
6. マルコフ・ブランケット:境界を情報理論で表現する装置
FEPの全体像では、システムを
- 外部状態
(environment) - 内部状態
(agent) - ブランケット状態
(感覚状態 と能動状態 を含む)
に分け、条件付き独立性を仮定する。基本的な形は
であり、外部と内部はブランケットを介してのみ統計的に結び付く。感覚状態は外部から内部へ情報を運び、能動状態は内部から外部へ作用を及ぼす。これにより「どこまでが自己で、どこからが環境か」という境界が確率的独立性として宣言され、情報の流れを数式で扱える。
7. 熱力学の自由エネルギーとの関係
名称が同じため、混同を避けるために差分を表で整理する。
| 観点 | 熱力学(ヘルムホルツ等) | FEP(変分自由エネルギー) |
|---|---|---|
| 定義の舞台 | 物理量(エネルギー、温度、エントロピー) | 確率モデル(生成モデルと近似分布) |
| 代表式 | ||
| エントロピーの意味 | 物理的エントロピー | 情報論的エントロピー(分布の不確実性) |
| 最小化の意味 | 平衡・自発過程の方向 | 近似事後の改善、証拠下限の最大化(=サプライザル上界の最小化) |
| 接続の仕方 | 統計力学を介した類推が中心 | 変分推論・情報理論の等式変形が中心 |
FEPの議論で「物理学的自由エネルギーに似た形が出る」と言われるのは、
8. 機械学習・統計との対応
8.1 ELBOと変分推論
既に述べた通り、
の更新:事後 に近づける最適化 - パラメータ学習:
のパラメータを更新して を高める(ELBO最大化)
8.2 VAEとの関係(同型性)
VAEでは潜在変数
を最大化する。これは前述の「データ適合+複雑さ」の分解と同型であり、FEPの知覚(推論)部分と数学的骨格を共有する。
8.3 予測符号化との関係
Fristonの系譜では、変分自由エネルギー最小化を神経回路の計算仮説として読み替え、予測誤差(prediction error)の最小化として表現する流れがある。重要なのは、単なる「誤差最小化のスローガン」ではなく、背後に
- 生成モデル
- 近似事後
- 上界
があり、誤差項が対数尤度に由来するという点である。
9. 基本用語の対応表
| 概念 | 情報理論での定義 | FEP・変分推論での現れ方 |
|---|---|---|
| サプライザル | ||
| エントロピー | 長期平均の驚きの議論で登場 | |
| KL | 近似事後と真の事後のずれ、複雑さ項 | |
| 相互情報量 | $I(S;O)=\mathbb{E}[D_{KL}(p(s | o)|p(s))]$ |
| 交差エントロピー | 好み |
10. 実証研究・議論の状況
FEPは一般性が高く、どの現象も「何らかの生成モデル」を選べば説明できるのではないか、という議論がある。したがって、理論全体の可否を一撃で決めるよりも、特定のシステムに対して
- 生成モデルの仮定を具体化する
- その帰結(学習則、ダイナミクス、行動選択)を予測する
- 実データで検証する
という進め方が重視される。
国内では、自由エネルギー原理の体系的な日本語解説として、神経回路学会誌の解説論文や脳科学辞典の項目が参照しやすい。また理化学研究所(RIKEN)からは、培養神経回路などの実験系で自由エネルギー原理に沿う予測を検討する研究成果がプレスリリースとして公表されている。
11. まとめと展望
自由エネルギー原理は、観測のサプライザル
今後の展望としては、(i) マルコフ・ブランケットや生成モデルを具体系に即してどこまで同定できるか、(ii) 期待自由エネルギーの分解(リスク、曖昧さ、情報獲得)を、行動データや神経データでどの粒度まで検証できるか、(iii) 機械学習(変分モデル、表現学習、制御)との対応を保ちながら、どの仮定が実験的に区別可能な予測を生むか、が焦点になるであろう。
参考文献
脳科学辞典:自由エネルギー原理(磯村拓哉、2022)
https://bsd.neuroinf.jp/wiki/自由エネルギー原理Karl, F. (2012). A Free Energy Principle for Biological Systems.
https://www.fil.ion.ucl.ac.uk/~karl/A Free Energy Principle for Biological Systems.pdfFriston, K. (2021). Some Interesting Observations on the Free Energy Principle. Entropy (MDPI).
https://www.mdpi.com/1099-4300/23/8/1076Parr, T. et al. (2019). Generalised free energy and active inference. Biological Cybernetics.
https://link.springer.com/article/10.1007/s00422-019-00805-wKirchhoff, M. et al. (2018). The Markov blankets of life: autonomy, active inference and ... Journal of the Royal Society Interface.
https://royalsocietypublishing.org/rsif/article/15/138/20170792RIKENプレスリリース(2022)神経回路は潜在的な統計学者
https://www.riken.jp/press/2022/20220114_3/RIKENプレスリリース(2023)培養神経回路において自由エネルギー原理を実証
https://www.riken.jp/press/2023/20230807_1/index.htmlMIT Press(2022)Parr, T. et al. Active Inference: The Free Energy Principle in Mind, Brain, and Behavior(オープンアクセス版)
https://direct.mit.edu/books/oa-monograph/5299/Active-InferenceThe-Free-Energy-Principle-in-Mind乾敏郎(京都大学 名誉教授)講義案内:今度こそ分かる自由エネルギー原理の急所(日本語)
https://www.can-neuro.org/2025/advance_1_inui/6799/