Generalized Jarzynski Equality under Nonequilibrium Feedback Control Original: http://jp.arxiv.org/abs/0907.4914 (Dated: January 20, 2010) ※ これは、上タイトルの論文(プレプリント)を理解するために、個人的に翻訳したメモです。 ※ 正確な内容については、オリジナルをあたってください。 ※ 訳したのは論文の前半部分、Introduction, First Main Result, Second Main Result までです。 ※ ※印の部分は、翻訳者が付けた注釈です。 ------------------------------------------------------------------------ 【イントロダクション】 (* 導入部省略 *) 着目すべきは Jarzynski等式である: < exp( -β(W - ΔF) ) > = 1 ・・・(1) ここで は熱力学系に働いた仕事の統計的平均、 ΔF は自由エネルギーの差、 T ≡ (kB β)^-1 は、初期状態の正準分布(カノニカル分布)の温度。 ※ Jarzynski等式とは、とある変化について、系に働きかけた仕事Wと、 ※ 系に蓄えられた(あるいは系が失った)自由エネルギーΔFの関係を表す式です。 ※ < > 記号は平均をとる、という意味です。 ※ Δ が付いているのは、最初と最後の状態間の差、という意味です。 ※ kB はボルツマン定数です。 ※ 別の書き方で、 ※ exp( - ΔF / kB T ) = < exp( - W / kB T ) > ※ としてある場合もありますが、この式は上の(1) と等価です。 等式(1)は、終了状態が平衡から遠く離れていてもなお成立する。 つまり、時刻 t = 0 から τ までの間に、 外部パラメータλ を λ(0) から λ(τ) まで有限の速さで変化させて系を導いたときでさえ(等式は成立している)。 ここでの λ とは、例えば気体の体積や、光ピンセットの振動数など(の制御パラメータのこと)である。 (1)式の左辺は、仕事 W の全ての次数のキュムラントを含んでいる。 ※ キュムラント ※  確率分布の特性関数φ(ξ)が φ(ξ) = exp( c0 + c1ξ + c2ξ^2 + ・・・)のように展開できるとき、 ※  係数 cn を n次のキュムラントといい、この展開をキュムラント展開という。 ※ 特性関数(確率分布の) ※  確率変数 X に対して関数φ(ξ) = E[ exp( i ξ X ) ]をその特性関数という。 ※  (-- 岩波数学入門辞典より) ※※ E[ ] は期待値のことです。 ※※ 特性関数とは、要するに確率密度関数をフーリエ変換したものです。 ※※ (n次の)キュムラントとは、特性関数を展開した(n次の)係数のことです。 実際のところ、熱力学第二法則 < W > ≧ ΔF ・・・(2) や、揺動散逸定理は、それぞれ W の一次と二次のキュムラントの結果である。 ※ 揺動散逸定理とは、-- Wikipedia「揺動散逸定理」より ※  熱力学系の平衡におけるゆらぎと抵抗(抗力)の間にある関係を示すものである。 ※  特殊な場合の例、ブラウン運動に関するアインシュタインの関係式は次で与えられる: ※   D = μ kB T ※  ここでD は粒子の拡散係数、μ は移動度(外力に対する粒子の最終速度の比、μ = vd / F) ※ 参考:生体にみられる``ゆらぎ'' -- http://www.p.u-tokyo.ac.jp/~yamamoto/jres_3/jres_3.html (* 途中省略 *) 確率的な熱力学系を、時刻 tm において観測することを考えてみよう。 その時点における系の相空間上の点を Γm として、P[Γm] をその確率、y を観測結果だとしよう。 観測には、条件付き確率 P[y|Γm] で特定される観測誤差を含み得るものと仮定する。 条件付き確率 P[y|Γm]とは、系の状態が Γm であった条件下において、結果 y が得られる確率のことだ。 例えば、観測にガウス分布型ノイズが誘発されたなら、ノイズのばらつきがあるので、条件付き確率は次式で与えられる、 P[y|Γm] = (2πN)^(-1/2) exp( - (y - Γm)^2 / 2N), N > 0 ※ 相空間(あるいは位相空間)とは、 ※  解析力学で用いられる道具立てで、粒子の位置と運動量で張られた空間のことです。 ※  相空間上の1点1点がそれぞれ、系の1つの状態を表しています。 ※ 条件付き確率 P[B|A] とは、 ※  事象A が起こった条件のもとで、事象B が起こる確率のことです。 ※ ガウス分布(正規分布)の式は、 ※  f(y) = (2π(σ^2))^(-1/2) exp( - (y - μ)^2 /(2 σ^2)) ※  ここで、μ:平均、σ:分散、です。 結果 y が得られる確率は、次式で与えられる、 P[y] = ∫dΓm P[y|Γm] P[Γm] 観測によって得られた情報は、次のような相互情報量として特徴付けられる、 ≡ ∫dΓm dy P[y|Γm] P[Γm] I[Γm, y] ここで I[Γm, y] ≡ ln( P[y|Γm] / P[Γm] ) である。 ※ 相互情報量とは、 ※  形式的には、2つの離散確率変数 X と Y の相互情報量は ※   I(X; Y) = ∫∫ P(x, y) log( p(x, y) / p(x) p(y) ) dx dy ※  直観的には、相互情報量は X と Y が共有する情報量の尺度である。 ※  一方の変数を知ることでもう一方をどれだけ推測できるようになるかを示す。 ※  (-- Wikipedia「相互情報量」より) ※ つまりここでは、 ※  <得られた情報> = ∫d(全ての状態に渡って){ (観測誤差)・(系がその状態になっている確率) } ※ みたいな感じになっているということです。 フィードバック制御を行った場合、パラメータ λ の制御手順は、時刻 tm 後の結果 y に依存する、 このことを λ(t; y) と表記しよう。 フィードバック制御の導入は、熱力学第二法則(2)式の一般化の必要を我々に促す。 フィードバック制御(あるいは”悪魔”)から得られた相互情報量 を含めれば、 < W > ≧ ΔF - kB T ・・・(3) かくして、熱力学系に必要とされる仕事は、フィードバック制御によって減らすことができる。 ここで重要な問いかけは: フィードバック制御がある状況下で Jarzynski等式(1)を一般化して、 非平衡の挙動について不等式(3)より詳細な知見が得られないだろうか、 ちょうどオリジナルの Jarzynski等式がそうであった(熱力学第二法則(2)より詳細な知見が得られた)ように。 この論文で、我々は肯定的に答えよう。 ------------------------------------------------------------------------ 【第1の主要な結果】 情報の項を左辺に含む、一般化された Jarzynski等式は: < exp( -β(W - ΔF) - I > = 1 ・・・(4) この証明は後ほど与えよう。 注意すべきは、λ(τ; y) が為されたとき、(時刻 τ に結果 y を得たときの外部パラメータλ) ΔF が y に依存するかもしれないということだ。 我々の結果は、局所詳細釣り合い(あるいは詳細揺らぎ定理)を満たすような、古典的な確率過程に適用できる。 従って、我々の結果は、微少な非平衡系を制御する広範囲の分野に適用できることになる。 (4)式の一次のキュムラントから、指数関数の凹性により、不等式(3)は直接作り出すことができる。 もし全ての確率変数がガウス分布であれば、二次のキュムラントから、 相互情報量の項を含む一般化された揺動散逸定理を導くことができる: < σ + I > = 1/2 [ Δ (σ + I) ]^2 ・・・(5) ここで σ ≡ β(W - ΔF) は、仕事の消失(あるいはエントロピー生成)、 [ Δ (σ + I) ]^2 ≡ < (σ + I)^2 - <σ + I>^2 > は、仕事と相互情報量の分散を表す。 それゆえ、より多くの情報を得るほど、系がこうむる損失は少なくなるわけだ。 ------------------------------------------------------------------------ 【第2の主要な結果】 もし、フィードバック制御のある状況下で、オリジナルの Jarzynski等式(1)の左辺が観測できたなら、 右辺の答は1つにはならないだろう。その右辺をγと書けば: < exp( -β(W - ΔF) > = γ ・・・(6) 重要なポイントは、逆方向の制御手順を用いることでγを直接測定できるということ、 そしてそのγがフィードバック制御の効果の表れとなることだ。 従って、式(6)の左辺と右辺は独立した手続きによって測定できることになる。 さて、γの性質について論じることにしよう。 まず1点目に注意するのは、制御手順λはフィードバック制御のため、 時刻 t > tm で測定結果 y に依存するということである。 特に、取り得る結果の選択肢が有限個のM個であった場合、 順方向にはM個の制御手順λ(t; y) が存在することになる。 それら(の手順)に対応して、逆方向の手順λ†(t; y) ≡ λ(τ-t; y) が存在する、 そしてそれら(逆方向の手順)は、 パラメータλ†(0; y) に対応する初期状態の正準分布(カノニカル分布)からスタートすることで、 時刻 0 < t < τ-tm の範囲のみで結果 y に依存する。 逆方向の過程では、フィードバック制御を一切行わないものとしよう。 その代わり、順方向の結果 y に依存するように、何回も系を操作するものとしよう。 そこで我々は、逆方向の過程が時刻τ - tm にある内に観測を行い、結果 y' を得る。 制御手順λ†(t; y) で結果 y' が得られる確率を Pλ†(t; y)[y'] としよう、 この確率は、全ての y に対して ∫dy' Pλ†(t; y)[y'] = 1 に規格化されているものとする。 さらに、y の時間反転を y* と書くことにしよう、 もし系の運動量を測定するときには、yi* = - yi となり(時間反転なので符号が逆)、 もし系の位置を測定するときには、yi* = yi となる(時間反転しても符号は変わらない)。 y' = y* となる特別な場合には、 ※ つまり逆方向の過程の結果が時間反転の結果に等しくなるような場合には、 Pλ†(t; y)[y*] という記号を用いることにしよう、 これは必ずしも単一の値である必要はない。 さて、我々はγが次式で与えられることを示せる、 γ = ∫dy Pλ†(t; y)[y*] ・・・(7) 詳細は後で論じるが、式(7)を証明するため、 条件付き確率が P[y*|Γm*] = P[y|Γm] を満たすものと我々は仮定している。 ※ つまり、条件付き確率は時間反転しても変わらないものと仮定する。 ここで、Γm* は相空間上の点 Γm を時間反転したものだ。 例えば、 Γm = (r, p)、r は位置、p は運動量であったなら、Γm* = (r, -p) ということである。 物理的には、γとは、時間反転した手順上での時間反転した結果が得られる確率の合計である。 フィードバック制御が無ければ、γ = 1 となる、 なぜなら Pλ†(t)[y*] は単一の確率分布となるからだ。 式(6)の妥当性は、右辺と左辺を独立に測定することによって、実験的に確かめることができる。 順方向の過程で、W と ΔF を測定することができる。 そして、時間反転手順λ†(t; y) を、全ての可能な結果 y について何度も実行することによって、 γを決定することができる。 ひとたび等式(6)が確かめられたなら、我々はフィードバック効果γを、 ただ順方向手順の W と ΔF を測定するだけで見積もることができる。 フィードバック制御の効果は、式(6) に表されているのだと言える。 W < ΔF を満たすような小さな量の仕事が、式(6)の左辺にあるように指数的に大きな量の寄与を生む。 特に、フィードバック制御がある場合、式(1)が破られていてもなお、式(2)が満たされている状況が起こり得る。 そのような例は、後ほど論じよう。 このような状況下では、フィードバック制御は の一次の項ではなく、高次のキュムラントのみに影響を与える。 次に、相互情報量 I と、パラメータγの関係について論じよう。 確率変数 X のキュムラント母関数 C[X] ≡ ln < exp( - X ) > を導入する。 式(4) と 式(6) と、< exp(-I) > = 1 であることから、 C[σ + I] - C[σ] - C[I] = - ln γ を得る。 この式の左辺は σ と I の相関を示しているので、 γとは散逸と情報の相関を測定したものだということがわかる。 特に、σ と I の結合分布がガウス分布であれば、 < Δσ ΔI > = - ln γ ・・・(8) この < Δσ ΔI > ≡ < σ I > - <σ> ということだ。 I が測定によって得られた情報量という意味を持ち、 σは、得られた情報をフィードバック制御によっていかに効果的に用いたかを示している。 γが大きければ、情報を効果的に用いて散逸σを小さくしたということだ。 つまり、情報 I がより大きければ、散逸σはより小さくなる。 I はただ観測のみに依存するが、σは観測とフィードバック制御の両方に依存している。 (* 以下、後半部は略 *) ========================================================================