オトナの熱力学入門①:熱力学第一法則のための微分幾何

このシリーズでは、「熱力学」と呼ばれる学問を様々な視点から考え、さらにそれを他の学問に適用することについて扱います。

基本的に自分の勉強のために執筆するため、必ずしも正しいとは限りません。また、トピックは非常に多岐にわたる(微分幾何統計力学解析力学情報科学、情報幾何、生物学、経済学など)と思いますが、その回で必要とする事前知識はまず初めに提示し、それ以外の知識はその場で解説することにします。内容に関する批判・コメントや質問などあれば、随時記事にコメントいただければ幸いです。



シリーズの最初はやはり、熱力学の基礎である「平衡熱力学」を扱うことについて考えてみます。しばらくの目標は、

平衡状態を記述するためにはどのような数学があるべきか

です。また、事前にある程度仮定することとして、

を挙げておきます。

熱力学的状態空間

平衡熱力学では、「平衡状態」と呼ばれる状態どうしの関係や、その間でどのような遷移が可能かを扱います。一般には理想気体を題材に導入されることが多いですが、「平衡状態」という概念自体は、気体に限らずさまざまな現象に適用できます。


たとえば、氷と水が共存する状態は「固液平衡」として捉えられますし、pHで表される水素イオンの濃度も「酸塩基平衡」として考えられます。酵素などのタンパク質が他の分子(例えば薬剤や他のタンパク質)と結合・解離する化学反応も平衡ですし、タンパク質の折り畳み(フォールディング)も平衡として扱われます。

また、空洞放射と呼ばれる現象も興味深い例です。これは、閉じた空間の中で充満する光(熱放射)が、その空間の温度に応じた波長スペクトルを持つことです。例えば、熱い溶鉱炉は壁からの熱の放射が一定の色(例えばオレンジ色)に光る平衡状態にあります。また、この空洞放射は、すべての光を吸収し熱を放射する理想物体である黒体の放射と等価であることが知られており、初期宇宙も熱平衡状態にあったこと(すなわちビッグバンの証拠)が、宇宙背景放射の観測によって示されています。


とにかく、これらはすべて「平衡状態」を考える熱力学を使っており、それぞれにおいて、温度や濃度、波長といった異なる変数を用いて記述します。統計力学は、こうした平衡状態をミクロな粒子の統計から導き出す学問です。一方で、「平衡熱力学」として、特定の変数にあまり依存せずより普遍的な形で「平衡状態」を記述するためには、別の数学的な体系が必要になります。では、そもそも「平衡状態」は、どのような数学で書かれるべきなのでしょうか?

状態関数

熱力学における「状態」とは何でしょうか?

解析力学などの古典的な力学では、ミクロな粒子の「状態」は位置と運動量によって記述されます。エネルギーはこれらの変数の関数として定まり、位置と運動量がわかれば系の状態も確定すると考えられています。一方、量子力学ではもう少しややこしく、ミクロな粒子は確率的な挙動を示すため、系の「状態」を決定するのはそのような確率を定めるものです。例えば、電子の「スピン」という性質は二次元複素ベクトル(スピノル)で表されます。


いずれにせよ、これらの例ではエネルギーを状態とは扱いませんでした。しかし、熱力学ではエネルギーも状態として扱います。もっとも、エネルギー自体は他の状態の数値から計算可能であるため、状態関数と呼ばれています。わざわざエネルギーを状態関数として考えることについては、記事の後半、および後の回で考えていきます。


ここで重要なのは、解析力学で状態を記述するために位置と運動量を座標とした「相空間」と呼ばれる空間があったように、熱力学でも「熱力学的状態空間」と呼ばれる空間を定義する必要があるということです。この空間の座標には、エネルギーをはじめとした様々な状態変数が含まれます。

熱力学的状態空間は、扱う系によって変化します。例えば密閉した理想気体を扱う際は、内部エネルギー  U, エントロピー  S, 体積  V の3つの組  (U,S,V) からなる3次元空間を熱力学的状態空間とみなします。もし「開放系」を扱う、つまり物質のやり取りを許すならば、物質量  N を導入しますし、磁力の影響を加味したいならば、磁化  M を入れます。もっと変な例として、化学反応の進行度、ブラックホールの面積、「獲得した情報」なども扱えます。


これらの状態変数は系の大きさに比例するという定量性があります。つまり、系を分割すればその数値も同じ割合で分割されます。このような性質は示量性(extensive)と呼ばれており、示量性を持つ状態を示量変数と呼びます。エネルギーも示量性があるので示量変数と言えます。

一方で、温度  T や圧力  P のように系の大きさに依存しない変数もあります。40℃+50℃という計算を考えることは意味をなさず、このような変数は示強(intensive)変数と呼ばれています。


後ほど説明しますが、熱力学では基本的に「エネルギー」もしくは「示強変数×示量変数」の形式しか扱いません。というより、それ以外の形式は現れません。それは、これから説明していくように、熱力学の幾何的な構造にそのような制約があるからです。

マクロ状態と多様体

統計力学はミクロな力学とマクロな熱力学の間を自然につなぐことができる理論です。このミクロとマクロはどのように対応がついているのでしょうか?詳細は後の回で触れますが、ミクロな粒子の平衡状態に対応するもの、すなわち相空間の各点に対応する分布は、

 \displaystyle P(q,p)= \frac{exp \left( \theta_1F_1(q, p) + \dots + \theta_mF_m(q, p) \right)}{Z}

という形で書けます。なお、 (q, p) は長くて鬱陶しかったので (q_1, \dots, q_N, p_1, \dots, p_N) を全部圧縮してしまっただけで、分子の数に応じて複雑になります。

いずれにせよ、expの中にm個の \theta, Fのペアを用意して、それで書けるものとして考えます。特に Fは、理論的には計測することが可能であるとします(物理量と呼びます)。


私たちは、マクロな変数を持ち出して熱力学というものを作りたかったので、この分布関数をさらに示量変数などと対応付けたいと思っています。例えば、 F の一つに各分子の運動エネルギーに比例した量  p_i^2 があります。理論的には?一つ一つの分子の動きを計測すれば求まる量ではありますが、明らかに分子数が多くなると追いきれないので、熱力学で扱うときには系全体の平均エネルギーなどで置き換えたいと考えます。しかし、実際の分布自体は m 個のFを元に"状態"が決まっていると考えるほうが正しいです。

もしミクロに定まる物理量を用いた場合、mはおよそ分子の数に近いような非常に大きな数字となるため、それに対応するm次元の空間は明らかに超高次元です。しかし、熱力学ではマクロに定まる物理量(状態変数)を扱いたいので、高々3~数次元程度に収まる低次元の空間だけを考えています。或いは、m次元の空間のうち「マクロな状態変数」が"ほぼ"同じ数値をとるような部分的な空間のみを考察する、ということに相当します。


したがって、大きな次元の空間の中の特定の空間について考察する数学的仕組みを利用する必要があるでしょう。また、その上で平衡状態とは何かを考察する、あるいは平衡状態間を遷移する仕組みを考えるための数学が必要です。これは、現代の数学において多様体、および微分幾何という名前で扱われています。

微分幾何の基本

ここでは、とりあえず今後必要とする微分幾何の概念を抑えることだけを目標とします。また、数学的な厳密性はないです。もう少し細かく説明している弊ブログの記事もあるため、興味がある方は参考にしてください。

cake-by-the-river.hatenablog.jp

cake-by-the-river.hatenablog.jp

多様体

地球の表面はほぼ球面とみなしても良い形状をしています。そのため、緯度と経度によって地球上の特定の位置を指すことができます。しかし、普段生活していてわざわざ緯度と経度を用いて場所を指定する人はいません。例えば、渋谷のある場所で待ち合わせをするとき、スマホで渋谷駅周辺の地図を参照して場所を確認したりします。

この時、本来は球面であるはずの地表面を二次元の平面として近似したものでも、ほとんど問題なく場所を指定できています。それは、地表面全体から見て、ある場所(例えばハチ公像の位置)のごく周辺とみなせる範囲はほとんど平面と扱っても差し支えがないからです。逆に言えば、本当はぐにゃぐにゃしているような図形であっても、ある点のごく周辺だけを切り取って考えればほとんどユークリッド空間と近似ができるのです。


多様体とは、ぐにゃぐにゃしている図形や空間のことです。多様体上のある点について、ごく周辺(近傍と呼びます)は地図のような別のユークリッド空間で近似します。地図に対応するX,Y座標があるように、このユークリッド空間も局所座標系(chart)と呼ばれる局所的な座標によって記述されます。もしうまくこの地図を使って多様体上の全ての点を漏れなく何かしらの局所座標に充てることができれば、多様体上のあらゆる点を表現することができます。この「地図帳」は数学ではアトラスと呼ばれています。

多様体と局所座標系

例えば、熱力学的状態空間  (U,S,V)多様体の一つです。これはちょっとしたネタバレになりますが、熱力学を多様体で考える際は、実は熱力学的状態空間よりももっと高次元の拡張空間を考え、その中の部分空間(部分多様体)として扱います。拡張空間は宇宙のようなもので、その中の地表面を考えるように熱力学の部分多様体は曲がった空間です。そして、熱力学的状態空間の座標  U, S, V はその多様体上の局所座標として利用できる、というわけです。この拡張空間は「接触多様体」と呼ばれ、後に熱力学ポテンシャルやLegendre変換を自然に扱うための舞台となります。ここではまだ直観だけで大丈夫です。

接空間とベクトル場

多様体上の点の間を移動するには、速度ベクトルを決める必要があります。渋谷から東京まで移動したいとして、各駅の周辺の地図を参照して向きと大きさを決められますが、地図帳のページ同士には当然重なりがあって、重なった地点で使っている座標は異なるため速度ベクトルの数値も一見すると異なって見えます。

これでは困るため、少し突拍子のない発想を用います。つまり、速度を何かしらの(微分可能な)関数の勾配とみなしましょう。

 v = \nabla f

関数  f多様体上の点を実数へ対応させるものであり、これは座標系に依存せずに一意に定められます。

一方、勾配ベクトルは確かに局所座標系に依存して記述しますが、上の式に局所座標系が陽に現れていないように、局所座標系に依存せずに一意に定めることが可能です。むしろ、勾配ベクトルの座標表示は各点で採用した局所座標系に依存して変化します。例えば、2つの局所座標系  (x,y), (u,v) を用いて

 \displaystyle \left(\frac{\partial f}{\partial x}, \frac{\partial f}{\partial y} \right), \left( \frac{\partial f}{\partial u}, \frac{\partial f}{\partial v} \right)

と二つの表され方をしますが、これらは本質的には同じものを表しているはずです。線形代数を思い出すと、これはベクトルが異なる基底によって展開されていることに相当するとわかります。この場合、基底は

 \displaystyle \left(\frac{\partial}{\partial x}, \frac{\partial}{\partial y} \right), \left(\frac{\partial}{\partial u}, \frac{\partial}{\partial v} \right)

となります。この偏微分の形を基底とするベクトル空間を、接空間と呼びます。多様体上の点 pに付随する接空間  T_p M はその点の局所座標系に対応する形で決めることができます。

元はといえば速度ベクトルをうまく表現するために導入していましたが、関数の勾配という形式で表現することでこれを解決しました。そして、速度ベクトルは接空間の基底を用いて表せるため、接空間自体はありとあらゆる速度ベクトルを生成することができる空間です。


各点に一つの速度ベクトルを対応付けると、多様体の全ての点に速度ベクトルが張られたものができます。これはベクトル場と呼ばれています。例えば、ある点Aを出発する多様体上の曲線を表現したいとします。点Aからスタートして、その瞬間の速度ベクトル  v_Aに応じた方向にわずかに進むことを考えます。

 \displaystyle x + \Delta x = v_A \Delta t

これは、移動時間を短くしていけば、まさに線形常微分方程式を表しています。各瞬間で速度ベクトルは変化しますが、ベクトル場  X(p) があれば、常微分方程式の解(曲線)  \gamma (t)

 \displaystyle \frac{d \gamma(t)}{dt} = X(\gamma(t))

として書けるでしょう(初期条件は \gamma(0) = A)。この曲線は多様体上の「運動」を表しているため、軌跡とも呼びます。

裏を返せば、各瞬間の速度ベクトルはこの軌跡(曲線)の接線方向を示していると言えます。そのため、速度ベクトルは接ベクトルとも呼ばれており、多様体上のありとあらゆる曲線に接する接ベクトルの集合を考えていることから、接空間という名前が付けられているのです。もし多様体が2次元(地表面など)であれば、接空間は接平面とも言えます。

接空間とベクトル場の軌跡

余接空間と1-形式

続けて、ある点  p 上の接ベクトルについて

  • 接ベクトル1つを入力として、それを実数に移す線形関数  f

を考えることにします。ここでの「線形関数」は抽象的なもので、たとえば、内積によってベクトルから数値を取り出す操作に近いです。このような関数”自体”もベクトル空間になることを示します(もしすでに双対空間に慣れている方は飛ばしていただいて構いません)。


例えば、接ベクトルの基底を  (e_1, \dots, e_n) とします。この時、接ベクトルは

 v = v^1 e_1 + \dots + v^n e_n

のように各成分 v^1, \dots , v^n を用いて表されます(座標表示)。続けて、この接ベクトルを受け取り、それを実数値に変換する関数  f_p を考えます(関数  f多様体上の点  p に依存していることを明記しています)。関数  f を線形関数とするということは、接ベクトルの各成分について対応する関数値を割り当て、その和として実数値を返すものだとみなすことに相当します。つまり、

 f_p(v) = f_1(p) v^1 + \dots + f_n(p) v^n

と書けるはずです。この形式であれば、「線形性」を持つことができます(示してみてください)。ところで、 f_i(p) v^i という項は単に数値の掛け算をしているにすぎないため、

 \displaystyle (f_1(p), \dots, f_n(p)) \cdot \left( \begin{array} \ v^1 \\ \vdots \\ v^n \end{array} \right)

という”内積”としてみなせます(正確には成分同士の積の和という形で「内積のように」扱えるということです)。つまり、関数  f n個の基底  (\tilde{e}^1, \dots, \tilde{e}^n) を用いて

 f = f_1 \tilde{e}^1 + \dots + f_n \tilde{e}^n

として表せることになります。これはまさにベクトル空間の座標表示です。


このように、あるベクトル空間を受け取って実数値に対応付ける線形関数は、それ自体もベクトルとしてみなせます。そのベクトル空間は双対空間と呼ばれており、多様体上の接空間に対応する双対空間は余接空間と呼ばれています。余接空間から取り出すベクトルはコベクトルと呼ばれています。接空間の基底が \frac{\partial}{\partial x}のように与えられていたため、余接空間の基底は  dx として記述されます。


例えば、局所座標系が  (x, y) であるとある多様体において、ある点上のコベクトルとして  dx + dy を用意してみます。このコベクトルは、接ベクトル  (v_x, v_y) があるときに、対応する実数値を  v_x + v_y として得ることができます。ベクトル表記で考えるならば、 dx + dy (1, 1) に対応します。


なお、上の計算で成分同士の内積としてみなせるという部分がキーだったわけですが、これを逆向きに考えれば、接ベクトル  v とはコベクトル  f を実数値に変換する線形関数とみなせます。すなわち、双対空間の双対空間は元の線形空間になる、というわけです。この面白い性質は後の回で利用することになります。


接空間 T_p M多様体上の各点 pに対応して存在していたように、余接空間も多様体上の各点に存在しており、 T^*_p M と表します。そして、余接空間におけるベクトル場に相当するものが、1-形式と呼ばれているものです。つまり、多様体上の各点ごとにコベクトルを割り当てるようなものです。

各点の局所座標を使って割り当てたコベクトルを記述できるならば、1-形式は数式一つで書けて便利になります。例えば、2次元  (x,y) について、余接空間の基底  dx, dy それぞれの係数を  a(x,y), b(x,y) という関数で表せるならば、その1-形式は

 \omega = a(x,y) dx + b(x,y) dy

と書けます。先ほど  dx + dy というコベクトルを考えましたが、例えばそれが多様体上の点  (1, 1) に付随していたとしたら、 \omega = x dx + y dy のような1-形式に対応しているかもしれません。あるいは、 \omega = x^2 dx + x y dy のような1-形式かもしれません。とにかく、多様体上の座標を用いた関数によって各点にコベクトルが作られていると考えられます。


1-形式、或いはコベクトルを直感的に理解する方法として、”等高線”を考えるのがおすすめです。接ベクトルとコベクトルの組み合わせが与えられれば、一つの実数値を得ることができます。かえって、一つのコベクトルに対し、同じ実数値を返すようなすべての接ベクトルの集まりを考えることができ、これは"等高線"とみなせます。


例えば、二次元平面上の1-形式  \omega = dx について、接ベクトル  (0,-1) を入力としたときの数値は 0 となります。これは、接ベクトルが  (0, 1) (0, 10) でも同じ 0 になります。一方、 (2, -0.5) の数値は 2 になります。このように、それぞれの数値を満たす曲線(今回は直線)を等高線とみなすと、数値は「登った量」に相当するでしょう。

1-形式 ω=dx の等高線と、登った量としての関数値

そこで、1-形式  \omega に対し、「 \omega = C になる」という言葉を、値が  C になる接ベクトルの集合を得る操作とします。特に、 \omega = 0 は、関数  \omega ker を得ることに相当します。


もう少し複雑な1-形式  \omega = x^2 dx + y dy では、各点に付随する等高線は異なるものになります。また、それらの等高線から  \omega =0 となる接ベクトルを各点で選ぶことで、ベクトル場を形成することができます。

1-形式 ω = x^2 dx + y dy と、ω = 0 となるベクトル場。ベクトル場の色はその大きさを示している

図を見るとわかるように、各点の接ベクトルは等高線に沿った方向を向いていることになります。つまり、1-形式は各点の局所的な等高線を表していることになります。


さて、各点の等高線に沿う形の接ベクトルを使って多様体上に曲線を描くことを考えてみましょう。接ベクトルは速度ベクトルだったので、各点で対応した速度方向に動き続けることで曲線が作られるイメージです。あくまで山の等高線に沿う方向に動くので、山を登りも下りもしないようなルートになりそうです。


一方で、多様体上の曲線に対し、各瞬間の接ベクトルと1-形式の「内積」による数値を足し続ける操作を考えます。これはまさに、「(線)積分」のことです。より形式的に示すと、曲線  \gamma の上で1-形式  \omega積分することは

 \displaystyle \int_{\gamma} \omega

と書けます。ただし、今回は \omega =0 となる接ベクトルのみで構成されたベクトル場の上での曲線を考えているので、そうした曲線をどのようにとっても、線積分の値は0になるのが特徴といえます。


さて、 \omega = 0 となるベクトル場上のあらゆる曲線を考えることにしましょう。このような曲線は、ベクトル場の上を動く物体の軌跡という風にも捉えることができます。なぜならば、ベクトル場とは本来各点に対応した接ベクトル、もとい速度ベクトルの集合であり、各点での速度ベクトルによって決められた曲線はまさしくその速度によって記述される物体の軌跡に対応するからです。したがって、多様体上を動くあらゆる物体の軌跡として考えることができます。

実は、今回のベクトル場の上を動く物体の軌跡は以下の図に示されるように、ある関数  F(x,y) で表せるような曲面に乗ります。曲面に乗るとはつまり、この関数を横にスパッと切ったら対応する軌跡が現れる、ということです。

x^2 dx + y dy = 0 の曲線は曲面に乗る

少し強引に感じるかもしれないですが、このように曲線が関数  F の上に乗るような1-形式  \omega dF と呼ぶことにします。あるいは

 \omega = dF

と書いても良いです。


1-形式は局所的な等高線であると述べました。今導入した関数  F はすなわち山そのものを表すことになりそうです。すると、「等高線  \omega に沿った曲線が山  F に乗る」というのは一見して当然のことのように聞こえます。

それは本当でしょうか?あくまで1-形式は局所的な指定にすぎません。例えば、 y dx という1-形式は、多様体上のy座標の絶対値が大きくなるほど等高線の感覚が短くなっていくような不思議な山になりそうです。というかそんな山はあり得るのでしょうか?  y>0 のみを考えたとして、山  F の等高線は必ず常にy軸方向のみからなる必要がありますが、異なるy座標の等高線同士をうまく滑らかにつなぐには必ずx方向の動きが必要な気がします。つまり、無理だということです。

1-形式 y dx は山に乗らない

では、果たしてどのような1-形式  \omega であれば  \omega = dF と書けるものなのでしょうか?1-形式が  \omega = dF と書けるかどうかは、「積分する過程で結果が出発点と終点だけに依存するかどうか(経路非依存性)」という重要な性質と関係します。これはまさに、これから熱力学を考える際に深く関係してきます。

熱力学第一法則

とりあえずある程度の数学的知識を付けたので、改めて「熱力学」に必要なことを考えてみましょう。熱力学は、あくまでも熱に関連した実験的な観測から得られた経験則に基づいているので、そのような実験的観測の歴史から始めてみます。


熱力学は熱が発生するような対象を考えたいというモチベーションから生じてきました。蒸気機関はボイラーで発生する熱を羽根車を回したりピストンを押すことで機械的な仕事の形に変換する仕組みで、産業革命の原動力となりました。コリオリはこうした機械の効率を計算するために、仕事という概念を「力×距離」として提唱しました。その後、仕事が熱に交換できるということをジュールが実験で示されました。

一方で、軍医で生理学者だったヘルムホルツは、筋肉が動くことは化学反応によるものであること(それまでは「生命力」というものが要因だと信じられていました)、そしてその反応に付随して熱が発生することを発見しました。これは、化学反応に基づき、仕事と熱の二つが生じるということであり、生体が食事などで吸収した「活力」が、筋肉の働きや熱などに変換されて利用されている、という発想につながります。そしてそれは生体に限らず自然界すべてに当てはまることではないか?と考えたわけです。

当時は「エネルギー」という言葉はなく、"活力(Kraft)の保存" として提唱されていました。落下する物体やバネはそれぞれ活力を持っており、それらは摩擦によって失われていると考えられていました。しかし、ジュールの実験は熱も活力の形式であることを示し、別の活力である仕事に変換できるのだという風に考えたわけです。こうして、エネルギー保存の法則を展開しました。


では、「活力」たるエネルギーが交換可能であることはどのように示せばよいのでしょうか?あるいは、これらの量を数学的にどのように扱えばよいのでしょうか?

エネルギー保存

エネルギー保存の法則は、考えている系全体でエネルギーの全体量が変化しないことを表します。私たちは主に系自体=内部と環境=外部とで、熱や仕事の形でエネルギーを交換することを考えたいので、内部エネルギー  U という量を定義します。内部エネルギーの実態は分子の振動や運動によるものですが、ここではあくまで交換に関する法則を必要としているので、その差だけ考えます。そして、外部とのやり取りで全体量が変わらないのであれば、

 \Delta U = \Delta Q - \Delta W

がエネルギー保存を表す式になります。これが熱力学第一法則です。符号はどの方向を考えるかに依りますが、ここでは  \Delta Q は系が受け取る熱、 \Delta W は系が外部に与える仕事です(蒸気機関などを想定)。


例えば、外部と熱のやり取りを遮断している(断熱系)ならば、エネルギー変化は仕事の変化で記述されます。さらに仕事もしない孤立系であれば、内部エネルギーは変化しないはずです。熱力学第一法則の面白いところは、これが平衡状態かどうかとは関係がないことです。つまり、孤立系では常に

 \displaystyle \frac{dU}{dt} = 0

となります。


エネルギーのやり取りは究極的には微小な変化として記述可能です。これは微分形の熱力学第一法則と呼ばれています。

 dU = \delta Q - \delta W

まさに、熱力学第一法則は1-形式の間の関係式です。もっと言えば、内部エネルギーは1-形式  \omega = \delta Q - \delta W について  \omega = dU と書けるような関数  U ということです。

しれっと謎の  \delta という記法が出てきていますが、これはこれから説明する"不完全な形式(不完全微分"を表すものとしています。対照的に、  dU完全形式(完全微分と呼ばれています。

状態関数と経路関数

完全形式・不完全な形式について考える前に、より重要な問題を提起します。

微分形の熱力学第一法則は、有限変化の熱力学第一法則と一貫しているのでしょうか?つまり

 dU = \delta Q - \delta W \ \ \to \ \ \Delta U = \Delta Q - \Delta W

は本当に成り立つのでしょうか? dU はあくまで微小変化を記述する1-形式ですが、 ΔU は二つの状態間の有限な変化です。これらを橋渡しするには、dU を経路に沿って積分する必要があります。


微小変化を、有限の変化に発展させる方法は積分です。実際、熱力学的状態空間という多様体の上で状態を変化させることは、多様体上の曲線(軌跡)を考えることに相当します。熱力学ではそのような操作は「経路」という別の名前で呼ばれています。そして、1-形式  dU に対して経路を「積分」することについては先ほど触れました。先ほどの文脈では経路の積分値は0でしたが、ここでは外部にエネルギーが移動する場合があるため、必ずしも成り立たなくてもよさそうです。

しかし、重要な性質を仮定しなければなりません。それがまさに「内部エネルギーが状態関数であること」です。状態関数とは状態によってその関数の数値が決まることでしたが、これは経路(曲線)に依存しないということを意味します。一方、積分結果が経路に依存する関数は経路関数と呼ばれています。例えば、理想気体については(統計力学から)実際に内部エネルギーと他の状態変数との関係が求まり、内部エネルギーが2つの状態変数  (V, S) によって一つに定まる状態関数である様子がわかります。

理想気体の状態関数である内部エネルギーと経路

内部エネルギーが経路関数だとどう困るのでしょうか?例えば上の図は二つの経路  \gamma_1, \gamma_2 のもとに 1-形式  dU積分した結果が等しいことを示しています。

 \displaystyle \int_{\gamma_1} dU = \int_{\gamma_2} dU = +7

経路の片方を反転し、それらを組み合わせればループを作ることができます。上の図を見ると状態関数であればループの積分結果は0になるとわかります。

しかし、もし内部エネルギーが経路関数であった場合、積分の結果が異なる可能性があります。例えば経路  \gamma_2 での積分結果が  +6 だったとします。このとき、ループの積分結果は  +1 となります。つまり、あるループ経路に沿って内部エネルギーが1だけ増えるとすれば、それを繰り返すことでエネルギーを際限なく蓄積できることになります。これではエネルギー保存の法則に反してしまいます。

このような経路の組み合わせが一つでも見つかってしまえば、すぐにエネルギー保存の法則を壊すことができます。逆に言えば、状態関数ではどんな経路で山登りを行っても同じ数値になることが保証できるので、エネルギー保存の法則を自然に満たせるというわけです。これが内部エネルギーが状態関数であることが必要条件になることを表しています。


仕事は経路関数です。仕事はもともと力×距離として導入しましたが、理想気体などでは力を圧力と体積に分解して記述できることがわかっています。距離の方は積分に対応しているので、まずは1-形式を

 \delta W = p dV

と書くことにします。これにより、

 \Delta W = \int_{\gamma} \delta W = \int_{\gamma} p dV

と書けるわけです。体積はもともと状態変数として導入しているため、 dV は余接空間の基底と言えます。

さて、この積分は経路に依存しているのでしょうか?これは具体的に計算してみればわかります。状態方程式から  P = nRT/V であり、温度に依存した量であることがわかります。そのため、経路の途中で温度を変化させるようなことがあれば、それによって最終的な積分結果は変わりうるわけです。ループを作れば、仕事については0にならない可能性が高いわけです。

熱力学第一法則は内部エネルギーの完全形式

さて、これまでの内容を微分幾何の言葉にしてみます。

多様体上の状態関数とは経路に依存しない関数で、ループを作れば必ずその積分が0になるはずでした。ループの積分を周回積分という記法で書けば

 \displaystyle \oint dF = 0

ということです。ところで、解曲線が曲面に乗るような1-形式も  \omega = dF として書いたことを思い出しましょう。これまでの議論を踏まえると、まさにそのような1-形式であれば、 F が状態関数を満たすことがわかります。


そこで、私たちは1-形式の性質から状態関数を定義し直します。つまり、何かしらの関数 F を用いて1-形式  \omega \omega = dF として書けるとき、関数  F を状態関数と呼びます。そして、そのような形で書ける1-形式のことを完全形式と呼びます。一方、そのような形式で書けない1-形式は不完全形式と呼ばれており、その場合に対応する曲線の積分値は経路関数と呼ぶわけです。



これにより、熱力学第一法則を微分幾何の言葉で言えます。つまり、微分形の)熱力学第一法則とは、内部エネルギーが状態関数であること、およびその完全形式  dU が不完全形式  \delta Q, \delta W の差によって書けるという法則を数式にしたものです。また、完全形式であることにより、大域的な熱力学第一法則も示されるわけです。



このように記述することのメリットは、それぞれの座標に依存していない、ということです。理想気体の場合に(その存在だけ使った)エントロピーと体積をもとに内部エネルギーの座標表示を利用しましたが、上の定式化には一切そのことは出てきません。一方、微分幾何的な定式化ではどのような座標系でも1-形式が完全形式であるかどうかという性質のみ注目すればよく、詳細な表現の違いに影響されません。つまり、内部エネルギーがどのような状態変数で書かれているかに依存しないのです。

これにより、たとえ状態変数をいろいろと増やす(例えば、物質量、磁化、反応の進行度、獲得した情報、などなど)場合であっても、上の性質はわざわざそれぞれの座標に応じて記述する必要がなくなります。あるいは、状態関数を「状態変数により記述できる」という状態変数=座標に依存した形で定義せずに済み、エネルギー保存はどのような形態であっても成り立つことを広く提唱したことになります。まさにこれは座標に依らない微分幾何の強みでしょう。


ところで、熱が不完全形式であることは特に示さずに利用してしまいました。熱には仕事のように目に見えてわかる関係はなかなか見つけられない気もします。また、完全形式はどのような1-形式であれば実現されるのか、ということについてあまり触れることができませんでした。次回は、熱にまつわる歴史から始めて、エントロピーと呼ばれる(不思議な?)状態関数が完全形式と微分形式の理論から保証されること、それによって熱力学第二法則を説明したカラテオドリの原理について解説します。

参考文献

後で書きます。