ぶちゅり

日々学んだ物理学に関することをメモしていきます。コメントでのご指摘お願いします。

【多様体論】多様体上のスカラー/反変/共変ベクトル/テンソル

地図を貼り付けられる多様体上にはスカラーやベクトル、テンソルの構造が表れてきます。
\newcommand{\bm}{\boldsymbol}

多様体上の関数(スカラー場)

m次元C^r多様体M上の関数f:M\rightarrow{\mathbb R}C^s(0\leqq s \leqq r)級関数(スカラー場)であるとは、
f \circ \phi_\alpha^{-1}:\phi_\alpha(U_\alpha)\rightarrow{\mathbb R}C^r級であることです。
C^r多様体(M,\mathcal S)上の関数fC^s級であるとき、それと同一な(M,\mathcal T)上においても、fC^s級となります(証明略)。なので、多様体上の関数の定義に座標近傍が用いられてはいますが、この性質は座標近傍に依存しないです(同一と定義した多様体ではこの性質を保つということです)。多様体上のスカラー場(関数)全体を\mathcal F(M)と表し、そのうちC^s級のもの全体をC^s(M)と表します。さっきから関数のことをスカラー場といっていますが、関数はスカラー値(\mathbb Rの値)への写像で、各点にスカラー値を対応させています。ですからこれはスカラーの「場」なのです。関数の帰り値のスカラー値は、地図の貼り付け方(座標)に依りません。この性質はとても大切になってきます(これこそが幾何という考え方です)。

多様体間の写像

m次元C^r多様体M,n次元C^r多様体Nとして、その間の写像f:M \rightarrow Nがある一点p\in M C^s級であるとは、pを含むMC^r級座標近傍(U,\phi)f(p)を含むNC^r級座標近傍(V,\psi)が存在して、
1.f(U)\in V
2.\psi \circ f \circ \phi^{-1}:\phi(U)\rightarrow \psi(V)がC^s級写像である。
2.はすなわち、\psi \circ f \circ \phi^{-1} を局所座標表示したn個の関数がそれぞれC^s級関数であるということです。
そして、f(U,\phi),(V,\psi)C^s級のとき、p,f(p)を含む別のC^r級座標近傍(U',\phi '),(V',\psi ')であってもC^s級となります(証明略)。

m次元C^r多様体M,n次元C^r多様体Nとして、その間の写像f:M \rightarrow NC^s級であるとは、各点\forall p \in MfC^s級であることです。また、f^{-1}が存在し(f全単射)、ff^{-1}C^s写像であるときにfC^s微分同相写像といいます。s=0のときは単に同相写像のこととします。

多様体上の反変(接)ベクトル

多様体Mt=0で点pを通る曲線x:(-\epsilon,\epsilon)\ni t\mapsto x(t)\in Uを与えると、この曲線に沿った多様体上の関数fの点pでの微分操作{\bm v}_{x,p}=\frac{dx}{dt}|_{t=0}が自然に次のように定義できます。
{\bm v}_{x,p}(f)=\left. \frac{dx}{dt}\right| _{t=0}(f):=\left. \frac{df(x(t))}{dt}\right| _{t=0}]
[tex:{\bm v}_{x,p}=\frac{dx}{dt}|_{t=0}:f\mapsto \frac{df(x(t))}{dt}|_{t=0} \in {\mathbb R}という線形性とライプニッツ則をもつ汎関数となります。すなわち
{\bm v}_{x,p}(af+bg)=a{\bm v}_{x,p}(f)+b{\bm v}_{x,p}(g)
{\bm v}_{x,p}(fg)={\bm v}_{x,p}(f)g(x(0))+f(x(0)){\bm v}_{x,p}(g)
{\bm v}_{x,p}は曲線[tex:xの引き方だけで定まり、また曲線xの引き方だけ存在するといえる、任意のxを考えて、{\bm v}_{x,p}の属する集合を\mathcal V_p(M)とします。ここで、任意の微分操作{\bm v}_{x,p},{\bm v}_{y,p}に関して、和と実数倍を次のように定義します。多様体上の任意の関数f、任意の多様体に引ける曲線x,y、任意の実数a,bに対して
a{\bm v}_{x,p}+b{\bm v}_{y,p}\in \mathcal V_p(M)
(a{\bm v}_{x,p}+b{\bm v}_{y,p})(f):=a{\bm v}_{x,p}(f)+b{\bm v}_{y,p}(f)
のように定義するとベクトル空間の公理を満たし、\mathcal V_p(M)はベクトル空間になります。このベクトル空間の元を反変ベクトルまたは接ベクトルといいます。ここまでの\mathcal V_p(M)(の元)において座標近傍はあらわに出ていなので、座標近傍に依らずに多様体の各点にベクトル空間が定めることができるということです。ここで、曲線に沿って反変ベクトルを局所座標表示してみます。ただし、x(t)まわりのUでのある局所座標表示として、
\phi(x(t))=(x^1(t),...,x^m(t))=(x^1,...,x^m),f(x(t))=(f\circ\phi^{-1})(x^1(t),...,x^m(t))となっているとします。
V_{x(t)}(M)\ni\bm v_{x,x(t)}(f)=\frac{dx}{dt}(f)=\frac{df(x(t))}{dt}=\frac{d(f\circ\phi^{-1})(x^1(t),...,x^m(t))}{dt}
合成関数の微分公式を用いれば、
=\frac{dx^\mu(t)}{dt}\frac{\partial (f\circ\phi^{-1})(x^1(t),...,x^m(t))}{\partial x^\mu}=\frac{dx^\mu(t)}{dt}\frac{\partial f(x(t))}{\partial x^\mu}
よって、
\bm v_{x,x(t)}=\frac{dx^\mu(t)}{dt}\left(\frac{\partial}{\partial x^\mu}\right)_{x(t)}:=\left(\frac{dx^\mu(t)}{dt}\right)_{x(t)}\left(\frac{\partial}{\partial x^\mu}\right)_{x(t)}
(曲線xを明示するために最右辺を定義しました)となり、反変ベクトルを局所座標表示したときの成分を具体的に求めることができます。この表示から、ある曲線で与える反変ベクトルは速度ベクトルというべきもの、つまり速度ベクトルの自然な拡張になっていることがわかります。ある曲線で与えられる、曲線に沿った反変ベクトルを速度ベクトルということにします。そしてこの表示から、\mathcal V_p(M)の基底は\left(\frac{\partial}{\partial x^\mu}\right)_p\ (1\leqq\mu \leqq m)になっていることがわかます。ただしこれは次のように定義されます。
\phi(x_\mu(t))=(x^1,...,x^\mu+t,...,x^m)
\left(\frac{\partial}{\partial x^\mu}\right)_p:=\bm v_{x_\mu,p}:f\mapsto \left(\frac{\partial f}{\partial x^\mu}\right)_p:=\left.\frac{df(x_\mu(t))}{dt}\right|_{t=0}=\left(\frac{\partial(f\circ\phi^{-1})}{\partial x^\mu}\right)_p(\phi(p))
{\mathbb R}^m 上の曲線\phi\circ x_\mu がそれぞれ x^\mu 軸に平行に、t\Delta t増えたら\mu 番目の成分も\Delta t増えるような直線(線分)になっているということです。これはすなわち{\mathbb R}^mでの通常の偏微分です。以降は表記上簡単なため、{\bm v}_{x,p}を単に{\bm v}_pと書きます(別の曲線に沿った共変ベクトルと区別したい場合には{\bm w}_pなどとします)。ある{\bm v}_p \in \mathcal V_p(M)が座標近傍(U,\phi)で、(v^\mu)_p\in {\mathbb R}(スカラー)として{\bm v}_p =(v^\mu)_p \left(\frac{\partial}{\partial x^\mu}\right)_pと表されているとします。(ただし、添え字\mu についてアインシュタインの縮約を用いています。アインシュタインの縮約とは同じ添え字が式中に上下に2回あらわれたらその添え字について考えている分すべての和をとることを意味し、この場合\Sigma_{\mu=1}^mです。) ここで、別の座標近傍(U',\phi '),\phi '(p)=(x'^1,...,x'^m )では{\bm v}_p =(v'^\mu)_p \left(\frac{\partial}{\partial x'^\mu}\right)_pで表されているとします。(U,\phi)(U',\phi ')の間の座標変換で、基底の変換性は次のようになります。
\left(\frac{\partial}{\partial x^\mu}\right)_p=\frac{\partial x'^\nu}{\partial x^\mu}(\phi(p))\left(\frac{\partial}{\partial x'^\nu}\right)_p
\left(\frac{\partial}{\partial x'^\mu}\right)_p=\frac{\partial x^\nu}{\partial x'^\mu}(\phi(p))\left(\frac{\partial}{\partial x^\nu}\right)_p
よって、成分の変換性は次のようになります。
(v'^\mu)_p=\frac{\partial x'^\mu}{\partial x^\nu}(\phi(p)) (v^\nu)_p
成分の変換性は基底とは逆になっていて、この変換則から反変ベクトルと言われています。

多様体上の反変ベクトル場

反変ベクトルは多様体の各点で無数に考えられますが、各点へ反変ベクトルをユニークに対応させるものを反変ベクトル場(または単にベクトル場){\bm v}=v^\mu \frac{\partial}{\partial x^\mu}:p\mapsto {\bm v}_pといい、反変ベクトル場全体を\mathcal V(M)とします。(v^\mu は各点でスカラーを与えるものなので、多様体上の関数です。v^\mu\in\mathcal F(M)) 反変ベクトル場同士の和を{\bm v}+{\bm w}:p\mapsto {\bm v}_p+{\bm w}_p、関数倍をf{\bm v}:p\mapsto f(p){\bm v}_pで定義します(定数関数を与えれば実数倍のようになる)。多様体ユークリッド空間の大きな違いに、各点での反変ベクトル空間が一般に異なるか、等しいかということがあり、そのために多様体では各点で考えた反変ベクトル空間に対してそれへの対応すなわち場という考え方を用いるのです。
まとめると、
\mathcal V(M)\ni {\bm v}=v^\mu \frac{\partial}{\partial x^\mu}:M \ni p\mapsto {\bm v}_p=(v^\mu)_p \left(\frac{\partial}{\partial x^\mu}\right)_p\in \mathcal V_p(M)
\mathcal V_p(M)\ni {\bm v}_p:\mathcal F(M)\ni f\mapsto {\bm v}_p(f)\in{\mathbb R}
物理でよくある表記ルールとして、反変ベクトルを局所座標で書いたときの成分(v^\mu)_pの添え字\mu は上に書くとされている。逆にこの後出てくる共変ベクトルの成分は(\omega_\mu)_pのように下に書くとされています。

多様体上の共変(余接)ベクトル(コベクトル)

多様体の各点pで反変ベクトルを引数にした次のような線形汎関数{\bm \omega}_{f,p}を考えます。ただしその線形汎関数多様体上の関数fを用いて定まります。(反変ベクトルは多様体上の曲線を固定して関数を作用させて実数である微分係数を返しますが、この場合は関数を固定して曲線で定まる反変ベクトルを作用させて実数である微分係数を返します。)
{\bm \omega}_{f,p} :\mathcal V_p(M)\ni a{\bm v}_p +b{\bm w}_p \mapsto {\bm \omega}_{f,p}(a{\bm v}_p+b{\bm w}_p):=a{\bm v}_p(f)+b{\bm w}_p(f)\in {\bf R}
多様体上の任意の関数fを考えて、{\bm \omega}_{f,p}の属する集合を\mathcal V^*_p(M)とします。ここで、任意の線形汎関数{\bm \omega}_{f,p},{\bm \omega}_{g,p}に対して、和と実数倍を次のように定義します。多様体の点pにおける任意の反変ベクトル{\bm v}_p多様体上の任意の関数f,g、実数a,bに対して
a{\bm \omega}_{f,p}+b{\bm \omega}_{g,p}\in \mathcal V^*_p(M)
(a{\bm \omega}_{f,p}+b{\bm \omega}_{g,p})({\bm v}_p):=a{\bm v}_p(f)+b{\bm v}_p(g)
のように定義するとベクトル空間の公理を満たし、\mathcal V^*_p(M)はベクトル空間になります。このベクトル空間を、ベクトル空間\mathcal V_p(M)から定まる双対ベクトル空間\mathcal V^*_p(M)といいます。この双対ベクトル空間の元を共変ベクトルまたは余接ベクトルといいます。反変ベクトルのときと同様に、ここまでの\mathcal V^*_p(M)(の元)において座標近傍はあらわに出ていなので、座標近傍に依らずに多様体の各点に(双対)ベクトル空間が定めることができるということです。ここで、各点まわりU\ni pでの座標近傍(U,\phi),\phi(p)=(x^1,...,x^m)を考えると、\mathcal V_p(M)の基底は\bm\omega_{x^\mu\circ\phi,p}=:(dx^\mu)_pになります(これを基底(\frac{\partial}{\partial x^\mu})_pから定まる双対基底といいます)。ただしこれはfとして座標関数^\mu\circ\phi を考えたもので、次の性質をもちます。
(dx^\mu)_p\left(\left(\frac{\partial}{\partial x^\nu}\right)_p\right):=\left(\frac{\partial}{\partial x^\nu}\right)_p(x^\mu\circ\phi)=\frac{\partial x^\mu}{\partial x^\nu}(\phi(p))=\delta^\mu_\nu
以降、{\bm \omega}_{f,p}を単に{\bm \omega}_pと書きます(別の関数で定まる共変ベクトルと区別したい場合には{\bm \eta}_pとします)。ある{\bm \omega}_p \in \mathcal V^*_p(M)が座標近傍(U,\phi)で、(\omega_\mu)_p\in {\mathbb R}(スカラー)として{\bm \omega}_p =(\omega_\mu)_p (dx^\mu)_pと表されているとします。ここで、別の座標近傍(U',\phi '),\phi '(p)=(x'^1,...,x'^m )では{\bm \omega}_p =(\omega'_\mu)_p (dx'^\mu)_pで表されているとします。(U,\phi)(U',\phi ')の間の座標変換で、双対基底の変換性は次のようになります。
(dx'^\mu)_p=\frac{\partial x'^\mu}{\partial x^\nu}(\phi(p)) (dx^\nu)_p
よって、成分の変換性は次のようになります。
(\omega'_\mu)_p=\frac{\partial x^\mu}{\partial x'^\nu}(\phi(p)) (\omega_\nu)_p
成分の変換性は、元の基底(つまり、双対基底ではない)と同じになっていて、逆に双対基底の変換性とは逆です。元の基底を基準にみて、この変換則から共変ベクトルと言われています。

多様体上の共変ベクトル場

共変ベクトルは多様体の各点で無数に考えられますが、各点へ共変ベクトルをユニークに対応させるものを共変ベクトル場(または1次微分形式){\bm \omega}=\omega_\mu dx^\mu:p\mapsto {\bm \omega}_pといい共変ベクトル場全体を\mathcal V^*(M)とします。共変ベクトル場同士の和を{\bm \omega}+{\bm \eta}:p\mapsto {\bm \omega}_p+{\bm \eta}_p、関数倍をf{\bm \omega}:p\mapsto f(p){\bm \omega}_pで定義する(定数関数を与えれば実数倍のようになります)。
まとめると
\mathcal V^*(M)\ni {\bm \omega}=\omega_\mu dx^\mu:M \ni p\mapsto {\bm \omega}_p=(\omega_\mu)_p (dx^\mu)_p\in \mathcal V^*_p(M)
\mathcal V^*_p(M)\ni {\bm \omega}_p:\mathcal V_p(M)\ni {\bm v}_p\mapsto {\bm \omega}_p({\bm v}_p)\in{\mathbb R}

多様体上のテンソル

多様体上のテンソルとは、多様体上の反変ベクトルや共変ベクトルを引数にする多重線形関数です。いま、多様体Mr個の反変ベクトル場{\bm v_1,...,\bm v_r}s個の共変ベクトル場{\bm \omega^1,...,\bm \omega^s}によって、各点p\in Mに反変ベクトル{(\bm v_1)_p,...,(\bm v_r)_p}と共変ベクトル{(\bm \omega^1)_p,...,(\bm \omega^s)_p}が与えられているとします。各点pr階反変s階共変テンソル{\bm t_p}テンソル\otimes という記法によって、次の記号で書かれる多重線形関数として定義されます。
{\bm t_p}:=(\bm v_1)_p\otimes...\otimes(\bm v_r)_p\otimes(\bm \omega^1)_p\otimes...\otimes(\bm \omega^s)_p
{\bm t_p}:\mathcal V^*_p(M)\times ...\times \mathcal V^*_p(M)\times \mathcal V_p(M)\times ... \times \mathcal V_p(M)\rightarrow {\mathbb R}
{\bm t_p}((\bm \eta^1)_p,...,(\bm \eta^r)_p),(\bm w_1)_p,...,(\bm w_s)_p):=(\bm \eta^1)_p((\bm v_1)_p)...(\bm \eta^r)_p((\bm v_r)_p)(\bm \omega^1)_p((\bm w_1)_p)...(\bm \omega^s)_p((\bm w_s)_p)
このテンソル全体が属する集合を\mathcal T_{p}\hspace{0.2pt}^r_s(M)= \displaystyle{\bigotimes^{r} \mathcal V_p(M) \bigotimes^{s} \mathcal V^*_p(M)}と書きます。点pで考えると記号が煩いので、基底は場としてから後で考えることにします。
そして、いつもと同様、和と実数倍を次のように定義することで、これはベクトル空間となります。
{\bm t_p}:=(\bm v_1)_p\otimes...\otimes(\bm v_r)_p\otimes(\bm \omega^1)_p\otimes...\otimes(\bm \omega^s)_p
{\bm u_p}:=(\bm v'_1)_p\otimes...\otimes(\bm v'_r)_p\otimes(\bm \omega'^1)_p\otimes...\otimes(\bm \omega'^s)_p
a\bm t_p + b\bm u_p \in \mathcal T_{p}\hspace{0.2pt}^r_s(M)
(a\bm t_p + b\bm u_p)((\bm \eta^1)_p,...,(\bm \eta^r)_p),(\bm w_1)_p,...,(\bm w_s)_p)
:=a(\bm \eta^1)_p((\bm v_1)_p)...(\bm \eta^r)_p((\bm v_r)_p)(\bm \omega^1)_p((\bm w_1)_p)...(\bm \omega^s)_p((\bm w_s)_p)
+b(\bm \eta^1)_p((\bm v'_1)_p)...(\bm \eta^r)_p((\bm v'_r)_p)(\bm \omega'^1)_p((\bm w_1)_p)...(\bm \omega'^s)_p((\bm w_s)_p)

多様体上のテンソル

ベクトル場と同様にして、r階反変s階共変テンソル{\bm t}が対応{\bm t}:p\mapsto {\bm t_p}として定義できます。テンソル場の和と関数倍も同様に
\bm t+\bm u:p\mapsto \bm t_p +\bm u_p
f\bm t:p\mapsto f(p)\bm t_p
として定義できます。テンソル場全体を\mathcal T^r_s(M)=\displaystyle{\bigotimes^{r} \mathcal V(M) \bigotimes^{s} \mathcal V^*(M)}と書きま。テンソル場の一部で局所座標で考えたときの基底は、次のように局所座標表示してみると
\bm v_1\otimes...\otimes\bm v_r\otimes\bm \omega^1\otimes...\otimes\bm \omega^s(\bm \eta^1,...,\bm \eta^r,\bm w_1,...,\bm w_s):=\bm \eta^1(\bm v_1)...\bm \eta^r(\bm v_r)\bm \omega^1(\bm w_1)...\bm \omega^s(\bm w_s)
=\eta^1_{\mu_1}dx^{\mu_1}\left(v_1^{\lambda_1}\frac{\partial}{\partial x^{\lambda_1}}\right)...\eta^r_{\mu_r}dx^{\mu_r}\left(v_r^{\lambda_r}\frac{\partial}{\partial x^{\lambda_r}}\right)\omega^1_{\nu_1}dx^{\nu_1}\left(w_1^{\kappa_1}\frac{\partial}{\partial x^{\kappa_1}}\right)...\omega^s_{\nu_s}dx^{\nu_s}\left(w_s^{\kappa_s}\frac{\partial}{\partial x^{\kappa_s}}\right)
=(\eta^1_{\mu_1}v_1^{\mu_1})...(\eta^r_{\mu_r}v_r^{\mu_r})(\omega^1_{\nu_1}w_1^{\nu_1})...(\omega^s_{\nu_s}w_s^{\nu_s})
=(\eta^1_{\mu_1}v_1^{\mu_1})...(\eta^r_{\mu_r}v_r^{\mu_r})(\omega^1_{\nu_1}w_1^{nu_1})...(\omega^s_{\nu_s}w_s^{\nu_s})\hspace{17em}
\frac{\partial}{\partial x^{\mu_1}}\otimes...\otimes\frac{\partial}{\partial x^{\mu_r}}\otimes dx^{\nu_1}\otimes...\otimes dx^{\nu_s}\left(dx^{\mu_1},...,dx^{\mu_r},\frac{\partial}{\partial x^{\nu_1}},...,\frac{\partial}{\partial x^{\nu_s}}\right)
=v_1^{\mu_1}...v_r^{\mu_r}\omega^1_{\nu_1}...\omega^s_{\nu_s} \frac{\partial}{\partial x^{\mu_1}}\otimes...\otimes\frac{\partial}{\partial x^{\mu_r}}\otimes dx^{\nu_1}\otimes...\otimes dx^{\nu_s}\left(\eta^1_{\mu_1}dx^{\mu_1},...,\eta^r_{\mu_r} dx^{\mu_r},w_1^{\nu_1}\frac{\partial}{\partial x^{\nu_1}},...,w_s^{\nu_s}\frac{\partial}{\partial x^{\nu_s}}\right)
のように\frac{\partial}{\partial x^{\mu_1}}\otimes...\otimes\frac{\partial}{\partial x^{\mu_r}}\otimes dx^{\nu_1}\otimes...\otimes dx^{\nu_s}が基底となります。係数v_1^{\mu_1}...v_r^{\mu_r}\omega^1_{\nu_1}...\omega^s_{\nu_s}をt^{\mu_1...\mu_r}_{\nu_1...\nu_s}とすれば
\bm t = t^{\mu_1...\mu_r}_{\nu_1...\nu_s} \frac{\partial}{\partial x^{\mu_1}}\otimes...\otimes\frac{\partial}{\partial x^{\mu_r}}\otimes dx^{\nu_1}\otimes...\otimes dx^{\nu_s}
と書けることがわかるかと思います。まとめると
\mathcal T^r_s(M)\ni {\bm t}=t^{\mu_1...\mu_r}_{\nu_1...\nu_s} \frac{\partial}{\partial x^{\mu_1}}\otimes...\otimes\frac{\partial}{\partial x^{\mu_r}}\otimes dx^{\nu_1}\otimes...\otimes dx^{\nu_s}:M \ni p]
[tex:\mapsto {\bm t}_p=(t^{\mu_1...\mu_r}_{\nu_1...\nu_s})_p \left(\frac{\partial}{\partial x^{\mu_1}}\right)_p\otimes...\otimes\left(\frac{\partial}{\partial x^{\mu_r}}\right)_p\otimes (dx^{\nu_1})_p\otimes...\otimes (dx^{\nu_s})_p\in T_p\hspace{0.2pt}^r_s(M)
T_p\hspace{0.2pt}^r_s(M)\ni {\bm t}_p:\mathcal V^*_p(M)\times ...\times \mathcal V^*_p(M)\times \mathcal V_p(M)\times ... \times \mathcal V_p(M)\ni ((\bm \eta^1)_p,...,(\bm \eta^r)_p,(\bm w_1)_p,...,(\bm w_s)_p)
\mapsto (\bm \eta^1)_p((\bm v_1)_p)...(\bm \eta^r)_p((\bm v_r)_p)(\bm \omega^1)_p((\bm w_1)_p)...(\bm \omega^s)_p((\bm w_s)_p)\in{\mathbb R}

縮約

r階反変s階共変テンソル場のi番目の反変ベクトル場とj番目共変ベクトル場をかみ合わせて(r-1)階反変(s-1)階共変テンソル場を返す操作を表す写像C^i_j:T^r_s\rightarrow T^{r-1}_{s-1}を縮約といい、次のように定義します。
C^i_j \left(\bm v_1\otimes...\otimes\bm v_r\otimes\bm \omega^1\otimes...\otimes\bm \omega^s\right)
:=\bm \omega^j (\bm v_i) \bm v_1\otimes...\otimes \bm v_{i-1}\otimes\bm v_{i+1}\otimes...\otimes\bm v_r\otimes\bm \omega^1\otimes...\otimes\bm \omega^{j-1}\otimes\bm \omega^{j+1}\otimes...\otimes\bm \omega^s
特に、1階反変1階共変テンソル場の縮約C^1_1をトレース{\rm Tr}といいます。
{\rm Tr}(\bm v\otimes \bm \omega)=\bm \omega(\bm v)\in {\mathbb R}

参考文献

松本幸夫 著 (1988) 『多様体の基礎』(基礎数学5) 東京大学出版会.

【多様体論】多様体の定義

一般相対論の舞台は時空、そして時空は多様体です。(正確に言えばローレンツ多様体です。) つまり、多様体論を学ぶことは一般相対論を学ぶ上で必須となってきます。この記事の読者の対象は一般相対論を学ぼうとしている人とします。多様体というのは簡単いえば、地図を貼り付けられる図形のようなものです。地図を貼り付けられるというのが重要で、そのことによってさまざまな性質を課すことができます。

位相空間のお気持ち

多様体位相空間のうち、地図が貼り付けられるものです。位相空間とは近さの概念をもつ集合ですが、近さの定め方はやや緩いです。まず、距離を定義した集合からいえる性質を抜き出して、距離という概念を取り払って、集合の元同士の近さや遠さという概念を、その部分集合に対して開集合という集まり方を定めることで定めることができます。これを用いることで、距離なしに連続性や極限の定義をすることができます。まずそのために距離空間から見ていきましょう。

距離空間の重要な3つの性質

まず距離空間(X,d)とは
\forall{x,y,z} \in{X},\ d:X \times X \ni (x,y)\mapsto d(x,y)\in{\mathbb R}に対して
1.d(x,y)\geq 0 \ (d(x,y)=0 \Longleftrightarrow x=y)
2.d(x,y)=d(y,x)
3.d(x,z)+d(z,y)\geq d(x,y)
が成り立つものでした(距離空間の公理)。そして、点a\in Xにおける\epsilon-近傍N_{\epsilon}(a;X)
N_{\epsilon}(a;X)=\{x\in X|d(x,a)<\epsilon\}
と定義します。ここで、Xの部分集合U\subset Xが開集合であることをUの任意の点\forall a\subset Uに対して、\epsilon \subset{\mathbb R}>0を十分に小さくとると、N_{\epsilon}(a;X)\subset Uが成り立つことと定義します。(特にUの'境界'でこれが成り立つことが閉集合との大きな違いです。) 距離をいれた空間Xにおける開集合の性質として次の3つが挙げられます。Xの開集合の集合(集合族)を\mathcal Oとして、
1.X \in \mathcal O, \varnothing \in \mathcal O
2.\forall k\in{\mathbb N}_{\leqq n},\  U_k\in \mathcal O \Longrightarrow \bigcap_{\forall k\in{\mathbb N}_{\leqq n}} U_k \in \mathcal O
3.\forall \lambda\in\Lambda,\ U_\lambda \in \mathcal O \Longrightarrow \bigcup_{\forall\lambda\in\Lambda} U_\lambda \in \mathcal O
が成り立ちます。

位相空間の定義

さきほどあげた3つの距離空間の性質として重要なことは、その主張に距離(d:X\times X \rightarrow {\mathbb R})が明示的に表れていないことです。ここでこの3つの性質を定義として、ある集合に対してその元同士の近さの概念が距離空間よりも抽象的に得られるのです。この3つだけでいいのは不思議ですが、受け入れることにします。ここで、集合Xとその部分集合族\mathcal Oについて、\mathcal OXの位相で、(X,\mathcal O)位相空間であるとは、次の3つの条件が成り立つことこととします。
1.X \in \mathcal O, \varnothing \in \mathcal O
2.\forall k\in{\mathbb N}_{\leqq n},\  U_k\in \mathcal O \Longrightarrow \bigcap_{\forall k\in{\mathbb N}_{\leqq n}} U_k \in \mathcal O
3.\forall \lambda\in\Lambda,\ U_\lambda \in \mathcal O \Longrightarrow \bigcup_{\forall\lambda\in\Lambda} U_\lambda \in \mathcal O
\mathcal Oは開集合系ともいい、\forall U \in \mathcal OXの開集合Uといいます。(この補集合として閉集合が定義されます。) 要するに、予め開集合であるもの(開集合のあつまり)を\mathcal Oとして定義しているということになります。それらが、距離空間で現れた開集合の性質を満たしているという前提で。

ハウスドルフ空間

ハウスドルフの公理とは、位相空間(X,O)の任意の異なる2点p,q\in Xに対して、それぞれを含むU\cap V=\varnothing となるような開集合U,Vがあることです。ハウスドルフの公理を満たす位相空間ハウスドルフ空間といいます。位相空間は一般にはハウスドルフ空間ではないです。ハウスドルフ空間は、開集合という近さの指標をもってして2点をしっかりと区別することができるという性質を持っているのです。

連続写像

位相空間には開集合をもってして近さを議論することができ、連続性を定義することができます。位相空間(X,\mathcal O_X),(Y,\mathcal O_Y)の間の写像f:X \rightarrow Yがあるとします。f連続写像であるとは、\forall U \in \mathcal O_Yに対して、f^{-1}(U) \in \mathcal O_Xが成り立つことです。なぜこれで連続写像と言えるかというと、\epsilon-\delta的に定めた連続写像の概念と一致するからです。これは位相のテキスト等に譲ることとします。f同相写像であるとは、f全単射で、ff^{-1}連続写像であることです。X,Yの間に同相写像があるとき、XYは位相同形であるといい、X\approx Yと表します。

多様体のお気持ち

多様体とは、まあまあいい性質をもった図形のことで、外在的には十分次元の大きいユークリッド空間に図形を置いて、その図形の上で動くことを扱いますが、これを外在的なユークリッド空間の存在なしに内在的に議論を進めることができます。しかし、この図形が曲がっていると従来のように関数の微分積分を考えたり、ベクトルを扱ったりすることができなくなるため、さまざまな工夫が必要となってきます。

局所座標

位相空間(M,\mathcal O)の開集合Uからm次元数空間\mathbb R^mのある開集合U'への同相写像\phi : U\rightarrow U'があるとき、(U,\phi )m次元座標近傍といい、\phi を局所座標系といいます。

位相多様体

位相空間(M,\mathcal O)m次元位相多様体であるとは、
1.(M,\mathcal O)がハウスドルフ位相空間である
2.Mの任意の点に対するm次元座標近傍が存在して、これにMが被覆される
2.は、すなわち、座標近傍の族(座標近傍系またはアトラス)\mathcal S=\{(U_\alpha,\phi_\alpha)\}_{\alpha\in A}があり、M=\bigcup_{\alpha \in A}U_\alpha となることです。
今後位相多様体であるような位相空間(M,\mathcal O)を単に(M,\mathcal S)さらには単にMと表し、暗に適当な位相や座標近傍系が入っているものとします。

微分可能多様体

位相多様体MC^r微分可能様体(C^r微分可能多様体またはC^r級可微分多様体または単にC^r多様体)であるとは、
U_\alpha \cap U_\beta\not=\varnothingであるような\forall\alpha ,\beta\in Aについて、
\phi_\beta\circ\phi_\alpha^{-1}:\phi_\alpha(U_\alpha\cap U_\beta)\rightarrow\phi_\beta(U_\alpha\cap U_\beta)
という座標変換がC^r写像であることです。
Mの相異なるC^r級座標近傍系\mathcal S\mathcal Tがあり、\mathcal S\mathcal Tについて、\mathcal S \cup \mathcal TM上のC^r級座標近傍系になるとき、\mathcal S\mathcal Tは同値であるといいます。また、同値なC^r級座標近傍系\mathcal S\mathcal Tに対して、C^r多様体(M,\mathcal S)(M,\mathcal T)は同一であるといいます。また、C^r級座標近傍系\mathcal Sと同値であるような任意のC^r級座標近傍系(\mathcal T,\mathcal U,\mathcal V,...)との和集合を\mathcal M=\mathcal M(\mathcal S)=\mathcal S \cup \mathcal T \cup \mathcal U \cup \mathcal V \cup ...\mathcal Sから定まるMの極大座標近傍系\mathcal Mといい、\mathcal M(\mathcal S)\mathcal Sから定まるMC^r微分構造といい、\mathcal S\mathcal Mに従属するといいます。

参考文献

松本幸夫(1988)『多様体の基礎』(基礎数学5)東京大学出版会.

【一般相対性理論】アインシュタイン方程式の線形化

アインシュタイン方程式は平坦なミンコフスキー時空からのずれとして1次の精度で書きあらわすことができます。こうすることで、そのままではかなり複雑なアインシュタインの重力理論を摂動的に捉え、定性的な議論をすることができます。

線形化

アインシュタイン方程式(宇宙項なし)は*1

\displaystyle R_{\mu\nu}-\frac{1}{2}Rg_{\mu\nu}=\frac{8\pi G}{c^4}T_{\mu\nu}

で、重力場h_{\mu\nu}=g_{\mu\nu}-\eta_{\mu\nu}とします((ここで微分幾何的な見方を捨てていると思います。)。 h_{\mu\nu}の1次の精度でアインシュタイン方程式を記述していきます。

\displaystyle h^{\mu\nu}=g^{\mu\nu}+\eta^{\mu\nu}

とすることにより、h_{\mu\nu}の添え字の上げ下げは1次の精度の範囲では\eta_{\mu\nu}, \eta^{\mu\nu}で行うことができます。また、以降、 h:=h^\mu_\mu, (\partial h)_\mu=\partial_\nu h^\nu_\mu, \partial\partial h=\partial_\mu \partial_\nu h^{\mu\nu}という略記を用います。線形化は、まずレビ-チビタ接続の線形化から行ってみます。2次以上の項はどんどん落としていき、いちいち\approxで結ばず、等号で結ぶこととします。

\displaystyle 2\Gamma^\mu_{\nu\lambda}=g^{\mu\kappa}(\partial_\nu g_{\lambda\kappa}+\partial_\lambda g_{\nu\kappa}-\partial_\kappa g_{\nu\lambda})
\displaystyle =\eta^{\mu\kappa}(\partial_\nu h_{\lambda\kappa}+\partial_\lambda h_{\nu\kappa}-\partial_\kappa h_{\nu\lambda})
\displaystyle =\partial_\nu h^\mu_\lambda+\partial_\lambda h^\mu_\nu-\partial^\mu h_{\nu\lambda}

\displaystyle 2\partial_\mu \Gamma^\mu_{\nu\lambda}=\partial_\nu \partial_\mu h^\mu_\lambda+\partial_\lambda \partial_\mu h^\mu_\nu- \partial_\mu\partial^\mu h_{\nu\lambda}
\displaystyle =\partial_\nu (\partial h)_\lambda+\partial_\lambda(\partial h)_\nu-\Box h_{\nu\lambda}

\displaystyle 2\partial_\mu \Gamma^\lambda_{\nu\lambda}=\partial_\nu \partial_\mu h^\lambda_\lambda+\partial_\lambda \partial_\mu h^\lambda_\nu- \partial_\mu\partial^\lambda h_{\nu\lambda}
\displaystyle =\partial_\nu \partial_\mu h+\partial_\mu (\partial h)_\nu- \partial_\mu (\partial h)_\nu
\displaystyle =\partial_\mu \partial_\nu h

\displaystyle 2R_{\mu\nu}=\partial_\lambda 2\Gamma^\lambda_{\mu\nu}-\partial_\nu 2\Gamma^\lambda_{\mu\lambda}
\displaystyle =\partial_\mu (\partial h)_\nu+\partial_\nu(\partial h)_\mu-\Box h_{\mu\nu}-\partial_\mu \partial_\nu h

ここで、X_{\mu}:=(\partial h)_\mu -\frac{1}{2}\partial_\mu hとします。

\displaystyle 2R_{\mu\nu}=-\Box h_{\mu\nu}+\partial_\mu X_\nu +\partial_\mu X_\mu
\displaystyle =-\Box h_{\mu\nu}+2\partial_{(\mu}X_{\nu)}

\displaystyle 2R=2R^\mu_\mu
\displaystyle =\partial^\mu (\partial h)_\mu+\partial_\mu(\partial h)^\mu-\Box h^\mu_\mu-\partial^\mu \partial_\mu h
\displaystyle =2\partial\partial h-2\Box h

\displaystyle R_{\mu\nu}-\frac{1}{2}Rg_{\mu\nu}=-\frac{1}{2}\Box h_{\mu\nu}+\partial_{(\mu}X_{\nu)}-\frac{1}{2}(\partial\partial h-\Box h)\eta_{\mu\nu}

したがって、線形化アインシュタイン方程式は、

\displaystyle -\frac{1}{2}\Box h_{\mu\nu}+\frac{1}{2}\partial_\mu(\partial h)_\nu +\frac{1}{2}\partial_\nu(\partial h)_\mu-\frac{1}{2}\partial_\mu \partial_\nu h -\frac{1}{2}(\partial\partial h-\Box h)\eta_{\mu\nu}=\frac{8\pi G}{c^4} T_{\mu\nu}

となります。

ゲージ固定

上の(一般的な)線形化アインシュタイン方程式はやや項が多く煩わしいので、ゲージ固定をすることを考えてみます、つまりある特別は座標系をとるということです。一般相対性原理(一般共変性)より、一般座標変換x^\mu\rightarrow x'^\mu = x^\mu +\epsilon^\muにより、重力場

\displaystyle \delta h_{\mu\nu}=-\partial_\mu \epsilon_\nu -\partial_\nu \epsilon_\mu

というゲージ変換を受けます。もちろん変換を受けても重力理論は不変です。このゲージ変換の4つの自由度を用いて、

\displaystyle X_\mu=0

の4条件を課してローレンス-ゲージ固定します。このゲージ固定の下で、再び\delta X_\mu=0を満たす座標変換をしてみます。すなわち

\displaystyle \delta X_{\mu}:=(\partial \delta h)_\mu -\frac{1}{2}\partial_\mu \delta h
\displaystyle =-\partial^\nu(\partial_\mu \epsilon_\nu +\partial_\nu \epsilon_\mu)-\frac{1}{2}\partial_\mu(-2\partial \epsilon)
\displaystyle =-\partial_\mu(\partial \epsilon) -\Box \epsilon_\mu+\partial_\mu(\partial \epsilon)
\displaystyle =-\Box \epsilon_\mu=0

\Box \epsilon_\mu=0を満たす変換で、ローレンス-ゲージ固定を崩さないです。このような4つの自由度を用いて、さらに4条件

\displaystyle h_{0i}=0,\ h=0

を課ります。そうすると、ローレンス-ゲージ固定の条件式からただちに、(\partial h)_\mu=0がいえて、\partial\partial h=0もいえるので、このゲージ固定の下で線形化アインシュタイン方程式は、

\displaystyle -\frac{1}{2}\Box h_{\mu\nu}=\frac{8\pi G}{c^4} T_{\mu\nu}

とすることができます。このうち、解に

\displaystyle \Box h_{\mu\nu}=0

を満たすものを加えたものもまた解になります。これを解いてみると、フーリエ分解で、

\displaystyle h_{\mu\nu} = \int \frac{d^3\boldsymbol k}{\sqrt{(2\pi)^3 2k^0}}\sum_{\lambda=0}^3 \left(a(\boldsymbol k,\lambda 
)\epsilon_{\mu\nu} (\boldsymbol k,\lambda 
)e^{ikx}+a^{*}(\boldsymbol k,\lambda 
)\epsilon_{\mu\nu}^*(\boldsymbol k,\lambda)e^{-ikx}\right)

となりますね。ゲージ固定をして、10の自由度を2\times 4用いたので、解の自由度は10-8=2です。

*1:アインシュタイン方程式は変分原理から導くことができます。こちらの記事を参照してください。fumofumobun.hatenablog.jp

【波動】波動方程式の導出

1次元波動方程式の導出をニュートン力学から導きます。(大学のレポートの問題にあって、そのコピペになります。)

方針

まず、下の図のような N個の質点を糸で繋ぐモデルを考えます。 i(i=0,\cdots, N-1)でラベリングされ、いずれも質量mとします。すべての質点はy方向への運動が許され、x方向への運動はしないものとし、ラベルiの質点の位置を(x_i(t),y_i(t))とします。 各質点間のx方向の距離はdすなわち、x_i(t)=idとします。 すなわち、考えるべきは各質点のy_i(t)の時間発展をy方向の1次元のニュートン力学運動方程式で調べることです。 また最後には連続的な弦とみなせるような極限を考えます。

f:id:fumofumobun:20200109112702p:plain

質点を繋げたモデルの運動方程式

上の図のように両方向の糸から張力Tを受けているとすると、ニュートン運動方程式

\displaystyle m\ddot y_i=T\sin\theta_i -T\sin\theta_{i-1}

です。質点のy方向への運動が微小だとして\theta_iについて線形近似を行うと、

\displaystyle m\ddot y_i\approx T(\tan\theta_i -\tan\theta_{i-1})
\displaystyle=T\left(\frac{y_{i+1}-y_i}{d}-\frac{y_i-y_{i-1}}{d}\right)
\displaystyle=\frac{T}{d}\left(y_{i+1}-2y_i-y_{i-1}\right)

となります。

連続極限

質点ではありますが、 y_i(t)=u(x_i,t)のようにして場の考え方に近づけます。y_i(t)iでラベルされたx_i上にある時刻tでの質点のy座標という意味ですが、u(x_i,t)は位置x_i, 時刻tにおけるスカラー値であり、質点の位置である変数x_iが時刻と同じくパラメータx_iに格下げされたということになります。そしてこの置き換えをしたうえで、N\rightarrow\infty, d\rightarrow 0Nd(弦の全長)やm/d:\sigma(線密度)が有限となるような極限をとります。そうすると、運動方程式の左辺は、

\displaystyle m\ddot y_i(t)=m\frac{\partial^2 u}{\partial t^2}(x_i,t)

右辺は、

\displaystyle \frac{T}{d}\left(y_{i+1}-2y_i-y_{i-1}\right)
\displaystyle =\frac{T}{d}(u(x_{i+1},t)-2u(x_i,t)+u(x_i,t))
\displaystyle=\frac{T}{d}(u(id+d,t)-2u(id,t)+u(id-d,t))
\displaystyle=\frac{T}{d}\left(u(id,t)+\frac{\partial u}{\partial x}(id,t)d+\frac{1}{2}\frac{\partial^2 u}{\partial x^2}(id,t)d^2-2u(id,t)\right.
\displaystyle \hspace{3em}\left.+u(id,t)+\frac{\partial u}{\partial x}(id,t)(-d)+\frac{1}{2}\frac{\partial^2 u}{\partial x^2}(id,t)(-d)^2+\mathcal O(d^3)\right)
\displaystyle=Td \frac{\partial^2 u}{\partial x^2}(id,t)+\mathcal O(d^2)
\displaystyle=Td \frac{\partial^2 u}{\partial x^2}(x_i,t)+\mathcal O(d^2)

なので、

\displaystyle\frac{\partial^2 u}{\partial t^2}(x_i,t)
\displaystyle =\frac{T}{m/d} \frac{\partial^2 u}{\partial x^2}(x_i,t)+\mathcal O(d^2/m)
\displaystyle=\frac{T}{\sigma} \frac{\partial^2 u}{\partial x^2}(x_i,t)+\mathcal O(d)

よって、上で述べた極限では運動方程式

\displaystyle\frac{\partial^2 u}{\partial t^2}(x,t)=\frac{T}{\sigma} \frac{\partial^2 u}{\partial x^2}(x,t)=:v^2\frac{\partial^2 u}{\partial x^2}(x,t)

となります。これが導きたかった弦の1次元波動方程式になります。

【微分幾何】形作用素の導入

2020年、あけましておめでとうございます。新年になったので、リーマン幾何であらわれる形作用素というものを解説したいと思います。

ガウスの公式

{\rm dim}\ M =n多様体ユークリッド空間へのはめこみf:M\rightarrow \mathbb R^{n+1}があるとします。リーマン計量は、ユークリッド空間の標準内積\lt ,\gtとして、各点で

g_p(X_p,Y_p):=\left\lt(df)_p  (X_p), (df)_p (Y_p)\right\gt

のように誘導します。\mathfrak{X}(M)Mのベクトル場全体で、\mathfrak{X}_ffに沿う\mathbb R^{n+1}のベクトル場、D\mathbb R^{n+1}の標準の線形接続とし、D: \mathfrak{X}(M)\times \mathfrak{X}_f\rightarrow \mathfrak{X}_fによって、単位法ベクトル場nとして

 D_X df(Y)=df(\nabla_X Y)+h(X,Y)n

Mに直交する成分と接する成分に分解できます。hが第2基本形式です。この式で\nabla_X Yを誘導しています。またこれをガウスの公式といいます。そして、実はこのようにして誘導した\nablaはさきほど誘導したリーマン計量gに対するレビ-チビタ(リーマン)接続になっています*1

ワインガルテンの公式

単位法ベクトル場は\left\lt n,n\right\gt=1, \left\lt D_X n,n\right\gt=0を満たすので、あるY\in T(M)が存在して、

D_X n=df(Y)

となります。YXにより定まるため、X\rightarrow Y:=-AXと書くことにすると、

D_X n=-df(AX)

となり、これをワインガルテンの公式といいます。ではなぜAXという記号を導入したかというと、Aを作用としてみると、写像D_{\cdot} n:X\mapsto D_X nが線形写像であることから合成写像df\circ A:X\mapsto -df(AX)が線形写像であることがわかり、写像df:AX \mapsto -df(AX)が線形写像であることとからA:X\mapsto AXが線形写像としてみなせるからです。A:T(M)\rightarrow T(M)すなわちA\in T(M)\otimes T^*(M)です。この混合2階テンソルAを形作用素といいます。単位法線ベクトル場の微分を考え、\mathbb R^{n+1}の中のMという曲面の曲がり具合を表すものと捉えることができ、\mathbb R^{n+1}の中でのMの「形をつくっている」ことから形作用素といいます。この形作用素の性質やこれを考えることで何が嬉しいのかということはまた次回の記事にしたいと思います。

*1:Dの性質などを用いることにより示すことができます。

【力学】幾何的なニュートン力学

ニュートン力学での運動方程式といえば

\displaystyle m\frac{d^2 x^i}{dt^2}=f^i

を想起すると思います。ではこの運動方程式が使える条件は述べられるでしょうか。非相対論的、古典的はもちろんですが、デカルト座標の慣性系ですね。これを幾何的な視点からみると見通しがよくなります*1。もちろん、ラグランジアンを用いた解析力学的なやり方でもいいわけです。この記事で行うことは、そのラグランジュ運動方程式をさらにもう一段階計算を進めることに値します。

リーマン幾何学

ニュートン力学の舞台である3次元ユークリッド空間に、リーマン幾何学を用いれば、一般座標では次の方程式を用いればよいことがわかると思います(リーマン幾何の解説まではこの記事でしません)。

\displaystyle m\left(\frac{d^2 x^i}{dt^2}+\Gamma^i_{jk} \frac{dx^j}{dt}\frac{dx^k}{dt}\right)=f^i\left(=-g^{ij}\frac{\partial U}{\partial x^j}\right)

 

極座標

例をみるにはまず極座標系ですよね。極座標系では

g_{ij}={\rm diag}(1,r^2,r^2\sin^2\theta)

ですから、ここから接続係数を頑張って計算します。コツとしては(\Gamma^r_{ij})などが対称行列であることを用いるとわかりやすく、ミスが減ると思います。結果を記すと、

\displaystyle (\Gamma^r_{ij}) = \left(\begin{array}{ccc}0 & 0 & 0 \\0 & -r & 0\\0 & 0 & -r\sin^2\theta\end{array}\right)

\displaystyle (\Gamma^\theta_{ij}) = \left(\begin{array}{ccc}0 & \frac{1}{r} & 0 \\ \frac{1}{r} & 0 & 0\\0 & 0 & -\sin\theta\cos\theta\end{array}\right)

\displaystyle (\Gamma^\phi_{ij}) = \left(\begin{array}{ccc}0 & 0 & \frac{1}{r} \\0 & 0 & \frac{1}{\tan\theta}\\\frac{1}{r} & \frac{1}{\tan\theta} & 0\end{array}\right)

このあとは行列(\dot{x^i} \dot{x^j})を右からかけてトレースをとれば、極座標系特有の項がでます。

\displaystyle \Gamma^r_{ij}\dot{x^i} \dot{x^j}=-r\dot{\theta}^2-r\sin^2\theta\dot{\phi}^2

\displaystyle \Gamma^\theta_{ij}\dot{x^i} \dot{x^j}=\frac{2}{r}\dot{r}\dot{\theta}-\sin\theta\cos\theta\dot{\phi}^2

\displaystyle \Gamma^\phi_{ij}\dot{x^i} \dot{x^j}=\frac{2}{r}\dot{r}\dot{\phi}+\frac{2}{\tan\theta}\dot{\theta}\dot{\phi}

よって、運動方程式は、

\displaystyle m\left(\ddot{r}-r\dot{\theta}^2-r\sin^2\theta\dot{\phi}^2\right)=f^r\left(=-\frac{\partial U}{\partial r}\right)

\displaystyle m\left(\ddot{\theta}+\frac{2}{r}\dot{r}\dot{\theta}-\sin\theta\cos\theta\dot{\phi}^2\right)=f^\theta\left(=-\frac{1}{r^2}\frac{\partial U}{\partial \theta}\right)

\displaystyle m\left(\ddot{\phi}+\frac{2}{r}\dot{r}\dot{\phi}+\frac{2}{\tan\theta}\dot{\theta}\dot{\phi}\right)=f^\phi\left(=-\frac{1}{r^2\sin^2\theta}\frac{\partial U}{\partial \phi}\right)

となります。ラグランジアンから求める方法は、その座標系でのラグランジアンを求める大変さがあり、今回のリーマン幾何から求める方法は、計量と接続を求める大変さがありますね。

このような話は一般相対性理論でお目にかかる...ということが殆どだと思います。しかし、一般相対論のテキストで紙面を多く使って解説されていることというのは一般相対論特有の話ではなく、ニュートン力学でさえあった話なのです。ニュートン力学の時点で既に、座標変換のエッセンスはつまっているのです。基礎といわれる力学や線形代数学が大事な理由ですね。

【特殊相対性理論】加速に対する勘違いから一般相対性理論へ

特殊相対性理論は歪みのないミンコフスキー時空間で物理を考えます。そしてこれを拡張した一般相対性理論では歪みのあり得る時空間で物理を考えます。やや混同されがちな特殊相対論と一般相対論の違いをここで明確にしていきたいと思います。

 

 

加速運動と加速系

まず、勘違いされがちなのが「特殊相対論では加速運動が扱えない」というものがあります。はっきり言っておくと、特殊相対論では加速運動を扱えます。特殊相対論で行っていることは、 加速運動する人からみた(加速系/非慣性系)物理を考えることまではしていませんが、静止あるいは等速直線運動する人からみた(慣性系)物理を考えることをしています。慣性系から加速運動は扱っているのです。慣性系から加速運動をみて、その加速運動している方へ乗り移るということを扱っていないだけなのです。慣性系から慣性系への変換がローレンツ変換で、慣性系から非慣性系へ...いや慣性系または非慣性系のいずれかから慣性系または非慣性系への変換が一般座標変換です。

 

そして、別に特殊相対論でも一般座標変換は扱うことはできます。ただ、特殊相対論の主張としては、そのような変換をすると運動方程式が変わってしまうというだけなのです。慣性系での運動方程式

\displaystyle m\frac{d^2x^\mu}{d\tau^2}=f^\mu

は慣性系同士なら乗り移りまくっても、形が変わらない、

\displaystyle m\frac{d^2x'^\mu}{d\tau^2}=f'^\mu

となるということです。この運動方程式から加速運動を扱っているというのは明白ですね。そして、この運動方程式が成り立っている慣性系からみて加速運動をしている物体へ乗り移り、非慣性系から運動を記述する運動方程式はというと...

\displaystyle m\frac{d^2x'^\mu}{d\tau^2}=f'^\mu-m\Gamma^\mu_{\nu\lambda}\frac{dx'^\nu}{d\tau}\frac{dx'^\lambda}{d\tau}

となるのです(たしか)。なんだか見覚えのある項が右側に余分にきています、これが非慣性系であることからくる慣性力です。このエッセンスはニュートン力学にありますよね(基礎が大事ってこういうことですね)。

 

このように、方程式の形が変わってしまうのが見苦しいから特殊相対論では特殊相対性原理として「ローレンツ変換で結ばれる慣性系の間で物理法則が不変な形である」という原理にしているわけです。ニュートン力学ではガリレイの相対性原理「ガリレイ変換で結ばれる慣性系の間での物理法則が不変な形である」といっているだけです。ですから、原理としてはそうなんですが、高校物理等で散々やったように、非慣性系も扱うことはできて、しかし、ガリレイの相対性原理や特殊相対性原理が保証しないように、運動方程式の形が変わって、慣性力が表れて汚くなってしまうというだけのことなのです。

 

一般相対性理論

一方、一般相対性理論ではさらに原理を強い主張にしてしまいます。しかし、原理が複数あって、これらが根本的に別種のことであって、分離して考えなくてはいけないと思います。一般相対論という理論のなかに別種のものを入れてしまったがために、勘違いが起きやすくなっている原因のひとつになっていることかと思います。

 

原理の一つ目は、一般相対性原理「任意の座標系、慣性系に限らず非慣性系までも含め、物理法則が不変な形である」というものになります。さきほどの特殊相対論から考えるととても簡単なことです。さきほどの方程式

\displaystyle m\left(\frac{d^2x^\mu}{d\tau^2}+\Gamma^\mu_{\nu\lambda}\frac{dx^\nu}{d\tau}\frac{dx^\lambda}{d\tau}\right)=f^\mu

が変わらない、と言っているだけです(\Gamma^\mu_{\nu\lambda}まではここでは解説せず、既知とします)。\Gamma^\mu_{\nu\lambda}がゼロのような真っすぐな、まさに特殊な座標系すなわち慣性系だけの運動方程式の形を保証していたのが特殊相対性原理、もっと一般に保証してくれるのが一般相対性原理です。このように考えると、非相対論から相対論、古典論から相対論などのように、別に物理観自体が変わっているというわけではないですよね。

 

では他の原理はというと時空を歪める重力に関する言及です。しかし、今の話に時空の歪みというのは考えません。というか、上のことに、重力という力の見方をガラっと変えて、付け足すというか時空という対象物を変化させるものです。ですから個人的には「特殊相対性理論」「一般相対性理論」「重力理論」と段階を踏んで、一般相対性理論を分割してしまったほうがよかったのではないかと個人的に思っています。