ぶちゅり

日々学んだ物理学に関することをメモしていきます。コメントでのご指摘お願いします。

【微分幾何】主ファイバー束

ゲージ理論は数学的にはファイバー束の言葉で記述されます。今回は主ファイバー束の定義をしていきます。

主ファイバー束の定義

M上のG-主ファイバー束Pとは、まず、M,PC^\infty微分可能多様体であり、Gがリー群
fumofumobun.hatenablog.jp
で、以下の条件を満たすことをいいます。Mは底空間、Gは構造群、Pは主ファイバー束といいます。底空間と構造群を明記してP(M,G)と書くこともあります。

1. 射影\pi :P\rightarrow Mが存在する。

2. GPに自由に右から作用し、その作用を施しても、射影したものは変わらない。

3. 局所自明性がある。

これら3つの条件です。これではわからないと思うのでひとつずつ解説していきます。

射影

射影\pi :P\rightarrow M全射です。全射であればとりあえずはいいです。

構造群の作用

右からの作用は次のようにかけます。
(u,a)\in P\times G\rightarrow ua\in P
射影しても変わらないというのは次のことを意味しています。
\pi(ua)=\pi(u)
自由に作用というのは、
ua=u
となるようなa単位元e\in Gだけであるということです。
f:id:fumofumobun:20200319181157j:plain

局所自明性

定義をパッと見た時にP=M\times G(積多様体)を連想したかと思いますが、局所自明性というのは局所的にはこのような自明なものになっているということです。つまり、各点x\in Mに対して近傍U\ni xがあり、少なくとも\pi^{-1}(U)\subset PU\times Gに対応させられるということです。そのような対応を微分同相写像\psi_U:\pi^{-1}(U)\rightarrow U\times Gとしておきます。\psi_U(u)\in U\times Gですから、Uのほうは\pi(u)でよいと思います。Gのほうを、C^\infty写像\phi_U:\pi^{-1}(U)\rightarrow Gによって\phi_U(u)として表せるとしましょう。
\psi_U(u)=(\pi_U(u),\phi_U(u))
です。\phi_U\phi_U(ua)=\phi_U(u)aを満たしておくとよいでしょう。図をみるとわかりやすいかとおもいます。
f:id:fumofumobun:20200319181209j:plain

参考文献

茂木勇・伊藤光弘 著「復刊 微分幾何学ゲージ理論」2001 共立出版株式会社

【微分幾何】リー群とリー代数(編集中)

リー群は様々なところで耳にします。今回の記事では、ゲージ理論の数学的定式化に向けて、リー群周りのことについて簡単にまとめていきます。

リー群の定義

GC^\infty級可微分多様体としての構造をもち、群演算G×G \rightarrow G ; (g,h) \mapsto ghG \rightarrow G ; g \mapsto g^{-1}多様体間の写像としてC^\infty写像であるとき、Gをリー群といいます。

左移動と右移動

写像L_g : G \rightarrow G ; h \mapsto L_gh=ghを左移動、R_g : G \rightarrow G ; h \mapsto R_gh=hgを右移動といいます。左(右)移動はC^\infty微分同相写像(L_g^{-1}(R_g^{-1}が存在して、Lg,L_g^{-1}(R_g, R_g^{-1}C^\infty級)です。以降、特に左移動について見ていきますが、右移動についても同様です。

左不変ベクトル場

L_gG単位元eにおける微分L_{g*e}:T_eG \rightarrow T_{L_ge}G=T_gGから、eでのある接ベクトルXに対して各点gでの接ベクトル\bar{X}_g := L_{g*e}(X)を定めることができます。これによりできるベクトル場\bar{X}:g \mapsto \bar{X}Xにより定まる左不変ベクトル場といいます。

【一般相対性理論】一般相対性理論を数学的に簡潔に述べると

一般相対性理論微分幾何学の理論で、割と数学的に綺麗に述べることができます。以下では簡潔に基礎方程式を得るまでを数学的に述べたいと思います。

Einstein方程式を得るまで

D次元時空(一般相対性理論ではD=4)は、向き付けられたC^\infty級[D次元ローレンツ多様体[\mathcal Mであり、擬Riemann計量がaffine接続\nablaと両立し、接続係数\Gamma^{\lambda}_{\mu\nu}がLevi-Civita接続\{\lambda,\mu\nu\}(Christoffelの記号)で、torsionは0だと考えます。この\mathcal M上の擬Riemann計量全体\mathcal R_{\mathcal M}g\in \mathcal R_{\mathcal M}から定まる逆計量テンソルg^{-1}=g^{\mu\nu}\partial_\mu\otimes \partial_\nu、Riemann曲率テンソルRie(g)=R^\mu_{\nu\lambda\kappa}\partial_\mu\otimes dx^\nu\otimes dx^\lambda\otimes dx^\kappa、Ricci曲率テンソルRic(g)=R^\lambda_{\mu\lambda\nu} dx^\mu\otimes dx^\nu=:R_{\mu\nu} dx^\mu\otimes dx^\nu、曲率スカラーR(g)=g^{\mu\nu}R_{\mu\nu}、体積要素dV(g)=\sqrt{|\det(g_{\mu\nu})|}dx^0\wedge\cdots\wedge dx^{D-1}とするときに、次の汎関数

\displaystyle S : \mathcal R_{\mathcal M}\ni g\mapsto S[g]:=\frac{1}{16\pi}\int_{\mathcal M} R(g) dV\in \mathbb R

をEinstein-Hillbert作用といいます。光速c=1万有引力定数G=1とします。物質場\mathcal L_{\rm mat}(g)と定数\Lambdaを加えた作用

\displaystyle S[g]:=\int_{\mathcal M} \left(\frac{1}{16\pi}(R(g)-2\Lambda)+\mathcal L_{\rm mat}(g)\right)dV

gに対する第一変分の方程式として、(\partial \mathcal M上の積分は落として、*1Einstein方程式
\displaystyle Ric(g)-\frac{1}{2}R(g)g+\Lambda g=8\pi T(g)
を得ます。ただし、T(g)=T_{\mu\nu}dx^\mu\otimes dx^\nu
\displaystyle T^{\mu\nu}=\frac{\delta\mathcal L_{\rm mat}}{\delta g_{\mu\nu}}+\frac{1}{2}\mathcal L_{\rm mat}g^{\mu\nu}
です。Einstein方程式を満たすgをEinstein計量、(\mathcal M, g)をEinstein空間といいます。

*1:厳密にはGibbons-Hawking-York項が必要です。https://fumofumobun.hatenablog.jp/entry/2019/12/05/015826

【一般相対性理論】ゲージ場としての重力場(概説)

電磁場などはゲージ場であることは有名であるかと思います。ゲージ理論とは、ある種の変換、ゲージ変換に対する作用の不変性を原理におく物理理論です。このゲージ理論を一般化した一般ゲージ理論では、重力場も(一般)ゲージ場として捉えることができます(内山龍雄による)。ここではその概要を述べていきます。

重力場を得るためのゲージ変換

重力場を得るときに特に他と違って特別な点というのが、ゲージ変換が座標の変換によってもたらされることです。これを一般ゲージ変換ということにします。一般ゲージ変換は、
\displaystyle x^\mu\rightarrow x'^\mu(x)
という座標変換によって、諸量が変分を受けます。電磁場の場合は場の位相変換、つまりe^{i\theta}不定性を利用したゲージ変換でしたが、重力場の場合は、どのような座標系をとっても、真な物理法則は変わらないという不定性を利用したゲージ変換ということになります。

大域的一般ゲージ変換

まず、大域的ゲージ変換としてローレンツ変換に対して作用が不変、いえ、これをより一般化して線形変換
x^\mu\rightarrow x'^\mu=a^\mu_\nu x^\nu=x^\mu+\epsilon^\mu_\nu x^\nu+\mathcal O(\epsilon^2)
を考えます。\epsilonは微小パラメータです。(a^\mu_\nu)正則行列、すなわち\det(a^\mu_\nu)\not=0だけを課しておきます。この要請は、座標系を移りあうとき、もとの座標系に戻ったときに物理が変わってしまうとおかしいという物理的な要請に対応しているかと思います。

ラグランジアン密度は、変換x^\mu\rightarrow x'^\mu=x^\mu+\epsilon^\mu_\nu x^\nu+\mathcal O(\epsilon^2)に対してテンソル成分として振る舞う場の集まり\phi_A(x)(A=0,\cdots,N-1)により、\mathcal L(\phi_A,\partial_\mu \phi_A,g_{\mu\nu})であるとします。つまり、作用I
\displaystyle I=\int \mathcal L(\phi_A,\partial_\mu \phi_A,g_{\mu\nu})\sqrt{-g}d^4x
で、これが大域的な線形座標変換に対して不変になっています。g_{\mu\nu}は計量テンソルで、大域的な変換を考えているので時空全体で一定値を取ります。この変換のうち特殊なものとして、ローレンツ変換があり、この場合、g_{\mu\nu}=\eta_{\mu\nu}={\rm diag}(-1,+1,+1,+1)となります。

そして、\epsilonを微小パラメータとして1次の精度で展開した座標変換による諸量の第一変分を計算していき、作用の変分を考えます。今回は概説ということで一般ゲージ変換の場合に特徴的な例をいくらか載せるだけにとどめておきます(僕自身、まだ計算が追えきれていないというのと、いまレポートとテストに追われているという理由があります...)。\displaystyle \boldsymbol G^\mu_\nuを変換x^\mu\rightarrow x'^\mu=x^\mu+\epsilon^\mu_\nu x^\nuによる生成子のN次表現行列とします、つまり、\boldsymbol G^\mu_\nu=((\boldsymbol G^\mu_\nu)_A^B)です。\phiN次縦ベクトルとみなします、つまり、\phi=(\phi_A)です。
\displaystyle \delta\phi_A:=\epsilon^\nu_\mu (\boldsymbol G^\mu_\nu)_A^B \phi_B=\epsilon^\nu_\mu(\boldsymbol G^\mu_\nu\phi)_A
\displaystyle \delta \partial_\mu =-\epsilon^\nu_\mu\partial_\nu
という関係があって、
\delta (\partial_\mu\phi_A)=\partial'_\mu\phi'_A-\partial_\mu \phi_A
=(\partial_\mu+\delta\partial_\mu)(\phi_A+\delta\phi_A)-\partial_\mu\phi_A
=\partial_\mu(\delta\phi_A)+(\delta\partial_\mu)\phi_A
=\epsilon^\nu_\mu(\boldsymbol G^\mu_\nu \partial_\mu\phi)_A-\epsilon^\nu_\mu\partial_\nu\phi_A
と、例えばこんなふうに変分と微分が可換でなくなって、形式的にライプニッツ則が成り立ちます。このような点が一般ゲージ変換での特徴となっています。
このような一般ゲージ変換のもと、作用は不変になっています。つまり、
\displaystyle \frac{\partial \mathcal L \sqrt{-g}}{\partial \phi_A}(\boldsymbol G^\mu_\nu \phi)_A +\frac{\partial \mathcal L \sqrt{-g}}{\partial \partial_\mu\phi_A}(\boldsymbol G^\mu_\nu \partial_\mu\phi)_A -\frac{\partial \mathcal L \sqrt{-g}}{\partial \partial_\mu\phi_A}\partial_\mu\phi_A -2\frac{\partial \mathcal L \sqrt{-g}}{\partial g_\mu\lambda}g_{\nu\lambda}+\delta^\mu_\nu \mathcal L\sqrt{-g}=0
を要請するというのが原理です。

局所的一般ゲージ変換

ゲージ理論の一般論に従うと、さきほどの座標変換を局所的なものに置き換える、つまり、
\epsilon^\mu_\nu\rightarrow \xi^\mu_\nu(x)
として、(つまり、g_{\mu\nu}(x)などが時空全体で一定なのではなく、各点各点で変わっているということです。)
\xi^\mu_nu(x)=\partial_\nu\xi^\mu(x)
x^\mu\rightarrow x'^\mu\rightarrow x^\mu+\xi^\mu(x)(\xi^\mu(x):=\xi^\mu_\nu(x)x^\nu)から要請されます。
このような局所的な一般ゲージ変換だと例えば、
\delta(\partial_\mu\phi_A)=-\partial_\mu\xi^\nu\partial_\nu\phi_A+\partial_\mu(\partial_\lambda \xi^\kappa(\boldsymbol G^\lambda_\kappa \phi)_A)
=-\xi^\nu_\mu \partial_\nu\phi_A+ \xi^\kappa_\lambda(\boldsymbol G^\lambda_\kappa \partial_\mu\phi)_A+\partial_\mu\xi^\kappa_\lambda(\boldsymbol G^\lambda_\kappa \phi)_A
となります。この第三項は大域的一般ゲージ変換の場合には出てきませんでした。この項を打ち消して対称性を回復させるように、ゲージ場A^\mu_{\nu\lambda}を導入するのがゲージ理論の一般的な処方になります。

ゲージ場としての重力場

上の局所的一般ゲージ変換からの帰結として、例えば、共変微分
\nabla_\mu \phi_A=\partial_\mu\phi_A+A^\lambda_{\mu\nu}(\boldsymbol G^\nu_\lambda \phi)_A
と要請され、やや計算や議論を経ると、
\nabla_\lambda g_{\mu\nu}=0

\displaystyle A^\mu_{(\nu\lambda)}=\frac{1}{2}g^{\mu\kappa}(\partial_\lambda g_{\nu\kappa}+\partial_\nu g_{\kappa\lambda}-\partial_\kappa g_{\nu\lambda})=\Gamma^\mu_{\nu\lambda}
と、ゲージ場の対称部分としてレビ-チビタ接続係数が得られます。接続係数は一般座標変換に対して不定性があったので、ゲージ場としての性質が備わっているというのは確かにあっています。ゲージ場の非対称部分A^\mu_{[\nu\lambda]}\partial_\mu\partial_\nu\xi^\lambdaの打ち消しには役には立たず、意味のない余計な量となります。これは0とするようです、つまり捩れなしです。ゲージ理論の一般論として、曲率\boldsymbol R_{\mu\nu}:=R^\lambda_{\kappa\mu\nu}\boldsymbol G^\kappa_\lambdaからラグランジアン密度をつくると、まず\Gamma^\lambda_{\mu\nu}g_{\mu\nu}は独立なものとして、レビ-チビタ接続は拘束条件とし、
\displaystyle \mathcal L_R=c{\rm tr}(\boldsymbol R_{\mu\nu}\boldsymbol R_{\lambda\kappa})g^{\mu\lambda}g^{\nu\kappa}
\displaystyle \mathcal L_C =\Lambda^{(\mu\nu)}_\lambda\left(\Gamma^\lambda_{\mu\nu}-\frac12g^{\lambda\kappa}(\partial_\mu\ g_{\kappa\nu}+\partial_\nu g_{\mu\kappa}-\partial_\kappa g_{\mu\nu})\right)
とおき
\mathcal L_G=\mathcal L_R+\mathcal L_C
\displaystyle \int \mathcal L_G\sqrt{-g} d^4x
とします。\mathcal L_Cはレビ-チビタ接続の拘束条件のために必要で、\Lambda^{(\mu\nu)}_\lambdaは未定乗数で、テンソル成分です。

しかし、上のようにゲージ理論の一般的な処方に従って得た作用から変分原理によって場の方程式を得ると、アインシュタイン方程式とは異なった方程式になるようです。

参考文献

内山龍雄 ( 1987) 『一般ゲージ場序説』 岩波書店.

【力学】単振り子の厳密解の初等関数による高精度な近似

振り子の解は高校で\theta=\theta_0 \sin(\omega t +\phi)のようにならったかと思います。これは1次の精度での近似解です。振り子は厳密に解くこともできます。しかし、その解はヤコビのsn関数という特殊関数や周期に第一種完全楕円積分などが用いられ、やや複雑です。この記事ではこれを精度をある程度損なわず、そこそこに良い初等関数で構成される近似解を記述してみたいと思います。この記事は僕が高校の課題研究で扱っていたもので、当時は慣性抵抗と粘性抵抗までを含めた近似解を導出し、数値計算や実験との比較も行っていました。

無抵抗単振り子の厳密解

単振り子の初期条件は角\displaystyle \theta_0から静かに離すものとします。このラグランジアンは、
\displaystyle L=\frac{1}{2}ml^2{\dot{\theta}}^2-mgl\left(1-\cos\theta\right)
なので、オイラー-ラグランジュの運動方程式を立てると、
\displaystyle \ddot{\theta}+\omega_{0}^2\sin\theta=0
\displaystyle \omega_{0}^2\equiv\sqrt{\frac{g}{l} }
\displaystyle dt=\frac{1}{\sqrt{2\omega_0}}\frac{d\theta}{\sqrt{\cos\theta-\cos\theta_0}}
\displaystyle \sin\phi\equiv\frac{\sin{\frac{\theta}{2}}}{\sin{\frac{\theta_0}{2}}}
\displaystyle \omega_{0}t=\pm\int_{\frac{\pi}{2}}^{\phi} \frac{d\phi}{\sqrt{1-\sin^2{\frac{\theta_0}{2}}\sin\phi}}
と表されるので、積分を実行することで解が得られます。既によく知られた厳密な解析では、ヤコビのsn関数と定義することで、\displaystyle \thetaの関数が表されます。ヤコビのsn関数を\displaystyle \mathrm{sn}(u,k)とすると、次のように表されます。ただし、\displaystyle K(k)は第一種完全楕円積分といいます。
\displaystyle \theta=2\sin^{-1}\left[\sin{\left(\frac{\theta_0}{2}\right)}\mathrm{sn}\left(\omega_0t+K\left(\sin{\frac{\theta_0}{2}}\right),\sin{\frac{\theta_0}{2}}\right)\right]
\displaystyle K(k)\equiv\int_{0}^{\frac{\pi}{2}}\frac{d\phi}{\sqrt{1-k^2\sin^2\phi}}
そして、ヤコビのsn関数や第一種完全楕円積分は初等関数で表せないということが証明されています。(参考文献[1])

近似手法

\displaystyle \omega_0t=\pm\int_{\frac{\pi}{2}}^{\sin^{-1}\frac{\sin{\frac{\theta}{2}}}{\sin{\frac{\theta_0}{2}}}}\frac{d\phi}{\sqrt{1-\sin^2{\frac{\theta_0}{2}}\sin^2{\phi}}}
ここで、
\displaystyle 1\gg\sin^2{\frac{\theta_0}{2}}\sin^2{\phi}
であれば、
\displaystyle \sqrt{1-\sin^2{\frac{\theta_0}{2}}\sin^2{\phi}}\approx1-\frac{1}{2}\sin^2{\frac{\theta_0}{2}}\sin^2{\phi}
という近似が適用できます。
\displaystyle \omega_0t\approx\pm\int_{\frac{\pi}{2}}^{\sin^{-1}\frac{\sin{\frac{\theta}{2}}}{\sin{\frac{\theta_0}{2}}}}\frac{d\phi}{1-\frac{1}{2}\sin^2{\frac{\theta_0}{2}}\sin^2{\phi}}
\displaystyle =\pm\int_{\frac{\pi}{2}}^{\sin^{-1}\frac{\sin{\frac{\theta}{2}}}{\sin{\frac{\theta_0}{2}}}}\frac{d\phi}{\cos^2{\phi}+\sin^2{\phi}-\frac{1}{2}\sin^2{\frac{\theta_0}{2}}\sin^2{\phi}}
\displaystyle =\pm\int_{\frac{\pi}{2}}^{\sin^{-1}\frac{\sin{\frac{\theta}{2}}}{\sin{\frac{\theta_0}{2}}}}\frac{d\phi}{\cos^2{\phi}+\left(1-\frac{1}{2}\sin^2{\frac{\theta_0}{2}}\right)\sin^2{\phi}}
\displaystyle =\pm\int_{\frac{\pi}{2}}^{\sin^{-1}\frac{\sin{\frac{\theta}{2}}}{\sin{\frac{\theta_0}{2}}}}{\frac{\frac{1}{\cos^2{\phi}}}{1+\left(1-\frac{1}{2}\sin^2{\frac{\theta_0}{2}}\right)\tan^2{\phi}}d\phi}
次の変数変換をします。
\displaystyle \sqrt{1-\frac{1}{2}\sin^2{\frac{\theta_0}{2}}}=\sqrt{\frac{\cos{\theta_0}+3}{4}}\equiv a\left(\theta_0\right)
\displaystyle a\left(\theta_0\right)\tan{\phi\equiv}\tan{\Phi}
\displaystyle d\phi{=\frac{\frac{\cos^2{\phi}}{\cos^2{\Phi}}}{a\left(\theta_0\right)}d\Phi}
そうすれば、
\displaystyle \omega_0t\approx\pm\int_{\frac{\pi}{2}}^{\tan^{-1}\left(a\left(\theta_0\right)\tan\sin^{-1}\frac{\sin{\frac{\theta}{2}}}{\sin{\frac{\theta_0}{2}}}\right)}{\frac{\frac{1}{\cos^2{\phi}}\frac{\cos^2{\phi}}{\cos^2{\Phi}}}{\left(1+\tan^2{\Phi}\right)a\left(\theta_0\right)}d\Phi}
\displaystyle =\pm\frac{1}{a\left(\theta_0\right)}\int_{\frac{\pi}{2}}^{\tan^{-1}\left(a\left(\theta_0\right)\tan\sin^{-1}\frac{\sin{\frac{\theta}{2}}}{\sin{\frac{\theta_0}{2}}}\right)}d\Phi
\displaystyle =\pm\frac{1}{a\left(\theta_0\right)}\left\{\tan^{-1}\left(a\left(\theta_0\right)\tan\sin^{-1}\frac{\sin{\frac{\theta}{2}}}{\sin{\frac{\theta_0}{2}}}\right)-\frac{\pi}{2}\right\}
\displaystyle a\left(\theta_0\right)\omega_0t\pm\frac{\pi}{2}\approx\pm\tan^{-1}\left(a\left(\theta_0\right)\tan\sin^{-1}\frac{\sin{\frac{\theta}{2}}}{\sin{\frac{\theta_0}{2}}}\right)
ここで、
\displaystyle \sin^{-1}\cos\left(a\left(\theta_0\right)\omega_0t\right)\approx\tan^{-1}\left(a\left(\theta_0\right)\tan\sin^{-1}\frac{\sin{\frac{\theta}{2}}}{\sin{\frac{\theta_0}{2}}}\right)
とします。これによって、\displaystyle \pmを式中から無くすことができます。
\displaystyle \tan\sin^{-1}\cos\left(a\left(\theta_0\right)\omega_0t\right)\approx a\left(\theta_0\right)\tan\sin^{-1}\frac{\sin{\frac{\theta}{2}}}{\sin{\frac{\theta_0}{2}}}
\displaystyle \tan^{-1}\left\{\frac{1}{a\left(\theta_0\right)}\tan\sin^{-1}\cos\left(a\left(\theta_0\right)\omega_0t\right)\right\}\approx\sin^{-1}\frac{\sin{\frac{\theta}{2}}}{\sin{\frac{\theta_0}{2}}}
\displaystyle \sin{\left(\frac{\theta_0}{2}\right)}{\rm \sin\tan}^{-1}\left\{\frac{1}{a\left(\theta_0\right)}\tan\sin^{-1}\cos\left(a\left(\theta_0\right)\omega_0t\right)\right\}\approx\sin{\frac{\theta}{2}}
\displaystyle \theta\approx2{\sin^{-1}}\left[\sin{\left(\frac{\theta_0}{2}\right)}{\rm \sin\tan}^{-1}\left\{\frac{1}{a\left(\theta_0\right)}\tan\sin^{-1}\cos\left(a\left(\theta_0\right)\omega_0t\right)\right\}\right]
ただし、\displaystyle \tanが定義されない引数の点では、\displaystyle \thetaが連続となるような値とします。
この振動の周期\displaystyle Tは、
\displaystyle T\approx\frac{4}{\omega_0}\int_{0}^{\frac{\pi}{2}}\frac{d\phi}{1-\frac{1}{2}\sin^2{\frac{\theta_0}{2}}\sin^2{\phi}}
\displaystyle =\frac{4}{a\left(\theta_0\right)\omega_0}\int_{0}^{\frac{\pi}{2}}d\phi
\displaystyle =\frac{2\pi}{a\left(\theta_0\right)\omega_0}
また、第一種完全楕円積分は次のように近似されます。
\displaystyle K\left(\sin{\frac{\theta_0}{2}}\right)\approx\frac{\pi}{2}\frac{1}{a\left(\theta_0\right)}
この近似解における\displaystyle a\left(\theta_0\right)は、周期の振依存性を補正しているとわかります。したがって、
\displaystyle T\approx\frac{2\pi}{a\left(\theta_0\right)\omega_0}
の精度が向上するような改良された\displaystyle a\left(\theta_0\right)であれば、より精度の高い\displaystyle \thetaの解を表せられることが期待されます。
次に示す算術幾何平均と楕円積分の関係は第一種完全楕円積分数値計算に用いられ、収束が早いことが知られています。
\displaystyle I\left(a_0,b_0\right)\equiv\int_{0}^{\frac{\pi}{2}}\frac{d\vartheta}{\sqrt{{a_0}^2\cos^2\vartheta+{b_0}^2\sin^2\vartheta}}=I\left(\frac{a_0+b_0}{2},\sqrt{a_0b_0}\right)
\displaystyle a_{n+1}=\frac{a_n+b_n}{2},b_{n+1}=\sqrt{a_nb_n}
\displaystyle I\left(a_0,b_0\right)=I\left(a_\infty,a_\infty\right)=I\left(b_\infty,b_\infty\right)=\frac{1}{a_\infty}\int_{0}^{\frac{\pi}{2}}d\vartheta=\frac{\pi}{2a_\infty}
\displaystyle K\left(\sin{\frac{\theta_0}{2}}\right)=I\left(1, \cos\frac{\theta_0}{2}\right)\equiv\frac{\pi}{2a}
\displaystyle aは1と\displaystyle \cos\frac{\theta_0}{2}の算術幾何平均とします。これを有限回で打ち切って利用します。
1回目
\displaystyle \frac{1+\cos\frac{\theta_0}{2}}{2},\ \sqrt{\cos\frac{\theta_0}{2}}
2回目
\displaystyle \frac{\frac{1+\cos\frac{\theta_0}{2}}{2}+\sqrt{\cos\frac{\theta_0}{2}}}{2}=\left(\frac{1+\sqrt{\cos\frac{\theta_0}{2}}}{2}\right)^2,\sqrt{\frac{1+\cos\frac{\theta_0}{2}}{2}\sqrt{\cos\frac{\theta_0}{2}}}
最後に、3回目の幾何平均をとると、
\displaystyle a\approx\frac{1+\sqrt{\cos\frac{\theta_0}{2}}}{2}\sqrt{\sqrt{\frac{1+\cos\frac{\theta_0}{2}}{2}\sqrt{\cos\frac{\theta_0}{2}}}}
さきほどの\displaystyle a\left(\theta_0\right)は、
\displaystyle a\left(\theta_0\right)\approx\frac{\pi}{2}\frac{1}{K\left(\sin{\frac{\theta_0}{2}}\right)}
であったので、改良された\displaystyle a\left(\theta_0\right)は次のように定められて、精度を改良できます。
\displaystyle a\left(\theta_0\right)\equiv\frac{1+\sqrt{\cos\frac{\theta_0}{2}}}{2}\sqrt{\sqrt{\frac{1+\cos\frac{\theta_0}{2}}{2}\sqrt{\cos\frac{\theta_0}{2}}}}
すなわち、ヤコビのsn関数を次のように近似していることとなります。
\displaystyle \mathrm{sn}\left(u,k\right)=\sin(F^{-1}\left(u,k\right))
\displaystyle \approx{\rm \sin\tan}^{-1}\left\{\frac{1}{a\left(\theta_0\right)}\tan\sin^{-1}\sin\left(a\left(\theta_0\right)u\right)\right\}


以下のグラフ*1は、\mathrm{sn}\left(u,k\right)とこの近似関数のプロットです。微小角で近似したものなので、母数が1に近いほど誤差は大きくなります。
k=0.9
https://pbs.twimg.com/media/DlCYCXbV4AAQ5Cr?format=jpg&name=small
k=0.99
https://pbs.twimg.com/media/DlCYCXZU8AA-E28?format=jpg&name=small
k=0.999
https://pbs.twimg.com/media/DlCYCXbUcAIsSe0?format=jpg&name=small
k=0.9999
https://pbs.twimg.com/media/DlCYCXcU4AAnCIg?format=jpg&name=small


参考文献

[1] 松信 伊, 理正夫, 竹内啓『初等関数の数値計算』(シリーズ新しい応用の数学(8))(1974).

*1:

【一般相対性理論】線形化重力場の量子化

線形化した重力場は電磁場と同様に量子化することができます。電磁場の場合と比べながら量子化していきましょう。そして、古典的な波を量子化することによって、その波の粒子性というものを捉えることができます。この記事はレポートで出題された「重力波に粒子性はあるか」という問題で提出した内容です。(こんなのB1に出題するのオカシイ...)

\def\bra#1{\mathinner{\left\langle{#1}\right|}}\def\ket#1{\mathinner{\left|{#1}\right\rangle}}\def\braket#1#2{\mathinner{\left\langle{#1}\middle|#2\right\rangle}}

電磁波の粒子性

まず電磁波に粒子性があるというのは、現代的な視点からすれば、古典場としてみる電磁場には波動性しかなく、場と粒子というのは別々の描像であり、場である電磁波に粒子性を見出すことはできないのですが、全てが場であると捉え、その場を(第二)量子化することによって時空点をパラメータとする場を演算子化し、真空状態に対して場の生成演算子を作用させることにより粒子を生成させることができると考えます。 古典論では粒子は生成も消滅もしませんが、場を量子化した場の量子論では粒子は場の局所的なエネルギーとみなし、場から粒子を生成も消滅もすることができるようです。(と僕は理解しています、まだきちんと場の量子論を学んでいないためよくはわかっていません。)

自由電磁場の量子化

まず、自由電磁場の量子化の流れをみます。発生源がないときの電磁場の方程式はマクスウェル方程式から電磁ポテンシャルについて
\displaystyle \Box A_\mu =0
が得られました。この解はフーリエ分解によって、
\displaystyle A_\mu = \int \frac{d^3\boldsymbol k}{\sqrt{(2\pi)^3 2k^0}}\sum_{\lambda=0}^3 \left(a(\boldsymbol k,\lambda 
)\epsilon^\mu (\boldsymbol k,\lambda 
)e^{ikx}+a^{*}(\boldsymbol k,\lambda 
)\epsilon^{\mu*}(\boldsymbol k,\lambda)e^{-ikx}\right)
ただし、\displaystyle kx=k_\mu x^\mu, \epsilon^i\displaystyle \boldsymbol kに垂直な単位ベクトルです。

第二量子化の手法はいくらかあるのですが、正準量子化をするとします。電磁場の場合、\displaystyle A^0の正準共役運動量の第0成分\displaystyle \pi_0\displaystyle 0であるという困難があり、ローレンスゲージで固定した*1次のラグランジアン密度
\displaystyle \mathcal L=-\frac{1}{4}F_{\mu\nu}F^{\mu\nu}-\frac{1}{2}(\partial_\mu A^\mu)^2
を用います。このラグランジアン密度は部分積分を経ると次のラグランジアン密度と等価になっています。
\displaystyle \mathcal L=-\frac{1}{2}\partial_\nu A_\mu \partial^\nu A^\mu
このラグランジアン密度に対するラグランジュの場の方程式が上の式となります。方程式を再現するラグランジアン密度がわかったので、場\displaystyle A^\muに対する正準共役運動量場\displaystyle \pi_\muが定義できます。
\displaystyle \pi_\mu:=\frac{\partial \mathcal L}{\partial \partial_0 A^\mu}
正準量子化の手続きは次のようにします(これを信じる)。(\displaystyle x=(x^0,x^1,x^2,x^3)=(ct,\boldsymbol x)とします。)
\displaystyle A^\mu(x)\rightarrow \hat {A}^\mu(x)
\displaystyle [\hat{A}^\mu(ct,\boldsymbol x),\hat{\pi}_\nu(ct,\boldsymbol y)]=i\delta^\mu_\nu\delta^3(\boldsymbol{x-y})
\displaystyle [\hat{A}^\mu(ct,\boldsymbol x),\hat A^\nu(ct,\boldsymbol y)]=[\hat{\pi}_\nu(ct,\boldsymbol x),\hat{\pi}_\nu(ct,\boldsymbol y)]=0
方程式の解は\displaystyle a(\boldsymbol k,\lambda)演算子化することによって、次のようになり
\displaystyle \hat A_\mu = \int \frac{d^3\boldsymbol k}{\sqrt{(2\pi)^3 2k^0}}\sum_{\lambda=0}^3 \left(\hat a(\boldsymbol k,\lambda 
)\epsilon^\mu (\boldsymbol k,\lambda 
)e^{ikx}+\hat a^{\dagger}(\boldsymbol k,\lambda 
)\epsilon^{\mu*}(\boldsymbol k,\lambda)e^{-ikx}\right)
これら\displaystyle \hat a(\boldsymbol k,\lambda),\hat a^{\dagger}(\boldsymbol k,\lambda)の交換関係は
\displaystyle [\hat a(\boldsymbol k,\lambda),\hat a^{\dagger}(\boldsymbol k',\lambda')]=\eta_{\lambda\lambda'}\delta^3(\boldsymbol{k-k'})
\displaystyle [\hat a(\boldsymbol k,\lambda),\hat a(\boldsymbol k',\lambda')]=[\hat a^{\dagger}(\boldsymbol k,\lambda),\hat a^{\dagger}(\boldsymbol k',\lambda')]=0
となります。 この\displaystyle \hat a^{\dagger}(\boldsymbol k,\lambda)が電磁場の粒子すなわち光子の生成演算子\displaystyle \hat a(\boldsymbol k,\lambda)が消滅演算子になっていて、電磁場の真空状態\displaystyle \ket{0}
\displaystyle \forall \boldsymbol k,\lambda,\ \hat a(\boldsymbol k,\lambda)\ket{0}=0
\displaystyle \braket{0|0}=1
を要請し, 例えば1粒子状態は
\displaystyle \hat a^{\dagger}(\boldsymbol k,\lambda)\ket{0}
になります。このようにして電磁場の粒子性が古典自由電磁場の量子化という手続きによってみることができます。

電磁場から重力場

上でみた量子化重力場に対して行いたいのですが、当然ながら(高階微分がたくさん入っているなどの理由から)困難がいくつもあるようです。まず一般相対論における重力の捉え方というのはエネルギーによって、時空という多様体が歪むことによってあたかも力が働いているかのように思えるということです。電磁場とのアナロジー量子化をしようとすると、この微分幾何的な見方はある程度捨てる必要があると思います。

ここでは重力波を1次の精度で、(できれば)量子化をし、電磁波同様に重力波にも粒子性があるのかということを考えます。もちろん近似理論なので完全ではないですが、定性的な議論にはなり得ると思います。

まず、アインシュタインの重力理論は一般相対論的に共変性が自明な形で書かれていますが、正準量子化をしようとすると、共変性が自明でないADM分解をし、正準形式に書き直さなければならないです。またいくらかの困難もあります。 重力場は線形化(1次の精度で考える)すると、\displaystyle \Box h_{\mu\nu}=0 という電磁場のような方程式に帰着します。fumofumobun.hatenablog.jp したがって、殆ど電磁場とのアナロジーで同様の議論を進めることができると考えられるので、線形化した重力場に限っては、正準形式を経由せず、生成消滅演算子の、上で見たような交換関係を課すことによって量子化するということをしてよいと思います。ゆえに、方針としては、[古典場のアインシュタイン方程式を線形化\displaystyle \rightarrow ゲージ固定 \displaystyle \rightarrow フーリエ分解で解く \displaystyle \rightarrow 演算子化し、解にあらわれている生成消滅演算子の交換関係を定める \displaystyle \rightarrow 重力場の真空状態に生成演算子を作用させ、重力子を定義する] こののような流れが使えると思われます。電磁場同様に、
\displaystyle \Box h_{\mu\nu}=0
を満たす自由場を量子化することとします。まずフーリエ分解により、この古典解は、
\displaystyle h_{\mu\nu} = \int \frac{d^3\boldsymbol k}{\sqrt{(2\pi)^3 2k^0}}\sum_{\lambda=0}^3 \left(a(\boldsymbol k,\lambda 
)\epsilon_{\mu\nu} (\boldsymbol k,\lambda 
)e^{ikx}+a^{*}(\boldsymbol k,\lambda 
)\epsilon_{\mu\nu}^*(\boldsymbol k,\lambda)e^{-ikx}\right)
でした。

線形化自由重力場量子化

上で述べたように、古典場として解いた解にあらわれる係数を生成消滅演算子として量子化し、交換関係を課すことにより線形化重力場量子化とします。(線形という特別な場合なので正準量子化の正準形式で表すということをスキップしているということです。これが良いことなのかは力不足でわかりません...。)

古典場の解を演算子化します。
\displaystyle \hat h_{\mu\nu} = \int \frac{d^3\boldsymbol k}{\sqrt{(2\pi)^3 2k^0}}\sum_{\lambda=0}^3 \left(\hat a(\boldsymbol k,\lambda 
)\epsilon_{\mu\nu} (\boldsymbol k,\lambda 
)e^{ikx}+\hat a^{\dagger}(\boldsymbol k,\lambda 
)\epsilon^*_{\mu\nu}(\boldsymbol k,\lambda)e^{-ikx}\right)
交換関係
\displaystyle [\hat a(\boldsymbol k,\lambda),\hat a^{\dagger}(\boldsymbol k',\lambda')]=\eta_{\lambda\lambda'}\delta^3(\boldsymbol{k-k'})
\displaystyle [\hat a(\boldsymbol k,\lambda),\hat a(\boldsymbol k',\lambda')]=[\hat a^{\dagger}(\boldsymbol k,\lambda),\hat a^{\dagger}(\boldsymbol k',\lambda')]=0
を課して量子化とします。この\displaystyle \hat a^{\dagger}(\boldsymbol k,\lambda)が線形化重力場の粒子すなわち重力子の生成演算子\displaystyle \hat a(\boldsymbol k,\lambda)が消滅演算子になっています。このようにして重力場の粒子性が古典自由線形化重力場量子化という手続きによってみることができると思います。ただ、非線形項や相互作用までも考えると、量子化には多くの困難があるようで、それが弦理論などの最先端の量子重力理論に繋がるようです。 厳密に重力場は現段階で量子化はできておらず、また重力子の検出もできていないようで、この話はあくまで自由重力場の1次の精度での重力子の示唆というだけであって、現実でどうなっているのか僕には見当が付きません。

参考文献

坂本眞人 著 (2014) 『場の量子論 -不変性と自由場を中心にして-』(量子力学選書) 裳華房.
和田純夫 著 (2018) 『今度こそわかる重力理論』(今度こそわかるシリーズ) 講談社.
『Lecture 3 Quantization of gravitational waveshttps://www.youtube.com/watch?v=XChiTmQcDAM

*1:このゲージ固定の仕方がさらなる困難を生み, 実際は期待値としてゲージ固定をしなければならないです。

【微分幾何】多様体の計量/接続/測地線/曲率

多様体ではスカラーだったりベクトルだったりテンソルを考えましたが、これらを利用することで多様体多様体自体を自分自身で、内在的に計る(測る)ことができます。そのために計量テンソルというものがまず重要になってきます。

\newcommand{\bm}{\boldsymbol}

計量テンソル

次のような2つの条件1.対称, 2.非退化の条件をもつ2階共変テンソル\bm g \in \mathcal T_2(M)を考えます。
1.\forall \bm v, \bm w \in V(M), \bm g(\bm v,\bm w)=\bm g(\bm w,\bm v)
2.\forall \bm v \in V(M), \bm g(\bm v,\bm w)=0 \Longrightarrow \bm w =\bm 0
このような2階共変テンソル\bm gを擬リーマン計量といい、多様体との組(M,\bm g)を擬リーマン多様体といいます。(擬リーマン計量では\bm g(\bm v,\bm v)<0と負になり得ます。) 非負という条件を課したものはリーマン計量といい、組(M,\bm g)をリーマン多様体といいます。擬リーマン多様体において、反変ベクトル場のノルムを||\bm v||:=\sqrt{|\bm g(\bm v,\bm v)|}で定義します。リーマン多様体では||\bm v||:=\sqrt{\bm g(\bm v,\bm v)}で定義できます。

正規直交化

いま、反変ベクトル場の基底を勝手に取ってきます。すると、
\bm g\left(\frac{\partial}{\partial x^\lambda},\frac{\partial}{\partial x^\kappa}\right)=g_{\mu\nu}dx^\mu\otimes dx^\nu\left(\frac{\partial}{\partial x^\lambda},\frac{\partial}{\partial x^\kappa}\right)=g_{\mu\nu}\delta^\mu_\lambda \delta^\nu_\kappa=g_{\lambda\kappa}
ですが、各p\in M周りUの座標変換\phi'\circ\phi^{-1}:\phi(p)=(x^1,...,x^m)\mapsto\phi'(p)=(x'^1,...,x'^m)次のように与えます。
\mu=1:
\left(\frac{\partial}{\partial x'^1}\right)_{p}:=\left|\left|\left(\frac{\partial}{\partial x^1}\right)_{p}\right|\right|^{-1}\left(\frac{\partial}{\partial x^1}\right)_{p}
2\leq\mu\leq m:
\left(\frac{\partial}{\partial \widetilde{x}^\mu}\right)_{p}:=\left(\frac{\partial}{\partial x^\mu}\right)_{p}-\sum_{\nu=1}^{\mu-1}\bm g_p\left(\left(\frac{\partial}{\partial x^\mu}\right)_{p},\left(\frac{\partial}{\partial x'^\nu}\right)_{p}\right)\bm g_p\left(\left(\frac{\partial}{\partial x'^\nu}\right)_{p},\left(\frac{\partial}{\partial x'^\nu}\right)_{p}\right)\left(\frac{\partial}{\partial x'^\nu}\right)_{p}
\left(\frac{\partial}{\partial x'^\mu}\right)_{p}:=\left|\left|\left(\frac{\partial}{\partial \widetilde{x}^\mu}\right)_{p}\right|\right|^{-1}\left(\frac{\partial}{\partial \widetilde{x}^\mu}\right)_{p}
というような操作を繰り返すことによって座標変換をすると、
\bm g_p\left(\left(\frac{\partial}{\partial x'^\lambda}\right)_{p},\left(\frac{\partial}{\partial x'^\kappa}\right)_{p}\right)=\pm\delta_{\lambda\kappa}
とすることができます(シュミットの正規直交化法)。このようにした基底\left(\frac{\partial}{\partial x'^\mu}\right)_{p}を点pにおける正規直交基底といいます。このときの+1-1の数(符号数)は座標に依りません(シルベスターの慣性法則)。 +1の数をp,-1の数をqとすると、符号数は(p,q)のようにして表します。m次元擬リーマン多様体のうち符号数が(m-1,1)または(1,m-1)のものを特にローレンツ多様体といいます。相対論で扱う時空間は(4次元の)ローレンツ多様体です。

逆計量テンソル

計量テンソルのスロットにひとつだけ反変ベクトル場をいれることを考えます。
\bm g(\bm v):=\bm g(\bm v,)=\bm g(,\bm v)=g_{\mu\nu}\delta^\nu_\lambda v^\lambda dx^\mu=g_{\mu\nu}v^\nu dx^\mu:=v_\mu dx^\mu
するとこれは1階の共変テンソルとしてみることができます。さらにあるテンソル\bm t=\bm t_1\otimes\bm v\otimes\bm t_2のように書けているとき、\bm vに作用させると約束したうえで、いわゆる添え字の下げに対応する写像\bm g_{\bm v}:\mathcal T^r_s(M)\rightarrow \mathcal T^{r-1}_{s+1}(M)
\bm g_{\bm v}(\bm t):=\bm t_1\otimes\bm g(\bm v)\otimes \bm t_2=v_\mu \bm t_1\otimes dx^\mu \otimes \bm t_2
も考えることもできます。つまり、計量テンソルのスロットをひとつだけ用いると、反変ベクトル場から共変ベクトル場をユニークに生成するものとみることができます。これに対して、逆に共変ベクトル場から反変ベクトル場をユニークに生成する非退化対称2階反変テンソル\bm g^{-1}\in\mathcal  T^2(M)を次のように定義し、逆計量テンソルといいます。(計量テンソルの非退化性から逆計量テンソルが存在します。)
\bm g^{-1}(\bm g(\bm v)):=\bm g^{-1}(\bm g(\bm v),)=\bm g^{-1}(,\bm g(\bm v)):=\bm v
(g^{-1})^{\mu\nu}\delta^\lambda_\nu g_{\lambda\kappa}v^{\kappa}\frac{\partial}{\partial x^\mu}=(g^{-1})^{\mu\nu}g_{\nu\kappa}v^\kappa\frac{\partial}{\partial x^\mu}:=v^\mu\frac{\partial}{\partial x^\mu}
すなわち、
(g^{-1})^{\mu\nu}g_{\nu\kappa}:=\delta^\mu_\kappa
あるいは先ほどの記号の定義によって、
(g^{-1})^{\mu\nu}v_\nu:=v^\mu
とみることもできます。このように成分では計量テンソルと逆計量テンソルは添え字の上げ下げを行っているようにみることができます。(しかし重要なのはそこではなく元の定義です。)また、逆計量テンソルの成分を簡単に次のように書くこととします。
(g^{-1})^{\mu\nu}=g^{\mu\nu}

多様体上の曲線の長さと最短距離線方程式

擬リーマン多様体に曲線x:[t_1,t_2]\ni t\mapsto x(t)\in Mが与えられると、速度ベクトル(曲線に沿って定義される反変ベクトル)\bm v_{x(t)}=\frac{dx}{dt}=\left(\frac{dx^\mu(t)}{dt}\right)_{x(t)}\left(\frac{\partial}{\partial x^\mu}\right)_{x(t)}\in \mathcal V_{x(t)}(M)が定義でき、点x(t)における速度ベクトルのノルムすなわちある点での速さが||\bm v_{x(t)}||で与えられます。つまり、速度ベクトルのノルムを各点で考えるとこれは速さの拡張になっています。したがって、速さをパラメータt積分することによって多様体上の曲線xの長さL_xが次のように定義できます。ただし、次の積分は通常の意味の積分です。
L_x:=\int_{t_1}^{t_2} \left|\left|\bm v_{x(t)}\right|\right|dt=\int_{t_1}^{t_2} \left|\left|\frac{dx}{dt}\right|\right|dt=\int_{t_1}^{t_2} \sqrt{\left|\bm g_{x(t)}\left(\frac{dx}{dt},\frac{dx}{dt}\right)\right|}dt
局所座標表示すれば
=\int_{t_1}^{t_2} \sqrt{\left|(g_{\mu\nu})_{x(t)}(v^\mu)_{x(t)} (v^\nu)_{x(t)}\right|}dt=\int_{t_1}^{t_2} \sqrt{\left|(g_{\mu\nu})_{x(t)}\left(\frac{dx^\mu(t)}{dt}\right)_{x(t)} \left(\frac{dx^\nu(t)}{dt}\right)_{x(t)}\right|}dt
となります。次に、多様体に2点p,q\in Mが与えられたときに、この2点を結ぶような曲線xが与える長さL_xが最小となるような条件を求めます。これは、変分法すなわちL_cを作用として\delta L_x=0とすればよいですね。この手順(具体的な計算は講談社基礎物理学シリーズ相対性理論{\rm p}.128などを参照)によって次のような方程式が得られます。
\left(g_{\mu\nu}\right)_{x(t)}\left(\frac{d^2x^\nu(t)}{dt^2}\right)_{x(t)}+\left( [\nu\lambda,\mu ]\right)_{x(t)}\left(\frac{dx^\nu(t)}{dt}\right)_{x(t)}\left(\frac{dx^\lambda(t)}{dt}\right)_{x(t)}=0
\left([\nu\lambda,\mu]\right)_{x(t)}:=\frac{1}{2}\left(\left(\frac{\partial\left(g_{\mu\nu}\right)_{x(t)}}{\partial x^\lambda}\right)_{x(t)}+\left(\frac{\partial \left(g_{\mu\lambda}\right)_{x(t)}}{\partial x^\nu}\right)_{x(t)}-\left(\frac{\partial \left(g_{\lambda\nu}\right)_{x(t)}}{\partial x^\mu}\right)_{x(t)}\right)
=\left([\lambda\nu,\mu]\right)_{x(t)}
これは多様体上の任意の2点間を結ぶ曲線のうちその長さが最小となるもの、つまり多様体上の一般的な直線のようなものを与える微分方程式です。測地線方程式ではないです。\left([\nu\lambda,\mu]\right)_{x(t)}を第一種クリストッフェル記号といいます。この左辺は共変ベクトルの成分になっていて、これを成分とする共変ベクトルに逆計量テンソルg^{\mu\kappa}\frac{\partial}{\partial x^\mu}\frac{\partial}{\partial x^\kappa}を作用させれば、成分として方程式は
\left(\frac{d^2x^\kappa(t)}{dt^2}\right)_{x(t)}+\left(\left\{\begin{aligned}\kappa\hspace{3pt}\\ \nu\lambda\end{aligned}\right\}\right)_{x(t)}\left(\frac{dx^\nu(t)}{dt}\right)_{x(t)}\left(\frac{dx^\lambda(t)}{dt}\right)_{x(t)}=0
\left(\left\{\begin{aligned}\kappa\hspace{3pt}\\ \nu\lambda\end{aligned}\right\}\right)_{x(t)}:=\left(g^{\mu\kappa}\right)_{x(t)}\left([\nu\lambda,\mu]\right)_{x(t)}=\left(\left\{\begin{aligned}\kappa\hspace{3pt}\\ \lambda\nu\end{aligned}\right\}\right)_{x(t)}
となります。\left(\left\{\kappa,\nu\lambda\right\}\right)_{x(t)}を第二種クリストッフェルの記号といいます。この方程式から、関数x^\mu:t\mapsto x^\mu(t)が求まり、x(t)=\phi^{-1}(x^1(t),...,x^m(t))の具体的な形が求まるということになります。

微分幾何学的な操作や量

一般に、多様体では平坦なユークリッド空間とは違って歪んでいる部分を含むのでユークリッド空間で扱ってきたベクトル場の方向微分などはそのままでは扱えません。多様体論の基本の目的として、座標に依らないようにして拡張していかなければならないです。またその歪み具合を表すような量も定義しておくと便利です。これは座標に依っては困るので(0階,1階,高階であれ)テンソルであらわされるとよいということになります。

アファイン接続と共変微分、測地線方程式

多様体の反変ベクトル場の二項演算のアファイン(アフィン)接続\nabla:V(M)\times V(M)\ni(\bm v,\bm w)\mapsto \nabla_{\bm v} \bm w\in V(M)を次の条件で定義します。
1. \nabla_{\bm v_1+\bm v_2}(\bm w)=\nabla_{\bm v_1}(\bm w)+\nabla_{\bm v_2}(\bm w)
2. \nabla_{\bm v}(\bm w_1+\bm w_2)=\nabla_{\bm v}(\bm w_1)+\nabla_{\bm v}(\bm w_2)
3. \nabla_{f\bm v}\bm w=f\nabla_{\bm v}\bm w
4. \nabla_{\bm v}f\bm w=(\bm v f)\bm w +f\nabla_{\bm v}\bm w
これにしたがって局所座標表示すると、
\nabla_{\bm v} \bm w=\nabla_{v^\mu \frac{\partial}{\partial x^\mu}}w^\nu \frac{\partial}{\partial x^\nu}
=v^\mu \nabla_{\frac{\partial}{\partial x^\mu}}w^\nu\frac{\partial}{\partial x^\nu}
=v^\mu \left(\frac{\partial w^\lambda}{\partial x^\mu}\frac{\partial}{\partial x^\lambda}+w^\nu\nabla_{\frac{\partial}{\partial x^\mu}}\frac{\partial}{\partial x^\nu}\right)
ここで、これは反変ベクトル場なので、基底に対するある係数(スカラー場/関数)\Gamma^\lambda_{\mu\nu}が存在して、\nabla_{\frac{\partial}{\partial x^\mu}}\frac{\partial}{\partial x^\nu}=\Gamma^\lambda_{\mu\nu}\frac{\partial}{\partial x^\lambda}と書けるので、
\nabla_{\bm v} \bm w=v^\mu \left(\frac{\partial w^\lambda}{\partial x^\mu}+\Gamma^\lambda_{\mu\nu}w^\nu\right)\frac{\partial}{\partial x^\lambda}
となります。\nabla_{\bm v}\bm w\bm vによる\bm wの共変微分といいます。また、\Gamma^\lambda_{\mu\nu}を接続係数といいます。この定義だけでは接続係数に一意性はないです。接続係数は局所座標ごとのなんらかの関数です。共変微分は通常のベクトル場の方向微分の一般化になっています。ユークリッド空間では各点pに定まる反変ベクトルの属する空間は同じであるから異なる点同士のベクトル和を自然に考えることができました。そこから差を考えることができて、方向微分が自然に定義できました。しかし、一般の多様体の場合には各点に定まっているベクトル空間が異なっているために異なる点同士のベクトル和は定められていないです。(同じ点同士はできるので、一挙にすべての点でやってしまおうというアイデアがベクトル場であったのです。) 異なる点でベクトル和が考えられないということは、通常のベクトルの微分はそのままでは考えられないということになりますが、通常のベクトル場の方向微分の性質である線形性やライプニッツ則を抽出して一般化して定義することで、この問題をクリアしています。(距離空間から位相空間への拡張に似ていますね。)共変微分というものは、座標に依らずに、あるベクトルのもつ方向性により他のベクトルの変化を見ることができます。実際に\bm vがある曲線x上でxによって定義されているとします。すなわち、速度ベクトル\bm v_{x(t)}=\frac{dx}{dt}=\left(\frac{dx^\mu(t)}{dt}\right)_{x(t)}\left(\frac{\partial}{\partial x^\mu}\right)_{x(t)}となっているとします。[tex:\bm wは少なくともこの曲線x上で定義されているとして、共変微分を用いると、xに沿って\bm wがどの程度変化しているのか、1次の精度(線形性とライプニッツ則に起因する)で測ることができます。特に、\nabla_{\bm v} \bm w=\bm 0という状況では\bm wxに沿って大きさと方向が変わっていないということを示しています。よってこれをもって多様体上のベクトルの平行移動と定義すればよいです。具体的に書けば、
\nabla_{\bm v} \bm w=\frac{dx^\mu(t)}{dt} \left(\frac{\partial w^\lambda}{\partial x^\mu}+\Gamma^\lambda_{\mu\nu}w^\nu\right)\frac{\partial}{\partial x^\lambda}=\bm 0
すなわち、
\frac{dx^\mu(t)}{dt}\frac{\partial w^\lambda}{\partial x^\mu}+\Gamma^\lambda_{\mu\nu}\frac{dx^\mu(t)}{dt}w^\nu=0
\frac{dw^\lambda(t)}{dt}+\Gamma^\lambda_{\mu\nu}\frac{dx^\mu(t)}{dt}w^\nu=0
直線直交座標では平行移動であれば当然\frac{\partial w^\lambda}{\partial x^\mu}=0であるから\Gamma^\lambda_{\mu\nu}=0です。一方、曲線座標では\frac{\partial w^\lambda}{\partial x^\mu}\not=0となって\Gamma^\lambda_{\mu\nu}\not=0です。\Gamma^\lambda_{\mu\nu}はその局所座標の「歪み」に起因するベクトルの変化を直線直交座標の方と整合性を保つように打ち消すような量であるとみることができますし、異なるベクトル空間を比較できるようにベクトル空間をまさに「接続」しているとみることもできます。見方を変えれば設定した\Gamma^\lambda_{\mu\nu}がベクトルの変化具合ないし異なるベクトル空間の比較規則を決めているとみることもできます。(ただし、次に定義するように、特殊な条件下では\Gamma^\lambda_{\mu\nu}が一意的に定まるのでこの見方はあまりしないです。)注意すべきことは、平坦なユークリッド空間であっても曲線座標を貼れば\Gamma^\lambda_{\mu\nu}\not=0であるし、歪んだ多様体であっても局所直線直交座標を貼れば\Gamma^\lambda_{\mu\nu}=0となるのです。つまり、\Gamma^\lambda_{\mu\nu}多様体そのものの真の歪み具合を表せるような量ではないということです。あくまで、座標の歪み具合しか表せないのです。

アファイン接続は共変ベクトル場に対しても同様に定義できます。\nabla:V(M)\times V^*(M)\rightarrow V^*(M)、接続係数は\nabla_{\frac{\partial}{\partial x^\mu}}dx^\nu=-\Gamma^\nu_{\mu\lambda} dx^\lambdaで与えられます。より一般に、テンソル場に対しては次のように定義されます。\nabla:V(M)\times T^r_s(M)\rightarrow V^r_s(M)また、テンソル場に対する共変微分は次で与えます。
\nabla_{\bm v}(\bm t_1\otimes\bm t_2)=(\nabla_{\bm v}\bm t_1)\otimes\bm t_2 + \bm t_1\otimes(\nabla_{\bm v}\bm t_2)
これを繰り返してベクトルにまで分解すればよいです。また、反変ベクトルの基底や基底による共変微分は次のような略記号がよく用いられます。
\frac{\partial}{\partial x^\mu}=\partial_\mu
\nabla_{\frac{\partial}{\partial x^\mu}}=\nabla_\mu

レビ-チビタ接続

曲線xの速度ベクトルが曲線xに沿って変わらない、すなわち\nabla_{\bm v}\bm v=\bm 0であるとします。この曲線[tex:]を測地線といいます。\nabla_{\bm v}\bm v=\bm 0を局所座標表示すればただちに、
\frac{dv^\lambda(t)}{dt}+\Gamma^\lambda_{\mu\nu}\frac{dx^\mu(t)}{dt}v^\nu=0
\frac{d^2x^\lambda(t)}{dt^2}+\Gamma^\lambda_{\mu\nu}\frac{dx^\mu(t)}{dt}\frac{dx^\nu(t)}{dt}=0
を得ます。これを測地線方程式といいます。測地線は、もし計量テンソルが存在して、この曲線に沿って変わらない\nabla_{\bm v}\bm g=\bm 0ときにはこの曲線に沿って速度ベクトルのノルムを保つことができるということであるから最短距離線に一致しま。よって最短距離線方程式と比較して、接続係数が第二種クリストッフェル記号で与えられるということがわかります。これが多様体の各点の速度ベクトルで成り立つときの接続係数をレビ-チビタ(リーマン)接続といいます。すなわち、
\Gamma^\lambda_{\mu\nu}=\left\{\begin{aligned}\lambda\hspace{3pt}\\ \mu\nu\end{aligned}\right\}
ここから、レビ-チビタ接続は下の添字について対称性をもつ、
\Gamma^\lambda_{\mu\nu}=\Gamma^\lambda_{\nu\nu}
ということがわかります。これは捩れがないということですが、これについては省略します(通常の一般相対論では重要ではないです)。

曲率テンソル

多様体が歪んでいれば、反変ベクトルを2つ反変ベクトル場に沿って平行移動させると、どちらのベクトル場に沿って先に平行移動させるかという2通りの平行移動の方法で、平行移動させた結果は一致しえないですね。例えばレビ-チビタ接続を考えるものとすると、この場合には、平行移動先では、ノルムは保存されるものの、向きが異なります。つまり、平行移動という操作が一般に非可換であるということになります。これは、平行移動そのものを定義する共変微分が一般に非可換であるということになります。よって、2階共変微分の順序交換の差が多様体の歪み具合を表す量になり得ます。次の写像\bm R':(\bm v_1,\bm v_2, \bm w)\rightarrow \bm R'(\bm v_1,\bm v_2,\bm w)を考えます。
\bm R'(\bm v_1,\bm v_2,\bm w):=\nabla_{\bm v_1}(\nabla_{\bm v_2}\bm w)-\nabla_{\bm v_2}(\nabla_{\bm v_1}\bm w)
このような歪み具合を表す量として、\bm R'テンソル場であることが要請されますが、
\bm R'(f\bm v_1,\bm v_2,\bm w)=\nabla_{f\bm v_1}(\nabla_{\bm v_2}\bm w)-\nabla_{\bm v_2}(\nabla_{f\bm v_1}\bm w)
=f\nabla_{\bm v_1}(\nabla_{\bm v_2}\bm w)-\nabla_{\bm v_2}(f\nabla_{\bm v_1}\bm w)
=f\nabla_{\bm v_1}(\nabla_{\bm v_2}\bm w)-f\nabla_{\bm v_2}(\nabla_{\bm v_1}\bm w)-(\bm v_2 f)(\nabla_{\bm v_1}\bm w)
=f\bm R'(\bm v_1,\bm v_2,\bm w)-(\bm v_2 f)(\nabla_{\bm v_1}\bm w) \not=f\bm R'(\bm v_1,\bm v_2,\bm w)
\bm v_2,\bm wについても同様で、テンソル場になっていません。この修正項として-\nabla_{[\bm v_1,\bm v_2]}\bm wを加えるとうまくテンソル場になります。([\bm v_1,\bm v_2]f=\bm v_1(\bm v_2 f)-\bm v_2(\bm v_1 f)というベクトル場です。局所座標表示をすれば、これがベクトル場であることはただちに示すことができます。) よって、\bm R:(\bm v_1,\bm v_2, \bm w)\rightarrow \bm R(\bm v_1,\bm v_2,\bm w)=\nabla_{\bm v_1}(\nabla_{\bm v_2}\bm w)-\nabla_{\bm v_2}(\nabla_{\bm v_1}\bm w)-\nabla_{[\bm v_1,\bm v_2]}\bm wで定める4階混合テンソル\bm Rを歪み具合を表す量とすることができます。(スロットを3つ使っています。) これを(リーマン)曲率テンソルといいます。実際、
\bm R(f\bm v_1,\bm v_2,\bm w)=f\bm R'(\bm v_1,\bm v_2,\bm w)-(\bm v_2 f)(\nabla_{\bm v_1}\bm w)-\nabla_{[f\bm v_1,\bm v_2]}\bm w
=f\bm R'(\bm v_1,\bm v_2,\bm w)-(\bm v_2 f)(\nabla_{\bm v_1}\bm w)-\nabla_{f[\bm v_1,\bm v_2]-(\bm v_2f)\bm v_1}\bm w
=f\bm R'(\bm v_1,\bm v_2,\bm w)-(\bm v_2 f)(\nabla_{\bm v_1}\bm w)+\nabla_{(\bm v_2f)\bm v_1}\bm w- \nabla_{f[\bm v_1,\bm v_2]}\bm w
=f\bm R'(\bm v_1,\bm v_2,\bm w)-(\bm v_2 f)(\nabla_{\bm v_1}\bm w)+(\bm v_2f)\nabla_{\bm v_1}\bm w- f\nabla_{[\bm v_1,\bm v_2]}\bm w
=f\bm R'(\bm v_1,\bm v_2,\bm w)- f\nabla_{[\bm v_1,\bm v_2]}\bm w
=f\bm R(\bm v_1,\bm v_2,\bm w)
などのように打ち消し合います(その他のスロットはご自分で計算してみてください)。\bm R(\bm v_1,\bm v_2,\bm w)を局所座標表示すると、
\bm R(\bm v_1,\bm v_2,\bm w)=v_1^\mu v_2^\nu\left(\frac{\partial \Gamma^\lambda_{\nu\eta}}{\partial x^\mu}-\frac{\partial \Gamma^\lambda_{\mu\eta}}{\partial x^\eta}+\Gamma^\lambda_{\mu\kappa} \Gamma^\kappa_{\nu\eta}-\Gamma^\lambda_{\nu\kappa} \Gamma^\kappa_{\mu\eta}\right)w^\eta \frac{\partial}{\partial x^\lambda}=:v_1^\mu v_2^\nu R^\lambda_{\mu\nu\eta} w^\eta \frac{\partial}{\partial x^\lambda}
なので、
\bm R=R^\kappa_{\mu\nu\lambda}\frac{\partial}{\partial x^\kappa}\otimes dx^\mu\otimes dx^\nu \otimes dx^\lambda
とかくとすると、さきほどまで後ろ3つのスロットを使っていたということになります。これに対して添え字の上げ下げや縮約という操作(いわゆる添字について足し上げる)をすると4階共変テンソル場や2階共変テンソル場、0階テンソル場(スカラー場)をつくることもできます。4階共変テンソル場は、1つ目に計量テンソルを作用させると約束して(\bm gの下付きの数字は何番目のスロットに作用させるかを約束しています。)
\bm g_1(\bm R)=g_{\kappa\eta} R^\eta_{\mu\nu\lambda}dx^\kappa \otimes dx^\mu\otimes dx^\nu \otimes dx^\lambda
=R_{\kappa\mu\nu\lambda}dx^\kappa \otimes dx^\mu\otimes dx^\nu \otimes dx^\lambda
2階共変テンソル場は、曲率テンソルの1つ目の反変ベクトル場と2つ目共変ベクトル場を縮約することで定義され、
C^1_2\left(R^\kappa_{\mu\nu\lambda}\frac{\partial}{\partial x^\kappa}\otimes dx^\mu\otimes dx^\nu \otimes dx^\lambda\right)=R^\kappa_{\mu\nu\lambda}\delta^\nu_\kappa dx^\mu\otimes dx^\lambda
=R^\kappa_{\mu\kappa\lambda} dx^\mu\otimes dx^\lambda
=R^\lambda_{\mu\lambda\nu} dx^\mu\otimes dx^\nu=:R_{\mu\nu}dx^\mu\otimes dx^\nu=:\bm R_{\rm Ricci}
となり、\bm R_{\rm Ricci}をリッチ曲率テンソルといいます。スカラー場は、添え字を上げたリッチ曲率テンソルをさらに縮約し、
\bm g_1^{-1}(\bm R_{\rm Ricci})=g^{\mu\lambda}R_{\lambda\nu} \frac{\partial}{\partial x^\mu}\otimes dx^\nu
=:R^\mu_\nu \frac{\partial}{\partial x^\mu}\otimes dx^\nu
C^1_1(\bm g^{-1}_1(\bm R_{\rm Ricci}))=R^\mu_\nu \delta^\nu_\mu
=R^\mu_\mu=:R
となります。Rをリッチ曲率スカラーといいます。このようにして座標に依らないという強い性質をもつ(4,2,0階などの)テンソル場によって多様体の歪み具合を表すことができます。リッチ曲率スカラーの符号によって多様体の歪み方をある程度分類することができます。