軌道角運動量からスピンを導く


多くの量子力学の教科書では半整数の大きさをもつ角運動量「スピン」がかなり荒っぽい方法で導入される。すなわち、角運動量の交換関係を満足する演算子の固有値としては軌道角運動量のような整数値だけでなく半整数値があってもよいから、半整数の固有値をとるものも角運動量として採用しよう、という論法である。そしてシュテルン・ゲルラッハの実験を引用し、銀粒子のビームが磁場によって2本に分裂したことを根拠にスピン \(1/2\) の存在を認めさせる。(整数値の軌道角運動量を考えている限り磁場によるビーム線の分裂は奇数本にしかならない。) しかしそのような論法をとらなくとも、スピンはある程度理論的にも導くことができる。このページでは、軌道角運動量に対して通常は行わないような特殊な要請をすることで、スピンやパウリ行列の性質を導出していく。

軌道角運動量

まず最初に量子論における軌道角運動量の性質を復習しておこう。とくに証明等は行わないので、忘れてしまった人は量子力学の教科書を見直してほしい。

軌道角運動量 \(\bm{L}\) は次で定義される: \begin{equation} \bm{L} = \bm{r} \times \bm{p} \end{equation} ただし \(\bm{r}\) は(粒子の)位置ベクトル、\(\bm{p}\) は運動量ベクトルである。ベクトルを成分に分けて書けば \begin{equation} L_{x} = y p_{z} - z p_{y}, \4 L_{y} = z p_{x} - x p_{z}, \4 L_{z} = x p_{y} - y p_{x} \end{equation} である。これらは次の交換関係を満足する: \begin{equation} [ L_{y}, L_{z} ] = i \h \1 L_{x}, \4 [ L_{z}, L_{x} ] = i \h \1 L_{y}, \4 [ L_{x}, L_{y} ] = i \h \1 L_{z} \label{commutation} \end{equation} 軌道角運動量 \(\bm{L}\) の自身との内積は次のようになる: \begin{equation} \bm{L}^{2} = \bm{L} \ip \bm{L} = L_{x}^{2} + L_{y}^{2} + L_{z}^{2} \end{equation} この演算子は角運動量のすべての成分と可換である: \begin{equation} [ \bm{L}^{2}, L_{i} ] = 0 \5 ( i = x, y, z ) \label{commutation2} \end{equation} よって \(\bm{L}^{2}\) と \(L_{z}\) の同時固有状態が存在することになる。その波動関数は球面調和関数と呼ばれ次の固有値をもつ: \begin{align} \bm{L}^{2} \1 Y_{\l m} &= \h^{2} \l \1 ( \l + 1 ) \1 Y_{\l m} \5 ( \l = 0, 1, 2, \dots ) \\[8pt] L_{z} \1 Y_{\l m} &= \h m \1 Y_{\l m} \5 ( m = 0, \pm1, \pm2, \dots, \pm \l \2 ) \end{align}

スピンの導出

上で見たように軌道角運動量演算子 \(\bm{L}^{2}\) の固有値は \begin{equation*} \h^{2} \l \1 ( \l + 1 ) = 0, \ 2 \1 \h^{2}, \ 6 \1 \h^{2}, \ 12 \1 \h^{2}, \ 20 \1 \h^{2}, \dots \end{equation*} という値をとり、我々はこれらを非負整数 \(\l=0,\1 1,\1 2,\1 3,\1 4,\dots\) によってラベル付けし区別している。ところでなぜ \(\l\) の値は非負に制限されているのだろう? 実はこれには「便利だから」という以外に何か必然的な理由があるわけではない。実際に、例えば \begin{equation*} \h^{2} \l \1 ( \l + 1 ) = 6 \h^{2} \end{equation*} という \(\l\) に関する二次方程式は、\(\l=2\) 以外に、負の整数 \(\l=-3\) も解にもつ。一般に、\(\l\) についての二次方程式 \begin{equation*} \h^{2} \l \1 ( \l + 1 ) = \h^{2} n ( n + 1 ) \5 ( n = 0, 1, 2,\dots ) \end{equation*} は因数分解によって \begin{equation*} ( \l - n ) ( \l + n + 1 ) = 0 \end{equation*} と変形されるため、\(\l=n\) だけでなく、\(\l=-(n+1)\) も解となり得る。すなわち、角運動量の状態を区別する際には、非負整数 \(\l=0,1,2,\dots\) と同等に、負整数 \(\l=-1,-2,-3,\dots\) のほうを採用してもよいことになる。しかしながら、負の整数を採用したからといって何か新しいことが起こるわけではなく、例えば固有値 \(\l=-1\) に対応する球面調和関数は、\(\l=0\) に対応する \(Y_{00}\) であって意味のある変化は何も起こらない。\(\bm{L}^{2}\) の固有値問題は \(\l\) と \(-(\l+1)\) の入れ替えに関して完全に対称であり、そのため我々はそれらを特に区別せずに、扱いやすい非負整数 \(\l=0,1,2,\dots\) のほうを、状態を区別するためのラベルとして使っているのである。

ところが自然をよく観察してみるとこの対称性は完全ではないらしい。例としてシュテルン・ゲルラッハの実験を考えてみよう。シュテルン・ゲルラッハの実験では、磁場中を通過した銀粒子のビームが2つに分裂するという現象が観察される。銀原子では、その中の電子が \([\mr{Kr}]\,4d^{10}\,5s^{1}\) という電子配置をとり、完全に電子で満たされた \(\mr{Kr}\) 核および \(4d\) 軌道からなる内殻と、その外側の \(5s\) 軌道にある価電子1個によって原子が構成されている。一般に、荷電粒子である電子が軌道角運動量をもつと、それが作る円電流によって磁気モーメントが生じ、外部磁場と相互作用するようになるのだが(ビームの分裂)、内殻電子に対してはそれらの角運動量の総和が \(0\) になる性質があるため、とくに銀原子の場合には、最外殻の \(5s\) 電子1個だけが原子の磁気モーメントへ寄与することになる。しかしながら、この \(5s\) 電子も軌道角運動量の状態は \(\l=m=0\) であるので、銀原子は全体として磁気モーメントをもつことはなく、したがって磁場によるビームの分裂は起こらないと考えられていた。ところが、実際に実験を行ってみると銀粒子のビームは2つに分裂したのである。そこである人は、電子の自転にともなう角運動量の存在を仮定し、その大きさ \(1/2\) の角運動量「スピン」によって実験結果をうまく説明したわけである。けれども我々はここで次のように考えることにしよう:「磁場中においては軌道角運動量に関するなんらかの対称性が破れることで、\(\l=0\) の状態と \(\l=-1\) の状態が区別できるようになり、その2つの状態のちがいが銀ビームの分裂となって観察されたのだ」と。これが以下のスピン導出における唯一本質的な仮定となる。

さて、この仮定を頼りに \(\l\) の正と負を区別したいのだが、ところでどうして \(\bm{L}^{2}\) の固有値は正と負が区別できなくなってしまっているのだろう? その答えは簡単で、それは演算子 \(\bm{L}^{2}\) が軌道角運動量の「1乗」ではなく「2乗」の演算子になっているからである。もしも軌道角運動量の「1乗」の演算子をもってきたなら、その演算子の固有値 \(\lambda\) は \begin{equation} \lambda = \h \l, \, -\h ( \l + 1 ) \5 ( \l = 0, 1, 2,\dots ) \label{eigen} \end{equation} という形になるだろう。ところが、そのような演算子は \(\bm{L}\) 自身ではありえない。なぜならばベクトル演算子 \(\bm{L}\) に固有値が存在すると仮定すると、それはまたベクトル値をとらなければならず、したがって式\eqref{eigen}のようなスカラーの固有値をとることは考えられないからである。そこで \(\bm{L}\) がスカラー演算子となるよう新しくベクトル演算子 \(\bm{\sigma}=\sigma_{x}\bm{e}_{x}+\sigma_{y}\bm{e}_{y}+\sigma_{z}\bm{e}_{z}\) を導入し、この演算子との内積によって角運動量の1乗の演算子 \begin{equation} \bm{L} \ip \bm{\sigma} = L_{x} \sigma_{x} + L_{y} \sigma_{y} + L_{z} \sigma_{z} \end{equation} を定義する。\(\bm{\sigma}\) という意味深な記号の使い方をしているが、今のところ \(\bm{\sigma}\) の性質については(それがベクトル演算子であることを除き)まったくの未知である。\(\bm{\sigma}\) について何も知らなくても、上で述べた仮定だけから、これがパウリ行列と同じ性質をもつ演算子になってしまう、というのが以下での話の流れとなる。

それでは上での仮定をもとに \(\bm{\sigma}\) の性質を調べていこう。まず最初に \(\bm{L}\ip\bm{\sigma}\) の固有値\eqref{eigen}が実数であることより \(\bm{L}\ip\bm{\sigma}\) はエルミート演算子であることがわかる(エルミート演算子は実数の固有値をもつ)。つまり \begin{equation} ( \bm{L} \ip \bm{\sigma} )^{\dagger} = \bm{L} \ip \bm{\sigma} \label{hermitian} \end{equation} である。ところで軌道角運動量はエルミート \(\bm{L}^{\dagger}=\bm{L}\) であり、また内積という演算は対称性 \begin{equation} \bm{L} \ip \bm{\sigma} = \bm{\sigma} \ip \bm{L} \label{symmetry} \end{equation} をもたなければならないので、式\eqref{hermitian}の左辺は \begin{equation*} ( \bm{L} \ip \bm{\sigma} )^{\dagger} = ( \bm{\sigma} \ip \bm{L} )^{\dagger} = \bm{L}^{\dagger} \ip \bm{\sigma}^{\dagger} = \bm{L} \ip \bm{\sigma}^{\dagger} \end{equation*} と変形される(途中でエルミート共役の性質 \((AB)^{\dagger}=B^{\dagger}A^{\dagger}\) を使った)。これが式\eqref{hermitian}右辺と等しくなればよいのだが、そのためには \begin{equation} \bm{\sigma}^{\dagger} = \bm{\sigma} \end{equation} であればよいだろう。すなわち、\(\bm{\sigma}\) はエルミート演算子と考えられる。

次に \(\bm{L}\ip\bm{\sigma}\) の任意の固有状態に対し \(\bm{L}^{2}\) の観測を行うことを考えてみよう。仮定より \(\bm{L}\ip\bm{\sigma}\) の固有状態は \(\h\l\) や \(-\h(\l+1)\) という固有値をもつのだが、もし \(\l=0,1,2,\dots\) の値が同じであるならば、固有値 \(\h\l\) の状態も \(-\h(\l+1)\) の状態も \(\bm{L}^{2}\) の測定については同じ固有値 \(\h^{2}\l(\l+1)\) を与えるはずである。(シュテルン・ゲルラッハの実験で言えば、分裂した銀原子の価電子の軌道角運動量がどちらも \(\l=0\) の状態にあったことに対応する。) すなわち \(\bm{L}\ip\bm{\sigma}\) の固有状態は \(\bm{L}^{2}\) の固有状態にもなっているのである(同時固有状態)。一般に、異なる2つの演算子の同時固有状態が存在するとき、その2つの演算子は交換するという性質がある。そのため \(\bm{L}\ip\bm{\sigma}\) と \(\bm{L}^{2}\) は交換するはずであり、式で表せば \begin{equation} [ \bm{L} \ip \bm{\sigma}, \, \bm{L}^{2} ] = 0 \end{equation} となる。この式の左辺を少し変形すると \begin{equation*} [ \bm{L} \ip \bm{\sigma}, \, \bm{L}^{2} ] = \sum_{i=x,y,z} \, [ L_{i} \sigma_{i}, \bm{L}^{2} ] = \sum_{i=x,y,z} \, \bigl( L_{i} [ \sigma_{i}, \bm{L}^{2} ] + [ L_{i}, \bm{L}^{2} ] \sigma_{i} \bigr) \end{equation*} となるが、式\eqref{commutation2}に書いたように \([L_{i},\bm{L}^{2}]=0\) であるから \begin{equation*} \sum_{i=x,y,z} L_{i} \, [ \sigma_{i}, \bm{L}^{2} ] = 0 \end{equation*} でなければならない。これが成り立つためには \begin{equation} [ \sigma_{i}, \bm{L}^{2} ] = 0 \5 ( i = x, y, z ) \label{commutation3} \end{equation} となればよい。さらに内積の対称性\eqref{symmetry}より \begin{equation} L_{x} \sigma_{x} + L_{y} \sigma_{y} + L_{z} \sigma_{z} = \sigma_{x} L_{x} + \sigma_{y} L_{y} + \sigma_{z} L_{z} \label{symmetry2} \end{equation} が成り立たねばならないから、(やや論理に飛躍があるが)一般に次の交換関係を仮定してもよいだろう: \begin{equation} [ \sigma_{i}, L_{j} ] = 0 \5 ( i, j = x, y, z ) \end{equation} これを仮定すれば、式\eqref{commutation3}や式\eqref{symmetry2}の条件はどちらも問題なく満足されることになる。

最後に \(\bm{\sigma}\) の代数的性質を導いてみよう。上でも述べたように、もし \(\bm{L}\ip\bm{\sigma}\) の固有状態が得られているなら、その固有値が \(\h\l\) であるか \(-\h(\l+1)\) であるかによらず、その状態の \(\bm{L}^{2}\) の固有値は \(\h^{2}\l(\l+1)\) である。また、これらの固有値に対して \begin{equation*} (\h\l) \Bigl( (\h\l) + \h \Bigr) = \h^{2} \l \1 ( \l + 1 ) \end{equation*} \begin{equation*} -\h(\l+1) \Bigl( -\h(\l+1) + \h \Bigr) = \h^{2} \l \1 ( \l + 1 ) \end{equation*} という恒等式が成立するので、対応する演算子 \(\bm{L}\ip\bm{\sigma}\) や \(\bm{L}^{2}\) に関しても同じ形の恒等式 \begin{equation} \bm{L} \ip \bm{\sigma} \, \bigl( \bm{L} \ip \bm{\sigma} + \h \bigr) = \bm{L}^{2} \label{identity} \end{equation} が成り立つと考えられるだろう。そこでこの恒等式の成立を仮定し、ここから \(\bm{\sigma}\) に対してどのような演算規則が導かれるかを調べてみたい。式\eqref{identity}左辺の \(\bm{L}\ip\bm{\sigma}\) を成分で表し、式を展開すると \begin{align*} \bm{L} \ip \bm{\sigma} \, \bigl( \bm{L} \ip \bm{\sigma} + \h \bigr) &=( L_{x} \sigma_{x} + L_{y} \sigma_{y} + L_{z} \sigma_{z} ) ( L_{x} \sigma_{x} + L_{y} \sigma_{y} + L_{z} \sigma_{z} + \h ) \\[3pt] &= L_{x}^{2} \sigma_{x}^{2} + L_{y}^{2} \sigma_{y}^{2} + L_{z}^{2} \sigma_{z}^{2} + \h ( L_{x} \sigma_{x} + L_{y} \sigma_{y} + L_{z} \sigma_{z} ) \\[3pt] & \4 + L_{y} L_{z} \sigma_{y} \sigma_{z} + L_{z} L_{y} \sigma_{z} \sigma_{y} + L_{z} L_{x} \sigma_{z} \sigma_{x} + L_{x} L_{z} \sigma_{x} \sigma_{z} \\[3pt] & \4 + L_{x} L_{y} \sigma_{x} \sigma_{y} + L_{y} L_{x} \sigma_{y} \sigma_{x} \end{align*} になるが、軌道角運動量の交換関係\eqref{commutation}より \begin{equation*} L_{y} L_{z} = L_{z} L_{y} + i \h L_{x}, \4 L_{z} L_{x} = L_{x} L_{z} + i \h L_{y}, \4 L_{x} L_{y} = L_{y} L_{x} + i \h L_{z} \end{equation*} であるので、これらを使うと式\eqref{identity}は \begin{align} L_{x}^{2} + L_{y}^{2} + L_{z}^{2} &= L_{x}^{2} \sigma_{x}^{2} + L_{y}^{2} \sigma_{y}^{2} + L_{z}^{2} \sigma_{z}^{2} \notag \\[3pt] & \4 + L_{z} L_{y} ( \sigma_{y} \sigma_{z} + \sigma_{z} \sigma_{y} ) + i \h L_{x} ( \sigma_{y} \sigma_{z} - i \sigma_{x} ) \notag \\[3pt] & \4 + L_{x} L_{z} ( \sigma_{z} \sigma_{x} + \sigma_{x} \sigma_{z} ) + i \h L_{y} ( \sigma_{z} \sigma_{x} - i \sigma_{y} ) \\[3pt] & \4 + L_{y} L_{x} ( \sigma_{x} \sigma_{y} + \sigma_{y} \sigma_{x} ) + i \h L_{z} ( \sigma_{x} \sigma_{y} - i \sigma_{z} ) \notag \end{align} という形に展開される。この等式が成り立つためには \(\bm{\sigma}\) の演算規則として \begin{equation} \sigma_{x}^{2} = \sigma_{y}^{2} = \sigma_{z}^{2} = 1 \label{eq1} \end{equation} \begin{equation} \sigma_{y} \sigma_{z} + \sigma_{z} \sigma_{y} = 0, \4 \sigma_{z} \sigma_{x} + \sigma_{x} \sigma_{z} = 0, \4 \sigma_{x} \sigma_{y} + \sigma_{y} \sigma_{x} = 0 \label{eq2} \end{equation} \begin{equation} \sigma_{y} \sigma_{z} = i \sigma_{x}, \4 \sigma_{z} \sigma_{x} = i \sigma_{y}, \4 \sigma_{x} \sigma_{y} = i \sigma_{z} \label{eq3} \end{equation} が成り立てばよい。

以上をまとめると、ベクトル演算子 \(\bm{\sigma}\) は軌道角運動量演算子 \(\bm{L}\) の任意の成分と交換するエルミート演算子であり、その各成分は式\eqref{eq1}-\eqref{eq3}のような演算規則を満足することになる。また、式\eqref{eq2}と式\eqref{eq3}を用いると交換関係 \begin{equation} [ \sigma_{y}, \sigma_{z} ] = 2i \sigma_{x}, \4 [ \sigma_{z}, \sigma_{x} ] = 2i \sigma_{y}, \4 [ \sigma_{x}, \sigma_{y} ] = 2i \sigma_{z} \label{eq4} \end{equation} が得られる。ここで演算子 \(\bm{S}\) を \begin{equation} \bm{S} = \frac{\h}{2} \bm{\sigma} \end{equation} によって定義すると、これは角運動量の交換関係 \begin{equation} [ S_{y}, S_{z} ] = i \h \1 S_{x}, \4 [ S_{z}, S_{x} ] = i \h \1 S_{y}, \4 [ S_{x}, S_{y} ] = i \h \1 S_{z} \end{equation} を満足することがわかる(スピン)。

行列の性質

式\eqref{eq4}より \(\bm{\sigma}\) の各成分 \(\sigma_{x},\sigma_{y},\sigma_{z}\) は非可換であるからそれらを単なる数字で表すことはできない。そこで演算子 \(\sigma_{i}\) を行列で表現できないか考えてみよう。この節では具体的な行列表現を探す前にまず、\(\sigma_{i}\) を表現する行列が満足すべき一般的性質を調べていくことにする。

まず第一に \(\bm{\sigma}\) はエルミート演算子であったから、その表現はエルミート行列でなければならない。さらに式\eqref{eq1}の性質より \begin{equation} \sigma_{i}^{2} = I \5 ( i = x, y, z ) \label{unitarity} \end{equation} であるから(ただし \(I\) は単位行列)、\(\sigma_{i}^{-1}=\sigma_{i}=\sigma_{i}^{\dagger}\) より、\(\sigma_{i}\) がユニタリー行列であることもわかる。なお、式\eqref{eq3}の関係より \(\sigma_{x},\sigma_{y},\sigma_{z}\) のすべてを実行列にとることはできない(なぜなら、例えば \(\sigma_{x},\sigma_{y}\) を実行列にすることができたとしたら、\(\sigma_{z}=-i\1\sigma_{x}\sigma_{y}\) より \(\sigma_{z}\) の行列要素は虚数になるから)。そのため、\(\sigma_{x},\sigma_{y},\sigma_{z}\) のすべてが対称行列や直交行列になることはない。一般に、エルミート行列は適当なユニタリー行列によって対角化することができる。そこでエルミート行列 \(\sigma_{i}\) を対角化するようなユニタリー行列を \(U\) と置くことにすると、式\eqref{unitarity}の両辺に左側から \(U^{-1}\) を、右側から \(U\) を掛けることによって \begin{equation*} ( U^{-1} \sigma_{i} U ) ( U^{-1} \sigma_{i} U ) = I \end{equation*} という式を得る。この式は \(\sigma_{i}\) を対角化した行列 \(U^{-1}\sigma_{i}U\) の2乗が単位行列になることを意味している。これより、対角行列 \(U^{-1}\sigma_{i}U\) の対角成分は \(1\) か \(-1\) のいずれかでなければならず、\(\sigma_{i}\) の固有値は \(1\) または \(-1\) であるとわかる。(スピン \(S_{i}\) の固有値は \(\pm\h/2\) になる。) ところで、式\eqref{eq2}より \(\bm{\sigma}\) の任意の異なる2成分 \(\sigma_{i}\) と \(\sigma_{j}\) の間には、反交換関係 \begin{equation} \sigma_{i} \sigma_{j} = -\sigma_{j} \sigma_{i} \4 ( i \neq j ) \end{equation} が成り立つから、この性質とユニタリー性\eqref{unitarity}を使うと \begin{equation*} \sigma_{i} = \sigma_{i} \sigma_{j} \sigma_{j} = - \sigma_{j} \sigma_{i} \sigma_{j} \end{equation*} であることがわかる。ここで \(\sigma_{i}=-\sigma_{j}\sigma_{i}\sigma_{j}\) の両辺のトレース(行列の対角成分の総和)を計算してみると、トレースの性質 \(\tr(AB)=\tr(BA)\) より \begin{equation*} \tr \, \sigma_{i} = -\tr( \sigma_{j} \sigma_{i} \sigma_{j} ) = -\tr( \sigma_{i} \sigma_{j} \sigma_{j} ) = -\tr \, \sigma_{i} \end{equation*} となり \begin{equation} \tr \, \sigma_{i} = 0 \end{equation} がわかる。このトレース \(0\) の性質は \(\sigma_{i}\) を対角化した行列 \(U^{-1}\sigma_{i}U\)にも引き継がれる: \begin{equation} \tr( U^{-1} \sigma_{i} U ) = \tr( \sigma_{i} U U^{-1} ) = \tr \, \sigma_{i} = 0 \end{equation} この性質と \(U^{-1}\sigma_{i}U\) の対角成分が \(1\) か \(-1\) であることを考慮すると、\(\sigma_{i}\) が偶数次の正方行列でなければならないとわかる(なぜならば対角成分が \(1\) と \(-1\) の値しかとらない行列に対して、そのトレースが \(0\) となるためには \(1\) と \(-1\) の現れる回数は等しくなければならない)。\(\sigma_{i}^{2}=I\) であるが、単位行列 \(I\) や \(-I\) がそのまま \(\sigma_{i}\) の行列表現となることはないわけである。なお \(\sigma_{i}\) の固有値がわかるとトレースだけでなく行列式を求めることもできる。\(\sigma_{i}\) は偶数次の行列であったから、その行や列の数を \(2n\) と置くとことにすると、それを対角化したとき対角成分には \(1\) と \(-1\) が \(n\) 回ずつ現れることとなるので \begin{equation} \det \sigma_{i} = \det( \sigma_{i} U U^{-1} ) = \det( U^{-1} \sigma_{i} U ) = (-1)^{n} \end{equation} となる。途中で行列式の性質 \(\det(AB)=\det(BA)\) を使った。とくに \(2\times2\) 行列の場合には \(\sigma_{i}\) の行列式は \(-1\) である。この節の最後に \(\sigma_{x},\sigma_{y},\sigma_{z}\) を表す3つの行列がすべて異なる形になることを示そう。仮に \(\sigma_{x}\) と \(\sigma_{y}\) の行列表現が同じになったと仮定する。するとそれらは同じ行列なので当然交換するはずだが、交換関係\eqref{eq4}より \([\sigma_{x},\sigma_{y}]=2i\sigma_{z}\) であるから \begin{equation*} [ \sigma_{x}, \sigma_{y} ] = 2i \sigma_{z} = 0 \end{equation*} となり \(\sigma_{z}\) は零行列となってしまう。しかしユニタリー性により \(\sigma_{z}^{2}=I\) だから、これは矛盾である。したがって \(\sigma_{x},\sigma_{y},\sigma_{z}\) の行列表現はすべて互いに異なっている。

ここまででわかった \(\sigma_{i}\) の行列としての性質をまとめると次のようになる:

  1. エルミート行列かつユニタリー行列
  2. 偶数次の正方行列
  3. 行列のサイズを \(2n\times2n\) とすると固有値は \(1\) と \(-1\) が \(n\) 個ずつ
  4. トレース: \(\tr\,\sigma_{i}=0\)
  5. 行列式: \(\det\sigma_{i}=(-1)^{n}\)
  6. \(\sigma_{x},\sigma_{y},\sigma_{z}\) の行列表現はすべて互いに異なる。

パウリ行列

上で調べた一般的性質をもとに \(\sigma_{i}\) の具体的な行列表現を求めてみよう。\(\sigma_{i}\) は偶数次の行列でなければならないから、まずはいちばんサイズの小さな \(2\times2\) の行列表現を探してみることにする(もし \(2\times2\) の表現がうまく見つけられなかったら \(4\times4\) やそれ以上の表現を探せばよい)。トレース \(0\) の \(2\times2\) エルミート行列のもっとも一般的な形は \(a,b,c\) を実数として \begin{equation} \sigma_{i} = \begin{bmatrix} a & b+ci \\ b-ci & -a \end{bmatrix} \label{matrix} \end{equation} である。この一般形に対して \(\sigma_{i}^{2}\) を計算すると \begin{align*} \sigma_{i}^{2} &= \begin{bmatrix} a & b+ci \\ b-ci & -a \end{bmatrix} \begin{bmatrix} a & b+ci \\ b-ci & -a \end{bmatrix} \\[8pt] &= \begin{bmatrix} a^{2}+b^{2}+c^{2} & 0 \\ 0 & a^{2}+b^{2}+c^{2} \end{bmatrix} \end{align*} になるので、ユニタリー性 \(\sigma_{i}^{2}=I\) より \begin{equation} a^{2} + b^{2} + c^{2} = 1 \label{unitarity2} \end{equation} という条件が得られる。また行列式の条件 \(\det\sigma_{i}=-1\) は \begin{equation*} \det \sigma_{i} = \det \begin{bmatrix} a & b+ci \\ b-ci & -a \end{bmatrix} = -a^{2} - b^{2} - c^{2} \end{equation*} より式\eqref{unitarity2}と同じ条件を与える。

式\eqref{unitarity2}の条件を満たす\eqref{matrix}の形の行列のうち、さらに式\eqref{eq2}と\eqref{eq3}の条件 \begin{equation} \sigma_{y} \sigma_{z} + \sigma_{z} \sigma_{y} = 0, \4 \sigma_{z} \sigma_{x} + \sigma_{x} \sigma_{z} = 0, \4 \sigma_{x} \sigma_{y} + \sigma_{y} \sigma_{x} = 0 \label{eq5} \end{equation} \begin{equation} \sigma_{y} \sigma_{z} = i \sigma_{x}, \4 \sigma_{z} \sigma_{x} = i \sigma_{y}, \4 \sigma_{x} \sigma_{y} = i \sigma_{z} \label{eq6} \end{equation} を満足する3つの行列 \(\sigma_{x},\sigma_{y},\sigma_{z}\) を求めたい。けれど、これ以上は行列の成分を決める手がかりがないため、まずは \(\sigma_{z}\) の成分を適当に決めてしまうことにしよう。

できるだけ簡単な形を使ったほうが計算には便利だろうから、\(\sigma_{z}\) を対角行列 \begin{equation} \sigma_{z} = \begin{bmatrix} 1 & 0 \\ 0 & -1 \end{bmatrix} \end{equation} にとる。この行列が式\eqref{unitarity2}の条件を満足していることは容易に確認できるだろう。次に \(\sigma_{x}\) を決めよう。すでに \(\sigma_{z}\) の形が定まっているから \(\sigma_{x}\) の形には少し制限が付く。具体的には式\eqref{eq5}のまん中の関係式 \begin{equation*} \sigma_{z} \sigma_{x} + \sigma_{x} \sigma_{z} = 0 \end{equation*} である。\(\sigma_{x}\) の形を式\eqref{matrix}のように置いて \(\sigma_{z}\sigma_{x}+\sigma_{x}\sigma_{z}\) を計算すると \begin{equation*} \begin{bmatrix} 1 & 0 \\ 0 & -1 \end{bmatrix} \begin{bmatrix} a & b+ci \\ b-ci & -a \end{bmatrix} + \begin{bmatrix} a & b+ci \\ b-ci & -a \end{bmatrix} \begin{bmatrix} 1 & 0 \\ 0 & -1 \end{bmatrix} = \begin{bmatrix} 2a & 0 \\ 0 & 2a \end{bmatrix} \end{equation*} となるが、これが \(0\) となるためには \(a=0\) でなければならない。つまり行列 \(\sigma_{x}\) は \begin{equation*} \sigma_{x} = \begin{bmatrix} 0 & b+ci \\ b-ci & 0 \end{bmatrix} \end{equation*} という形に制限される。今のところこれ以上 \(\sigma_{x}\) に課される制限はないので、先ほどと同じように計算ができるだけ簡単になるよう \begin{equation} \sigma_{x} = \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix} \end{equation} という形に決めてしまおう。この行列が条件\eqref{unitarity2}を満足していることも明らかである。最後に \(\sigma_{y}\) を決めたいのだが、こちらには \(\sigma_{x}\) よりもさらに強い制限が付く、と言うより式\eqref{eq6}のまん中の関係式 \begin{equation*} \sigma_{z} \sigma_{x} = i \sigma_{y} \end{equation*} より一意に決まってしまう。実際 \begin{equation*} \sigma_{z} \sigma_{x} = \begin{bmatrix} 1 & 0 \\ 0 & -1 \end{bmatrix} \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix} = \begin{bmatrix} 0 & 1 \\ -1 & 0 \end{bmatrix} \end{equation*} より \begin{equation} \sigma_{y} = \begin{bmatrix} 0 & -i \\ i & 0 \end{bmatrix} \end{equation} となる。この行列は式\eqref{matrix}の形をしており、条件\eqref{unitarity2}もきちんと満足している。以上で \(\bm{\sigma}\) の3つの成分を表現する行列がすべて求まった: \begin{equation} \sigma_{x} = \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix}, \4 \sigma_{y} = \begin{bmatrix} 0 & -i \\ i & 0 \end{bmatrix}, \4 \sigma_{z} = \begin{bmatrix} 1 & 0 \\ 0 & -1 \end{bmatrix} \end{equation} これはよく知られているパウリ行列と全く同じである。実はまだ、この3つの行列が式\eqref{eq5}と式\eqref{eq6}の条件をすべて満足しているかどうかはチェックしていないのであるが、実際に1つずつ代入していくことですべての条件がきちんと満たされることを確認できるだろう。

高次元への一般化

以上、スピンやパウリ行列の理論的導出を行った。もしかすると以上の話の流れを見て、あらかじめスピンやパウリ行列の性質を知っていたから、それと辻褄を合わせるように無理矢理ロジックを組み立てたようだと感じる人がいるかもしれない。3次元空間だけを見ていると確かにそう見えるかもしれないが、実のことを言うと、元々この方法は3次元空間ではなく、一般次元の空間においてスピンの性質を調べるために考案したものである(実はこのページで示したスピン導出の論法は、一般の次元においてもほぼそのままの形で適用できる)。私自身は、高次元空間におけるスピンの性質を何も知らない状態で、上で述べたのと同様の導出法だけを頼りにして、スピンやパウリ行列の性質をすべて知ることができた。4次元以上の高次元空間において我々はスピンのことを何も知らない。例えば、4次元空間でスピンは何個の成分をもつベクトルになるだろう? そもそもスピンはベクトル量なのだろうか? またスピンはどのような演算規則を満足するだろう? これまでの伝統的なスピンの導入法に頼っていてはこれらの質問に対して何一つ明確な回答を与えることはできないはずだ。(答えを言うと、4次元空間においてスピンは6個の独立成分をもつ「2-ベクトル」という2階の反対称テンソルとなり、式\eqref{eq3}に似た演算規則を満足する。そして、一般化されたパウリ行列の最小サイズは相変わらず \(2\times2\) である。詳しくは「スピンの理論的導出」を参照。)

このページで示したスピンの導出法は、「スピン」という存在に対する理解を深めてもくれる。元々スピンは電子の自転にともなう角運動量というアイディアで導入されたものであったが、そもそも電子のような構造のない点粒子に対して自転という描像を用いるのは適当でない。そのためスピンの存在は「量子力学的な内部自由度」というよくわからない言葉によってしばしば誤魔化されてしまう。しかし、上で見てきた導出法によれば、電子の状態の二価性の起源は単純な \(\bm{L}^{2}\) の測定においては同一視されてしまう、本来は異なるはずの軌道角運動量の二状態をきちんと区別したことにある。このように考えはじめると「スピン」などというよくわからない自由度を導入する必然性はなくなり(もちろん計算のためにパウリ行列という数学的な道具はこれまでと同じように用いられるのだが)、直観的に理解しやすい軌道角運動量だけを物理的実体として認めればよいことになる。その意味でこのページの話はスピンを軌道角運動量に統一する理論だったわけである。