No.379 - 高校数学で理解する秘書問題 [科学]
\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{#1}} \newcommand{\ol}[1]{\overline{#1}} \newcommand{\sb}{\subset} \newcommand{\sp}{\supset} \newcommand{\al}{\alpha} \newcommand{\sg}{\sigma}\newcommand{\cd}{\cdots}\)
No.376「高校数学で理解するマッチング問題」に関連する話題を取り上げます。関連といっても "答が同じ数値になる" という意味の関連で、問題の性質は違います。
No.376 では、一般的にマッチング問題(出会いの問題)と言われるものを「席替えの成功確率」という形で提示しました。次のような問題です。
No.376 ではこの確率がおよそ 0.368 であること、また人数が増えると \(\dfrac{1}{e}=0.3678794411\cd\) に収束していくことを見ました(\(e\) は自然対数の底=ネイピア数)。席替えが成功する確率はクラスの人数が少なければ低く、クラスの人数が多ければ高いと考えるのが普通でしょう。しかし実際にはクラスの人数にかかわらず(6人以上のクラスであれば)ほぼ 0.368 であり、それより成功確率が大きくなることはない。これが少々意外な結論でした。
この \(\dfrac{1}{e}\) という値が答になる別の確率の問題があります。「秘書問題(secretary problem)」です。これも少々意外な確率が答になります。
秘書問題
一般的に「秘書問題」と言われているものは次のようなものです。
もし、全員と面接してからそのうちの一人に採用を通知するなら話は簡単です。全員の相対的な優先順位をつけられるので、1位の人に通知すればよい。しかしこの問題では「面接した直後に採用するか採用しないかを通知する」必要があります。このとき「もし仮に全員と面接したとしたら優先順位が1位になるはずの人を採用できる確率」を最も大きくするのが問題です。面接の順序はランダムであることにも注意します。この問題を数学的に解析します。
最大値のカードを選択する戦略
説明の都合上、カードを選択する問題にします。秘書問題と等価です。
まず、\(\bs{n=5}\) の場合で、とりうる戦略と確率を分析します。裏返しのカードは順に \(C_1\)、\(C_2\)、\(C_3\)、\(C_4\)、\(C_5\) です。それぞれのカードの表に書かれている実数値を \(V(C_n)\) とします(\(V\::\) value)。戦略立案の条件は、
です。\(T\) を選択する確率を最大化する問題なので、この条件は必須です。この条件に合致する戦略は、以降で検討するように5種類あるので、それを \(S_n\:\:(n=0,\:1,\:2,\:3,\:4)\) で表します(\(S\::\) strategy)。また、戦略 \(S_n\) のときに 最大カード・\(T\) を選択できる確率を \(P(S_n)\) とします(\(P\::\) probability)。
戦略:\(S_0\)
最初のカード \(C_1\) は「無条件に選択するか、無条件に選択しないかのどちらか」です。利用できる情報は \(V(C_1)\) だけですが、\(V(C_1)\) を見ても全体の中での順位は全く判断できないからです。たとえ \(V(C_1)=0.00001\) などであっても、実数値はいくらでも小さくできるので、それが最大カードの可能性があります。
そこで、最初のカード \(\bs{C_1}\) を必ず選択する戦略を \(S_0\) とします。\(T\) の位置はランダムなので、
戦略:\(S_1\)
戦略:\(S_1\) では、\(\bs{C_1}\) は必ず選択せずに "様子見" とし、その後の \(C_2\)、\(C_3\)、\(C_4\) の状況で選択するカードを決めます。もし \(V(C_1) < V(C_2)\) なら \(C_2\) を選択します。もちろん、\(C_2\) が最大カード・\(T\) かどうかは分かりません。しかし、\(\bs{C_1}\) は \(\bs{T}\) ではない確証を得たので、\(\bs{C_1}\) を選択せずに済んだ(= \(T\) を選択する確率を高めた)という効果が出ました。なお「\(V(C_1) < V(C_2)\) であっても \(C_2\) を選択しない戦略」もありますが、その場合、\(C_1\) と \(C_2\) は必ず選択しないので、それは次項の "戦略:\(S_2\)" です。
もし \(\bs{V(C_1) > V(C_2)}\) なら、\(\bs{C_2}\) は \(\bs{T}\) でありません。従って \(C_2\) を選択せずに \(C_3\) を表にします。そして \(V(C_1) < V(C_3)\) であれば \(C_3\) を選択します。もちろん \(C_3\) が \(T\) かどうかは分かりませんが、\(\bs{C_2}\) に加えて \(\bs{C_1}\) も \(\bs{T}\) ではない確証を得たという効果が生じました。
もし \(V(C_1) > V(C_3)\) なら \(C_3\) は \(T\) ではないことが分かったので、\(C_4\) を表にします。なお「\(V(C_1) < V(C_3)\) であっても \(C_3\) を選択しない」という戦略も考えられますが、その場合、\(C_1\)、\(C_2\)、\(C_3\) は必ず選択しないので、それは後で述べる "戦略:\(S_3\)" です。
以下、同様の考え方で \(C_4\) を選択するかどうかを決めます。つまり、\(\bs{V(C_1)}\) より大きな実数値が出たとき、そのカードを選択します。この方針で \(C_4\) も選択しなければ、最終的にどれか1枚を選択する必要があるので \(C_5\) を選択します。
ここで、戦略:\(S_1\) で \(T\) を選択できる確率、\(P(S_1)\) を計算します。
\(\bs{C_1=T}\) のとき、\(C_1\) は選択しないので、
\(P(S_1)=0\)
\(\bs{C_2=T}\) のとき、必ず \(C_2\) を選択することになります。\(C_2=T\) となる確率は \(\dfrac{1}{5}\) なので、
\(P(S_1)=\dfrac{1}{5}\)
\(\bs{C_3=T}\) のとき、\(C_3\) を選択するのは \(V(C_1) > V(C_2)\) のとき(= \(C_2\) を選択しないとき)です。カードの並べ方はランダムなので、\(V(C_1) > V(C_2)\) となるか \(V(C_1) < V(C_2)\) かは半々です。従って、
\(P(S_1)=\dfrac{1}{5}\times\dfrac{1}{2}\)
\(\bs{C_4=T}\) のとき、\(C_4\) を選択するのは \(C_2\)、\(C_3\) を選択しない場合です。\(V(C_1)\)、\(V(C_2)\)、\(V(C_3)\) のうちの最大値がどれかは3つの場合がありますが、\(C_2\) か \(C_3\) が選択されないのは、最大値が \(V(C_1)\) のときだけです。つまり割合として \(\dfrac{1}{3}\) の場合です。従って、
\(P(S_1)=\dfrac{1}{5}\times\dfrac{1}{3}\)
\(\bs{C_5=T}\) のとき、\(C_5\) を選択するのは \(C_2\)、\(C_3\)、\(C_4\) を選択しない場合だけです。\(V(C_1)\)、\(V(C_2)\)、\(V(C_3)\)、\(V(C_4)\) のうちの最大値がどれかは4つの場合がありますが、\(C_2\)、\(C_3\)、\(C_4\) のどれもが選択されないのは、最大値が \(V(C_1)\) のときだけです。つまり割合として \(\dfrac{1}{4}\) の場合です。従って、
\(P(S_1)=\dfrac{1}{5}\times\dfrac{1}{4}\)
以上の5つケースは排他的なので、
\(\begin{eqnarray}
&&\:\:P(S_1)&=\dfrac{1}{5}\left(1+\dfrac{1}{2}+\dfrac{1}{3}+\dfrac{1}{4}\right)\\
&&&=\dfrac{1}{5}\cdot\dfrac{25}{12}\\
&&&=0.4167\\
\end{eqnarray}\)
が \(T\) を選択できる確率です。\(S_0\) よりは \(2\)倍以上の確率になりました。
戦略:\(S_2\)
この戦略では、\(C_1\)、\(C_2\) は様子見として選択せず(=たとえ \(V(C_1) < V(C_2)\) であっても \(C_2\) を選択しない)、\(C_3\)、\(C_4\) の状況で判断します。選択の判断は \(S_1\) と同様です。つまり、様子見のカード、\(\bs{V(C_1)}\)、\(\bs{V(C_2)}\) より大きな実数値のカードを選択します。
\(C_1=T\) または \(C_2=T\) のとき、\(T\) は選択されません。
\(C_3=T\) のときは必ず \(T\) が選択されます。
\(C_4=T\) のとき、\(C_4\) が選択されるのは \(V(C_1)\)、\(V(C_2)\)、\(V(C_3)\) のうちの最大値が \(V(C_1)\)、\(V(C_2)\) のどちらかの場合です。\(V(C_3)\) が最大値だと \(C_3\) を選択してしまうからです。つまり \(\dfrac{2}{3}\) の割合です。
\(C_5=T\) のとき、\(C_5\) が選択されるのは \(V(C_1)\)、\(V(C_2)\)、\(V(C_3)\)、\(V(C_4)\)のうちの最大値が \(V(C_1)\)、\(V(C_2)\) のどちらかの場合です。そうでなければ \(C_3\) か \(C_4\) を選択してしまうからです。つまり \(\dfrac{2}{4}=\dfrac{1}{2}\) の割合です。まとめると、
\(\begin{eqnarray}
&&\:\:P(S_2)&=\dfrac{1}{5}\left(1+\dfrac{2}{3}+\dfrac{1}{2}\right)\\
&&&=\dfrac{1}{5}\cdot\dfrac{13}{6}\\
&&&=0.4333\\
\end{eqnarray}\)
となります。\(P(S_1)\) より大きい値です。
戦略:\(S_3\)
この戦略では、\(C_1\)、\(C_2\)、\(C_3\) は様子見として選択せず、\(C_4\) の状況で判断します。\(V(C_1)\)、\(V(C_2)\)、\(V(C_3)\) より \(V(C_4)\) が大きな実数値のときに、\(C_4\) を選択します。
\(C_1=T\) または \(C_2=T\) または \(C_3=T\) のとき、\(T\) は選択されません。
\(C_4=T\) のときは必ず \(T\) が選択されます。
\(C_5=T\) のとき、\(C_5\) が選択されるのは \(V(C_1)\)、\(V(C_2)\)、\(V(C_3)\)、\(V(C_4)\) のうちの最大値が\(V(C_4)\) ではない場合です。\(V(C_4)\) が最大値だと \(C_4\) を選択してしまうからです。つまり \(C_5\) が選択されるのは \(\dfrac{3}{4}\) の場合です。まとめると、
\(\begin{eqnarray}
&&\:\:P(S_3)&=\dfrac{1}{5}\left(1+\dfrac{3}{4}\right)\\
&&&=\dfrac{1}{5}\cdot\dfrac{7}{4}\\
&&&=0.3500\\
\end{eqnarray}\)
となり、\(P(S_2)\) より小さくなりました。
戦略:\(S_4\)
この戦略では \(C_1\)、\(C_2\)、\(C_3\)、\(C_4\) を選択せず、必ず \(C_5\) を選択します。\(C_5=T\) である確率は \(\dfrac{1}{5}\) であり、
\(P(S_4)=0.2\)
となって、\(P(S_0)\) と同じ確率です。
\(n=5\) の場合のまとめ
以上の検討結果により \(n=5\) の場合で可能な戦略は、「最大カード・\(T\) ではないとの確証を得たカードは選択しない」という条件のもとで \(S_0\) ~ \(S_4\) の5種であり、これ以外にはありません。各戦略ごとの確率をまとめると、
\(P(S_0)=0.2\)
\(P(S_1)=0.4167\)
\(P(S_2)=0.4333\)
\(P(S_3)=0.35\)
\(P(S_4)=0.2\)
で、\(n=5\) では「戦略:\(S_2\)」が最大カード・\(T\) を選択する確率を最大化します。この "確率最大化" の検討過程から、次のようなことが分かります。
一般化
\(n=5\) のときの考察を一般化し、\(n\) を \(n\geq2\) の任意の数とします。一般化された戦略は、
です。また、
とします。もし \(1\leq t\leq k\) なら \(T\) を選択することはないので、確率は \(0\) です。
\(\bs{k < t\leq n}\) のとき、\(\bs{T}\) を選択するのは、\(\bs{V(C_1)}\)、\(\bs{V(C_2)}\)、\(\bs{\cd}\)、\(\bs{V(C_{t-1})}\) の中での最大が、\(\bs{V(C_1)}\)、\(\bs{V(C_2)}\)、\(\bs{\cd\:V(C_k)}\) の中にある場合だけです。そうでなければ \(\bs{T}\) にたどりつく前に \(\bs{C_{k+1}}\)、\(\bs{\cd\:C_{t-1}}\) のどれかを選択してしまうからです。つまり \(T\) を選択するのは、割合としては \(\dfrac{k}{t-1}\) の場合です。
\(t\) 番目に \(T\) がある確率は \(\dfrac{1}{n}\) なので、\(T\) を選択する確率は、
\(\dfrac{1}{n}\cdot\dfrac{k}{t-1}\)
です。全体の確率は、この式を \(t\) の範囲 \((k < t\leq n)\) で合計し、
\(\begin{eqnarray}
&&\:\:P(S_k)&=\displaystyle\sum_{t=k+1}^{n}\dfrac{1}{n}\cdot\dfrac{k}{t-1}\\
&&&=\dfrac{k}{n}\displaystyle\sum_{t=k+1}^{n}\cdot\dfrac{1}{t-1}\\
&&&=\dfrac{k}{n}\displaystyle\sum_{t=k}^{n-1}\cdot\dfrac{1}{t}\\
&&&=\dfrac{k}{n}\left(\dfrac{1}{k}+\dfrac{1}{k+1}+\:\cd\:+\dfrac{1}{n-1}\right)\\
\end{eqnarray}\)
となります。
\(n=5\) のときには、上で計算したように戦略:\(S_2\) が最大確率になりました。では、一般の場合に最大確率になる戦略 \(S_k\) は何か。\(n=5,\:10,\:15,\:\cd\:,\:100\) の場合をパソコンで計算してみると、次の表の通りです。
\(n\) が大きくなれば、\(T\) を選択する確率が最大になるのは、様子見をしたカードが全体の \(36\%\)~\(37\%\) 程度のときであり、そのときの確率は \(0.37\) 程度であることが分かります。
\(n\) が十分に大きいとき
\(n\) が十分に大きい前提で、最大確率となる \(S_k\) を数学的に求めます。そのために \(P(S_k)\) の式を簡便な形に変換します。上で計算したように、
\(P(S_k)=\dfrac{k}{n}\displaystyle\sum_{t=k}^{n-1}\dfrac{1}{t}\)
であり、図2でグレーで示した部分の面積に \(\dfrac{k}{n}\) を掛けたものが \(P(S_k)\) です。
従って、積分で計算可能な "図2の赤色の部分" に \(\dfrac{k}{n}\) を掛けると \(P(S_k)\) の下限値になり、
\(P(S_k) > \dfrac{k}{n}\displaystyle\int_{k}^{n}\dfrac{1}{t}\,dt\)
です。置換積分を使うために、
\(\begin{eqnarray}
&&\:\:t&=ns\\
&&\:\:s&=\dfrac{t}{n}\\
&&\:\:dt&=n\,ds\\
\end{eqnarray}\)
と置くと、
\(\begin{eqnarray}
&&\:\:P(S_k)& > \phantom{-}\dfrac{k}{n}\displaystyle\int_{1}^{\tfrac{k}{n}}\dfrac{1}{ns}\cdot n\,ds\\
&&&=\phantom{-}\dfrac{k}{n}\displaystyle\int_{1}^{\tfrac{k}{n}}\dfrac{1}{s}\,ds\\
&&&=-\dfrac{k}{n}\mr{log}\left(\dfrac{k}{n}\right) \br{①}\\
\end{eqnarray}\)
となります。
図2のグレーの部分を \(1\) だけ左にずらしたのが下の図3です。左へずらすことで \(k\) ~ \(n\) の範囲からはみ出た部分の面積は \(\dfrac{1}{k}\) です。
従って、積分を使って \(P(S_k)\) の上限値を求めると、
\(\begin{eqnarray}
&&\:\:P(S_k)& < \dfrac{k}{n}\left(\dfrac{1}{k}+\displaystyle\int_{k}^{n-1}\dfrac{1}{t}\,dt\right)\\
&&&=\dfrac{k}{n}\left(\dfrac{1}{k}+\displaystyle\int_{\tfrac{k}{n}}^{1-\tfrac{1}{n}}\dfrac{1}{s}\,ds\right)\\
&&&=\dfrac{k}{n}\left(\dfrac{1}{k}+\mr{log}\left(1-\dfrac{1}{n}\right)-\mr{log}\left(\dfrac{k}{n}\right)\right)\\
&&&=\dfrac{1}{n}+\dfrac{k}{n}\mr{log}\left(1-\dfrac{1}{n}\right)-\dfrac{k}{n}\mr{log}\left(\dfrac{k}{n}\right)\\
\end{eqnarray}\)
と計算できます。ここで、
\(\al=\dfrac{1}{n}+\dfrac{k}{n}\mr{log}\left(1-\dfrac{1}{n}\right)\)
と置くと、
\(\begin{eqnarray}
&&\:\:\dfrac{1}{n}\rightarrow0 &(n\rightarrow\infty)\\
&&\:\:\mr{log}\left(1-\dfrac{1}{n}\right)\rightarrow0 &(n\rightarrow\infty)\\
\end{eqnarray}\)
\(0 < \dfrac{k}{n} < 1\)
なので、
\(P(S_k) < \al-\dfrac{k}{n}\mr{log}\left(\dfrac{k}{n}\right)\) \(\br{②}\)
\(\al\rightarrow0\:\:(n\rightarrow\infty)\)
となります。下限値の \(\br{①}\) 式と、上限値の \(\br{②}\) 式 を合わせると、
\(-\dfrac{k}{n}\mr{log}\left(\dfrac{k}{n}\right) < P(S_k) < \al-\dfrac{k}{n}\mr{log}\left(\dfrac{k}{n}\right)\)
\(\al\rightarrow0\:\:(n\rightarrow\infty)\)
となって、\(n\) が十分大きいときには、
\(P(S_k)=-\dfrac{k}{n}\mr{log}\left(\dfrac{k}{n}\right)\) \(\br{③}\)
とみなしてよいことが分かりました。ここで \(x=\dfrac{k}{n}\) とすると、
\(P(S_k)=-x\mr{log}(x)\)
となります。\(P(S_k)\) が最大値となる \(x\) を求めるために、右辺を微分して \(0\) とおくと、
\(\begin{eqnarray}
&&\:\:-&\mr{log}(x)-1&=\phantom{-}0\\
&&&\mr{log}(x)&=-1\\
\end{eqnarray}\)
\(\longrightarrow\:x=\dfrac{1}{e}\)
です。つまり、\(\dfrac{k}{n}=\dfrac{1}{e}\) のときに \(P(S_k)\) は最大値をとります。このときの \(P(S_k)\) を \(\br{③}\) 式で求めると、
\(P(S_k)\) の最大値\(=\dfrac{1}{e}\)
と計算できます。この \(\dfrac{1}{e}\) はマッチング問題と全く同じで、\(\fallingdotseq0.368\) です。かつ、この問題では答に現れる2つの数値が共に \(\dfrac{1}{e}\) です。
\(n\) が十分に大きいときは、\(P(S_k)\) の最大値は \(\dfrac{1}{e}\) ですが、上のパソコンでの計算例を見ると、\(n\) を増やしたときに \(\dfrac{1}{e}=0.3678794411\cd\) に収束する様子は、マッチング問題と違って非常に緩慢なことが分かります。
秘書問題の結論
最大値のカードを選択する戦略の結論は次のようになります。
当初の「秘書問題」の文脈でこの結論を書くと、
となります。この結論は \(n\) が十分に大きくても成り立ちます。\(\bs{n}\) がどんなに大きくても、4割程度の高確率で最良の選択ができるというのが、少々意外な結果なのでした。
No.376「高校数学で理解するマッチング問題」に関連する話題を取り上げます。関連といっても "答が同じ数値になる" という意味の関連で、問題の性質は違います。
No.376 では、一般的にマッチング問題(出会いの問題)と言われるものを「席替えの成功確率」という形で提示しました。次のような問題です。
小学校の 40人のクラスで、席替えを "くじ引き" でやるとします。まず、現在の席に 1 ~ 40 の席番号を割り振ります。担任の先生は、1~40 の数字を書いた紙を40枚用意し、その紙を数字が見えないように折って、箱の中に入れてかき混ぜます。生徒は順に箱から紙を1枚ずつ引き、そこに書かれている数字がその子の新しい席となります。 もちろんこのやり方だと、今の自分の席番号の紙を引く子が現れる可能性があります。そして「すべての子が現在の席番号と違う番号を引いたとき、席替えは成功」と定義します。40人のクラスで、席替えが(1回のくじ引きで)成功する確率はどれほどでしょうか。 |
No.376 ではこの確率がおよそ 0.368 であること、また人数が増えると \(\dfrac{1}{e}=0.3678794411\cd\) に収束していくことを見ました(\(e\) は自然対数の底=ネイピア数)。席替えが成功する確率はクラスの人数が少なければ低く、クラスの人数が多ければ高いと考えるのが普通でしょう。しかし実際にはクラスの人数にかかわらず(6人以上のクラスであれば)ほぼ 0.368 であり、それより成功確率が大きくなることはない。これが少々意外な結論でした。
この \(\dfrac{1}{e}\) という値が答になる別の確率の問題があります。「秘書問題(secretary problem)」です。これも少々意外な確率が答になります。
秘書問題
一般的に「秘書問題」と言われているものは次のようなものです。
秘書を一人採用する。 | |
応募者は n 人あった。この n 人とランダムな順で面接する。すべての人と面接するとは限らない。 | |
面接した直後に、採用するか採用しないかを通知する。採用の通知をしたら、以降の面接はしない。採用しない場合は次の面接を行う。 | |
採用しないと通知した人に対して、その通知を覆して採用することはない。 | |
面接を行った人すべてに相対的な優先順位をつけることができる。その相対順位に基づいて、直近に面接した人を採用するかしないを判断できる。 | |
この前提で、n 人の中で最も優先順位の高い人を採用する確率を最大にするには、どういう戦略をとるべきか。またその戦略をとったとき、n 人の中で最も優先順位の高い人を採用できる確率はいくらか。 |
もし、全員と面接してからそのうちの一人に採用を通知するなら話は簡単です。全員の相対的な優先順位をつけられるので、1位の人に通知すればよい。しかしこの問題では「面接した直後に採用するか採用しないかを通知する」必要があります。このとき「もし仮に全員と面接したとしたら優先順位が1位になるはずの人を採用できる確率」を最も大きくするのが問題です。面接の順序はランダムであることにも注意します。この問題を数学的に解析します。
最大値のカードを選択する戦略
説明の都合上、カードを選択する問題にします。秘書問題と等価です。
\(n\) 枚のカードがあります。それぞれのカードの表には、相異なる正の実数値が一つずつ書いてあります。 | |
実数値の範囲は全く不明です。\(n\) 個の実数値には最大と最小があるはずですが、実数値はどんなに大きくも、また小さくもできるので、1枚のカードを見ただけでは最大や最小の判断はできません。\(100,000\) のような数値でも、それが最小値かも知れない。もちろん、複数のカードを見ればその大小関係を判断することができます。 | |
最大の実数値が書かれたカードを「最大カード」とよび、\(T\) で表します(\(T\::\) target)。 | |
この \(n\) 枚のカードをよくシャッフルし、裏返しにして、一列に並べます。順に \(C_1\)、\(C_2\)、\(\cd\)、\(C_n\) とします(\(C\::\) card)。このうちのどれかが \(T\) です。\(T\) を選択するのが問題です。 | |
\(C_1\)、\(C_2\)、\(\cd\) と順にカードを表にしていき、表にしたカードの最新のものを選択するかどうかを判断します。このとき、表にしてある全部のカードの実数値を比較検討できますが、選択できるのは最新に表にしたカードだけです。また、最終的にはどれかのカードを必ず選択しなければなりません。 | |
「最大カード」\(T\) を選択できる確率を最も大きくする戦略と、そのときの確率を求めるのが問題です。 |
まず、\(\bs{n=5}\) の場合で、とりうる戦略と確率を分析します。裏返しのカードは順に \(C_1\)、\(C_2\)、\(C_3\)、\(C_4\)、\(C_5\) です。それぞれのカードの表に書かれている実数値を \(V(C_n)\) とします(\(V\::\) value)。戦略立案の条件は、
最大カード・\(\bs{T}\) ではないとの確証を得たカードは選択しない
です。\(T\) を選択する確率を最大化する問題なので、この条件は必須です。この条件に合致する戦略は、以降で検討するように5種類あるので、それを \(S_n\:\:(n=0,\:1,\:2,\:3,\:4)\) で表します(\(S\::\) strategy)。また、戦略 \(S_n\) のときに 最大カード・\(T\) を選択できる確率を \(P(S_n)\) とします(\(P\::\) probability)。
戦略:\(S_0\)
最初のカード \(C_1\) は「無条件に選択するか、無条件に選択しないかのどちらか」です。利用できる情報は \(V(C_1)\) だけですが、\(V(C_1)\) を見ても全体の中での順位は全く判断できないからです。たとえ \(V(C_1)=0.00001\) などであっても、実数値はいくらでも小さくできるので、それが最大カードの可能性があります。
そこで、最初のカード \(\bs{C_1}\) を必ず選択する戦略を \(S_0\) とします。\(T\) の位置はランダムなので、
\(P(S_0)=\dfrac{1}{5}=0.2\)
です。戦略:\(S_1\)
戦略:\(S_1\) では、\(\bs{C_1}\) は必ず選択せずに "様子見" とし、その後の \(C_2\)、\(C_3\)、\(C_4\) の状況で選択するカードを決めます。もし \(V(C_1) < V(C_2)\) なら \(C_2\) を選択します。もちろん、\(C_2\) が最大カード・\(T\) かどうかは分かりません。しかし、\(\bs{C_1}\) は \(\bs{T}\) ではない確証を得たので、\(\bs{C_1}\) を選択せずに済んだ(= \(T\) を選択する確率を高めた)という効果が出ました。なお「\(V(C_1) < V(C_2)\) であっても \(C_2\) を選択しない戦略」もありますが、その場合、\(C_1\) と \(C_2\) は必ず選択しないので、それは次項の "戦略:\(S_2\)" です。
もし \(\bs{V(C_1) > V(C_2)}\) なら、\(\bs{C_2}\) は \(\bs{T}\) でありません。従って \(C_2\) を選択せずに \(C_3\) を表にします。そして \(V(C_1) < V(C_3)\) であれば \(C_3\) を選択します。もちろん \(C_3\) が \(T\) かどうかは分かりませんが、\(\bs{C_2}\) に加えて \(\bs{C_1}\) も \(\bs{T}\) ではない確証を得たという効果が生じました。
もし \(V(C_1) > V(C_3)\) なら \(C_3\) は \(T\) ではないことが分かったので、\(C_4\) を表にします。なお「\(V(C_1) < V(C_3)\) であっても \(C_3\) を選択しない」という戦略も考えられますが、その場合、\(C_1\)、\(C_2\)、\(C_3\) は必ず選択しないので、それは後で述べる "戦略:\(S_3\)" です。
以下、同様の考え方で \(C_4\) を選択するかどうかを決めます。つまり、\(\bs{V(C_1)}\) より大きな実数値が出たとき、そのカードを選択します。この方針で \(C_4\) も選択しなければ、最終的にどれか1枚を選択する必要があるので \(C_5\) を選択します。
ここで、戦略:\(S_1\) で \(T\) を選択できる確率、\(P(S_1)\) を計算します。
\(\bs{C_1=T}\) のとき、\(C_1\) は選択しないので、
\(P(S_1)=0\)
\(\bs{C_2=T}\) のとき、必ず \(C_2\) を選択することになります。\(C_2=T\) となる確率は \(\dfrac{1}{5}\) なので、
\(P(S_1)=\dfrac{1}{5}\)
\(\bs{C_3=T}\) のとき、\(C_3\) を選択するのは \(V(C_1) > V(C_2)\) のとき(= \(C_2\) を選択しないとき)です。カードの並べ方はランダムなので、\(V(C_1) > V(C_2)\) となるか \(V(C_1) < V(C_2)\) かは半々です。従って、
\(P(S_1)=\dfrac{1}{5}\times\dfrac{1}{2}\)
\(\bs{C_4=T}\) のとき、\(C_4\) を選択するのは \(C_2\)、\(C_3\) を選択しない場合です。\(V(C_1)\)、\(V(C_2)\)、\(V(C_3)\) のうちの最大値がどれかは3つの場合がありますが、\(C_2\) か \(C_3\) が選択されないのは、最大値が \(V(C_1)\) のときだけです。つまり割合として \(\dfrac{1}{3}\) の場合です。従って、
\(P(S_1)=\dfrac{1}{5}\times\dfrac{1}{3}\)
\(\bs{C_5=T}\) のとき、\(C_5\) を選択するのは \(C_2\)、\(C_3\)、\(C_4\) を選択しない場合だけです。\(V(C_1)\)、\(V(C_2)\)、\(V(C_3)\)、\(V(C_4)\) のうちの最大値がどれかは4つの場合がありますが、\(C_2\)、\(C_3\)、\(C_4\) のどれもが選択されないのは、最大値が \(V(C_1)\) のときだけです。つまり割合として \(\dfrac{1}{4}\) の場合です。従って、
\(P(S_1)=\dfrac{1}{5}\times\dfrac{1}{4}\)
以上の5つケースは排他的なので、
\(\begin{eqnarray}
&&\:\:P(S_1)&=\dfrac{1}{5}\left(1+\dfrac{1}{2}+\dfrac{1}{3}+\dfrac{1}{4}\right)\\
&&&=\dfrac{1}{5}\cdot\dfrac{25}{12}\\
&&&=0.4167\\
\end{eqnarray}\)
が \(T\) を選択できる確率です。\(S_0\) よりは \(2\)倍以上の確率になりました。
戦略:\(S_2\)
この戦略では、\(C_1\)、\(C_2\) は様子見として選択せず(=たとえ \(V(C_1) < V(C_2)\) であっても \(C_2\) を選択しない)、\(C_3\)、\(C_4\) の状況で判断します。選択の判断は \(S_1\) と同様です。つまり、様子見のカード、\(\bs{V(C_1)}\)、\(\bs{V(C_2)}\) より大きな実数値のカードを選択します。
\(C_1=T\) または \(C_2=T\) のとき、\(T\) は選択されません。
\(C_3=T\) のときは必ず \(T\) が選択されます。
\(C_4=T\) のとき、\(C_4\) が選択されるのは \(V(C_1)\)、\(V(C_2)\)、\(V(C_3)\) のうちの最大値が \(V(C_1)\)、\(V(C_2)\) のどちらかの場合です。\(V(C_3)\) が最大値だと \(C_3\) を選択してしまうからです。つまり \(\dfrac{2}{3}\) の割合です。
\(C_5=T\) のとき、\(C_5\) が選択されるのは \(V(C_1)\)、\(V(C_2)\)、\(V(C_3)\)、\(V(C_4)\)のうちの最大値が \(V(C_1)\)、\(V(C_2)\) のどちらかの場合です。そうでなければ \(C_3\) か \(C_4\) を選択してしまうからです。つまり \(\dfrac{2}{4}=\dfrac{1}{2}\) の割合です。まとめると、
\(\begin{eqnarray}
&&\:\:P(S_2)&=\dfrac{1}{5}\left(1+\dfrac{2}{3}+\dfrac{1}{2}\right)\\
&&&=\dfrac{1}{5}\cdot\dfrac{13}{6}\\
&&&=0.4333\\
\end{eqnarray}\)
となります。\(P(S_1)\) より大きい値です。
戦略:\(S_3\)
この戦略では、\(C_1\)、\(C_2\)、\(C_3\) は様子見として選択せず、\(C_4\) の状況で判断します。\(V(C_1)\)、\(V(C_2)\)、\(V(C_3)\) より \(V(C_4)\) が大きな実数値のときに、\(C_4\) を選択します。
\(C_1=T\) または \(C_2=T\) または \(C_3=T\) のとき、\(T\) は選択されません。
\(C_4=T\) のときは必ず \(T\) が選択されます。
\(C_5=T\) のとき、\(C_5\) が選択されるのは \(V(C_1)\)、\(V(C_2)\)、\(V(C_3)\)、\(V(C_4)\) のうちの最大値が\(V(C_4)\) ではない場合です。\(V(C_4)\) が最大値だと \(C_4\) を選択してしまうからです。つまり \(C_5\) が選択されるのは \(\dfrac{3}{4}\) の場合です。まとめると、
\(\begin{eqnarray}
&&\:\:P(S_3)&=\dfrac{1}{5}\left(1+\dfrac{3}{4}\right)\\
&&&=\dfrac{1}{5}\cdot\dfrac{7}{4}\\
&&&=0.3500\\
\end{eqnarray}\)
となり、\(P(S_2)\) より小さくなりました。
戦略:\(S_4\)
この戦略では \(C_1\)、\(C_2\)、\(C_3\)、\(C_4\) を選択せず、必ず \(C_5\) を選択します。\(C_5=T\) である確率は \(\dfrac{1}{5}\) であり、
\(P(S_4)=0.2\)
となって、\(P(S_0)\) と同じ確率です。
\(n=5\) の場合のまとめ
以上の検討結果により \(n=5\) の場合で可能な戦略は、「最大カード・\(T\) ではないとの確証を得たカードは選択しない」という条件のもとで \(S_0\) ~ \(S_4\) の5種であり、これ以外にはありません。各戦略ごとの確率をまとめると、
\(P(S_0)=0.2\)
\(P(S_1)=0.4167\)
\(P(S_2)=0.4333\)
\(P(S_3)=0.35\)
\(P(S_4)=0.2\)
で、\(n=5\) では「戦略:\(S_2\)」が最大カード・\(T\) を選択する確率を最大化します。この "確率最大化" の検討過程から、次のようなことが分かります。
性急にカードを選択するのは損である。いくつかは "様子見" をして、そのあとに全体的な判断をすべきである。 | |
しかし、様子見をし過ぎるのも損である。様子見の中に最大カード・\(T\) が含まれる可能性が高まるからである。 | |
この2つのトレードオフで、確率を最大化する戦略が決まる。 |
一般化
\(n=5\) のときの考察を一般化し、\(n\) を \(n\geq2\) の任意の数とします。一般化された戦略は、
戦略 \(S_0\)
戦略 \(S_k\:\:(1\leq k\leq n-1)\)
最初のカードを選択する。
戦略 \(S_k\:\:(1\leq k\leq n-1)\)
\(k\) 番目までのカードは選択せず、\(k+1\) 番目以降で、\(V(C_1)\)~\(V(C_k)\) の最大値より大きな数値のカードを選択する。大きな数値が出ない場合は最後のカードを選択する。
です。また、
最大カード \(T\) の位置:\(t\) 番目
とします。もし \(1\leq t\leq k\) なら \(T\) を選択することはないので、確率は \(0\) です。
\(\bs{k < t\leq n}\) のとき、\(\bs{T}\) を選択するのは、\(\bs{V(C_1)}\)、\(\bs{V(C_2)}\)、\(\bs{\cd}\)、\(\bs{V(C_{t-1})}\) の中での最大が、\(\bs{V(C_1)}\)、\(\bs{V(C_2)}\)、\(\bs{\cd\:V(C_k)}\) の中にある場合だけです。そうでなければ \(\bs{T}\) にたどりつく前に \(\bs{C_{k+1}}\)、\(\bs{\cd\:C_{t-1}}\) のどれかを選択してしまうからです。つまり \(T\) を選択するのは、割合としては \(\dfrac{k}{t-1}\) の場合です。
![]() |
図1:最大カード・\(T\) を選択できる場合 |
\(C_1\)、 \(\cd\) 、\(C_{t-1}\) のうちの最大値のカードが \(C_{k+1}\)、 \(\cd\) 、\(C_{t-1}\) の中にあれば、そのカードを選択してしまって、\(T\) にはたどり着かない。最大値のカードが \(C_1\)、\(\cd\) 、\(C_k\) の範囲にあれば、\(T\) が選択される。もちろん、\(k < t\) であることが大前提である。 |
\(t\) 番目に \(T\) がある確率は \(\dfrac{1}{n}\) なので、\(T\) を選択する確率は、
\(\dfrac{1}{n}\cdot\dfrac{k}{t-1}\)
です。全体の確率は、この式を \(t\) の範囲 \((k < t\leq n)\) で合計し、
\(\begin{eqnarray}
&&\:\:P(S_k)&=\displaystyle\sum_{t=k+1}^{n}\dfrac{1}{n}\cdot\dfrac{k}{t-1}\\
&&&=\dfrac{k}{n}\displaystyle\sum_{t=k+1}^{n}\cdot\dfrac{1}{t-1}\\
&&&=\dfrac{k}{n}\displaystyle\sum_{t=k}^{n-1}\cdot\dfrac{1}{t}\\
&&&=\dfrac{k}{n}\left(\dfrac{1}{k}+\dfrac{1}{k+1}+\:\cd\:+\dfrac{1}{n-1}\right)\\
\end{eqnarray}\)
となります。
\(n=5\) のときには、上で計算したように戦略:\(S_2\) が最大確率になりました。では、一般の場合に最大確率になる戦略 \(S_k\) は何か。\(n=5,\:10,\:15,\:\cd\:,\:100\) の場合をパソコンで計算してみると、次の表の通りです。
\(5\) | \(S_{2}\) | \(0.43333\) | \(0.40\) |
\(10\) | \(S_{3}\) | \(0.39869\) | \(0.30\) |
\(15\) | \(S_{5}\) | \(0.38941\) | \(0.33\) |
\(20\) | \(S_{7}\) | \(0.38421\) | \(0.35\) |
\(25\) | \(S_{9}\) | \(0.38092\) | \(0.36\) |
\(30\) | \(S_{11}\) | \(0.37865\) | \(0.37\) |
\(35\) | \(S_{13}\) | \(0.37700\) | \(0.37\) |
\(40\) | \(S_{15}\) | \(0.37574\) | \(0.38\) |
\(45\) | \(S_{16}\) | \(0.37493\) | \(0.36\) |
\(50\) | \(S_{18}\) | \(0.37428\) | \(0.36\) |
\(55\) | \(S_{20}\) | \(0.37371\) | \(0.36\) |
\(60\) | \(S_{22}\) | \(0.37321\) | \(0.37\) |
\(65\) | \(S_{24}\) | \(0.37278\) | \(0.37\) |
\(70\) | \(S_{26}\) | \(0.37239\) | \(0.37\) |
\(75\) | \(S_{27}\) | \(0.37210\) | \(0.36\) |
\(80\) | \(S_{29}\) | \(0.37186\) | \(0.36\) |
\(85\) | \(S_{31}\) | \(0.37163\) | \(0.36\) |
\(90\) | \(S_{33}\) | \(0.37142\) | \(0.37\) |
\(95\) | \(S_{35}\) | \(0.37122\) | \(0.37\) |
\(100\) | \(S_{37}\) | \(0.37104\) | \(0.37\) |
\(n\) が大きくなれば、\(T\) を選択する確率が最大になるのは、様子見をしたカードが全体の \(36\%\)~\(37\%\) 程度のときであり、そのときの確率は \(0.37\) 程度であることが分かります。
\(n\) が十分に大きいとき
\(n\) が十分に大きい前提で、最大確率となる \(S_k\) を数学的に求めます。そのために \(P(S_k)\) の式を簡便な形に変換します。上で計算したように、
\(P(S_k)=\dfrac{k}{n}\displaystyle\sum_{t=k}^{n-1}\dfrac{1}{t}\)
であり、図2でグレーで示した部分の面積に \(\dfrac{k}{n}\) を掛けたものが \(P(S_k)\) です。
![]() |
図2:\(P(S_k)\) の下限値の計算 |
従って、積分で計算可能な "図2の赤色の部分" に \(\dfrac{k}{n}\) を掛けると \(P(S_k)\) の下限値になり、
\(P(S_k) > \dfrac{k}{n}\displaystyle\int_{k}^{n}\dfrac{1}{t}\,dt\)
です。置換積分を使うために、
\(\begin{eqnarray}
&&\:\:t&=ns\\
&&\:\:s&=\dfrac{t}{n}\\
&&\:\:dt&=n\,ds\\
\end{eqnarray}\)
と置くと、
\(\begin{eqnarray}
&&\:\:P(S_k)& > \phantom{-}\dfrac{k}{n}\displaystyle\int_{1}^{\tfrac{k}{n}}\dfrac{1}{ns}\cdot n\,ds\\
&&&=\phantom{-}\dfrac{k}{n}\displaystyle\int_{1}^{\tfrac{k}{n}}\dfrac{1}{s}\,ds\\
&&&=-\dfrac{k}{n}\mr{log}\left(\dfrac{k}{n}\right) \br{①}\\
\end{eqnarray}\)
となります。
図2のグレーの部分を \(1\) だけ左にずらしたのが下の図3です。左へずらすことで \(k\) ~ \(n\) の範囲からはみ出た部分の面積は \(\dfrac{1}{k}\) です。
![]() |
図3:\(P(S_k)\) の上限値の計算 |
従って、積分を使って \(P(S_k)\) の上限値を求めると、
\(\begin{eqnarray}
&&\:\:P(S_k)& < \dfrac{k}{n}\left(\dfrac{1}{k}+\displaystyle\int_{k}^{n-1}\dfrac{1}{t}\,dt\right)\\
&&&=\dfrac{k}{n}\left(\dfrac{1}{k}+\displaystyle\int_{\tfrac{k}{n}}^{1-\tfrac{1}{n}}\dfrac{1}{s}\,ds\right)\\
&&&=\dfrac{k}{n}\left(\dfrac{1}{k}+\mr{log}\left(1-\dfrac{1}{n}\right)-\mr{log}\left(\dfrac{k}{n}\right)\right)\\
&&&=\dfrac{1}{n}+\dfrac{k}{n}\mr{log}\left(1-\dfrac{1}{n}\right)-\dfrac{k}{n}\mr{log}\left(\dfrac{k}{n}\right)\\
\end{eqnarray}\)
と計算できます。ここで、
\(\al=\dfrac{1}{n}+\dfrac{k}{n}\mr{log}\left(1-\dfrac{1}{n}\right)\)
と置くと、
\(\begin{eqnarray}
&&\:\:\dfrac{1}{n}\rightarrow0 &(n\rightarrow\infty)\\
&&\:\:\mr{log}\left(1-\dfrac{1}{n}\right)\rightarrow0 &(n\rightarrow\infty)\\
\end{eqnarray}\)
\(0 < \dfrac{k}{n} < 1\)
なので、
\(P(S_k) < \al-\dfrac{k}{n}\mr{log}\left(\dfrac{k}{n}\right)\) \(\br{②}\)
\(\al\rightarrow0\:\:(n\rightarrow\infty)\)
となります。下限値の \(\br{①}\) 式と、上限値の \(\br{②}\) 式 を合わせると、
\(-\dfrac{k}{n}\mr{log}\left(\dfrac{k}{n}\right) < P(S_k) < \al-\dfrac{k}{n}\mr{log}\left(\dfrac{k}{n}\right)\)
\(\al\rightarrow0\:\:(n\rightarrow\infty)\)
となって、\(n\) が十分大きいときには、
\(P(S_k)=-\dfrac{k}{n}\mr{log}\left(\dfrac{k}{n}\right)\) \(\br{③}\)
とみなしてよいことが分かりました。ここで \(x=\dfrac{k}{n}\) とすると、
\(P(S_k)=-x\mr{log}(x)\)
となります。\(P(S_k)\) が最大値となる \(x\) を求めるために、右辺を微分して \(0\) とおくと、
\(\begin{eqnarray}
&&\:\:-&\mr{log}(x)-1&=\phantom{-}0\\
&&&\mr{log}(x)&=-1\\
\end{eqnarray}\)
\(\longrightarrow\:x=\dfrac{1}{e}\)
です。つまり、\(\dfrac{k}{n}=\dfrac{1}{e}\) のときに \(P(S_k)\) は最大値をとります。このときの \(P(S_k)\) を \(\br{③}\) 式で求めると、
\(P(S_k)\) の最大値\(=\dfrac{1}{e}\)
と計算できます。この \(\dfrac{1}{e}\) はマッチング問題と全く同じで、\(\fallingdotseq0.368\) です。かつ、この問題では答に現れる2つの数値が共に \(\dfrac{1}{e}\) です。
\(n\) が十分に大きいときは、\(P(S_k)\) の最大値は \(\dfrac{1}{e}\) ですが、上のパソコンでの計算例を見ると、\(n\) を増やしたときに \(\dfrac{1}{e}=0.3678794411\cd\) に収束する様子は、マッチング問題と違って非常に緩慢なことが分かります。
秘書問題の結論
最大値のカードを選択する戦略の結論は次のようになります。
最初からの \(36.8\%\) のカードは選択せずに "様子見" とし、それ以降のカードで、様子見のカードの最大値よりも大きな値が出たら選択するのがベストの戦略である。この戦略により \(36.8\%\) の確率で \(n\) 枚の中の最大カードを選択できる。 |
当初の「秘書問題」の文脈でこの結論を書くと、
\(n\) 人の応募者とランダムに面接するとき、「最初から \(0.368n\) 人までの応募者」は不採用とし、それ以降の応募者で「最初から \(0.368n\) 人までのすべての応募者よりも秘書にふさわしいと判断した人」を採用する。これにより \(36.8\%\) の確率で全応募者の中のベストの人(=全員を面接したとしたらベストと判断できるはずの人)を採用できる。 |
となります。この結論は \(n\) が十分に大きくても成り立ちます。\(\bs{n}\) がどんなに大きくても、4割程度の高確率で最良の選択ができるというのが、少々意外な結果なのでした。
2024-11-03 10:51
nice!(0)
No.376 - 高校数学で理解するマッチング問題 [科学]
\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{#1}} \newcommand{\ol}[1]{\overline{#1}} \newcommand{\sb}{\subset} \newcommand{\sp}{\supset} \newcommand{\al}{\alpha} \newcommand{\sg}{\sigma}\newcommand{\cd}{\cdots}\)
今まで「高校数学で理解する ・・・・・・」というタイトルの記事をいくつか書きましたが、その続きです。過去の記事は、
の、総計 17 の記事です。分類すると、
となります。今回の "マッチング問題" は「③ 直感に反する確率」のジャンルに属するものです。
なお、"高校数学で理解する" というタイトルは、「高校までで習う数学だけを前提知識とする(それ以外は全部証明する)」という意味です。もちろん、"おおよそ高校までの数学" が正しく、正式には大学で習う数学を証明なしで使ったことがあります。たとえば、No.325「高校数学で理解する誕生日のパラドックス」での "マクローリン展開(テイラー展開)" ですが、今回もそれを使います。
席替えの成功確率
小学校で 40人のクラスがあるとします。このクラスには約 90%の確率で誕生日が同じ子がいる(正確には 89.12%)というのが No.325「高校数学で理解する誕生日のパラドックス」でしたが、今回は席替えの問題です。
40人のクラスで、席替えを "くじ引き" でやるとします。まず、現在の席に 1 ~ 40 の席番号を割り振ります。担任の先生は、1 ~ 40 の数字を書いた紙を 40枚用意し、その紙を数字が見えないように折って、箱の中に入れてかき混ぜます。生徒は席番号1の子から順に箱から紙を1枚ずつ引き、そこに書かれている数字がその子の新しい席となります。もちろんこのやり方だと、今の自分の席番号の紙を引く子が現れる可能性があります。現在の席番号以外の番号を引けば、その子は "成功" と定義します。
そして「すべての子が成功したら、クラスの席替えは成功」と定義します。つまり「すべての子が現在の席番号と違う番号を引いたとき、席替えは成功」です。では、40人のクラスで席替えが成功する確率はどれほどでしょうか。これが問題です。
40人だと考えづらいので、極端ですが、クラスの人数が 3人の場合で考えてみます。席1、席2、席3の子が引いた数字を順に3つの数字の組で表すと、考えられる組み合わせは、
(1, 2, 3)
(1, 3, 2)
(2, 1, 3)
(2, 3, 1)◎
(3, 1, 2)◎
(3, 2, 1)
の6通り(=3!)です。このうち "席替え成功" となるのは ◎印をつけた、
(2, 3, 1)
(3, 1, 2)
の2通りだけなので、
席替えの成功確率\(=\dfrac{2}{6}\fallingdotseq0.33\)
です。この結果の 0.33 は直感と合っているのではないでしょうか。席1の子が成功する確率は 0.66 ですが、もし席1の子が2を引き、席2の子が1を引いてしまったら(確率 0.5)席3の子が失敗します("2,1,3" のパターン)。また、席1の子が3を引いたとしても、席2の子が2を引いてしまったら(確率 0.5)失敗です("3,2,1" のパターン)。席替えの成功確率は 0.66 の半分になって 0.33。これはわかりやすい話です。
席替えの成功確率が 0.33 という低い数字になるのは、各生徒の成功確率が 0.66 とか 0.5 とかで、1.0 と比べるとかなり小さい数字だからと考えられます。席が3つしかないのでそうなるしかなく、成功確率は低い。
では、40人のクラスではどうでしょうか。この場合、席1の子の成功確率は \(\dfrac{39}{40}=0.975\) であり、席2の子の成功確率もそれに近い数です。40人全員の成功確率もそれなりに高いはずで、従ってクラスの席替えの成功確率は高いと思われます。くじを引く子たちの立場で考えてみても、まさか自分の席の番号を引くとは思わないでしょう。選択肢は 40 もあるのだから ・・・・・・。しかし、実際に成功確率を計算してみると、
席替えの成功確率\(\fallingdotseq0.368\)
となり、40人のクラスでも、3人のクラスと成功確率はあまり変わらないのです。わずかに増加していますが ・・・・・・。36.8 % という確率は、席替えを3回トライして1回成功するかどうかという数字です。逆に言うと、63.2 % という高確率で自分の席の紙を引く子が少なくとも1人は出てくる。
これは直感とはズレているのではないでしょうか。なぜそのようになるのか、それが以下です。
マッチング問題と完全順列
これは、一般にはマッチング問題(出会いの問題。matching problem)と呼ばれています。フランスの数学者、ピエール・ド・モンモール(1678-1719)が初めて提示したので、モンモールの問題とも言われます。
2人のプレーヤー、AとBがそれぞれ 13枚のカードを渡されます。Aにはスペードの A, 2, 3, 4, 5, 6, 7, 8, 9, 10, J, Q, K を、Bにはクラブの A, 2, 3, 4, 5, 6, 7, 8, 9, 10, J, Q, K です。AとBはその中から任意の1枚を選び、同時に場に提示します。一度提示したカードは捨て、これを13回繰り返します。場に提示されたカードの種類が1回でも同じであればマッチング成功です。同じ種類のカードが全くなければマッチングは不成功です。成功する確率はどれだけか、というのがマッチング問題です。
一般化すると、\(1\) ~ \(n\) の数字の書かれたカードをランダムにシャッフルし、順番に場に提示したとき、\(i\) 番目に提示したカードの数字が \(i\) であるとマッチングが成立したことになります。「\(i\) 番目に提示したカードの数字が \(i\) でない」という状況が \(n\) 回続くと(=一度もマッチしないと)、マッチング不成立です。
さきほど書いた\(40\)人のクラスの「席替え成功確率」は、\(n=40\) のときにマッチング不成立になる確率はいくらか、という問題になります。
\(1\) ~ \(n\) の \(n\)個の数字の順列の総数は \(n!\) ですが、\(i\) 番目の数字 \(d_i\) が \(i\) でない \((1\leq i\leq n)\) 順列を完全順列(complete permutation)と言います。つまり、
\(d_i\neq i\:\:(1\leq i\leq n)\)
を満たす順列です。攪乱順列(derangement)という言い方もあります。\(d_i\neq i\:(1\leq i\leq n)\) であってこそ「数字を完全にかき混ぜた(=攪乱した)順列」なので、そう呼ばれるのでしょう。
完全順列という言葉を使うと、\(\bs{n}\) 個の数字の順列(総数は \(\bs{n!}\))のうちの完全順列の割合がマッチング不成立の確率(=席替えの成功確率)です。では、完全順列の数はどの程度あるのでしょうか。これを計算するために、まず、集合における「包除原理」を説明します。
包除原理(Inclusion-Exclusion Principle)
包除原理とは、有限集合の和集合の要素数を計算する原理で、英語では Inclusion-Exclusion Principle と言います。Inclusion は包含、Exclusionは除外の意味で、日本語では包除原理です。
以下、\(A_i\) を有限集合とし、\(A_i\) の要素数を \(|A_i|\) と表記します。いま2つの集合、\(A_1\) と \(A_2\) があるとき、\(A_1\) と \(A_2\) の和集合の要素数は次の式で表されます。
\(|A_1\cup A_2|=|A_1|+|A_2|-|A_1\cap A_2|\)
つまり、\(A_1\) と \(A_2\) の和集合の要素数は、\(A_1\) の要素数と \(A_2\) の要素数の和から、ダブル・カウントした \(A_1\) と \(A_2\) の共通部分(\(A_1\cap A_2\))の要素数を引き算して求まります。これはシンプルです。3つの集合 \(A_1\:,A_2,\:A_3\) になると次が成り立ちます。
【証明】
\(|A_1|+|A_2|+|A_3|\) の式は、複数回カウントしている要素がある。要素のカウント数を図に表すと図1である。
\(|A_1\cap A_2|+|A_1\cap A_3|+|A_2\cap A_3|\) は「2つの集合の共通部分」を複数回カウントしている要素がある。要素のカウント数を図に表すと図2である。
\(|A_1\cap A_2\cap A_3|\) は「3つの集合の共通部分」を1回だけカウントしているから、カウント数を図に表すと図3である。要素のカウント数に注目して、
(図1)\(-\)(図2)\(+\)(図3)
を計算すると図4になる。図4はすべての要素を1回だけカウントしているので、題意は正しい。【証明終】
包除原理を使う例として、たとえば次の問題があります。
という問題です。包除原理の通りに順に計算すると、
\(\phantom{1}2\)の倍数:\(50\)(\(\phantom{1}2\)~\(100\))
\(\phantom{1}3\)の倍数:\(33\)(\(\phantom{1}3\)~\(\phantom{1}99\))
\(\phantom{1}5\)の倍数:\(20\)(\(\phantom{1}5\)~\(100\))
\(\phantom{1}6\)の倍数:\(16\)(\(\phantom{1}6\)~\(\phantom{1}96\))
\(10\)の倍数:\(10\)(\(10\)~\(100\))
\(15\)の倍数:\(\phantom{1}6\)(\(15\)~\(\phantom{1}90\))
\(30\)の倍数:\(\phantom{1}3\)(\(30\)~\(\phantom{1}90\))
なので、答えは
\(100-(50+33+20-16-10-6+3)=26\)
となります。実際に数をリストしてみると、
\(\phantom{1}1,\:\phantom{1}7,\:11,\:13,\:17,\:19,\:23,\:29,\:31,\:37,\)
\(41,\:43,\:47,\:49,\:53,\:59,\:61,\:67,\:71,\:73,\)
\(77,\:79,\:83,\:89,\:91,\:97\)
の \(26\)個です。
さらに、集合の数が4個になると次のようになります。一般論につながる形で証明をします。
【証明】
1つの集合だけに属する要素は、第1項だけでプラス・カウントされているから、カウント数は1である。
\(A_1\) と \(A_2\) の共通部分(\(A_1\cap A_2\))の要素は、第1項で2回プラス・カウントされ、第2項で1回マイナス・カウントされているから、合計のカウント数は計1である。これは「2つの集合の共通部分」すべてで同じである。
\(A_1\cap A_2\cap A_3\) の要素は、第1項で3回プラス・カウントされ(\(|A_1|+|A_2|+|A_3|\) で \(+\:{}_{3}\mr{C}_{1}\) 回)、第2項で3回マイナス・カウントされ(\(-|A_1\cap A_2|-\)\(|A_1\cap A_3|-\)\(|A_2\cap A_3|\) で \(-\:{}_{3}\mr{C}_{2}\) 回)、第3項で1回プラス・カウントされているから(\(+\:{}_{3}\mr{C}_{3}\) 回)、合計のカウント数は1である。これは「3つの集合の共通部分」すべてで同じである。
\(A_1\cap A_2\cap A_3\cap A_4\) の要素が何回カウントされているかをみると、
であり、合計のカウント数は1である。以上で、1つの集合だけに属する要素も、2~4個の集合の共通部分の要素もすべて1回カウントされているから、題意は正しい。【証明終】
集合の数が \(n\)個 の場合の一般論では次のようになります。
【証明】
1つの集合だけに属する要素は、第1項だけでプラス・カウントされているから、カウント数は1である。また、\(m\)個の集合の共通部分(\(2\leq m\leq n\))は、第1項 ~ 第\(\bs{m}\)項でカウントされ、回数はそれぞれ、
だから、合計のカウント数は、
\(\displaystyle\sum_{k=1}^{m}(-1)^{k-1}{}_{m}\mr{C}_{k}\)
である。この式の値を評価するために \((x-1)^m\) の二項展開を利用する。\((x-1)^m\) を二項展開すると、
\(\begin{eqnarray}
&&\:\:(x-1)^m=&x^m-{}_{m}\mr{C}_{1}x^{m-1}+{}_{m}\mr{C}_{2}x^{m-2}\\
&&&-{}_{m}\mr{C}_{3}x^{m-3}+\:\cd\:+(-1)^m{}_{m}\mr{C}_{m}\\
\end{eqnarray}\)
となるが、この式に \(x=1\) を代入すると、
左辺\(=0\)
右辺\(=1-{}_{m}\mr{C}_{1}x+{}_{m}\mr{C}_{2}-{}_{m}\mr{C}_{3}+\:\cd\:+(-1)^m{}_{m}\mr{C}_{m}\)
である。ここから、
\(\longrightarrow\:\displaystyle\sum_{k=1}^{m}(-1)^{k-1}{}_{m}\mr{C}_{k}=1\)
となる。従って、\(m\)個の集合の共通部分(\(2\leq m\leq n\))は、\(m\) の値にかかわらず合計1回だけカウントされている。
以上で1つの集合だけに属する要素も、共通部分に属する要素も、すべて1回カウントされているから、題意は正しい。【証明終】
完全順列の個数を数える
包除原理を踏まえて、完全順列の個数を計算します。\(1\) ~ \(n\) の \(n\) 個の数字の順列の集合を \(P(n)\) とすると \(|P(n)|=n!\) です。これらの中で、順列の \(i\) 番目の数字 \(d_i\) が \(i\) でないもの \((1\leq i\leq n)\) が完全順列(complete permutation)です。つまり、
\(d_i\neq i\:\:(1\leq i\leq n)\)
を満たす順列です。ここでは完全順列の反対、つまり、
ある \(i\:(1\leq i\leq n)\) について \(d_i=i\)
となる順列を「不完全順列」(incomplete permutation)と呼ぶことにし(ここだけの用語です)、
\(P_{cp}(n)\):完全順列の集合
\(P_{ip}(n)\):不完全順列の集合
と書くことにします。
\(\begin{eqnarray}
&&\:\:|P(n)|&=|P_{cp}(n)|+|P_{ip}(n)|\\
&&&=n!\\
\end{eqnarray}\)
です。以下、不完全順列の個数(\(|P_{ip}(n)|\))を調べることにします。
\(1\) ~ \(n\) の \(n\)個の数字の順列で、\(i\) 番目の数字 \(d_i\) が \(d_i=i\) であるような順列の集合を \(A_i\) と定義します。そうすると、不完全順列の集合は、
\(P_{ip}(n)=A_1\cup A_2\cup A_3\cup\cd\cup A_n\)
と表現できます。もちろん、\(A_1,\:A_2,\:A_3,\:\cd\) の要素にはかなりの重複があります。ここで、重複を排して不完全順列の数を数えるために包除原理を使うと、
\(|P_{ip}(n)|=\)
となります。まず、第1項を考えると、\(|A_1|\) は「1番目の数字以外の \(n-1\) 個の数字」がつくる順列の数だけあります。つまり、
\(|A_1|=(n-1)!\)
であり、問題の対称性から、
\(|A_1|=|A_2|=|A_3|=\:\cd\:=|A_n|\)
なので、第1項\(=n\cdot(n-1)!\) です。
第2項は、2つの数字の選び方が \({}_{n}\mr{C}_{2}\) 通りあり、それぞれについて「2つの数字以外の \((n-2)\) 個の数字」がつくる順列の数=\((n-2)!\) だけマイナス・カウントされるので、
第2項\(=-{}_{n}\mr{C}_{2}\cdot(n-2)!\)
です。同様に考えて全体をまとめると、
となります。従って、不完全順列の数はこれらを合算して、
\(|P_{ip}(n)|\)
\(\begin{eqnarray}
&&\:\:&=&n\cdot(n-1)!-\dfrac{n!}{(n-2)!2!}\cdot(n-2)!+\\
&&&&\dfrac{n!}{(n-3)!3!}\cdot(n-3)!-\cd\:+(-1)^{n-1}\cdot1\\
&&&=&n!\left(1-\dfrac{1}{2!}+\dfrac{1}{3!}-\:\cd\:+(-1)^{n-1}\dfrac{1}{n!}\right)\\
\end{eqnarray}\)
と計算できます。完全順列の数は、
\(|P_{cp}(n)|\)
\(=n!-|P_{ip}(n)|\)
\(=n!\left(\dfrac{1}{2!}-\dfrac{1}{3!}+\:\cd\:-(-1)^{n-1}\dfrac{1}{n!}\right)\)
\(=n!\left(\dfrac{1}{2!}-\dfrac{1}{3!}+\:\cd\:+(-1)^n\dfrac{1}{n!}\right)\)
です。
マッチング成立・不成立の確率
以上の不完全順列の個数をもとに、マッチングが成立する確率 \(\mathcal{P}_{match}(n)\) を計算すると、
\(\begin{eqnarray}
&&\:\:\mathcal{P}_{match}(n)&=\dfrac{|P_{ip}(n)|}{n!}\\
&&&=1-\dfrac{1}{2!}+\dfrac{1}{3!}-\:\cd\:+(-1)^{n-1}\dfrac{1}{n!}\\
&&&=\displaystyle\sum_{k=1}^{n}(-1)^{k-1}\dfrac{1}{k!}\\
\end{eqnarray}\)
となります。マッチングが不成立の確率 \(\mathcal{P}_{unmatch}(n)\) は、
\(\begin{eqnarray}
&&\:\:\mathcal{P}_{unmatch}(n)&=\dfrac{|P_{cp}(n)|}{n!}\\
&&&=\dfrac{1}{2!}-\dfrac{1}{3!}+\:\cd\:+(-1)^n\dfrac{1}{n!}\\
&&&=\displaystyle\sum_{k=2}^{n}(-1)^k\dfrac{1}{k!}\\
\end{eqnarray}\)
であり、これが「くじによる席替え」が成功する確率です。
ここで、\(\displaystyle\lim_{n\rightarrow\infty}\mathcal{P}_{match}(n)\)、\(\displaystyle\lim_{n\rightarrow\infty}\mathcal{P}_{unmatch}(n)\) の値を求めます。これにはテイラー展開の特別の場合であるマクローリン展開を使います。自然対数の底を \(e\) とすると、\(e^x\) のマクローリン展開は、
\(e^x=1+x+\dfrac{1}{2!}x^2+\dfrac{1}{3!}x^3+\dfrac{1}{3!}x^4+\:\cd\)
です。この式で \(x=-1\) とすると、
\(\dfrac{1}{e}=\dfrac{1}{2!}-\dfrac{1}{3!}+\dfrac{1}{4!}-\:\cd\)
\(1-\dfrac{1}{e}=1-\dfrac{1}{2!}+\dfrac{1}{3!}-\dfrac{1}{4!}+\:\cd\)
なので、
\(\begin{eqnarray}
&&\:\:\displaystyle\lim_{n\rightarrow\infty}\mathcal{P}_{match}(n)&=1-\dfrac{1}{e}\\
&&&=0.6321205588285577\cd\\
&&\:\:\displaystyle\lim_{n\rightarrow\infty}\mathcal{P}_{unmatch}(n)&=\dfrac{1}{e}\\
&&&=0.3678794411714423\cd\\
\end{eqnarray}\)
となります。ちなみに、この値を初めて求めたのは大数学者のオイラーだそうです。
\(\mathcal{P}_{unmatch}(n)\) の値(=順列の中の完全順列の割合)を、\(n=3\) ~ \(13\)(=カードの枚数) について計算し、小数点以下\(10\)桁だけを表示すると次の表の通りになります。
\(n=6\) あたりから急速に極限値である \(\dfrac{1}{e}=0.3678794411\cd\) に近づき、\(n=13\) では小数点以下\(10\)桁までが極限値と一致します。以降はほぼ一定の値になり、もちろん\(40\)人クラスの席替えの成功率も極限値とほぼ一致します。ということで、\(n\) が極端に少ない場合(\(5\) 以下)を除き、
としてよいのでした。つまり、くじによる席替えの成功確率は約\(\bs{36.8\:\%}\) であり、クラスの人数によらない。これが結論です。この「\(n\) の値にかかわらず確率がほぼ一定」というところが、少々直感に反する結果になるのでした。
本文では包除原理を使って完全順列の個数を求めましたが(包除原理の証明が記事の目的の一つでした)、完全順列の個数を示す漸化式を作ることができます。それを説明します。簡潔に書くために、\(n\) 個の数字の完全順列の数を \(D(n)\) とします(攪乱順列:derangement の \(D\) で、本文では \(|P_{cp}(n)|\) としたのもです)。
わかりやすく説明するために、\(n\) 個の箱があり、\(1\) ~ \(n\) の番号が振ってあるとします。また \(n\) 枚のカードがあり、\(1\) ~ \(n\) の番号が書かれています。このカードを1枚づつ順に箱に入れるとします。入れる順番は任意ですが、1つの箱には1枚のカードしか入れられません。箱に入れていないカードを "残っているカード"、カードが入っていない箱を "残っている箱" と表現します。
この状況で、カードと箱の対応パターンは \(n!\) 通りあります。
ここで「カードの番号と同じ番号の箱には入れない」というルールを設けます。このルールがあると、\(n\) 個の箱への \(n\) 枚のカードの対応パターンは完全順列の数である \(D(n)\) 通りになります。
入れる順序は任意なので、最初にカード \(\bs{1}\) を箱 \(\bs{i\:\:(i\neq1)}\) に入れるとします。\(i\) の選び方は \(n-1\) 通りあります。次に、カード \(\bs{i}\) を残っているどれかの箱に入れるとします。どの箱に入れるかを2つに分けて考えます。
カード \(i\) を箱 \(1\) に入れる場合
入れた後では、箱 \(1\) にカード \(i\)、箱 \(i\) にカード \(1\) がある状態です。残っているのは、
であり、これらの \((n-2)\) 枚のカードをルールに沿って \((n-2)\) 個の箱に入れるパターンは、定義から \(D(n-2)\) 通りです。
カード \(i\) を箱 \(1\) に入れない場合
この場合、カード \(i\) は "箱 \(1\) 以外の残っている箱" に入れることになります。ここで、カードの番号 \(i\) を \(1\) に書き換えてしまいます。こうしたとしても(書き換えた結果の)カード \(1\) は、"箱 \(1\) 以外の残っている箱" に入れることになります。カード \(1\) は箱 \(1\) に入れてはいけないというルールがあるからです。つまり、カード番号 の \(i\) を \(1\) に書き換えたとしても、「ルールに沿ってカードを箱に入れるパターンの数」は変わりません。
カードの番号を書き換えた直後の状態で、残っているのは、
となり、これらの \((n-1)\) 枚のカードをルールに沿って \((n-1)\) 個の箱に入れるパターンは、定義から \(D(n-1)\) 通りです。\((n-1)\) 枚を箱に入れ終わったあとで、\(1\) に書き換えたカードを \(i\) に戻せば、\(1\) から \(n\) のカードをすべて箱に入れたことになります。
まとめると、最初の \(i\) の選び方は \(n-1\) 通りあり、それぞれについて、
があり、この2つは排他的です。従って、
\(D(n)=(n-1)(D(n-1)+D(n-2))\)
の漸化式が得られます。\(D(1)=0,\:\:D(2)=1\) なので、
\(D(1)=0\)
\(D(2)=1\)
\(D(3)=2\cdot(1+0)=2\)
\(D(4)=3\cdot(2+1)=9\)
などとなります。
\(D(n)\) の一般項を求めるために漸化式を変形します。
\(D(n)=(n-1)(D(n-1)+D(n-2))\)
\(\begin{eqnarray}
&&\:\:D(n)=&nD(n-1)-D(n-1)\\
&&&+(n-1)D(n-2)\\
\end{eqnarray}\)
\(D(n)-nD(n-1)=\)
\(-(D(n-1)-(n-1)D(n-2))\)
\(B(n)=D(n)-nD(n-1)\) とおくと、
\(B(2)=D(2)-2\cdot D(1)=1\)
\(B(n)=-B(n-1)\)
です。従って \(B(n)\) の一般項は、
\(B(n)=(-1)^n\)
であり、\(D(n)\) に戻すと、
\(D(n)-nD(n-1)=(-1)^n\)
になります。この両辺を \(n!\) で割ると、
\(\dfrac{D(n)}{n!}-\dfrac{D(n-1)}{(n-1)!}=(-1)^n\dfrac{1}{n!}\)
が得られます。この式の両辺を \(2\) から \(n\) までたし算して整理すると、
\(\dfrac{D(n)}{n!}-\dfrac{D(1)}{1!}\)
\(=\dfrac{1}{2!}-\dfrac{1}{3!}+\:\cd+(-1)^n\dfrac{1}{n!}\)
\(D(n)=n!\cdot\displaystyle\sum_{k=2}^{n}(-1)^k\dfrac{1}{k!}\)
となり、包除原理を使った計算(\(|P_{cp}(n)|\))と一致します。
エレガントな解法ですが、漸化式を求めるのが難しい。特に「カード \(i\) を箱 \(1\) に入れない場合の数が \(D(n-1)\) である」ことをゼロから発想するのは大変でしょう。「カード \(i\) を箱 \(1\) に入れない」ということを「ルール上、カード \(1\) は箱 \(1\) に入れられない」と同一視する発想が必要です。また、漸化式から一般項を求める際にも、「式の変形」と「\(n!\) で割る」という、2つの "一般項生成テクニック" がポイントになっています。
ということで、本文では包除原理を使った説明にしました。この方がマッチング問題の本質をとらえています。
ただ、問題の本質をとらえた正攻法で "丹念に" 証明するしかないと "一見思える" 問題でも、漸化式という大変エレガントな解答がある。そのあたりに数学の深さの一端が現れていると思います。
今まで「高校数学で理解する ・・・・・・」というタイトルの記事をいくつか書きましたが、その続きです。過去の記事は、
高校数学で理解するRSA暗号の数理 | |
高校数学で理解する公開鍵暗号の数理 | |
高校数学で理解する楕円曲線暗号の数理 | |
高校数学で理解する誕生日のパラドックス | |
高校数学で理解するレジ行列の数理 | |
高校数学で理解するガロア理論(1)~(6) | |
高校数学で理解する ChatGPT の仕組み | |
高校数学で理解する素数判定の数理 | |
高校数学で理解するガロア理論(7) |
の、総計 17 の記事です。分類すると、
公開鍵暗号とその関連技術(素数判定)
No.310, 311, 313, 315, 316, 369
| |
ガロア理論
No.354, 355, 356, 357, 358, 359, 370
| |
直感に反する確率
No.325, 329
| |
生成AIの技術(=Transformer)
No.365, 366
|
となります。今回の "マッチング問題" は「③ 直感に反する確率」のジャンルに属するものです。
なお、"高校数学で理解する" というタイトルは、「高校までで習う数学だけを前提知識とする(それ以外は全部証明する)」という意味です。もちろん、"おおよそ高校までの数学" が正しく、正式には大学で習う数学を証明なしで使ったことがあります。たとえば、No.325「高校数学で理解する誕生日のパラドックス」での "マクローリン展開(テイラー展開)" ですが、今回もそれを使います。
席替えの成功確率
小学校で 40人のクラスがあるとします。このクラスには約 90%の確率で誕生日が同じ子がいる(正確には 89.12%)というのが No.325「高校数学で理解する誕生日のパラドックス」でしたが、今回は席替えの問題です。
40人のクラスで、席替えを "くじ引き" でやるとします。まず、現在の席に 1 ~ 40 の席番号を割り振ります。担任の先生は、1 ~ 40 の数字を書いた紙を 40枚用意し、その紙を数字が見えないように折って、箱の中に入れてかき混ぜます。生徒は席番号1の子から順に箱から紙を1枚ずつ引き、そこに書かれている数字がその子の新しい席となります。もちろんこのやり方だと、今の自分の席番号の紙を引く子が現れる可能性があります。現在の席番号以外の番号を引けば、その子は "成功" と定義します。
そして「すべての子が成功したら、クラスの席替えは成功」と定義します。つまり「すべての子が現在の席番号と違う番号を引いたとき、席替えは成功」です。では、40人のクラスで席替えが成功する確率はどれほどでしょうか。これが問題です。
40人だと考えづらいので、極端ですが、クラスの人数が 3人の場合で考えてみます。席1、席2、席3の子が引いた数字を順に3つの数字の組で表すと、考えられる組み合わせは、
(1, 2, 3)
(1, 3, 2)
(2, 1, 3)
(2, 3, 1)◎
(3, 1, 2)◎
(3, 2, 1)
の6通り(=3!)です。このうち "席替え成功" となるのは ◎印をつけた、
(2, 3, 1)
(3, 1, 2)
の2通りだけなので、
席替えの成功確率\(=\dfrac{2}{6}\fallingdotseq0.33\)
です。この結果の 0.33 は直感と合っているのではないでしょうか。席1の子が成功する確率は 0.66 ですが、もし席1の子が2を引き、席2の子が1を引いてしまったら(確率 0.5)席3の子が失敗します("2,1,3" のパターン)。また、席1の子が3を引いたとしても、席2の子が2を引いてしまったら(確率 0.5)失敗です("3,2,1" のパターン)。席替えの成功確率は 0.66 の半分になって 0.33。これはわかりやすい話です。
席替えの成功確率が 0.33 という低い数字になるのは、各生徒の成功確率が 0.66 とか 0.5 とかで、1.0 と比べるとかなり小さい数字だからと考えられます。席が3つしかないのでそうなるしかなく、成功確率は低い。
では、40人のクラスではどうでしょうか。この場合、席1の子の成功確率は \(\dfrac{39}{40}=0.975\) であり、席2の子の成功確率もそれに近い数です。40人全員の成功確率もそれなりに高いはずで、従ってクラスの席替えの成功確率は高いと思われます。くじを引く子たちの立場で考えてみても、まさか自分の席の番号を引くとは思わないでしょう。選択肢は 40 もあるのだから ・・・・・・。しかし、実際に成功確率を計算してみると、
席替えの成功確率\(\fallingdotseq0.368\)
となり、40人のクラスでも、3人のクラスと成功確率はあまり変わらないのです。わずかに増加していますが ・・・・・・。36.8 % という確率は、席替えを3回トライして1回成功するかどうかという数字です。逆に言うと、63.2 % という高確率で自分の席の紙を引く子が少なくとも1人は出てくる。
これは直感とはズレているのではないでしょうか。なぜそのようになるのか、それが以下です。
マッチング問題と完全順列
これは、一般にはマッチング問題(出会いの問題。matching problem)と呼ばれています。フランスの数学者、ピエール・ド・モンモール(1678-1719)が初めて提示したので、モンモールの問題とも言われます。
2人のプレーヤー、AとBがそれぞれ 13枚のカードを渡されます。Aにはスペードの A, 2, 3, 4, 5, 6, 7, 8, 9, 10, J, Q, K を、Bにはクラブの A, 2, 3, 4, 5, 6, 7, 8, 9, 10, J, Q, K です。AとBはその中から任意の1枚を選び、同時に場に提示します。一度提示したカードは捨て、これを13回繰り返します。場に提示されたカードの種類が1回でも同じであればマッチング成功です。同じ種類のカードが全くなければマッチングは不成功です。成功する確率はどれだけか、というのがマッチング問題です。
一般化すると、\(1\) ~ \(n\) の数字の書かれたカードをランダムにシャッフルし、順番に場に提示したとき、\(i\) 番目に提示したカードの数字が \(i\) であるとマッチングが成立したことになります。「\(i\) 番目に提示したカードの数字が \(i\) でない」という状況が \(n\) 回続くと(=一度もマッチしないと)、マッチング不成立です。
さきほど書いた\(40\)人のクラスの「席替え成功確率」は、\(n=40\) のときにマッチング不成立になる確率はいくらか、という問題になります。
\(1\) ~ \(n\) の \(n\)個の数字の順列の総数は \(n!\) ですが、\(i\) 番目の数字 \(d_i\) が \(i\) でない \((1\leq i\leq n)\) 順列を完全順列(complete permutation)と言います。つまり、
\(d_i\neq i\:\:(1\leq i\leq n)\)
を満たす順列です。攪乱順列(derangement)という言い方もあります。\(d_i\neq i\:(1\leq i\leq n)\) であってこそ「数字を完全にかき混ぜた(=攪乱した)順列」なので、そう呼ばれるのでしょう。
完全順列という言葉を使うと、\(\bs{n}\) 個の数字の順列(総数は \(\bs{n!}\))のうちの完全順列の割合がマッチング不成立の確率(=席替えの成功確率)です。では、完全順列の数はどの程度あるのでしょうか。これを計算するために、まず、集合における「包除原理」を説明します。
包除原理(Inclusion-Exclusion Principle)
包除原理とは、有限集合の和集合の要素数を計算する原理で、英語では Inclusion-Exclusion Principle と言います。Inclusion は包含、Exclusionは除外の意味で、日本語では包除原理です。
以下、\(A_i\) を有限集合とし、\(A_i\) の要素数を \(|A_i|\) と表記します。いま2つの集合、\(A_1\) と \(A_2\) があるとき、\(A_1\) と \(A_2\) の和集合の要素数は次の式で表されます。
\(|A_1\cup A_2|=|A_1|+|A_2|-|A_1\cap A_2|\)
つまり、\(A_1\) と \(A_2\) の和集合の要素数は、\(A_1\) の要素数と \(A_2\) の要素数の和から、ダブル・カウントした \(A_1\) と \(A_2\) の共通部分(\(A_1\cap A_2\))の要素数を引き算して求まります。これはシンプルです。3つの集合 \(A_1\:,A_2,\:A_3\) になると次が成り立ちます。
\(|A_1\cup A_2\cup A_3|\) \(\begin{eqnarray} &&\:\:=&|A_1|+|A_2|+|A_3|\\ &&&-|A_1\cap A_2|-|A_1\cap A_3|-|A_2\cap A_3|\\ &&&+|A_1\cap A_2\cap A_3|\\ \end{eqnarray}\) |
【証明】
|
|
|
|
\(|A_1|+|A_2|+|A_3|\) の式は、複数回カウントしている要素がある。要素のカウント数を図に表すと図1である。
\(|A_1\cap A_2|+|A_1\cap A_3|+|A_2\cap A_3|\) は「2つの集合の共通部分」を複数回カウントしている要素がある。要素のカウント数を図に表すと図2である。
\(|A_1\cap A_2\cap A_3|\) は「3つの集合の共通部分」を1回だけカウントしているから、カウント数を図に表すと図3である。要素のカウント数に注目して、
(図1)\(-\)(図2)\(+\)(図3)
を計算すると図4になる。図4はすべての要素を1回だけカウントしているので、題意は正しい。【証明終】
包除原理を使う例として、たとえば次の問題があります。
\(100\)以下の自然数で、\(2,\:3,\:5\) の倍数ではない数は何個あるか |
という問題です。包除原理の通りに順に計算すると、
\(\phantom{1}2\)の倍数:\(50\)(\(\phantom{1}2\)~\(100\))
\(\phantom{1}3\)の倍数:\(33\)(\(\phantom{1}3\)~\(\phantom{1}99\))
\(\phantom{1}5\)の倍数:\(20\)(\(\phantom{1}5\)~\(100\))
\(\phantom{1}6\)の倍数:\(16\)(\(\phantom{1}6\)~\(\phantom{1}96\))
\(10\)の倍数:\(10\)(\(10\)~\(100\))
\(15\)の倍数:\(\phantom{1}6\)(\(15\)~\(\phantom{1}90\))
\(30\)の倍数:\(\phantom{1}3\)(\(30\)~\(\phantom{1}90\))
なので、答えは
\(100-(50+33+20-16-10-6+3)=26\)
となります。実際に数をリストしてみると、
\(\phantom{1}1,\:\phantom{1}7,\:11,\:13,\:17,\:19,\:23,\:29,\:31,\:37,\)
\(41,\:43,\:47,\:49,\:53,\:59,\:61,\:67,\:71,\:73,\)
\(77,\:79,\:83,\:89,\:91,\:97\)
の \(26\)個です。
さらに、集合の数が4個になると次のようになります。一般論につながる形で証明をします。
\(|A_1\cup A_2\cup A_3\cup A_4|=\)
|
【証明】
1つの集合だけに属する要素は、第1項だけでプラス・カウントされているから、カウント数は1である。
\(A_1\) と \(A_2\) の共通部分(\(A_1\cap A_2\))の要素は、第1項で2回プラス・カウントされ、第2項で1回マイナス・カウントされているから、合計のカウント数は計1である。これは「2つの集合の共通部分」すべてで同じである。
\(A_1\cap A_2\cap A_3\) の要素は、第1項で3回プラス・カウントされ(\(|A_1|+|A_2|+|A_3|\) で \(+\:{}_{3}\mr{C}_{1}\) 回)、第2項で3回マイナス・カウントされ(\(-|A_1\cap A_2|-\)\(|A_1\cap A_3|-\)\(|A_2\cap A_3|\) で \(-\:{}_{3}\mr{C}_{2}\) 回)、第3項で1回プラス・カウントされているから(\(+\:{}_{3}\mr{C}_{3}\) 回)、合計のカウント数は1である。これは「3つの集合の共通部分」すべてで同じである。
\(A_1\cap A_2\cap A_3\cap A_4\) の要素が何回カウントされているかをみると、
第1項で | \(+\:4\) 回 | (\(+\:{}_{4}\mr{C}_{1}\) 回) |
第2項で | \(-\:6\) 回 | (\(-\:{}_{4}\mr{C}_{2}\) 回) |
第3項で | \(+\:4\) 回 | (\(+\:{}_{4}\mr{C}_{3}\) 回) |
第4項で | \(-\:1\) 回 | (\(-\:{}_{4}\mr{C}_{4}\) 回) |
であり、合計のカウント数は1である。以上で、1つの集合だけに属する要素も、2~4個の集合の共通部分の要素もすべて1回カウントされているから、題意は正しい。【証明終】
集合の数が \(n\)個 の場合の一般論では次のようになります。
\(|A_1\cup A_2\cup A_3\cup\cd\cup A_n|=\)
|
【証明】
1つの集合だけに属する要素は、第1項だけでプラス・カウントされているから、カウント数は1である。また、\(m\)個の集合の共通部分(\(2\leq m\leq n\))は、第1項 ~ 第\(\bs{m}\)項でカウントされ、回数はそれぞれ、
第1項で | \(+\) | \({}_{m}\mr{C}_{1}\) 回 |
第2項で | \(-\) | \({}_{m}\mr{C}_{2}\) 回 |
第3項で | \(+\) | \({}_{m}\mr{C}_{3}\) 回 |
\(\vdots\) | ||
第\(\bs{m}\)項で | \((-1)^{m-1}\cdot\) | \({}_{m}\mr{C}_{m}\) 回 |
だから、合計のカウント数は、
\(\displaystyle\sum_{k=1}^{m}(-1)^{k-1}{}_{m}\mr{C}_{k}\)
である。この式の値を評価するために \((x-1)^m\) の二項展開を利用する。\((x-1)^m\) を二項展開すると、
\(\begin{eqnarray}
&&\:\:(x-1)^m=&x^m-{}_{m}\mr{C}_{1}x^{m-1}+{}_{m}\mr{C}_{2}x^{m-2}\\
&&&-{}_{m}\mr{C}_{3}x^{m-3}+\:\cd\:+(-1)^m{}_{m}\mr{C}_{m}\\
\end{eqnarray}\)
となるが、この式に \(x=1\) を代入すると、
左辺\(=0\)
右辺\(=1-{}_{m}\mr{C}_{1}x+{}_{m}\mr{C}_{2}-{}_{m}\mr{C}_{3}+\:\cd\:+(-1)^m{}_{m}\mr{C}_{m}\)
である。ここから、
\({}_{m}\mr{C}_{1}-{}_{m}\mr{C}_{2}+{}_{m}\mr{C}_{3}-\:\cd\:-(-1)^m{}_{m}\mr{C}_{m}\) | \(=1\) | |
\({}_{m}\mr{C}_{1}-{}_{m}\mr{C}_{2}+{}_{m}\mr{C}_{3}-\:\cd\:+(-1)^{m-1}{}_{m}\mr{C}_{m}\) | \(=1\) |
となる。従って、\(m\)個の集合の共通部分(\(2\leq m\leq n\))は、\(m\) の値にかかわらず合計1回だけカウントされている。
以上で1つの集合だけに属する要素も、共通部分に属する要素も、すべて1回カウントされているから、題意は正しい。【証明終】
完全順列の個数を数える
包除原理を踏まえて、完全順列の個数を計算します。\(1\) ~ \(n\) の \(n\) 個の数字の順列の集合を \(P(n)\) とすると \(|P(n)|=n!\) です。これらの中で、順列の \(i\) 番目の数字 \(d_i\) が \(i\) でないもの \((1\leq i\leq n)\) が完全順列(complete permutation)です。つまり、
\(d_i\neq i\:\:(1\leq i\leq n)\)
を満たす順列です。ここでは完全順列の反対、つまり、
ある \(i\:(1\leq i\leq n)\) について \(d_i=i\)
となる順列を「不完全順列」(incomplete permutation)と呼ぶことにし(ここだけの用語です)、
\(P_{cp}(n)\):完全順列の集合
\(P_{ip}(n)\):不完全順列の集合
と書くことにします。
\(\begin{eqnarray}
&&\:\:|P(n)|&=|P_{cp}(n)|+|P_{ip}(n)|\\
&&&=n!\\
\end{eqnarray}\)
です。以下、不完全順列の個数(\(|P_{ip}(n)|\))を調べることにします。
\(1\) ~ \(n\) の \(n\)個の数字の順列で、\(i\) 番目の数字 \(d_i\) が \(d_i=i\) であるような順列の集合を \(A_i\) と定義します。そうすると、不完全順列の集合は、
\(P_{ip}(n)=A_1\cup A_2\cup A_3\cup\cd\cup A_n\)
と表現できます。もちろん、\(A_1,\:A_2,\:A_3,\:\cd\) の要素にはかなりの重複があります。ここで、重複を排して不完全順列の数を数えるために包除原理を使うと、
\(|P_{ip}(n)|=\)
\(+\displaystyle\sum_{i=1}^{n}|A_i|\) | 第1項 | ||
\(-\displaystyle\sum_{1\leq i < j}^{n}|A_i\cap A_j|\) | 第2項 | ||
\(+\displaystyle\sum_{1\leq i < j < k}^{n}|A_i\cap A_j\cap A_k|\) | 第3項 | ||
\(\vdots\) | |||
\((-1)^{n-1}\cdot|A_1\cap A_2\cap A_3\cap\cd\cap A_n|\) | 第\(\bs{n}\)項 |
となります。まず、第1項を考えると、\(|A_1|\) は「1番目の数字以外の \(n-1\) 個の数字」がつくる順列の数だけあります。つまり、
\(|A_1|=(n-1)!\)
であり、問題の対称性から、
\(|A_1|=|A_2|=|A_3|=\:\cd\:=|A_n|\)
なので、第1項\(=n\cdot(n-1)!\) です。
第2項は、2つの数字の選び方が \({}_{n}\mr{C}_{2}\) 通りあり、それぞれについて「2つの数字以外の \((n-2)\) 個の数字」がつくる順列の数=\((n-2)!\) だけマイナス・カウントされるので、
第2項\(=-{}_{n}\mr{C}_{2}\cdot(n-2)!\)
です。同様に考えて全体をまとめると、
第1項\(=\) | \(+\) | \({}_{n}\mr{C}_{1}\cdot(n-1)!\) |
第2項\(=\) | \(-\) | \({}_{n}\mr{C}_{2}\cdot(n-2)!\) |
第3項\(=\) | \(+\) | \({}_{n}\mr{C}_{3}\cdot(n-3)!\) |
\(\vdots\) | ||
第\(\bs{n}\)項\(=\) | \((-1)^{n-1}\cdot\) | \({}_{n}\mr{C}_{n}\cdot0!\) |
となります。従って、不完全順列の数はこれらを合算して、
\(|P_{ip}(n)|\)
\(\begin{eqnarray}
&&\:\:&=&n\cdot(n-1)!-\dfrac{n!}{(n-2)!2!}\cdot(n-2)!+\\
&&&&\dfrac{n!}{(n-3)!3!}\cdot(n-3)!-\cd\:+(-1)^{n-1}\cdot1\\
&&&=&n!\left(1-\dfrac{1}{2!}+\dfrac{1}{3!}-\:\cd\:+(-1)^{n-1}\dfrac{1}{n!}\right)\\
\end{eqnarray}\)
と計算できます。完全順列の数は、
\(|P_{cp}(n)|\)
\(=n!-|P_{ip}(n)|\)
\(=n!\left(\dfrac{1}{2!}-\dfrac{1}{3!}+\:\cd\:-(-1)^{n-1}\dfrac{1}{n!}\right)\)
\(=n!\left(\dfrac{1}{2!}-\dfrac{1}{3!}+\:\cd\:+(-1)^n\dfrac{1}{n!}\right)\)
です。
マッチング成立・不成立の確率
以上の不完全順列の個数をもとに、マッチングが成立する確率 \(\mathcal{P}_{match}(n)\) を計算すると、
\(\begin{eqnarray}
&&\:\:\mathcal{P}_{match}(n)&=\dfrac{|P_{ip}(n)|}{n!}\\
&&&=1-\dfrac{1}{2!}+\dfrac{1}{3!}-\:\cd\:+(-1)^{n-1}\dfrac{1}{n!}\\
&&&=\displaystyle\sum_{k=1}^{n}(-1)^{k-1}\dfrac{1}{k!}\\
\end{eqnarray}\)
となります。マッチングが不成立の確率 \(\mathcal{P}_{unmatch}(n)\) は、
\(\begin{eqnarray}
&&\:\:\mathcal{P}_{unmatch}(n)&=\dfrac{|P_{cp}(n)|}{n!}\\
&&&=\dfrac{1}{2!}-\dfrac{1}{3!}+\:\cd\:+(-1)^n\dfrac{1}{n!}\\
&&&=\displaystyle\sum_{k=2}^{n}(-1)^k\dfrac{1}{k!}\\
\end{eqnarray}\)
であり、これが「くじによる席替え」が成功する確率です。
ここで、\(\displaystyle\lim_{n\rightarrow\infty}\mathcal{P}_{match}(n)\)、\(\displaystyle\lim_{n\rightarrow\infty}\mathcal{P}_{unmatch}(n)\) の値を求めます。これにはテイラー展開の特別の場合であるマクローリン展開を使います。自然対数の底を \(e\) とすると、\(e^x\) のマクローリン展開は、
\(e^x=1+x+\dfrac{1}{2!}x^2+\dfrac{1}{3!}x^3+\dfrac{1}{3!}x^4+\:\cd\)
です。この式で \(x=-1\) とすると、
\(\dfrac{1}{e}=\dfrac{1}{2!}-\dfrac{1}{3!}+\dfrac{1}{4!}-\:\cd\)
\(1-\dfrac{1}{e}=1-\dfrac{1}{2!}+\dfrac{1}{3!}-\dfrac{1}{4!}+\:\cd\)
なので、
\(\begin{eqnarray}
&&\:\:\displaystyle\lim_{n\rightarrow\infty}\mathcal{P}_{match}(n)&=1-\dfrac{1}{e}\\
&&&=0.6321205588285577\cd\\
&&\:\:\displaystyle\lim_{n\rightarrow\infty}\mathcal{P}_{unmatch}(n)&=\dfrac{1}{e}\\
&&&=0.3678794411714423\cd\\
\end{eqnarray}\)
となります。ちなみに、この値を初めて求めたのは大数学者のオイラーだそうです。
\(\mathcal{P}_{unmatch}(n)\) の値(=順列の中の完全順列の割合)を、\(n=3\) ~ \(13\)(=カードの枚数) について計算し、小数点以下\(10\)桁だけを表示すると次の表の通りになります。
\(3\) | \(0.3333333333\) |
\(4\) | \(0.3750000000\) |
\(5\) | \(0.3666666666\) |
\(6\) | \(0.3680555555\) |
\(7\) | \(0.3678571428\) |
\(8\) | \(0.3678819444\) |
\(9\) | \(0.3678791887\) |
\(10\) | \(0.3678794642\) |
\(11\) | \(0.3678794392\) |
\(12\) | \(0.3678794413\) |
\(13\) | \(0.3678794411\) |
\(\vdots\) | \(\vdots\) |
\(\infty\) | \(0.3678794411\) |
\(n=6\) あたりから急速に極限値である \(\dfrac{1}{e}=0.3678794411\cd\) に近づき、\(n=13\) では小数点以下\(10\)桁までが極限値と一致します。以降はほぼ一定の値になり、もちろん\(40\)人クラスの席替えの成功率も極限値とほぼ一致します。ということで、\(n\) が極端に少ない場合(\(5\) 以下)を除き、
マッチング成立の確率 | :\(63.2\:\%\) | |
マッチング不成立の確率 | :\(36.8\:\%\) |
としてよいのでした。つまり、くじによる席替えの成功確率は約\(\bs{36.8\:\%}\) であり、クラスの人数によらない。これが結論です。この「\(n\) の値にかかわらず確率がほぼ一定」というところが、少々直感に反する結果になるのでした。
補記:漸化式 |
本文では包除原理を使って完全順列の個数を求めましたが(包除原理の証明が記事の目的の一つでした)、完全順列の個数を示す漸化式を作ることができます。それを説明します。簡潔に書くために、\(n\) 個の数字の完全順列の数を \(D(n)\) とします(攪乱順列:derangement の \(D\) で、本文では \(|P_{cp}(n)|\) としたのもです)。
わかりやすく説明するために、\(n\) 個の箱があり、\(1\) ~ \(n\) の番号が振ってあるとします。また \(n\) 枚のカードがあり、\(1\) ~ \(n\) の番号が書かれています。このカードを1枚づつ順に箱に入れるとします。入れる順番は任意ですが、1つの箱には1枚のカードしか入れられません。箱に入れていないカードを "残っているカード"、カードが入っていない箱を "残っている箱" と表現します。
この状況で、カードと箱の対応パターンは \(n!\) 通りあります。
ここで「カードの番号と同じ番号の箱には入れない」というルールを設けます。このルールがあると、\(n\) 個の箱への \(n\) 枚のカードの対応パターンは完全順列の数である \(D(n)\) 通りになります。
入れる順序は任意なので、最初にカード \(\bs{1}\) を箱 \(\bs{i\:\:(i\neq1)}\) に入れるとします。\(i\) の選び方は \(n-1\) 通りあります。次に、カード \(\bs{i}\) を残っているどれかの箱に入れるとします。どの箱に入れるかを2つに分けて考えます。
カード \(i\) を箱 \(1\) に入れる場合
入れた後では、箱 \(1\) にカード \(i\)、箱 \(i\) にカード \(1\) がある状態です。残っているのは、
カード | :\(2,\:3,\:\cd,\:i-1,\:i+1,\:\cd\:,\:n\) | |
箱 | :\(2,\:3,\:\cd,\:i-1,\:i+1,\:\cd\:,\:n\) |
であり、これらの \((n-2)\) 枚のカードをルールに沿って \((n-2)\) 個の箱に入れるパターンは、定義から \(D(n-2)\) 通りです。
カード \(i\) を箱 \(1\) に入れない場合
この場合、カード \(i\) は "箱 \(1\) 以外の残っている箱" に入れることになります。ここで、カードの番号 \(i\) を \(1\) に書き換えてしまいます。こうしたとしても(書き換えた結果の)カード \(1\) は、"箱 \(1\) 以外の残っている箱" に入れることになります。カード \(1\) は箱 \(1\) に入れてはいけないというルールがあるからです。つまり、カード番号 の \(i\) を \(1\) に書き換えたとしても、「ルールに沿ってカードを箱に入れるパターンの数」は変わりません。
カードの番号を書き換えた直後の状態で、残っているのは、
カード | :\(1,\:2,\:3,\:\cd,\:i-1,\:i+1,\:\cd\:,\:n\) | |
箱 | :\(1,\:2,\:3,\:\cd,\:i-1,\:i+1,\:\cd\:,\:n\) |
となり、これらの \((n-1)\) 枚のカードをルールに沿って \((n-1)\) 個の箱に入れるパターンは、定義から \(D(n-1)\) 通りです。\((n-1)\) 枚を箱に入れ終わったあとで、\(1\) に書き換えたカードを \(i\) に戻せば、\(1\) から \(n\) のカードをすべて箱に入れたことになります。
まとめると、最初の \(i\) の選び方は \(n-1\) 通りあり、それぞれについて、
カード \(i\) を箱 \(1\) に入れる場合 | :\(D(n-2)\) 通り | |
カード \(i\) を箱 \(1\) に入れない場合 | :\(D(n-1)\) 通り |
があり、この2つは排他的です。従って、
\(D(n)=(n-1)(D(n-1)+D(n-2))\)
の漸化式が得られます。\(D(1)=0,\:\:D(2)=1\) なので、
\(D(1)=0\)
\(D(2)=1\)
\(D(3)=2\cdot(1+0)=2\)
\(D(4)=3\cdot(2+1)=9\)
などとなります。
\(D(n)\) の一般項を求めるために漸化式を変形します。
\(D(n)=(n-1)(D(n-1)+D(n-2))\)
\(\begin{eqnarray}
&&\:\:D(n)=&nD(n-1)-D(n-1)\\
&&&+(n-1)D(n-2)\\
\end{eqnarray}\)
\(D(n)-nD(n-1)=\)
\(-(D(n-1)-(n-1)D(n-2))\)
\(B(n)=D(n)-nD(n-1)\) とおくと、
\(B(2)=D(2)-2\cdot D(1)=1\)
\(B(n)=-B(n-1)\)
です。従って \(B(n)\) の一般項は、
\(B(n)=(-1)^n\)
であり、\(D(n)\) に戻すと、
\(D(n)-nD(n-1)=(-1)^n\)
になります。この両辺を \(n!\) で割ると、
\(\dfrac{D(n)}{n!}-\dfrac{D(n-1)}{(n-1)!}=(-1)^n\dfrac{1}{n!}\)
が得られます。この式の両辺を \(2\) から \(n\) までたし算して整理すると、
\(\dfrac{D(n)}{n!}-\dfrac{D(1)}{1!}\)
\(=\dfrac{1}{2!}-\dfrac{1}{3!}+\:\cd+(-1)^n\dfrac{1}{n!}\)
\(D(n)=n!\cdot\displaystyle\sum_{k=2}^{n}(-1)^k\dfrac{1}{k!}\)
となり、包除原理を使った計算(\(|P_{cp}(n)|\))と一致します。
エレガントな解法ですが、漸化式を求めるのが難しい。特に「カード \(i\) を箱 \(1\) に入れない場合の数が \(D(n-1)\) である」ことをゼロから発想するのは大変でしょう。「カード \(i\) を箱 \(1\) に入れない」ということを「ルール上、カード \(1\) は箱 \(1\) に入れられない」と同一視する発想が必要です。また、漸化式から一般項を求める際にも、「式の変形」と「\(n!\) で割る」という、2つの "一般項生成テクニック" がポイントになっています。
ということで、本文では包除原理を使った説明にしました。この方がマッチング問題の本質をとらえています。
ただ、問題の本質をとらえた正攻法で "丹念に" 証明するしかないと "一見思える" 問題でも、漸化式という大変エレガントな解答がある。そのあたりに数学の深さの一端が現れていると思います。
2024-09-21 15:36
nice!(0)
No.375 - 定住生活の起源 [科学]
No.232「定住生活という革命」の続きです。最近の新聞に日本列島における定住の起源に関する記事があったので、No.232 に関係した話として以下に書きます。
変わりゆく考古学の常識
2024年8月7日の朝日新聞(夕刊)に、
定住の兆し 旧石器時代に
変わりゆく考古学の常識
との見出しの記事が掲載されました。これは、東京大学大学院の森先一貴准教授が2024年度の浜田青陵賞(考古学の顕著な業績に贈られる賞。第36回)を受賞されたのを機に、記者が森先准教授に取材した記事です。見出しの通り、新しい発見によって考古学の従来の常識がどんどん書き換えられている、との主旨の記事です。
ちなみに見出しの「旧石器時代」ですが、日本列島に現生人類(ホモ・サピエンス)がやってきたのが約4万年前で、そこから縄文時代が始まる約1万6千年前までを世界の先史時代の区分に合わせて「旧石器時代」と呼んでいます。「旧石器」は打製石器、「新石器」は磨製石器の意味ですが、日本では縄文時代以前にも磨製石器があったので、石器の種類での時代区分はできません。
縄文時代を象徴するのは土器と竪穴式住居です。土器はクリなどを煮たり、食料を貯蔵したりする道具ですが、重くて壊れやすく、移動生活で携行するには不向きです。土器の出現は定住を示唆します。もちろん竪穴式住居は定住のしるしです。
しかし森先氏は、土器も住居跡も見つかっていない旧石器時代から、すでに「一時的な定住」があったと推定しています。その根拠が陥し穴猟です。
陥し穴とはどのようなものでしょうか。以下、森先氏の著書「日本列島4万年のディープヒストリー」(朝日選書 朝日新聞出版 2021)より紹介します。
陥し穴
日常の日本語では "落とし穴" ですが、狩猟用の穴(=罠)という意味で以下 "陥し穴" とします。
「陥し穴」は、地面に掘った土坑です。土坑とは、発掘調査で確認される遺構のうち人間が掘ったと考えられる穴で、その性格がすぐには見極めにくいものをいいます。竪穴式住居跡とか、人骨が発掘される墓は目的が明確ですが、それ以外の、必ずしも目的が明確ではない穴が土坑です。その土坑のなかで、研究によって狩猟用の罠だと推定されたのが陥し穴です。縄文時代の陥し穴は、上の引用にある港北ニュータウンや多摩ニュータウンの造成地だけではなく、日本列島の各地から発見されています。
ところが狩猟用の陥し穴は、縄文時代より遙か以前、旧石器時代の日本列島に存在したことが分かってきました。それが次の引用です。引用に出てくる姶良火山とは、現在の鹿児島湾にあった火山で、約3万年前に大噴火を起こしました。噴火の跡はカルデラ(=姶良カルデラ)になり、そこに海水が引き込まれてできたのが鹿児島湾です。現在の桜島はその姶良カルデラの外輪山の一部が火山になっているものです。外輪山の一部が桜島ということをとってみても、姶良火山の噴火がいかに巨大だったかがわかります。
列島各地で発見された陥し穴の形は、細長い溝状のものや、平面が円形、楕円形、四角形などです。このような形は旧石器時代も縄文時代も共通です。
陥し穴を使った狩猟のやり方は、動物が障害物を嫌う性質を利用し、列状に掘った穴と穴の間に柵を作って、動物を穴に誘導したと考えられています。陥し穴は、弓矢や槍を使った罠などと違って、狩猟対象動物を傷つけません。そのため、血の匂いで他の肉食動物をおびき寄せるようなことはなく、数日間隔で見回ることで狩猟ができます。その間は別の食料(魚、木の実など)の獲得を行える。いったん掘ってしまえば、効率的に狩りができる方法です。
旧石器時代の陥し穴が見つかっている地域は、縄文時代とは違って、関東から九州(宮崎、種子島)にかけての太平洋沿岸に限られます。3万年前は氷期ですが、関東以南の太平洋沿岸は黒潮の影響で比較的温暖であり、広葉樹林が広がっていました。広葉樹林があれば、コナラ類の樹木の実(ドングリやクリ、クルミなど)やトチの実を食料にできます。もちろん、川で魚をとることもできる。これらの食料資源を合わせて「定住的な」生活をしていた可能性が高いのです。
森先氏の陥し穴に関する解説は、次のように締めくくられています。
森先氏は「大昔のことだから知能や能力が劣っているはずだとみなす時代遅れの進歩史観」と書いていますが、まさにその通りだと思います。人間は言葉をもつので、それによって技術や文化を伝承し積み重ねることでより高度にできます。そのため我々は暗黙に "進歩史観バイアス" を持ってしまうのですね。しかし知能や能力に関していうと、そのベースのところは「ホモ・サピエンスであれば同じ」はずです。少なくとも3万年とかそいういった "短期間" では変わらないでしょう。旧石器時代とか縄文時代、弥生時代といった先史時代を想像するときには "進歩史観バイアス" を排除する必要があります。
陥し穴猟で思うのは、現生人類は "計画と実行"によって生きることができるということです。先史時代の人類の狩猟というと、槍を獲物に投げつけて倒すとか、多人数で協力して獲物の群れを追い込んで崖から落として一網打尽にするとか、そういった話を歴史書で読みます。しかし陥し穴による猟はそれとは全く違うレベルにあります。
つまり陥し穴は、狩猟採集の一般形である「獲物を探して目の前に現れたところを槍で捕獲する」「食用植物を探し出して採集する」ということを完全に超越した行為です。"超越" としたのは、陥し穴を掘ったとしても今日の食料、明日の糧を得るためには何の役にも立たないからです。それでも多大な労力と時間をかけて陥し穴を掘るのは、それでシカやイノシシを捕獲できるという「まだ見ぬ未来」を想像し、予見できるからです。もちろん捕獲できないリスクはあるが、そのリスク込みで予見にもとづいた計画を立て、それにもとづいて実行する能力があるのです。
農耕も同じです。イネ科植物(コムギやコメ)を植えたとしても、食料になるのは数ヶ月先であり、それまでのあいだは数々の世話をする必要があります。もちろん、植える前に土地を耕すのも骨の折れる作業です。作物と気候環境によりますが、水路を作る必要も出てくるでしょう。収穫ゼロというリスクも当然あるが、数ヶ月後にどっさりと食料を得られるはずだという計画があり、それにもとづいて実行できるから農耕が成立します。
我々はこういった "予見にもとづく計画と実行" を当たり前だと思っていますが、これは大変な能力だと思います。ささやかな短期的報酬よりも(あるいは短期的には不利益になったとしても)、より大きい長期的な報酬を選択できる能力、これが "ホモ・サピエンス=賢いヒト" たるゆえんでしょう。
人類史のなかの定住革命
ここで、冒頭に書いた No.232「定住生活という革命」を振り返ります。No.232 は西田正規氏(筑波大学名誉教授)の『人類史のなかの定住革命』(講談社学術文庫。単行本は 1986年出版)の内容を紹介したものでした。この本の内容は森先氏の著書「日本列島4万年のディープヒストリー」でも引用されています。人類は約1万年前に定住生活を始めましたが、それ以前は遊動生活でした。「定住」と反対の言葉が「遊動」です。
西田氏は定住生活を促進した一つの要因として定置漁具による漁撈をあげていました。もちろん遊動生活を送っていた旧石器時代でもヤスやモリで魚を採っていましたが、このような漁具は大量の魚が川に遡上するような環境と季節でしか効率的ではありません。
これに対し、定住とともに出現したのはヤナ(梁)、ウケ(筌)、魚網などの定置漁具、ないしは定置性の強い漁具です。ヤナは、木や竹で簀の子状に編んだ台を川や川の誘導路に設置し、上流ないしは下流から泳いできた魚が簀の子にかかるのを待つ漁具です。ウケは、木や竹で編んだ籠を作り、魚の性質を利用して入り口から入った魚を出られなくして漁をするもので、川や池、湖、浅瀬の海に沈めて使われました。ヤスやモリで魚を突くのは大型の魚にしか向きませんが、定置漁具は小さな魚に対しても有効です。こういった定置漁具の発明が定住化を促進する要因になったというのが、西田氏の論でした。
この「定置漁具」に相当する、陸上での「定置狩猟のための罠」が「陥し穴」と言えるでしょう。陥し穴は、それが有効であればあるだけ、定住を促進する要因になります。この "定置狩猟罠" は3万年前の旧石器時代に場所を限って現れ、縄文時代には列島全体に広がった。森先氏が言うように、縄文時代に本格化する定住生活の "兆し" がまさに旧石器時代にあったことになります。
西田氏の『人類史のなかの定住革命』の主張の根幹にあるのは、
という認識です。我々はえてして、遊動=遅れている、定住=進んでいる、というような "進歩史観バイアス" に捕らわれています。現代では定住が当たり前で、住所不定は犯罪者と同義に使われることがあるほどなので、そうなるのは当然かも知れません。しかし西田氏はこのようなバイアスを一切取り去った見方をしています。そして、定住という極めて困難な生活様式に挑戦する中で人類の文化に革命が起こったと主張しているわけです。そもそも、なぜ遊動生活をするのかという理由(=遊動の要因)は、
などです。経済面の補足をすると、食料資源となる動植物は季節によって分布を変えることが多く(特に中緯度の温帯地域では)、遊動生活の要因になります。
定住生活をするとなると、遊動の要因となる事項を、すべて定住地で解決しなければなりません。これは大変なことです。まず、最も重要な食料資源を定住地近辺での狩猟採集で獲得し、さらに資源の季節変動を平準化するために保存方法を工夫しなければなりません。
また、ゴミや排泄物の処理ルールを決めて定住地を常に清潔に保つ必要があります。でないと寄生虫や病原菌が蔓延して、最悪の場合は定住民が全滅しかねません。集団内の不和はリーダーが(ないしは何らかの "権威" が)解決し、水害が発生したとしたらそれを避ける工夫をし、さらに墓地などを作って死者と共存しなければなりません。
定住地の中のある場所で "災い" が起こったとしたら、それは精霊の怒りと考えられるので、(たとえば)その場所に祠を建てて祈祷をし、精霊の怒りを鎮める ・・・・・・ というような行為を通じて、"災いの場所" とも共存する必要があります。
定住をした以上、定住地から逃げるわけにはいかない。そのための課題解決をする中で新しい人類の文化が生まれたというのが西田氏の見解でした。
であれば、3万年前に陥し穴を作った人々は、たとえ定住が季節的であったとしても、定住で発生する諸問題を解決する最初の一歩、革命を起こす一歩を踏み出したのでしょう。それが縄文時代の文化の発展につながっていった。3万年前に日本列島にいた人たちと現代の我々は無関係ではなく、連続していると感じました。
変わりゆく考古学の常識
2024年8月7日の朝日新聞(夕刊)に、
定住の兆し 旧石器時代に
変わりゆく考古学の常識
との見出しの記事が掲載されました。これは、東京大学大学院の森先一貴准教授が2024年度の浜田青陵賞(考古学の顕著な業績に贈られる賞。第36回)を受賞されたのを機に、記者が森先准教授に取材した記事です。見出しの通り、新しい発見によって考古学の従来の常識がどんどん書き換えられている、との主旨の記事です。
ちなみに見出しの「旧石器時代」ですが、日本列島に現生人類(ホモ・サピエンス)がやってきたのが約4万年前で、そこから縄文時代が始まる約1万6千年前までを世界の先史時代の区分に合わせて「旧石器時代」と呼んでいます。「旧石器」は打製石器、「新石器」は磨製石器の意味ですが、日本では縄文時代以前にも磨製石器があったので、石器の種類での時代区分はできません。
|
縄文時代を象徴するのは土器と竪穴式住居です。土器はクリなどを煮たり、食料を貯蔵したりする道具ですが、重くて壊れやすく、移動生活で携行するには不向きです。土器の出現は定住を示唆します。もちろん竪穴式住居は定住のしるしです。
しかし森先氏は、土器も住居跡も見つかっていない旧石器時代から、すでに「一時的な定住」があったと推定しています。その根拠が陥し穴猟です。
|
陥し穴とはどのようなものでしょうか。以下、森先氏の著書「日本列島4万年のディープヒストリー」(朝日選書 朝日新聞出版 2021)より紹介します。
陥し穴
日常の日本語では "落とし穴" ですが、狩猟用の穴(=罠)という意味で以下 "陥し穴" とします。
|
ところが狩猟用の陥し穴は、縄文時代より遙か以前、旧石器時代の日本列島に存在したことが分かってきました。それが次の引用です。引用に出てくる姶良火山とは、現在の鹿児島湾にあった火山で、約3万年前に大噴火を起こしました。噴火の跡はカルデラ(=姶良カルデラ)になり、そこに海水が引き込まれてできたのが鹿児島湾です。現在の桜島はその姶良カルデラの外輪山の一部が火山になっているものです。外輪山の一部が桜島ということをとってみても、姶良火山の噴火がいかに巨大だったかがわかります。
|
![]() |
初音ヶ原遺跡(静岡県三島市) |
連なっている丸い穴が、3万年前の陥し穴とみられる土坑群である。直径1~2メートル、深さ1.4~2メートルで、かなり大きくて深い。陥し穴はこのように列状に作られており、穴と穴の間に柵を配置して、移動してくる動物(シカやイノシシなど)を誘導したと考えられている。 |
(AERAdot. 2019.7.25 より) |
|
列島各地で発見された陥し穴の形は、細長い溝状のものや、平面が円形、楕円形、四角形などです。このような形は旧石器時代も縄文時代も共通です。
![]() |
船久保遺跡(神奈川県横須賀市) |
船久保遺跡の上空からの写真に、丸形と四角形の土坑の位置を白で示した図。それぞれの形の土坑が列状に連なっていて、陥し穴と推定されている。画面の下の方に丸穴が波形に連なっている。また左下から右上にかけて四角い穴が直線上に並んでいる。 |
(NHK BS「ヒューマニエンス」2024.3.19 より) |
![]() |
船久保遺跡で発掘された四角形の陥し穴。旧石器時代の陥し穴で四角形のものはめずらしい。 |
(NHK サイカルジャーナル 2018.6.15 より) |
![]() |
船久保遺跡の四角形の陥し穴でシカを捕獲する想像図。穴は底に向かって狭くなっている。シカの後足の力は強いが、前足は弱く、前足だけが穴に落ちると脱出は難しくなる。狩猟対象の動物によって穴の形状を変えた(たとえば、丸形はイノシシ、四角形はシカ)と推測する学者もいる。 |
(NHK BS「ヒューマニエンス」2024.3.19 より) |
![]() |
大津保畑遺跡(鹿児島県 中種子町:種子島の中央部)で発掘された旧石器時代の円形の陥し穴。底部が膨らんでいて、穴に落ちた動物が逃げにくい形をしている。 |
(AERAdot. 2019.7.25 より) |
|
陥し穴を使った狩猟のやり方は、動物が障害物を嫌う性質を利用し、列状に掘った穴と穴の間に柵を作って、動物を穴に誘導したと考えられています。陥し穴は、弓矢や槍を使った罠などと違って、狩猟対象動物を傷つけません。そのため、血の匂いで他の肉食動物をおびき寄せるようなことはなく、数日間隔で見回ることで狩猟ができます。その間は別の食料(魚、木の実など)の獲得を行える。いったん掘ってしまえば、効率的に狩りができる方法です。
![]() |
国立科学博物館に展示されている、旧石器時代の陥し穴猟の想像模型。人との対比で穴の大きさがわかる。 |
(AERAdot. 2019.7.25 より) |
|
旧石器時代の陥し穴が見つかっている地域は、縄文時代とは違って、関東から九州(宮崎、種子島)にかけての太平洋沿岸に限られます。3万年前は氷期ですが、関東以南の太平洋沿岸は黒潮の影響で比較的温暖であり、広葉樹林が広がっていました。広葉樹林があれば、コナラ類の樹木の実(ドングリやクリ、クルミなど)やトチの実を食料にできます。もちろん、川で魚をとることもできる。これらの食料資源を合わせて「定住的な」生活をしていた可能性が高いのです。
|
森先氏の陥し穴に関する解説は、次のように締めくくられています。
|
森先氏は「大昔のことだから知能や能力が劣っているはずだとみなす時代遅れの進歩史観」と書いていますが、まさにその通りだと思います。人間は言葉をもつので、それによって技術や文化を伝承し積み重ねることでより高度にできます。そのため我々は暗黙に "進歩史観バイアス" を持ってしまうのですね。しかし知能や能力に関していうと、そのベースのところは「ホモ・サピエンスであれば同じ」はずです。少なくとも3万年とかそいういった "短期間" では変わらないでしょう。旧石器時代とか縄文時代、弥生時代といった先史時代を想像するときには "進歩史観バイアス" を排除する必要があります。
陥し穴猟で思うのは、現生人類は "計画と実行"によって生きることができるということです。先史時代の人類の狩猟というと、槍を獲物に投げつけて倒すとか、多人数で協力して獲物の群れを追い込んで崖から落として一網打尽にするとか、そういった話を歴史書で読みます。しかし陥し穴による猟はそれとは全く違うレベルにあります。
つまり陥し穴は、狩猟採集の一般形である「獲物を探して目の前に現れたところを槍で捕獲する」「食用植物を探し出して採集する」ということを完全に超越した行為です。"超越" としたのは、陥し穴を掘ったとしても今日の食料、明日の糧を得るためには何の役にも立たないからです。それでも多大な労力と時間をかけて陥し穴を掘るのは、それでシカやイノシシを捕獲できるという「まだ見ぬ未来」を想像し、予見できるからです。もちろん捕獲できないリスクはあるが、そのリスク込みで予見にもとづいた計画を立て、それにもとづいて実行する能力があるのです。
農耕も同じです。イネ科植物(コムギやコメ)を植えたとしても、食料になるのは数ヶ月先であり、それまでのあいだは数々の世話をする必要があります。もちろん、植える前に土地を耕すのも骨の折れる作業です。作物と気候環境によりますが、水路を作る必要も出てくるでしょう。収穫ゼロというリスクも当然あるが、数ヶ月後にどっさりと食料を得られるはずだという計画があり、それにもとづいて実行できるから農耕が成立します。
我々はこういった "予見にもとづく計画と実行" を当たり前だと思っていますが、これは大変な能力だと思います。ささやかな短期的報酬よりも(あるいは短期的には不利益になったとしても)、より大きい長期的な報酬を選択できる能力、これが "ホモ・サピエンス=賢いヒト" たるゆえんでしょう。
ちなみに、No.169「十代の脳」に書いたのですが、"計画と実行" は脳の前頭前皮質の発達に依存した能力です。そして、前頭前皮質はヒトの思春期以降に本格的に発達する部分で、脳の中では最も遅く発達します。これから推察できるのは、人類が最も遅く獲得した能力が "計画と実行" だということです。
人類史のなかの定住革命
|
西田氏は定住生活を促進した一つの要因として定置漁具による漁撈をあげていました。もちろん遊動生活を送っていた旧石器時代でもヤスやモリで魚を採っていましたが、このような漁具は大量の魚が川に遡上するような環境と季節でしか効率的ではありません。
これに対し、定住とともに出現したのはヤナ(梁)、ウケ(筌)、魚網などの定置漁具、ないしは定置性の強い漁具です。ヤナは、木や竹で簀の子状に編んだ台を川や川の誘導路に設置し、上流ないしは下流から泳いできた魚が簀の子にかかるのを待つ漁具です。ウケは、木や竹で編んだ籠を作り、魚の性質を利用して入り口から入った魚を出られなくして漁をするもので、川や池、湖、浅瀬の海に沈めて使われました。ヤスやモリで魚を突くのは大型の魚にしか向きませんが、定置漁具は小さな魚に対しても有効です。こういった定置漁具の発明が定住化を促進する要因になったというのが、西田氏の論でした。
この「定置漁具」に相当する、陸上での「定置狩猟のための罠」が「陥し穴」と言えるでしょう。陥し穴は、それが有効であればあるだけ、定住を促進する要因になります。この "定置狩猟罠" は3万年前の旧石器時代に場所を限って現れ、縄文時代には列島全体に広がった。森先氏が言うように、縄文時代に本格化する定住生活の "兆し" がまさに旧石器時代にあったことになります。
西田氏の『人類史のなかの定住革命』の主張の根幹にあるのは、
定住生活は何も優れた生活様式ではなく、むしろ、それまで遊動生活をしてきた人類の生活や社会のあり方に大きな変革を要請するもので、極めて困難なものであった
という認識です。我々はえてして、遊動=遅れている、定住=進んでいる、というような "進歩史観バイアス" に捕らわれています。現代では定住が当たり前で、住所不定は犯罪者と同義に使われることがあるほどなので、そうなるのは当然かも知れません。しかし西田氏はこのようなバイアスを一切取り去った見方をしています。そして、定住という極めて困難な生活様式に挑戦する中で人類の文化に革命が起こったと主張しているわけです。そもそも、なぜ遊動生活をするのかという理由(=遊動の要因)は、
食料や水、エネルギー源(薪など)を得るため | |
集団内の不和や、ほかの集団との不和や緊張を避けるため | |
ゴミや排泄物の蓄積を避け、また風水害を避けるため | |
死・死体などの不快なもの、災いや危険(病気・怪我・事故など)から逃れるため |
などです。経済面の補足をすると、食料資源となる動植物は季節によって分布を変えることが多く(特に中緯度の温帯地域では)、遊動生活の要因になります。
定住生活をするとなると、遊動の要因となる事項を、すべて定住地で解決しなければなりません。これは大変なことです。まず、最も重要な食料資源を定住地近辺での狩猟採集で獲得し、さらに資源の季節変動を平準化するために保存方法を工夫しなければなりません。
また、ゴミや排泄物の処理ルールを決めて定住地を常に清潔に保つ必要があります。でないと寄生虫や病原菌が蔓延して、最悪の場合は定住民が全滅しかねません。集団内の不和はリーダーが(ないしは何らかの "権威" が)解決し、水害が発生したとしたらそれを避ける工夫をし、さらに墓地などを作って死者と共存しなければなりません。
定住地の中のある場所で "災い" が起こったとしたら、それは精霊の怒りと考えられるので、(たとえば)その場所に祠を建てて祈祷をし、精霊の怒りを鎮める ・・・・・・ というような行為を通じて、"災いの場所" とも共存する必要があります。
定住をした以上、定住地から逃げるわけにはいかない。そのための課題解決をする中で新しい人類の文化が生まれたというのが西田氏の見解でした。
であれば、3万年前に陥し穴を作った人々は、たとえ定住が季節的であったとしても、定住で発生する諸問題を解決する最初の一歩、革命を起こす一歩を踏み出したのでしょう。それが縄文時代の文化の発展につながっていった。3万年前に日本列島にいた人たちと現代の我々は無関係ではなく、連続していると感じました。
2024-08-31 16:16
nice!(0)
No.374 - マイノリティは過小評価される [科学]
No.347「少なくともひとりは火曜日生まれの女の子」は、偶然の出来事が起こる "確率" を考えることは人間にとって難しい、というテーマでした。イギリスの著名な数学者、イアン・スチュアートは次のように書いています。
スチュアートの本には次のような設問が載っていました。前提として、女の子と男の子は等しい確率で生まれてくるとします。また、赤ちゃんが生まれる曜日は、日・月・火・水・木・金・土、で同じ確率とします。
① の正解は \(\tfrac{1}{4}=0.25\) ですが、\(\tfrac{1}{3}\) と間違う人がいそうです(2人の子どもには、女女、女男、男男、の3パターンがあって、女女はそのうちの一つと考えてしまう)。
② のように「少なくとも一人は」などという条件が付くと難しくなります。正解は \(\tfrac{1}{3}\fallingdotseq 0.33\) です。
さらに ③ の ような複雑な条件になると、正解は不可能と言ってよいでしょう。③ の正解は \(\tfrac{13}{27}\fallingdotseq 0.48\) です。我々の直感では、「③の確率」は「②の確率」とイコール(ないしは同程度)ですが、正しい答えは "②とは全然違う" のです。
かなり難しい設問ですが(特に ③)、要するにスチュアートの言いたいことは「偶然の出来事が起こる確率を(素早く)推定するのは難しい」ということであり、平たく言うと「確率は難しい」ということです。それを言いたいがために、上の "ややこしい" 設問を作ったわけです。
ところで最近の新聞に確率は難しいことを如実に示す記事が掲載されました。それは「2人とも女の子問題」よりずっと簡単な確率ですが、それでも難しい。その記事は以下です。
性的少数者は過小視される
2024年7月23日の朝日新聞(夕刊)に、新潟大学の新美亮輔准教授の研究を取材した記事が掲載されました。見出しは、
「マイノリティー」少なく見積もる傾向
で、次のように始まります。
人には「マイノリティーの人が周囲にはいない」と思い込む傾向があり、それを確率の観点から実験を行って考察しようというのが主題です。具体的な設問と回答の例が以下です。
設問を簡潔に言うと、
となります。正解の計算方法は記事にありますが、それを求めると、
であり、上の引用のように「正解は89%」となります。しかし新美准教授の設問は電卓を使わずに答えて下さいということでしょう。暗算でできそうな範囲で、ざっと見積もるとどうなるか。
30人クラスの7% は約2人です。30人クラスが多数あった場合、① 同性愛者・両性愛者が2人いるクラスが最も多く、② 1人/3人のクラスがそれより少なく、③ 0人/4人のクラスがさらに少ない。仮に、①:②:③のクラス数の相対比率を 3:2:1 とすると、1人以上のクラスは9クラス(3+2+2+1+1)のうちの8クラスであり、9割程度のクラスで同性愛者・両性愛者が少なくとも一人いることになります。もちろん 3:2:1 は恣意的に決めただけなので、4:3:2 でもよいわけです(その場合は14クラスのうちの12クラス)。とにかく、かなりの高い確率で(ないしは、ほぼ間違いなく)30人クラスには同性愛者・両性愛者がいると見積もれます。
ただしこの設問は「暗算での見積もり」をするかどうかはともかく、直感で答えるのが主眼でしょう。直感で答えるとどうなるかがポイントです。
以上を踏まえて、新美准教授の調査を検討すると、最も多かった回答は 2% とあります。おそらくですが、2% と回答した人は設問の「1人でもいる確率」の意味が分からなかったのだろうと思います。もしくは「確率」の意味が分からなかった。意味が分からないので、設問にある数字である30(人)と 0.07(7%)をかけ算して 2 と答えた。もちろんこのかけ算の答えは 2人であり、30人クラスにいる同性愛者・両性愛者の平均的な数(期待値)です。
設問の意味が分からないときに、設問にある数字を適当に使って答えを "導く" のはよくあることです。従って、この調査は確率という言葉を用いないでやった方がよいと思います。たとえば一例ですが、
というような質問です。この質問でも、なおかつ2クラス(=2%)が最多の回答となるでしょうか。おそらくならないのではと思います。
問題はその次で、「10%を下回るとする答えが目立ち、約9割は実際の確率より小さくとらえていた」とあるところです。「10%を下回る答え」の場合、確率の意味を理解して答えているのかどうかは大いに疑問です。それはさておき、「約9割は実際の確率より小さくとらえていた」がポイントです。7% のマイノリティは、直感ではそれよりもずっと少なく感じられるようです。
記事には別の設問の結果が載っていました。
設問を簡潔に言うと、
となります。7% が 3% になっただけで、本質的には第1問と同じです。これも正解を計算で求めると、
であり、記事にあるように確率は60%です。「最も多くの人が回答した確率は1%」というのは第1問と同じで、30×0.03=1 の計算で 1% としたのでしょう。この設問でも「9割近くの人が過小にみていた」というのは、第1問と全く同じです。
記事にある「企業経営者は色覚異常者も働きやすい職場づくりに責をもつべきだ」という意見は "政治的に正しい" ので、たとえ建前であったとしても、賛否を問われると "Yes" と答える人が多いと予想できます。しかし「30人クラスで色覚異常者が一人でもいる確率は 60%」という正しい結果を知ると、"Yes" の率が 5ポイント以上増加したのが興味深いところです。
人間は確率が苦手
記事は次のように締めくくられています。
人間は確率が苦手です。それは、確率が単なる計算上の数字に見えてしまって実感が伴わないからでしょう。クラスの中にマイノリティの人は「いる」か「いない」かのどちらかです。0.6 人いるなんてことはない。10クラスあったら およそ 6クラスにはマイノリティの人がいると計算上言われても、10クラスに同時に所属できない以上、自分のクラスには「いる」か「いない」かです。つまり「クラスにマイノリティの人がいる確率は 60%」という計算上の数字を "実感" はできず、なんとなく違和感を抱いてしまう。これが "苦手" の根本要因だと思います。
そういった中で確率を問われると「約9割の人は、マイノリティが一人でもいる確率を過小にみていた」わけです。いわば「過小視バイアス」がかかってしまう。しかし逆に言うと「約1割の人は確率を正しく認識していた」ということです。こういう方もいたことに注意すべきでしょう。
この「過小視バイアス」の原因は何となく理解できます。設問は、7% ないしは 3% のマイノリティに関するものです。ということは、平均して回答者の 93%、97% はマジョリティ側の人です。マジョリティ側の人は、学校や職場などの社会集団において、おそらく設問にあるマイノリティの存在を経験したことがないと思います。なぜなら、同性愛者・両性愛者の人は、自分からそのことをカミングアウトしないのが今の社会では普通だからです。また、色覚異常は確かに不便で、場合によっては重大トラブルに至る可能性もありますが、当人は色覚異常を前提に安全に生活する知恵を身につけているはずです。自分から色覚異常だと集団のメンバーに告知する必然性は薄いはずです。
つまり回答者の大多数は過去に自分の経験した社会集団において、設問にあるようなマイノリティに接したことがないと感じたはずです(実はそれと知らずに接しているのだけれど)。自分の経験上は確率ゼロである。この "経験" が、過小視バイアスの一番の原因でしょう。記事にある「周囲にそうした人はいないという思い込み」です。
人口の 10% 前後は左利きです。今の社会で左利きは「隠すべきこと」ではないし、必然的に左利きは周囲に分かってしまうはずです。不便な面もあるでしょうが、左利き用の商品も多数あるし、逆にスポーツではサウスポーが有利なケースがいろいろあります(右利きだけどスポーツだけサウスポーの人さえいます)。左利きの子が学校のクラスにいたという記憶は、多くの人の脳裏にあるのではないでしょうか。マイノリティを「左利き」として設問すれば違った結果になったかもしれません。
このような「過小視バイアス」があるとして、設問は具体的な確率を答えるものです。計算で答えを出すわけではないので、計算以外の何らかの代替手段が必要です。「正しく認識していた約1割の人」は、上の方に書いた「暗算できそうな範囲で、ざっと見積もった」のかも知れません。
では、過小に答えた人は実際どうしたのでしょうか。記事を読むと、全くのあてずっぽうやランダムでもないようです。過小は過小なりの傾向がある。ということは、確率を認識するときに「人はどのような代替手段に頼っているのか」が問題です。
確率の認識に対する人のバイアスは、事故や災害の確率認識では重大問題になりかねません。また、マイノリティの人たちを支援する政策立案の際などでは、バイアスが暗黙に人の思考を束縛しかねないでしょう。「確率に対する人間の直感は絶望的だ」と諦めるのではなく、「確率を認識するときに、人はどのような代替手段に頼り、それがどういうバイアスを生むのか」という認知心理学の研究は、確かに意義があるものだと思いました。
|
スチュアートの本には次のような設問が載っていました。前提として、女の子と男の子は等しい確率で生まれてくるとします。また、赤ちゃんが生まれる曜日は、日・月・火・水・木・金・土、で同じ確率とします。
|
① の正解は \(\tfrac{1}{4}=0.25\) ですが、\(\tfrac{1}{3}\) と間違う人がいそうです(2人の子どもには、女女、女男、男男、の3パターンがあって、女女はそのうちの一つと考えてしまう)。
② のように「少なくとも一人は」などという条件が付くと難しくなります。正解は \(\tfrac{1}{3}\fallingdotseq 0.33\) です。
さらに ③ の ような複雑な条件になると、正解は不可能と言ってよいでしょう。③ の正解は \(\tfrac{13}{27}\fallingdotseq 0.48\) です。我々の直感では、「③の確率」は「②の確率」とイコール(ないしは同程度)ですが、正しい答えは "②とは全然違う" のです。
かなり難しい設問ですが(特に ③)、要するにスチュアートの言いたいことは「偶然の出来事が起こる確率を(素早く)推定するのは難しい」ということであり、平たく言うと「確率は難しい」ということです。それを言いたいがために、上の "ややこしい" 設問を作ったわけです。
ところで最近の新聞に確率は難しいことを如実に示す記事が掲載されました。それは「2人とも女の子問題」よりずっと簡単な確率ですが、それでも難しい。その記事は以下です。
性的少数者は過小視される
2024年7月23日の朝日新聞(夕刊)に、新潟大学の新美亮輔准教授の研究を取材した記事が掲載されました。見出しは、
「マイノリティー」少なく見積もる傾向
で、次のように始まります。
|
人には「マイノリティーの人が周囲にはいない」と思い込む傾向があり、それを確率の観点から実験を行って考察しようというのが主題です。具体的な設問と回答の例が以下です。
第1問:同性愛者・両性愛者がクラスにいる確率 |
|
設問を簡潔に言うと、
大学生の7%が同性愛者・両性愛者です。30人クラスの大学生の中に同性愛者・両性愛者が1人でもいる確率は何%だと思いますか |
となります。正解の計算方法は記事にありますが、それを求めると、
\(=1-(1-0.07)^{30}\) \(=0.88663\) |
であり、上の引用のように「正解は89%」となります。しかし新美准教授の設問は電卓を使わずに答えて下さいということでしょう。暗算でできそうな範囲で、ざっと見積もるとどうなるか。
30人クラスの7% は約2人です。30人クラスが多数あった場合、① 同性愛者・両性愛者が2人いるクラスが最も多く、② 1人/3人のクラスがそれより少なく、③ 0人/4人のクラスがさらに少ない。仮に、①:②:③のクラス数の相対比率を 3:2:1 とすると、1人以上のクラスは9クラス(3+2+2+1+1)のうちの8クラスであり、9割程度のクラスで同性愛者・両性愛者が少なくとも一人いることになります。もちろん 3:2:1 は恣意的に決めただけなので、4:3:2 でもよいわけです(その場合は14クラスのうちの12クラス)。とにかく、かなりの高い確率で(ないしは、ほぼ間違いなく)30人クラスには同性愛者・両性愛者がいると見積もれます。
ただしこの設問は「暗算での見積もり」をするかどうかはともかく、直感で答えるのが主眼でしょう。直感で答えるとどうなるかがポイントです。
以上を踏まえて、新美准教授の調査を検討すると、最も多かった回答は 2% とあります。おそらくですが、2% と回答した人は設問の「1人でもいる確率」の意味が分からなかったのだろうと思います。もしくは「確率」の意味が分からなかった。意味が分からないので、設問にある数字である30(人)と 0.07(7%)をかけ算して 2 と答えた。もちろんこのかけ算の答えは 2人であり、30人クラスにいる同性愛者・両性愛者の平均的な数(期待値)です。
設問の意味が分からないときに、設問にある数字を適当に使って答えを "導く" のはよくあることです。従って、この調査は確率という言葉を用いないでやった方がよいと思います。たとえば一例ですが、
大学生の7%が同性愛者・両性愛者です。大学生30人のクラスが100あったとします(合計3000人です)。この100クラスの中で同性愛者・両性愛者が1人でもいるクラスは何クラス程度ですか |
というような質問です。この質問でも、なおかつ2クラス(=2%)が最多の回答となるでしょうか。おそらくならないのではと思います。
問題はその次で、「10%を下回るとする答えが目立ち、約9割は実際の確率より小さくとらえていた」とあるところです。「10%を下回る答え」の場合、確率の意味を理解して答えているのかどうかは大いに疑問です。それはさておき、「約9割は実際の確率より小さくとらえていた」がポイントです。7% のマイノリティは、直感ではそれよりもずっと少なく感じられるようです。
第2問:色覚異常者がクラスにいる確率 |
記事には別の設問の結果が載っていました。
|
設問を簡潔に言うと、
色覚異常とされる人は人口の3%です。30人クラスの中に色覚異常者が1人でもいる確率は何%だと思いますか |
となります。7% が 3% になっただけで、本質的には第1問と同じです。これも正解を計算で求めると、
\(=1-(1-0.03)^{30}\) \(=0.59899\) |
であり、記事にあるように確率は60%です。「最も多くの人が回答した確率は1%」というのは第1問と同じで、30×0.03=1 の計算で 1% としたのでしょう。この設問でも「9割近くの人が過小にみていた」というのは、第1問と全く同じです。
記事にある「企業経営者は色覚異常者も働きやすい職場づくりに責をもつべきだ」という意見は "政治的に正しい" ので、たとえ建前であったとしても、賛否を問われると "Yes" と答える人が多いと予想できます。しかし「30人クラスで色覚異常者が一人でもいる確率は 60%」という正しい結果を知ると、"Yes" の率が 5ポイント以上増加したのが興味深いところです。
人間は確率が苦手
記事は次のように締めくくられています。
|
人間は確率が苦手です。それは、確率が単なる計算上の数字に見えてしまって実感が伴わないからでしょう。クラスの中にマイノリティの人は「いる」か「いない」かのどちらかです。0.6 人いるなんてことはない。10クラスあったら およそ 6クラスにはマイノリティの人がいると計算上言われても、10クラスに同時に所属できない以上、自分のクラスには「いる」か「いない」かです。つまり「クラスにマイノリティの人がいる確率は 60%」という計算上の数字を "実感" はできず、なんとなく違和感を抱いてしまう。これが "苦手" の根本要因だと思います。
そういった中で確率を問われると「約9割の人は、マイノリティが一人でもいる確率を過小にみていた」わけです。いわば「過小視バイアス」がかかってしまう。しかし逆に言うと「約1割の人は確率を正しく認識していた」ということです。こういう方もいたことに注意すべきでしょう。
この「過小視バイアス」の原因は何となく理解できます。設問は、7% ないしは 3% のマイノリティに関するものです。ということは、平均して回答者の 93%、97% はマジョリティ側の人です。マジョリティ側の人は、学校や職場などの社会集団において、おそらく設問にあるマイノリティの存在を経験したことがないと思います。なぜなら、同性愛者・両性愛者の人は、自分からそのことをカミングアウトしないのが今の社会では普通だからです。また、色覚異常は確かに不便で、場合によっては重大トラブルに至る可能性もありますが、当人は色覚異常を前提に安全に生活する知恵を身につけているはずです。自分から色覚異常だと集団のメンバーに告知する必然性は薄いはずです。
つまり回答者の大多数は過去に自分の経験した社会集団において、設問にあるようなマイノリティに接したことがないと感じたはずです(実はそれと知らずに接しているのだけれど)。自分の経験上は確率ゼロである。この "経験" が、過小視バイアスの一番の原因でしょう。記事にある「周囲にそうした人はいないという思い込み」です。
人口の 10% 前後は左利きです。今の社会で左利きは「隠すべきこと」ではないし、必然的に左利きは周囲に分かってしまうはずです。不便な面もあるでしょうが、左利き用の商品も多数あるし、逆にスポーツではサウスポーが有利なケースがいろいろあります(右利きだけどスポーツだけサウスポーの人さえいます)。左利きの子が学校のクラスにいたという記憶は、多くの人の脳裏にあるのではないでしょうか。マイノリティを「左利き」として設問すれば違った結果になったかもしれません。
このような「過小視バイアス」があるとして、設問は具体的な確率を答えるものです。計算で答えを出すわけではないので、計算以外の何らかの代替手段が必要です。「正しく認識していた約1割の人」は、上の方に書いた「暗算できそうな範囲で、ざっと見積もった」のかも知れません。
では、過小に答えた人は実際どうしたのでしょうか。記事を読むと、全くのあてずっぽうやランダムでもないようです。過小は過小なりの傾向がある。ということは、確率を認識するときに「人はどのような代替手段に頼っているのか」が問題です。
確率の認識に対する人のバイアスは、事故や災害の確率認識では重大問題になりかねません。また、マイノリティの人たちを支援する政策立案の際などでは、バイアスが暗黙に人の思考を束縛しかねないでしょう。「確率に対する人間の直感は絶望的だ」と諦めるのではなく、「確率を認識するときに、人はどのような代替手段に頼り、それがどういうバイアスを生むのか」という認知心理学の研究は、確かに意義があるものだと思いました。
2024-08-10 10:42
nice!(0)
No.372 - ヒトの進化と "うま味" [科学]
No.360「ヒトの進化と苦味」の続きです。味覚の "基本5味" は、甘味・塩味・酸味・苦味・うま味で、このそれぞれに対応した味覚受容体(= 舌の味蕾細胞の表面にある味覚センサー)が存在します。
味覚受容体のうち、苦味受容体だけは多種類あり、それは霊長類(サルの仲間)の進化と密接な関係があります。つまり小型の霊長類では、マーモセットが20種、リスザルが22種、メガネザルが16種などですが、大型霊長類ではそれよりも種類が多く、ゴリラは25種、チンパンジーは28種、ヒトは26種です。
要点をまとめると、
となるでしょう。これは「霊長類の食性の変化が進化につながり、その裏には味覚の変化がある」という、極めて納得性の高い説明です。
しかし、これだけでは疑問が残ります。苦味受容体が発達したのは「食べてはいけない植物の葉を忌避するため」だったとして、では、そもそも「植物の葉を好んで食べるように嗜好が変化した」のはなぜか、という疑問です。
2024年6月23日の NHK Eテレの「サイエンス ZERO:生命をつなぐ神秘のパワー 味覚」を見ていたら、明治大学の特任講師・戸田安香氏がこの疑問に答えていました。それはうま味受容体の進化です。この内容が興味深かったので、以下に紹介します。
うま味とは
まず、そもそも "うま味" とは何かですが、うま味受容体(細胞表面のうま味センサー)を活性化する物質は、アミノ酸(タンパク質の構成物質)とヌクレオチド(核酸系物質)の2つのカテゴリーがあります。
アミノ酸のうま味物質の代表はグルタミン酸です。和食では昆布のうま味成分がグルタミン酸ですが、昆布以外の海草にも含まれ、また、緑茶、トマトをはじめとする野菜類、魚介類、肉、乳製品、発酵食品などに幅広く含まれます。グルタミン酸以外にも、アスパラギン酸、アラニン、セリンなどのアミノ酸がうま味物質として働きます。
ヌクレオチドとは、糖にリン酸基と塩基が結合している物質の総称です。核酸(DNA, RNA)はヌクレオチドが連鎖している集合体で、1つのヌクレオチドに結合している塩基は DNA の場合、シトシン(C)、グアニン(G)、アデニン(A)、チミン(T)のどれかです。この CGAT の相補的な結合でDNAの2重螺旋構造ができています。生体におけるヌクレオチドは多数あり、例えば「エネルギー通貨」とも言われるアデノシン3リン酸(ATP)もヌクレオチドです。
ヌクレオチドのうま味物質の代表的なものがイノシン酸です。和食の鰹節の "だし" のうま味がイノシン酸ですが、鰹節だけでなく、牛肉、豚肉、魚介類に含まれています。広く "肉類" と言えるでしょう。また、干し椎茸のうま味成分であるグアニル酸もヌクレオチドです。
さらに、グルタミン酸とヌクレオチド(例えばイノシン酸)が同時に作用するとうま味が飛躍的に強く感じられるという、うま味の相乗効果があります。和食の「合わせだし」はこの原理を活用したものです。
霊長類 17種のうま味感覚
ここからが明治大学の戸田安香氏(のグループ)の研究です。霊長類 17種のうま味受容体を調べると、
ことが分かりました。うま味受容体は1種類ですが、霊長類によって微妙に構造が違っていて、受容体が活性化される原理が違うのです。そこで、食物に含まれるうま味物質を調べると、
ことが分かりました。「植物の葉はグルタミン酸を含む」というのは意外な感じもしますが、緑茶(特に玉露)を考えると納得できます。以上をまとめると、霊長類とうま味受容体の進化は次のようになります。
動物の味覚をどうやって調べるのか
「サイエンス ZERO:生命をつなぐ神秘のパワー 味覚」では、17種の霊長類の味覚をどうやって調べたのかの説明がありました。
まず培養細胞を用意します。培養細胞とは、もともとはヒトの細胞ですが、実験室で維持・増殖が可能なように改変してあり、継続的に増殖させて世界で流通しているものです。短時間で増殖する、遺伝子導入がしやすい、などの実験に適した特徴があります。
この培養細胞に霊長類から採取したうま味受容体の遺伝子を "遺伝子導入" します。そうすることで、培養細胞の表面に霊長類のうま味受容体が発現します。また同時に、発光タンパク質の遺伝子を導入すると、細胞内に発光タンパク質が生成されます。この発光タンパク質はカルシウム・イオンに反応して光るタイプのものです。
うま味を感じるメカニズムは、受容体が活性化すると細胞内のカルシウム・イオン濃度が増大し、それが起点となって信号が脳に伝わるというものです。これを実験室で模擬するわけです。
こうして作った培養細胞を多数増殖させ、そこにうま味物質を添加して発光の様子を顕微鏡で記録します。発光が観察されればうま味受容体が活性化している、つまり遺伝子導入した霊長類がその物質にうま味を感じると推定できます。
戸田氏はこの実験系を完成させるために、培養液の種類を変えたり、発光タンパク質のタイプを変更するなど、数々の試行錯誤を行いました。1年半かけて発光が検知できるようになったと、番組で紹介されていました。
素人考えだと、動物の(霊長類の)味覚を調べるには、動物に該当物質を食べさせて反応を観察するしか無いように思いますが、それとは全く違った「バイオテクノロジーを駆使した実験方法」であることが理解できました。
この研究の意義ですが、番組で戸田氏は次のように語っていました。
戸田氏のグループの研究によって「うま味が重要な味覚」であることが一目瞭然になりました。なぜなら、霊長類が大型化しヒトへと進化する過程でうま味が重要な役割を果たしたことが実験で明らかになったからです。
No.108「UMAMIのちから」でも書いたように、1908年、東京帝国大学の池田菊苗博士は、昆布だしの成分がグルタミン酸ナトリウムであることを突き止め、この味を「うま味」と名付けました。そして1909年、世界初のうま味調味料「味の素」が発売された、というのは日本人に広く知られたストーリーです。イノシン酸(1913。小玉新太郎が発見)、グアニル酸(1957。国仲明)も日本人の発見です。
2000年代になってうま味受容体が特定され、第5の味覚であることが科学的に証明されました。しかし、戸田氏によると世界の味覚研究者の間で umami は必ずしもポピュラーになっているわけではない。おそらくumami が日本語だからでしょう。その意味で、うま味をヒトの進化と結びつけた戸田氏(のグループ)の研究は、味覚研究の歴史からして意義深いものです。池田博士から100年以上たってようやくここにたどり着いたと言えるでしょう。
何を食べるかで決まる
今回の研究で、霊長類の "味覚の進化" の一端が解明されました。普通、霊長類の進化というと、頭蓋骨の形とか、顎や歯の形状、脳の容積、運動能力(木登り、直立、歩行など)に関するものがほとんどですが、今回は味覚という "感覚" の進化の研究です。考えてみると、視覚や聴覚、味覚、嗅覚などの感覚は、動物が生き延びて子孫を残す上で超重要なものなのですね。その "感覚" が直接的な研究対象になっていることが有意義だと感じました。
苦味受容体の進化(No.360「ヒトの進化と苦味」)とうま味受容体の進化は、ともに霊長類がタンパク源を植物へと広げ、大型化していった過程と結びついています。その進化の結果としてヒトが出現した。もちろん苦味・うま味だけでなく、甘味(糖)や塩味(ナトリウムイオン)も含めて、動物の食性は味覚と密接にからんでいます。
"You are what you eat" という英語のことわざがあります。少々意訳すると「何を食べるかで、何者であるかが決まる」ということでしょう。これは人についての言葉ですが、動物でも同じはずです。「何を食べるか・何を食べないか」で、体の構造や生理的機能が決まり、食環境に合致するように進化していく。その「食べる・食べない」は味覚に左右されている。そういうことだと理解しました。
ノーベル賞の理由
これ以降は余談です。戸田氏が作った実験系で思い出した話があります。この実験系では「発光タンパク質」が使われていますが、番組によると、当初は「蛍光タンパク質」を使っていたがうまくいかず、発光タンパク質に変えて試行錯誤して実験系を完成させた、とのことでした。
蛍光タンパク質は、ある波長の光(たとえば青色)を当てると、別の波長の光(たとえば赤色)を発するタンパク質です。それに対して発光タンパク質は、細胞からのエネルギーと何らかのトリガー(実験系ではカルシウム・イオン)を受け取って発光するタンパク質です。
2008年のノーベル賞(化学賞)は、緑色蛍光タンパク質を発見したボストン大学名誉教授の下村脩氏ら3人が受賞しました。この緑色蛍光タンパク質の発見以降、数々の蛍光・発光タンパク質が作られるようになりました。これらは細胞内の生命現象を可視化する道具として、生命科学で無くてはならないものになっています。
実は、下村氏のノーベル賞受賞の報道に接したとき、素人としては「そんなにすごいことなのか」と疑問に思ったのを覚えています。しかし今になってよくよく考えてみると、テレビの生命科学・医学番組で放映される「細胞内を可視化した動画」は、その多くに「光るタンパク質」を使っているのですね。我々はそういう動画を見て「光るタンパク質が使われている」などとは考えもしないのだけれど・・・。
戸田氏の実験系の話を知って「ノーベル賞には、それに値する理由がある」ことを、改めて実感しました。
味覚受容体のうち、苦味受容体だけは多種類あり、それは霊長類(サルの仲間)の進化と密接な関係があります。つまり小型の霊長類では、マーモセットが20種、リスザルが22種、メガネザルが16種などですが、大型霊長類ではそれよりも種類が多く、ゴリラは25種、チンパンジーは28種、ヒトは26種です。
|
要点をまとめると、
霊長類は進化の過程で、昆虫に加えて植物の葉をタンパク源とするようになった。 | |
植物の葉は昆虫と違って身近に豊富にあり、簡単に手に入る。これが霊長類の大型化につながった。 | |
しかし、植物は生き残りのために多様な毒素を発達させており、それらの毒を苦味として検知するために苦味受容体の種類が増えた。 |
となるでしょう。これは「霊長類の食性の変化が進化につながり、その裏には味覚の変化がある」という、極めて納得性の高い説明です。
しかし、これだけでは疑問が残ります。苦味受容体が発達したのは「食べてはいけない植物の葉を忌避するため」だったとして、では、そもそも「植物の葉を好んで食べるように嗜好が変化した」のはなぜか、という疑問です。
2024年6月23日の NHK Eテレの「サイエンス ZERO:生命をつなぐ神秘のパワー 味覚」を見ていたら、明治大学の特任講師・戸田安香氏がこの疑問に答えていました。それはうま味受容体の進化です。この内容が興味深かったので、以下に紹介します。
うま味とは
まず、そもそも "うま味" とは何かですが、うま味受容体(細胞表面のうま味センサー)を活性化する物質は、アミノ酸(タンパク質の構成物質)とヌクレオチド(核酸系物質)の2つのカテゴリーがあります。
アミノ酸のうま味物質の代表はグルタミン酸です。和食では昆布のうま味成分がグルタミン酸ですが、昆布以外の海草にも含まれ、また、緑茶、トマトをはじめとする野菜類、魚介類、肉、乳製品、発酵食品などに幅広く含まれます。グルタミン酸以外にも、アスパラギン酸、アラニン、セリンなどのアミノ酸がうま味物質として働きます。
ヌクレオチドとは、糖にリン酸基と塩基が結合している物質の総称です。核酸(DNA, RNA)はヌクレオチドが連鎖している集合体で、1つのヌクレオチドに結合している塩基は DNA の場合、シトシン(C)、グアニン(G)、アデニン(A)、チミン(T)のどれかです。この CGAT の相補的な結合でDNAの2重螺旋構造ができています。生体におけるヌクレオチドは多数あり、例えば「エネルギー通貨」とも言われるアデノシン3リン酸(ATP)もヌクレオチドです。
ヌクレオチドのうま味物質の代表的なものがイノシン酸です。和食の鰹節の "だし" のうま味がイノシン酸ですが、鰹節だけでなく、牛肉、豚肉、魚介類に含まれています。広く "肉類" と言えるでしょう。また、干し椎茸のうま味成分であるグアニル酸もヌクレオチドです。
さらに、グルタミン酸とヌクレオチド(例えばイノシン酸)が同時に作用するとうま味が飛躍的に強く感じられるという、うま味の相乗効果があります。和食の「合わせだし」はこの原理を活用したものです。
霊長類 17種のうま味感覚
ここからが明治大学の戸田安香氏(のグループ)の研究です。霊長類 17種のうま味受容体を調べると、
体重が 1kg 以下の小型の霊長類は昆虫をタンパク源としていて、そのうま味受容体はヌクレオチドで活性化される。 | |
体重が 1kg 以上の中・大型の霊長類は主に植物の葉からタンパク質を摂取しており、そのうま味受容体は主にグルタミン酸でで活性化される。 |
ことが分かりました。うま味受容体は1種類ですが、霊長類によって微妙に構造が違っていて、受容体が活性化される原理が違うのです。そこで、食物に含まれるうま味物質を調べると、
昆虫にはグルタミン酸とヌクレオチドの両方が含まれている。 | |
植物の葉はグルタミン酸を含むが、ヌクレオチドをほとんど含まない。 |
ことが分かりました。「植物の葉はグルタミン酸を含む」というのは意外な感じもしますが、緑茶(特に玉露)を考えると納得できます。以上をまとめると、霊長類とうま味受容体の進化は次のようになります。
霊長類はもともと昆虫食であったが、植物の葉にも食性を広げ、それによって大型化し、類人猿の出現に至った。この裏には、うま味受容体の進化がある。つまり、うま味受容体が "ヌクレオチド・センセー" から "グルタミン酸センサー" へと変化し、これによって植物食が可能になった。
![]() |
小型霊長類のうま味受容体 |
リスザルのうま味受容体の測定結果。横軸はヌクレオチドの濃度(2種測定)で、縦軸は反応の強さ。 |
「サイエンス ZERO」(2024.6.23)より |
![]() |
大型霊長類のうま味受容体 |
チンパンジーのうま味受容体は、ヌクレオチドよりもグルタミン酸に強く反応する。左側の「別のうま味物質への反応」となっているグラフがグルタミン酸の測定結果。 |
「サイエンス ZERO」(2024.6.23)より |
動物の味覚をどうやって調べるのか
「サイエンス ZERO:生命をつなぐ神秘のパワー 味覚」では、17種の霊長類の味覚をどうやって調べたのかの説明がありました。
まず培養細胞を用意します。培養細胞とは、もともとはヒトの細胞ですが、実験室で維持・増殖が可能なように改変してあり、継続的に増殖させて世界で流通しているものです。短時間で増殖する、遺伝子導入がしやすい、などの実験に適した特徴があります。
この培養細胞に霊長類から採取したうま味受容体の遺伝子を "遺伝子導入" します。そうすることで、培養細胞の表面に霊長類のうま味受容体が発現します。また同時に、発光タンパク質の遺伝子を導入すると、細胞内に発光タンパク質が生成されます。この発光タンパク質はカルシウム・イオンに反応して光るタイプのものです。
うま味を感じるメカニズムは、受容体が活性化すると細胞内のカルシウム・イオン濃度が増大し、それが起点となって信号が脳に伝わるというものです。これを実験室で模擬するわけです。
こうして作った培養細胞を多数増殖させ、そこにうま味物質を添加して発光の様子を顕微鏡で記録します。発光が観察されればうま味受容体が活性化している、つまり遺伝子導入した霊長類がその物質にうま味を感じると推定できます。
戸田氏はこの実験系を完成させるために、培養液の種類を変えたり、発光タンパク質のタイプを変更するなど、数々の試行錯誤を行いました。1年半かけて発光が検知できるようになったと、番組で紹介されていました。
素人考えだと、動物の(霊長類の)味覚を調べるには、動物に該当物質を食べさせて反応を観察するしか無いように思いますが、それとは全く違った「バイオテクノロジーを駆使した実験方法」であることが理解できました。
この研究の意義ですが、番組で戸田氏は次のように語っていました。
|
戸田氏のグループの研究によって「うま味が重要な味覚」であることが一目瞭然になりました。なぜなら、霊長類が大型化しヒトへと進化する過程でうま味が重要な役割を果たしたことが実験で明らかになったからです。
No.108「UMAMIのちから」でも書いたように、1908年、東京帝国大学の池田菊苗博士は、昆布だしの成分がグルタミン酸ナトリウムであることを突き止め、この味を「うま味」と名付けました。そして1909年、世界初のうま味調味料「味の素」が発売された、というのは日本人に広く知られたストーリーです。イノシン酸(1913。小玉新太郎が発見)、グアニル酸(1957。国仲明)も日本人の発見です。
2000年代になってうま味受容体が特定され、第5の味覚であることが科学的に証明されました。しかし、戸田氏によると世界の味覚研究者の間で umami は必ずしもポピュラーになっているわけではない。おそらくumami が日本語だからでしょう。その意味で、うま味をヒトの進化と結びつけた戸田氏(のグループ)の研究は、味覚研究の歴史からして意義深いものです。池田博士から100年以上たってようやくここにたどり着いたと言えるでしょう。
何を食べるかで決まる
今回の研究で、霊長類の "味覚の進化" の一端が解明されました。普通、霊長類の進化というと、頭蓋骨の形とか、顎や歯の形状、脳の容積、運動能力(木登り、直立、歩行など)に関するものがほとんどですが、今回は味覚という "感覚" の進化の研究です。考えてみると、視覚や聴覚、味覚、嗅覚などの感覚は、動物が生き延びて子孫を残す上で超重要なものなのですね。その "感覚" が直接的な研究対象になっていることが有意義だと感じました。
苦味受容体の進化(No.360「ヒトの進化と苦味」)とうま味受容体の進化は、ともに霊長類がタンパク源を植物へと広げ、大型化していった過程と結びついています。その進化の結果としてヒトが出現した。もちろん苦味・うま味だけでなく、甘味(糖)や塩味(ナトリウムイオン)も含めて、動物の食性は味覚と密接にからんでいます。
番組の中で、動物の食性と味覚の関係について興味深い話がありました。鳥の祖先は恐竜で(No.210「鳥は "奇妙な恐竜"」)、それも、草食ではなく肉食恐竜です。一般に肉食動物は植物から糖を摂取しないので、甘味受容体が欠如しています(生存に必須のブドウ糖は体内で生成する。No.226「血糖と糖質制限」)。現代でも猫科の動物がそうであり、肉食恐竜の子孫である鳥も甘味受容体が欠如しているのです。
ところが、鳥類の分類上「スズメ亜目」に属する鳥は、うま味受容体で "糖" を検知できることが戸田氏の研究で判明しました。スズメ亜目には、スズメ、メジロ、シジュウカラ、モズ、ウグイス、ヒヨドリ、ヒバリ、ムクドリ、セキレイ、ツバメ、カラスなどの、なじみ深い鳥が含まれます。考えてみると、我々が日常生活でよく見かける野生の鳥はほとんどがスズメ亜目です(それ以外はハト、カモぐらいか)。それもそのはずで、世界に生息する鳥の種の約半数はスズメ亜目であり、鳥類の中では大繁栄しているグループなのです。
この繁栄の理由は、スズメ亜目が肉食(昆虫食)に加えて、花の蜜や穀物を食べるように進化したことが大きく、この裏には「うま味受容体による "糖" の検知」があるというのが戸田氏の見解でした。
ところが、鳥類の分類上「スズメ亜目」に属する鳥は、うま味受容体で "糖" を検知できることが戸田氏の研究で判明しました。スズメ亜目には、スズメ、メジロ、シジュウカラ、モズ、ウグイス、ヒヨドリ、ヒバリ、ムクドリ、セキレイ、ツバメ、カラスなどの、なじみ深い鳥が含まれます。考えてみると、我々が日常生活でよく見かける野生の鳥はほとんどがスズメ亜目です(それ以外はハト、カモぐらいか)。それもそのはずで、世界に生息する鳥の種の約半数はスズメ亜目であり、鳥類の中では大繁栄しているグループなのです。
この繁栄の理由は、スズメ亜目が肉食(昆虫食)に加えて、花の蜜や穀物を食べるように進化したことが大きく、この裏には「うま味受容体による "糖" の検知」があるというのが戸田氏の見解でした。
"You are what you eat" という英語のことわざがあります。少々意訳すると「何を食べるかで、何者であるかが決まる」ということでしょう。これは人についての言葉ですが、動物でも同じはずです。「何を食べるか・何を食べないか」で、体の構造や生理的機能が決まり、食環境に合致するように進化していく。その「食べる・食べない」は味覚に左右されている。そういうことだと理解しました。
ノーベル賞の理由
これ以降は余談です。戸田氏が作った実験系で思い出した話があります。この実験系では「発光タンパク質」が使われていますが、番組によると、当初は「蛍光タンパク質」を使っていたがうまくいかず、発光タンパク質に変えて試行錯誤して実験系を完成させた、とのことでした。
蛍光タンパク質は、ある波長の光(たとえば青色)を当てると、別の波長の光(たとえば赤色)を発するタンパク質です。それに対して発光タンパク質は、細胞からのエネルギーと何らかのトリガー(実験系ではカルシウム・イオン)を受け取って発光するタンパク質です。
2008年のノーベル賞(化学賞)は、緑色蛍光タンパク質を発見したボストン大学名誉教授の下村脩氏ら3人が受賞しました。この緑色蛍光タンパク質の発見以降、数々の蛍光・発光タンパク質が作られるようになりました。これらは細胞内の生命現象を可視化する道具として、生命科学で無くてはならないものになっています。
実は、下村氏のノーベル賞受賞の報道に接したとき、素人としては「そんなにすごいことなのか」と疑問に思ったのを覚えています。しかし今になってよくよく考えてみると、テレビの生命科学・医学番組で放映される「細胞内を可視化した動画」は、その多くに「光るタンパク質」を使っているのですね。我々はそういう動画を見て「光るタンパク質が使われている」などとは考えもしないのだけれど・・・。
戸田氏の実験系の話を知って「ノーベル賞には、それに値する理由がある」ことを、改めて実感しました。
2024-07-13 10:16
nice!(0)
No.370 - 高校数学で理解するガロア理論(7)可解性の判定 [科学]
\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{#1}} \newcommand{\ol}[1]{\overline{#1}} \newcommand{\sb}{\subset} \newcommand{\sp}{\supset} \newcommand{\al}{\alpha} \newcommand{\sg}{\sigma}\newcommand{\cd}{\cdots}\)
No.359「高校数学で理解するガロア理論(6)」の補足をここに書きます。No.359 では \(x^5+11x-44=0\) という5次方程式をとりあげ、それが可解であることと(ガロア群は \(D_{10}\))、実際に数式処理ソフトで求めた解を記載しました。しかし、なぜ可解なのか(=四則演算とべき根で表せるのか)、そもそも可解性をどう判断するのには触れませんでした。そこで今回はその補足して、
を書きます。もちろんこれは、「高校数学で理解するガロア理論」シリーズの一部であり、前に書いた以下の記事の知識を前提とします。
No.354 - 高校数学で理解するガロア理論(1)証明の枠組み
No.355 - 高校数学で理解するガロア理論(2)整数の群・多項式・体
No.356 - 高校数学で理解するガロア理論(3)線形空間・群・ガロア群
No.357 - 高校数学で理解するガロア理論(4)可解性の必要条件
No.358 - 高校数学で理解するガロア理論(5)可解性の十分条件
No.359 - 高校数学で理解するガロア理論(6)可解な5次方程式・定理一覧
5次方程式の可解性とガロア群の判定
No.359 で、可解な5次方程式 \(x^5-2=0\) のガロア群が、位数 \(20\) のフロベニウス群 \(F_{20}\) であることを確認しました。一般に5次方程式のガロア群は、
の5種しかないことが知られています。このうち、
\(F_{20}\)、\(D_{10}\)、\(C_5\)
が可解群です(\(D_{10}\) は \(D_5\) と書く流儀もある)。\(S_5\) と \(A_5\) が可解でないことは「対称群の可解性」(65G)で証明しました。これらの群の、集合としての包括関係は、
です。\(F_{20}\)(下図)は奇置換と偶置換の両方を含むので、\(A_5\) の部分集合ではありあません。
そこで問題になるのは、ある5次方程式があったとき可解かどうか、ないしはガロア群が何かを判定する方法です。この判定のアルゴリズムを以下に書きます。それには「剰余類」と「共役群」の知識が必要なので、まずそれについて書きます。以降の内容は次の2つの文献を参考にしました。
文献1
Alexander D. Healy :
"Resultants, Resolvents and the Computation of Galois Groups"
文献2
D. S. Dummit :
"Solving Solvable Quintics"
剰余類
剰余類については No.356 の「4.一般の群」で書きましたが(41E)、改めて復習します。群 \(G\) の部分群を \(H\) とし、群 \(G\) の全ての元、
\(g_1=e,\:g_2,\:g_3,\:\cd\:,g_n\:\:(n=|G|)\)
を \(H\) に群演算した \(n\) 個の集合、
\(g_1H,\:g_2H,\:\cd\:,\:g_nH\)
を考えます(ここでは左から掛けるとしますが、右からでも同じ議論になります)。これらの任意の2つの集合 \(g_iH\) と \(g_jH\:(i\neq j)\) を比較すると、
のどちらかになります。なぜなら、もし \(g_1H\) と \(g_2H\) に同じ元があるとして、それが \(g_1H\) では \(g_1h_i\)、\(g_2H\) では \(g_2h_j\) と表されているとします。
\(g_1h_i=g_2h_j\)
です。これに左から \(g_2^{-1}\)、右から \(h_i^{-1}\) を掛けると、
\(g_2^{-1}g_1=h_jh_i^{-1}\:\in\:H\)
\(g_2^{-1}g_1\:\in\:H\)
となります。一般に \(h\in H\) と \(hH=H\) は同値なので(41C)、
\(g_2^{-1}g_1H=H\)
が得られますが、これに左から \(g_2\) を掛けると、
\(g_1H=g_2H\)
となります。従って、
になります。このことの対偶は
です。\(g_1H\) と \(g_2H\) の選択は任意なので、2つの剰余類について「全く同じか、全く違う」が成り立ちます。そこで、集合として同じものを一つにまとめてしまいます。その結果として \(d\) 個の集合ができたとして、
\(g_iH\:\:(1\leq i\leq d)\)
を「剰余類」と呼び、\(G/H\) で表します。\(g_i\) の選び方には自由度がありますが、どれかを採用して \(g_i\) を代表元と言います。この結果、
\(G=g_1H\:\cup\:g_2H\:\cup\:\cd\cup\:g_dH\)
\(g_iH\cap g_jH=\phi\:\:(i\neq j)\)
\(|G|=d|H|\)
となり、\(G\) が \(H\) による剰余類で "分割" できたことになります。この分割は、\(g_1=e\) として、\(H\) に含まれない \(G\) の元を \(g_2\) とし、\(g_1H\) と \(g_2H\) に含まれない \(G\) の元を \(g_3\) とし・・・というように \(G\) の元が尽きるまで続ける、と考えても同じです。
\(G=S_5\)、\(H=F_{20}\) の例で考えます。\(F_{20}\) の生成元は、巡回置換で表して、
\((1,\:2,\:3,\:4,\:5),\:(2,\:3,\:5,\:4)\)
とします。\(|S_5|/|F_{20}|=6\) なので、\(S_5\) は 部分群 \(F_{20}\) によって6つの剰余類 \(S_5/F_{20}\) に分割されます。その代表元を \(g_1,\) \(g_2,\) \(g_3,\) \(g_4,\) \(g_5,\) \(g_6\) とします。実際に計算してみると、たとえば代表元として、
\(g_1=e\)
\(g_2=(1,\:2,\:3)\)
\(g_3=(1,\:3,\:2)\)
\(g_4=(1,\:2)\)
\(g_5=(1,\:3)\)
\(g_6=(2,\:3)\)
とすることができます。以降、\(S_5/F_{20}\) を問題にするときには、この代表元を使って計算します。もちろん代表元の選び方には自由度があって、たとえば \(e,\) \((1,\:2),\) \((1,\:3),\) \((1,\:4),\) \((1,\:5),\) \((2,\:5)\) と選ぶこともできます。
さらに計算してみると、6つの剰余類 \(S_5/F_{20}\) には次の性質があることがわかります。つまり、\(\sg\) を、
\(\sg=(1,\:2,\:3,\:4,\:5)\in H\)
の巡回置換とすると、
\(\sg\:g_1H=g_1H\)
\(\sg\:g_2H=g_5H\)
\(\sg\:g_3H=g_4H\)
\(\sg\:g_4H=g_6H\)
\(\sg\:g_5H=g_3H\)
\(\sg\:g_6H=g_2H\)
が成り立ちます。これが成り立つことは、たとえば、
\(\begin{eqnarray}
&&\:\:g_5^{-1}\sg\:g_2&=(1,\:3)(1,\:2,\:3,\:4,\:5)(1,\:2)\\
&&&=(2,\:4,\:5,\:3)\in H\\
&&&\longrightarrow\:g_5^{-1}\sg\:g_2H=H\\
&&&\longrightarrow\:\sg\:g_2H=g_5H\\
\end{eqnarray}\)
と確認できます。同様にして、
\(\begin{eqnarray}
&&\:\:g_4^{-1}\sg\:g_3&=(1,\:2)(1,\:2,\:3,\:4,\:5)(1,\:3,\:2)\\
&&&=(1,\:4,\:5,\:2)\in H\\
&&&\longrightarrow\:\sg\:g_3H=g_4H\\
\end{eqnarray}\)
\(\begin{eqnarray}
&&\:\:g_6^{-1}\sg\:g_4&=(2,\:3)(1,\:2,\:3,\:4,\:5)(1,\:2)\\
&&&=(1,\:2,\:3,\:4,\:5)\in H\\
&&&\longrightarrow\:\sg\:g_4H=g_6H\\
\end{eqnarray}\)
\(\begin{eqnarray}
&&\:\:g_3^{-1}\sg\:g_5&=(1,\:3,\:2)^{-1}(1,\:2,\:3,\:4,\:5)(1,\:3)\\
&&&=(1,\:2,\:3)(1,\:2,\:3,\:4,\:5)(1,\:3)\\
&&&=(1,\:4,\:5,\:2)\in H\\
&&&\longrightarrow\:\sg\:g_5H=g_3H\\
\end{eqnarray}\)
\(\begin{eqnarray}
&&\:\:g_2^{-1}\sg\:g_6&=(1,\:2,\:3)^{-1}(1,\:2,\:3,\:4,\:5)(2,\:3)\\
&&&=(1,\:3,\:2)(1,\:2,\:3,\:4,\:5)(2,\:3)\\
&&&=(2,\:4,\:5,\:3)\in H\\
&&&\longrightarrow\:\sg\:g_6H=g_2H\\
\end{eqnarray}\)
であり、上の式が成り立つことが確認できます。つまり、\(g_1H\:(=H)\) だけは \(\sg\) を作用させても不変ですが、その他の剰余類に \(\sg\) を作用させると、順に、
\(g_2H\:\overset{\large\sg}{\rightarrow}\:g_5H\:\overset{\large\sg}{\rightarrow}\:g_3H\:\overset{\large\sg}{\rightarrow}\:g_4H\:\overset{\large\sg}{\rightarrow}\:g_6H\:\overset{\large\sg}{\rightarrow}\:g_2H\:\rightarrow\:\cd\)
と "巡回" します。このことは、後で可解性の条件定理で使います。
共役群
群 \(G\) の部分群を \(H\) とします。群 \(G\) の任意の元 を \(x\) とするとき、
\(xHx^{-1}\) \((x\in G)\)
を「\(H\) と共役な群」と言います(\(x^{-1}Hx\) と定義してもよい)。これが群になることは、\(h_1,\:h_2,\:h_3\:\in\:H\)、\(h_1h_2=h_3\) のとき、
\(\begin{eqnarray}
&&\:\:(xh_1x^{-1})(xh_2x^{-1})&=xh_1h_2x^{-1}\\
&&&=xh_3x_{-1}\:\in\:xHx^{-1}\\
\end{eqnarray}\)
というように、\(xHx^{-1}\) が群演算で閉じていることから分かります。
\(H\) と共役な群 \(xHx^{-1}\) は \(x\) の個数=群の位数だけあることになりますが、これら全てが違う群ではありません。もし \(H\) が \(G\) の正規部分群であれば、\(G\) の任意の元 \(x\) について \(xHx^{-1}=H\) が成り立つので、\(H\) と共役な部分群は \(H\) 自身だけです。
また、\(x,\:y\:\in\:G\) が同じ剰余類 \(G/H\) に属しているとすると、その剰余類の代表元を \(g_1\) として、
\(x=g_1h_i\)
\(y=g_1h_j\)
と表現できますが、
\(\begin{eqnarray}
&&\:\:xHx^{-1}&=g_1h_iHh_i^{-1}g_1^{-1}\\
&&&=g_1Hg_1^{-1}\\
&&\:\:yHy^{-1}&=g_1h_jHh_j^{-1}g_1^{-1}\\
&&&=g_1Hg_1^{-1}\\
&&\:\:xHx^{-1}&=yHy^{-1}\\
\end{eqnarray}\)
となって、\(x,\:y\) による \(H\) の共役群は同じものです。従って、\(H\) の共役群の数は最大で \(G\) の \(H\) による剰余類の数\(=|G|/|H|\) です。
フロベニウス群 \(F_{20}\) は \(S_5\) の正規部分群ではありません。計算してみると、剰余類 \(G/H\) の代表元 \(g_i\:(1\leq i\leq6)\)に対して、次の6つの共役な部分群があることが分かります。\(H=\langle\:(1,2,3,4,5),\:(2,3,5,4)\:\rangle\) とすると、\(H_i=g_iHg_i^{-1}\) はそれぞれ、
\(g_1=e\)
\(H_1=\langle\:(1,2,3,4,5),\:(2,3,5,4)\:\rangle=H\)
\(g_2=(1,\:2,\:3)\)
\(H_2=\langle\:(1,2,4,3,5),\:(2,4,5,3)\:\rangle\)
\(g_3=(1,\:3,\:2)\)
\(H_3=\langle\:(1,2,4,5,3),\:(2,4,3,5)\:\rangle\)
\(g_4=(1,\:2)\)
\(H_4=\langle\:(1,2,5,4,3),\:(2,5,3,4)\:\rangle\)
\(g_5=(1,\:3)\)
\(H_5=\langle\:(1,2,3,5,4),\:(2,3,4,5)\:\rangle\)
\(g_6=(2,\:3)\)
\(H_6=\langle\:(1,2,5,3,4),\:(2,5,4,3)\:\rangle\)
です。また \(S_5\) の任意の元を \(g\) とすると、\(H\) の \(g\) による共役群 \(gHg^{-1}\) は、\(g\) が属する剰余類の代表元 \(g_i\) を用いて、
\(gHg^{-1}=g_iHg_i^{-1}\) \((g,\:g_i\in H_i)\)
と表せることになります。
ある5次方程式のガロア群がフロベニウス群である、という場合、共役な6つの群のどれかであることを言っています。総称してフロベニウス群、とも言えます。
固定化群とリゾルベント
固定化群
以下は5次方程式を念頭に記述しますが、一般の \(n\)次方程式としても同じです。
\(S_5\) の部分群を \(G\) とします(\(G\subset S_5\))。\(G\) は \(S_5\) そのものであってもかまいません。次に、5変数、\(X_1,\:X_2,\:X_3,\:X_4,\:X_5\) の任意の多項式、
\(F(X_1,\:X_2,\:X_3,\:X_4,\:X_5)\)
を考えます。そして「\(S_5\) の任意の元 \(\sg\) による \(F\) への作用」を考えます。\(F\) は \(\sg\) の作用によって変数の入れ替えが起こります。たとえば、
\(\begin{eqnarray}
&&\:\:F&=X_1^2X_2+X_2^2X_3\\
&&\:\:\sg&=(1,\:2)\\
\end{eqnarray}\)
だと、
\(\sg F=X_2^2X_1+X_1^2X_3\)
です。この、多項式とそれへの作用を用いて固定化群(ないしは安定化群)の定義をします。
固定化群 \(H\) は、多項式 \(F\) と群 \(G\) に依存しているので \(H_{(F,G)}\) としました。いくつかの例をあげます。\(G=D_6\)(3次の2面体群。\(=S_3\))とすると、
などです。
リゾルベント(Resolvent)
以降、一般の既約な5次多項式を、
で表します。根と係数の関係から、 \(a\) ~ \(e\) は \(x_i\) の基本対称式で表現できます。その具体的な形は No.357「高校数学で理解するガロア理論(4)」の「6.5 5次方程式に解の公式はない」の定理(65H)にあげました。
次にリゾルベントを定義します。定義に使うのは、
です。
\(g_i\cdot F(x_1,x_2,x_3,x_4,x_5)\) という表記は、
の意味です。\(g\in G\) とすると、
\(g\cdot F(X_1,X_2,X_3,X_4,X_5)=\)
\(F(X_{g(1)},X_{g(2)},X_{g(3)},X_{g(4)},X_{g(5)})\)
\(g\cdot F(x_1,x_2,x_3,x_4,x_5)=\)
\(F(x_{g(1)},x_{g(2)},x_{g(3)},x_{g(4)},x_{g(5)})\)
の意味です。\(g=(1,2,3)\) とすると、\(g(1)=2\)、\(g(2)=3\)、\(g(3)=1\)、\(g(4)=4\)、\(g(5)=5\) です。また以降で、関数 \(F(X_1,X_2,X_3,X_4,X_5)\) と 値 \(F(x_1,x_2,x_3,x_4,x_5)\) を \(F\) と簡略表記します。どちらを指すかは文脈によります。
このように、剰余類 \(G/H\) の代表元 \(g_i\) を \(F(x_1,x_2,x_3,x_4,x_5)\) に作用させることの意味を考えてみます。いま \(G\) の任意の元を \(g_\al,\:g_\beta\)とし、同じ剰余類 \(g_iH\) に属するとします。そうすると、\(H\) の適当な元 \(h_s,\:h_t\) を用いて、
\(g_\al=g_ih_s\)
\(g_\beta=g_ih_t\)
と表現できます。すると、
\(g_\al\cdot F=g_ih_s\cdot F=g_i\cdot F\)
\(g_\beta\cdot F=g_ih_t\cdot F=g_i\cdot F\)
となるので(\(H\) の元 \(h_s,\:h_t\) を \(F\) に作用させても不変)、
\(g_\al\cdot F=g_\beta\cdot F\)
となり、\(g_\al\cdot F\) と \(g_\beta\cdot F\) は同じ多項式です。ということは、\(G\) の元を \(F\) に作用させた多項式は最大、
\(g_1\cdot F,\:\:g_2\cdot F,\:\cd\cd\:,\:\:g_d\cdot F\)
の \(d\) 種類(=剰余類の数)あることになります(\(g_1,\:g_2,\:\cd\:g_d\) は \(G/H\) の代表元)。逆に、\(1\leq i,\:j\leq d\)(但し、\(i=j=1\) ではない) とし、
\(g_i\cdot F=g_j\cdot F\)
になるとすると、
\(g_j^{-1}g_i\cdot F=F\)
\(g_j^{-1}g_i\in H\)
\(g_j^{-1}g_iH=H\)
\(g_iH=g_jH\)
\(g_i=g_j\)
となります。この対偶は「\(g_i\neq g_j\) なら \(g_iF\neq g_jF\)」であり、\(G\) の元を \(F\) に作用させた多項式は、
\(g_1\cdot F,\:\:g_2\cdot F,\:\cd\cd\:,\:g_d\cdot F\)
の \(d\) 種類です。これらを「(\(\bs{G}\) における)\(\bs{F}\) と共役な多項式」と呼ぶことにします。
そもそも \(G/H\) の代表元は、\(g_iH\:(1\leq i\leq|G|)\) の集合から同じもを集めて、それらの代表として \(g_1H,\:g_2H,\:\cd\:g_dH\) としたものであり、
\(G=g_1H\:\cup\:g_2H\:\cup\:\cd\:\cup\:g_dH\)
が成り立つのでした。従って、\(G\) の任意の元を \(g\) とすると、\(gG=G\) なので、\(gg_iH\:(1\leq i\leq|G|)\) の集合から同じもを集めると、それらの代表として \(gg_1H,\:gg_2H,\:\cd\:,\:gg_dH\) とすることができ、
\(G=gg_1H\:\cup\:gg_2H\:\cup\:\cd\:\cup\:gg_dH\)
も成り立ちます。つまり、\(G/H\) の代表元を \(g_1,\:g_2,\:\cd\:,\:g_d\) とすると、\(gg_1,\:gg_2,\:\cd\:,\:gg_d\) も \(G/H\) の代表元です。従って、多項式 \(F\) へ作用させた、
\(gg_1\cdot F,\:gg_2\cdot F,\:\cd\:,\:gg_d\cdot F\)
の \(d\) 個の多項式も「\(F\) と共役な多項式」です。つまり、これら \(\bs{d}\) 個の多項式の集合を考えると、
\(\{g_1\cdot F,\:g_2\cdot F,\:\cd\:,\:g_d\cdot F\}=\)
\(\{gg_1\cdot F,\:gg_2\cdot F,\:\cd\:,\:gg_d\cdot F\}\)
であり、集合としては同じもの( \(\bs{\br{①}}\) )です。ここでリゾルベントの定義式を振り返ると、
\(R(x)=\displaystyle\prod_{i=1}^{d}(x-g_i\cdot F(x_1,x_2,x_3,x_4,x_5))\)
であり、\(g_1\cdot F,\:g_2\cdot F,\:\cd\:,\:g_d\cdot F\) の対称式になっています。つまり \(\bs{R(x)}\) は任意の2つの \(\bs{g_i\cdot F,\:g_j\cdot F}\) の入れ替えで不変( \(\bs{\br{②}}\) )です。結局、\(\bs{\br{①}}\) と \(\bs{\br{②}}\) を合わせると、
\(g\cdot R(x)=R(x)\)
が分かります。つまり \(\bs{R(x)}\) は \(\bs{G}\) の任意の元の作用で不変です。\(G\) は \(S_5\) かその部分群で、\(f(x)=0\) の5つの根 \(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) を置換するものでした。この置換で不変ということは、 \(R(x)\) の係数は \(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) の基本対称式で表現できます。従って \(R(x)\) の係数は \(f(x)\) の係数で表現できる有理数です。
\(F\) の \(G\) における固定化群は \(H\) でした。では、\(g\cdot F\:(g\in G)\) の固定化群は何かを調べてみると、\(H\) の任意の元を \(h\) として、
\(ghg^{-1}g\cdot F=gh\cdot F=g\cdot F\)
なので、\(ghg^{-1}\) は \(g\cdot F\) を固定します。 \(h\) は任意なので、
\(g\cdot F\) の固定化群は \(gHg^{-1}\) であり、\(H\) とは共役な群
であることがわかります。以上を踏まえて次の定理を証明します。この定理は文献1によります。
ガロア群とリゾルベントの関係
[主張1の証明]
\(\mr{Gal}(\bs{L}/\bs{Q})\) が \(H\) の部分群 \(N\:(N\subset H)\) と共役とすると、\(\sg\in G\) である \(\sg\) が存在し、\(\mr{Gal}(\bs{L}/\bs{Q})=\sg N\sg^{-1}\) と表せる。従って \(\tau\in\mr{Gal}(\bs{L}/\bs{Q})\) である任意の \(\tau\) をとると、\(\tau=\sg\:\mu\:\sg^{-1}\:(\mu\in N)\) と表せる。また、\(\sg\) が含まれる剰余類 \(G/H\) を \(g_iH\) とすると、\(\sg\) は適当な \(H\) の元 \(\eta\) を用いて \(\sg=g_i\:\eta\) と表せる。
ここでリゾルベントの定義式のうちの、
\(g_i\cdot F(x_1,x_2,x_3,x_4,x_5)\)
に着目すると(以下、\(F(x_1,x_2,x_3,x_4,x_5)\) を \(F\) と書く)、
\(\begin{eqnarray}
&&\:\:\tau(g_i\cdot F)&=\sg\:\mu\:\sg^{-1}(g_i\cdot F)\\
&&&=g_i\:\eta\:\mu\:\eta^{-1}g_i^{-1}g_i\cdot F\\
&&&=g_i\:\eta\:\mu\:\eta^{-1}\cdot F\\
\end{eqnarray}\)
となるが、\(\eta\)、\(\mu\)、\(\eta^{-1}\) はいずれも \(H\) の元なので、\(F\) に作用すると \(F\) を固定する。従って、
\(\tau(g_i\cdot F)=g_i\cdot F\)
であり、\(g_i\cdot F\) は \(\tau\) の作用で不変である。\(\tau\) は \(\mr{Gal}(\bs{L}/\bs{Q})\) の任意の元であり、ガロア群の任意の元で不変な \(g_i\cdot F\) は有理数である。\(g_i\cdot F\) はリゾルベント方程式の根の一つだから、方程式は有理数の根を持つ。[証明終]
[主張2の証明]
\(g_i\cdot F(x_1,x_2,x_3,x_4,x_5)\) がリゾルベント方程式の重複度1の有理数の根であったとする。\(\mr{Gal}(\bs{L}/\bs{Q})\) の任意の元 \(\tau\) は 有理数を固定する。\(g_i\cdot F\) は重複度1の根なので、\(g_i\cdot F\) 以外に有理数の根 \(g_j\cdot F\) があったとしても、\(g_i\cdot F\neq g_j\cdot F\:\:(i\neq j)\) である。従って、
\(\begin{eqnarray}
&&\:\:\tau\:g_i\cdot F=&g_i\cdot F\\
&&\:\:\tau\:g_i\cdot F\neq&g_j\cdot F\:\:(i\neq j)\\
\end{eqnarray}\)
が成り立つ。これは、\(\mr{Gal}(\bs{L}/\bs{Q})\) の任意の元 \(\tau\) が \(g_i\cdot F\) の固定化群に含まれることを意味する。\(F\) の固定化群 \(H\) の 任意の元を \(h\) とすると、\(h\cdot F=F\) であるが、
\(\begin{eqnarray}
&&\:\:g_ihg_i^{-1}g_i\cdot F&=g_ih\cdot F\\
&&&=g_i\cdot F\\
\end{eqnarray}\)
なので \(g_ihg_i^{-1}\) は \(g_i\cdot F\) を固定する。\(h\) は \(H\) の任意の元だから、\(g_i\cdot F\) の固定化群は \(H\) と共役な \(g_iHg_i^{-1}\) である。つまり、\(\mr{Gal}(\bs{L}/\bs{Q})\) の任意の元 \(\tau\) が \(\tau\in g_iHg_i^{-1}\) なので、\(\mr{Gal}(\bs{L}/\bs{Q})\) は \(H\) と共役な群の部分群である。[証明終]
リゾルベント \(R(x)\) を計算するためには、定義どおりにすると \(f(x)=0\) の根、\(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) が必要です。しかし \(G=S_5\) の場合は、任意の \(g\in S_5\) について
\(g\cdot R(x)=R(x)\)
です。ということは、\(R(x)\) の係数は \(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) の基本対称式で表されることになり、つまり方程式 \(\bs{f(x)=0}\) の係数だけから \(\bs{R(x)}\) の計算が可能です。
主張1の対偶は、
であり、これを方程式のガロア群の判断に使えます。たとえば、\(G=S_5,\:H=F_{20}\) の場合、\(R(x)=0\) が有理数の根をもたなければ、ガロア群は \(S_5\) か \(A_5\) です。
主張2の証明の流れをみると「\(\mr{Gal}(\bs{L}/\bs{Q})\) は \(H\) と共役な群の部分群である」ではなく、「\(\mr{Gal}(\bs{L}/\bs{Q})\) は \(H\) の部分群である」というようにできることが分かります。つまり、方程式 \(f(x)=0\) の根を \(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) と求め、\(g_i\cdot F(x_1,x_2,x_3,x_4,x_5)\) が有理数だと分かったとき、根を入れ替えて、
\(x_i=x_{g_i(i)}\)
とし、変換後の \(x_i\) で \(R(x)\) を計算すれば、\(g_1\cdot F(x_1,x_2,x_3,x_4,x_5)\) が有理数になり、\(g_1=e\) なので \(\mr{Gal}(\bs{L}/\bs{Q})=H\) となります。つまり、根の入れ替えによってガロア群を "互いに共役な複数の群の中のどれかに一つに固定" できる。これは、\(G=F_{20}\)、\(H=C_5\) の場合に、\(G\) を \(F_{20}\) の6つの共役群のなかの \(\langle\:(1,2,3,4,5),\:(2,3,5,4)\:\rangle\) に固定したいときに使います(後述)。
\(x^5+11x-44=0\)
以下、\(x^5+11x-44=0\) を例に、「ガロア群とリゾルベントの関係性定理」を使って可解性とガロア群を判定します。
固定化群:\(F_{20}\)
可解性の判定のためには、ガロア群が \(F_{20}\) の部分群かどうかを判定すればよいわけです。そこでまず \(G=S_5\) とし、多項式 \(F(X_1,X_2,X_3,X_4,X_5)\) を、
\(F(X_1,X_2,X_3,X_4,X_5)\)
\(\begin{eqnarray}
&&\:\: =&X_1^2(X_2X_5+X_3X_4)+X_2^2(X_1X_3+X_4X_5)+\\
&&&X_3^2(X_1X_5+X_2X_4)+X_4^2(X_1X_2+X_3X_5)+\\
&&&X_5^2(X_1X_4+X_2X_3)\\
\end{eqnarray}\)
と定義します。そうするとこの多項式の固定化群 \(H\) は、
\(H=\langle\:(1,2,3,4,5),\:(2,3,5,4)\:\rangle\)
のフロベニウス群 \(F_{20}\) になります。そのことを確認してみると、
\((1,2,3,4,5)\cdot F\)
\(\begin{eqnarray}
&&\:\: =&X_2^2(X_3X_1+X_4X_5)+X_3^2(X_2X_4+X_5X_1)+\\
&&&X_4^2(X_2X_1+X_3X_5)+X_5^2(X_2X_3+X_4X_1)+\\
&&&X_1^2(X_2X_5+X_3X_4)\\
&&\:\: =&F\\
\end{eqnarray}\)
\((2,3,5,4)\cdot F\)
\(\begin{eqnarray}
&&\:\: =&X_1^2(X_3X_4+X_5X_2)+X_3^2(X_1X_5+X_2X_4)+\\
&&&X_5^2(X_1X_4+X_3X_2)+X_2^2(X_1X_3+X_5X_4)+\\
&&&X_4^2(X_1X_2+X_3X_5)\\
&&\:\: =&F\\
\end{eqnarray}\)
となって、確かに \(F\) の固定化群が \(H\) だと分かります。ここで \(H\) は6つある共役群のうちの特定の1つであることに注意します。剰余類 \(G/H\) の代表元を、
\(e,\:(1,2,3),\:(1,3,2),\:(1,2),\:(1,3),\:(2,3)\)
として、
\(F_1=F\)
\(F_2=(1,2,3)\cdot F\)
\(F_3=(1,3,2)\cdot F\)
\(F_4=(1,2)\cdot F\)
\(F_5=(1,3)\cdot F\)
\(F_6=(2,3)\cdot F\)
とします。方程式 \(f(x)=0\) の5つの解を \(x_1,x_2,x_3,x_4,x_5\) とし、\(X_i\) に \(x_i\) を代入したものを改めて \(F_i\) として(\(1\leq i\leq6\))、
\(R_{S5/F20}(x)=(x-F_1)(x-F_2)(x-F_3)(x-F_4)(x-F_5)(x-F_6)\)
でリゾルベントを定義します。この \(R(x)\) を \(x_1,x_2,x_3,x_4,x_5\) の基本対称式で表し、基本対称式に方程式の係数を割り当てれば、\(R(x)\) の具体的な形が求まります。ちなみに代表元のとり方には自由度があるので、上で書いたように、たとえば \((1,2)\) \((1,3)\) \((1,4)\) \((1,5)\) \((2,5)\) などとしても、同じ \(R(x)\) になります。
まず、方程式を \(x^5+px+q=0\) として \(R(x)\) を求めてみます。この計算は、さすがに手計算では厳しいので、Python の SymPy モジュールで計算することにします。コードの例は後述します。この結果、
\(\begin{eqnarray}
&&R_{S5/F20}(x)=&x^6+8px^5+40p^2x^4+160p^3x^3+400p^4x^2+\\
&&&(512p^5-3125q^4)x+256p^6-9375pq^4\\
\end{eqnarray}\)
となります。これに \(x^5+11x-44\) の係数を入れると、
\(\begin{eqnarray}
&&R_{S5/F20}(x)&=&x^6+88x^5+4840x^4+212960x^3+5856400x^2\\
&&&&-11630341888x-386068880384\\
&&&=&(x-88)(x^5+176x^4+20328x^3+2001824x^2\\
&&&&+182016912x+4387146368)\\
\end{eqnarray}\)
です。この結果、リゾルベント方程式が \(x=88\) の根をもつので、\(x^5+11x-44=0\) の方程式は可解であると判断できます。ガロア群は \(F_{20},\:D_{10},\:C_5\) のどれかです。もし仮に \(R_{S5/F20}(x)=0\) が有理数の根をもたなければ、ガロア群は \(S_5\) か \(A_5\) です。
実は、リゾルベント方程式、\(R_{S5/F20}(x)=0\) が有理数根を持てば、その有理数根は重複度1の根(単根)であり、他に有理数根はないことが言えます。その理由ですが、いま、\(F_1\) が有理数だとします。もし \(F_1\) が有理数でなければ、根 \(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) の順序を入れ替えて \(F_1\) を有理数にできるので、こう仮定して一般性を失いません。そして、
\(r(x)=(x-F_2)(x-F_3)(x-F_4)(x-F_5)(x-F_6)=0\)
の5次方程式を考えます。この \(r(x)\) の最小分解体を \(\bs{L}_{r(x)}\) とし、ガロア群を \(\mr{Gal}(\bs{L}_{r(x)}/\bs{Q})\) とします。
ここで一般論です。既約多項式のガロア群は根の集合に対して根を置換するように作用しますが、この作用は推移的(transitive)です。推移的とは、群(たとえばガロア群 \(G\))が集合(たとえば方程式の根の集合 \(X\))に対して作用(たとえば、根 \(x_1,\) \(x_2,\) \(x_3,\) \(x_4,\) \(x_5\) の置換)するとき、\(X\) の任意の2つの元 \(x_i,\:x_j\) について、
\(\sg(x_i)=x_j\) \((\sg\in G)\)
となる \(\sg\) が必ず存在することを意味します。既約多項式のガロア群は、その定義から推移的です。この逆で、ガロア群が推移的であれば方程式は既約であることも成り立ちます。
\(r(x)=0\) の根は、\(F_2,\:F_3,\:F_4,\:F_5,\:F_6\) であり、
\(F_1=F\)
\(F_2=(1,2,3)\cdot F\)
\(F_3=(1,3,2)\cdot F\)
\(F_4=(1,2)\cdot F\)
\(F_5=(1,3)\cdot F\)
\(F_6=(2,3)\cdot F\)
ですが、剰余類の説明のところに書いたように、\(\sg\) を \((1,\:2,\:3,\:4,\:5)\) の巡回置換とすると、
となり、\(\bs{\sg}\) は、\(\bs{F_2,\:F_3,\:F_4,\:F_5,\:F_6}\) という \(\bs{r(x)=0}\) の5つの根の置換するように作用します。かつ \(\sg\) を順々に作用させると根は 、
\(F_2\:\overset{\large\sg}{\rightarrow}\:F_5\:\overset{\large\sg}{\rightarrow}\:F_3\:\overset{\large\sg}{\rightarrow}\:F_4\:\overset{\large\sg}{\rightarrow}\:F_6\:\overset{\large\sg}{\rightarrow}\:F_2\:\rightarrow\:\cd\)
と巡回します。これは、
\(\begin{eqnarray}
&&\:\:C_5&=\langle\:(1,2,3,4,5)\:\rangle\\
&&&=\{\:\sg,\:\sg^2,\:\sg^3,\:\sg^4,\:\sg^5=e\:\}\\
\end{eqnarray}\)
が \(\mr{Gal}(\bs{L}_{r(x)}\:/\bs{Q})\) の部分群であり、\(\bs{\mr{Gal}(\bs{L}_{r(x)}\:/\bs{Q})}\) の \(\bs{r(x)=0}\) の根に対する作用は推移的であることを意味します。従って \(\bs{r(x)}\) は既約多項式です。これから言えるのは、
ということです。従って、5次方程式の可解性判断は次のように結論づけられます。
固定化群:\(A_5\)
ガロア群が \(F_{20},\:D_{10},\:C_5\) のどれかを調べるには、固定化群が5次交代群 \(\bs{A_5}\) となる多項式を利用します。
\(F(X_1,X_2,X_3,X_4,X_5)=\)
\(\begin{eqnarray}
&&\:\: &(X_1-X_2)(X_1-X_3)(X_1-X_4)(X_1-X_5)\\
&&&(X_2-X_3)(X_2-X_4)(X_2-X_5)\\
&&&(X_3-X_4)(X_3-X_5)(X_4-X_5)\\
\end{eqnarray}\)
とおきます。\(F\) は 任意の互換の作用で \(-F\) になるので、任意の偶数個の互換を作用させても不変です。つまり \(F\) の固定化群は \(A_5\) です。剰余類 \(S_5/A_5\) の代表元としては、互換のどれかを選ぶことができます。従って、
\(F_1=F\)
\(F_2=(1,2)\cdot F=-F\)
とすることができて、これに方程式の5つの解 \(x_1,x_2,x_3,x_4,x_5\) を代入して、
\(\begin{eqnarray}
&&\:\:R_{S5/A5}(x)&=(x-F_1)(x-F_2)\\
&&&=x^2-F^2\\
\end{eqnarray}\)
でリゾルベントを定義します。リゾルベント方程式 \(R_{S5/A5}(x)=0\) は、相異なる2つの有理数根(\(F\) と \(-F\))をもつか、ないしは有理数根をもたないかのどちらかです。この \(R(x)\) を \(x_1,x_2,x_3,x_4,x_5\) の基本対称式で表し、基本対称式に方程式の係数を割り当てれば、\(R(x)\) の具体的な形が求まります。ちなみに、\(F\) は差積(数学記号では \(\Delta\))、\(F^2\) は判別式(数学記号では \(D\))と呼ばれています。
方程式を \(x^5+px+q\) として \(R(x)\) を求めてみると、
\(R_{S5/A5}(x)=x^2-(256p^5+3125q^4)\)
となります。これに \(x^5+11x-44\) の係数を入れると、
\(\begin{eqnarray}
&&R_{S5/A5}(x)&=x^2-11754029056\\
&&&=(x-108416)(x+108416)\\
\end{eqnarray}\)
となり、リゾルベント方程式が有理数の根をもつので、ガロア群は \(A_5\) の部分群であり、\(D_{10},\:C_5\) のどちらかです。もし仮に有理数の根をもたなければ、ガロア群は \(F_{20}\) です。
固定化群:\(C_5\)
さらに、\(G=F_{20},\:H=C_5\) とすることで、\(x^5+11x-44=0\) のガロア群が \(D_{10}\) か \(C_5\) かを調べます。この場合、\(G\) の生成元を \((1,2,3,4,5),\:(2,3,5,4)\) 、\(H\) の生成元を \((1,2,3,4,5)\) と固定して計算します。そのためにまず、方程式 \(x^5+11x-44=0\) を数値計算で解き、根を求めます。根が \(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) と求まったとします。
フロベニウス群 \(\langle\:(1,2,3,4,5),(2,3,5,4)\:\rangle\) を固定化群とする多項式 \(F_1\) に \(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) を代入したもの、およびそれと共役な多項式(\(F_2\)~\(F_6\))は、
\(\begin{eqnarray}
&&\:\:F_1=&x_1^2(x_2x_5+x_3x_4)+x_2^2(x_1x_3+x_4x_5)+\\
&&&x_3^2(x_1x_5+x_2x_4)+x_4^2(x_1x_2+x_3x_5)+\\
&&&x_5^2(x_1x_4+x_2x_3)\\
\end{eqnarray}\)
\(F_2=(1,2,3)\cdot F_1\)
\(F_3=(1,3,2)\cdot F_1\)
\(F_4=(1,2)\cdot F_1\)
\(F_5=(1,3)\cdot F_1\)
\(F_6=(2,3)\cdot F_1\)
でした。このうちの1つが有理数です。たとえば、\(F_3=(1,3,2)\cdot F_1\) が有理数だとすると、\(g=(1,3,2)\) として、
\(x_{g(1)},\:x_{g(2)},\:x_{g(3)},\:x_{g(4)},\:x_{g(5)}\)
を改めて \(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) と定義し直せば、\(F_1\) が有理数になります。この準備をした上で、固定化群が \(H=\langle\:(1,2,3,4,5)\:\rangle\) になる多項式 \(F_{C1}\) を考えると、
\(F_{C1}=X_1X_2^2+X_2X_3^2+X_3X_4^2+X_4X_5^2+X_5X_1^2\)
がそれに相当します。冒頭に掲げたフロベニウス群の図を参考にして剰余類 \(G/H\) の代表元を選ぶと、\(F_{C1}\) に共役な多項式は、
\(\begin{eqnarray}
&&\:\:F_{C2}&=(2,3,5,4)&\cdot F_{C1}\\
&&\:\:F_{C3}&=(2,3,5,4)^2&\cdot F_{C1}\\
&&&=(2,5)(3,4)&\cdot F_{C1}\\
&&\:\:F_{C4}&=(2,3,5,4)^3&\cdot F_{C1}\\
&&&=(2,4,5,3)&\cdot F_{C1}\\
\end{eqnarray}\)
です。従ってリゾルベントは、
\(R_{F20/C5}(x)=(x-F_{C1})(x-F_{C2})(x-F_{C3})(x-F_{C4})\)
で求まります。実際に \(x^5+11x-44=0\) のリゾルベントを求めると、
\(\begin{eqnarray}
&&\:\:R_{F20/C5}(x)&=x^4+968x^2+15972x+395307\\
&&&=(x^2-22x+1089)(x^2+22x+363)\\
\end{eqnarray}\)
です。因数分解の結果の2つの2次式はいずれも既約なので、リゾルベント方程式には有理数の根がありません。従って \(x^5+11x-44=0\) のガロア群は \(C_5\) ではなく \(D_{10}\) です。
もし仮に、\(R_{F20/C5}(x)=0\) のリゾルベント方程式が重複度1の有理数根をもてば、「ガロア群とリゾルベントの関係性定理」に従って、ガロア群は \(H\) の共役群の部分群ということになります。
ただし、No.359「高校数学で理解するガロア理論(6)」で書いたように、\(H=\langle\:(1,2,3,4,5)\:\rangle\)(\(=C_5\)) は \(G=\langle\:(1,2,3,4,5),\:(2,3,5,4)\:\rangle\)(\(=F_{20}\))の正規部分群です。従って、\(G\) における \(H\) と共役な群は \(H\) だけです。また、\(H\) に部分群はありません。つまり、ガロア群は \(H=\langle\:(1,2,3,4,5)\:\rangle\) です。
さらに、その \(H\) は \(F_{C1}\) と共役な \(F_{C2},\:F_{C3},\:F_{C4}\) の固定化群でもある。ということは、ガロア群で固定される \(F_{C2},\:F_{C3},\:F_{C4}\) は全て有理数です。これは、ガロア群が \(C_5\) になる方程式の例(後述)で確認できます。
実は、\(x^5+px+q=0\) の形の方程式のガロア群が \(C_5\)(=位数 \(5\) の巡回群)になることはありません。これはガロア理論から分かります。つまり、5次方程式の根 \(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) のうち、実数根の数は1、3,5のどれかです。方程式が可解である前提では「実数解が3つの5次方程式は可解ではない(66B)」ので、実数根の数は1、5のどちらかです。\(x_1\) が実数だとすると、拡大次数(33G)は、
\([\:\bs{Q}(x_1)\::\:\bs{Q}\:]=5\)
です(33F)。従って、最小分解体を \(\bs{L}=\bs{Q}(x_1,x_2,x_3,x_4,x_5)\) とすると、
\([\:\bs{L}\::\:\bs{Q}\:]\geq5\)
ですが、複素数根があるとすると、\([\:\bs{L}\::\:\bs{Q}\:] > 5\) です。従って、\([\:\bs{L}\::\:\bs{Q}\:]=5\) となるのは、複素数根がないとき、つまり実数根が5つの場合で、かつ、
\(\bs{Q}(x_1)=\bs{Q}(x_2)=\bs{Q}(x_3)=\bs{Q}(x_4)=\bs{Q}(x_5)\)
が成り立つときだけです。つまり \(x_1\) の四則演算で他の実数根が表わされる場合です(3次方程式のガロア群が \(C_3\) になる場合と同じ原理。No.358 参照)。
しかし、\(f(x)=x^5+px+q\) を微分すると \(f\,'(x)=5x^4+p\) ですが、\(f\,'(x)=0\) の実数根の数は高々2つであり、これから \(f(x)=0\) の実数根は高々3つであることが分かります。つまり、\([\:\bs{L}\::\:\bs{Q}\:]=5\) はあり得ません。従って \(|\mr{Gal}(\bs{L}/\bs{Q})|=5\) とはならず(52B)、ガロア群が \(C_5\) になることはないのです。
ちなみに文献2には、ガロア群が \(C_5\) になる方程式の例として、
\(x^5-110x^3-55x^2+2310x+979=0\)
という、少々ややこしい式があげてあります。このリゾルベントを計算してみると次の通りで、ガロア群が \(C_5\) であることが確認できます。このケースでは、前述の通り、リゾルベント方程式 \(R_{F20/C5}(x)=0\) が重複度を含めて4つの有理数根(そのうちの一つは重複度1の根、\(990\))をもっています。
\(R_{S5/F20}(x)\)
\(\begin{eqnarray}
&&\:\:=&x^6+18480x^5+47764750x^4-580262760000x^3\\
&&&-1796651418959375x^2+2980357148316659375x\\
&&&-360260685644469671875\\
&&\:\:=&(x+9955)(x^5+8525x^4-37101625x^3-210916083125x^2\\
&&& +303018188550000x-36188918698590625)\\
\end{eqnarray}\)
\(R_{S5/A5}(x)\)
\(=x^2-1396274566650390625\)
\(=(x-1181640625)(x+1181640625)\)
\(R_{F20/C5}(x)\)
\(=x^4+165x^3-698775x^2-383161625x-56495958750\)
\(=(x-990)(x+385)^3\)
以前に書いた記事から、ガロア群が \(F_{20}\) 、\(S_5\) の例をあげておきます。No.359 で、可解な5次方程式 \(x^5-2=0\) のガロア群が、位数 \(20\) のフロベニウス群 \(F_{20}\) であることを書きましたが、そのリゾルベントを計算してみると次の通りです。
\(f(x)=x^5-2\)
\(\begin{eqnarray}
&&\:\: R_{S5/F20}(x)&=x^6-50000x\\
&&&=x(x^5-50000)\\
&&\:\: R_{S5/A5}(x)&=x^2-50000\\
\end{eqnarray}\)
\(R_{S5/F20}(x)=0\) は \(x=0\) の根がありますが、\(R_{S5/A5}(x)\) は既約多項式であり、ガロア群は \(F_{20}\) です。
No.357 の記事の末尾で、可解でない方程式の代表としてあげた方程式(実数解が3つの5次方程式)のリゾルベントは次の通りです。
\(f(x)=x^5-5x+1\)
\(\begin{eqnarray}
&&\:\: R_{S5/F20}(x)&=&x^6-40x^5+1000x^4-20000x^3+\\
&&&&250000x^2-1603125x+4046875\\
&&\:\: R_{S5/A5}(x)&=&x^2+796875\\
\end{eqnarray}\)
2つのリゾルベントが共に既約多項式なので、ガロア群は \(S_5\) です。\(R_{S5/F20}(x)\) が既約であることは SymPy で確認できます。以前に書いた記事にはありませんが、ガロア群が \(A_5\) になる例もあげておきます。
\(f(x)=x^5+20x+16\)
\(\begin{eqnarray}
&&\:\: R_{S5/F20}(x)&=&x^6+160x^5+16000x^4+1280000x^3+\\
&&&&64000000x^2+1433600000x+4096000000\\
&&\:\: R_{S5/A5}(x)&=&x^2-1024000000\\
&&&=&(x-32000)(x+32000)\\
\end{eqnarray}\)
この \(R_{S5/F20}(x)\) も既約多項式です。
「ガロア群とリゾルベントの関係性定理」をよく読むと、この定理ではガロア群が決定できないケースがあります。それは、
ケースです。固定化群が \(C_5\)(\(G=F_{20},\:H=C_5\))の場合にはこれが起こりえます。
この場合、文献1では、元の方程式をガロア群が同じである別の方程式に変数変換してリゾルベントを計算するアルゴリズムが書かれていますが、詳細になるので割愛します。
可解な方程式の根をべき根で求める計算手法は文献2に書かれていますが、ガロア理論とは離れるので省略します。
\(x^5+11x-44=0\) の方程式は実数根が1つで、虚数根が4つです。実数根を \(\al\) とし、\(\al\) の近似値と厳密値をソフトで求めてみると次のようになります。この厳密値は本当かと心配になりますが、検算してみると正しいことが分かります。
\(\begin{eqnarray}
&&\:\:\al&=1.8777502748964972576\cd\\
&&&=\dfrac{\sqrt[5]{11}}{(\sqrt[5]{5})^4}(\al_1+\al_2-\al_3+\al_4)\\
\end{eqnarray}\)
\(\al_1=\sqrt[5]{\phantom{-}75+50\sqrt{5}-12\sqrt{5-\sqrt{5}}-59\sqrt{5+\sqrt{5}}}\)
\(\al_2=\sqrt[5]{\phantom{-}75-50\sqrt{5}+59\sqrt{5-\sqrt{5}}-12\sqrt{5+\sqrt{5}}}\)
\(\al_3=\sqrt[5]{-75+50\sqrt{5}+59\sqrt{5-\sqrt{5}}-12\sqrt{5+\sqrt{5}}}\)
\(\al_4=\sqrt[5]{\phantom{-}75+50\sqrt{5}+12\sqrt{5-\sqrt{5}}+59\sqrt{5+\sqrt{5}}}\)
リゾルベントとガロア群を求めるコード
この記事で書いたリゾルベントの計算は、実際は Python の SymPy モジュールを使ったプログラムで行いました。従って、正確かどうかはそのプログラムの正しさに依存します。念のため、そのプログラムを掲げておきます。
この中に、gCalculateResolvent() という関数がありますが、5次方程式の係数を受け取ってリゾルベントを計算し、表示します。また、ガロア群の種類を表示します。方程式の係数は、5次方程式を、
\(x^5+ax^4+bx^3+cx^2+dx+e=0\)
としたとき、\([a,\:b,\:c,\:d,\:e]\) のリストです。\(a\) ~ \(e\) は整数、ないしはプログラムの冒頭で定義された変数(=シンボル。下記では \(p,\:q\))です。一部が整数、一部が変数であってもかまいません。
SymPy の symmetrize というメソッドが出てきますが、複数シンボルの式を、それらシンボルの基本対称式で表わすものです。また factor(因数分解をする)や solve(方程式を解く)、gcd(多項式の最大公約数を求める)も使っています。
実行結果
上の実行結果は Python コードの出力を見やすいように多少整形してあります。ちなみに文献2には、
\(f(x)=x^5+px^3+qx^2+rx+s\)
としたときのリゾルベント \(R_{S5/F20}(x)\) が記述されていますが(77項からなる長い式です)、上のコードの出力と一致します。また、
\(x^5-110x^3-55x^2+2310x+979=0\)
のリゾルベント方程式 \(R_{S5/F20}(x)=0\) が \(x=-9955\) の有理数根をもつと書かれていますが、これは本文中に書いたコードの出力結果と一致しています。
No.359「高校数学で理解するガロア理論(6)」の補足をここに書きます。No.359 では \(x^5+11x-44=0\) という5次方程式をとりあげ、それが可解であることと(ガロア群は \(D_{10}\))、実際に数式処理ソフトで求めた解を記載しました。しかし、なぜ可解なのか(=四則演算とべき根で表せるのか)、そもそも可解性をどう判断するのには触れませんでした。そこで今回はその補足して、
一般の5次方程式の可解性をどう判断するのか | |
5次方程式のガロア群の求め方 |
を書きます。もちろんこれは、「高校数学で理解するガロア理論」シリーズの一部であり、前に書いた以下の記事の知識を前提とします。
No.354 - 高校数学で理解するガロア理論(1)証明の枠組み
No.355 - 高校数学で理解するガロア理論(2)整数の群・多項式・体
No.356 - 高校数学で理解するガロア理論(3)線形空間・群・ガロア群
No.357 - 高校数学で理解するガロア理論(4)可解性の必要条件
No.358 - 高校数学で理解するガロア理論(5)可解性の十分条件
No.359 - 高校数学で理解するガロア理論(6)可解な5次方程式・定理一覧
5次方程式の可解性とガロア群の判定
No.359 で、可解な5次方程式 \(x^5-2=0\) のガロア群が、位数 \(20\) のフロベニウス群 \(F_{20}\) であることを確認しました。一般に5次方程式のガロア群は、
\(S_5\) | :5次対称群 | (位数 \(120\)) | |
\(A_5\) | :5次交代群 | (位数 \(60\)) | |
\(F_{20}\) | :フロベニウス群 | (位数 \(20\)) | |
\(D_{10}\) | :5次2面体群 | (位数 \(10\)) | |
\(C_5\) | :5次巡回群 | (位数 \(5\)) |
の5種しかないことが知られています。このうち、
\(F_{20}\)、\(D_{10}\)、\(C_5\)
が可解群です(\(D_{10}\) は \(D_5\) と書く流儀もある)。\(S_5\) と \(A_5\) が可解でないことは「対称群の可解性」(65G)で証明しました。これらの群の、集合としての包括関係は、
\(S_5\:\sp\:A_5\) | \(\sp\:D_{10}\:\sp\:C_5\) | |
\(S_5\:\sp\:F_{20}\) | \(\sp\:D_{10}\:\sp\:C_5\) |
です。\(F_{20}\)(下図)は奇置換と偶置換の両方を含むので、\(A_5\) の部分集合ではありあません。
![]() |
フロベニウス群 \(\bs{F_{20}}\) |
ガロア群 \(F_{20}\) の \(20\)個の元を、4つの5角形の頂点に配置した図。\((1,2,3,4,5)\) などはガロア群を構成する巡回置換を表す。また \(23451\) などは、その巡回置換によって \(12345\) を置換した結果を表す(白ヌキ数字は置換で不動の点)。この群の生成元は、色を付けた \((1,2,3,4,5)\) と \((2,3,5,4)\) である。 |
そこで問題になるのは、ある5次方程式があったとき可解かどうか、ないしはガロア群が何かを判定する方法です。この判定のアルゴリズムを以下に書きます。それには「剰余類」と「共役群」の知識が必要なので、まずそれについて書きます。以降の内容は次の2つの文献を参考にしました。
文献1
Alexander D. Healy :
"Resultants, Resolvents and the Computation of Galois Groups"
文献2
D. S. Dummit :
"Solving Solvable Quintics"
剰余類
剰余類については No.356 の「4.一般の群」で書きましたが(41E)、改めて復習します。群 \(G\) の部分群を \(H\) とし、群 \(G\) の全ての元、
\(g_1=e,\:g_2,\:g_3,\:\cd\:,g_n\:\:(n=|G|)\)
を \(H\) に群演算した \(n\) 個の集合、
\(g_1H,\:g_2H,\:\cd\:,\:g_nH\)
を考えます(ここでは左から掛けるとしますが、右からでも同じ議論になります)。これらの任意の2つの集合 \(g_iH\) と \(g_jH\:(i\neq j)\) を比較すると、
\(g_iH\) と \(g_jH\) は全く同じ集合(全ての元が同じ) | |
\(g_iH\) と \(g_jH\) は全く違う集合(同じ元はない) |
のどちらかになります。なぜなら、もし \(g_1H\) と \(g_2H\) に同じ元があるとして、それが \(g_1H\) では \(g_1h_i\)、\(g_2H\) では \(g_2h_j\) と表されているとします。
\(g_1h_i=g_2h_j\)
です。これに左から \(g_2^{-1}\)、右から \(h_i^{-1}\) を掛けると、
\(g_2^{-1}g_1=h_jh_i^{-1}\:\in\:H\)
\(g_2^{-1}g_1\:\in\:H\)
となります。一般に \(h\in H\) と \(hH=H\) は同値なので(41C)、
\(g_2^{-1}g_1H=H\)
が得られますが、これに左から \(g_2\) を掛けると、
\(g_1H=g_2H\)
となります。従って、
\(g_1H\) と \(g_2H\) に一つでも同じ元があれば全体が同じ(\(g_1H=g_2H\)) |
になります。このことの対偶は
\(g_1H\) と \(g_2H\) が違えば(=一つでも違う元があれば)\(g_1H\) と \(g_2H\) に同じ元は全く無い(\(g_1H\cap g_2H=\phi\)) |
です。\(g_1H\) と \(g_2H\) の選択は任意なので、2つの剰余類について「全く同じか、全く違う」が成り立ちます。そこで、集合として同じものを一つにまとめてしまいます。その結果として \(d\) 個の集合ができたとして、
\(g_iH\:\:(1\leq i\leq d)\)
を「剰余類」と呼び、\(G/H\) で表します。\(g_i\) の選び方には自由度がありますが、どれかを採用して \(g_i\) を代表元と言います。この結果、
\(G=g_1H\:\cup\:g_2H\:\cup\:\cd\cup\:g_dH\)
\(g_iH\cap g_jH=\phi\:\:(i\neq j)\)
\(|G|=d|H|\)
となり、\(G\) が \(H\) による剰余類で "分割" できたことになります。この分割は、\(g_1=e\) として、\(H\) に含まれない \(G\) の元を \(g_2\) とし、\(g_1H\) と \(g_2H\) に含まれない \(G\) の元を \(g_3\) とし・・・というように \(G\) の元が尽きるまで続ける、と考えても同じです。
\(G=S_5\)、\(H=F_{20}\) の例で考えます。\(F_{20}\) の生成元は、巡回置換で表して、
\((1,\:2,\:3,\:4,\:5),\:(2,\:3,\:5,\:4)\)
とします。\(|S_5|/|F_{20}|=6\) なので、\(S_5\) は 部分群 \(F_{20}\) によって6つの剰余類 \(S_5/F_{20}\) に分割されます。その代表元を \(g_1,\) \(g_2,\) \(g_3,\) \(g_4,\) \(g_5,\) \(g_6\) とします。実際に計算してみると、たとえば代表元として、
\(g_1=e\)
\(g_2=(1,\:2,\:3)\)
\(g_3=(1,\:3,\:2)\)
\(g_4=(1,\:2)\)
\(g_5=(1,\:3)\)
\(g_6=(2,\:3)\)
とすることができます。以降、\(S_5/F_{20}\) を問題にするときには、この代表元を使って計算します。もちろん代表元の選び方には自由度があって、たとえば \(e,\) \((1,\:2),\) \((1,\:3),\) \((1,\:4),\) \((1,\:5),\) \((2,\:5)\) と選ぶこともできます。
さらに計算してみると、6つの剰余類 \(S_5/F_{20}\) には次の性質があることがわかります。つまり、\(\sg\) を、
\(\sg=(1,\:2,\:3,\:4,\:5)\in H\)
の巡回置換とすると、
\(\sg\:g_1H=g_1H\)
\(\sg\:g_2H=g_5H\)
\(\sg\:g_3H=g_4H\)
\(\sg\:g_4H=g_6H\)
\(\sg\:g_5H=g_3H\)
\(\sg\:g_6H=g_2H\)
が成り立ちます。これが成り立つことは、たとえば、
\(\begin{eqnarray}
&&\:\:g_5^{-1}\sg\:g_2&=(1,\:3)(1,\:2,\:3,\:4,\:5)(1,\:2)\\
&&&=(2,\:4,\:5,\:3)\in H\\
&&&\longrightarrow\:g_5^{-1}\sg\:g_2H=H\\
&&&\longrightarrow\:\sg\:g_2H=g_5H\\
\end{eqnarray}\)
と確認できます。同様にして、
\(\begin{eqnarray}
&&\:\:g_4^{-1}\sg\:g_3&=(1,\:2)(1,\:2,\:3,\:4,\:5)(1,\:3,\:2)\\
&&&=(1,\:4,\:5,\:2)\in H\\
&&&\longrightarrow\:\sg\:g_3H=g_4H\\
\end{eqnarray}\)
\(\begin{eqnarray}
&&\:\:g_6^{-1}\sg\:g_4&=(2,\:3)(1,\:2,\:3,\:4,\:5)(1,\:2)\\
&&&=(1,\:2,\:3,\:4,\:5)\in H\\
&&&\longrightarrow\:\sg\:g_4H=g_6H\\
\end{eqnarray}\)
\(\begin{eqnarray}
&&\:\:g_3^{-1}\sg\:g_5&=(1,\:3,\:2)^{-1}(1,\:2,\:3,\:4,\:5)(1,\:3)\\
&&&=(1,\:2,\:3)(1,\:2,\:3,\:4,\:5)(1,\:3)\\
&&&=(1,\:4,\:5,\:2)\in H\\
&&&\longrightarrow\:\sg\:g_5H=g_3H\\
\end{eqnarray}\)
\(\begin{eqnarray}
&&\:\:g_2^{-1}\sg\:g_6&=(1,\:2,\:3)^{-1}(1,\:2,\:3,\:4,\:5)(2,\:3)\\
&&&=(1,\:3,\:2)(1,\:2,\:3,\:4,\:5)(2,\:3)\\
&&&=(2,\:4,\:5,\:3)\in H\\
&&&\longrightarrow\:\sg\:g_6H=g_2H\\
\end{eqnarray}\)
であり、上の式が成り立つことが確認できます。つまり、\(g_1H\:(=H)\) だけは \(\sg\) を作用させても不変ですが、その他の剰余類に \(\sg\) を作用させると、順に、
\(g_2H\:\overset{\large\sg}{\rightarrow}\:g_5H\:\overset{\large\sg}{\rightarrow}\:g_3H\:\overset{\large\sg}{\rightarrow}\:g_4H\:\overset{\large\sg}{\rightarrow}\:g_6H\:\overset{\large\sg}{\rightarrow}\:g_2H\:\rightarrow\:\cd\)
と "巡回" します。このことは、後で可解性の条件定理で使います。
共役群
群 \(G\) の部分群を \(H\) とします。群 \(G\) の任意の元 を \(x\) とするとき、
\(xHx^{-1}\) \((x\in G)\)
を「\(H\) と共役な群」と言います(\(x^{-1}Hx\) と定義してもよい)。これが群になることは、\(h_1,\:h_2,\:h_3\:\in\:H\)、\(h_1h_2=h_3\) のとき、
\(\begin{eqnarray}
&&\:\:(xh_1x^{-1})(xh_2x^{-1})&=xh_1h_2x^{-1}\\
&&&=xh_3x_{-1}\:\in\:xHx^{-1}\\
\end{eqnarray}\)
というように、\(xHx^{-1}\) が群演算で閉じていることから分かります。
\(H\) と共役な群 \(xHx^{-1}\) は \(x\) の個数=群の位数だけあることになりますが、これら全てが違う群ではありません。もし \(H\) が \(G\) の正規部分群であれば、\(G\) の任意の元 \(x\) について \(xHx^{-1}=H\) が成り立つので、\(H\) と共役な部分群は \(H\) 自身だけです。
また、\(x,\:y\:\in\:G\) が同じ剰余類 \(G/H\) に属しているとすると、その剰余類の代表元を \(g_1\) として、
\(x=g_1h_i\)
\(y=g_1h_j\)
と表現できますが、
\(\begin{eqnarray}
&&\:\:xHx^{-1}&=g_1h_iHh_i^{-1}g_1^{-1}\\
&&&=g_1Hg_1^{-1}\\
&&\:\:yHy^{-1}&=g_1h_jHh_j^{-1}g_1^{-1}\\
&&&=g_1Hg_1^{-1}\\
&&\:\:xHx^{-1}&=yHy^{-1}\\
\end{eqnarray}\)
となって、\(x,\:y\) による \(H\) の共役群は同じものです。従って、\(H\) の共役群の数は最大で \(G\) の \(H\) による剰余類の数\(=|G|/|H|\) です。
フロベニウス群 \(F_{20}\) は \(S_5\) の正規部分群ではありません。計算してみると、剰余類 \(G/H\) の代表元 \(g_i\:(1\leq i\leq6)\)に対して、次の6つの共役な部分群があることが分かります。\(H=\langle\:(1,2,3,4,5),\:(2,3,5,4)\:\rangle\) とすると、\(H_i=g_iHg_i^{-1}\) はそれぞれ、
\(g_1=e\)
\(H_1=\langle\:(1,2,3,4,5),\:(2,3,5,4)\:\rangle=H\)
\(g_2=(1,\:2,\:3)\)
\(H_2=\langle\:(1,2,4,3,5),\:(2,4,5,3)\:\rangle\)
\(g_3=(1,\:3,\:2)\)
\(H_3=\langle\:(1,2,4,5,3),\:(2,4,3,5)\:\rangle\)
\(g_4=(1,\:2)\)
\(H_4=\langle\:(1,2,5,4,3),\:(2,5,3,4)\:\rangle\)
\(g_5=(1,\:3)\)
\(H_5=\langle\:(1,2,3,5,4),\:(2,3,4,5)\:\rangle\)
\(g_6=(2,\:3)\)
\(H_6=\langle\:(1,2,5,3,4),\:(2,5,4,3)\:\rangle\)
です。また \(S_5\) の任意の元を \(g\) とすると、\(H\) の \(g\) による共役群 \(gHg^{-1}\) は、\(g\) が属する剰余類の代表元 \(g_i\) を用いて、
\(gHg^{-1}=g_iHg_i^{-1}\) \((g,\:g_i\in H_i)\)
と表せることになります。
ある5次方程式のガロア群がフロベニウス群である、という場合、共役な6つの群のどれかであることを言っています。総称してフロベニウス群、とも言えます。
固定化群とリゾルベント
固定化群
以下は5次方程式を念頭に記述しますが、一般の \(n\)次方程式としても同じです。
\(S_5\) の部分群を \(G\) とします(\(G\subset S_5\))。\(G\) は \(S_5\) そのものであってもかまいません。次に、5変数、\(X_1,\:X_2,\:X_3,\:X_4,\:X_5\) の任意の多項式、
\(F(X_1,\:X_2,\:X_3,\:X_4,\:X_5)\)
を考えます。そして「\(S_5\) の任意の元 \(\sg\) による \(F\) への作用」を考えます。\(F\) は \(\sg\) の作用によって変数の入れ替えが起こります。たとえば、
\(\begin{eqnarray}
&&\:\:F&=X_1^2X_2+X_2^2X_3\\
&&\:\:\sg&=(1,\:2)\\
\end{eqnarray}\)
だと、
\(\sg F=X_2^2X_1+X_1^2X_3\)
です。この、多項式とそれへの作用を用いて固定化群(ないしは安定化群)の定義をします。
固定化群の定義 \(G\subset S_5\) とし、5変数、\(X_1,\:X_2,\:X_3,\:X_4,\:X_5\) の任意の多項式を \(F\) とする。\(G\) の元 \(\sg\) で、\(F\) に作用しても \(F\) を不変にする元の集合、 \(H_{(F,G)}\:=\:\{\sg\:|\:\sg\subset G,\:\sg\:F=F\}\) は群を成す。この \(H\) を(\(G\) における)\(F\) の固定化群(ないしは安定化群。stabilizer)と呼ぶ。 |
固定化群 \(H\) は、多項式 \(F\) と群 \(G\) に依存しているので \(H_{(F,G)}\) としました。いくつかの例をあげます。\(G=D_6\)(3次の2面体群。\(=S_3\))とすると、
\(F=X_1X_2+X_2X_3+X_3X_1\)
\(\begin{eqnarray} &&\:\:\longrightarrow\:H&=D_6\:(=S_3)\\ &&&=\{\:e,(1,2,3),(1,3,2),(1,2),(1,3),(2,3)\:\}\\ \end{eqnarray}\)
\(F=X_1^2X_2+X_2^2X_3+X_3^2X_1\)
\(\longrightarrow\:H=C_3=\{\:e,(1,2,3),(1,3,2)\:\}\)
\(F=X_1+X_2\)
\(\longrightarrow\:H=\{\:e,(1,2)\:\}\)
\(F=X_1-X_2\)
\(\longrightarrow\:H=\{e\}\)
\(\begin{eqnarray} &&\:\:\longrightarrow\:H&=D_6\:(=S_3)\\ &&&=\{\:e,(1,2,3),(1,3,2),(1,2),(1,3),(2,3)\:\}\\ \end{eqnarray}\)
\(F=X_1^2X_2+X_2^2X_3+X_3^2X_1\)
\(\longrightarrow\:H=C_3=\{\:e,(1,2,3),(1,3,2)\:\}\)
\(F=X_1+X_2\)
\(\longrightarrow\:H=\{\:e,(1,2)\:\}\)
\(F=X_1-X_2\)
\(\longrightarrow\:H=\{e\}\)
などです。
リゾルベント(Resolvent)
以降、一般の既約な5次多項式を、
\(\begin{eqnarray}
&&f(x)&=x^5+ax^4+bx^3+cx^2+dx+e\\
&&&=(x-x_1)(x-x_2)(x-x_3)(x-x_4)(x-x_5)\\
\end{eqnarray}\)
係数 \(a\) ~ \(e\) は有理数 | |
\(x_i\) は \(f(x)=0\) の根 |
で表します。根と係数の関係から、 \(a\) ~ \(e\) は \(x_i\) の基本対称式で表現できます。その具体的な形は No.357「高校数学で理解するガロア理論(4)」の「6.5 5次方程式に解の公式はない」の定理(65H)にあげました。
次にリゾルベントを定義します。定義に使うのは、
5次方程式 \(f(x)=0\) | |
多項式 \(F(X_1,\:X_2,\:X_3,\:X_4,\:X_5)\) | |
\(f(x)=0\) の根を多項式に代入した値 \(F(x_1,x_2,x_3,x_4,x_5)\) | |
群 \(G\:\:(\:\subset S_5\:)\) | |
多項式 \(F\) の \(G\) における固定化群 \(H\)( \(\subset G\) ) | |
剰余類 \(G/H\) |
です。
リゾルベントの定義 既約な有理係数の5次方程式 \(f(x)=0\) の根を \(x_1,x_2,x_3,x_4,x_5\) とする。 \(G\subset S_5\) とし、5変数、\(X_1,\:X_2,\:X_3,\:X_4,\:X_5\) の任意の多項式を \(F\) とする。\(G\) における \(F\) の固定化群を \(H\) とする。 剰余類 \(G/H\) の代表元を \(g_1,\:g_2,\:\cd\:,g_d\) とする。\(|G|=d|H|\) である。このとき、リゾルベント \(R(x)\) を \(R_{(F,G,f)}(x)=\displaystyle\prod_{i=1}^{d}(\:x-g_i\cdot F(x_1,x_2,x_3,x_4,x_5)\:)\) と定義する。 |
\(g_i\cdot F(x_1,x_2,x_3,x_4,x_5)\) という表記は、
多項式 \(F(X_1,\:X_2,\:X_3,\:X_4,\:X_5)\) に \(g_i\) を作用させてできた多項式に \(X_i=x_i\:(1\leq i\leq5)\) 代入した値
の意味です。\(g\in G\) とすると、
\(g\cdot F(X_1,X_2,X_3,X_4,X_5)=\)
\(F(X_{g(1)},X_{g(2)},X_{g(3)},X_{g(4)},X_{g(5)})\)
\(g\cdot F(x_1,x_2,x_3,x_4,x_5)=\)
\(F(x_{g(1)},x_{g(2)},x_{g(3)},x_{g(4)},x_{g(5)})\)
の意味です。\(g=(1,2,3)\) とすると、\(g(1)=2\)、\(g(2)=3\)、\(g(3)=1\)、\(g(4)=4\)、\(g(5)=5\) です。また以降で、関数 \(F(X_1,X_2,X_3,X_4,X_5)\) と 値 \(F(x_1,x_2,x_3,x_4,x_5)\) を \(F\) と簡略表記します。どちらを指すかは文脈によります。
このように、剰余類 \(G/H\) の代表元 \(g_i\) を \(F(x_1,x_2,x_3,x_4,x_5)\) に作用させることの意味を考えてみます。いま \(G\) の任意の元を \(g_\al,\:g_\beta\)とし、同じ剰余類 \(g_iH\) に属するとします。そうすると、\(H\) の適当な元 \(h_s,\:h_t\) を用いて、
\(g_\al=g_ih_s\)
\(g_\beta=g_ih_t\)
と表現できます。すると、
\(g_\al\cdot F=g_ih_s\cdot F=g_i\cdot F\)
\(g_\beta\cdot F=g_ih_t\cdot F=g_i\cdot F\)
となるので(\(H\) の元 \(h_s,\:h_t\) を \(F\) に作用させても不変)、
\(g_\al\cdot F=g_\beta\cdot F\)
となり、\(g_\al\cdot F\) と \(g_\beta\cdot F\) は同じ多項式です。ということは、\(G\) の元を \(F\) に作用させた多項式は最大、
\(g_1\cdot F,\:\:g_2\cdot F,\:\cd\cd\:,\:\:g_d\cdot F\)
の \(d\) 種類(=剰余類の数)あることになります(\(g_1,\:g_2,\:\cd\:g_d\) は \(G/H\) の代表元)。逆に、\(1\leq i,\:j\leq d\)(但し、\(i=j=1\) ではない) とし、
\(g_i\cdot F=g_j\cdot F\)
になるとすると、
\(g_j^{-1}g_i\cdot F=F\)
\(g_j^{-1}g_i\in H\)
\(g_j^{-1}g_iH=H\)
\(g_iH=g_jH\)
\(g_i=g_j\)
となります。この対偶は「\(g_i\neq g_j\) なら \(g_iF\neq g_jF\)」であり、\(G\) の元を \(F\) に作用させた多項式は、
\(g_1\cdot F,\:\:g_2\cdot F,\:\cd\cd\:,\:g_d\cdot F\)
の \(d\) 種類です。これらを「(\(\bs{G}\) における)\(\bs{F}\) と共役な多項式」と呼ぶことにします。
そもそも \(G/H\) の代表元は、\(g_iH\:(1\leq i\leq|G|)\) の集合から同じもを集めて、それらの代表として \(g_1H,\:g_2H,\:\cd\:g_dH\) としたものであり、
\(G=g_1H\:\cup\:g_2H\:\cup\:\cd\:\cup\:g_dH\)
が成り立つのでした。従って、\(G\) の任意の元を \(g\) とすると、\(gG=G\) なので、\(gg_iH\:(1\leq i\leq|G|)\) の集合から同じもを集めると、それらの代表として \(gg_1H,\:gg_2H,\:\cd\:,\:gg_dH\) とすることができ、
\(G=gg_1H\:\cup\:gg_2H\:\cup\:\cd\:\cup\:gg_dH\)
も成り立ちます。つまり、\(G/H\) の代表元を \(g_1,\:g_2,\:\cd\:,\:g_d\) とすると、\(gg_1,\:gg_2,\:\cd\:,\:gg_d\) も \(G/H\) の代表元です。従って、多項式 \(F\) へ作用させた、
\(gg_1\cdot F,\:gg_2\cdot F,\:\cd\:,\:gg_d\cdot F\)
の \(d\) 個の多項式も「\(F\) と共役な多項式」です。つまり、これら \(\bs{d}\) 個の多項式の集合を考えると、
\(\{g_1\cdot F,\:g_2\cdot F,\:\cd\:,\:g_d\cdot F\}=\)
\(\{gg_1\cdot F,\:gg_2\cdot F,\:\cd\:,\:gg_d\cdot F\}\)
であり、集合としては同じもの( \(\bs{\br{①}}\) )です。ここでリゾルベントの定義式を振り返ると、
\(R(x)=\displaystyle\prod_{i=1}^{d}(x-g_i\cdot F(x_1,x_2,x_3,x_4,x_5))\)
であり、\(g_1\cdot F,\:g_2\cdot F,\:\cd\:,\:g_d\cdot F\) の対称式になっています。つまり \(\bs{R(x)}\) は任意の2つの \(\bs{g_i\cdot F,\:g_j\cdot F}\) の入れ替えで不変( \(\bs{\br{②}}\) )です。結局、\(\bs{\br{①}}\) と \(\bs{\br{②}}\) を合わせると、
\(g\cdot R(x)=R(x)\)
が分かります。つまり \(\bs{R(x)}\) は \(\bs{G}\) の任意の元の作用で不変です。\(G\) は \(S_5\) かその部分群で、\(f(x)=0\) の5つの根 \(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) を置換するものでした。この置換で不変ということは、 \(R(x)\) の係数は \(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) の基本対称式で表現できます。従って \(R(x)\) の係数は \(f(x)\) の係数で表現できる有理数です。
\(F\) の \(G\) における固定化群は \(H\) でした。では、\(g\cdot F\:(g\in G)\) の固定化群は何かを調べてみると、\(H\) の任意の元を \(h\) として、
\(ghg^{-1}g\cdot F=gh\cdot F=g\cdot F\)
なので、\(ghg^{-1}\) は \(g\cdot F\) を固定します。 \(h\) は任意なので、
\(g\cdot F\) の固定化群は \(gHg^{-1}\) であり、\(H\) とは共役な群
であることがわかります。以上を踏まえて次の定理を証明します。この定理は文献1によります。
ガロア群とリゾルベントの関係
ガロア群とリゾルベントの関係性定理 \(G\subset S_5\) とし、5変数、\(X_1,\:X_2,\:X_3,\:X_4,\:X_5\) の任意の多項式を \(F\) とする。\(G\) の元 \(\sg\) で、\(F\) に作用しても \(F\) を不変にする元の集合を \(H\) とする。 \(H_{(F,G)}\:=\:\{\sg\:|\:\sg\subset G,\:\sg\cdot F=F\}\) であり、\(H\) は群を成す(固定化群)。 既約な有理係数の5次方程式 \(f(x)=0\) の根を \(x_1,x_2,x_3,x_4,x_5\) とする。\(f(x)\) の最小分解体を、 \(\bs{L}=\bs{Q}(x_1,x_2,x_3,x_4,x_5)\) とし、ガロア群を \(\mr{Gal}(\bs{L}/\bs{Q})\) で表す。 剰余類 \(G/H\) の代表元を \(g_1,\:g_2,\:\cd\:,g_d\) とする。\(|G|=d|H|\) である。このとき、リゾルベント \(R(x)\) を、\(d\) 次多項式、 \(R_{(F,G,f)}(x)=\displaystyle\prod_{i=1}^{d}(\:x-g_i\cdot F(x_1,x_2,x_3,x_4,x_5)\:)\) と定義する。以上の前提のもとに、次の2つの主張が成り立つ。 主張1
\(\mr{Gal}(\bs{L}/\bs{Q})\) が \(H\) の部分群(\(H\)を含む)と共役であれば、\(R(x)=0\)(リゾルベント方程式と呼ぶ)は有理数の根をもつ。
主張2
\(R(x)=0\)(リゾルベント方程式)が重複度1の有理数の根をもてば、\(\mr{Gal}(\bs{L}/\bs{Q})\) は \(H\) と共役な群の部分群である(重複度1の根とは重根ではない根=単根を指す)。
|
[主張1の証明]
\(\mr{Gal}(\bs{L}/\bs{Q})\) が \(H\) の部分群 \(N\:(N\subset H)\) と共役とすると、\(\sg\in G\) である \(\sg\) が存在し、\(\mr{Gal}(\bs{L}/\bs{Q})=\sg N\sg^{-1}\) と表せる。従って \(\tau\in\mr{Gal}(\bs{L}/\bs{Q})\) である任意の \(\tau\) をとると、\(\tau=\sg\:\mu\:\sg^{-1}\:(\mu\in N)\) と表せる。また、\(\sg\) が含まれる剰余類 \(G/H\) を \(g_iH\) とすると、\(\sg\) は適当な \(H\) の元 \(\eta\) を用いて \(\sg=g_i\:\eta\) と表せる。
ここでリゾルベントの定義式のうちの、
\(g_i\cdot F(x_1,x_2,x_3,x_4,x_5)\)
に着目すると(以下、\(F(x_1,x_2,x_3,x_4,x_5)\) を \(F\) と書く)、
\(\begin{eqnarray}
&&\:\:\tau(g_i\cdot F)&=\sg\:\mu\:\sg^{-1}(g_i\cdot F)\\
&&&=g_i\:\eta\:\mu\:\eta^{-1}g_i^{-1}g_i\cdot F\\
&&&=g_i\:\eta\:\mu\:\eta^{-1}\cdot F\\
\end{eqnarray}\)
となるが、\(\eta\)、\(\mu\)、\(\eta^{-1}\) はいずれも \(H\) の元なので、\(F\) に作用すると \(F\) を固定する。従って、
\(\tau(g_i\cdot F)=g_i\cdot F\)
であり、\(g_i\cdot F\) は \(\tau\) の作用で不変である。\(\tau\) は \(\mr{Gal}(\bs{L}/\bs{Q})\) の任意の元であり、ガロア群の任意の元で不変な \(g_i\cdot F\) は有理数である。\(g_i\cdot F\) はリゾルベント方程式の根の一つだから、方程式は有理数の根を持つ。[証明終]
[主張2の証明]
\(g_i\cdot F(x_1,x_2,x_3,x_4,x_5)\) がリゾルベント方程式の重複度1の有理数の根であったとする。\(\mr{Gal}(\bs{L}/\bs{Q})\) の任意の元 \(\tau\) は 有理数を固定する。\(g_i\cdot F\) は重複度1の根なので、\(g_i\cdot F\) 以外に有理数の根 \(g_j\cdot F\) があったとしても、\(g_i\cdot F\neq g_j\cdot F\:\:(i\neq j)\) である。従って、
\(\begin{eqnarray}
&&\:\:\tau\:g_i\cdot F=&g_i\cdot F\\
&&\:\:\tau\:g_i\cdot F\neq&g_j\cdot F\:\:(i\neq j)\\
\end{eqnarray}\)
が成り立つ。これは、\(\mr{Gal}(\bs{L}/\bs{Q})\) の任意の元 \(\tau\) が \(g_i\cdot F\) の固定化群に含まれることを意味する。\(F\) の固定化群 \(H\) の 任意の元を \(h\) とすると、\(h\cdot F=F\) であるが、
\(\begin{eqnarray}
&&\:\:g_ihg_i^{-1}g_i\cdot F&=g_ih\cdot F\\
&&&=g_i\cdot F\\
\end{eqnarray}\)
なので \(g_ihg_i^{-1}\) は \(g_i\cdot F\) を固定する。\(h\) は \(H\) の任意の元だから、\(g_i\cdot F\) の固定化群は \(H\) と共役な \(g_iHg_i^{-1}\) である。つまり、\(\mr{Gal}(\bs{L}/\bs{Q})\) の任意の元 \(\tau\) が \(\tau\in g_iHg_i^{-1}\) なので、\(\mr{Gal}(\bs{L}/\bs{Q})\) は \(H\) と共役な群の部分群である。[証明終]
リゾルベント \(R(x)\) を計算するためには、定義どおりにすると \(f(x)=0\) の根、\(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) が必要です。しかし \(G=S_5\) の場合は、任意の \(g\in S_5\) について
\(g\cdot R(x)=R(x)\)
です。ということは、\(R(x)\) の係数は \(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) の基本対称式で表されることになり、つまり方程式 \(\bs{f(x)=0}\) の係数だけから \(\bs{R(x)}\) の計算が可能です。
主張1の対偶は、
\(R(x)=0\) が有理数の根をもたなければ、\(\mr{Gal}(\bs{L}/\bs{Q})\) は \(H\) の部分群ではありえない
であり、これを方程式のガロア群の判断に使えます。たとえば、\(G=S_5,\:H=F_{20}\) の場合、\(R(x)=0\) が有理数の根をもたなければ、ガロア群は \(S_5\) か \(A_5\) です。
主張2の証明の流れをみると「\(\mr{Gal}(\bs{L}/\bs{Q})\) は \(H\) と共役な群の部分群である」ではなく、「\(\mr{Gal}(\bs{L}/\bs{Q})\) は \(H\) の部分群である」というようにできることが分かります。つまり、方程式 \(f(x)=0\) の根を \(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) と求め、\(g_i\cdot F(x_1,x_2,x_3,x_4,x_5)\) が有理数だと分かったとき、根を入れ替えて、
\(x_i=x_{g_i(i)}\)
とし、変換後の \(x_i\) で \(R(x)\) を計算すれば、\(g_1\cdot F(x_1,x_2,x_3,x_4,x_5)\) が有理数になり、\(g_1=e\) なので \(\mr{Gal}(\bs{L}/\bs{Q})=H\) となります。つまり、根の入れ替えによってガロア群を "互いに共役な複数の群の中のどれかに一つに固定" できる。これは、\(G=F_{20}\)、\(H=C_5\) の場合に、\(G\) を \(F_{20}\) の6つの共役群のなかの \(\langle\:(1,2,3,4,5),\:(2,3,5,4)\:\rangle\) に固定したいときに使います(後述)。
\(x^5+11x-44=0\)
以下、\(x^5+11x-44=0\) を例に、「ガロア群とリゾルベントの関係性定理」を使って可解性とガロア群を判定します。
固定化群:\(F_{20}\)
可解性の判定のためには、ガロア群が \(F_{20}\) の部分群かどうかを判定すればよいわけです。そこでまず \(G=S_5\) とし、多項式 \(F(X_1,X_2,X_3,X_4,X_5)\) を、
\(F(X_1,X_2,X_3,X_4,X_5)\)
\(\begin{eqnarray}
&&\:\: =&X_1^2(X_2X_5+X_3X_4)+X_2^2(X_1X_3+X_4X_5)+\\
&&&X_3^2(X_1X_5+X_2X_4)+X_4^2(X_1X_2+X_3X_5)+\\
&&&X_5^2(X_1X_4+X_2X_3)\\
\end{eqnarray}\)
と定義します。そうするとこの多項式の固定化群 \(H\) は、
\(H=\langle\:(1,2,3,4,5),\:(2,3,5,4)\:\rangle\)
のフロベニウス群 \(F_{20}\) になります。そのことを確認してみると、
\((1,2,3,4,5)\cdot F\)
\(\begin{eqnarray}
&&\:\: =&X_2^2(X_3X_1+X_4X_5)+X_3^2(X_2X_4+X_5X_1)+\\
&&&X_4^2(X_2X_1+X_3X_5)+X_5^2(X_2X_3+X_4X_1)+\\
&&&X_1^2(X_2X_5+X_3X_4)\\
&&\:\: =&F\\
\end{eqnarray}\)
\((2,3,5,4)\cdot F\)
\(\begin{eqnarray}
&&\:\: =&X_1^2(X_3X_4+X_5X_2)+X_3^2(X_1X_5+X_2X_4)+\\
&&&X_5^2(X_1X_4+X_3X_2)+X_2^2(X_1X_3+X_5X_4)+\\
&&&X_4^2(X_1X_2+X_3X_5)\\
&&\:\: =&F\\
\end{eqnarray}\)
となって、確かに \(F\) の固定化群が \(H\) だと分かります。ここで \(H\) は6つある共役群のうちの特定の1つであることに注意します。剰余類 \(G/H\) の代表元を、
\(e,\:(1,2,3),\:(1,3,2),\:(1,2),\:(1,3),\:(2,3)\)
として、
\(F_1=F\)
\(F_2=(1,2,3)\cdot F\)
\(F_3=(1,3,2)\cdot F\)
\(F_4=(1,2)\cdot F\)
\(F_5=(1,3)\cdot F\)
\(F_6=(2,3)\cdot F\)
とします。方程式 \(f(x)=0\) の5つの解を \(x_1,x_2,x_3,x_4,x_5\) とし、\(X_i\) に \(x_i\) を代入したものを改めて \(F_i\) として(\(1\leq i\leq6\))、
\(R_{S5/F20}(x)=(x-F_1)(x-F_2)(x-F_3)(x-F_4)(x-F_5)(x-F_6)\)
でリゾルベントを定義します。この \(R(x)\) を \(x_1,x_2,x_3,x_4,x_5\) の基本対称式で表し、基本対称式に方程式の係数を割り当てれば、\(R(x)\) の具体的な形が求まります。ちなみに代表元のとり方には自由度があるので、上で書いたように、たとえば \((1,2)\) \((1,3)\) \((1,4)\) \((1,5)\) \((2,5)\) などとしても、同じ \(R(x)\) になります。
まず、方程式を \(x^5+px+q=0\) として \(R(x)\) を求めてみます。この計算は、さすがに手計算では厳しいので、Python の SymPy モジュールで計算することにします。コードの例は後述します。この結果、
\(\begin{eqnarray}
&&R_{S5/F20}(x)=&x^6+8px^5+40p^2x^4+160p^3x^3+400p^4x^2+\\
&&&(512p^5-3125q^4)x+256p^6-9375pq^4\\
\end{eqnarray}\)
となります。これに \(x^5+11x-44\) の係数を入れると、
\(\begin{eqnarray}
&&R_{S5/F20}(x)&=&x^6+88x^5+4840x^4+212960x^3+5856400x^2\\
&&&&-11630341888x-386068880384\\
&&&=&(x-88)(x^5+176x^4+20328x^3+2001824x^2\\
&&&&+182016912x+4387146368)\\
\end{eqnarray}\)
です。この結果、リゾルベント方程式が \(x=88\) の根をもつので、\(x^5+11x-44=0\) の方程式は可解であると判断できます。ガロア群は \(F_{20},\:D_{10},\:C_5\) のどれかです。もし仮に \(R_{S5/F20}(x)=0\) が有理数の根をもたなければ、ガロア群は \(S_5\) か \(A_5\) です。
実は、リゾルベント方程式、\(R_{S5/F20}(x)=0\) が有理数根を持てば、その有理数根は重複度1の根(単根)であり、他に有理数根はないことが言えます。その理由ですが、いま、\(F_1\) が有理数だとします。もし \(F_1\) が有理数でなければ、根 \(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) の順序を入れ替えて \(F_1\) を有理数にできるので、こう仮定して一般性を失いません。そして、
\(r(x)=(x-F_2)(x-F_3)(x-F_4)(x-F_5)(x-F_6)=0\)
の5次方程式を考えます。この \(r(x)\) の最小分解体を \(\bs{L}_{r(x)}\) とし、ガロア群を \(\mr{Gal}(\bs{L}_{r(x)}/\bs{Q})\) とします。
ここで一般論です。既約多項式のガロア群は根の集合に対して根を置換するように作用しますが、この作用は推移的(transitive)です。推移的とは、群(たとえばガロア群 \(G\))が集合(たとえば方程式の根の集合 \(X\))に対して作用(たとえば、根 \(x_1,\) \(x_2,\) \(x_3,\) \(x_4,\) \(x_5\) の置換)するとき、\(X\) の任意の2つの元 \(x_i,\:x_j\) について、
\(\sg(x_i)=x_j\) \((\sg\in G)\)
となる \(\sg\) が必ず存在することを意味します。既約多項式のガロア群は、その定義から推移的です。この逆で、ガロア群が推移的であれば方程式は既約であることも成り立ちます。
\(r(x)=0\) の根は、\(F_2,\:F_3,\:F_4,\:F_5,\:F_6\) であり、
\(F_1=F\)
\(F_2=(1,2,3)\cdot F\)
\(F_3=(1,3,2)\cdot F\)
\(F_4=(1,2)\cdot F\)
\(F_5=(1,3)\cdot F\)
\(F_6=(2,3)\cdot F\)
ですが、剰余類の説明のところに書いたように、\(\sg\) を \((1,\:2,\:3,\:4,\:5)\) の巡回置換とすると、
\(\sg\:(1,2,3)\cdot F\) | \(=(1,3)\cdot F\) | |
\(\sg\:(1,3,2)\cdot F\) | \(=(1,2)\cdot F\) | |
\(\sg\:(1,2)\cdot F\) | \(=(2,3)\cdot F\) | |
\(\sg\:(1,3)\cdot F\) | \(=(1,3,2)\cdot F\) | |
\(\sg\:(2,3)\cdot F\) | \(=(1,2,3)\cdot F\) |
となり、\(\bs{\sg}\) は、\(\bs{F_2,\:F_3,\:F_4,\:F_5,\:F_6}\) という \(\bs{r(x)=0}\) の5つの根の置換するように作用します。かつ \(\sg\) を順々に作用させると根は 、
\(F_2\:\overset{\large\sg}{\rightarrow}\:F_5\:\overset{\large\sg}{\rightarrow}\:F_3\:\overset{\large\sg}{\rightarrow}\:F_4\:\overset{\large\sg}{\rightarrow}\:F_6\:\overset{\large\sg}{\rightarrow}\:F_2\:\rightarrow\:\cd\)
と巡回します。これは、
\(\begin{eqnarray}
&&\:\:C_5&=\langle\:(1,2,3,4,5)\:\rangle\\
&&&=\{\:\sg,\:\sg^2,\:\sg^3,\:\sg^4,\:\sg^5=e\:\}\\
\end{eqnarray}\)
が \(\mr{Gal}(\bs{L}_{r(x)}\:/\bs{Q})\) の部分群であり、\(\bs{\mr{Gal}(\bs{L}_{r(x)}\:/\bs{Q})}\) の \(\bs{r(x)=0}\) の根に対する作用は推移的であることを意味します。従って \(\bs{r(x)}\) は既約多項式です。これから言えるのは、
リゾルベント方程式 \(R_{S5/F20}(x)=0\) に有理数根 \(a\) が一つあったとすると、\(R_{S5/F20}(x)/(x-a)\) は既約多項式である。つまり、\(a\) は重複度1の根(単根)であり、他に有理数根はない
ということです。従って、5次方程式の可解性判断は次のように結論づけられます。
5次方程式の可解性定理 5次方程式が可解である必要十分条件は、\(R_{S5/F20}(x)=0\) というリゾルベント方程式が有理数根を持つことである |
固定化群:\(A_5\)
ガロア群が \(F_{20},\:D_{10},\:C_5\) のどれかを調べるには、固定化群が5次交代群 \(\bs{A_5}\) となる多項式を利用します。
\(F(X_1,X_2,X_3,X_4,X_5)=\)
\(\begin{eqnarray}
&&\:\: &(X_1-X_2)(X_1-X_3)(X_1-X_4)(X_1-X_5)\\
&&&(X_2-X_3)(X_2-X_4)(X_2-X_5)\\
&&&(X_3-X_4)(X_3-X_5)(X_4-X_5)\\
\end{eqnarray}\)
とおきます。\(F\) は 任意の互換の作用で \(-F\) になるので、任意の偶数個の互換を作用させても不変です。つまり \(F\) の固定化群は \(A_5\) です。剰余類 \(S_5/A_5\) の代表元としては、互換のどれかを選ぶことができます。従って、
\(F_1=F\)
\(F_2=(1,2)\cdot F=-F\)
とすることができて、これに方程式の5つの解 \(x_1,x_2,x_3,x_4,x_5\) を代入して、
\(\begin{eqnarray}
&&\:\:R_{S5/A5}(x)&=(x-F_1)(x-F_2)\\
&&&=x^2-F^2\\
\end{eqnarray}\)
でリゾルベントを定義します。リゾルベント方程式 \(R_{S5/A5}(x)=0\) は、相異なる2つの有理数根(\(F\) と \(-F\))をもつか、ないしは有理数根をもたないかのどちらかです。この \(R(x)\) を \(x_1,x_2,x_3,x_4,x_5\) の基本対称式で表し、基本対称式に方程式の係数を割り当てれば、\(R(x)\) の具体的な形が求まります。ちなみに、\(F\) は差積(数学記号では \(\Delta\))、\(F^2\) は判別式(数学記号では \(D\))と呼ばれています。
方程式を \(x^5+px+q\) として \(R(x)\) を求めてみると、
\(R_{S5/A5}(x)=x^2-(256p^5+3125q^4)\)
となります。これに \(x^5+11x-44\) の係数を入れると、
\(\begin{eqnarray}
&&R_{S5/A5}(x)&=x^2-11754029056\\
&&&=(x-108416)(x+108416)\\
\end{eqnarray}\)
となり、リゾルベント方程式が有理数の根をもつので、ガロア群は \(A_5\) の部分群であり、\(D_{10},\:C_5\) のどちらかです。もし仮に有理数の根をもたなければ、ガロア群は \(F_{20}\) です。
固定化群:\(C_5\)
さらに、\(G=F_{20},\:H=C_5\) とすることで、\(x^5+11x-44=0\) のガロア群が \(D_{10}\) か \(C_5\) かを調べます。この場合、\(G\) の生成元を \((1,2,3,4,5),\:(2,3,5,4)\) 、\(H\) の生成元を \((1,2,3,4,5)\) と固定して計算します。そのためにまず、方程式 \(x^5+11x-44=0\) を数値計算で解き、根を求めます。根が \(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) と求まったとします。
フロベニウス群 \(\langle\:(1,2,3,4,5),(2,3,5,4)\:\rangle\) を固定化群とする多項式 \(F_1\) に \(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) を代入したもの、およびそれと共役な多項式(\(F_2\)~\(F_6\))は、
\(\begin{eqnarray}
&&\:\:F_1=&x_1^2(x_2x_5+x_3x_4)+x_2^2(x_1x_3+x_4x_5)+\\
&&&x_3^2(x_1x_5+x_2x_4)+x_4^2(x_1x_2+x_3x_5)+\\
&&&x_5^2(x_1x_4+x_2x_3)\\
\end{eqnarray}\)
\(F_2=(1,2,3)\cdot F_1\)
\(F_3=(1,3,2)\cdot F_1\)
\(F_4=(1,2)\cdot F_1\)
\(F_5=(1,3)\cdot F_1\)
\(F_6=(2,3)\cdot F_1\)
でした。このうちの1つが有理数です。たとえば、\(F_3=(1,3,2)\cdot F_1\) が有理数だとすると、\(g=(1,3,2)\) として、
\(x_{g(1)},\:x_{g(2)},\:x_{g(3)},\:x_{g(4)},\:x_{g(5)}\)
を改めて \(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) と定義し直せば、\(F_1\) が有理数になります。この準備をした上で、固定化群が \(H=\langle\:(1,2,3,4,5)\:\rangle\) になる多項式 \(F_{C1}\) を考えると、
\(F_{C1}=X_1X_2^2+X_2X_3^2+X_3X_4^2+X_4X_5^2+X_5X_1^2\)
がそれに相当します。冒頭に掲げたフロベニウス群の図を参考にして剰余類 \(G/H\) の代表元を選ぶと、\(F_{C1}\) に共役な多項式は、
\(\begin{eqnarray}
&&\:\:F_{C2}&=(2,3,5,4)&\cdot F_{C1}\\
&&\:\:F_{C3}&=(2,3,5,4)^2&\cdot F_{C1}\\
&&&=(2,5)(3,4)&\cdot F_{C1}\\
&&\:\:F_{C4}&=(2,3,5,4)^3&\cdot F_{C1}\\
&&&=(2,4,5,3)&\cdot F_{C1}\\
\end{eqnarray}\)
です。従ってリゾルベントは、
\(R_{F20/C5}(x)=(x-F_{C1})(x-F_{C2})(x-F_{C3})(x-F_{C4})\)
で求まります。実際に \(x^5+11x-44=0\) のリゾルベントを求めると、
\(\begin{eqnarray}
&&\:\:R_{F20/C5}(x)&=x^4+968x^2+15972x+395307\\
&&&=(x^2-22x+1089)(x^2+22x+363)\\
\end{eqnarray}\)
です。因数分解の結果の2つの2次式はいずれも既約なので、リゾルベント方程式には有理数の根がありません。従って \(x^5+11x-44=0\) のガロア群は \(C_5\) ではなく \(D_{10}\) です。
もし仮に、\(R_{F20/C5}(x)=0\) のリゾルベント方程式が重複度1の有理数根をもてば、「ガロア群とリゾルベントの関係性定理」に従って、ガロア群は \(H\) の共役群の部分群ということになります。
ただし、No.359「高校数学で理解するガロア理論(6)」で書いたように、\(H=\langle\:(1,2,3,4,5)\:\rangle\)(\(=C_5\)) は \(G=\langle\:(1,2,3,4,5),\:(2,3,5,4)\:\rangle\)(\(=F_{20}\))の正規部分群です。従って、\(G\) における \(H\) と共役な群は \(H\) だけです。また、\(H\) に部分群はありません。つまり、ガロア群は \(H=\langle\:(1,2,3,4,5)\:\rangle\) です。
さらに、その \(H\) は \(F_{C1}\) と共役な \(F_{C2},\:F_{C3},\:F_{C4}\) の固定化群でもある。ということは、ガロア群で固定される \(F_{C2},\:F_{C3},\:F_{C4}\) は全て有理数です。これは、ガロア群が \(C_5\) になる方程式の例(後述)で確認できます。
実は、\(x^5+px+q=0\) の形の方程式のガロア群が \(C_5\)(=位数 \(5\) の巡回群)になることはありません。これはガロア理論から分かります。つまり、5次方程式の根 \(x_1,\:x_2,\:x_3,\:x_4,\:x_5\) のうち、実数根の数は1、3,5のどれかです。方程式が可解である前提では「実数解が3つの5次方程式は可解ではない(66B)」ので、実数根の数は1、5のどちらかです。\(x_1\) が実数だとすると、拡大次数(33G)は、
\([\:\bs{Q}(x_1)\::\:\bs{Q}\:]=5\)
です(33F)。従って、最小分解体を \(\bs{L}=\bs{Q}(x_1,x_2,x_3,x_4,x_5)\) とすると、
\([\:\bs{L}\::\:\bs{Q}\:]\geq5\)
ですが、複素数根があるとすると、\([\:\bs{L}\::\:\bs{Q}\:] > 5\) です。従って、\([\:\bs{L}\::\:\bs{Q}\:]=5\) となるのは、複素数根がないとき、つまり実数根が5つの場合で、かつ、
\(\bs{Q}(x_1)=\bs{Q}(x_2)=\bs{Q}(x_3)=\bs{Q}(x_4)=\bs{Q}(x_5)\)
が成り立つときだけです。つまり \(x_1\) の四則演算で他の実数根が表わされる場合です(3次方程式のガロア群が \(C_3\) になる場合と同じ原理。No.358 参照)。
しかし、\(f(x)=x^5+px+q\) を微分すると \(f\,'(x)=5x^4+p\) ですが、\(f\,'(x)=0\) の実数根の数は高々2つであり、これから \(f(x)=0\) の実数根は高々3つであることが分かります。つまり、\([\:\bs{L}\::\:\bs{Q}\:]=5\) はあり得ません。従って \(|\mr{Gal}(\bs{L}/\bs{Q})|=5\) とはならず(52B)、ガロア群が \(C_5\) になることはないのです。
ちなみに文献2には、ガロア群が \(C_5\) になる方程式の例として、
\(x^5-110x^3-55x^2+2310x+979=0\)
という、少々ややこしい式があげてあります。このリゾルベントを計算してみると次の通りで、ガロア群が \(C_5\) であることが確認できます。このケースでは、前述の通り、リゾルベント方程式 \(R_{F20/C5}(x)=0\) が重複度を含めて4つの有理数根(そのうちの一つは重複度1の根、\(990\))をもっています。
\(R_{S5/F20}(x)\)
\(\begin{eqnarray}
&&\:\:=&x^6+18480x^5+47764750x^4-580262760000x^3\\
&&&-1796651418959375x^2+2980357148316659375x\\
&&&-360260685644469671875\\
&&\:\:=&(x+9955)(x^5+8525x^4-37101625x^3-210916083125x^2\\
&&& +303018188550000x-36188918698590625)\\
\end{eqnarray}\)
\(R_{S5/A5}(x)\)
\(=x^2-1396274566650390625\)
\(=(x-1181640625)(x+1181640625)\)
\(R_{F20/C5}(x)\)
\(=x^4+165x^3-698775x^2-383161625x-56495958750\)
\(=(x-990)(x+385)^3\)
以前に書いた記事から、ガロア群が \(F_{20}\) 、\(S_5\) の例をあげておきます。No.359 で、可解な5次方程式 \(x^5-2=0\) のガロア群が、位数 \(20\) のフロベニウス群 \(F_{20}\) であることを書きましたが、そのリゾルベントを計算してみると次の通りです。
\(f(x)=x^5-2\)
\(\begin{eqnarray}
&&\:\: R_{S5/F20}(x)&=x^6-50000x\\
&&&=x(x^5-50000)\\
&&\:\: R_{S5/A5}(x)&=x^2-50000\\
\end{eqnarray}\)
\(R_{S5/F20}(x)=0\) は \(x=0\) の根がありますが、\(R_{S5/A5}(x)\) は既約多項式であり、ガロア群は \(F_{20}\) です。
No.357 の記事の末尾で、可解でない方程式の代表としてあげた方程式(実数解が3つの5次方程式)のリゾルベントは次の通りです。
\(f(x)=x^5-5x+1\)
\(\begin{eqnarray}
&&\:\: R_{S5/F20}(x)&=&x^6-40x^5+1000x^4-20000x^3+\\
&&&&250000x^2-1603125x+4046875\\
&&\:\: R_{S5/A5}(x)&=&x^2+796875\\
\end{eqnarray}\)
2つのリゾルベントが共に既約多項式なので、ガロア群は \(S_5\) です。\(R_{S5/F20}(x)\) が既約であることは SymPy で確認できます。以前に書いた記事にはありませんが、ガロア群が \(A_5\) になる例もあげておきます。
\(f(x)=x^5+20x+16\)
\(\begin{eqnarray}
&&\:\: R_{S5/F20}(x)&=&x^6+160x^5+16000x^4+1280000x^3+\\
&&&&64000000x^2+1433600000x+4096000000\\
&&\:\: R_{S5/A5}(x)&=&x^2-1024000000\\
&&&=&(x-32000)(x+32000)\\
\end{eqnarray}\)
この \(R_{S5/F20}(x)\) も既約多項式です。
「ガロア群とリゾルベントの関係性定理」をよく読むと、この定理ではガロア群が決定できないケースがあります。それは、
リゾルベント方程式が有理数の根を持つが、重根の有理数根しか持たない
ケースです。固定化群が \(C_5\)(\(G=F_{20},\:H=C_5\))の場合にはこれが起こりえます。
この場合、文献1では、元の方程式をガロア群が同じである別の方程式に変数変換してリゾルベントを計算するアルゴリズムが書かれていますが、詳細になるので割愛します。
|
\(x^5+11x-44=0\) の方程式は実数根が1つで、虚数根が4つです。実数根を \(\al\) とし、\(\al\) の近似値と厳密値をソフトで求めてみると次のようになります。この厳密値は本当かと心配になりますが、検算してみると正しいことが分かります。
\(\begin{eqnarray}
&&\:\:\al&=1.8777502748964972576\cd\\
&&&=\dfrac{\sqrt[5]{11}}{(\sqrt[5]{5})^4}(\al_1+\al_2-\al_3+\al_4)\\
\end{eqnarray}\)
\(\al_1=\sqrt[5]{\phantom{-}75+50\sqrt{5}-12\sqrt{5-\sqrt{5}}-59\sqrt{5+\sqrt{5}}}\)
\(\al_2=\sqrt[5]{\phantom{-}75-50\sqrt{5}+59\sqrt{5-\sqrt{5}}-12\sqrt{5+\sqrt{5}}}\)
\(\al_3=\sqrt[5]{-75+50\sqrt{5}+59\sqrt{5-\sqrt{5}}-12\sqrt{5+\sqrt{5}}}\)
\(\al_4=\sqrt[5]{\phantom{-}75+50\sqrt{5}+12\sqrt{5-\sqrt{5}}+59\sqrt{5+\sqrt{5}}}\)
リゾルベントとガロア群を求めるコード
この記事で書いたリゾルベントの計算は、実際は Python の SymPy モジュールを使ったプログラムで行いました。従って、正確かどうかはそのプログラムの正しさに依存します。念のため、そのプログラムを掲げておきます。
この中に、gCalculateResolvent() という関数がありますが、5次方程式の係数を受け取ってリゾルベントを計算し、表示します。また、ガロア群の種類を表示します。方程式の係数は、5次方程式を、
\(x^5+ax^4+bx^3+cx^2+dx+e=0\)
としたとき、\([a,\:b,\:c,\:d,\:e]\) のリストです。\(a\) ~ \(e\) は整数、ないしはプログラムの冒頭で定義された変数(=シンボル。下記では \(p,\:q\))です。一部が整数、一部が変数であってもかまいません。
SymPy の symmetrize というメソッドが出てきますが、複数シンボルの式を、それらシンボルの基本対称式で表わすものです。また factor(因数分解をする)や solve(方程式を解く)、gcd(多項式の最大公約数を求める)も使っています。
import sympy as sy
from IPython.display import display, Math
from sympy.polys.polyfuncs import symmetrize
x1, x2, x3, x4, x5 = sy.symbols('x1:6')
s1, s2, s3, s4, s5 = sy.symbols('s1:6')
x, p, q = sy.symbols('x, p, q')
# ================================
# メインプログラム
# ================================
def main():
eq = [0, 0, 0, p, q] # x**5+p*x+q=0
gCalculateResolvent(eq)
#
eq = [0, 0, 0, 11, -44] # D10
gCalculateResolvent(eq)
# ================================
# リゾルベントの計算で使用する関数
# ================================
def gPermutation(x, permutaion):
# リスト x の要素を置換(permutaion)に従って入替える
new = [x[permutaion[i]-1] for i in range(len(x))]
return new
def gConjugate(equation, permutaion):
# 5変数の多項式を permutaion に従って置換する
v = [x1, x2, x3, x4, x5]
pv = gPermutation(v, permutaion)
new = equation.subs(zip(v, pv), simultaneous=True)
return new
def gComplexToInt(x, e=1.0e-8):
# 虚部が 0 に近く、実部が整数に近い複素数を整数化する。
a = x.real;
if abs(x.imag) < e and abs(round(a) - a) < e:
return round(a)
else:
return x
def gDisplayLaTex(header, eq):
# LaTex 形式で表示する
ltx = header.replace(' ', r'\quad') + sy.latex(eq)
display(Math(ltx))
# ================================
# リゾルベントの計算関数
# ================================
def gCalculateResolvent(eq):
#
Galois = "UnKnown" # ガロア群の名称
#
Coeff_is_Integer = True
# 方程式の係数がすべて整数(変数なし)
for coef in eq:
if type(coef) != int:
Coeff_is_Integer = False
break
#
# 方程式を表示
#
equation = x**5 + eq[0]*x**4 + eq[1]*x**3 + \
eq[2]*x**2 + eq[3]*x + eq[4]
gDisplayLaTex("f(x)=", equation)
# ----------------------------
# Resolvent S5/F20 を計算する
# F1 : F20 で不変な多項式
# ----------------------------
F1 = x1**2*x2*x5 + x1**2*x3*x4 + \
x2**2*x1*x3 + x2**2*x4*x5 + \
x3**2*x1*x5 + x3**2*x2*x4 + \
x4**2*x1*x2 + x4**2*x3*x5 + \
x5**2*x1*x4 + x5**2*x2*x3
# S5/F20 の代表元
representatives = [[1,2,3,4,5], # e
[2,3,1,4,5], # (1,2,3)
[3,1,2,4,5], # (1,3,2)
[2,1,3,4,5], # (1,2)
[3,2,1,4,5], # (1,3)
[1,3,2,4,5]] # (2,3)
# S5 で F1 と共役な多項式
F2 = gConjugate(F1, representatives[1]) # (1,2,3)
F3 = gConjugate(F1, representatives[2]) # (1,3,2)
F4 = gConjugate(F1, representatives[3]) # (1,2)
F5 = gConjugate(F1, representatives[4]) # (1,3)
F6 = gConjugate(F1, representatives[5]) # (2,3)
F = [F1, F2, F3, F4, F5, F6]
#
# Resolvent
#
R = (x - F1)*(x - F2)*(x - F3)* \
(x - F4)*(x - F5)*(x - F6)
R = sy.expand(R)
#
# Resolventの係数を取り出し、基本対称式表現にし、
# 方程式の係数で置き換え、Resolventを作り直す
# sympy.polys.polyfuncs.symmetrize を使う
#
c = [R.coeff(x, i) for i in range(6)]
for i in range(6):
c[i] = symmetrize(c[i], formal=True)[0]
c[i] = c[i].subs([(s1, -eq[0]), \
(s2, eq[1]), \
(s3, -eq[2]), \
(s4, eq[3]), \
(s5, -eq[4])])
# s1 ... s5 は symmetrize から
# 返される基本対称式のシンボル名
R = x**6 + c[5]*x**5 + c[4]*x**4 + c[3]*x**3 + \
c[2]*x**2 + c[1]*x + c[0]
gDisplayLaTex(" R_{S5/F20}(x)=", R)
#
# Resolventを因数分解する
# 因数分解できればResolvent方程式は有理数根がある
#
if Coeff_is_Integer:
R_save = R
R = sy.factor(R)
if R == R_save:
F20Rational = False
else:
F20Rational = True
gDisplayLaTex(" =", R)
# -----------------------------------------------
# Resolvent S5/A5 を計算する
# F1 : A5 の作用で不変な多項式(5次方程式の差積)
# -----------------------------------------------
F1 = (x1 - x2)*(x1 - x3)*(x1 - x4)*(x1 - x5)* \
(x2 - x3)*(x2 - x4)*(x2 - x5)*(x3 - x4)* \
(x3 - x5)*(x4 - x5)
# S5 で F1 と共役な多項式
F2 = gConjugate(F1, [2, 1, 3, 4, 5]) # (1, 2)
#
R = (x - F1)*(x - F2)
R = sy.expand(R)
c = [R.coeff(x, i) for i in range(2)]
for i in range(2):
c[i] = symmetrize(c[i], formal=True)[0]
c[i] = c[i].subs([(s1, -eq[0]), \
(s2, eq[1]), \
(s3, -eq[2]), \
(s4, eq[3]), \
(s5, -eq[4])])
R = x**2 + c[1]*x + c[0]
gDisplayLaTex(" R_{S5/A5}(x)=", R)
#
# Resolventを因数分解
#
if Coeff_is_Integer:
R_save = R
R = sy.factor(R)
if R == R_save:
A5Rational = False
else:
A5Rational = True
gDisplayLaTex(" =", R)
#
# Galois群を決める
#
if Coeff_is_Integer:
if F20Rational:
if A5Rational: Galois = "D10/C5"
else: Galois = "F20"
else:
if A5Rational: Galois = "A5"
else: Galois = "S5"
#
# Resolvent F20/C5 を計算(別関数)
#
if Galois == "D10/C5":
Galois = gCalculateResolventC5(eq, F,
representatives)
print(f" (Galois group = {Galois})")
#
return
# ================================
# リゾルベントの計算関数(F20/C5)
# ================================
def gCalculateResolventC5(eq, F, representatives):
#
# 方程式の解を求める(sympy.solve)
#
sols = sy.solve(x**5 + eq[0]*x**4 + eq[1]*x**3 + \
eq[2]*x**2 + eq[3]*x + eq[4])
xvalue = [] # 方程式の根(複素数)
for sol in sols: xvalue.append(complex(sol.evalf()))
#
# F20 の生成元を (1,2,3,4,5), (2,3,5,4) とするため
# 共役な多項式のうちの F1 (=F[0]) が有理数になるように
# 根を入れ替える
#
xsymbol = [x1, x2, x3, x4, x5]
# 有理数となるFiを探索
for rational, Fi in enumerate(F):
val = Fi.subs(zip(xsymbol, xvalue))
val = complex(sy.expand(val))
if type(gComplexToInt(val)) == int: break
# 根を入れ替える
xvalue = gPermutation(xvalue, representatives[rational])
#
# F1 : C5 (1,2,3,4,5) で不変な多項式
#
F1 = x1*x2**2 + x2*x3**2 + x3*x4**2 + \
x4*x5**2 + x5*x1**2
#
# F20 において F1 と共役な多項式を求める
# 剰余類 F20/C5 の代表元は
# e, (2,3,5,4), (2,5)(3,4), (2,4,5,3)
#
F2 = gConjugate(F1, [1,3,5,2,4]) # (2,3,5,4)
F3 = gConjugate(F1, [1,5,4,3,2]) # (2,5)(3,4)
F4 = gConjugate(F1, [1,4,2,5,3]) # (2,4,5,3)
#
# Resolvent F20/C5
#
R = (x - F1)*(x - F2)*(x - F3)*(x - F4)
R = R.subs(zip(xsymbol, xvalue))
R = sy.expand(R)
c = [complex(R.coeff(x, i)) for i in range(4)]
for i in range(4):
c[i] = gComplexToInt(c[i], e=1.0e-4)
R = x**4 + c[3]*x**3 + c[2]*x**2 + c[1]*x + c[0]
gDisplayLaTex(" R_{F20/C5}(x)=", R)
R = sy.factor(R) # 因数分解
gDisplayLaTex(" =", R)
#
# Galois群を決める
#
sols = sy.solve(R) # リゾルベント方程式の根を求める
IntegerRoot = False # True : 有理数根をもつ
SimpleRoot = False # True : 単根の有理数根をもつ
for a in sols:
if type(a) != sy.core.numbers.Integer: continue
# sy. ... .Integer : sympy の整数クラス
IntegerRoot = True
multiple_root = sy.expand((x - int(a))**2)
if sy.gcd(R, multiple_root) != multiple_root:
SimpleRoot = True
break
#
if SimpleRoot:
Galois = "C5"
else:
if not IntegerRoot: # 有理数根がない
Galois = "D10"
else:
Galois = "D10/C5"
return Galois
# ================================
# メインプログラムを呼び出す
# ================================
main()
|
実行結果
\(f(x)=px+q+x^5\)
\(\begin{eqnarray}
&&\:\:R_{S5/F20}(x)&=&256p^6+400p^4x^2+160p^3x^3+40p^2x^4\\
&&&&-9375pq^4+8px^5+x^6+x(512p^5-3125q^4)\\
&&\:\:R_{S_5/A_5}(x)&=&-256p^5-3125q^4+x^2\\
\end{eqnarray}\)
\(f(x)=x^5+11x-44\)
\(\begin{eqnarray}
&&\:\:R_{S5/F20}(x)&=&x^6+88x^5+4840x^4+212960x^3+\\
&&&&5856400x^2-11630341888x-386068880384\\
&&&=&(x-88)(x^5+176x^4+20328x^3+2001824x^2+\\
\end{eqnarray}\)
\(182016912x+4387146368)\)
\(\begin{eqnarray}
&&\:\:R_{S5/A5}(x)&=&x^2-11754029056\\
&&&=&(x-108416)(x+108416)\\
&&\:\:R_{F20/C5}(x)&=&x^4+968x^2+15972x+395307\\
&&&=&(x^2-22x+1089)(x^2+22x+363)\\
\end{eqnarray}\)
(Galois group = D10)
|
上の実行結果は Python コードの出力を見やすいように多少整形してあります。ちなみに文献2には、
\(f(x)=x^5+px^3+qx^2+rx+s\)
としたときのリゾルベント \(R_{S5/F20}(x)\) が記述されていますが(77項からなる長い式です)、上のコードの出力と一致します。また、
\(x^5-110x^3-55x^2+2310x+979=0\)
のリゾルベント方程式 \(R_{S5/F20}(x)=0\) が \(x=-9955\) の有理数根をもつと書かれていますが、これは本文中に書いたコードの出力結果と一致しています。
2024-05-17 17:12
nice!(0)
No.369 - 高校数学で理解する素数判定の数理 [科学]
\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{#1}} \newcommand{\ol}[1]{\overline{#1}} \newcommand{\sb}{\subset} \newcommand{\sp}{\supset} \newcommand{\al}{\alpha} \newcommand{\sg}{\sigma}\newcommand{\cd}{\cdots}\)
今まで「高校数学で理解する・・・」という記事を何回か書きましたが、その中に暗号についての一連の記事があります。
No.310「高校数学で理解するRSA暗号の数理(1)」
No.311「高校数学で理解するRSA暗号の数理(2)」
No.313「高校数学で理解する公開鍵暗号の数理」
No.315「高校数学で理解する楕円曲線暗号の数理(1)」
No.316「高校数学で理解する楕円曲線暗号の数理(2)」
の5つです。これらは公開鍵暗号と、その中でも代表的な RSA暗号、楕円曲線暗号の数学的背景を書いたものです。情報通信をインフラとする現代社会は、この公開鍵暗号がなくては成り立ちません。"数学の社会応用" の典型的な例と言えるでしょう。
これらの暗号では、10進数で数10桁~数100桁の素数が必要です。ないしは、数10桁~数100桁の数が素数かどうかを判定する必要があります。
たとえば、マイナンバー・カードの認証に使われている RSA暗号の公開鍵は 2048ビットで、1024ビットの素数2つを掛け合わせて個人ごとに作られます。1024ビットということは \(2^{1023}\) ~ \(2^{1024}-1\) の数であり、10進では約300桁の巨大数です。素数を生成する式はないので、作るためには1024ビットの数をランダムに選び、それが素数かどうかを実用的な時間で判定する必要があります。
ビットコインのデジタル署名で使われているのは、256ビットの楕円曲線暗号です。この暗号の公開鍵は一般に公開されていますが(暗号の仕組みから個人ごとに作る必要はない)、この公開鍵を設計するときに必要なのは、256ビット=約80桁(10進)の数が素数かどうかを判定することです。
つまり、公開鍵暗号の基礎となっている技術が「素数判定」なのです。そこで今回は、素数判定の方法で一般的な「Miller-Rabin テスト」の数学的背景を書きます。Miller、Rabin は、このテストを考案した数学者2人の名前です。
前提知識
本論に入る前に前提知識について整理します。「高校数学で理解する・・・」というタイトルは「高校までで習う数学の知識だけを前提とする」という意味です。従って、その前提からはずれるものはすべて証明するのが基本方針です。
今回は、以前の「高校数学で理解する・・・」で証明した事項を前提知識とします。
・合同式
・フェルマの小定理
・中国剰余定理
・オイラー関数
・群
です。また、暗号の記事ではありませんが、No.355「高校数学で理解するガロア理論(2)」の次の事項も前提とします。
・剰余群
・既約剰余類群
・巡回群
・群の直積
・群の同型
以下、剰余群以下の事項について、素数判定に関わるところを簡単に復習します。
剰余群
整数の集合を \(Z\) で表し、整数 \(n\) の倍数の集合を \(nZ\) とします。また、
\(\ol{j_n}\)
は、\(\bs{n}\) で割った余りが \(\bs{j}\) である整数の集合とします(剰余類と呼ばれる)。たとえば、\(n=9,\:j=2\) とすると、\(\ol{2_9}\) は「\(9\) で割ったら \(2\) 余る整数の集合」で、
\(\ol{2_9}=\{\:\cd,\:-16,\:-7,\:2,\:11,\:20,\:29,\:\cd\:\}\)
です。剰余群 \(Z/nZ\) とは、
\(Z/nZ=\{\ol{0_n},\:\ol{1_n},\:\cd\:,\:\ol{(n-1)_n}\}\)
で示される「無限集合を元とする有限集合」です。\(n=9\) だと、
\(Z/9Z=\{\ol{0_9},\:\ol{1_9},\:\ol{2_9},\:\ol{3_9},\:\ol{4_9},\:\ol{5_9},\:\ol{6_9},\:\ol{7_9},\:\ol{8_9}\}\)
です。この集合の元の加算 \(+\) を、
\(\ol{i_n}+\ol{j_n}=\ol{(i+j)_n}\)
と定義すると(右辺は整数のたし算)、\(Z/nZ\) はこの演算について群の定義を満たし(=加法群)、この群を剰余群と呼びます。一般に有限群 \(G\) の元の数=群位数を \(|G|\) で表しますが、剰余群の群位数は、
\(|Z/nZ|=n\)
です。以降、剰余類と整数を同一視して、
\(Z/9Z=\{0,\:1,\:2,\:3,\:4,\:5,\:6,\:7,\:8\}\)
というように書きます。従って、\(1\) は 整数の \(1\) を表すことも、また、\(Z/nZ\) の元(= \(n\) で割ると \(1\) 余る数の集合= \(\ol{1_n}\))を表すこともあります。どちらかは文脈で決まります。
既約剰余類群
\(Z/nZ\) の元 \(\{0,\:1,\:\cd\:,\:j,\:\cd\:,\:n-1\}\) から \(\mr{gcd}(j,\:n)=1\) となる元(= \(n\) と素な元)だけを取り出した集合を既約剰余類群といい、\((Z/nZ)^{*}\) で表します。例をあげると、
\(\begin{eqnarray}
&&\:\:(Z/9Z)^{*}&=\{\ol{1_9},\:\ol{2_9},\:\ol{4_9},\:\ol{5_9},\:\ol{7_9},\:\ol{8_9}\}\\
&&&=\{\:1,\:2,\:4,\:5,\:7,\:8\:\}\\
\end{eqnarray}\)
です。この集合の、元と元との乗算 \(\cdot\) を、
\(\ol{i_n}\cdot\ol{j_n}=\ol{(ij)_n}\)
で定義すると(右辺の \(ij\) は整数の乗算)、\((Z/nZ)^{*}\) は乗算を演算とする群になります(=乗法群)。従って、任意の元 \(a\in(Z/nZ)^{*}\) の逆元 \(a^{-1}\) が存在して、
\(a\cdot a^{-1}=1\)
が成り立ちます。つまり乗算と除算が自由にできます。\((Z/9Z)^{*}\) の例では、
\(\begin{eqnarray}
&&\:\:1^{-1}&=1&&\\
&&\:\:2^{-1}&=5, &5^{-1}&=2\\
&&\:\:4^{-1}&=7, &7^{-1}&=4\\
&&\:\:8^{-1}&=8&&\\
\end{eqnarray}\)
です。\((Z/nZ)^{*}\) の群位数は、オイラー関数 \(\varphi\) を使って、
\((Z/nZ)^{*}=\varphi(n)\)
で表されます。\(\varphi(n)\) は「\(n\) 以下で \(n\) とは互いに素な数の個数」です。\(p,\:q\) を異なる素数とすると、
\(\begin{eqnarray}
&&\:\:\varphi(p)&=p-1\\
&&\:\:\varphi(pq)&=(p-1)(q-1)\\
&&\:\:\varphi(p^2)&=p(p-1)\\
\end{eqnarray}\)
などが成り立ちます。
巡回群
\(p\) を奇素数(\(p\neq2\))とすると、既約剰余類群 \((Z/pZ)^{*}\) は生成元 \(g\) をもちます。つまり、
\((Z/pZ)^{*}=\{\:g,\:g^2,\:g^,\:\cd\:,\:g^{p-1}=1\:\}\)
と表され、群位数は \(\varphi(p)=p-1\) です。このように、一つの生成元の累乗で全ての元が表せる群を巡回群と言います(\(1\) の次は再び \(g\) になって巡回する)。また、\(n\) が \(p\) の累乗、\(n=p^{\al}\:(\al\geq2)\) のときも \((Z/p^{\al}Z)^{*}\) は生成元をもつ巡回群です。\(\al=2\) のときの群位数は、
\(|(Z/p^2Z)^{*}|=\varphi(p^2)=p(p-1)\)
です。\((Z/9Z)^{*}\) の場合、群位数は \(\varphi(9)=6\) で、\(g=2\) と \(g=5\) が生成元になり、
\(\begin{eqnarray}
&&\:\:(Z/9Z)^{*}&=\{2,\:2^2=4,\:2^3=8,\:2^4=7,\:2^5=5,\:2^6=1\}\\
&&&=\{5,\:5^2=7,\:5^3=8,\:5^4=4,\:5^5=2,\:5^6=1\}\\
\end{eqnarray}\)
などと表せます。\(1,\:4,\:7,\:8\) は生成元ではありません。
群の直積、群の同型
\(G\) と \(H\) を有限群とし、その元を \(g_i\in G,\:h_j\in H\) として、2つの元のペア、
\((g_i,\:h_j)\) \((1\leq i\leq|G|,\:1\leq j\leq|H|)\)
を作るとき、すべてのペアを元とする集合を「群の直積」と言い、\(G\times H\) で表します。元と元の演算を \(g_i\) と \(h_i\) で個別に行うことで、直積も群になります。その群位数は、
\(|G\times H|=|G|\cdot|H|\)
です。
中国剰余定理によると、\(m,\:n\) が互いに素のとき、
\(x\equiv a\:\:(\mr{mod}\:m)\)
\(x\equiv b\:\:(\mr{mod}\:n)\)
の連立合同方程式は、\(mn\) を法として唯一の解を持ちます。\(x\) を \(m\) で割った余りを \(x_m\)、\(n\) で割った余りを \(x_n\) とし、
\(f\::\:x\:\longrightarrow\:(x_m,\:x_n)\)
の写像 \(f\) を定義すると、中国剰余定理によって \(f\) は1対1写像であり、かつ、
\(\begin{eqnarray}
&&\:\:f(xy)&=((xy)_m,\:\:(xy)_n)\\
&&&=((x_m\cdot y_m)_m,\:\:(x_n\cdot y_n)_n)\\
\end{eqnarray}\)
\(\begin{eqnarray}
&&\:\:f(x)f(y)&=(x_m,\:x_n)\:(y_m,\:y_n)\\
&&&=((x_m\cdot y_m)_m,\:\:(x_n\cdot y_n)_n)\\
\end{eqnarray}\)
なので、
\(f(xy)=f(x)f(y)\)
が成り立ちます。また同様に \(f(x+y)=f(x)+f(y)\) であり、\(f\) は演算を保存する同型写像です。従って、剰余群 \(Z/mnZ\) は、2つの群の直積との間で "群の同型" が成り立ち、
\(Z/mnZ\cong Z/mZ\times Z/nZ\)
です(=中国剰余定理の群による表現)。また 既約剰余類群 \((Z/mnZ)^{*}\) は、
\((Z/mnZ)^{*}\cong(Z/mZ)^{*}\times(Z/nZ)^{*}\)
と直積で表現できます。\(m,\:n\) がともに奇素数で \(m=p,\:n=q\:(\neq p)\)だと、
\((Z/pqZ)^{*}\cong(Z/pZ)^{*}\times(Z/qZ)^{*}\)
です。\((Z/pqZ)^{*}\) は巡回群でありませんが、2つの巡回群の直積で表現できることになります。
以上を前提として「Miller-Rabin テスト」のことを書きますが、これは「確率的素数判定アルゴリズム」の一種です。
「Miller-Rabin テスト」は「フェルマ・テスト」の発展形と言えるものです。そこでまず、「フェルマ・テスト」の原理になっている「フェルマの小定理」から始めます。
フェルマの小定理
素数がもつ重要な性質を示したのが、フェルマの小定理です。
この定理の \(a\) を、指数関数の「底(base)」と呼びます。偶数の素数は \(2\) しかないので、以降、\(\bs{n}\) は \(\bs{3}\) 以上の奇数として素数判定を考えます。フェルマの小定理を素数判定用に少々言い換えると、次のように表現できます。
このフェルマの小定理の対偶は次のようになります。
\(n\) が \(3\) 以上の奇数の合成数のとき、\(1\leq a\leq n-1\) について、
\(a^{n-1}\equiv1\:\:(\mr{mod}\:n)\)
\(a^{n-1}\not\equiv1\:\:(\mr{mod}\:n)\)
のどちらになるのか、\(a\) ごとに検討してみます。もちろん \(a=1\) なら \(a^{n-1}\equiv1\:\:(\mr{mod}\:n)\) です。また、\(a=n-1\:(=-1)\) でも、\(n-1\) が偶数なので、 \(a^{n-1}\equiv1\:\:(\mr{mod}\:n)\) です。
また、\(a\) が \(n\) と互いに素でないとき、つまり \(\mr{gcd}(n,\:a)\neq1\) ときは \(a^{n-1}\not\equiv1\:\:(\mr{mod}\:n)\) です。なぜなら、\(a\) と \(n\) の最大公約数を \(d\:(\neq1)\) として、もし \(a^{n-1}\equiv1\:\:(\mr{mod}\:n)\) だとすると、
\(a^{n-1}=k\cdot n+1\:\:(k\) は整数\()\)
と表わせますが、
左辺について \(d\mid a^{n-1}\)
右辺について \(d\nmid(k\cdot n+1)\)
となってしまい、矛盾するからです。
\(a\neq1,\:n-1\)、 \(\mr{gcd}(n,\:a)=1\) のときにどうなるかは、\(a\) によって両方がありえます。ためにしに、\(n=21\) で計算してみると、
となります。色を塗った10個が \(a\neq1,\:n-1\)、 \(\mr{gcd}(n,\:a)=1\) のところですが、\(\equiv1\) \((a=8,\:13)\) と \(\not\equiv1\)(それ以外の8個)があることがわかります。とにかく、上の表で一つでも \(\bs{\not\equiv1}\) があれば、\(n\) は合成数だと判断できます。
このフェルマの小定理の対偶を利用して、巨大整数(数10桁~数100桁) \(n\) が素数かどうかを確率的に判定できます。つまり、\(1\leq a\leq n-1\) である数をランダムに、順々に選び、ある \(a\) がフェルマの条件に反すれば、その時点で \(n\) は合成数と判定します。何回か試行してすべての \(a\) がフェルマの条件に合致するなら(=合成数だと判定できなければ)、\(n\) は素数の可能性が高い。
しかし困ったことに「合成数でありながら、多数の \(\bs{a}\) でフェルマの条件を満たしてしまう \(\bs{n}\)」が存在します。"カーマイケル数" です。最小のカーマイケル数は \(561=3\cdot11\cdot17\) ですが、\(\mr{gcd}(561,\:a)=1\) であるすべての \(a\:\:(1\leq a\leq560)\) で、
\(a^{560}\equiv1\:\:(\mr{mod}\:561)\)
が成り立ちます。その理由ですが、\(a\) を \(3,\:11,\:17\) のすべてと素な任意の数(= \(561\) と素な任意の数)とすると、フェルマの小定理より、
\(\begin{eqnarray}
&&\:\:a^{2}&\equiv1\:\:(\mr{mod}\:3)\\
&&\:\:a^{10}&\equiv1\:\:(\mr{mod}\:11)\\
&&\:\:a^{16}&\equiv1\:\:(\mr{mod}\:17)\\
\end{eqnarray}\)
が成り立ちます。\(560\) は、\(2,\:10,\:16\) 全部の倍数なので、それぞれの合同式の両辺を適切に累乗すると、
\(a^{560}\equiv1\:\:(\mr{mod}\:3)\)
\(a^{560}\equiv1\:\:(\mr{mod}\:11)\)
\(a^{560}\equiv1\:\:(\mr{mod}\:17)\)
が成り立つ。そうすると、中国剰余定理により、
\(a^{560}\equiv1\:\:(\mr{mod}\:3\cdot11\cdot17)\)
が成り立ちます。\(560\) 以下で \(561\) と素な数の個数は、オイラー関数 \(\varphi(n)\)(= \(n\) 以下で \(n\) と素な数の個数)を使うと、
\(\begin{eqnarray}
&&\:\:\varphi(561)&=\varphi(3)\varphi(11)\varphi(17)\\
&&&=2\cdot10\cdot16=320\\
\end{eqnarray}\)
なので、\(\dfrac{320}{560}=\dfrac{4}{7}\)、つまり半数以上の \(a\) でフェルマの条件が満たされることになります。これを一般的に言うと、カーマイケル数 \(c\) が3個の素数 \(p,\:q,\:r\) の積の場合、
\(\begin{eqnarray}
&&\:\:c&=pqr\\
&&\:\:\varphi(c)&=(p-1)(q-1)(r-1)\\
\end{eqnarray}\)
なので、この2つの比は、\(p,\:q,\:r\) が大きくなると \(1\) に近づきます。それは、ほとんど全ての \(a\:\:(1\leq a\leq c-1)\) がフェルマの条件を満たすことを意味します。
カーマイケル数は、特に \(n\) が巨大だと極めて希です。Wikipedia によると、「\(1\) から \(10^{21}\) の間には \(20,138,200\) 個のカーマイケル数があり、これはおよそ \(5\cdot10^{13}\) 個にひとつの割合」だそうです。しかし、カーマイケル数が無限個あることも証明されています。\(n\) が "運悪く" カーマイケル数だと、フェルマ\(\cdot\)テストでは素数と判定されてしまう。つまり、フェルマの条件を使って素数を確率的に判定するアルゴリズムには問題があるわけです。
Miller-Rabin の条件
そこで、素数の条件として、フェルマの条件とは別のものを考えます。フェルマの条件、
\(a^{n-1}\equiv1\:\:(\mr{mod}\:n)\)
において、\(n\) が素数とすると、\(n-1\) は偶数です。そこで、
\(n-1=2^ek\) (\(e\geq1,\:k\) は奇数)
と表します。この表記を用いて、\(a^{n-1}-1\) という式を因数分解すると、
\(\begin{eqnarray}
&&\:\:a^{n-1}-1&=a^{2^ek}-1\\
&&&=(a^{2^{e-1}k})^2-1\\
&&&=(a^{2^{e-1}k}+1)(a^{2^{e-1}k}-1)\\
&&&=(a^{2^{e-1}k}+1)((a^{2^{e-2}k})^2-1)\\
&&&=(a^{2^{e-1}k}+1)(a^{2^{e-2}k}+1)(a^{2^{e-2}k}-1)\\
&&& \vdots\\
\end{eqnarray}\)
と続きます。結局、因数分解は、
となります。これを \((\br{A})\) 式とします。\(n\) が素数のときは、フェルマの条件を変形すると、
\(a^{n-1}-1\equiv0\:\:(\mr{mod}\:n)\)
なので、フェルマの条件と等価な式は、
\((\br{A})\) 式の右辺 \(\equiv0\:\:(\mr{mod}\:n)\)
であり、ということは、
が成立します。\(\bs{n}\) が素数であるのがポイントです。\(n\) が合成数ならこんなことは言えません。このことより、\(n\) が素数であるための新たな条件が導けます。次項です。
素数の条件(Miller-Rabin)
\(a^{2^ik}\:\:(0\leq i\leq e-1)\) の \(e\) 個の数列を Miller-Rabin 系列と呼ぶことにします。
\(a^k,\:a^{2k},\:a^{4k},\:\cd\:,\:a^{2^{e-1}k}\)
です。この系列は、ある項の2乗が次の項になっています。従って \(\mr{mod}\:n\) でみて \(a^{2^rk}\equiv-1\) になれば、以降の項はすべて \(\equiv1\:(\mr{mod}\:n)\) になります。ということは、系列の中で \(\equiv-1\) となる項は「全く無い」か「一つだけある」のどちらかです。
ちなみに、Miller-Rabin による素数の条件の対偶は次の通りです。これを利用して合成数の判定ができます。
\(\bs{n}\) が素数であれば、フェルマーの条件と Miller-Rabin の条件は等価です。しかし、\(n\) が合成数のときは、フェルマの条件と Miller-Rabin の条件の意味が違ってきます。それが次です。
\(n\) が合成数のとき
\(n\) が合成数のときは、フェルマの条件から Miller-Rabin の条件を導くことはできません。なぜなら「\(n\)が素数」が導出のキーだからです。つまり、
とすると、\(a\in F\) であっても \(a\in M\) とは限らない。しかし、\((\br{A})\) 式でわかるように \(a\in M\) なら必ず \(a\in F\) です。従って、
\(M\:\subset\:F\)
です。ということは、数 \(a\) についてのフェルマーの条件によって \(n\) が合成数だと判定できなくても(つまり \(a\in F\))、Miller-Rabin の条件で合成数と判定できる(つまり \(a\notin M\))可能性があることになります。つまり合成数の判定においては、Miller-Rabin の条件はフェルマーの条件より厳格です。
しかも Miller-Rabin の条件は、合成数を合成数だと判定できる確率(ないしは判定できない確率)が、\(\bs{n}\) の値にかかわらず示せるのです。それが次の定理です。
Miller-Rabin の定理
\(\bs{n}\) がいかなる数であっても成り立つのがポイントです。実際に計算をしてみます。\(n\) を \(9\leq n < 10000\) である奇数の合成数とします。調べてみると、その総数は \(3771\)個です。そして、
とし、\(3771\)個の \(n\) のうち \(P\geq0.2\) のものをリストアップすると、次の5つだけです。
\(n=9\) のとき、\(P\) は最大値の \(0.25\) です。それ以降、\(n=1891\) のときに \(P\fallingdotseq0.24\) となりますが、\(0.25\) を越える \(n\) は( \(9\leq n < 10000\) では)無いことがわかります。そしてこの定理は、\(\bs{n}\) がいかなる奇数の合成数であっても \(\bs{P\leq0.25}\) と主張しているわけです。
これでまず言えることは、Miller-Rabin の条件にとっての「カーマイケル数のような数」はあり得ないことです。
さらにこの定理によって、素数判定の信頼度を示すことができます。比喩で言うと次のとおりです。
以上の考え方で \(n\) の素数判定をするアルゴリズムが次です。
\(r=40\) だとすると、Miller-Rabin の素数判定アルゴリズムで「素数と判定したにもかかわらず実は合成数」の確率は、
\(\dfrac{1}{4^{40}}\) 以下
であることが保証されます。\(4^{40}\) は、\(\fallingdotseq\:1.2\times10^{24}\) で、\(10\)進数で\(25\)桁の数です。あまりに巨大すぎて想像するのは難しいのですが、たとえば、1秒の \(100\)万分の \(1\) の時間は \(1\) マイクロ秒で、\(1\) 秒間に地球を \(7.5\)周する光が \(300\)メートルしか進まない時間です。一方、宇宙の年齢は \(138\)億年程度と言われています。この宇宙の年齢をマイクロ秒で表すと、\(4.4\times10^{23}\) マイクロ秒です。ということは、\(4^{40}\) はその3倍近い数字です。
\(\dfrac{1}{4^{40}}\) は、数学的には \(0\) ではありませんが、確率としては実用的に \(0\) です。以上が Miller-Rabin の素数判定の原理です。
以降、 なぜ \(\dfrac{1}{4}\) 以下であると言えるのか、その証明をします。
定理を再度述べると次の通りです。
3つのケースにわけて証明します。以降の証明は、後藤・鈴木(首都大学東京)「Miller-Rabin素数判定法における誤り確率の上限」を参考にしました。
② ③ のケースは \(n\) が平方因子を持たないので ① と排他的であり、また ② と ③ も排他的です。いずれの場合も \(n\) が奇数なので、素因数に \(2\) は現れません。以降の3つのケースに分けた証明では、\(p\) を素数としたとき既約剰余類群 \((Z/pZ)^{*}\) 、\((Z/p^2Z)^{*}\) が巡回群であることを利用します。
1. \(n=p^2t\:\:(\:p\)は奇素数。\(t\geq1\) は奇数\()\)
Miller-Rabin の条件を満たす \(a\:(0\leq a\leq n-1)\) の集合を \(M\) とします。上で説明したように、\(n\) が合成数であったとしても Miller-Rabin の条件が成立すればフェルマの条件も成立します(\(n\) が合成数だとその逆は成り立たない)。従って、
\(a^{n-1}\equiv1\:\:(\mr{mod}\:n)\)
が成り立ちます。このフェルマの条件を満たす \(a\:(1\leq a\leq n-1)\) の集合を \(F\) とすると、\(M\:\subset\:F\) なので元の数は、
\(|M|\leq|F|\)
です。さらに、\(p^2\mid n\)(= \(p^2\) が \(n\) を割り切る)なので、
も同時に成り立ちます。\((\br{B})\) 式を満たす \(a\:(1\leq a\leq n-1)\) の集合を \(R_1\) とすると、\(a\in F\) なら \(a\in R_1\) なので、
\(\begin{eqnarray}
&&\:\:F&\subset R_1\\
&&\:\:|F|&\leq|R_1|\\
\end{eqnarray}\)
が成り立ちます。\(|M|\leq|F|\) とあわせると、
\(|M|\leq|R_1|\)
です。次に、剰余群 \(Z/p^2Z\) の元 で \((\br{B})\) 式を満たす \(a\:(0\leq a\leq p^2-1)\) の集合を \(R_2\) とします。\(x\in R_2\) だとすると、\(\mr{mod}\:p^2\) では、
\(\begin{eqnarray}
&&\:\:x&=x+p^2\\
&&&=x+2p^2\\
&&& \vdots\\
&&&=x+(t-1)p^2\leq p^2t-1\\
\end{eqnarray}\)
です。つまり、\((\br{B})\) 式を満たす \(Z/p^2Z\) の元1個に対して、\((\br{B})\) 式を満たす、\(0\leq a\leq n-1\:(p^2t-1)\) の \(t\)個の数が対応します。従って、
\(t|R_2|=|R_1|\)
です。\(|M|\leq|R_1|\) とあわせると、
\(|M|\leq t|R_2|\)
です。
剰余群 \(Z/p^2Z\) の元で \((\br{B})\) 式を満たすのは、\(p^2\) と互いに素な元だけです。つまり、既約剰余類群 \((Z/p^2Z)^{*}\) の元で \((\br{B})\) 式を満たすものの集合が \(R_2\) であるとも言えます。以降、 \((Z/p^2Z)^{*}\) を使って \(R_2\) の元の数、\(|R_2|\) を見積もります。それには \((Z/p^2Z)^{*}\) が巡回群であることを利用します。
一般に、巡回群においては次が成り立ちます。この定理を \((\br{C})\) とします。
【証明】
\(h=\mr{gcd}(m,\:d)\) とおく。位数 \(d\) の巡回群 \(G\) は、生成元 \(g\) を用いて、
\(G=\{g,\:g^2,\:g^3,\:\cd\:,\:g^{d-1},\:g^d=1\}\)
と表現できる。そこで \(x=g^i\:\:(1\leq i\leq d)\) と表すと、
\(\begin{eqnarray}
&&\:\:(g^i)^m&=1\\
&&\:\:g^{im}&=1\\
\end{eqnarray}\)
なので、\(im\) は群位数 \(d\) の整数倍である。つまり、
\(d\mid im\)
である。\(h=\mr{gcd}(m,\:d)\) として \(d\,'=\dfrac{d}{h}\) \(m\,'=\dfrac{m}{h}\) とおくと、
\(d\,'\mid im\,'\)
になるが、\(d\,'\) と \(m\,'\) は互いに素なので、
\(d\,'\mid i\)
である。つまり \(i\) は \(d\,'=\dfrac{d}{h}\) の倍数である。従って、\(1\leq i\leq d\) であることを考慮すると、
\(i=\dfrac{d}{h}\cdot j\:\:(1\leq j\leq h)\)
と表せる。つまり、\(x^m=1\) を満たす \(x\) の個数は \(h=\mr{gcd}(m,\:d)\) 個である。【証明終】
既約剰余類群 \((Z/p^2Z)^{*}\) は巡回群であり、群位数は\(\varphi(p^2)=p(p-1)\) です。従って、\((Z/p^2Z)^{*}\) の元で \(a^{n-1}=1\) を満たす元の数(\(=|R_2|\))は定理 \((\br{C})\) により、
\(\begin{eqnarray}
&&\:\:|R_2|&=\mr{gcd}(p(p-1),\:n-1)\\
&&&=\mr{gcd}(p(p-1),\:p^2t-1)\\
\end{eqnarray}\)
となります。ここで、\(p^2t-1\) は \(p\) で割り切れないので、
\(\mr{gcd}(p(p-1),\:p^2t-1)=\mr{gcd}(p-1,\:p^2t-1)\)
ですが、この式の右辺は \(p-1\) 以下です。従って、
\(|R_2|\leq p-1\)
です。\(|M|\leq t|R_2|\) とあわせると、
\(|M|\leq t(p-1)\)
が得られました。従って、\(1\leq a\leq n-1\) のなかで Miller-Rabin の条件を満たす数の比率は、
\(\begin{eqnarray}
&&\:\:\dfrac{|M|}{n-1}&\leq\dfrac{t(p-1)}{tp^2-1}\\
&&&=\dfrac{p-1}{p^2-\dfrac{1}{t}}\\
\end{eqnarray}\)
となります。定義によって \(t\geq1,\:p\geq3\) ですが、上式の右辺は \(t\) についても \(p\) についても単調減少です。従って右辺の最大値は \(t=1,\:p=3\) のときで、
\(\dfrac{t(p-1)}{tp^2-1}\leq\dfrac{1}{4}\)
です。結論として、
\(\dfrac{|M|}{n-1}\leq\dfrac{1}{4}\)
となり、\(1\leq a\leq n-1\) のなかで Miller-Rabin の条件を満たす数の比率は \(\dfrac{1}{4}\) 未満であることが証明されました。
ちなみに、この証明はフェルマの条件しか使っていません。つまり、
と言えます。ということは、平方因子をもつ数はカーマイケル数にはなりえないことが分かります。
2. \(n=p_1\cdot p_2\:(\:p_1,\:p_2\) は奇素数で \(p_1\neq p_2\:)\)
Miller-Rabin の定理を再掲します。
証明のポイントは2つあります。(2) の条件に関する Miller-Rabin 系列、
\(a^k,\:a^{2k},\:\:a^{4k},\:\cd\:,\:a^{(e-1)k}\)
を考えると、ある項の2乗が次の項なので、\(a^{2^rk}\equiv-1\:\:(\mr{mod}\:n)\) となる項があれば、それ以降の項は全て \(\equiv1\) となります。つまり、\(a^{2^rk}\equiv-1\) となる項は1つしかありません。従って、\(r\) を一つ決めたときに \(a^{2^rk}\equiv-1\) を満たす \(a\) の集合を \(A_2(r)\) とし、(2) を満たすすべての \(a\) の集合を \(A_2\) とすると、
\(|A_2|=\displaystyle\sum_{r=0}^{e-1}|A_2(r)|\)
が成り立ちます。さらに (1) の条件を満たす \(a\) の集合を \(A_1\) とすると、(1) と (2) は排他的です。従って、Miller-Rabin の条件を満たす \(a\) の集合を \(M\) とすると、
\(\begin{eqnarray}
&&\:\:|M|&=|A_1|+|A_2|\\
&&&=|A_1|+\displaystyle\sum_{r=0}^{e-1}|A_2(r)|\\
\end{eqnarray}\)
です。このことを以下の証明で利用します。もう一つの証明のポイントは、「1.\(\bs{n=p^2t\:\:(\:p}\) は奇素数。\(\bs{t\geq1}\) は奇数\(\bs{)}\)」での証明と同じように、巡回群の性質を利用することです。
まず前提として、Miller-Rabin の条件を満たす \(a\:(0\leq a\leq n-1)\) は、フェルマの条件、\(a^{n-1}\equiv1\:\:(\mr{mod}\:n)\) も満たしますが、これが成り立つ \(a\) は \(n\) とは素です。従って、既約剰余類群 \((Z/nZ)^{*}\:=\:(Z/p_1p_2Z)^{*}\) の範囲で \(a\) の個数を検討します。
もちろん、\(p_1\neq p_2\) なので、既約剰余類群 \((Z/p_1p_2Z)^{*}\) は巡回群ではありません。しかし \(p_1,\:p_2\) が互いに素なので、\((Z/p_1p_2Z)^{*}\) は2つの既約剰余類群の直積と同型であり、
\((Z/p_1p_2Z)^{*}\cong(Z/p_1Z)^{*}\times(Z/p_2Z)^{*}\)
と表せます。つまり、\(a\in(Z/p_1p_2Z)^{*}\) とし、
\(a\) を \(p_1\) で割った余りを \(a_{p_1}\)
\(a\) を \(p_2\) で割った余りを \(a_{p_2}\)
と書くと、\(a_{p_1}\in(Z/p_1Z)^{*},\:\:a_{p_2}\in(Z/p_2Z)^{*}\) ですが、ここで、
\(f\::\:a\:\longrightarrow\:(a_{p_1},\:a_{p_2})\)
の写像を定義すると、この写像は1対1(全単射)で、同型写像であり、上の「直積と同型」の式が成り立ちます。同型写像は \(f(xy)=f(x)f(y)\) というように演算を保存するので、演算してから写像した結果と写像してから演算した結果は同じです。
また、この \((Z/p_1Z)^{*}\) と \((Z/p_2Z)^{*}\) は、\(p_1\) と \(p_2\) が素数なので、生成元をもつ巡回群です。それぞれの群位数は、
\(\begin{eqnarray}
&&\:\:|(Z/p_1p_2Z)^{*}|&=\varphi(p_1p_2)\\
&&&=(p_1-1)(p_2-1)\\
\end{eqnarray}\)
\(|(Z/p_1Z)^{*}|=\varphi(p_1)=p_1-1\)
\(|(Z/p_2Z)^{*}|=\varphi(p_2)=p_2-1\)
であり、
\(|(Z/p_1p_2Z)^{*}|=|(Z/p_1Z)^{*}|\cdot|(Z/p_2Z)^{*}|\)
が成り立ちます。ここで \((Z/p_1Z)^{*}\) の任意の部分集合を \(H_1\)、\((Z/p_2Z)^{*}\) の任意の部分集合を \(H_2\) とします。
\(H_1\subset(Z/p_1Z)^{*}\)
\(H_2\subset(Z/p_2Z)^{*}\)
です。\((Z/p_1p_2Z)^{*}\) の元 \(a\) で、
\(a_{p_1}\in H_1\)
\(a_{p_2}\in H_2\)
となる \(a\) を考え、このような \(a\) の集合を \(H\) と書くと、
\(f\::\:a\:\longrightarrow\:(a_{p_1},\:\:a_{p_2})\)
の写像は1対1対応であり(=中国剰余定理)、集合の元の数については、
\(|H|=|H_1|\cdot|H_2|\)
が成り立ちます。
以上を踏まえて証明に進みます。一般に、
\(x\equiv y\:\:(\mr{mod}\:p_1p_2)\) なら
\(x\equiv y\:\:(\mr{mod}\:p_1)\) かつ \(x\equiv y\:\:(\mr{mod}\:p_2)\)
が言えます。また、\(p_1\) と \(p_2\) は互いに素なので、
\(x\equiv y\:\:(\mr{mod}\:p_1)\) かつ \(x\equiv y\:\:(\mr{mod}\:p_2)\) なら
\(x\equiv y\:\:(\mr{mod}\:p_1p_2)\)
も言えます。なぜなら、\(p_1\mid(x-y)\) かつ \(p_2\mid(x-y)\) なら、\(p_1p_2\mid(x-y)\) だからです。つまり、
\(x\equiv y\:\:(\mr{mod}\:p_1p_2)\)
\(x\equiv y\:\:(\mr{mod}\:p_1)\) かつ \(x\equiv y\:\:(\mr{mod}\:p_2)\)
の2つは、\(p_1,\:p_2\) が素数という前提では等価です。従って、Miller-Rabin の条件は次のように言い換えることができます。
このように言い換えて、\((Z/p_1p_2Z)^{*}\) での問題を、\((Z/p_1Z)^{*}\) と \((Z/p_2Z)^{*}\) の問題に置き換えます。Miller-Rabin の条件を満たす、
とすると、元の数については、
\(|M|=|M_1|\cdot|M_2|\)
が成り立ちます。以降、(1)\(,\) (2) の条件ごとに \(|M_1|\) と \(|M_2|\) を見積もることで、条件ごとの \(|M|\) を見積もり、そこから目的である \(|M|\) の数を評価します。(1)\(,\) (2) の条件ごとの \(M\) については、既に上で使ったように、
(1)を満たす \(M\) の部分集合を \(A_1\)
(2)を満たす \(M\) の部分集合を \(A_2\)
とします。
\(n-1=2^ek\) とおいたのと同じように、
\(p_1-1=2^{e_1}k_1\) (\(e_1\geq1,\:k_1\):奇数)
\(p_2-1=2^{e_2}k_2\) (\(e_2\geq1,\:k_2\):奇数)
とします。ここで、
\(e_1\leq e_2\)
とします。\(p_1\) と \(p_2\) は入れ替えてもよいので、こうすることで一般性は失われません。まず初めに、\(e,\:e_1,\:e_2\) の関係を整理しておきます。\(n-1=2^ek\) の式ですが、
\(\begin{eqnarray}
&&\:\:n-1&=p_1\cdot p_2-1\\
&&&=(2^{e_1}k_1+1)\cdot(2^{e_2}k_2+1)-1\\
&&&=2^{e_1+e_2}k_1k_2+2^{e_1}k_1+2^{e_2}k_2\\
&&&=2^{e_1}(2^{e_2}k_1k_2+k_1+2^{e_2-e_1}k_2)\\
\end{eqnarray}\)
と計算されます。この式を、
\(n-1=2^{e_1}\cdot K\)
\(K=2^{e_2}k_1k_2+k_1+2^{e_2-e_1}k_2\)
と表わすと、
\(e_1 < e_2\) のときは、\(K\) は奇数なので \(e=e_1\)
\(e_1=e_2\) のときは、\(K\) は偶数なので \(e > e_1\)
となり、いずれにせよ、
\(e_1\leq e\)
です。
以降、
\(e_1 < e_2\)
\(e_1=e_2\)
の2つに分けて証明します。
2.1 \(e_1 < e_2\) の場合
(1)が成立するとき
(1) を満たす \(a\:(1\leq a\leq n-1)\) の集合を \(A_1\) とします。巡回群に関する定理 \((\br{C})\) により、\((Z/pZ)^{*}\) の群位数は \(p-1\) なので、
\(a^k=1\) となる \((Z/p_1Z)^{*}\) の元は \(\mr{gcd}(k,\:p_1-1)\) 個
\(a^k=1\) となる \((Z/p_2Z)^{*}\) の元は \(\mr{gcd}(k,\:p_2-1)\) 個
です。また、\(n=p_1p_2\) のとき、
\((Z/nZ)^{*}\cong(Z/p_1Z)^{*}\times(Z/p_2Z)^{*}\)
の同型が成り立つので、
\(\begin{eqnarray}
&&\:\:|A_1|&=\mr{gcd}(k,\:p_1-1)\cdot\mr{gcd}(k,\:p_2-1)\\
&&&=\mr{gcd}(k,\:2^{e_1}k_1)\cdot\mr{gcd}(k,\:2^{e_2}k_2)\\
\end{eqnarray}\)
です。ここで、\(k,\:k_1,\:k_2\) は全て奇数です。従って、
\(\mr{gcd}(k,\:2^{e_1}k_1)=\mr{gcd}(k,\:k_1)\)
\(\mr{gcd}(k,\:2^{e_2}k_2)=\mr{gcd}(k,\:k_2)\)
が成り立ち、
\(|A_1|=\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\)
となります。ここで \(|A_1|\) の上限値を評価すると、
\(\mr{gcd}(k,\:k_1)\leq k_1\)
\(\mr{gcd}(k,\:k_2)\leq k_2\)
であり、
\(|A_1|\leq k_1k_2\)
が結論づけられます。
(2)が成立するとき
(2) を満たす \(a\:(1\leq a\leq n-1)\) の集合を \(A_2\) とします。まず、\(0\leq r\leq e-1\) である \(r\) を一つ固定して考え、
\(a^{2^rk}\equiv-1\:\:(\mr{mod}\:p_1)\) かつ
\(a^{2^rk}\equiv-1\:\:(\mr{mod}\:p_2)\)
であるような集合を \(A_2(r)\) とします。そうすると、
\(|A_2|=\displaystyle\sum_{r=0}^{e-1}|A_2(r)|\)
が成り立ちます。まず、次を証明します。
【証明】
\((Z/p_1Z)^{*}\) は群位数 \(p_1-1\) の巡回群なので、その生成元を \(g\) とする。ここで、
\(g^{\frac{p_1-1}{2}}\)
を考えると、生成元の定義上、\(g^{p_1-1}=1,\) \(g^x\neq1\:(1\leq x < p_1-1)\) なので、
\(\begin{eqnarray}
&&\:\:g^{\frac{p_1-1}{2}}&\neq1\\
&&\:\:(g^{\frac{p_1-1}{2}})^2&=1\\
\end{eqnarray}\)
であり、つまり、
\(g^{\frac{p_1-1}{2}}=-1\:(=p_1-1)\)
である。\(a^{2^rk}=-1\) が成り立つ \(a\) を、生成元 \(g\) を用いて、
\(a=g^x\:\:(1\leq x\leq p_1-1)\)
と表すと、
だが、\(p_1-1=2^{e_1}k_1\) なので、
\(g^{2^rkx}=g^{2^{e_1-1}k_1}\)
が成り立つ。ここで一般的に \((Z/pZ)^{*}\) の生成元を \(g\) とし、
\(g^s=g^t\)
なら、\(j\) を整数として、
\(\begin{eqnarray}
&&\:\:g^{p-1}&=1\\
&&\:\:g^{j(p-1)}&=1\\
\end{eqnarray}\)
なので、
\(g^s=g^{t+j(p-1)}\)
である。つまり、
\(s\equiv t\:\:(\mr{mod}\:p-1)\)
が成り立つ。従って、
\(2^rkx\equiv2^{e_1-1}k_1\:\:(\mr{mod}\:p_1-1)\)
であり、\((\br{E})\) 式は \((\br{D})\) 式と等価である。\((\br{E})\) 式を解いて \(x\) を求めると、そこから \(a=g^x\) で \(a\) が求まる。
ここで、\(r\geq e_1\) と仮定すると、\((\br{E})\) 式は、
\(2^rkx-2^{e_1-1}k_1\equiv0\:\:(\mr{mod}\:2^{e_1}k_1)\)
と書ける。この \((\br{F})\) 式の \((2^{r-e_1+1}kx-k_1)\) の項に着目すると、\(r-e_1+1\geq1\) であり、\(k_1\) は奇数なので「偶数 - 奇数」=「奇数」である。そうすると、\((\br{F})\) 式の左辺は \(2^{e_1-1}\) の奇数倍であり、法である \(2^{e_1}k_1\) では割り切れず、\((\br{F})\) 式は成り立たない。つまり、\(a^{2^rk}=-1\) の解は、\(r\geq e_1\) のときには無い。
一方、\(r < e_1\) のとき \((\br{E})\) 式は、
と書ける。この \((\br{F}\,')\) 式が成り立つためには、\((kx-2^{e_1-r-1}k_1)\) の項は約数として \(2^i\:(i\geq e_1-r\geq1)\) を持つ必要があるが(少なくとも偶数である必要)、\(kx\) と \(2^{e_1-r-1}k_1\) はともに奇数にも偶数にもなり得るので、 \((\br{F}\,')\) 式の成立可能性に問題はない。そこで、以降で \(r < e_1\) のときの \((\br{E})\) 式の解の個数を検討する。
において、
\(\begin{eqnarray}
&&\:\:h&=\mr{gcd}(k,\:k_1)\\
&&\:\:k\,'&=\dfrac{k}{h}\\
&&\:\:k_1{}^{\prime}&=\dfrac{k_1}{h}\\
\end{eqnarray}\)
とおく。\(k\,'\) と \(k_1{}^{\prime}\) は互いに素で、また、\(k,\:k_1\) が奇数なので、\(h,\:k\,',\:k_1{}^{\prime}\) は奇数である。\(r < e_1\) つまり \(r\leq e_1-1\) の条件があるので、\((\br{E})\) 式の両辺と法を \(2^rh\) で割ると、
となる。一般的に、
\(ax\equiv b\:\:(\mr{mod}\:m)\)
の合同方程式は、\(a\) が \(m\) と素なときには \(b\) の値にかかわらず解があって、その解は \(m\) を法として唯一である(下記)。
\((\br{G})\) 式 をみると、\(k\,'\) と \(k_1{}^{\prime}\) は互いに素であり、かつ奇数なので、\((\br{G})\) 式における \(k\,'\) と、法である \(2^{e_1-r}k_1{}^{\prime}\) は互いに素である。ということは、
\((\br{G})\) 式は、法 \(2^{e_1-r}k_1{}^{\prime}\) で唯一の解をもつ
ことになる。\((\br{G})\) 式は \((\br{E})\) 式の両辺と法を \(2^rh\) で割ったものであった。つまり、\((\br{G})\) 式の法は、
\(2^{e_1-r}k_1{}^{\prime}=\dfrac{2^{e_1}k_1}{2^rh}\)
である。ということは、\((\br{G})\) 式の、法 \(2^{e_1-r}k_1{}^{\prime}\) での唯一の解は、法 \(2^{e_1}k_1\) である \((\br{E})\) 式の解、\(2^rh=2^r\cdot\mr{gcd}(k,\:k_1)\) 個に対応する。\((\br{E})\) 式は \((\br{D})\) 式と等価なので、これで、
が証明できた。【証明終】
ここまでで、
\((Z/p_1Z)^{*}\) において \(a^{2^rk}=-1\) である \(a\) の個数は
\(r\geq e_1\) のとき \(0\) 個
\(r < e_1\) のとき \(2^r\cdot\mr{gcd}(k,\:k_1)\) 個
であることが分かりました。この議論は \((Z/p_2Z)^{*}\) のときにも全く同じようにできて、
\((Z/p_2Z)^{*}\) において \(a^{2^rk}=-1\) である \(a\) の個数は
\(r\geq e_2\) のとき \(0\) 個
\(r < e_2\) のとき \(2^r\cdot\mr{gcd}(k,\:k_2)\) 個
が言えます。この結果を踏まえて、
を求めます。これは、
\((Z/p_1p_2Z)^{*}\cong(Z/p_1Z)^{*}\times(Z/p_2Z)^{*}\)
の直積関係を利用すると、\(e_1 < e_2\) の関係を考慮して、
\(r < e_1\) のとき
\(\begin{eqnarray}
&&\:\: |A_2(r)|&=2^r\cdot\mr{gcd}(k,\:k_1)\cdot2^r\cdot\mr{gcd}(k,\:k_2)\\
&&&=4^r\cdot\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\\
\end{eqnarray}\)
\(r\geq e_1\) のとき
\(|A_2(r)|=0\)
となります。ここから \(|A_2|\) を計算するには、
\(|A_2|=\displaystyle\sum_{r=0}^{e-1}|A_2(r)|\)
ですが、\(e_1\leq e\) の関係があるので、\(e-1\) までの総和は \(e_1-1\) までの総和に等しいことになります。つまり、
\(\begin{eqnarray}
&&\:\:|A_2|&=\displaystyle\sum_{r=0}^{e-1}|A_2(r)|\\
&&&=\displaystyle\sum_{r=0}^{e_1-1}|A_2(r)|\\
&&&=\displaystyle\sum_{r=0}^{e_1-1}4^r\cdot\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\\
\end{eqnarray}\)
の式が成り立ちます。この式に等比数列の総和である、
\(\displaystyle\sum_{r=0}^{e_1-1}4^r=\dfrac{4^{e_1}-1}{4-1}=\dfrac{4^{e_1}-1}{3}\)
を代入すると、
\(|A_2|=\dfrac{4^{e_1}-1}{3}\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\)
です。ここで、
\(\mr{gcd}(k,\:k_1)\leq k_1\)
\(\mr{gcd}(k,\:k_2)\leq k_2\)
の関係を利用すると、
\(|A_2|\leq\dfrac{4^{e_1}-1}{3}k_1k_2\)
となります。ここまでの式は、\(e_1 < e_2\) でなくても \(e_1\leq e_2\) なら成り立つことが導出過程から分かります。
以上の計算で \(|M|\) を評価できます。
\(\begin{eqnarray}
&&\:\:|M|&=|A_1|+|A_2|\\
&&&\leq k_1k_2+\dfrac{4^{e_1}-1}{3}k_1k_2\\
\end{eqnarray}\)
この計算をもとに \(1\leq a\leq n-1\) の \(n-1\) 個のうちの \(|M|\) の割合を評価すると、
\(\begin{eqnarray}
&&\:\:\dfrac{|M|}{n-1}&=\dfrac{|M|}{p_1p_2-1}\\
&&& < \dfrac{|M|}{(p_1-1)(p_2-1)}\\
&&&=\dfrac{|M|}{2^{e_1}k_1\cdot2^{e_2}k_2}\\
&&&\leq\dfrac{1}{2^{e_1+e_2}}\left(1+\dfrac{4^{e_1}-1}{3}\right)\\
&&&=\dfrac{1}{2^{e_1+e_2}}\cdot\dfrac{2+4^{e_1}}{3}\\
\end{eqnarray}\)
となります。ここで、\(\bs{e_1 < e_2}\) なので、\(\bs{2e_1+1\leq e_1+e_2}\) です。従って、
\(\begin{eqnarray}
&&\:\:\dfrac{|M|}{n-1}& < \dfrac{1}{2^{2e_1+1}}\cdot\dfrac{2+4^{e_1}}{3}\\
&&&=\dfrac{2+4^{e_1}}{6\cdot4^{e_1}}\\
\end{eqnarray}\)
ですが、この最後の式の最大値は \(e_1=1\) のときです。これを代入すると、
\(\dfrac{|M|}{n-1} < \dfrac{6}{24}=\dfrac{1}{4}\)
となって、\(1\leq a\leq n-1\) のなかで Miller-Rabin の条件を満たす数の比率は \(e_1 < e_2\) のときに \(\dfrac{1}{4}\) 未満であることが証明されました。
2.2 \(e_1=e_2\) の場合
(1)が成立するとき
\(e_1 < e_2\) と全く同じ考え方で、
\(|A_1|=\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\)
です(\(k,\:k_1,\:k_2\) は奇数)。ここで、一般的には、
\(\mr{gcd}(k,\:k_1)\leq k_1\)
\(\mr{gcd}(k,\:k_2)\leq k_2\)
が成り立ちますが、\(e_1=e_2\) だと、
\(\mr{gcd}(k,\:k_1)=k_1\)
\(\mr{gcd}(k,\:k_2)=k_2\)
が同時に成り立つことはありません。なぜなら、同時に成り立つとすると、
\(k_1\mid k\) かつ \(k_2\mid k\)
ですが、\(n-1=2^ek\) だったので、
\(k_1\mid(n-1)\) かつ \(k_2\mid(n-1)\)
です。ここで、\(n-1\) は
\(\begin{eqnarray}
&&\:\:n-1&=p_1p_2-1\\
&&&=(1+2^{e_1}k_1)\cdot p_2-1\\
&&&\equiv p_2-1\:\:(\mr{mod}\:k_1)\\
\end{eqnarray}\)
となりますが、\(k_1\mid(n-1)\) なので、
\(k_1\mid(p_2-1)\)
\(k_1\mid2^{e_2}k_2\)
\(k_1\mid k_2\)
となります。まったく同様にして、
\(n-1\equiv p_1-1\:\:(\mr{mod}\:k_2)\)
\(k_2\mid(p_1-1)\)
\(k_2\mid2^{e_1}k_1\)
\(k_2\mid k_1\)
です。\(k_1\mid k_2\) かつ \(k_2\mid k_1\) ということは、\(k_1=k_2\) ですが、\(e_1=e_2\) なので、\(p_1=p_2\) となって矛盾します。つまり \(\mr{gcd}(k,\:k_1)=k_1\)、\(\mr{gcd}(k,\:k_2)=k_2\) が同時に成り立つことはありません。そこで、
\(\mr{gcd}(k,\:k_1) < k_1\)
\(\mr{gcd}(k,\:k_2)\leq k_2\)
として一般性を失いません。ここで \(k_1\) を素因数分解したときに現れる最小の素数を \(q\:(q\geq3)\)とし、
\(k_1=q\cdot k_0\:\:(k_0\):奇数\()\)
と表します。そうすると、\(\mr{gcd}(k,\:k_1) < k_1\) なので、
\(\mr{gcd}(k,\:k_1)\leq k_0\)
が成り立ち、
\(\dfrac{k_1}{\mr{gcd}(k,\:k_1)}\geq\dfrac{k_1}{k_0}=q\geq3\)
となります。ここから、
\(\mr{gcd}(k,\:k_1)\leq\dfrac{1}{3}k_1\)
が得られます。そこで、
\(\mr{gcd}(k,\:k_1)\leq\dfrac{1}{3}k_1\)
\(\mr{gcd}(k,\:k_2)\leq k_2\)
をもとに、
\(|A_1|=\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\)
を評価すると、
\(|A_1|\leq\dfrac{1}{3}k_1k_2\)
となります。
(2)が成立するとき
このケースは \(e_1 < e_2\) で導出した、
\(|A_2|\leq\dfrac{4^{e_1}-1}{3}\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\)
までは全く同じです。ここで、
\(\mr{gcd}(k,\:k_1)\leq\dfrac{1}{3}k_1\)
\(\mr{gcd}(k,\:k_2)\leq k_2\)
によって評価すると、
\(|A_2|\leq\dfrac{1}{3}\cdot\dfrac{4^{e_1}-1}{3}k_1k_2\)
が成り立ちます。
以上の計算から \(|M|\) を評価すると、
\(\begin{eqnarray}
&&\:\:|M|&=|A_1|+|A_2|\\
&&&\leq\dfrac{1}{3}k_1k_2+\dfrac{1}{3}\cdot\dfrac{4^{e_1}-1}{3}k_1k_2\\
\end{eqnarray}\)
この計算をもとに \(1\leq a\leq n-1\) の \(n\) 個のうちの \(|M|\) の割合を計算すると、
\(\begin{eqnarray}
&&\:\:\dfrac{|M|}{n-1}&=\dfrac{|M|}{p_1p_2-1}\\
&&& < \dfrac{|M|}{(p_1-1)(p_2-1)}\\
&&&=\dfrac{|M|}{2^{e_1}k_1\cdot2^{e_2}k_2}\\
&&&\leq\dfrac{1}{2^{e_1+e_2}}\cdot\dfrac{1}{3}\left(1+\dfrac{4^{e_1}-1}{3}\right)\\
&&&=\dfrac{1}{2^{2e_1}}\cdot\dfrac{1}{3}\cdot\dfrac{2+4^{e_1}}{3}\\
&&&=\dfrac{1}{4^{e_1}}\cdot\dfrac{1}{3}\cdot\dfrac{2+4^{e_1}}{3}\\
&&&=\dfrac{1}{3}\left(\dfrac{2}{3\cdot4^{e_1}}+\dfrac{1}{3}\right)\\
\end{eqnarray}\)
となります。この最後の式の最大値は \(e_1=1\) のときです。代入すると、
\(\begin{eqnarray}
&&\:\:\dfrac{|M|}{n-1}& < \dfrac{1}{3}\left(\dfrac{1}{6}+\dfrac{1}{3}\right)\\
&&&=\dfrac{1}{6} < \dfrac{1}{4}\\
\end{eqnarray}\)
となって、\(1\leq a\leq n-1\) のなかで Miller-Rabin の条件を満たす数の比率は、\(e_1=e_2\) のときにも \(\dfrac{1}{4}\) 未満であることが証明されました。
3. \(n=p_1\cdot p_2\cdot\cd\cdot p_m\:\:(\:m\geq3\:)\)
\(n\) が3個以上の相異なる奇素数の積に素因数分解される場合です。この場合も、基本的には \(n=p_1\cdot p_2\) のケースと(全く同じではないが)同様になります。Miller-Rabin の定理を再掲します。
以降、表記を見やすくするため、\(m=3\)、\(n=p_1\cdot p_2\cdot p_3\) の場合で記述します。既約剰余類群の同型関係、
\((Z/p_1p_2p_3Z)^{*}\cong(Z/p_1Z)^{*}\times(Z/p_2Z)^{*}\times(Z/p_3Z)^{*}\)
を利用して、問題を置き換えます。それぞれの群位数は、
\(\begin{eqnarray}
&&\:\:|(Z/p_1p_2p_3Z)^{*}|&=\varphi(p_1p_2p_3)\\
&&&=(p_1-1)(p_2-1)(p_3-1)\\
\end{eqnarray}\)
\(|(Z/p_1Z)^{*}|=\varphi(p_1)=p_1-1\)
\(|(Z/p_2Z)^{*}|=\varphi(p_2)=p_2-1\)
\(|(Z/p_3Z)^{*}|=\varphi(p_3)=p_3-1\)
であり、
\(|(Z/p_1p_2p_3Z)^{*}|=|(Z/p_1Z)^{*}|\cdot|(Z/p_2Z)^{*}|\cdot|(Z/p_3Z)^{*}|\)
が成り立ちます。Miller-Rabin の条件は次のように言い換えられます。
例によって、
\(p_1-1=2^{e_1}k_1\:\:(e_1\geq1,\:k_1\) は奇数\()\)
\(p_2-1=2^{e_2}k_2\:\:(e_2\geq1,\:k_2\) は奇数\()\)
\(p_3-1=2^{e_3}k_3\:\:(e_3\geq1,\:k_3\) は奇数\()\)
とおきますが、\(\bs{e_1}\) は \(\bs{e_1,\:e_2,\:e_3}\) のうちの最小とします。こう仮定して一般性を失うことはありません。この仮定のもとでは、
\(3e_1\leq e_1+e_2+e_3\)
が成り立ちます。等号は \(e_1=e_2=e_3\) の場合です。
(1)が成立するとき
(1) を満たす \(a\:(1\leq a\leq n-1)\) の集合を \(A_1\) とします。\(n=p_1\cdot p_2\) のケースと同様の計算によって、
\(|A_1|=\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\cdot\mr{gcd}(k,\:k_3)\)
となります。\(|A_1|\) の上限値を評価すると、
\(\mr{gcd}(k,\:k_1)\leq k_1\)
\(\mr{gcd}(k,\:k_2)\leq k_2\)
\(\mr{gcd}(k,\:k_3)\leq k_3\)
なので、
\(|A_1|\leq k_1k_2k_3\)
が結論づけられます。
(2)が成立するとき
(2) を満たす \(a\:(1\leq a\leq n-1)\) の集合を \(A_2\) とします。\(n=p_1\cdot p_2\) のケースと同様の計算で、
\(|A_2|=\displaystyle\sum_{r=0}^{e_1-1}(2^r)^3\cdot\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\cdot\mr{gcd}(k,\:k_3)\)
です。この式に \(e_1\) だけが現れるのは、\(e_1\) が \(\{e_1,\:e_2,\:e_3\}\) の最小値だからです。ここで、
\(\mr{gcd}(k,\:k_1)\leq k_1\)
\(\mr{gcd}(k,\:k_2)\leq k_2\)
\(\mr{gcd}(k,\:k_3)\leq k_3\)
の関係を利用します。また、等比数列の総和を計算すると、
\(\begin{eqnarray}
&&\:\:\displaystyle\sum_{r=0}^{e_1-1}(2^r)^3&=\displaystyle\sum_{r=0}^{e_1-1}(2^3)^r\\
&&&=\dfrac{(2^3)^{e_1}-1}{2^3-1}\\
\end{eqnarray}\)
です。まとめると、
\(|A_2|\leq\dfrac{2^{3e_1}-1}{2^3-1}\cdot k_1k_2k_3\)
が得られます。
以上をもとに \(|M|\) を評価すると、
\(\begin{eqnarray}
&&\:\:|M|&=|A_1|+|A_2|\\
&&&\leq k_1k_2k_3+\dfrac{2^{3e_1}-1}{2^3-1}\cdot k_1k_2k_3\\
\end{eqnarray}\)
です。この計算をもとに \(1\leq a\leq n-1\) の \(n-1\) 個のうちの \(|M|\) の割合を計算すると、
\(\begin{eqnarray}
&&\:\:\dfrac{|M|}{n-1}&=\dfrac{|M|}{p_1p_2p_3-1}\\
&&& < \dfrac{|M|}{(p_1-1)(p_2-1)(p_3-1)}\\
&&&=\dfrac{|M|}{2^{e_1}k_1\cdot2^{e_2}k_2\cdot2^{e_3}k_3}\\
&&&\leq\dfrac{1}{2^{e_1+e_2+e_3}}\left(1+\dfrac{2^{3e_1}-1}{2^3-1}\right)\\
\end{eqnarray}\)
となります。ここで、\(3e_1\leq e_1+e_2+e_3\) です。従って、
\(\begin{eqnarray}
&&\:\:\dfrac{|M|}{n-1}& < \dfrac{1}{2^{3e_1}}\left(1+\dfrac{2^{3e_1}-1}{2^3-1}\right)\\
&&&=\dfrac{6+2^{3e_1}}{7\cdot2^{3e_1}}\\
\end{eqnarray}\)
ですが、この最後の式は \(e_1\) の増大によって単調減少するので、その最大値は \(e_1=1\) のときです。これを代入すると、
\(\dfrac{|M|}{n-1} < \dfrac{6+8}{56}=\dfrac{1}{4}\)
となって、\(1\leq a\leq n-1\) のなかで Miller-Rabin の条件を満たす数の比率は \(\dfrac{1}{4}\) 未満であることが確かめられました。
以上の表記は \(m=3\) の場合ですが、証明のプロセスを振り返ってみると、\(m\geq3\) のときは、
\(\begin{eqnarray}
&&\:\:\dfrac{|M|}{n-1}& < \dfrac{1}{2^{m\cdot e_1}}\left(1+\displaystyle\sum_{r=0}^{e_1-1}(2^m)^r\right)\\
&&&=\dfrac{1}{2^{m\cdot e_1}}\left(1+\dfrac{2^{m\cdot e_1}-1}{2^m-1}\right)\\
&&&=\dfrac{2^m-2+2^{m\cdot e_1}}{(2^m-1)\cdot2^{m\cdot e_1}}\\
\end{eqnarray}\)
です。この式の右辺は \(e_1\) について単調減少なので、\(e_1=1\) を代入すると、
\(\begin{eqnarray}
&&\:\:\dfrac{|M|}{n-1}& < \dfrac{2^m-2+2^m}{(2^m-1)\cdot2^m}\\
&&&=\dfrac{2\cdot(2^m-1)}{(2^m-1)\cdot2^m}\\
&&&=\dfrac{1}{2^{m-1}}\\
&&&\leq\dfrac{1}{4}\\
\end{eqnarray}\)
が \(m\geq3\) のすべてで成り立ちます。
ちなみに、カーマイケル数は必ず、\(p_1\cdot p_2\cdot\cd\cdot p_m\) \((\:m\geq3\:)\) の形をしていることが知られています。上の証明によって、\(n\) がカーマイケル数であったとしても Miller-Rabin の条件を満たす底 \(a\) は 全体の \(\dfrac{1}{4}\) 未満であることが分かります。
以上で、Miller-Rabin の定理が証明されました。
Miller-Rabin の定理を使って、実際に巨大素数を求めてみます。2048 ビットの RSA 暗号で使われる 1024 ビットの素数を求めます。1024 ビットは、\(2^{1023}\) ~ \(2^{1024}-1\) の数です。Python で整数 n が素数かどうかを判定する関数、miller_rabin(n) を次のようにシンプルに実装します。n が素数なら True、合成数なら False を返す関数です。反復回数は 40回とします。
この関数を用いて作ったのは、次のようなプログラムです。
1つの実行例ですが、12個の素数が見つかり、最初に見つかったのは次に示す 308桁の素数でした。実行時間は Google Colaboratry の環境で約 30秒です。
何回か実行してみると、素数の桁数はほとんどが 309桁で、一部が 308桁です。これは \(\mr{log}_{10}2^{1023}\fallingdotseq307.95\) なので、そうなるはずです。また、1万個の n のうちの素数の数は 8~18 個程度となりました。実行結果について「素数定理」と「反復回数」の観点から考察します。
素数定理
数学では、\(x\) 以下の素数の個数を \(\pi(x)\) で表わします。素数定理によると、
\(\pi(x)\sim\dfrac{x}{\mr{log}(x)}\)
です。左辺と右辺をつなぐ \(\sim\) は、
左辺と右辺の比率 \(\longrightarrow\:1\:\:(x\longrightarrow\infty)\)
を意味します。以下、
\(\pi(x)=\dfrac{x}{\mr{log}(x)}\)
と考えて、m ビットの数に含まれる素数の割合を見積もります。m ビットの数の総数は \(2^{m-1}\) 個なので、m ビット数の素数割合は、
ですが、\(\dfrac{m-2}{m-1}\) を \(1\) と見なすと、簡潔に、
素数割合 \(=\dfrac{1}{\mr{log}2\cdot m}\)
です。この式に \(m=1024\) を代入すると、
素数割合 \(\fallingdotseq0.0014\)
となります。つまり、
と言えます。これは上の実験で、1万個の n のうちの素数の数は 8~18 個程度だったことに合致します。
反復回数
プログラムを少々変更して、
何回目の反復(iteration)で素数\(\cdot\)合成数の判定ができたか
を調べると、素数判定のときは当然 iteration = 40 ですが、
合成数判定のときの iteration = 1
であることが分かります(1万個の素数判定をする前提です)。つまり、\(n\) が合成数なら最初の計算で即、合成数と判明します。何回かの反復の後に合成数と判明することは、上の計算では無いのです。
この理由は、\(n\) が合成数だと「\(a\:(1\leq a\leq n-1)\) のなかで Miller-Rabin の条件を満たす底 \(a\) の比率は \(\tfrac{1}{4}\) 以下」という定理の \(\tfrac{1}{4}\) が(一般には)過大評価であることによります。たとえば、\(n\) が2つの異なる素数の積の場合、
\(\begin{eqnarray}
&&\:\:n&=p_1p_2\\
&&\:\:n-1&=2^ek\\
&&\:\:p_1-1&=2^{e_1}k_1\\
&&\:\:p_2-1&=2^{e_2}k_2\\
\end{eqnarray}\)
(\(e,e_1,e_2\geq1,\:\:k,k_1,k_2\) は奇数)
において \(\tfrac{1}{4}\) 以下の主な根拠は、
\(\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\leq k_1k_2\)
でした。ところが、この式で等号が成り立つのは、特に \(n\) が巨大だと、めったにありません。高々 10,000個程度の合成数を判定したとしても、Miller-Rabin の条件を満たす底 \(a\) が現れる確率はほとんどゼロに等しいのです。
ランダムに選んだ数 \(n\) のほとんどは(1024 ビットの数の場合 99.86 % は)合成数です。したがって「合成数を合成数だと速く判定する」のが素数判定アルゴリズムのポイントであり、反復回数をどうするかは全体の速度にそれほど関係ありません。このあたりの事情はフェルマの条件で素数判定をしても同じです。
ただし、フェルマの条件とは違って、ランダムに選んだ底 \(a\) が Miller-Rabin の条件を満たす確率が、\(n\) の値にかかわらず必ず \(\tfrac{1}{4}\) 以下であることが数学的に保証されています。そこが Miller-Rabin の素数判定アルゴリズムの価値なのでした。
今まで「高校数学で理解する・・・」という記事を何回か書きましたが、その中に暗号についての一連の記事があります。
No.310「高校数学で理解するRSA暗号の数理(1)」
No.311「高校数学で理解するRSA暗号の数理(2)」
No.313「高校数学で理解する公開鍵暗号の数理」
No.315「高校数学で理解する楕円曲線暗号の数理(1)」
No.316「高校数学で理解する楕円曲線暗号の数理(2)」
の5つです。これらは公開鍵暗号と、その中でも代表的な RSA暗号、楕円曲線暗号の数学的背景を書いたものです。情報通信をインフラとする現代社会は、この公開鍵暗号がなくては成り立ちません。"数学の社会応用" の典型的な例と言えるでしょう。
これらの暗号では、10進数で数10桁~数100桁の素数が必要です。ないしは、数10桁~数100桁の数が素数かどうかを判定する必要があります。
たとえば、マイナンバー・カードの認証に使われている RSA暗号の公開鍵は 2048ビットで、1024ビットの素数2つを掛け合わせて個人ごとに作られます。1024ビットということは \(2^{1023}\) ~ \(2^{1024}-1\) の数であり、10進では約300桁の巨大数です。素数を生成する式はないので、作るためには1024ビットの数をランダムに選び、それが素数かどうかを実用的な時間で判定する必要があります。
ビットコインのデジタル署名で使われているのは、256ビットの楕円曲線暗号です。この暗号の公開鍵は一般に公開されていますが(暗号の仕組みから個人ごとに作る必要はない)、この公開鍵を設計するときに必要なのは、256ビット=約80桁(10進)の数が素数かどうかを判定することです。
つまり、公開鍵暗号の基礎となっている技術が「素数判定」なのです。そこで今回は、素数判定の方法で一般的な「Miller-Rabin テスト」の数学的背景を書きます。Miller、Rabin は、このテストを考案した数学者2人の名前です。
前提知識
本論に入る前に前提知識について整理します。「高校数学で理解する・・・」というタイトルは「高校までで習う数学の知識だけを前提とする」という意味です。従って、その前提からはずれるものはすべて証明するのが基本方針です。
今回は、以前の「高校数学で理解する・・・」で証明した事項を前提知識とします。
・合同式
・フェルマの小定理
・中国剰余定理
・オイラー関数
・群
です。また、暗号の記事ではありませんが、No.355「高校数学で理解するガロア理論(2)」の次の事項も前提とします。
・剰余群
・既約剰余類群
・巡回群
・群の直積
・群の同型
以下、剰余群以下の事項について、素数判定に関わるところを簡単に復習します。
剰余群
整数の集合を \(Z\) で表し、整数 \(n\) の倍数の集合を \(nZ\) とします。また、
\(\ol{j_n}\)
は、\(\bs{n}\) で割った余りが \(\bs{j}\) である整数の集合とします(剰余類と呼ばれる)。たとえば、\(n=9,\:j=2\) とすると、\(\ol{2_9}\) は「\(9\) で割ったら \(2\) 余る整数の集合」で、
\(\ol{2_9}=\{\:\cd,\:-16,\:-7,\:2,\:11,\:20,\:29,\:\cd\:\}\)
です。剰余群 \(Z/nZ\) とは、
\(Z/nZ=\{\ol{0_n},\:\ol{1_n},\:\cd\:,\:\ol{(n-1)_n}\}\)
で示される「無限集合を元とする有限集合」です。\(n=9\) だと、
\(Z/9Z=\{\ol{0_9},\:\ol{1_9},\:\ol{2_9},\:\ol{3_9},\:\ol{4_9},\:\ol{5_9},\:\ol{6_9},\:\ol{7_9},\:\ol{8_9}\}\)
です。この集合の元の加算 \(+\) を、
\(\ol{i_n}+\ol{j_n}=\ol{(i+j)_n}\)
と定義すると(右辺は整数のたし算)、\(Z/nZ\) はこの演算について群の定義を満たし(=加法群)、この群を剰余群と呼びます。一般に有限群 \(G\) の元の数=群位数を \(|G|\) で表しますが、剰余群の群位数は、
\(|Z/nZ|=n\)
です。以降、剰余類と整数を同一視して、
\(Z/9Z=\{0,\:1,\:2,\:3,\:4,\:5,\:6,\:7,\:8\}\)
というように書きます。従って、\(1\) は 整数の \(1\) を表すことも、また、\(Z/nZ\) の元(= \(n\) で割ると \(1\) 余る数の集合= \(\ol{1_n}\))を表すこともあります。どちらかは文脈で決まります。
既約剰余類群
\(Z/nZ\) の元 \(\{0,\:1,\:\cd\:,\:j,\:\cd\:,\:n-1\}\) から \(\mr{gcd}(j,\:n)=1\) となる元(= \(n\) と素な元)だけを取り出した集合を既約剰余類群といい、\((Z/nZ)^{*}\) で表します。例をあげると、
\(\begin{eqnarray}
&&\:\:(Z/9Z)^{*}&=\{\ol{1_9},\:\ol{2_9},\:\ol{4_9},\:\ol{5_9},\:\ol{7_9},\:\ol{8_9}\}\\
&&&=\{\:1,\:2,\:4,\:5,\:7,\:8\:\}\\
\end{eqnarray}\)
です。この集合の、元と元との乗算 \(\cdot\) を、
\(\ol{i_n}\cdot\ol{j_n}=\ol{(ij)_n}\)
で定義すると(右辺の \(ij\) は整数の乗算)、\((Z/nZ)^{*}\) は乗算を演算とする群になります(=乗法群)。従って、任意の元 \(a\in(Z/nZ)^{*}\) の逆元 \(a^{-1}\) が存在して、
\(a\cdot a^{-1}=1\)
が成り立ちます。つまり乗算と除算が自由にできます。\((Z/9Z)^{*}\) の例では、
\(\begin{eqnarray}
&&\:\:1^{-1}&=1&&\\
&&\:\:2^{-1}&=5, &5^{-1}&=2\\
&&\:\:4^{-1}&=7, &7^{-1}&=4\\
&&\:\:8^{-1}&=8&&\\
\end{eqnarray}\)
です。\((Z/nZ)^{*}\) の群位数は、オイラー関数 \(\varphi\) を使って、
\((Z/nZ)^{*}=\varphi(n)\)
で表されます。\(\varphi(n)\) は「\(n\) 以下で \(n\) とは互いに素な数の個数」です。\(p,\:q\) を異なる素数とすると、
\(\begin{eqnarray}
&&\:\:\varphi(p)&=p-1\\
&&\:\:\varphi(pq)&=(p-1)(q-1)\\
&&\:\:\varphi(p^2)&=p(p-1)\\
\end{eqnarray}\)
などが成り立ちます。
巡回群
\(p\) を奇素数(\(p\neq2\))とすると、既約剰余類群 \((Z/pZ)^{*}\) は生成元 \(g\) をもちます。つまり、
\((Z/pZ)^{*}=\{\:g,\:g^2,\:g^,\:\cd\:,\:g^{p-1}=1\:\}\)
と表され、群位数は \(\varphi(p)=p-1\) です。このように、一つの生成元の累乗で全ての元が表せる群を巡回群と言います(\(1\) の次は再び \(g\) になって巡回する)。また、\(n\) が \(p\) の累乗、\(n=p^{\al}\:(\al\geq2)\) のときも \((Z/p^{\al}Z)^{*}\) は生成元をもつ巡回群です。\(\al=2\) のときの群位数は、
\(|(Z/p^2Z)^{*}|=\varphi(p^2)=p(p-1)\)
です。\((Z/9Z)^{*}\) の場合、群位数は \(\varphi(9)=6\) で、\(g=2\) と \(g=5\) が生成元になり、
\(\begin{eqnarray}
&&\:\:(Z/9Z)^{*}&=\{2,\:2^2=4,\:2^3=8,\:2^4=7,\:2^5=5,\:2^6=1\}\\
&&&=\{5,\:5^2=7,\:5^3=8,\:5^4=4,\:5^5=2,\:5^6=1\}\\
\end{eqnarray}\)
などと表せます。\(1,\:4,\:7,\:8\) は生成元ではありません。
群の直積、群の同型
\(G\) と \(H\) を有限群とし、その元を \(g_i\in G,\:h_j\in H\) として、2つの元のペア、
\((g_i,\:h_j)\) \((1\leq i\leq|G|,\:1\leq j\leq|H|)\)
を作るとき、すべてのペアを元とする集合を「群の直積」と言い、\(G\times H\) で表します。元と元の演算を \(g_i\) と \(h_i\) で個別に行うことで、直積も群になります。その群位数は、
\(|G\times H|=|G|\cdot|H|\)
です。
中国剰余定理によると、\(m,\:n\) が互いに素のとき、
\(x\equiv a\:\:(\mr{mod}\:m)\)
\(x\equiv b\:\:(\mr{mod}\:n)\)
の連立合同方程式は、\(mn\) を法として唯一の解を持ちます。\(x\) を \(m\) で割った余りを \(x_m\)、\(n\) で割った余りを \(x_n\) とし、
\(f\::\:x\:\longrightarrow\:(x_m,\:x_n)\)
の写像 \(f\) を定義すると、中国剰余定理によって \(f\) は1対1写像であり、かつ、
\(\begin{eqnarray}
&&\:\:f(xy)&=((xy)_m,\:\:(xy)_n)\\
&&&=((x_m\cdot y_m)_m,\:\:(x_n\cdot y_n)_n)\\
\end{eqnarray}\)
\(\begin{eqnarray}
&&\:\:f(x)f(y)&=(x_m,\:x_n)\:(y_m,\:y_n)\\
&&&=((x_m\cdot y_m)_m,\:\:(x_n\cdot y_n)_n)\\
\end{eqnarray}\)
なので、
\(f(xy)=f(x)f(y)\)
が成り立ちます。また同様に \(f(x+y)=f(x)+f(y)\) であり、\(f\) は演算を保存する同型写像です。従って、剰余群 \(Z/mnZ\) は、2つの群の直積との間で "群の同型" が成り立ち、
\(Z/mnZ\cong Z/mZ\times Z/nZ\)
です(=中国剰余定理の群による表現)。また 既約剰余類群 \((Z/mnZ)^{*}\) は、
\((Z/mnZ)^{*}\cong(Z/mZ)^{*}\times(Z/nZ)^{*}\)
と直積で表現できます。\(m,\:n\) がともに奇素数で \(m=p,\:n=q\:(\neq p)\)だと、
\((Z/pqZ)^{*}\cong(Z/pZ)^{*}\times(Z/qZ)^{*}\)
です。\((Z/pqZ)^{*}\) は巡回群でありませんが、2つの巡回群の直積で表現できることになります。
以上を前提として「Miller-Rabin テスト」のことを書きますが、これは「確率的素数判定アルゴリズム」の一種です。
確率的素数判定アルゴリズム |
「Miller-Rabin テスト」は「フェルマ・テスト」の発展形と言えるものです。そこでまず、「フェルマ・テスト」の原理になっている「フェルマの小定理」から始めます。
フェルマの小定理
素数がもつ重要な性質を示したのが、フェルマの小定理です。
フェルマの小定理 \(p\) を素数とすると、\(p\) と素な \(a\) について、 \(a^{p-1}\equiv1\:\:(\mr{mod}\:p)\) が成り立つ。 |
この定理の \(a\) を、指数関数の「底(base)」と呼びます。偶数の素数は \(2\) しかないので、以降、\(\bs{n}\) は \(\bs{3}\) 以上の奇数として素数判定を考えます。フェルマの小定理を素数判定用に少々言い換えると、次のように表現できます。
フェルマの小定理 \(n\) を \(3\) 以上の奇数とする。\(\bs{n}\) が素数であれば、\(\bs{1\leq a\leq n-1}\) であるすべての \(\bs{a}\) について、次の "フェルマの条件" が成り立つ。 フェルマの条件 \(a^{n-1}\equiv1\:\:(\mr{mod}\:n)\) |
このフェルマの小定理の対偶は次のようになります。
フェルマの小定理の対偶 \(n\) が \(3\) 以上の奇数であるとき、\(\bs{1\leq a\leq n-1}\) であるどれか一つの \(\bs{a}\) について、 \(a^{n-1}\not\equiv1\:\:(\mr{mod}\:n)\) であれば(=フェルマの条件に反すれば)\(\bs{n}\) は合成数である。 |
\(n\) が \(3\) 以上の奇数の合成数のとき、\(1\leq a\leq n-1\) について、
\(a^{n-1}\equiv1\:\:(\mr{mod}\:n)\)
\(a^{n-1}\not\equiv1\:\:(\mr{mod}\:n)\)
のどちらになるのか、\(a\) ごとに検討してみます。もちろん \(a=1\) なら \(a^{n-1}\equiv1\:\:(\mr{mod}\:n)\) です。また、\(a=n-1\:(=-1)\) でも、\(n-1\) が偶数なので、 \(a^{n-1}\equiv1\:\:(\mr{mod}\:n)\) です。
また、\(a\) が \(n\) と互いに素でないとき、つまり \(\mr{gcd}(n,\:a)\neq1\) ときは \(a^{n-1}\not\equiv1\:\:(\mr{mod}\:n)\) です。なぜなら、\(a\) と \(n\) の最大公約数を \(d\:(\neq1)\) として、もし \(a^{n-1}\equiv1\:\:(\mr{mod}\:n)\) だとすると、
\(a^{n-1}=k\cdot n+1\:\:(k\) は整数\()\)
と表わせますが、
左辺について \(d\mid a^{n-1}\)
右辺について \(d\nmid(k\cdot n+1)\)
となってしまい、矛盾するからです。
\(a\neq1,\:n-1\)、 \(\mr{gcd}(n,\:a)=1\) のときにどうなるかは、\(a\) によって両方がありえます。ためにしに、\(n=21\) で計算してみると、
\(1\) | \(1\) |
\(2\) | \(4\) |
\(3\) | \(9\) |
\(4\) | \(16\) |
\(5\) | \(4\) |
\(6\) | \(15\) |
\(7\) | \(7\) |
\(8\) | \(1\) |
\(9\) | \(18\) |
\(10\) | \(16\) |
\(11\) | \(16\) |
\(12\) | \(18\) |
\(13\) | \(1\) |
\(14\) | \(7\) |
\(15\) | \(15\) |
\(16\) | \(4\) |
\(17\) | \(16\) |
\(18\) | \(9\) |
\(19\) | \(4\) |
\(20\) | \(1\) |
となります。色を塗った10個が \(a\neq1,\:n-1\)、 \(\mr{gcd}(n,\:a)=1\) のところですが、\(\equiv1\) \((a=8,\:13)\) と \(\not\equiv1\)(それ以外の8個)があることがわかります。とにかく、上の表で一つでも \(\bs{\not\equiv1}\) があれば、\(n\) は合成数だと判断できます。
このフェルマの小定理の対偶を利用して、巨大整数(数10桁~数100桁) \(n\) が素数かどうかを確率的に判定できます。つまり、\(1\leq a\leq n-1\) である数をランダムに、順々に選び、ある \(a\) がフェルマの条件に反すれば、その時点で \(n\) は合成数と判定します。何回か試行してすべての \(a\) がフェルマの条件に合致するなら(=合成数だと判定できなければ)、\(n\) は素数の可能性が高い。
しかし困ったことに「合成数でありながら、多数の \(\bs{a}\) でフェルマの条件を満たしてしまう \(\bs{n}\)」が存在します。"カーマイケル数" です。最小のカーマイケル数は \(561=3\cdot11\cdot17\) ですが、\(\mr{gcd}(561,\:a)=1\) であるすべての \(a\:\:(1\leq a\leq560)\) で、
\(a^{560}\equiv1\:\:(\mr{mod}\:561)\)
が成り立ちます。その理由ですが、\(a\) を \(3,\:11,\:17\) のすべてと素な任意の数(= \(561\) と素な任意の数)とすると、フェルマの小定理より、
\(\begin{eqnarray}
&&\:\:a^{2}&\equiv1\:\:(\mr{mod}\:3)\\
&&\:\:a^{10}&\equiv1\:\:(\mr{mod}\:11)\\
&&\:\:a^{16}&\equiv1\:\:(\mr{mod}\:17)\\
\end{eqnarray}\)
が成り立ちます。\(560\) は、\(2,\:10,\:16\) 全部の倍数なので、それぞれの合同式の両辺を適切に累乗すると、
\(a^{560}\equiv1\:\:(\mr{mod}\:3)\)
\(a^{560}\equiv1\:\:(\mr{mod}\:11)\)
\(a^{560}\equiv1\:\:(\mr{mod}\:17)\)
が成り立つ。そうすると、中国剰余定理により、
\(a^{560}\equiv1\:\:(\mr{mod}\:3\cdot11\cdot17)\)
が成り立ちます。\(560\) 以下で \(561\) と素な数の個数は、オイラー関数 \(\varphi(n)\)(= \(n\) 以下で \(n\) と素な数の個数)を使うと、
\(\begin{eqnarray}
&&\:\:\varphi(561)&=\varphi(3)\varphi(11)\varphi(17)\\
&&&=2\cdot10\cdot16=320\\
\end{eqnarray}\)
なので、\(\dfrac{320}{560}=\dfrac{4}{7}\)、つまり半数以上の \(a\) でフェルマの条件が満たされることになります。これを一般的に言うと、カーマイケル数 \(c\) が3個の素数 \(p,\:q,\:r\) の積の場合、
\(\begin{eqnarray}
&&\:\:c&=pqr\\
&&\:\:\varphi(c)&=(p-1)(q-1)(r-1)\\
\end{eqnarray}\)
なので、この2つの比は、\(p,\:q,\:r\) が大きくなると \(1\) に近づきます。それは、ほとんど全ての \(a\:\:(1\leq a\leq c-1)\) がフェルマの条件を満たすことを意味します。
カーマイケル数は、特に \(n\) が巨大だと極めて希です。Wikipedia によると、「\(1\) から \(10^{21}\) の間には \(20,138,200\) 個のカーマイケル数があり、これはおよそ \(5\cdot10^{13}\) 個にひとつの割合」だそうです。しかし、カーマイケル数が無限個あることも証明されています。\(n\) が "運悪く" カーマイケル数だと、フェルマ\(\cdot\)テストでは素数と判定されてしまう。つまり、フェルマの条件を使って素数を確率的に判定するアルゴリズムには問題があるわけです。
Miller-Rabin の条件
そこで、素数の条件として、フェルマの条件とは別のものを考えます。フェルマの条件、
\(a^{n-1}\equiv1\:\:(\mr{mod}\:n)\)
において、\(n\) が素数とすると、\(n-1\) は偶数です。そこで、
\(n-1=2^ek\) (\(e\geq1,\:k\) は奇数)
と表します。この表記を用いて、\(a^{n-1}-1\) という式を因数分解すると、
\(\begin{eqnarray}
&&\:\:a^{n-1}-1&=a^{2^ek}-1\\
&&&=(a^{2^{e-1}k})^2-1\\
&&&=(a^{2^{e-1}k}+1)(a^{2^{e-1}k}-1)\\
&&&=(a^{2^{e-1}k}+1)((a^{2^{e-2}k})^2-1)\\
&&&=(a^{2^{e-1}k}+1)(a^{2^{e-2}k}+1)(a^{2^{e-2}k}-1)\\
&&& \vdots\\
\end{eqnarray}\)
と続きます。結局、因数分解は、
\(a^{n-1}-1=\) | \((a^{2^{e-1}k}\) | \(+1)\cdot\) | ||
\((a^{2^{e-2}k}\) | \(+1)\cdot\) | |||
\((a^{2^{e-3}k}\) | \(+1)\cdot\) | |||
\(\vdots\) | ||||
\((a^{2^2k}\) | \(+1)\cdot\) | |||
\((a^{2k}\) | \(+1)\cdot\) | |||
\((a^k\) | \(+1)\cdot(a^k-1)\) | \((\br{A})\) |
となります。これを \((\br{A})\) 式とします。\(n\) が素数のときは、フェルマの条件を変形すると、
\(a^{n-1}-1\equiv0\:\:(\mr{mod}\:n)\)
なので、フェルマの条件と等価な式は、
\((\br{A})\) 式の右辺 \(\equiv0\:\:(\mr{mod}\:n)\)
であり、ということは、
\((\br{A})\) 式の右辺の少なくとも1つの項 \(\equiv0\:\:(\mr{mod}\:n)\) |
が成立します。\(\bs{n}\) が素数であるのがポイントです。\(n\) が合成数ならこんなことは言えません。このことより、\(n\) が素数であるための新たな条件が導けます。次項です。
素数の条件(Miller-Rabin)
\(n\) を \(3\) 以上の奇数とし、 \(n-1=2^ek\) (\(e\geq1,\:k\) は奇数) と表されているものとする。このとき、\(\bs{n}\) が素数であれば、\(\bs{1\leq a\leq n-1}\) であるすべての \(\bs{a}\) について、次の Miller-Rabin の条件が成り立つ。 Miller-Rabin の条件 (1) \(a^k\equiv1\:\:(\mr{mod}\:n)\) もしくは (2) ある \(r\:(0\leq r\leq e-1)\) について、 \(a^{2^rk}\equiv-1\:\:(\mr{mod}\:n)\) |
\(a^{2^ik}\:\:(0\leq i\leq e-1)\) の \(e\) 個の数列を Miller-Rabin 系列と呼ぶことにします。
\(a^k,\:a^{2k},\:a^{4k},\:\cd\:,\:a^{2^{e-1}k}\)
です。この系列は、ある項の2乗が次の項になっています。従って \(\mr{mod}\:n\) でみて \(a^{2^rk}\equiv-1\) になれば、以降の項はすべて \(\equiv1\:(\mr{mod}\:n)\) になります。ということは、系列の中で \(\equiv-1\) となる項は「全く無い」か「一つだけある」のどちらかです。
ちなみに、Miller-Rabin による素数の条件の対偶は次の通りです。これを利用して合成数の判定ができます。
合成数の判定(対偶) \(n\) を \(3\) 以上の奇数とし、 \(n-1=2^ek\) (\(e\geq1,\:k\) は奇数) と表されているものとする。このとき、\(\bs{1\leq a\leq n-1}\) のある \(\bs{a}\) について、 (1) \(a^k\not\equiv1\:\:(\mr{mod}\:n)\) かつ (2) すべての \(r\:(0\leq r\leq e-1)\) について、 \(a^{2^rk}\not\equiv-1\:\:(\mr{mod}\:n)\) が成り立てば、\(n\) は合成数である。 |
\(\bs{n}\) が素数であれば、フェルマーの条件と Miller-Rabin の条件は等価です。しかし、\(n\) が合成数のときは、フェルマの条件と Miller-Rabin の条件の意味が違ってきます。それが次です。
\(n\) が合成数のとき
\(n\) が合成数のときは、フェルマの条件から Miller-Rabin の条件を導くことはできません。なぜなら「\(n\)が素数」が導出のキーだからです。つまり、
フェルマの条件を満たす底 \(a\) の集合を \(F\) | |
Miller-Rabin の条件を満たす底 \(a\) の集合を \(M\) |
とすると、\(a\in F\) であっても \(a\in M\) とは限らない。しかし、\((\br{A})\) 式でわかるように \(a\in M\) なら必ず \(a\in F\) です。従って、
\(M\:\subset\:F\)
です。ということは、数 \(a\) についてのフェルマーの条件によって \(n\) が合成数だと判定できなくても(つまり \(a\in F\))、Miller-Rabin の条件で合成数と判定できる(つまり \(a\notin M\))可能性があることになります。つまり合成数の判定においては、Miller-Rabin の条件はフェルマーの条件より厳格です。
しかも Miller-Rabin の条件は、合成数を合成数だと判定できる確率(ないしは判定できない確率)が、\(\bs{n}\) の値にかかわらず示せるのです。それが次の定理です。
Miller-Rabin の定理
Miller-Rabin の定理 \(n\) を \(3\) 以上の奇数の合成数とする。また、\(n-1=2^ek\:\:(e\geq1,\:k\) は奇数\()\) と表されているものとする。このとき、 Miller-Rabin の条件 (1) \(a^k\equiv1\:\:(\mr{mod}\:n)\) もしくは (2) ある \(r\:(0\leq r\leq e-1)\) について、 \(a^{2^rk}\equiv-1\:\:(\mr{mod}\:n)\) を満たす底 \(a\:(1\leq a\leq n-1)\) は、\(\bs{n-1}\) 個のうちの \(\bs{1/4}\) 以下である。 |
\(\bs{n}\) がいかなる数であっても成り立つのがポイントです。実際に計算をしてみます。\(n\) を \(9\leq n < 10000\) である奇数の合成数とします。調べてみると、その総数は \(3771\)個です。そして、
\(L=\)Miller-Rabin の条件を満たす底 \(a\) の個数
\(P=\dfrac{L}{n-1}\)
\(P=\dfrac{L}{n-1}\)
とし、\(3771\)個の \(n\) のうち \(P\geq0.2\) のものをリストアップすると、次の5つだけです。
\(9\) | \(3\) | \(1\) | \(2\) | \(0.25\) |
\(91\) | \(1\) | \(45\) | \(18\) | \(0.20\) |
\(703\) | \(1\) | \(351\) | \(162\) | \(0.23\) |
\(1891\) | \(1\) | \(945\) | \(450\) | \(0.24\) |
\(8911\) | \(1\) | \(4455\) | \(1782\) | \(0.20\) |
\(n=9\) のとき、\(P\) は最大値の \(0.25\) です。それ以降、\(n=1891\) のときに \(P\fallingdotseq0.24\) となりますが、\(0.25\) を越える \(n\) は( \(9\leq n < 10000\) では)無いことがわかります。そしてこの定理は、\(\bs{n}\) がいかなる奇数の合成数であっても \(\bs{P\leq0.25}\) と主張しているわけです。
これでまず言えることは、Miller-Rabin の条件にとっての「カーマイケル数のような数」はあり得ないことです。
さらにこの定理によって、素数判定の信頼度を示すことができます。比喩で言うと次のとおりです。
正方形の、中が見えない箱があり、玉が \(100\)個入っています。箱は「素数箱」と「合成数箱」の区別がありますが、そのどちらかは見た目で判別できません。ただし、素数箱なら\(100\)個の白玉が入っていて、合成数箱なら \(25\)個の白玉と \(75\)個の赤玉が入っています。 | |
箱の上面には穴があって、そこから手を入れて玉を取り出し、色を確認した後、玉を箱に戻す(そしてかき混ぜる)ことができます。この確認は繰り返しができて、その繰り返しで、箱が素数箱か合成数箱かを判断します。 | |
最初に取り出した玉が赤玉なら、箱は合成数箱だとわかります。しかし白玉だと、素数箱の可能性が高いものの、断言はできない。合成数箱でも白玉を取り出す確率が \(1/4\) あるからです。従って2回目の確認をします。 | |
2回続けて白だと、素数箱である可能性がぐんと高まります。もしそれが合成数箱だとすると、2回続けて白の確率は \(1/16\) しかないからです。もちろん2回目が赤だと合成数箱です。 | |
このようにして、赤が出ればその時点で合成数箱と判断し、白が出続ければ確認を繰り返します。もし合成数箱だとすると、白が5回出続ける確率は \(1/1024\) であり、以降、どんどん減っていくので、ある回数で打ち切って素数箱と判断します。 |
以上の考え方で \(n\) の素数判定をするアルゴリズムが次です。
Miller-Rabin の素数判定アルゴリズム
|
\(r=40\) だとすると、Miller-Rabin の素数判定アルゴリズムで「素数と判定したにもかかわらず実は合成数」の確率は、
\(\dfrac{1}{4^{40}}\) 以下
であることが保証されます。\(4^{40}\) は、\(\fallingdotseq\:1.2\times10^{24}\) で、\(10\)進数で\(25\)桁の数です。あまりに巨大すぎて想像するのは難しいのですが、たとえば、1秒の \(100\)万分の \(1\) の時間は \(1\) マイクロ秒で、\(1\) 秒間に地球を \(7.5\)周する光が \(300\)メートルしか進まない時間です。一方、宇宙の年齢は \(138\)億年程度と言われています。この宇宙の年齢をマイクロ秒で表すと、\(4.4\times10^{23}\) マイクロ秒です。ということは、\(4^{40}\) はその3倍近い数字です。
\(\dfrac{1}{4^{40}}\) は、数学的には \(0\) ではありませんが、確率としては実用的に \(0\) です。以上が Miller-Rabin の素数判定の原理です。
以降、 なぜ \(\dfrac{1}{4}\) 以下であると言えるのか、その証明をします。
Miller-Rabin の定理の証明 |
定理を再度述べると次の通りです。
Miller-Rabin の定理(再掲) \(n\) を \(3\) 以上の奇数の合成数とする。また、\(n-1=2^ek\:\:(e\geq1,\:k\) は奇数\()\) と表されているものとする。このとき、 Miller-Rabin の条件 (1) \(a^k\equiv1\:\:(\mr{mod}\:n)\) もしくは (2) ある \(r\:(0\leq r\leq e-1)\) について、 \(a^{2^rk}\equiv-1\:\:(\mr{mod}\:n)\) を満たす \(a\:(1\leq a\leq n-1)\) は、\(n-1\) 個のうちの \(1/4\) 以下である。 |
3つのケースにわけて証明します。以降の証明は、後藤・鈴木(首都大学東京)「Miller-Rabin素数判定法における誤り確率の上限」を参考にしました。
\(n=p^2t\:\:(p\)は奇素数。\(t\geq1\) は奇数\()\)と表されるとき
\(n\) が奇素数の2乗で割り切れるときです。このことを、\(n\) が「平方因子」をもつ、と言います。\(t\) の素因数分解に \(p\) が現れてもかまいません。平方因子が複数個ある場合は、そのどれかを \(p\) とします。
| |
\(n=p_1\cdot p_2\:(p_1,\:p_2\) は奇素数で \(p_1\neq p_2)\) | |
\(n=p_1\cdot p_2\cdot\cd\cdot p_m\:(m\geq3\) 個の相異なる奇素数の積\()\) |
② ③ のケースは \(n\) が平方因子を持たないので ① と排他的であり、また ② と ③ も排他的です。いずれの場合も \(n\) が奇数なので、素因数に \(2\) は現れません。以降の3つのケースに分けた証明では、\(p\) を素数としたとき既約剰余類群 \((Z/pZ)^{*}\) 、\((Z/p^2Z)^{*}\) が巡回群であることを利用します。
1. \(n=p^2t\:\:(\:p\)は奇素数。\(t\geq1\) は奇数\()\)
Miller-Rabin の条件を満たす \(a\:(0\leq a\leq n-1)\) の集合を \(M\) とします。上で説明したように、\(n\) が合成数であったとしても Miller-Rabin の条件が成立すればフェルマの条件も成立します(\(n\) が合成数だとその逆は成り立たない)。従って、
\(a^{n-1}\equiv1\:\:(\mr{mod}\:n)\)
が成り立ちます。このフェルマの条件を満たす \(a\:(1\leq a\leq n-1)\) の集合を \(F\) とすると、\(M\:\subset\:F\) なので元の数は、
\(|M|\leq|F|\)
です。さらに、\(p^2\mid n\)(= \(p^2\) が \(n\) を割り切る)なので、
\(a^{n-1}\equiv1\:\:(\mr{mod}\:p^2)\)
\((\br{B})\)
も同時に成り立ちます。\((\br{B})\) 式を満たす \(a\:(1\leq a\leq n-1)\) の集合を \(R_1\) とすると、\(a\in F\) なら \(a\in R_1\) なので、
\(\begin{eqnarray}
&&\:\:F&\subset R_1\\
&&\:\:|F|&\leq|R_1|\\
\end{eqnarray}\)
が成り立ちます。\(|M|\leq|F|\) とあわせると、
\(|M|\leq|R_1|\)
です。次に、剰余群 \(Z/p^2Z\) の元 で \((\br{B})\) 式を満たす \(a\:(0\leq a\leq p^2-1)\) の集合を \(R_2\) とします。\(x\in R_2\) だとすると、\(\mr{mod}\:p^2\) では、
\(\begin{eqnarray}
&&\:\:x&=x+p^2\\
&&&=x+2p^2\\
&&& \vdots\\
&&&=x+(t-1)p^2\leq p^2t-1\\
\end{eqnarray}\)
です。つまり、\((\br{B})\) 式を満たす \(Z/p^2Z\) の元1個に対して、\((\br{B})\) 式を満たす、\(0\leq a\leq n-1\:(p^2t-1)\) の \(t\)個の数が対応します。従って、
\(t|R_2|=|R_1|\)
です。\(|M|\leq|R_1|\) とあわせると、
\(|M|\leq t|R_2|\)
です。
剰余群 \(Z/p^2Z\) の元で \((\br{B})\) 式を満たすのは、\(p^2\) と互いに素な元だけです。つまり、既約剰余類群 \((Z/p^2Z)^{*}\) の元で \((\br{B})\) 式を満たすものの集合が \(R_2\) であるとも言えます。以降、 \((Z/p^2Z)^{*}\) を使って \(R_2\) の元の数、\(|R_2|\) を見積もります。それには \((Z/p^2Z)^{*}\) が巡回群であることを利用します。
一般に、巡回群においては次が成り立ちます。この定理を \((\br{C})\) とします。
巡回群 \(G\)(群位数 \(d\))において、\(x^m=1\) を満たす \(x\) の個数は \(\mr{gcd}(m,\:d)\) 個である。
\((\br{C})\) |
【証明】
\(h=\mr{gcd}(m,\:d)\) とおく。位数 \(d\) の巡回群 \(G\) は、生成元 \(g\) を用いて、
\(G=\{g,\:g^2,\:g^3,\:\cd\:,\:g^{d-1},\:g^d=1\}\)
と表現できる。そこで \(x=g^i\:\:(1\leq i\leq d)\) と表すと、
\(\begin{eqnarray}
&&\:\:(g^i)^m&=1\\
&&\:\:g^{im}&=1\\
\end{eqnarray}\)
なので、\(im\) は群位数 \(d\) の整数倍である。つまり、
\(d\mid im\)
である。\(h=\mr{gcd}(m,\:d)\) として \(d\,'=\dfrac{d}{h}\) \(m\,'=\dfrac{m}{h}\) とおくと、
\(d\,'\mid im\,'\)
になるが、\(d\,'\) と \(m\,'\) は互いに素なので、
\(d\,'\mid i\)
である。つまり \(i\) は \(d\,'=\dfrac{d}{h}\) の倍数である。従って、\(1\leq i\leq d\) であることを考慮すると、
\(i=\dfrac{d}{h}\cdot j\:\:(1\leq j\leq h)\)
と表せる。つまり、\(x^m=1\) を満たす \(x\) の個数は \(h=\mr{gcd}(m,\:d)\) 個である。【証明終】
既約剰余類群 \((Z/p^2Z)^{*}\) は巡回群であり、群位数は\(\varphi(p^2)=p(p-1)\) です。従って、\((Z/p^2Z)^{*}\) の元で \(a^{n-1}=1\) を満たす元の数(\(=|R_2|\))は定理 \((\br{C})\) により、
\(\begin{eqnarray}
&&\:\:|R_2|&=\mr{gcd}(p(p-1),\:n-1)\\
&&&=\mr{gcd}(p(p-1),\:p^2t-1)\\
\end{eqnarray}\)
となります。ここで、\(p^2t-1\) は \(p\) で割り切れないので、
\(\mr{gcd}(p(p-1),\:p^2t-1)=\mr{gcd}(p-1,\:p^2t-1)\)
ですが、この式の右辺は \(p-1\) 以下です。従って、
\(|R_2|\leq p-1\)
です。\(|M|\leq t|R_2|\) とあわせると、
\(|M|\leq t(p-1)\)
が得られました。従って、\(1\leq a\leq n-1\) のなかで Miller-Rabin の条件を満たす数の比率は、
\(\begin{eqnarray}
&&\:\:\dfrac{|M|}{n-1}&\leq\dfrac{t(p-1)}{tp^2-1}\\
&&&=\dfrac{p-1}{p^2-\dfrac{1}{t}}\\
\end{eqnarray}\)
となります。定義によって \(t\geq1,\:p\geq3\) ですが、上式の右辺は \(t\) についても \(p\) についても単調減少です。従って右辺の最大値は \(t=1,\:p=3\) のときで、
\(\dfrac{t(p-1)}{tp^2-1}\leq\dfrac{1}{4}\)
です。結論として、
\(\dfrac{|M|}{n-1}\leq\dfrac{1}{4}\)
となり、\(1\leq a\leq n-1\) のなかで Miller-Rabin の条件を満たす数の比率は \(\dfrac{1}{4}\) 未満であることが証明されました。
ちなみに、この証明はフェルマの条件しか使っていません。つまり、
\(n\) が平方因子をもつなら、\(1\leq a\leq n-1\) のなかでフェルマの条件を満たす数の比率は \(\tfrac{1}{4}\) 未満
と言えます。ということは、平方因子をもつ数はカーマイケル数にはなりえないことが分かります。
2. \(n=p_1\cdot p_2\:(\:p_1,\:p_2\) は奇素数で \(p_1\neq p_2\:)\)
Miller-Rabin の定理を再掲します。
Miller-Rabin の定理(再掲) \(n\) を \(3\) 以上の奇数の合成数とする。また、\(n-1=2^ek\:\:(e\geq1,\:k\) は奇数\()\) と表されているものとする。このとき、 Miller-Rabin の条件 (1) \(a^k\equiv1\:\:(\mr{mod}\:n)\) もしくは (2) ある \(r\:(0\leq r\leq e-1)\) について、 \(a^{2^rk}\equiv-1\:\:(\mr{mod}\:n)\) を満たす \(a\:(1\leq a\leq n-1)\) は、\(n-1\) 個のうちの \(1/4\) 以下である。 |
証明のポイントは2つあります。(2) の条件に関する Miller-Rabin 系列、
\(a^k,\:a^{2k},\:\:a^{4k},\:\cd\:,\:a^{(e-1)k}\)
を考えると、ある項の2乗が次の項なので、\(a^{2^rk}\equiv-1\:\:(\mr{mod}\:n)\) となる項があれば、それ以降の項は全て \(\equiv1\) となります。つまり、\(a^{2^rk}\equiv-1\) となる項は1つしかありません。従って、\(r\) を一つ決めたときに \(a^{2^rk}\equiv-1\) を満たす \(a\) の集合を \(A_2(r)\) とし、(2) を満たすすべての \(a\) の集合を \(A_2\) とすると、
\(|A_2|=\displaystyle\sum_{r=0}^{e-1}|A_2(r)|\)
が成り立ちます。さらに (1) の条件を満たす \(a\) の集合を \(A_1\) とすると、(1) と (2) は排他的です。従って、Miller-Rabin の条件を満たす \(a\) の集合を \(M\) とすると、
\(\begin{eqnarray}
&&\:\:|M|&=|A_1|+|A_2|\\
&&&=|A_1|+\displaystyle\sum_{r=0}^{e-1}|A_2(r)|\\
\end{eqnarray}\)
です。このことを以下の証明で利用します。もう一つの証明のポイントは、「1.\(\bs{n=p^2t\:\:(\:p}\) は奇素数。\(\bs{t\geq1}\) は奇数\(\bs{)}\)」での証明と同じように、巡回群の性質を利用することです。
まず前提として、Miller-Rabin の条件を満たす \(a\:(0\leq a\leq n-1)\) は、フェルマの条件、\(a^{n-1}\equiv1\:\:(\mr{mod}\:n)\) も満たしますが、これが成り立つ \(a\) は \(n\) とは素です。従って、既約剰余類群 \((Z/nZ)^{*}\:=\:(Z/p_1p_2Z)^{*}\) の範囲で \(a\) の個数を検討します。
もちろん、\(p_1\neq p_2\) なので、既約剰余類群 \((Z/p_1p_2Z)^{*}\) は巡回群ではありません。しかし \(p_1,\:p_2\) が互いに素なので、\((Z/p_1p_2Z)^{*}\) は2つの既約剰余類群の直積と同型であり、
\((Z/p_1p_2Z)^{*}\cong(Z/p_1Z)^{*}\times(Z/p_2Z)^{*}\)
と表せます。つまり、\(a\in(Z/p_1p_2Z)^{*}\) とし、
\(a\) を \(p_1\) で割った余りを \(a_{p_1}\)
\(a\) を \(p_2\) で割った余りを \(a_{p_2}\)
と書くと、\(a_{p_1}\in(Z/p_1Z)^{*},\:\:a_{p_2}\in(Z/p_2Z)^{*}\) ですが、ここで、
\(f\::\:a\:\longrightarrow\:(a_{p_1},\:a_{p_2})\)
の写像を定義すると、この写像は1対1(全単射)で、同型写像であり、上の「直積と同型」の式が成り立ちます。同型写像は \(f(xy)=f(x)f(y)\) というように演算を保存するので、演算してから写像した結果と写像してから演算した結果は同じです。
また、この \((Z/p_1Z)^{*}\) と \((Z/p_2Z)^{*}\) は、\(p_1\) と \(p_2\) が素数なので、生成元をもつ巡回群です。それぞれの群位数は、
\(\begin{eqnarray}
&&\:\:|(Z/p_1p_2Z)^{*}|&=\varphi(p_1p_2)\\
&&&=(p_1-1)(p_2-1)\\
\end{eqnarray}\)
\(|(Z/p_1Z)^{*}|=\varphi(p_1)=p_1-1\)
\(|(Z/p_2Z)^{*}|=\varphi(p_2)=p_2-1\)
であり、
\(|(Z/p_1p_2Z)^{*}|=|(Z/p_1Z)^{*}|\cdot|(Z/p_2Z)^{*}|\)
が成り立ちます。ここで \((Z/p_1Z)^{*}\) の任意の部分集合を \(H_1\)、\((Z/p_2Z)^{*}\) の任意の部分集合を \(H_2\) とします。
\(H_1\subset(Z/p_1Z)^{*}\)
\(H_2\subset(Z/p_2Z)^{*}\)
です。\((Z/p_1p_2Z)^{*}\) の元 \(a\) で、
\(a_{p_1}\in H_1\)
\(a_{p_2}\in H_2\)
となる \(a\) を考え、このような \(a\) の集合を \(H\) と書くと、
\(f\::\:a\:\longrightarrow\:(a_{p_1},\:\:a_{p_2})\)
の写像は1対1対応であり(=中国剰余定理)、集合の元の数については、
\(|H|=|H_1|\cdot|H_2|\)
が成り立ちます。
以上を踏まえて証明に進みます。一般に、
\(x\equiv y\:\:(\mr{mod}\:p_1p_2)\) なら
\(x\equiv y\:\:(\mr{mod}\:p_1)\) かつ \(x\equiv y\:\:(\mr{mod}\:p_2)\)
が言えます。また、\(p_1\) と \(p_2\) は互いに素なので、
\(x\equiv y\:\:(\mr{mod}\:p_1)\) かつ \(x\equiv y\:\:(\mr{mod}\:p_2)\) なら
\(x\equiv y\:\:(\mr{mod}\:p_1p_2)\)
も言えます。なぜなら、\(p_1\mid(x-y)\) かつ \(p_2\mid(x-y)\) なら、\(p_1p_2\mid(x-y)\) だからです。つまり、
\(x\equiv y\:\:(\mr{mod}\:p_1p_2)\)
\(x\equiv y\:\:(\mr{mod}\:p_1)\) かつ \(x\equiv y\:\:(\mr{mod}\:p_2)\)
の2つは、\(p_1,\:p_2\) が素数という前提では等価です。従って、Miller-Rabin の条件は次のように言い換えることができます。
\(n=p_1p_2,\:\:n-1=2^ek\) とするとき、 Miller-Rabin の条件(言い換え) (1) (1a) \(a^k\equiv1\:\:(\mr{mod}\:p_1)\) かつ (1b) \(a^k\equiv1\:\:(\mr{mod}\:p_2)\) もしくは、 (2) ある \(r\:(0\leq r\leq e-1)\) について、 (2a) \(a^{2^rk}\equiv-1\:\:(\mr{mod}\:p_1)\) かつ (2b) \(a^{2^rk}\equiv-1\:\:(\mr{mod}\:p_2)\) が成り立つ。 |
このように言い換えて、\((Z/p_1p_2Z)^{*}\) での問題を、\((Z/p_1Z)^{*}\) と \((Z/p_2Z)^{*}\) の問題に置き換えます。Miller-Rabin の条件を満たす、
\((Z/p_1p_2Z)^{*}\) | の部分集合を \(M\) | |
\((Z/p_1Z)^{*}\) | の部分集合を \(M_1\) | |
\((Z/p_2Z)^{*}\) | の部分集合を \(M_2\) |
とすると、元の数については、
\(|M|=|M_1|\cdot|M_2|\)
が成り立ちます。以降、(1)\(,\) (2) の条件ごとに \(|M_1|\) と \(|M_2|\) を見積もることで、条件ごとの \(|M|\) を見積もり、そこから目的である \(|M|\) の数を評価します。(1)\(,\) (2) の条件ごとの \(M\) については、既に上で使ったように、
(1)を満たす \(M\) の部分集合を \(A_1\)
(2)を満たす \(M\) の部分集合を \(A_2\)
とします。
\(n-1=2^ek\) とおいたのと同じように、
\(p_1-1=2^{e_1}k_1\) (\(e_1\geq1,\:k_1\):奇数)
\(p_2-1=2^{e_2}k_2\) (\(e_2\geq1,\:k_2\):奇数)
とします。ここで、
\(e_1\leq e_2\)
とします。\(p_1\) と \(p_2\) は入れ替えてもよいので、こうすることで一般性は失われません。まず初めに、\(e,\:e_1,\:e_2\) の関係を整理しておきます。\(n-1=2^ek\) の式ですが、
\(\begin{eqnarray}
&&\:\:n-1&=p_1\cdot p_2-1\\
&&&=(2^{e_1}k_1+1)\cdot(2^{e_2}k_2+1)-1\\
&&&=2^{e_1+e_2}k_1k_2+2^{e_1}k_1+2^{e_2}k_2\\
&&&=2^{e_1}(2^{e_2}k_1k_2+k_1+2^{e_2-e_1}k_2)\\
\end{eqnarray}\)
と計算されます。この式を、
\(n-1=2^{e_1}\cdot K\)
\(K=2^{e_2}k_1k_2+k_1+2^{e_2-e_1}k_2\)
と表わすと、
\(e_1 < e_2\) のときは、\(K\) は奇数なので \(e=e_1\)
\(e_1=e_2\) のときは、\(K\) は偶数なので \(e > e_1\)
となり、いずれにせよ、
\(e_1\leq e\)
です。
ちなみに、\(n=p_1p_2\cd p_m\:\:(m\geq3)\) のときも同様で、
\(p_i-1=2^{e_i}k_i\:(3\leq i\leq m)\)
としたとき、\(e_1\) を \(e_i\:(3\leq i\leq m)\) の最小値とすると、\(e_1\leq e\) です。
\(p_i-1=2^{e_i}k_i\:(3\leq i\leq m)\)
としたとき、\(e_1\) を \(e_i\:(3\leq i\leq m)\) の最小値とすると、\(e_1\leq e\) です。
以降、
\(e_1 < e_2\)
\(e_1=e_2\)
の2つに分けて証明します。
2.1 \(e_1 < e_2\) の場合
(1)が成立するとき
(1) を満たす \(a\:(1\leq a\leq n-1)\) の集合を \(A_1\) とします。巡回群に関する定理 \((\br{C})\) により、\((Z/pZ)^{*}\) の群位数は \(p-1\) なので、
\(a^k=1\) となる \((Z/p_1Z)^{*}\) の元は \(\mr{gcd}(k,\:p_1-1)\) 個
\(a^k=1\) となる \((Z/p_2Z)^{*}\) の元は \(\mr{gcd}(k,\:p_2-1)\) 個
です。また、\(n=p_1p_2\) のとき、
\((Z/nZ)^{*}\cong(Z/p_1Z)^{*}\times(Z/p_2Z)^{*}\)
の同型が成り立つので、
\(\begin{eqnarray}
&&\:\:|A_1|&=\mr{gcd}(k,\:p_1-1)\cdot\mr{gcd}(k,\:p_2-1)\\
&&&=\mr{gcd}(k,\:2^{e_1}k_1)\cdot\mr{gcd}(k,\:2^{e_2}k_2)\\
\end{eqnarray}\)
です。ここで、\(k,\:k_1,\:k_2\) は全て奇数です。従って、
\(\mr{gcd}(k,\:2^{e_1}k_1)=\mr{gcd}(k,\:k_1)\)
\(\mr{gcd}(k,\:2^{e_2}k_2)=\mr{gcd}(k,\:k_2)\)
が成り立ち、
\(|A_1|=\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\)
となります。ここで \(|A_1|\) の上限値を評価すると、
\(\mr{gcd}(k,\:k_1)\leq k_1\)
\(\mr{gcd}(k,\:k_2)\leq k_2\)
であり、
\(|A_1|\leq k_1k_2\)
が結論づけられます。
(2)が成立するとき
(2) を満たす \(a\:(1\leq a\leq n-1)\) の集合を \(A_2\) とします。まず、\(0\leq r\leq e-1\) である \(r\) を一つ固定して考え、
\(a^{2^rk}\equiv-1\:\:(\mr{mod}\:p_1)\) かつ
\(a^{2^rk}\equiv-1\:\:(\mr{mod}\:p_2)\)
であるような集合を \(A_2(r)\) とします。そうすると、
\(|A_2|=\displaystyle\sum_{r=0}^{e-1}|A_2(r)|\)
が成り立ちます。まず、次を証明します。
\((Z/p_1Z)^{*}\) において \(a^{2^rk}=-1\) である \(a\) の個数は \(r\geq e_1\) のとき \(0\) 個 \(r < e_1\) のとき \(2^r\cdot\mr{gcd}(k,\:k_1)\) 個 である。 |
【証明】
\((Z/p_1Z)^{*}\) は群位数 \(p_1-1\) の巡回群なので、その生成元を \(g\) とする。ここで、
\(g^{\frac{p_1-1}{2}}\)
を考えると、生成元の定義上、\(g^{p_1-1}=1,\) \(g^x\neq1\:(1\leq x < p_1-1)\) なので、
\(\begin{eqnarray}
&&\:\:g^{\frac{p_1-1}{2}}&\neq1\\
&&\:\:(g^{\frac{p_1-1}{2}})^2&=1\\
\end{eqnarray}\)
であり、つまり、
\(g^{\frac{p_1-1}{2}}=-1\:(=p_1-1)\)
である。\(a^{2^rk}=-1\) が成り立つ \(a\) を、生成元 \(g\) を用いて、
\(a=g^x\:\:(1\leq x\leq p_1-1)\)
と表すと、
\(a^{2^rk}=-1\)
\((g^x)^{2^rk}=g^{\frac{p_1-1}{2}}\) \((\br{D})\)
だが、\(p_1-1=2^{e_1}k_1\) なので、
\(g^{2^rkx}=g^{2^{e_1-1}k_1}\)
が成り立つ。ここで一般的に \((Z/pZ)^{*}\) の生成元を \(g\) とし、
\(g^s=g^t\)
なら、\(j\) を整数として、
\(\begin{eqnarray}
&&\:\:g^{p-1}&=1\\
&&\:\:g^{j(p-1)}&=1\\
\end{eqnarray}\)
なので、
\(g^s=g^{t+j(p-1)}\)
である。つまり、
\(s\equiv t\:\:(\mr{mod}\:p-1)\)
が成り立つ。従って、
\(2^rkx\equiv2^{e_1-1}k_1\:\:(\mr{mod}\:p_1-1)\)
\(2^rkx\equiv2^{e_1-1}k_1\:\:(\mr{mod}\:2^{e_1}k_1)\)
\((\br{E})\)
であり、\((\br{E})\) 式は \((\br{D})\) 式と等価である。\((\br{E})\) 式を解いて \(x\) を求めると、そこから \(a=g^x\) で \(a\) が求まる。
ここで、\(r\geq e_1\) と仮定すると、\((\br{E})\) 式は、
\(2^rkx-2^{e_1-1}k_1\equiv0\:\:(\mr{mod}\:2^{e_1}k_1)\)
\(2^{e_1-1}(2^{r-e_1+1}kx-k_1)\equiv0\:\:(\mr{mod}\:2^{e_1}k_1)\)
\((\br{F})\)
と書ける。この \((\br{F})\) 式の \((2^{r-e_1+1}kx-k_1)\) の項に着目すると、\(r-e_1+1\geq1\) であり、\(k_1\) は奇数なので「偶数 - 奇数」=「奇数」である。そうすると、\((\br{F})\) 式の左辺は \(2^{e_1-1}\) の奇数倍であり、法である \(2^{e_1}k_1\) では割り切れず、\((\br{F})\) 式は成り立たない。つまり、\(a^{2^rk}=-1\) の解は、\(r\geq e_1\) のときには無い。
一方、\(r < e_1\) のとき \((\br{E})\) 式は、
\(2^r(kx-2^{e_1-r-1}k_1)\equiv0\:\:(\mr{mod}\:2^{e_1}k_1)\)
\((\br{F}\,')\)
と書ける。この \((\br{F}\,')\) 式が成り立つためには、\((kx-2^{e_1-r-1}k_1)\) の項は約数として \(2^i\:(i\geq e_1-r\geq1)\) を持つ必要があるが(少なくとも偶数である必要)、\(kx\) と \(2^{e_1-r-1}k_1\) はともに奇数にも偶数にもなり得るので、 \((\br{F}\,')\) 式の成立可能性に問題はない。そこで、以降で \(r < e_1\) のときの \((\br{E})\) 式の解の個数を検討する。
\(2^rkx\equiv2^{e_1-1}k_1\:\:(\mr{mod}\:2^{e_1}k_1)\)
\((\br{E})\)
において、
\(\begin{eqnarray}
&&\:\:h&=\mr{gcd}(k,\:k_1)\\
&&\:\:k\,'&=\dfrac{k}{h}\\
&&\:\:k_1{}^{\prime}&=\dfrac{k_1}{h}\\
\end{eqnarray}\)
とおく。\(k\,'\) と \(k_1{}^{\prime}\) は互いに素で、また、\(k,\:k_1\) が奇数なので、\(h,\:k\,',\:k_1{}^{\prime}\) は奇数である。\(r < e_1\) つまり \(r\leq e_1-1\) の条件があるので、\((\br{E})\) 式の両辺と法を \(2^rh\) で割ると、
\(k\,'x\equiv2^{e_1-1-r}k_1{}^{\prime}\:\:(\mr{mod}\:2^{e_1-r}k_1{}^{\prime})\)
\((\br{G})\)
となる。一般的に、
\(ax\equiv b\:\:(\mr{mod}\:m)\)
の合同方程式は、\(a\) が \(m\) と素なときには \(b\) の値にかかわらず解があって、その解は \(m\) を法として唯一である(下記)。
一次不定方程式、
\(ax+my=b\)
は、\(\mr{gcd}(a,\:m)=1\) のときに解をもつ(No.355「高校数学で理解するガロア理論(2):不定方程式の解の存在:21C」参照)。この等式の両辺を \(\mr{mod}\:m\) でみると、
\(ax\equiv b\:\:(\mr{mod}\:m)\)
の合同方程式となる。この方程式に \(x_1,\:x_2\) の2つの解があるとすると、
\(ax_1\equiv b\:\:(\mr{mod}\:m)\)
\(ax_2\equiv b\:\:(\mr{mod}\:m)\)
\(a(x_1-x_2)\equiv0\:\:(\mr{mod}\:m)\)
となるが、\(\mr{gcd}(a,\:m)=1\) なので、
\(x_1\equiv x_2\:\:(\mr{mod}\:m)\)
となり、解は \(m\) を法として唯一である。
\(ax+my=b\)
は、\(\mr{gcd}(a,\:m)=1\) のときに解をもつ(No.355「高校数学で理解するガロア理論(2):不定方程式の解の存在:21C」参照)。この等式の両辺を \(\mr{mod}\:m\) でみると、
\(ax\equiv b\:\:(\mr{mod}\:m)\)
の合同方程式となる。この方程式に \(x_1,\:x_2\) の2つの解があるとすると、
\(ax_1\equiv b\:\:(\mr{mod}\:m)\)
\(ax_2\equiv b\:\:(\mr{mod}\:m)\)
\(a(x_1-x_2)\equiv0\:\:(\mr{mod}\:m)\)
となるが、\(\mr{gcd}(a,\:m)=1\) なので、
\(x_1\equiv x_2\:\:(\mr{mod}\:m)\)
となり、解は \(m\) を法として唯一である。
\((\br{G})\) 式 をみると、\(k\,'\) と \(k_1{}^{\prime}\) は互いに素であり、かつ奇数なので、\((\br{G})\) 式における \(k\,'\) と、法である \(2^{e_1-r}k_1{}^{\prime}\) は互いに素である。ということは、
\((\br{G})\) 式は、法 \(2^{e_1-r}k_1{}^{\prime}\) で唯一の解をもつ
ことになる。\((\br{G})\) 式は \((\br{E})\) 式の両辺と法を \(2^rh\) で割ったものであった。つまり、\((\br{G})\) 式の法は、
\(2^{e_1-r}k_1{}^{\prime}=\dfrac{2^{e_1}k_1}{2^rh}\)
である。ということは、\((\br{G})\) 式の、法 \(2^{e_1-r}k_1{}^{\prime}\) での唯一の解は、法 \(2^{e_1}k_1\) である \((\br{E})\) 式の解、\(2^rh=2^r\cdot\mr{gcd}(k,\:k_1)\) 個に対応する。\((\br{E})\) 式は \((\br{D})\) 式と等価なので、これで、
\(0\leq r\leq e-1\) である \(r\) を一つ固定して考えたとき、\((Z/p_1Z)^{*}\) において \(a^{2^rk}=-1\) である \(a\) の個数は
\(r\geq e_1\) のとき \(0\) 個
\(r < e_1\) のとき \(2^r\cdot\mr{gcd}(k,\:k_1)\) 個
\(r\geq e_1\) のとき \(0\) 個
\(r < e_1\) のとき \(2^r\cdot\mr{gcd}(k,\:k_1)\) 個
が証明できた。【証明終】
ここまでで、
\((Z/p_1Z)^{*}\) において \(a^{2^rk}=-1\) である \(a\) の個数は
\(r\geq e_1\) のとき \(0\) 個
\(r < e_1\) のとき \(2^r\cdot\mr{gcd}(k,\:k_1)\) 個
であることが分かりました。この議論は \((Z/p_2Z)^{*}\) のときにも全く同じようにできて、
\((Z/p_2Z)^{*}\) において \(a^{2^rk}=-1\) である \(a\) の個数は
\(r\geq e_2\) のとき \(0\) 個
\(r < e_2\) のとき \(2^r\cdot\mr{gcd}(k,\:k_2)\) 個
が言えます。この結果を踏まえて、
\(|A_2(r)|\): | \((Z/p_1p_2Z)^{*}\) において | |
\(a^{2^rk}=-1\) である \(a\) の個数 |
を求めます。これは、
\((Z/p_1p_2Z)^{*}\cong(Z/p_1Z)^{*}\times(Z/p_2Z)^{*}\)
の直積関係を利用すると、\(e_1 < e_2\) の関係を考慮して、
\(r < e_1\) のとき
\(\begin{eqnarray}
&&\:\: |A_2(r)|&=2^r\cdot\mr{gcd}(k,\:k_1)\cdot2^r\cdot\mr{gcd}(k,\:k_2)\\
&&&=4^r\cdot\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\\
\end{eqnarray}\)
\(r\geq e_1\) のとき
\(|A_2(r)|=0\)
となります。ここから \(|A_2|\) を計算するには、
\(|A_2|=\displaystyle\sum_{r=0}^{e-1}|A_2(r)|\)
ですが、\(e_1\leq e\) の関係があるので、\(e-1\) までの総和は \(e_1-1\) までの総和に等しいことになります。つまり、
\(\begin{eqnarray}
&&\:\:|A_2|&=\displaystyle\sum_{r=0}^{e-1}|A_2(r)|\\
&&&=\displaystyle\sum_{r=0}^{e_1-1}|A_2(r)|\\
&&&=\displaystyle\sum_{r=0}^{e_1-1}4^r\cdot\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\\
\end{eqnarray}\)
の式が成り立ちます。この式に等比数列の総和である、
\(\displaystyle\sum_{r=0}^{e_1-1}4^r=\dfrac{4^{e_1}-1}{4-1}=\dfrac{4^{e_1}-1}{3}\)
を代入すると、
\(|A_2|=\dfrac{4^{e_1}-1}{3}\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\)
です。ここで、
\(\mr{gcd}(k,\:k_1)\leq k_1\)
\(\mr{gcd}(k,\:k_2)\leq k_2\)
の関係を利用すると、
\(|A_2|\leq\dfrac{4^{e_1}-1}{3}k_1k_2\)
となります。ここまでの式は、\(e_1 < e_2\) でなくても \(e_1\leq e_2\) なら成り立つことが導出過程から分かります。
以上の計算で \(|M|\) を評価できます。
\(\begin{eqnarray}
&&\:\:|M|&=|A_1|+|A_2|\\
&&&\leq k_1k_2+\dfrac{4^{e_1}-1}{3}k_1k_2\\
\end{eqnarray}\)
この計算をもとに \(1\leq a\leq n-1\) の \(n-1\) 個のうちの \(|M|\) の割合を評価すると、
\(\begin{eqnarray}
&&\:\:\dfrac{|M|}{n-1}&=\dfrac{|M|}{p_1p_2-1}\\
&&& < \dfrac{|M|}{(p_1-1)(p_2-1)}\\
&&&=\dfrac{|M|}{2^{e_1}k_1\cdot2^{e_2}k_2}\\
&&&\leq\dfrac{1}{2^{e_1+e_2}}\left(1+\dfrac{4^{e_1}-1}{3}\right)\\
&&&=\dfrac{1}{2^{e_1+e_2}}\cdot\dfrac{2+4^{e_1}}{3}\\
\end{eqnarray}\)
となります。ここで、\(\bs{e_1 < e_2}\) なので、\(\bs{2e_1+1\leq e_1+e_2}\) です。従って、
\(\begin{eqnarray}
&&\:\:\dfrac{|M|}{n-1}& < \dfrac{1}{2^{2e_1+1}}\cdot\dfrac{2+4^{e_1}}{3}\\
&&&=\dfrac{2+4^{e_1}}{6\cdot4^{e_1}}\\
\end{eqnarray}\)
ですが、この最後の式の最大値は \(e_1=1\) のときです。これを代入すると、
\(\dfrac{|M|}{n-1} < \dfrac{6}{24}=\dfrac{1}{4}\)
となって、\(1\leq a\leq n-1\) のなかで Miller-Rabin の条件を満たす数の比率は \(e_1 < e_2\) のときに \(\dfrac{1}{4}\) 未満であることが証明されました。
2.2 \(e_1=e_2\) の場合
(1)が成立するとき
\(e_1 < e_2\) と全く同じ考え方で、
\(|A_1|=\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\)
です(\(k,\:k_1,\:k_2\) は奇数)。ここで、一般的には、
\(\mr{gcd}(k,\:k_1)\leq k_1\)
\(\mr{gcd}(k,\:k_2)\leq k_2\)
が成り立ちますが、\(e_1=e_2\) だと、
\(\mr{gcd}(k,\:k_1)=k_1\)
\(\mr{gcd}(k,\:k_2)=k_2\)
が同時に成り立つことはありません。なぜなら、同時に成り立つとすると、
\(k_1\mid k\) かつ \(k_2\mid k\)
ですが、\(n-1=2^ek\) だったので、
\(k_1\mid(n-1)\) かつ \(k_2\mid(n-1)\)
です。ここで、\(n-1\) は
\(\begin{eqnarray}
&&\:\:n-1&=p_1p_2-1\\
&&&=(1+2^{e_1}k_1)\cdot p_2-1\\
&&&\equiv p_2-1\:\:(\mr{mod}\:k_1)\\
\end{eqnarray}\)
となりますが、\(k_1\mid(n-1)\) なので、
\(k_1\mid(p_2-1)\)
\(k_1\mid2^{e_2}k_2\)
\(k_1\mid k_2\)
となります。まったく同様にして、
\(n-1\equiv p_1-1\:\:(\mr{mod}\:k_2)\)
\(k_2\mid(p_1-1)\)
\(k_2\mid2^{e_1}k_1\)
\(k_2\mid k_1\)
です。\(k_1\mid k_2\) かつ \(k_2\mid k_1\) ということは、\(k_1=k_2\) ですが、\(e_1=e_2\) なので、\(p_1=p_2\) となって矛盾します。つまり \(\mr{gcd}(k,\:k_1)=k_1\)、\(\mr{gcd}(k,\:k_2)=k_2\) が同時に成り立つことはありません。そこで、
\(\mr{gcd}(k,\:k_1) < k_1\)
\(\mr{gcd}(k,\:k_2)\leq k_2\)
として一般性を失いません。ここで \(k_1\) を素因数分解したときに現れる最小の素数を \(q\:(q\geq3)\)とし、
\(k_1=q\cdot k_0\:\:(k_0\):奇数\()\)
と表します。そうすると、\(\mr{gcd}(k,\:k_1) < k_1\) なので、
\(\mr{gcd}(k,\:k_1)\leq k_0\)
が成り立ち、
\(\dfrac{k_1}{\mr{gcd}(k,\:k_1)}\geq\dfrac{k_1}{k_0}=q\geq3\)
となります。ここから、
\(\mr{gcd}(k,\:k_1)\leq\dfrac{1}{3}k_1\)
が得られます。そこで、
\(\mr{gcd}(k,\:k_1)\leq\dfrac{1}{3}k_1\)
\(\mr{gcd}(k,\:k_2)\leq k_2\)
をもとに、
\(|A_1|=\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\)
を評価すると、
\(|A_1|\leq\dfrac{1}{3}k_1k_2\)
となります。
(2)が成立するとき
このケースは \(e_1 < e_2\) で導出した、
\(|A_2|\leq\dfrac{4^{e_1}-1}{3}\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\)
までは全く同じです。ここで、
\(\mr{gcd}(k,\:k_1)\leq\dfrac{1}{3}k_1\)
\(\mr{gcd}(k,\:k_2)\leq k_2\)
によって評価すると、
\(|A_2|\leq\dfrac{1}{3}\cdot\dfrac{4^{e_1}-1}{3}k_1k_2\)
が成り立ちます。
以上の計算から \(|M|\) を評価すると、
\(\begin{eqnarray}
&&\:\:|M|&=|A_1|+|A_2|\\
&&&\leq\dfrac{1}{3}k_1k_2+\dfrac{1}{3}\cdot\dfrac{4^{e_1}-1}{3}k_1k_2\\
\end{eqnarray}\)
この計算をもとに \(1\leq a\leq n-1\) の \(n\) 個のうちの \(|M|\) の割合を計算すると、
\(\begin{eqnarray}
&&\:\:\dfrac{|M|}{n-1}&=\dfrac{|M|}{p_1p_2-1}\\
&&& < \dfrac{|M|}{(p_1-1)(p_2-1)}\\
&&&=\dfrac{|M|}{2^{e_1}k_1\cdot2^{e_2}k_2}\\
&&&\leq\dfrac{1}{2^{e_1+e_2}}\cdot\dfrac{1}{3}\left(1+\dfrac{4^{e_1}-1}{3}\right)\\
&&&=\dfrac{1}{2^{2e_1}}\cdot\dfrac{1}{3}\cdot\dfrac{2+4^{e_1}}{3}\\
&&&=\dfrac{1}{4^{e_1}}\cdot\dfrac{1}{3}\cdot\dfrac{2+4^{e_1}}{3}\\
&&&=\dfrac{1}{3}\left(\dfrac{2}{3\cdot4^{e_1}}+\dfrac{1}{3}\right)\\
\end{eqnarray}\)
となります。この最後の式の最大値は \(e_1=1\) のときです。代入すると、
\(\begin{eqnarray}
&&\:\:\dfrac{|M|}{n-1}& < \dfrac{1}{3}\left(\dfrac{1}{6}+\dfrac{1}{3}\right)\\
&&&=\dfrac{1}{6} < \dfrac{1}{4}\\
\end{eqnarray}\)
となって、\(1\leq a\leq n-1\) のなかで Miller-Rabin の条件を満たす数の比率は、\(e_1=e_2\) のときにも \(\dfrac{1}{4}\) 未満であることが証明されました。
3. \(n=p_1\cdot p_2\cdot\cd\cdot p_m\:\:(\:m\geq3\:)\)
\(n\) が3個以上の相異なる奇素数の積に素因数分解される場合です。この場合も、基本的には \(n=p_1\cdot p_2\) のケースと(全く同じではないが)同様になります。Miller-Rabin の定理を再掲します。
Miller-Rabin の定理(再掲) \(n\) を \(3\) 以上の奇数の合成数とする。また、\(n-1=2^ek\:\:(e\geq1,\:k\) は奇数\()\) と表されているものとする。このとき、 Miller-Rabin の条件 (1) \(a^k\equiv1\:\:(\mr{mod}\:n)\) もしくは (2) ある \(r\:(0\leq r\leq e-1)\) について、 \(a^{2^rk}\equiv-1\:\:(\mr{mod}\:n)\) を満たす \(a\:(1\leq a\leq n-1)\) は、\(n-1\) 個のうちの \(1/4\) 以下である。 |
以降、表記を見やすくするため、\(m=3\)、\(n=p_1\cdot p_2\cdot p_3\) の場合で記述します。既約剰余類群の同型関係、
\((Z/p_1p_2p_3Z)^{*}\cong(Z/p_1Z)^{*}\times(Z/p_2Z)^{*}\times(Z/p_3Z)^{*}\)
を利用して、問題を置き換えます。それぞれの群位数は、
\(\begin{eqnarray}
&&\:\:|(Z/p_1p_2p_3Z)^{*}|&=\varphi(p_1p_2p_3)\\
&&&=(p_1-1)(p_2-1)(p_3-1)\\
\end{eqnarray}\)
\(|(Z/p_1Z)^{*}|=\varphi(p_1)=p_1-1\)
\(|(Z/p_2Z)^{*}|=\varphi(p_2)=p_2-1\)
\(|(Z/p_3Z)^{*}|=\varphi(p_3)=p_3-1\)
であり、
\(|(Z/p_1p_2p_3Z)^{*}|=|(Z/p_1Z)^{*}|\cdot|(Z/p_2Z)^{*}|\cdot|(Z/p_3Z)^{*}|\)
が成り立ちます。Miller-Rabin の条件は次のように言い換えられます。
\(n=p_1p_2p_3,\:\:n-1=2^ek\) とするとき、 (1) (1a) \(a^k\equiv1\:\:(\mr{mod}\:p_1)\) かつ (1b) \(a^k\equiv1\:\:(\mr{mod}\:p_2)\) かつ (1c) \(a^k\equiv1\:\:(\mr{mod}\:p_3)\) もしくは、 (2) ある \(r\:(0\leq r\leq e-1)\) について、 (2a) \(a^{2^rk}\equiv-1\:\:(\mr{mod}\:p_1)\) かつ (2b) \(a^{2^rk}\equiv-1\:\:(\mr{mod}\:p_2)\) かつ (2c) \(a^{2^rk}\equiv-1\:\:(\mr{mod}\:p_3)\) が成り立つ。 |
例によって、
\(p_1-1=2^{e_1}k_1\:\:(e_1\geq1,\:k_1\) は奇数\()\)
\(p_2-1=2^{e_2}k_2\:\:(e_2\geq1,\:k_2\) は奇数\()\)
\(p_3-1=2^{e_3}k_3\:\:(e_3\geq1,\:k_3\) は奇数\()\)
とおきますが、\(\bs{e_1}\) は \(\bs{e_1,\:e_2,\:e_3}\) のうちの最小とします。こう仮定して一般性を失うことはありません。この仮定のもとでは、
\(3e_1\leq e_1+e_2+e_3\)
が成り立ちます。等号は \(e_1=e_2=e_3\) の場合です。
(1)が成立するとき
(1) を満たす \(a\:(1\leq a\leq n-1)\) の集合を \(A_1\) とします。\(n=p_1\cdot p_2\) のケースと同様の計算によって、
\(|A_1|=\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\cdot\mr{gcd}(k,\:k_3)\)
となります。\(|A_1|\) の上限値を評価すると、
\(\mr{gcd}(k,\:k_1)\leq k_1\)
\(\mr{gcd}(k,\:k_2)\leq k_2\)
\(\mr{gcd}(k,\:k_3)\leq k_3\)
なので、
\(|A_1|\leq k_1k_2k_3\)
が結論づけられます。
(2)が成立するとき
(2) を満たす \(a\:(1\leq a\leq n-1)\) の集合を \(A_2\) とします。\(n=p_1\cdot p_2\) のケースと同様の計算で、
\(|A_2|=\displaystyle\sum_{r=0}^{e_1-1}(2^r)^3\cdot\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\cdot\mr{gcd}(k,\:k_3)\)
です。この式に \(e_1\) だけが現れるのは、\(e_1\) が \(\{e_1,\:e_2,\:e_3\}\) の最小値だからです。ここで、
\(\mr{gcd}(k,\:k_1)\leq k_1\)
\(\mr{gcd}(k,\:k_2)\leq k_2\)
\(\mr{gcd}(k,\:k_3)\leq k_3\)
の関係を利用します。また、等比数列の総和を計算すると、
\(\begin{eqnarray}
&&\:\:\displaystyle\sum_{r=0}^{e_1-1}(2^r)^3&=\displaystyle\sum_{r=0}^{e_1-1}(2^3)^r\\
&&&=\dfrac{(2^3)^{e_1}-1}{2^3-1}\\
\end{eqnarray}\)
です。まとめると、
\(|A_2|\leq\dfrac{2^{3e_1}-1}{2^3-1}\cdot k_1k_2k_3\)
が得られます。
以上をもとに \(|M|\) を評価すると、
\(\begin{eqnarray}
&&\:\:|M|&=|A_1|+|A_2|\\
&&&\leq k_1k_2k_3+\dfrac{2^{3e_1}-1}{2^3-1}\cdot k_1k_2k_3\\
\end{eqnarray}\)
です。この計算をもとに \(1\leq a\leq n-1\) の \(n-1\) 個のうちの \(|M|\) の割合を計算すると、
\(\begin{eqnarray}
&&\:\:\dfrac{|M|}{n-1}&=\dfrac{|M|}{p_1p_2p_3-1}\\
&&& < \dfrac{|M|}{(p_1-1)(p_2-1)(p_3-1)}\\
&&&=\dfrac{|M|}{2^{e_1}k_1\cdot2^{e_2}k_2\cdot2^{e_3}k_3}\\
&&&\leq\dfrac{1}{2^{e_1+e_2+e_3}}\left(1+\dfrac{2^{3e_1}-1}{2^3-1}\right)\\
\end{eqnarray}\)
となります。ここで、\(3e_1\leq e_1+e_2+e_3\) です。従って、
\(\begin{eqnarray}
&&\:\:\dfrac{|M|}{n-1}& < \dfrac{1}{2^{3e_1}}\left(1+\dfrac{2^{3e_1}-1}{2^3-1}\right)\\
&&&=\dfrac{6+2^{3e_1}}{7\cdot2^{3e_1}}\\
\end{eqnarray}\)
ですが、この最後の式は \(e_1\) の増大によって単調減少するので、その最大値は \(e_1=1\) のときです。これを代入すると、
\(\dfrac{|M|}{n-1} < \dfrac{6+8}{56}=\dfrac{1}{4}\)
となって、\(1\leq a\leq n-1\) のなかで Miller-Rabin の条件を満たす数の比率は \(\dfrac{1}{4}\) 未満であることが確かめられました。
以上の表記は \(m=3\) の場合ですが、証明のプロセスを振り返ってみると、\(m\geq3\) のときは、
\(\begin{eqnarray}
&&\:\:\dfrac{|M|}{n-1}& < \dfrac{1}{2^{m\cdot e_1}}\left(1+\displaystyle\sum_{r=0}^{e_1-1}(2^m)^r\right)\\
&&&=\dfrac{1}{2^{m\cdot e_1}}\left(1+\dfrac{2^{m\cdot e_1}-1}{2^m-1}\right)\\
&&&=\dfrac{2^m-2+2^{m\cdot e_1}}{(2^m-1)\cdot2^{m\cdot e_1}}\\
\end{eqnarray}\)
です。この式の右辺は \(e_1\) について単調減少なので、\(e_1=1\) を代入すると、
\(\begin{eqnarray}
&&\:\:\dfrac{|M|}{n-1}& < \dfrac{2^m-2+2^m}{(2^m-1)\cdot2^m}\\
&&&=\dfrac{2\cdot(2^m-1)}{(2^m-1)\cdot2^m}\\
&&&=\dfrac{1}{2^{m-1}}\\
&&&\leq\dfrac{1}{4}\\
\end{eqnarray}\)
が \(m\geq3\) のすべてで成り立ちます。
ちなみに、カーマイケル数は必ず、\(p_1\cdot p_2\cdot\cd\cdot p_m\) \((\:m\geq3\:)\) の形をしていることが知られています。上の証明によって、\(n\) がカーマイケル数であったとしても Miller-Rabin の条件を満たす底 \(a\) は 全体の \(\dfrac{1}{4}\) 未満であることが分かります。
以上で、Miller-Rabin の定理が証明されました。
1024 ビットの素数を求める |
Miller-Rabin の定理を使って、実際に巨大素数を求めてみます。2048 ビットの RSA 暗号で使われる 1024 ビットの素数を求めます。1024 ビットは、\(2^{1023}\) ~ \(2^{1024}-1\) の数です。Python で整数 n が素数かどうかを判定する関数、miller_rabin(n) を次のようにシンプルに実装します。n が素数なら True、合成数なら False を返す関数です。反復回数は 40回とします。
from random import randint
def miller_rabin(n):
if n == 2:
return True
if n < 2 or n % 2 == 0:
return False
k = (n - 1) // 2
e = 1;
while k % 2 == 0:
e += 1
k = k // 2
iteration = 40
for _ in range(iteration):
if not mr_base(n, e, k):
return False
return True
def mr_base(n, e, k):
a = randint(1, n - 1)
b = pow(a, k, n)
if (b == 1) or (b == n - 1):
return True
else:
for _ in range(e - 1):
b = pow(b, 2, n)
if b == n - 1:
return True
return False
|
この関数を用いて作ったのは、次のようなプログラムです。
\(2^{1023}\) ~ \(2^{1024}-1\) の間の乱数 \(n\) を \(10,000\)個、順々に発生させる。 | |
miller_rabin(n) で \(n\) が素数かどうかを調べる。 | |
見つかった素数の個数をカウントする。 | |
最初に見つかった素数を出力する。 |
1つの実行例ですが、12個の素数が見つかり、最初に見つかったのは次に示す 308桁の素数でした。実行時間は Google Colaboratry の環境で約 30秒です。
94872061 3054580553 8024546417 0443276752 8208705264 5738921481 0677834138 4405922941 9044925712 7675055467 0399951005 3184840724 4107587320 1847375774 1842027537 2972168431 3292460096 0558147125 1513790454 1422818823 6684614711 0137905023 0947309459 7845156412 5542386383 6759057622 9952488549 9964568003 6095666702 5172908475 7410497807
何回か実行してみると、素数の桁数はほとんどが 309桁で、一部が 308桁です。これは \(\mr{log}_{10}2^{1023}\fallingdotseq307.95\) なので、そうなるはずです。また、1万個の n のうちの素数の数は 8~18 個程度となりました。実行結果について「素数定理」と「反復回数」の観点から考察します。
素数定理
数学では、\(x\) 以下の素数の個数を \(\pi(x)\) で表わします。素数定理によると、
\(\pi(x)\sim\dfrac{x}{\mr{log}(x)}\)
です。左辺と右辺をつなぐ \(\sim\) は、
左辺と右辺の比率 \(\longrightarrow\:1\:\:(x\longrightarrow\infty)\)
を意味します。以下、
\(\pi(x)=\dfrac{x}{\mr{log}(x)}\)
と考えて、m ビットの数に含まれる素数の割合を見積もります。m ビットの数の総数は \(2^{m-1}\) 個なので、m ビット数の素数割合は、
素数割合 | \(=\dfrac{1}{2^{m-1}}(\pi(2^m)-\pi(2^{m-1}))\) | |
\(=\dfrac{1}{\mr{log}2\cdot m}\cdot\dfrac{m-2}{m-1}\) |
ですが、\(\dfrac{m-2}{m-1}\) を \(1\) と見なすと、簡潔に、
素数割合 \(=\dfrac{1}{\mr{log}2\cdot m}\)
です。この式に \(m=1024\) を代入すると、
素数割合 \(\fallingdotseq0.0014\)
となります。つまり、
1024 ビットの数、10,000個をランダムに選んで素数判定を行うと、0.14%=14 個程度の素数が見つかる
と言えます。これは上の実験で、1万個の n のうちの素数の数は 8~18 個程度だったことに合致します。
反復回数
プログラムを少々変更して、
何回目の反復(iteration)で素数\(\cdot\)合成数の判定ができたか
を調べると、素数判定のときは当然 iteration = 40 ですが、
合成数判定のときの iteration = 1
であることが分かります(1万個の素数判定をする前提です)。つまり、\(n\) が合成数なら最初の計算で即、合成数と判明します。何回かの反復の後に合成数と判明することは、上の計算では無いのです。
この理由は、\(n\) が合成数だと「\(a\:(1\leq a\leq n-1)\) のなかで Miller-Rabin の条件を満たす底 \(a\) の比率は \(\tfrac{1}{4}\) 以下」という定理の \(\tfrac{1}{4}\) が(一般には)過大評価であることによります。たとえば、\(n\) が2つの異なる素数の積の場合、
\(\begin{eqnarray}
&&\:\:n&=p_1p_2\\
&&\:\:n-1&=2^ek\\
&&\:\:p_1-1&=2^{e_1}k_1\\
&&\:\:p_2-1&=2^{e_2}k_2\\
\end{eqnarray}\)
(\(e,e_1,e_2\geq1,\:\:k,k_1,k_2\) は奇数)
において \(\tfrac{1}{4}\) 以下の主な根拠は、
\(\mr{gcd}(k,\:k_1)\cdot\mr{gcd}(k,\:k_2)\leq k_1k_2\)
でした。ところが、この式で等号が成り立つのは、特に \(n\) が巨大だと、めったにありません。高々 10,000個程度の合成数を判定したとしても、Miller-Rabin の条件を満たす底 \(a\) が現れる確率はほとんどゼロに等しいのです。
ランダムに選んだ数 \(n\) のほとんどは(1024 ビットの数の場合 99.86 % は)合成数です。したがって「合成数を合成数だと速く判定する」のが素数判定アルゴリズムのポイントであり、反復回数をどうするかは全体の速度にそれほど関係ありません。このあたりの事情はフェルマの条件で素数判定をしても同じです。
ただし、フェルマの条件とは違って、ランダムに選んだ底 \(a\) が Miller-Rabin の条件を満たす確率が、\(n\) の値にかかわらず必ず \(\tfrac{1}{4}\) 以下であることが数学的に保証されています。そこが Miller-Rabin の素数判定アルゴリズムの価値なのでした。
2024-03-18 18:23
nice!(0)
No.361 - 寄生生物が宿主を改変する [科学]
今まで、寄生生物が宿主(=寄生する相手)を操るというテーマに関連した記事を書きました。
の3つです。最初の No.348「蚊の嗅覚は超高性能」を要約すると、
でした。また No.350「寄生生物が行動をあやつる」は、次のようにまとめられます。
トキソプラズマは広範囲の動物に感染しますが、有性生殖ができるのは猫科の動物の体内だけです。トキソプラズマが動物の行動を改変するのは、猫科の動物に捕食されやすくするため(もともとそのためだった)と推測できます。
そのトキソプラズマについての記事が、No.352「トキソプラズマが行動をあやつる」です。何点かあげると、
などです。今回はその継続で、同じテーマについての新聞記事を取り上げます。朝日新聞 2023年2月~3月にかけて掲載された「寄生虫と人類」です。これは3回シリーズの記事で、その第2回(2023.3.3)と第3回(2023.3.10)を紹介します。今までと重複する部分もありますが、「寄生生物が宿主を改変する」ことを利用して医療に役立てようとする動きも紹介されています。
寄生生物の生き残り戦略
「寄生虫と人類」の第2回は、
との見出しです。例のトキソプラズマの話から始まります。
引用のようにトキソプラズマはヒトにも感染し、妊婦が初めて感染した場合、胎児が先天性トキソプラズマ症にかかることがあります。しかし、それ以上の影響があるのではと疑われています。つまり脳への影響です。脳への影響は動物で研究が進んでいます。
ネズミやオオカミにおけるトキソプラズマの影響は、No.350 や No.352 でも紹介した通りです。さらにトキソプラズマは、巧妙な仕掛けによって宿主の免疫系の攻撃から逃れるようなのです。
寄生虫は自らの生き残りのために宿主を改変しますが、そのことが自然生態系に大きな役割を持っている場合があります。その例が、No.350「寄生生物が行動をあやつる」で紹介したハリガネムシです。
No.350「寄生生物が行動をあやつる」に書いたように、佐藤准教授によると、渓流魚の餌の 60%(エネルギー換算)はハリガネムシが "連れてきた" 昆虫類でまかなわれているそうです。これだけでも重要ですが、上の引用によるとさらに「渓流魚に狙われる恐れが減った水生昆虫は藻類を食べるので、藻類が増えすぎない」とあります。ハリガネムシがカマドウマ(その他、カマキリ、キリギリスなど)に寄生することが、めぐりめぐって渓流の藻類が増えすぎないことにつながっている。生態系のバランスは誠に微妙だと思います。
寄生虫と病気治療
「寄生虫と人類」の第3回は、
との見出しです。ここでは寄生虫の生き残り戦略を解明して、それを人間の病気治療に役立てようとする研究が紹介されています。
記事に「マクロファージにがん細胞をどんどん食べさせるようにできるのではないか」とあります。これで思い出すのが、No.330「ウイルスでがんを治療する」です。これは、東京大学の藤堂教授が開発した "ウイルスによるがん治療薬" を紹介した記事でした。単純ヘルペスウイルス1型(HSV-1)の3つの遺伝子を改造し、がん細胞にだけ感染するようにすると、改造ヘルペスウイルスはがん細胞を次々と死滅させてゆく。
がん細胞を攻撃するのが難しい要因のひとつは、それが「自己」だからです。リーシュマニア原虫は寄生したマクロファージを改変して「自己」であるはずの赤血球だけを選択的に食べるようにします。その仕組みが解明できれば、がん細胞だけを食べるマクロファージを作れるかもしれません。
ヒトに感染する細菌やウイルスが、ヒトの免疫系からの攻撃を逃れるため、免疫の働きを押さえる制御性T細胞を誘導する(未分化のT細胞を制御性T細胞に変える)とか、制御性T細胞を活性化する話は、今までの記事で何回か書きました。
などです。細菌やウイルスが制御性T細胞を誘導するのであれば、遺伝子の数が多い寄生虫が同じことをできたとしても、むしろ当然という感じがします。
細菌やウイルスよりはるかに大きい寄生虫にヒトが対抗するためには、それを体内から排出するしかない。この仕組みを発動する免疫細胞が2010年に発見された(2型自然リンパ球、ILC2)という記事です。
寄生虫が多い環境では、このようなヒトの仕組みと、寄生虫が免疫から逃れようとする動き(制御性T細胞を生成するなど)が攻めぎ合っています。しかし、寄生虫がほとんどいない先進国の環境ではバランスが崩れ、ヒトの仕組みが不必要に発動して「自己」を攻撃してアレルギーの(一つの)原因になるわけです。
ヒト(ホモ・サピエンス)はアフリカのサバンナ地帯で進化してきたわけで、その環境とライフスタイル(狩猟採集)にマッチした DNA と体の造りになっています。サバンナでの狩猟採集に有利なように進化してきたのがヒトなのです。
もちろん現代で同じ環境で生きることはできません。しかし程度の差はあれ、「寄生生物と戦う環境、あるいは共生する環境」は、我々が健康に過ごすために必須だと感じる記事でした。
の3つです。最初の No.348「蚊の嗅覚は超高性能」を要約すると、
蚊がヒトを感知する仕組みは距離によって4種あり、その感度は極めて鋭敏である。
| |||||||||
ある種のウイルスは、ネズミに感染すると一部のたんぱく質の働きを弱める。それによってアセトフェノンを作る微生物が皮膚で増え、この臭いが多くの蚊を呼び寄せる(中国・清華大学の研究)。 |
でした。また No.350「寄生生物が行動をあやつる」は、次のようにまとめられます。
ハリガネムシは、カマキリに感染するとその行動を改変し、それによってカマキリは、深い水辺に反射した光の中に含まれる「水平偏光」に引き寄せられて水に飛び込む。ハリガネムシは水の中でカマキリの体から出て行き、そこで卵を生む。 | |
トキソプラズマに感染したオオカミはリスクを冒す傾向が強く、群のリーダーになりやすい。 | |
トキソプラズマに感染したネズミはネコの匂いも恐れずに近づく。 |
トキソプラズマは広範囲の動物に感染しますが、有性生殖ができるのは猫科の動物の体内だけです。トキソプラズマが動物の行動を改変するのは、猫科の動物に捕食されやすくするため(もともとそのためだった)と推測できます。
そのトキソプラズマについての記事が、No.352「トキソプラズマが行動をあやつる」です。何点かあげると、
トキソプラズマに感染したネズミは、天敵である猫の匂いを忌避しなくなることが、実験によって証明された。 | |
トキソプラズマに感染した人は、していない人に比べて交通事故にあう確率が 2.65 倍 高かった(チェコ大学。NHK BSP「超進化論 第3集」2023.1.8 による) | |
トキソプラズマに感染したハイエナはライオンに襲われやすくなる(ナショナル・ジオグラフィック:2021.7.11 デジタル版)。 |
などです。今回はその継続で、同じテーマについての新聞記事を取り上げます。朝日新聞 2023年2月~3月にかけて掲載された「寄生虫と人類」です。これは3回シリーズの記事で、その第2回(2023.3.3)と第3回(2023.3.10)を紹介します。今までと重複する部分もありますが、「寄生生物が宿主を改変する」ことを利用して医療に役立てようとする動きも紹介されています。
寄生生物の生き残り戦略
「寄生虫と人類」の第2回は、
生物操り 都合のいい環境に
宿主の脳や免疫を制御 生態系に影響も
宿主の脳や免疫を制御 生態系に影響も
との見出しです。例のトキソプラズマの話から始まります。
|
![]() |
トキソプラズマの拡散 |
(朝日新聞 2023.3.3 より) |
|
引用のようにトキソプラズマはヒトにも感染し、妊婦が初めて感染した場合、胎児が先天性トキソプラズマ症にかかることがあります。しかし、それ以上の影響があるのではと疑われています。つまり脳への影響です。脳への影響は動物で研究が進んでいます。
|
ネズミやオオカミにおけるトキソプラズマの影響は、No.350 や No.352 でも紹介した通りです。さらにトキソプラズマは、巧妙な仕掛けによって宿主の免疫系の攻撃から逃れるようなのです。
|
寄生虫は自らの生き残りのために宿主を改変しますが、そのことが自然生態系に大きな役割を持っている場合があります。その例が、No.350「寄生生物が行動をあやつる」で紹介したハリガネムシです。
|
No.350「寄生生物が行動をあやつる」に書いたように、佐藤准教授によると、渓流魚の餌の 60%(エネルギー換算)はハリガネムシが "連れてきた" 昆虫類でまかなわれているそうです。これだけでも重要ですが、上の引用によるとさらに「渓流魚に狙われる恐れが減った水生昆虫は藻類を食べるので、藻類が増えすぎない」とあります。ハリガネムシがカマドウマ(その他、カマキリ、キリギリスなど)に寄生することが、めぐりめぐって渓流の藻類が増えすぎないことにつながっている。生態系のバランスは誠に微妙だと思います。
寄生虫と病気治療
「寄生虫と人類」の第3回は、
「生き残り戦略」病気治療に光
宿主の免疫から攻撃逃れる仕組みを利用
宿主の免疫から攻撃逃れる仕組みを利用
との見出しです。ここでは寄生虫の生き残り戦略を解明して、それを人間の病気治療に役立てようとする研究が紹介されています。
|
記事に「マクロファージにがん細胞をどんどん食べさせるようにできるのではないか」とあります。これで思い出すのが、No.330「ウイルスでがんを治療する」です。これは、東京大学の藤堂教授が開発した "ウイルスによるがん治療薬" を紹介した記事でした。単純ヘルペスウイルス1型(HSV-1)の3つの遺伝子を改造し、がん細胞にだけ感染するようにすると、改造ヘルペスウイルスはがん細胞を次々と死滅させてゆく。
がん細胞を攻撃するのが難しい要因のひとつは、それが「自己」だからです。リーシュマニア原虫は寄生したマクロファージを改変して「自己」であるはずの赤血球だけを選択的に食べるようにします。その仕組みが解明できれば、がん細胞だけを食べるマクロファージを作れるかもしれません。
|
ヒトに感染する細菌やウイルスが、ヒトの免疫系からの攻撃を逃れるため、免疫の働きを押さえる制御性T細胞を誘導する(未分化のT細胞を制御性T細胞に変える)とか、制御性T細胞を活性化する話は、今までの記事で何回か書きました。
2010年には、自己免疫疾患を抑制する制御性T細胞の誘導に関係するバクテロイデス・フラジリスが、2011年には同様にこの制御性細胞を誘導するクロストリジウム属が発見された。─── No.70「自己と非自己の科学(2)」 | |
抗生物質のバンコマイシンで腸内細菌のクロストリジウム属を徐々に減らすと、ある時点で制御性T細胞が急減し、それが自己免疫疾患であるクローン病(=炎症性腸疾患)の発症を招く。─── No.120「"不在" という伝染病(2)」 | |
エンテロウイルスに感染すると制御性T細胞の生成が刺激され、その細胞が成人期まで存続する。制御性T細胞は自己免疫性T細胞の生成を抑えることで1型糖尿病を防ぐ。─── No.229「糖尿病の発症をウイルスが抑止する」 |
などです。細菌やウイルスが制御性T細胞を誘導するのであれば、遺伝子の数が多い寄生虫が同じことをできたとしても、むしろ当然という感じがします。
|
細菌やウイルスよりはるかに大きい寄生虫にヒトが対抗するためには、それを体内から排出するしかない。この仕組みを発動する免疫細胞が2010年に発見された(2型自然リンパ球、ILC2)という記事です。
寄生虫が多い環境では、このようなヒトの仕組みと、寄生虫が免疫から逃れようとする動き(制御性T細胞を生成するなど)が攻めぎ合っています。しかし、寄生虫がほとんどいない先進国の環境ではバランスが崩れ、ヒトの仕組みが不必要に発動して「自己」を攻撃してアレルギーの(一つの)原因になるわけです。
|
ヒト(ホモ・サピエンス)はアフリカのサバンナ地帯で進化してきたわけで、その環境とライフスタイル(狩猟採集)にマッチした DNA と体の造りになっています。サバンナでの狩猟採集に有利なように進化してきたのがヒトなのです。
もちろん現代で同じ環境で生きることはできません。しかし程度の差はあれ、「寄生生物と戦う環境、あるいは共生する環境」は、我々が健康に過ごすために必須だと感じる記事でした。
2023-06-16 16:30
nice!(0)
No.360 - ヒトの進化と苦味 [科学]
今まで、ヒトと苦味の関係について2つの記事を書きました。
No.177「自己と非自己の科学:苦味受容体」
No.178「野菜は毒だから体によい」
の2つです。No.177「自己と非自己の科学:苦味受容体」を要約すると次の通りです。
五味と総称される、甘味・酸味・塩味・苦味・うま味のうち、苦味を除く4つは、その味を引き起こす物質が決まっています。
です。この4味を感じる味覚受容体はそれぞれ1種類です。しかし苦味を引き起こす物質は多様で、それに対応して苦味受容体も複数種類あります。そしてヒトは、本来危険のサインである苦味を楽しむ文化を作ってきました。
などは世界中に広まっています。ビールもそうでしょう。ホップを使ってわざわざ苦くしている。赤ワインの味は複雑ですが、味の魅力を作るポイントの一つが苦味(=ブドウの皮由来のタンニン)であることは間違いないでしょう。
ではなぜ、本来危険のサインである苦味を楽しむ文化が広まったのでしょうか。その理由の一端が分かるのが、No.178「野菜は毒だから体によい」です。要約すると、
上にある植物の毒素は、苦味と重ならないものもありますが(カプサイシン)、重なる部分も多い。つまり、植物由来の微量毒素を摂取することと、苦いものを食べる・飲むことは密接に関係していると考えられます。
ヒトの体は(小さな)ストレスや(小さな)ダメージから回復する機能を備えています。使わない機能は衰えるのが原則です。それが必要ないと体が判断するからです。ヒトは苦いものを食べる・飲むことで、体のストレス回復機能を常時活性化させておき、それが健康維持に役立つ ・・・・・・。そういう風に考えられます。
先日の日本経済新聞に、苦味とヒトの進化をまとめた記事が掲載されました(2023年4月30日 日経 STYLE)。ヒトにとっての苦味の意味が理解できる良い記事だと思ったので、紹介します。
苦味、命の恵み
日本経済新聞の記事は、
苦味、命の恵み
と題するもので、このタイトルのもとに、次の文が続きます。
記事は2つの部分に分かれています。
です。「郷土に根ざす文化の味わい」では、日本の郷土料理を支える苦味、特に山菜料理とその歴史の紹介でした。
以下は、第2部である「ヒトへの進化支える不思議」を紹介します。
ヒトへの進化支える不思議
苦味が本来危険のサインだとすると、子供が苦い食べ物を嫌うのはヒトに備わった正常な反応でしょう。しかし「食体験を積む中である種の苦みをおいしいと学習する」のはなぜでしょうか。これは少々不思議です。なぜ味覚が変化するのか。
たとえば、甘味を考えてみると、子供が甘いものが大好きなのは人類共通だと思います。しかし大人になると甘いものを嫌う人がでてきます(大人になっても甘いもの大好きという人もいるが)。これはなぜかというと「甘いものは体によくない」「糖質のとりすぎは健康を損ねる」という "知識" を獲得するためと考えられます。
塩味もそうです。塩は料理には欠かせないし、適度な塩分は体の維持に必須です。しかし年配になると塩味が強すぎるものを嫌う人が出てくる。これは、高血圧症などの生活習慣病のリスクを避けるという "知識" からくるのだと思います。その他、酢を使った料理や飲料を好むように変わったとしたら、それも健康に良いという知識によるのでしょう。
しかし苦味は違います。「苦味が健康に良い」という "知識" が広まっているとは思えません。それでもなおかつ大人になると苦味を好むのは、もちろん、コーヒーや緑茶やビールを飲むという文化・習慣が根付いていて、それに馴染むわけです。ではなぜそういう文化・習慣が根付いたかと言うと、体が苦いものを欲するようになるからではないでしょうか。
苦味は本来、危険のサインだけれど、長い進化や文化的伝統のなかで "安全な苦味" と分かっているものについては、その苦味にメリットがあることを自然と体得するのだと思います。
日経新聞の引用を続けます。
苦味の受容体は26種類、と書かれています。苦味物質がは多様であり、それに対応して苦味受容体の種類も多い。その多様性はヒトが進化の過程で獲得してきたものです。
NHK BS プレミアム ヒューマニエンス「"毒と薬" その攻防が進化を生む」(2023年1月31日 22:00~23:00)に早川さんが出演されて、苦味受容体の解説をされていました。それによると、霊長類の苦味受容体の種類は、
だそうです。この違いは何かというと、小型霊長類は主として昆虫食であるのに対し、大型霊長類は大きな体を維持するために苦味物質が含まれる植物の葉を食べるようになったからです。
ちなみに、ヒトとチンパンジーは約700万年前に共通の祖先から別れたのですが、その共通祖先の苦味受容体の種類数は28と推定されるそうです。つまりヒトは2種類失った。これはなぜなのでしょうか。
受容体の数を減らすことで、食べられる食物の選択肢を増やしたとの話ですが、それ以外に、肉食を始めたこと(約250~200万年前)や、加熱調理(約100万年前かそれ以前)によって、苦味を忌避する必要性が薄れたことも影響しているのでしょう。NHK の「ヒューマニエンス」でもそういう話がありました。
また、ヒトの苦味感覚には個人差があり、また苦味を受容するスタイルも多様です。
スタバのドリップコーヒーは苦くて飲めないという人がいます。私は平気ですが、飲めないという意見も理解できる。しかしそれほど "苦い" ものであっても、人々は砂糖を入れたり、ミルク、生クリームなどを入れたりして "苦味をマスキング" し、"何とかして" 飲もうとしてきた。これは、体が苦味を欲している、と考えるのが妥当だと思います。
さらに日経新聞には「料理にあえて苦味を加える」という、興味深い話があります。
辛味調味料である辛子や山葵を添える料理はいろいろあります。であれば、「ハーブソルトに、ビールの苦みや香りの元になるホップの成分を配合した」苦味調味料を添える料理があってもよいはずです。
考えてみると、焼いたり、炙ったり、焦げめをつけたりする料理がいろいろあります。これは、過度にならない苦味を足すことで食材の味をより引き立たせる意味も大きいのでしょう。さらに「稚鮎の天ぷら」のような料理を考えてみると、おいしさのポイントが鮎の内臓(ワタ)の苦味でであることは確かです。
ホップを使ったような "苦味調味料" は今まで無かったかもしれないが、実質的に同じ効果を得る料理はたくさんあるはずです。
冒頭に書いたように「苦味受容体は舌や口の中以外にも広く存在し、食べ物が直接接するはずのない鼻の苦味受容体は細菌の排除に役立っている」のは事実なので、「健康維持のために中高年になると、苦味物質を体が欲するようになる」というのが、サイエンスとしては正しいと思います。
以上のような話を読むと、野菜を品種改良して適度な苦味まで無くすとか、あるいは減少させるのは、ヒトと苦味の長い付き合いの本筋から全くはずれた行為と言えるでしょう。
要するに我々は、苦味とうまく付き合えばよいということです。
No.177「自己と非自己の科学:苦味受容体」
No.178「野菜は毒だから体によい」
の2つです。No.177「自己と非自己の科学:苦味受容体」を要約すると次の通りです。
苦味は本来、危険のサインである。 | |||||||
舌で苦味を感じるセンサー、苦味受容体は、鼻などの呼吸器系にもあり、細菌などの進入物から体を防御している。その働きは3つある。
| |||||||
さらに、苦味受容体は呼吸器系だけでなく体のあちこちにあり(たとえば小腸)、免疫機能を果たしている。 |
五味と総称される、甘味・酸味・塩味・苦味・うま味のうち、苦味を除く4つは、その味を引き起こす物質が決まっています。
:糖 | |
:酸=水素イオン | |
:塩=ナトリウムイオン | |
:アミノ酸 |
です。この4味を感じる味覚受容体はそれぞれ1種類です。しかし苦味を引き起こす物質は多様で、それに対応して苦味受容体も複数種類あります。そしてヒトは、本来危険のサインである苦味を楽しむ文化を作ってきました。
お茶を飲む文化 | |
コーヒーを飲む文化 |
ではなぜ、本来危険のサインである苦味を楽しむ文化が広まったのでしょうか。その理由の一端が分かるのが、No.178「野菜は毒だから体によい」です。要約すると、
植物は、動物や昆虫に食べられまいとして、毒素を生成するものが多い。 | |||||||||||
植物の毒素のあるものは、微量であればヒトの体によい影響を及ぼす。代表的なものは、
| |||||||||||
これらは微量なら体の細胞に適度なストレスを与え、細胞はそのストレスから回復しようとする(たとえば抗酸化物質の算出)。その回復機能の活性化が体に良い影響を与える。 |
上にある植物の毒素は、苦味と重ならないものもありますが(カプサイシン)、重なる部分も多い。つまり、植物由来の微量毒素を摂取することと、苦いものを食べる・飲むことは密接に関係していると考えられます。
ヒトの体は(小さな)ストレスや(小さな)ダメージから回復する機能を備えています。使わない機能は衰えるのが原則です。それが必要ないと体が判断するからです。ヒトは苦いものを食べる・飲むことで、体のストレス回復機能を常時活性化させておき、それが健康維持に役立つ ・・・・・・。そういう風に考えられます。
先日の日本経済新聞に、苦味とヒトの進化をまとめた記事が掲載されました(2023年4月30日 日経 STYLE)。ヒトにとっての苦味の意味が理解できる良い記事だと思ったので、紹介します。
苦味、命の恵み
日本経済新聞の記事は、
苦味、命の恵み
と題するもので、このタイトルのもとに、次の文が続きます。
|
記事は2つの部分に分かれています。
郷土に根ざす文化の味わい | |
ヒトへの進化支える不思議 |
です。「郷土に根ざす文化の味わい」では、日本の郷土料理を支える苦味、特に山菜料理とその歴史の紹介でした。
![]() |
埼玉県入間市の郷土料理店「ともん」で供される山菜。日本経済新聞より。 |
以下は、第2部である「ヒトへの進化支える不思議」を紹介します。
ヒトへの進化支える不思議
|
苦味が本来危険のサインだとすると、子供が苦い食べ物を嫌うのはヒトに備わった正常な反応でしょう。しかし「食体験を積む中である種の苦みをおいしいと学習する」のはなぜでしょうか。これは少々不思議です。なぜ味覚が変化するのか。
たとえば、甘味を考えてみると、子供が甘いものが大好きなのは人類共通だと思います。しかし大人になると甘いものを嫌う人がでてきます(大人になっても甘いもの大好きという人もいるが)。これはなぜかというと「甘いものは体によくない」「糖質のとりすぎは健康を損ねる」という "知識" を獲得するためと考えられます。
塩味もそうです。塩は料理には欠かせないし、適度な塩分は体の維持に必須です。しかし年配になると塩味が強すぎるものを嫌う人が出てくる。これは、高血圧症などの生活習慣病のリスクを避けるという "知識" からくるのだと思います。その他、酢を使った料理や飲料を好むように変わったとしたら、それも健康に良いという知識によるのでしょう。
しかし苦味は違います。「苦味が健康に良い」という "知識" が広まっているとは思えません。それでもなおかつ大人になると苦味を好むのは、もちろん、コーヒーや緑茶やビールを飲むという文化・習慣が根付いていて、それに馴染むわけです。ではなぜそういう文化・習慣が根付いたかと言うと、体が苦いものを欲するようになるからではないでしょうか。
苦味は本来、危険のサインだけれど、長い進化や文化的伝統のなかで "安全な苦味" と分かっているものについては、その苦味にメリットがあることを自然と体得するのだと思います。
日経新聞の引用を続けます。
|
苦味の受容体は26種類、と書かれています。苦味物質がは多様であり、それに対応して苦味受容体の種類も多い。その多様性はヒトが進化の過程で獲得してきたものです。
|
NHK BS プレミアム ヒューマニエンス「"毒と薬" その攻防が進化を生む」(2023年1月31日 22:00~23:00)に早川さんが出演されて、苦味受容体の解説をされていました。それによると、霊長類の苦味受容体の種類は、
小型霊長類
大型霊長類
:20 | |
:22 | |
:16 |
:25 | |
:28 | |
:26 |
だそうです。この違いは何かというと、小型霊長類は主として昆虫食であるのに対し、大型霊長類は大きな体を維持するために苦味物質が含まれる植物の葉を食べるようになったからです。
ちなみに、ヒトとチンパンジーは約700万年前に共通の祖先から別れたのですが、その共通祖先の苦味受容体の種類数は28と推定されるそうです。つまりヒトは2種類失った。これはなぜなのでしょうか。
|
受容体の数を減らすことで、食べられる食物の選択肢を増やしたとの話ですが、それ以外に、肉食を始めたこと(約250~200万年前)や、加熱調理(約100万年前かそれ以前)によって、苦味を忌避する必要性が薄れたことも影響しているのでしょう。NHK の「ヒューマニエンス」でもそういう話がありました。
また、ヒトの苦味感覚には個人差があり、また苦味を受容するスタイルも多様です。
|
スタバのドリップコーヒーは苦くて飲めないという人がいます。私は平気ですが、飲めないという意見も理解できる。しかしそれほど "苦い" ものであっても、人々は砂糖を入れたり、ミルク、生クリームなどを入れたりして "苦味をマスキング" し、"何とかして" 飲もうとしてきた。これは、体が苦味を欲している、と考えるのが妥当だと思います。
さらに日経新聞には「料理にあえて苦味を加える」という、興味深い話があります。
|
![]() |
東京・北青山の「Hotel's」では、メインのステーキにホップの苦味が特徴のハーブソルトを添えて提供される。 |
辛味調味料である辛子や山葵を添える料理はいろいろあります。であれば、「ハーブソルトに、ビールの苦みや香りの元になるホップの成分を配合した」苦味調味料を添える料理があってもよいはずです。
考えてみると、焼いたり、炙ったり、焦げめをつけたりする料理がいろいろあります。これは、過度にならない苦味を足すことで食材の味をより引き立たせる意味も大きいのでしょう。さらに「稚鮎の天ぷら」のような料理を考えてみると、おいしさのポイントが鮎の内臓(ワタ)の苦味でであることは確かです。
ホップを使ったような "苦味調味料" は今まで無かったかもしれないが、実質的に同じ効果を得る料理はたくさんあるはずです。
|
冒頭に書いたように「苦味受容体は舌や口の中以外にも広く存在し、食べ物が直接接するはずのない鼻の苦味受容体は細菌の排除に役立っている」のは事実なので、「健康維持のために中高年になると、苦味物質を体が欲するようになる」というのが、サイエンスとしては正しいと思います。
|
以上のような話を読むと、野菜を品種改良して適度な苦味まで無くすとか、あるいは減少させるのは、ヒトと苦味の長い付き合いの本筋から全くはずれた行為と言えるでしょう。
要するに我々は、苦味とうまく付き合えばよいということです。
2023-05-27 08:41
nice!(0)
No.359 - 高校数学で理解するガロア理論(6) [科学]
\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{#1}} \newcommand{\ol}[1]{\overline{#1}} \newcommand{\sb}{\subset} \newcommand{\sp}{\supset} \newcommand{\al}{\alpha} \newcommand{\sg}{\sigma}\newcommand{\cd}{\cdots}\)
7.8 可解な5次方程式
大多数の5次方程式のガロア群は、対称群 \(S_5\) か 交代群 \(A_5\) であり、従って可解ではありません(65G)。しかし特別な形の5次方程式は可解です。
その可解な5次方程式として \(x^5-2=0\) を取り上げ、ガロア群を分析します。この方程式の根がべき根で表現できること(=可解)はあたりまえだし、こんな "単純な" 方程式のガロア群を分析することに意味があるのかどうか、疑ってしまいます。
しかし、\(x^5-2=0\) のガロア群は可解な5次方程式のガロア群としては最も複雑なのです。方程式の "見た目の" 単純・複雑さと、ガロア群の単純・複雑さはリンクしません。以下で \(x^5-2\) のガロア群を計算します。
\(x^5-2\) のガロア群
\(1\) の原始\(5\)乗根の一つを \(\zeta\) とします。\(x^5-1=0\) は、
\((x-1)(x^4+x^3+x^2+x+1)=0\)
と因数分解できるので、\(\zeta\) は、
\(x^4+x^3+x^2+x+1=0\)
の根です。7.1節で計算したように、たとえば、
\(\zeta=\dfrac{1}{4}(-1+\sqrt{5}+i\sqrt{10+2\sqrt{5}})\)
です。また、
\(\al=\sqrt[5]{2}\)
とします。そうすると、\(x^5-2=0\) の解は、
\(\al,\:\:\al\zeta,\:\:\al\zeta^2,\:\:\al\zeta^3,\:\:\al\zeta^4\)
の5つです。\(f(x)=x^5-2\) の最小分解体 \(\bs{L}\) は、
\(\begin{eqnarray}
&&\:\:\bs{L}&=\bs{Q}(\al,\:\al\zeta,\:\al\zeta^2,\:\al\zeta^3,\:\al\zeta^4)\\
&&&=\bs{Q}(\zeta,\al)\\
\end{eqnarray}\)
です。この \(\bs{L}=\bs{Q}(\zeta,\al)\) は、\(\bs{F}=\bs{Q}(\zeta)\) として、
\(\bs{Q}\:\subset\:\bs{F}\:\subset\:\bs{L}\)
という、体の拡大で作られたものと見なせます。つまり \(\bs{L}=\bs{F}(\al)\) です。
\(\zeta\) の \(\bs{Q}\) 上最小多項式は、\(x^4+x^3+x^2+x+1\) という4次多項式なので、拡大次数は、
\([\:\bs{F}:\:\bs{Q}\:]=4\)
です。\(\bs{Q}(\zeta)\) は単拡大体であり、単拡大体の同型写像の定理(51G)によって、\(\zeta\) に作用する \(\bs{Q}\) 上の同型写像はちょうど \(4\)個あります。
\(\bs{L}=\bs{Q}(\zeta,\al)\) は \(\bs{F}=\bs{Q}(\zeta)\) 上の5次既約多項式 \(x^5-2\) の解 \(\al\) を \(\bs{F}\) に添加した単拡大体です。従って、
\([\:\bs{L}\::\:\bs{F}\:]=5\)
です。\(\bs{L}=\bs{F}(\al)\) も単拡大体であり、\(\al\) に作用する \(\bs{\bs{F}}\) 上の同型写像は \(5\)個です。
拡大次数の連鎖律(33H)により、
\([\:\bs{L}\::\:\bs{Q}\:]=[\:\bs{L}\::\:\bs{F}\:]\cdot[\:\bs{F}\::\:\bs{Q}\:]=20\)
がわかります。従って \(\mr{Gal}(\bs{L}/\bs{Q})\) の位数は \(20\) です。\(\bs{L}=\bs{Q}(\zeta,\al)\) の自己同型写像を\(20\)個見つければ、それが \(\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q})\) です。
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\)
自己同型写像は、方程式の解を共役な解に移します。\(\zeta\) は \(1\) の原始\(5\)乗根であり、4次方程式 \(x^4+x^3+x^2+x+1=0\) の解なので、
\(\zeta,\:\:\zeta^2,\:\:\zeta^3,\:\:\zeta^4\)
が互いに共役です。そこで、自己同型写像 \(\tau_i\:(i=1,2,3,4)\) を、\(\zeta\) を \(\zeta^i\) に置き換える写像、つまり、
と定義します。これを、
\(\tau_i(\zeta)=\zeta^i\:\:(i=1,2,3,4)\)
と表記します。\(\tau_i\:(i=1,2,3,4)\) の集合を、
\(G_{\large t}=\{\tau_1,\:\tau_2,\:\tau_3,\:\tau_4\}\)
とすると、\(G_{\large t}\) は \(\bs{Q}(\zeta)\) の4つの自己同型写像の集合なので、
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})=G_{\large t}\)
です。恒等写像を \(e\) とすると、
\(\tau_1=e\)
ですが、
\(\tau_2(\zeta)=\zeta^2\)
\(\begin{eqnarray}
&&\:\:\tau_2^{\:2}(\zeta)&=\tau_2(\tau_2(\zeta))=\tau_2(\zeta^2)\\
&&&=\zeta^4=\tau_4(\zeta)\\
&&\:\:\tau_2^{\:3}(\zeta)&=\tau_2(\tau_2^2(\zeta))=\tau_2(\zeta^4)\\
&&&=\zeta^8=\zeta^3=\tau_3(\zeta)\\
&&\:\:\tau_2^{\:4}(\zeta)&=\zeta^{16}=\tau_1(\zeta)\\
\end{eqnarray}\)
と計算できるので、
\(\tau_1^{\:2}=\tau_4,\:\:\tau_1^{\:3}=\tau_3,\:\:\tau_1^{\:4}=e\)
となります。従って、\(\tau_2\) を \(\tau\) と書くと、
\(G_{\large t}=\{e,\:\tau,\:\tau^2,\:\tau^3\}\)
であり、\(G_{\large t}\) は \(\tau\)(= \(\tau_2\)) を生成元とする位数 \(4\) の巡回群で、既約剰余類群 \((\bs{Z}/5\bs{Z})^{*}\) と同型です。これは一般に \(1\) の原始\(n\)乗根を \(\zeta\) としたときに、
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/n\bs{Z})^{*}\)
という 6.3節の \(\bs{\bs{Q}(\zeta)}\)のガロア群の定理(63E)からもわかります。
\((\bs{Z}/5\bs{Z})^{*}\) の生成元は \(2,\:3\) です。従って、\(G_{\large t}\) の生成元は \(\tau_2,\:\tau_3\) です。\(\tau_4\) については、
\(\tau_4(\zeta)=\zeta^4\)
\(\begin{eqnarray}
&&\:\:\tau_4^{\:2}(\zeta)&=\tau_4(\tau_4(\zeta))=\tau_4(\zeta^4)\\
&&&=\zeta^{16}=\zeta\\
\end{eqnarray}\)
なので、\(\tau_4^{\:2}=\tau_1=e\) であり、生成元ではありません。
\(\mr{Gal}(\bs{F}(\al)/\bs{F})\)
\(\bs{L}=\bs{Q}(\zeta,\al)=\bs{F}(\al)\) は \(\bs{F}=\bs{Q}(\zeta)\) 上の既約方程式 \(x^5-2=0\) の解の一つである \(\al\) を \(\bs{F}\) に添加したべき根拡大体です。\(\bs{F}\) には \(1\)の原始5乗根 \(\zeta\) が含まれるので、\(\bs{F}(\al)/\bs{F}\) はガロア拡大、かつ巡回拡大です。\(\al\) と共役な方程式の根は、
\(\al,\:\:\al\zeta,\:\:\al\zeta^2,\:\:\al\zeta^3,\:\:\al\zeta^4\)
です。そこで \(\al\) に作用する自己同型写像 \(\sg_j\:(j=0,1,2,3,4)\) を、
と定義します。これを
\(\sg_j(\al)=\al\zeta^j\)
と書きます。\(\sg_j\) の集合を、
\(G_{\large s}=\{\sg_0,\:\sg_1,\:\sg_2,\:\sg_3,\:\sg_4\}\)
とすると、\(\mr{Gal}(\bs{F}(\al)/\bs{F})=G_{\large s}\) です。また、
\(\sg_0=e\)
\(\sg_1(\al)=\al\zeta\)
\(\sg_2(\al)=\al\zeta^2=\sg_1^{\:2}(\al)\)
\(\sg_3(\al)=\al\zeta^3=\sg_1^{\:3}(\al)\)
\(\sg_4(\al)=\al\zeta^4=\sg_1^{\:4}(\al)\)
です。\(\sg_1=\sg\) と書くと、
\(G_{\large s}=\{e,\:\sg,\:\sg^2,\:\sg^3,\:\sg^4\}\)
となって、\(G_{\large t}\) は \(\sg\) を生成元とする位数 \(5\) の巡回群であり、剰余群 \(\bs{Z}/5\bs{Z}\) と同型です。なお \(5\) は素数なので、\(\sg_1\) だけでなく、\(\sg_2,\:\sg_3,\:\sg_4\) も生成元です。
\(\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q})\)
\(\sg_j\) を使って、\(\bs{F}=\bs{Q}(\zeta)\) の自己同型写像 \(\tau_i\) を \(\bs{L}=\bs{Q}(\zeta,\al)\) の自己同型写像に延長します。同型写像の延長定理(51H)により、\(\bs{Q}(\zeta,\al)\) の自己同型写像で、その作用を \(\bs{Q}(\zeta)\) に限定すると \(\tau_i\) に一致するものが必ず存在します。
\(\tau_i\) と \(\sg_j\) の合成写像を \(\sg_{ij}\) とし、
と定義します。\(\tau_i\) が先に作用します。すると、
\(\sg_{10}=\sg_0\cdot\tau_1=e\cdot e=e\)
\(\sg_{ij}(\zeta)=\tau_i(\zeta)=\zeta^i\)
\(\sg_{ij}(\al)=\sg_j(\al)=\al\zeta^j\)
となります。また、
\(\begin{eqnarray}
&&\:\:\sg_{ij}(\al\zeta)&=\sg_j\tau_i(\al\zeta)\\
&&&=\sg_j(\al\zeta^i)\\
&&&=\al\zeta^j\zeta^i\\
&&&=\al\zeta^{i+j}\\
\end{eqnarray}\)
です。このように定義した \(\sg_{ij}\) 同士の演算(=写像の合成)は \(\sg_{ij}\) で閉じています。\(\tau_i\) も \(\sg_j\) も5次方程式の解を共役な解に移す写像なので、その合成写像もまた、解を共役な解に移す写像ですが(=閉じている)、次のように計算で確認することができます。
\(\tau_i\:(i=1,2,3,4)\) は \(\tau(\)=\(\tau_2)\) を生成元とする巡回群で、\(\sg_j\:(j=0,1,2,3,4)\) は \(\sg(=\sg_1)\) を生成元とする巡回群です。ここで、
\(\tau\sg=\sg^2\tau\)
が成り立ちます。なぜなら、
\(\begin{eqnarray}
&&\:\:\tau\sg(\al\zeta)&=\tau_2\sg_1(\al\zeta)\\
&&&=\tau_2(\al\zeta\cdot\zeta)=\tau_2(\al\zeta^2)\\
&&&=\al\zeta^4\\
&&\:\:\sg^2\tau(\al\zeta)&=\sg_1^{\:2}\tau_2(\al\zeta)\\
&&&=\sg_1^{\:2}(\al\zeta^2)\\
&&&=\sg_1(\al\zeta\cdot\zeta^2)\\
&&&=\al\zeta\cdot\zeta\cdot\zeta^2\\
&&&=\al\zeta^4\\
\end{eqnarray}\)
と計算できるので、
\(\tau\sg(\al\zeta)=\sg^2\tau(\al\zeta)\)
が成り立つからです。\(\sg\) と \(\tau\) は可換ではありませんが(\(\tau\sg\neq\sg\tau\))、\(\tau\sg=\sg^2\tau\) という、いわば "弱可換性" があります("弱可換性" はここだけの言葉)。
\(\sg_{ij}\) の 2つの元 \(\sg_{ab},\:\sg_{cd}\) の合成写像は、
\(\sg_{cd}\sg_{ab}=\sg_d\tau_c\sg_b\tau_a=\sg_d(\tau_c\sg_b)\tau_a\)
ですが、\(\tau_c\sg_b\) の部分は、
\(\tau_c\sg_b=\tau\cd\tau\sg\cd\sg\)
の形をしています。この部分に弱可換性 \(\tau\sg=\sg^2\tau\) の関係を繰り返し使って、
\(\tau_c\sg_b=\sg\cd\sg\tau\cd\tau\)
の形に変形できます。ということは、
\(\sg_{cd}\sg_{ab}=\sg\cd\sg\tau\cd\tau\)
にまで変形できます。\(\sg^5=e,\:\tau^4=e\) なので、これは、
\(\sg_{cd}\sg_{ab}=\sg_j\tau_i\)
となる \(i,\:j\) が一意に決まることを示していて、合成写像は \(\sg_{ij}\) で閉じていることがわかります。
2つの写像、\(\sg_{ab}\) と \(\sg_{cd}\) の合成写像を具体的に計算してみると、
\(\begin{eqnarray}
&&\:\:\sg_{cd}\sg_{ab}(\al\zeta)&=\sg_{cd}(\al\zeta^{a+b})\\
&&&=\sg_d\tau_c(\al\zeta^{a+b})\\
&&&=\sg_d\al\zeta^{c(a+b)}\\
&&&=\al\zeta^{ac+bc+d}\\
\end{eqnarray}\)
\((1\leq a,c\leq4,\:\:0\leq b,d\leq4)\)
となります。四則演算はすべて有限体 \(\bs{F}_5\) で(= \(\mr{mod}\:5\) で)行います。
\(\sg_{(ac)(bc+d)}(\al\zeta)=\al\zeta^{ac+bc+d}\)
なので、
\(\sg_{cd}\sg_{ab}=\sg_{(ac)(bc+d)}\)
です。記述を見やすくするため、
と書きます。この記法を使うと、
[ \(c,\:d\) ][ \(a,\:b\) ]\(=\)[ \(ac,\:bc+d\) ]
となります。また、
[ \(a,\:b\) ][ \(a^{-1},\:-a^{-1}b\) ]
\(=\)[ \(aa^{-1},\:-aa^{-1}b+b\) ]
\(=\)[ \(1,\:0\) ]\(=e\)
[ \(a^{-1},\:-a^{-1}b\) ][ \(a,\:b\) ]
\(=\)[ \(a^{-1}a,\:a^{-1}b-a^{-1}b\) ]
\(=\)[ \(1,\:0\) ]\(=e\)
なので、[ \(a,\:b\) ] の逆元は、
[ \(a,\:b\) ]\(^{-1}=\)[ \(a^{-1},\:-a^{-1}b\) ]
です。\(a^{-1}\) は \(\bs{F}_5\)(ないしは\((\bs{Z}/5\bs{Z})^{*}\))での逆元で、\(1^{-1}=1\)、\(2^{-1}=3\)、\(3^{-1}=2\)、\(4^{-1}=4\) です。
以上で、演算で閉じていて、単位元と逆元の存在がいえるので、
\(\sg_{ij}\:\:(i=1,2,3,4)\:\:(j=0,1,2,3,4)\)
は群を構成することがわかります。
\(\sg_{ij}\) を共役な解の巡回置換で表現します。\(x^5-2=0\) の5つの解を \(1,\:2\:,3,\:4,\:5\) で表します。つまり、
\(1:\al,\:2:\al\zeta,\:3:\al\zeta^2,\:4:\al\zeta^3,\:5:\al\zeta^4\)
です。
\(\tau_i(\zeta)=\zeta^i\)
ですが、\(\zeta^5=1\) に注意して、\(\tau_i\) を巡回置換で表現すると、
\(\tau_1=\:e\)
\(\tau_2=(2,\:3,\:5,\:4)=\tau\)
\(\tau_3=(2,\:4,\:5,\:3)=\tau^3\)
\(\tau_4=(2,\:5)(3,\:4)=\tau^2\)
となります。同様にして、
\(\sg_j(\al)=\al\zeta^j\)
なので、
\(\sg_0=\:e\)
\(\sg_1=(1,\:2,\:3,\:4,\:5)=\sg\)
\(\sg_2=(1,\:3,\:5,\:2,\:4)=\sg^2\)
\(\sg_3=(1,\:4,\:2,\:5,\:3)=\sg^3\)
\(\sg_4=(1,\:5,\:4,\:3,\:2)=\sg^4\)
です。これらをもとに \(\sg_{ij}\) を計算すると、次のようになります。
\(\sg_{10}=\sg_0\tau_1=\:e\)
\(\sg_{20}=\sg_0\tau_2=(2,\:3,\:5,\:4)\)
\(\sg_{30}=\sg_0\tau_3=(2,\:4,\:5,\:3)\)
\(\sg_{40}=\sg_0\tau_4=(2,\:5)(3,\:4)\)
\(\sg_{11}=\sg_1\tau_1=(1,\:2,\:3,\:4,\:5)\)
\(\sg_{21}=\sg_1\tau_2=(1,\:2,\:4,\:3)\)
\(\sg_{31}=\sg_1\tau_3=(1,\:2,\:5,\:4)\)
\(\sg_{41}=\sg_1\tau_4=(1,\:2)(3,\:5)\)
\(\sg_{12}=\sg_2\tau_1=(1,\:3,\:5,\:2,\:4)\)
\(\sg_{22}=\sg_2\tau_2=(1,\:3,\:2,\:5)\)
\(\sg_{32}=\sg_2\tau_3=(1,\:3,\:4,\:2)\)
\(\sg_{42}=\sg_2\tau_4=(1,\:3)(4,\:5)\)
\(\sg_{13}=\sg_3\tau_1=(1,\:4,\:2,\:5,\:3)\)
\(\sg_{23}=\sg_3\tau_2=(1,\:4,\:5,\:2)\)
\(\sg_{33}=\sg_3\tau_3=(1,\:4,\:3,\:5)\)
\(\sg_{43}=\sg_3\tau_4=(1,\:4)(2,\:3)\)
\(\sg_{14}=\sg_4\tau_1=(1,\:5,\:4,\:3,\:2)\)
\(\sg_{24}=\sg_4\tau_2=(1,\:5,\:3,\:4)\)
\(\sg_{34}=\sg_4\tau_3=(1,\:5,\:2,\:3)\)
\(\sg_{44}=\sg_4\tau_4=(1,\:5)(2,\:4)\)
この巡回置換表示にもとづいて
[ \(c,\:d\) ][ \(a,\:b\) ]\(=\)[ \(ac,\:bc+d\) ]
を検証してみます。たとえば、
となるはずですが、
となって、確かに成り立っています。また逆元の式、
[ \(a,\:b\) ]\(^{-1}=\)[ \(a^{-1},\:-a^{-1}b\) ]
ですが、
となり、成り立っています。\(\bs{F}_5\) での演算では \(2^{-1}=3\) です。
以上により、
\(\begin{eqnarray}
&&\:\:G=\{\sg_{ij}\:| &i=1,2,3,4\\
&&&j=0,1,2,3,4\}\\
\end{eqnarray}\)
とおくと、
\(G=\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q})\)
であることがわかりました。ここで、
\(G_{\large s}=\{e,\:\sg,\:\sg^2,\:\sg^3,\:\sg^4\}\)
は \(G\) の正規部分群になります。なぜなら、\(G_{\large s}=\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q}(\zeta))\) なので、\(G_{\large s}\) の固定体は \(\bs{Q}(\zeta)\) です。一方、\(\bs{Q}(\zeta)/\bs{Q}\) はガロア拡大なので、正規性定理(53C)によって \(G_{\large s}\) は \(G\) の正規部分群になるからです。
\(G_{\large s}\) が \(G\) の正規部分群であることは、計算でも確かめられます。"弱可換性" である、
\(\tau\sg=\sg^2\tau\)
の関係を使うと、
\(\begin{eqnarray}
&&\:\:\tau G_{\large s}&=\{\tau,\:\sg^2\tau,\:\sg^4\tau,\:\sg^6\tau,\:\sg^8\tau\}\\
&&&=\{\tau,\:\sg^2\tau,\:\sg^4\tau,\:\sg\tau,\:\sg^3\tau\}\\
&&&=\{e,\:\sg^2,\:\sg^4,\:\sg,\:\sg^3\}\cdot\tau\\
&&&=G_{\large s}\tau\\
\end{eqnarray}\)
が成り立ち、これを繰り返すと、
\(\tau^iG_{\large s}=G_{\large s}\tau^i\)
が成り立ちます。\(G\) の任意の元を \(\sg^j\tau^i\) とすると、
\(\begin{eqnarray}
&&\:\:(\sg^j\tau^i)G_{\large s}&=\sg^jG_{\large s}\tau^i\\
&&&=G_{\large s}(\sg^j\tau^i)\\
\end{eqnarray}\)
となって(\(\sg^j\) と \(G_{\large s}\) は可換です)、\(G_{\large s}\) が正規部分群の定義を満たします。
また、\(G\) の任意の元 \(x\) を \(x=\sg^j\tau^i\) とし、剰余群 \(G/G_{\large s}\) の任意の元 を \(xG_{\large s}\) とすると、
\(\begin{eqnarray}
&&\:\:xG_{\large s}&=(\sg^j\tau^i)G_{\large s}=\sg^jG_{\large s}\tau^i\\
&&&=G_{\large s}\tau^i\\
\end{eqnarray}\)
となりますが、\(G_{\large s}\tau^i=\tau^iG_{\large s}\) が成り立つので、
\(\begin{eqnarray}
&&\:\:(xG_{\large s})^4&=(G_{\large s}\tau^i)^4\\
&&&=(G_{\large s})^4(\tau^i)^4\\
&&&=G_{\large s}\\
\end{eqnarray}\)
となり、剰余群 \(G/G_{\large s}\) は位数 \(4\) の巡回群です。
もともと \(G_{\large s}=\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q}(\zeta))\) であり、\(\bs{Q}(\zeta)\) の固定体は \(G_{\large s}\) でした。従って、
のガロア対応が得られました。\(G_{\large s}\) は \(G\) の正規部分群で \(G/G_{\large s}\) は巡回群、また \(G_{\large s}\) も巡回群です。従って \(G\) は可解群です。なお、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})=G_{\large t}\) です。以上をまとめると、
\(\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q}))\)
\(=G\)
\(=\{\:\sg_{ij}\:\}=\{\:\sg_j\tau_i\:\}\)
\((i=1,2,3,4)\:\:(j=0,1,2,3,4)\)
\(\sg=(1,\:2,\:3,\:4,\:5)\)
\(\sg_0=e\)
\(\sg_1=\sg\)
\(\sg_2=\sg^2\)
\(\sg_3=\sg^3\)
\(\sg_4=\sg^4\)
\(\tau=(2,\:3,\:5,\:4)\)
\(\tau_1=e\)
\(\tau_2=\tau\)
\(\tau_3=\tau^3\)
\(\tau_4=\tau^2\)
\(\begin{eqnarray}
&&G_{\large s}&=\{e,\:\sg,\:\sg^2,\:\sg^3,\:\sg^4\}\\
&&&=\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q}(\zeta)))\\
&&G_{\large t}&=\{e,\:\tau,\:\tau^2,\:\tau^3\}\\
&&&=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q}))\\
\end{eqnarray}\)
となります。
位数 \(20\) の元、\(G=\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q})\) は、(位数 \(20\)の)フロベニウス群という名前がついていて、\(F_{20}\) と表記します。フロベニウス群は、高々1点を固定する置換と恒等置換から成る群です。\(G\) は、固定する点がない \(\sg=(1,\:2,\:3,\:4,\:5)\) と、1点だけを固定する \(\tau=(2,\:3,\:5,\:4)\) の2つを生成元とする群なので、フロベニウス群です。この \(F_{20}\) の内部構造を調べます。
\(\tau_i\) には \(\{\tau_1=e,\:\tau_2,\:\tau_3,\:\tau_4\}\) の生成元とはならない \(\tau_4\) があります。\(\sg_i,\:\tau_j\) このような性格をもつのは \(\tau_4\) だけです。その \(\tau_4\) は、
\(\tau_4=(2,\:5)(3,\:4)\)
\(\tau_4^{\:2}=e\)
でした。つまり \(\{e,\:\tau_4\}\) は位数2の巡回群です。
ということは、\(\sg_1=\sg\) と \(t_4\) を生成元として、新たな群を定義できることになります。その群の元を \(\pi_{ij}\) とし、
\(\pi_{ij}=\sg^j\tau_4^i\:\:(i=0,1,\:\:j=0,\:1,\:2,\:3,\:4)\)
\(\begin{eqnarray}
&&\:\: \pi_{0j}&=\sg_j\\
&&\:\: \pi_{1j}&=\sg_j\cdot\tau_4\\
&&&=\sg_j\cdot(2,\:5)(3,\:4)\\
\end{eqnarray}\)
と定義すると、位数 \(10\) の群になります。具体的に計算してみると、
\(\pi_{00}=e\)
\(\pi_{01}=(1,\:2,\:3,\:4,\:5)\)
\(\pi_{02}=(1,\:3,\:5,\:2,\:4)\)
\(\pi_{03}=(1,\:4,\:2,\:5,\:3)\)
\(\pi_{04}=(1,\:5,\:4,\:3,\:2)\)
\(\pi_{10}=(2,\:5)(3,\:4)\)
\(\pi_{11}=(1,\:2)(3,\:5)\)
\(\pi_{12}=(1,\:3)(4,\:5)\)
\(\pi_{13}=(1,\:4)(2,\:3)\)
\(\pi_{24}=(1,\:5)(2,\:4)\)
となります。
この群は5次の2面体群であり、\(D_{10}\) で表します(\(D_5\) と書く流儀もある。幾何学の文脈では \(D_5\))。一般に 2面体群 \(D_{2n}\)(または \(D_n\))とは、裏表のある正\(n\)角形を元の形に一致するように移動する(=対称移動をする)ことを表す群です。正5角形の頂点に1から5の名前を一周する順につけると、たとえば \((1,\:2,\:3,\:4,\:5)\) は \(72^\circ\)の回転であり、\((2,\:5)(3,\:4)\) は頂点1を通る対称軸で折り返す対称移動です。3次の2面体群を1.3節で図示しました。
\(D_{10}\) は \(F_{20}\) の部分群で、位数は \(10\) です。位数が \(20\) の半分なので、半分の部分群は正規部分群の定理(65F)により、\(D_{10}\) は \(F_{20}\) の正規部分群であり、剰余群 \(F_{20}/D_{10}\) は位数が \(2\) なので巡回群です。
さらに \(D_{10}\) の部分群として \(\sg_i\:(i=0,1,2,3,4)\) があり、位数 \(5\) の巡回群です。位数 \(5\) の巡回群は \(C_5\) と表記されます。\(C_5\) の位数もまた \(D_{10}\) の半分なので、\(C_5\) は \(D_{10}\) の正規部分群であり、剰余群 \(D_{10}/C_5\) は巡回群です。結局、\(F_{20}\) には、
\(F_{20}\:\sp\:C_5\:\sp\:\{\:e\:\}\)
\(F_{20}\:\sp\:D_{10}\:\sp\:C_5\:\sp\:\{\:e\:\}\)
という部分群の列(可解列)が存在することになり、これらの部分群は可解群です。実は、可解な5次方程式のガロア群は、\(F_{20}\)、\(D_{10}\)、\(C_5\) の3つしかないことが知られています。以上のように \(x^5-2=0\) のガロア群は、可解なガロア群の全部を含んでいるのでした。
\(x^5+11x-44\)
一般的に、ある5次方程式が与えられたとき、そのガロア群を決定するには少々複雑な計算が必要です。また可解な5次方程式の解を四則演算とべき根で表現するための計算手法も複雑で、この記事では省略します。ここでは、可解な5次方程式の例をあげておきます。
\(x^5+11x-44=0\)
のガロア群は \(D_{10}\) であることが知られています。この方程式は実数解が1つで、虚数解が4つです。実数解を \(\al\) とし、Wolfram Alpha で \(\al\) の近似値と厳密値を求めてみると次のようになります。この厳密値は本当かと心配になりますが、検算してみると正しいことが分かります。
\(\begin{eqnarray}
&&\:\:\al&=1.8777502748964972576\cd\\
&&&=\dfrac{\sqrt[5]{11}}{(\sqrt[5]{5})^4}(\al_1+\al_2-\al_3+\al_4)\\
\end{eqnarray}\)
\(\al_1=\sqrt[5]{\phantom{-}75+50\sqrt{5}-12\sqrt{5-\sqrt{5}}-59\sqrt{5+\sqrt{5}}}\)
\(\al_2=\sqrt[5]{\phantom{-}75-50\sqrt{5}+59\sqrt{5-\sqrt{5}}-12\sqrt{5+\sqrt{5}}}\)
\(\al_3=\sqrt[5]{-75+50\sqrt{5}+59\sqrt{5-\sqrt{5}}-12\sqrt{5+\sqrt{5}}}\)
\(\al_4=\sqrt[5]{\phantom{-}75+50\sqrt{5}+12\sqrt{5-\sqrt{5}}+59\sqrt{5+\sqrt{5}}}\)
第5章から第7章まで、かなり長い証明のステップでしたが、可解性の必要条件(64B)、
\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つ がべき根で表されているとする。\(f(x)\) の最小分解体を \(\bs{L}\) とするとき、\(\mr{Gal}(\bs{L}/\bs{Q})\) は可解群である。
と、可解性の十分条件(75A)、
体 \(\bs{F}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{K}\) とする。\(\mr{Gal}(\bs{K}/\bs{F})=G\) とし、\(G\) は可解群とする。このとき \(f(x)=0\) の解は四則演算とべき根で表現できる。
および、具体的な5次方程式のガロア群の検討と合わせて、次が結論づけられました。
\(\bs{Q}\) 上の多項式 \(f(x)\) の最小分解体を \(\bs{L}\) とする。方程式 \(f(x)=0\) の解が四則演算とべき根で表現できるための必要十分条件は、ガロア群
\(\mr{Gal}(\bs{L}/\bs{Q})\) が可解群であることである。
5次方程式のガロア群には、可解群でないものと可解群の両方がある。従って、任意の5次方程式の解を四則演算とべき根で統一的に表現する解の公式はない。
2.整数の群
2.1 整数
自然数 \(a\) と \(b\) の最大公約数を \(\mr{gcd}(a,\:b)\) で表す。自然数 \(a\) を \(b\) で割った余りを \(r\) とすると、
\(\mr{gcd}(a,\:b)=\mr{gcd}(b,\:r)\)
である。
2変数 \(x,\:y\) の1次不定方程式を、
\(ax+by=c\)
(\(a,\:b,\:c\) は整数。\(a\neq0,\:b\neq0\))
とし、\(a\) と \(b\) の最大公約数を \(d\) とする。このとき、
\(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。
このことは1次不定方程式が3変数以上であっても成り立つ。つまり
\(a_1x_1+a_2x_2+\:\cd\:+a_nx_n=c\)
(\(a_i\) は \(0\) 以外の整数)
とし、
\(d=\mr{gcd}(a_1,a_2,\:\cd\:,\:a_n)\)
とする。このとき、
\(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。
\(0\) でない整数 \(a\) と \(b\) が互いに素とすると、1次不定方程式、
\(ax+by=1\)
は整数解をもつ。また、\(n\) を任意の整数とすると、
\(ax+by=n\)
は整数解をもつ。あるいは、任意の整数 \(n\) は、
\(n=ax+by\) \((x,\:y\) は整数)
の形で表現できる。
これは3変数以上であっても成り立つ。たとえば3変数の場合は、\(0\) でない整数 \(a,\:b,\:c\) が互いに素、つまり、
\(\mr{gcd}(a,b,c)=1\)
であるとき、\(n\) を任意の整数として、1次不定方程式、
\(ax+by+cz=n\)
は整数解を持つ。
\(a,\:b\) を整数、\(n\) を自然数とする。\(a\) を \(n\) で割った余りと、\(b\) を \(n\) で割った余りが等しいとき、
\(a\equiv b\:\:(\mr{mod}\:n)\)
と書き、\(a\) と \(b\) は「法 \(n\) で合同」という。あるいは「\(\mr{mod}\:n\) で合同」、「\(\mr{mod}\:n\) で(見て)等しい」とも記述する。
\(a,\:b,\:c,\:d\) を整数、\(n,r\) を自然数とし、
\(a\equiv b\:\:(\mr{mod}\:n)\)
\(c\equiv d\:\:(\mr{mod}\:n)\)
とする。このとき、
である。
\(n_1\) と \(n_2\) を互いに素な自然数とする。\(a_1\) と \(a_2\) を、\(0\leq a_1 < n_1,\:0\leq a_2 < n_2\) を満たす整数とする。このとき、
\(x\equiv a_1\:\:(\mr{mod}\:n_1)\)
\(x\equiv a_2\:\:(\mr{mod}\:n_2)\)
の連立方程式を満たす整数 \(x\) が存在する。この \(x\) は \(\mr{mod}\:n_1n_2\) でみて唯一である。つまり、\(0\leq x < n_1n_2\) の範囲に解が唯一存在する。
\(n_1,\:n_2,\:\cd\:,\:n_k\) を、どの2つをとっても互いに素な自然数とする。\(a_i\) を \(0\leq a_i < n_i\:\:(1\leq i\leq k)\) を満たす整数とする。このとき、
\(x\equiv a_1\:\:(\mr{mod}\:n_1)\)
\(x\equiv a_2\:\:(\mr{mod}\:n_2)\)
\(\vdots\)
\(x\equiv a_k\:\:(\mr{mod}\:n_k)\)
の連立合同方程式を満たす整数 \(x\) が存在する。この \(x\) は \(\mr{mod}\:n_1n_2\cd n_k\) でみて唯一である。つまり、\(0\leq x < n_1n_2\cd n_k\) の範囲では唯一の解が存在する。
2.2 群
集合 \(G\) が次の ① ~ ④ を満たすとき、\(G\) は群(group)であると言う。
2.3 既約剰余類群
剰余群 \(\bs{Z}/n\bs{Z}\) から、代表元が \(n\) と互いに素なものだけを選び出したものを既約剰余類という。
「既約剰余類」は、乗算に関して群になる。これを「既約剰余類群」といい、\((\bs{Z}/n\bs{Z})^{*}\) で表す。
定義により、\((\bs{Z}/n\bs{Z})^{*}\) の群位数は \(\varphi(n)\) である。\(\varphi\) はオイラー関数で、\(\varphi(n)\) は \(n\) 以下で \(n\) と互いに素な自然数の数を表す。\(n\) が素数 \(p\) の場合の群位数は \(\varphi(p)=p-1\) である。
2.4 有限体 \(\bs{\bs{F}_p}\)
\(\bs{F}_p\) 上の1次方程式、
\(ax+b=c\)
は1個の解をもつ。
\(\bs{F}_p\) 上の多項式を \(f(x)\) とする。
\(f(a)=0\) なら、\(f(x)\) は \(x-a\) で割り切れる。
\(\bs{F}_p\) 上の \(n\)次多項式を \(f_n(x)\) とする。方程式、
\(f_n(x)=0\)
の解は、高々 \(n\) 個である。
2.5 既約剰余類群は巡回群
既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) は巡回群の直積に同型である
\((\bs{Z}/n\bs{Z})^{*}\) の元を \(a\) とする。以下が成り立つ。
[補題1]
\(a^x=1\) となる \(x\:\:(1\leq x)\) が必ず存在する。\(x\) のうち最小のものを \(d\) とすると、\(d\) を \(a\) の位数(order)と呼ぶ。
[補題2]
\(a,\:a^2,\:a^3,\:\cd\:,\:a^d=1\) は 全て異なる。ないしは、
\(a^0=1,\:a,\:a^2,\:\cd\:,a^{d-1}\) は 全て異なる。
[補題3]
\(n=p\)(素数)とする。\(d\) 乗すると \(1\) になる \((\bs{Z}/p\bs{Z})^{*}\) の元は、\(a,\:a^2,\:a^3,\:\cd\:,\:a^d\) がそのすべてである。
[補題4]
\(a^x=1\) となる \(x\) は \(d\) の倍数である。
[補題5]
\(a\) の位数を \(d\) とすると、\(d\) は 群位数 の約数である。
自然数 \(n\) と素な自然数 \(a\) について、
\(a^{\varphi(n)}=1\:\:(\mr{mod}\:n)\)
が成り立つ(オイラーの定理)。\(\varphi\) はオイラー関数で、\(\varphi(n)\) は \(n\) 以下で \(n\) と互いに素な自然数の数を表す。
\(n=p\)(素数)の場合は、\(p\) と素な数 \(a\) について、
\(a^{p-1}=1\:\:(\mr{mod}\:p)\)
となる(フェルマの小定理)。
\(p\) を素数とする。\((\bs{Z}/p\bs{Z})^{*}\) において、群位数 \((p-1)\) の約数 \(d\) のすべてについて、位数 \(d\) の元が \(\varphi(d)\) 個存在する。
\(p\) を素数とするとき、\((\bs{Z}/p\bs{Z})^{*}\) には生成元が存在する。生成元とは、その位数が \((\bs{Z}/p\bs{Z})^{*}\) の群位数、\(p-1\) の元である。
\(p\) を素数とし、\((\bs{Z}/p\bs{Z})^{*}\) の元の一つを \(a\) とする。\(a\) の位数を \(d\) とし、\(d < p-1\) とする。このとき、\(d < e\) である位数 \(e\) をもつ \((\bs{Z}/p\bs{Z})^{*}\) の元が存在する。
[補題6]
\(a,\:b\) を自然数とすると、2つの数、\(a\,',\:b\,'\) をとって、
\(a\,'|a\)
\(b\,'|b\)
\(\mr{gcd}(a\,',b\,')=1\)
\(\mr{lcm}(a,b)=a\,'b\,'\)
となるようにできる。
[補題7]
\(p\) を素数とし、\((\bs{Z}/p\bs{Z})^{*}\) の元の一つを \(a\) とする。\(a\) の位数を \(d\) とし、\(a^k\:\:(1\leq k\leq p-1)\) の位数を \(e\) とすると、
\(e=\dfrac{d}{\mr{gcd}(k,d)}\)
である。
[補題8]
\(p\) を奇素数とし、\(k\) を \(p\) と素な数とする(\(\mr{gcd}(k,p)=1\))。また、整数 \(m\) を \(m\geq1\) とする。
このとき、
\((1+kp^m)^p=1+k\,'p^{m+1}\)
と表すことができて、\(k\,'\) は \(p\) と素である。
\(p\) を \(p\neq2\) の素数(=奇素数)とする。また、\(g\) を \((\bs{Z}/p\bs{Z})^{*}\) の生成元とする。
このとき \(g\) または \(g+p\) は \((\bs{Z}/p^n\bs{Z})^{*}\) の生成元である。つまり、\((\bs{Z}/p^n\bs{Z})^{*}\) には生成元が存在する。
生成元の存在2(その1)
\(p\) を奇素数とし、\(g\) を \((\bs{Z}/p\bs{Z})^{*}\) の生成元とする。また、\(g\) は、
\(g^{p-1}=1+kp\)
\(\mr{gcd}(k,p)=1\)
と表されているとする。
この条件で、\(g\) は \((\bs{Z}/p^n\bs{Z})^{*}\) の生成元でもある。
生成元の存在2(その2)
\(p\) を奇素数とし、\(g\) を \((\bs{Z}/p\bs{Z})^{*}\) の生成元とする。また、\(g\) は、
\(g^{p-1}=1+kp^m\:\:(m\geq2)\)
\(\mr{gcd}(k,p)=1\)
と表されているとする。
この条件では、\(g+p\) が \((\bs{Z}/p^n\bs{Z})^{*}\) の生成元である。
2のべき乗の既約剰余類群は、
\((\bs{Z}/2^n\bs{Z})^{*}\cong(\bs{Z}/2\bs{Z})\times(\bs{Z}/2^{n-2}\bs{Z})\)
である。つまり2つの巡回群の直積に同型である。
[補題9]
\(n\geq2\) のとき、\(5\) の \(\mr{mod}\:2^n\) での位数は \(2^{n-2}\) である。
既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) は巡回群の直積に同型である。
3.多項式と体
3.1 多項式
\(a(x)\) と \(b(x)\) が互いに素な多項式のとき、
\(a(x)f(x)+b(x)g(x)=1\)
を満たす多項式 \(f(x)\)、\(g(x)\)で、
\(\mr{deg}\:g(x)\: < \:\mr{deg}\:a(x)\)
のものが存在する。
また、\(a(x)\) と \(b(x)\) が互いに素な多項式で、\(h(x)\) が任意の多項式のとき、
\(a(x)f(x)+b(x)g(x)=h(x)\)
を満たす多項式 \(f(x)\)、\(g(x)\) で、
\(\mr{deg}\:g(x)\: < \:\mr{deg}\:a(x)\)
のものが存在する。
有理数 \(\bs{Q}\) を係数とする多項式で、\(\bs{Q}\) の範囲ではそれ以上因数分解できない多項式を \(\bs{Q}\) 上で既約な多項式という。
整数係数の多項式 \(f(x)\) が \(\bs{Q}\) 上で(=有理数係数の多項式で)因数分解できれば、整数係数でも因数分解できる。
\(p(x)\) を既約多項式とし、\(f(x),\:g(x)\) を多項式とする。\(f(x)g(x)\) が \(p(x)\) で割り切れるなら、\(f(x),\:g(x)\) の少なくとも1つは \(p(x)\) で割り切れる。
\(p(x)\) を既約多項式とし、\(g(x)\) を多項式とする。\((g(x))^2\) が \(p(x)\) で割り切れるなら、\(g(x)\) は \(p(x)\) で割り切れる。また、\((g(x))^k\:\:(2\leq k)\) が \(p(x)\) で割り切れるなら、\(g(x)\) は \(p(x)\) で割り切れる。
\(p(x)\) を \(\bs{Q}\) 上の既約多項式、\(f(x)\) を \(\bs{Q}\) 上の多項式とする。
方程式 \(p(x)=0\) と \(f(x)=0\) が(複素数の範囲で)共通の解を1つでも持てば、\(f(x)\) は \(p(x)\) で割り切れる。
\(p(x)\) を \(\bs{Q}\) 上の既約多項式、\(f(x)\) を \(\bs{Q}\) 上の多項式とする。
\(f(x)\) の次数が1次以上で \(p(x)\) の次数未満のとき、方程式 \(p(x)=0\) と \(f(x)=0\) は(複素数の範囲で)共通の解を持たない。
\(p(x)\) を \(\bs{Q}\) 上の既約多項式とすると、方程式 \(p(x)=0\) は(複素数の範囲で)重解を持たない。
\(\al\) を 方程式の解とする。\(\al\) を解としてもつ、体 \(\bs{Q}\) 上の方程式のうち、次数が最小の多項式を、\(\al\) の \(\bs{Q}\) 上の最小多項式と言う。
\(\bs{Q}\) 上の方程式、\(f(x)=0\) が \(\al\) を解としてもつとき、
の2つは同値である。
3.2 体
体 \(\bs{Q}\) 上の多項式 \(f(x)\) を、
\(f(x)=(x-\al_1)(x-\al_2)\cd(x-\al_n)\)
と、1次多項式で因数分解したとき、
\(\bs{Q}(\al_1,\:\al_2,\:\cd\:,\:\al_n)\)
を \(f(x)\) の最小分解体と言う。\(f(x)\) は既約多項式でなくてもよい。
\(\bs{Q}\) 上の方程式の解をいくつか添加した代数拡大体 \(\bs{K}\) は単拡大である。つまり \(\bs{K}\) の元 \(\theta\) があって、\(\bs{K}=\bs{Q}(\theta)\) となる。この \(\theta\) を原始元という。
ある代数的数 \(\al\) の \(\bs{Q}\) 上の最小多項式が \(n\)次多項式 \(f(x)\) であるとする。このとき 体 \(\bs{K}\) を、
と定義すると、\(\bs{K}\) は体になり、\(\bs{K}=\bs{Q}(\al)\) である。その元の表し方は一意である。
3.3 線形空間
集合 \(V\) と 体 \(\bs{K}\) が次を満たすとき、\(V\) を \(\bs{\bs{K}}\) 上の線形空間(=ベクトル空間。linear space / vector space)と言う。
加算の定義
\(V\) の任意の元 \(u,\:v\) に対して \((u+v)\in V\) が定義されていて、この加算(\(+)\) の定義に関して \(V\) は可換群である。すなわち、
\((1)\) 単位元の存在
スカラー倍の定義
\(V\) の任意の元 \(u\) と \(\bs{K}\) の任意の元 \(k\) に対して、スカラー倍 \(ku\in V\) が定義されていて、加算との間に次の性質がある。\(u,\:v\) を \(V\) の元、\(k,\:m\) を \(\bs{K}\) の元とし、\(\bs{K}\) の乗法の単位元を \(1\) とする。
\((1)\:\:k(mu)=(km)u\)
\((2)\:\:(k+m)u=ku+mu\)
\((3)\:\:k(u+v)=ku+kv\)
\((4)\:\:1v=v\)
1次独立
線形空間 \(V\) の元の組、\(\{v_1,v_2,\cd,v_n\}\) に対して、
\(a_1v_1+a_2v_2+\)..\(+a_nv_n=0\)
を満たす \(\bs{K}\) の元 \(a_1,a_2,\cd,a_n\) が、\(a_1=a_2=\cd=a_n=0\) しかないとき、\(\{v_1,v_2,\cd,v_n\}\) は1次独立であるという。
1次従属
1次独立でないときが1次従属である。つまり、線形空間 \(V\) の元の組、\(\{v_1,v_2,\cd,v_n\}\) に対して、
\(a_1v_1+a_2v_2+\)..\(+a_nv_n=0\)
を満たす、少なくとも一つは \(0\) でない \(\bs{K}\) の元 \(a_1,a_2,\cd,a_n\) があるとき、\(\{v_1,v_2,\cd,v_n\}\) は1次従属であるという。
線形空間 \(V\) の元の組、\(\{v_1,v_2,\cd,v_n\}\) に対して、次の2つが満たされるとき、\(\{v_1,v_2,\cd,v_n\}\) を基底という。
基底から1つの元を除外したものは基底ではなくなる。また基底に1つの元を加えたものも基底ではない。
\(\{u_1,u_2,\cd,u_m\}\) と \(\{v_1,v_2,\cd,v_n\}\) がともに線形空間 \(V\) の基底であるとき、\(m=n\) である。
線形空間の基底に含まれる元の数が有限個のとき、その個数を線形空間の次元と言う。次元は基底の取り方によらない。
\(\bs{Q}\) 上の \(n\)次既約多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の解の一つを \(\al\) とする。単拡大体である \(\bs{Q}(\al)\) は \(\bs{Q}\) 上の \(n\)次元線形空間であり、\(\{1,\:\al,\:\al^2,\:\cd\:,\al^{n-1}\}\) は \(\bs{Q}(\al)\) の基底である。
代数拡大体 \(\bs{F},\:\bs{K}\) が \(\bs{F}\:\subset\:\bs{K}\) であるとき、\(\bs{K}\) は \(\bs{F}\) 上の線形空間である。\(\bs{K}\) の次元を、\(\bs{K}\)の(\(\bs{F}\)からの)拡大次数といい、
\([\:\bs{K}\::\:\bs{F}\:]\)
で表す。
代数拡大体 \(\bs{F},\:\bs{M},\:\bs{K}\) が \(\bs{F}\:\subset\:\bs{M}\:\subset\:\bs{K}\) であるとき、
\([\:\bs{K}\::\:\bs{F}\:]=[\:\bs{K}\::\:\bs{M}\:][\:\bs{M}\::\:\bs{F}\:]\)
が成り立つ。
体 \(\bs{K}_0\) と 体 \(\bs{K}\) があり、\(\bs{K}_0\:\subset\:\bs{K}\) を満たしている。\(\bs{K}_0\) と \(\bs{K}\) が有限次元であり、その次元が同じであれば、\(\bs{K}_0=\bs{K}\) である。
4.一般の群
4.1 部分群\(\bs{\cdot}\)正規部分群、剰余類\(\bs{\cdot}\)剰余群
群 \(G\) の2つの部分集合を \(H,\:N\) とする。\(H\) と \(N\) の演算結果である \(G\) の部分集合、\(HN\) を次の式で定義する。
\(HN\:=\:\{\:hn\:|\:h\in H,\:n\in N,\:hn\) は群の演算定義による \(\}\)
群 \(G\) の元の演算では結合則が成り立つから、部分集合の演算でも結合則が成り立つ。つまり \(H_1,\:H_2,\:H_3\) をを3つの部分群とすると、
\((H_1H_2)H_3=H_1(H_2H_3)\)
である。部分集合の元は \(1\)つでもよいから、\(x\) が \(G\) の元で \(x\) だけの部分集合を \(\{x\}\) とすると、
\(H_1(\{x\}H_2)=(H_1\{x\})H_2\)
である。これを、
\(H_1(xH_2)=(H_1x)H_2\)
と記述する。
群 \(G\) の部分集合を \(N\) とし、\(N\) の任意の2つの元を \(x,\:y\) とする。
\(xy\in N,\:x^{-1}\in N\)
なら、\(N\) は \(G\) の部分群である。
群 \(G\) の部分群を \(N\) とし、\(G\) の 元を \(x\) とすると、次の2つは同値である。
① \(xN\:=\:N\)
② \(x\:\in\:N\)
\(G\) の部分群を \(H,\:N\) とすると、\(H\cap N\) は部分群である。
有限群 \(G\) の位数を \(n\) とし( \(|G|=n\) )、\(H\) を \(G\) の部分群とする。\(H\) に左から \(G\) のすべての元、\(g_1,\:g_2,\:\cd\:,\:g_n\) かけて、集合、
\(g_1H,\:g_2H,\:\cd\:,g_nH\)
を作る。
\(g_1H,\:g_2H,\:\cd\:,g_nH\) から、同じになる集合を集めたものを剰余類と呼ぶ。その同じになる集合から代表的なものを一つ取り出し、
\(xH\:\:(x\in G)\)
の形で剰余類を表す。\(g_1H,\:g_2H,\:\cd\:,g_nH\) から剰余類が \(d\) 個できたとし、それらを、
\(x_1H,\:x_2H,\:\cd\:,x_dH\)
とすると、
\(i\neq j\) のとき \(x_iH\:\cap\:x_jH=\phi\)
\(G=x_1H\:\cup\:x_2H\:\cup\:\cd\:\cup\:x_dH\)
である。剰余類は、群 \(G\) の元を部分群 \(H\) によって分類したものといえる。
\(x_1H,\:x_2H,\:\cd\:,x_dH\) を「左剰余類」という。同じことが \(G\) の元を右からかけたときにも成り立ち、\(Hx_1{}^{\prime},\:Hx_2{}^{\prime},\:\cd\:,Hx_d\,'\) を「右剰余類」という。
群 \(G\) の 部分群 \(H\) による剰余類の個数 \(d\) について、\(d\cdot|H|=|G|\) が成り立つ。この \(d\) を「\(G\) の \(H\) による指数」といい、\([\:G\::\:H\:]\) で表す。つまり、
\(|G|=[\:G\::\:H\:]\cdot|H|\)
である(ラグランジュの定理)。
群 \(G\) の元 \(g\) の位数(\(g^x=e\) となる最小の \(x\))を \(n\) とすると、\(n\) は群位数 \(|G|\) の約数である。
群位数が素数の群は巡回群である。
有限群 \(G\) の部分群を \(H\) とする。\(G\) の全ての元 \(g\) について、
\(gH=Hg\)
が成り立つとき、\(H\) を \(G\) の正規部分群(normal subgroup)という。正規部分群では左剰余類と右剰余類が一致する。
定義により、\(G\) および \(\{e\}\) は \(G\) の正規部分群である。また \(G\) が可換群であると、その部分群は正規部分群である。巡回群は可換群だから、巡回群の部分群は正規部分群である。
有限群 \(G\) の正規部分群を \(H\) とする。\(G\) の \(H\) による剰余類
\(x_1H,\:x_2H,\:\cd\:,x_dH\:\:(\:x_i\in G,\:d=[\:G\::\:H\:]\:)\)
は部分集合の演算の定義(41A)で群になる。この群を \(G\) の \(H\) による剰余群(quotient group)といい、\(G/H\) で表す。剰余群は商群とも言う。
巡回群の部分群による剰余群は巡回群である。
\(G\) の正規部分群を \(H\)、部分群を \(N\) とする。このとき、
が成り立つ。
4.2 準同型写像
群 \(G\) から群 \(G\,'\) への写像 \(f\) がある。\(G\) の任意の2つの元、\(x,\:y\) について、
\(f(xy)=f(x)f(y)\)
が成り立つとき、\(f\) を \(G\) から \(G\,'\) への準同型写像(homomorphism)という。右辺は群 \(G\,'\) の演算定義に従う。
また、\(f\) が全単射写像のとき、\(f\) を同型写像(isomorphism)という。群 \(G\) から \(G\,'\) への同型写像が存在するとき、\(G\) と \(G\,'\) は同型であるといい、
\(G\:\cong\:G\,'\)
で表す。
群 \(G\) から群 \(G\,'\) への準同型写像 \(f\) がある。\(G\) の元を \(f\) で移した元の集合を「\(f\) の像(image)」といい、\(\mr{Im}\:f\) と書く。\(\mr{Im}\:f\) を \(f(G)\) と書くこともある。
\(\mr{Im}\:f\) は \(G\,'\) の部分群である。
\(G\) の単位元を \(e\)、\(G\,'\) の単位元を \(e\,'\) とする。準同型写像 \(f\) によって \(e\,'\) に移る \(G\) の元の集合を「\(f\) の核(kernel)」といい、\(\mr{Ker}\:f\) と書く。
\(\mr{Ker}\:f\) は \(G\) の部分群である。
群 \(G\) から群 \(G\,'\) への準同型写像 \(f\) がある。このとき
である。
群 \(G\) から群 \(G\,'\) への準同型写像を \(f\) とする。このとき \(\mr{Ker}\:f\) は \(G\) の正規部分群である。
4.3 同型定理
群 \(G\) から群 \(G\,'\) への準同型写像 \(f\) がある。\(H=\mr{Ker}\:f\) とすると、\(G\) の \(H\) による剰余群は、\(G\) の \(f\) による像と同型である。つまり、
\(G/H\:\cong\:\mr{Im}\:f\)
が成り立つ。
群 \(G\) の正規部分群を \(H\)、部分群を \(N\) とすると、
\(N/(N\cap H)\:\cong\:NH/H\)
が成り立つ。
5.ガロア群とガロア対応
5.1 体の同型写像
体 \(\bs{K}\) から 体 \(\bs{F}\) への写像 \(f\) が全単射であり、\(\bs{K}\) の任意の元、\(x,\:y\) に対して、
\(\begin{eqnarray}
&&\:\:f(x+y)&=f(x)+f(y)\\
&&\:\:f(xy)&=f(x)f(y)\\
\end{eqnarray}\)
が成り立つとき、\(f\) を体の同型写像という。この定義による同型写像は、加法と乗法のみならず、四則演算を保存する。
特に、\(\bs{K}\) から \(\bs{K}\) への同型写像を自己同型写像という。
\(\bs{K}\) から \(\bs{F}\) への同型写像が存在するとき、体 \(\bs{K}\) と 体 \(\bs{F}\) は同型であるといい、\(\bs{K}\:\cong\:\bs{F}\) で表す。
体 \(\bs{K}\) と \(\bs{F}\) がともに \(\bs{Q}\) を含むとき、\(a\in\bs{Q}\) に対して、
\(f(a)=a\)
である。つまり有理数は同型写像で不変である。
変数 \(x\) の多項式(係数は \(\bs{Q}\) の元)を分母・分子とする分数式を、\(\bs{Q}\) 上の有理式という。
体 \(\bs{K}\) と 体 \(\bs{F}\) は \(\bs{Q}\) を含むものとする。\(\sg\) を \(\bs{K}\) から \(\bs{F}\) への同型写像とし、\(a\) を \(\bs{K}\) の元とする。\(f(x)\) を \(\bs{Q}\) 上の有理式とすると、
\(\sg(f(a))=f(\sg(a))\)
である。これは多変数の有理式でも成り立つ。\(a_1,a_2,\cd,a_n\) を \(\bs{K}\) の元、\(f(x_1,x_2,\cd,x_n)\) を \(\bs{Q}\) 上の有理式とすると、
\(\sg(f(a_1,a_2,\cd,a_n))=f(\sg(a_1),\sg(a_1),\cd,\sg(a_n))\)
である。
\(\bs{Q}\) を含む体を \(\bs{K}\) とし、\(\bs{K}\)の拡大体を \(\bs{F}\:,\bs{F}\,'\) とする。\(\sg\) を \(\bs{K}\) を不変にする \(\bs{F}\) から \(\bs{F}\,'\) への同型写像とし、\(a\) を \(\bs{F}\) の元とする。\(f(x)\) を \(\bs{K}\) 上の有理式とすると、
\(\sg(f(a))=f(\sg(a))\)
である。
\(\sg\) を体 \(\bs{K}\) から 体 \(\bs{F}\) への同型写像とする。\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つを\(\al\)とし、\(\al\)は \(\bs{K}\) の元とする。すると \(\sg(\al)\) も \(f(x)=0\) の解である。
\(\sg\) を体 \(\bs{K}\) から 体 \(\bs{F}\) への同型写像とし、\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。方程式 \(f(x)=0\) の \(n\)個の解を \(\al_1,\al_2,\cd,\al_n\) とし、これらが全て \(\bs{K}\) に含まれるとする。
すると \(\sg(\al_1),\sg(\al_2),\cd,\sg(\al_n)\) は、\(\al_1,\al_2,\cd,\al_n\) を入れ替えたものである。
\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。\(\al,\:\beta\) を方程式 \(f(x)=0\) の異なる解とする。
すると \(\sg(\al)=\beta\) を満たす \(\bs{Q}(\al)\) から \(\bs{Q}(\beta)\) への唯一の同型写像 \(\sg\) が存在する。
\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。\(f(x)=0\) の全ての解を \(\al_1=\al,\:\al_2,\:\cd\:,\al_n\) とする。このとき \(\bs{Q}(\al)\) に作用する同型写像は \(n\)個あり、それらは、
\(\sg_i(\al)=\al_i\) \((1\leq i\leq n)\)
で定められ、\(\sg_i\) は \(\bs{Q}(\al)\) から \(\bs{Q}(\al_i)\) への同型写像となる。
\(\bs{Q}\) 上の \(n\)次既約多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の解の一つを \(\al\) とする。
\(\bs{\bs{Q}(\al)}\) 上の \(m\)次既約多項式を \(g(x)\) とし、方程式 \(g(x)=0\) の解の一つを \(\beta\) とする。また、\(\bs{Q}(\al)\) の同型写像の一つを \(\tau\) とする。
このとき、\(\tau\) は \(\bs{Q}(\al,\beta)\) の同型写像 \(\sg_j\) に延長できる。延長とは、\(\sg_j\) の作用を \(\bs{Q}(\al)\) に限定した写像の作用が \(\tau\) と一致することを言う。\(\tau\) を延長した同型写像 \(\sg_j\) は \(m\)個ある(\(0\leq j < m\))。
5.2 ガロア拡大とガロア群
ガロア拡大は次のように定義される。この2つの定義は同値である。
\(\bs{K}/\bs{F}\) がガロア拡大のとき、\(\bs{\bs{F}}\) を不変にする \(\bs{K}\) の自己同型写像の集合は群になる。これをガロア群といい、\(\mr{Gal}(\bs{K}/\bs{F})\) で表す。
\(\bs{Q}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\)、ガロア群を \(G\) とするとき、\([\:\bs{L}\::\:\bs{Q}\:]=|G|\) である。
\(\bs{F}\) を代数拡大体とし、\(\bs{F}\) のガロア拡大を \(\bs{L}\) とする。\(\bs{L}\) のガロア群の位数は \(\bs{F}\) から \(\bs{L}\) への拡大次数に等しい。つまり、
\([\:\bs{L}\::\:\bs{F}\:]=|\mr{Gal}(\bs{L}/\bs{F})|\)
である。
\(\bs{K}\) を \(\bs{F}\) のガロア拡大体とし、\(\bs{M}\) を \(\bs{F}\subset\bs{M}\subset\bs{K}\) である任意の体(=中間体)とするとき、\(\bs{K}\) は \(\bs{M}\) のガロア拡大体でもある。
5.3 ガロア対応
体 \(\bs{F}\) 上の方程式の最小分解体(=ガロア拡大体)を \(\bs{K}\) とし、ガロア群を \(G\) とする。\(G\) の部分群 \(H\) によって不変な \(\bs{K}\) の元の集合 \(\bs{M}\) は体になる。これを \(\bs{K}\) における \(H\) の固定体といい、\(\bs{K}(H)\) で表す(または \(\bs{K}^H\))。
また \(\bs{K}\) の中間体 \(\bs{M}\) のすべての元を不変にする \(G\) の部分集合 \(H\) は群になる。これを \(G\) における \(\bs{M}\) の固定群と呼び、\(G(\bs{M})\) で表す(または \(G^M\))。
\(\bs{F}\) のガロア拡大体を \(\bs{K}\) とし、ガロア群を \(G\) とする。\(G\) の任意の部分群を \(H\) とし、\(H\) による \(\bs{K}\) の固定体 \(\bs{K}(H)\) を \(\bs{M}\) とする(次式)。
\(\begin{eqnarray}
&&G\:\sp\:H &\sp\:\{e\}\\
&&\bs{F}\:\subset\:\bs{K}(H)=\bs{M} &\subset\:\bs{K}\\
\end{eqnarray}\)
\(\bs{M}\)の固定群を \(G(\bs{M})\) とする(次式)。ガロア群の定義により \(G(\bs{M})=\mr{Gal}(\bs{K}/\bs{M})\) である。
\(\begin{eqnarray}
&&\bs{F}\:\subset\:\bs{M} &\subset\:\bs{K}\\
&&G\:\sp\:G(\bs{M}) &\sp\:\{e\}\\
\end{eqnarray}\)
このとき、
\(G(\bs{M})=H\)
つまり、
\(\begin{eqnarray}
&&\:\:\mr{Gal}(\bs{K}/\bs{M})&=H \\
&&\:\:\bs{K}(G(\bs{M}))&=\bs{M}\\
\end{eqnarray}\)
が成り立つ。
\(\bs{Q}\) のガロア拡大を \(\bs{K}\) とし、\(\mr{Gal}(\bs{K}/\bs{Q})=G\) とする。\(\bs{K}\) の中間体 \(\bs{M}\) と \(G\) の部分群 \(H\) がガロア対応になっているとする。このとき
の2つは同値である。また、これが成り立つとき、
\(\mr{Gal}(\bs{M}/\bs{Q})\:\cong\:G/H\)
という群の同型が成り立つ。
6.可解性の必要条件
6.1 可解群
群 \(G\) から 単位元 \(e\) に至る部分群の列、
があって、\(H_{i+1}\) は \(H_i\) の正規部分群であり、剰余群 \(H_i/H_{i+1}\) が巡回群であるとき、\(G\) を可解群(solvable group)と言う。
\(H_{i+1}\) が \(H_i\) の正規部分群であるとき、\(H_i\) を正規列と言う。また、\(H_i/H_{i+1}\) が巡回群のとき、\(H_i\) を可解列という。
巡回群は可解群である。また、巡回群の直積も可解群である。
可解群の部分群は可解群である。
可解群の準同型写像による像は可解群である。
このことより、
可解群の剰余群は可解群
であることが分かる。なぜなら、群 \(G\) の部分群を \(N\) とすると、\(G\) から \(G/N\) への自然準同型、つまり \(x\in G\) として、
\(x\:\longmapsto\:xN\)
の準同型写像を定義できるからである。
6.2 巡回拡大
\(\bs{Q}\) のガロア拡大を \(\bs{K}\) とする。\(\mr{Gal}(\bs{K}/\bs{Q})\) が巡回群のとき、\(\bs{K}/\bs{Q}\) を巡回拡大(cyclic extension)と言う。
\(\bs{Q}\) の拡大体を \(\bs{K}\) とする。
となる拡大列があって(\(k > 1\))、\(\bs{K}_{i+1}/\bs{K}_i\:(0\leq i < k)\) が巡回拡大のとき、\(\bs{K}/\bs{Q}\) は累巡回拡大であると言う。ただし、\(\bs{\bs{K}/\bs{Q}}\) が累巡回拡大だとしても、\(\bs{\bs{K}/\bs{Q}}\) がガロア拡大であるとは限らない。
\(\bs{Q}\) のガロア拡大を \(\bs{K}\)、そのガロア群を \(G\) とする。このとき、
の2つは同値である。
6.3 原始\(\bs{n}\)乗根を含む体とべき根拡大
1の原始\(n\)乗根を \(\zeta\) とする。このとき
・\(\bs{Q}(\zeta)/\bs{Q}\) はガロア拡大
・\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\:\cong\:(\bs{Z}/n\bs{Z})^{*}\)
が成り立つ。
\(x^n-1=0\) の \(n\)個の解のうち、\(n\)乗して初めて \(1\) になる解を \(1\)の原始\(n\)乗根という。
原始\(n\)乗根は \(\varphi(n)\) 個ある。\(\varphi(n)\) はオイラー関数で、\(n\) と互いに素である \(n\) 以下の自然数の数を表す。
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、
\(\zeta^m\:\:(1\leq m\leq n)\)
は、\(1\) の\(n\)乗根の全体を表す。また、
\(\zeta^m\:\:(\mr{gcd}(m,n)=1)\)
は、\(1\) の原始\(n\)乗根の全体を表す。
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とする。\(\zeta\) の最小多項式を \(f(x)\) とし、\(k\) を \(n\) とは素な数とする。
このとき \(f(\zeta^k)=0\) である。
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とし、\(\zeta\) の最小多項式を \(f(x)\) とすると、\(f(x)\) は円分多項式である。円分多項式とは、方程式 \(f(x)=0\) が \(\varphi(n)\) 個の解をもち、それらすべてが 原始\(n\)乗根 である多項式である。
従って、原始\(n\)乗根は互いに共役である。最小多項式は既約多項式なので、円分多項式は既約多項式である。
\(\bs{Q}\) に \(\zeta\) を添加した単拡大体 \(\bs{Q}(\zeta)\) は \(f(x)\) の最小分解体であり、\(\bs{Q}(\zeta)/\bs{Q}\) はガロア拡大である。
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/n\bs{Z})^{*}\)
である。つまり \(1\) の原始\(n\)乗根の一つを \(\bs{Q}\) に添加した拡大体のガロア群は、既約剰余類群に同型である。
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は巡回群の直積と同型である。
従って、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は可解群であり(61B)、累巡回拡大である(62C)。
\(\bs{K}\) 上の方程式 \(x^n-a=0\:(a\in\bs{K}\)、\(a\neq1)\) の解の一つで、\(\bs{K}\) に含まれないものを \(\sqrt[n]{a}\) とするとき、\(\bs{K}(\sqrt[n]{a})\) を \(\bs{K}\) のべき根拡大(radical extension)と呼ぶ。
また、\(\bs{K}\) からのべき根拡大を繰り返して拡大体 \(\bs{F}\) ができるとき、\(\bs{F}/\bs{K}\) を累べき根拡大と言う。
\(1\) の原始\(n\)乗根を \(\zeta\) とし、\(\bs{K}\) に \(\zeta\) が含まれるとする。\(\bs{K}\) 上の方程式 \(x^n-a=0\:(a\in\bs{K}\)、\(a\neq1)\) の解の一つで、\(\bs{K}\) に含まれないものを \(\sqrt[n]{a}\) とし、\(\bs{L}=\bs{K}(\sqrt[n]{a})\) とすると、
が成り立つ。
6.4 可解性の必要条件
\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つである \(\al\) がべき根で表されているとする。このとき「\(\bs{Q}\) のガロア拡大 \(\bs{E}\) で、\(\al\) を含み、\(\bs{E}/\bs{Q}\) が累巡回拡大」であるような 代数拡大体 \(\bs{E}\) が存在する。
\(\bs{Q}\) 上の \(n\)次既約方程式 \(f(x)=0\) の解の一つ がべき根で表されているとする。\(f(x)\) の最小分解体を \(\bs{L}\) とするとき、\(\mr{Gal}(\bs{L}/\bs{Q})\) は可解群である。
6.5 5次方程式の解の公式はない
すべての置換は共通文字を含まない巡回置換の積で表せる。
すべての置換は互換の積で表せる。
一つの置換を互換の積で表したとき、その互換の数は奇数か偶数かのどちらかに決まる。
\(S_n\) の元は同数の偶置換と奇置換から成る。従って、
\([\:S_n\::\:A_n\:]=2\)
である。
\(A_n\) は \(S_n\) の正規部分群であり、\(S_n/A_n\) は巡回群である。
交代群 \(A_n\) の任意の元は、3文字の巡回置換の積で表せる。
群 \(G\) の部分群を \(N\) とする。
\(|G|=2|N|\)
のとき(つまり 群の指数 \([G:N]=2\) のとき)、\(N\) は \(G\) の正規部分群である。
5次以上の対称群、\(S_n\:\:(n\geq5)\) は可解群ではない。
\(\bs{Q}\) の代数拡大体を \(\bs{K}\) とする。\(\bs{K}\) の任意の元である\(k\)5つの変数 \(b_1,b_2,b_3,b_4,b_5\) を根とする多項式を、
\(\begin{eqnarray}
&&\:\:f(x)&=(x-b_1)(x-b_2)(x-b_3)(x-b_4)(x-b_5)\:\:(b_i\in\bs{K})\\
&&&=x^5-a_4x^4+a_3x^3-a_2x^2+a_1x-a_0\\
\end{eqnarray}\)
とし、\(\bs{Q}\) に \(a_0,a_1,a_2,a_3,a_4,\)を添加した代数拡大体を \(\bs{F}\) とする。つまり、
\(\bs{F}=\bs{Q}(a_0,\:a_1,\:a_2,\:a_3,\:a_4)\)
である。
このとき、\(\bs{K}\) の \(\bs{F}\) 上の ガロア群 \(G\) は5次対称群 \(S_5\) である。\(S_5\) は可解群ではないので(65G)、従って \(b_i\) を \(a_i\) のべき根で表すことはできない。
6.6 可解ではない5次方程式
群 \(G\) の位数 \(|G|\) が素数 \(p\) を約数にもつとき、\(g^p=e\:\:(g\neq e)\) となる \(G\) の元 \(g\) が存在する。つまり、\(G\) は位数 \(p\) の巡回群を部分群としてもつ。
\(f(x)\) を既約な5次多項式とする。方程式 \(f(x)=0\) が複素数解を2つ、実数解を3つもつなら、方程式は可解ではない。
7.可解性の十分条件
7.1 1の原始\(\bs{n}\)乗根
\(1\) の 原始\(n\)乗根はべき根で表現できる。
7.2 べき根拡大の十分条件のため補題
\(\bs{L}\) を \(\bs{K}\) のガロア拡大とし、\(\mr{Gal}(\bs{L}/\bs{K})\) を \(\sg\) で生成される位数 \(n\) の巡回群とする。式 \(g(x)\) を、
と定義する。このとき、\(\bs{L}\) の全ての元 \(x\) について、\(g(x)=0\) となるような \(\bs{L}\) の元、\(a_1,\:a_2,\:\cd\:,a_{n-1}\) は存在しない。
\(\zeta\) を \(1\) の原始\(n\)乗根とし、\(\zeta\)を含む代数体を \(\bs{K}\) とする。\(\bs{K}\) のガロア拡大体を \(\bs{L}\) とし、\(\mr{Gal}(\bs{L}/\bs{K})\) は \(\sg\) で生成される位数 \(n\) の巡回群とする(= \(\bs{L}/\bs{K}\) が巡回拡大)。また \(f(x)\) を \(\bs{K}\) 上の \(n\)次既約多項式とし、\(\bs{L}\) が方程式 \(f(x)=0\) の解 \(\theta\) を用いて、\(\bs{L}=\bs{K}(\theta)\) と表されているものとする。このとき、
\(g(x)=x+\zeta^{n-1}\sg(x)+\zeta^{n-2}\sg^2(x)+\cd+\zeta\sg^{n-1}(x)\)
とおくと、\(g(\theta),\:g(\theta^2),\:\cd\:,g(\theta^{n-1})\) のうち少なくとも一つは \(0\) ではない。
7.3 べき根拡大の十分条件
1の原始\(n\)乗根を \(\zeta\) とし、代数体 \(\bs{\bs{K}}\) には \(\bs{\zeta}\) が含まれるとする。\(\bs{L}/\bs{K}\) をガロア拡大とし、\(\mr{Gal}(\bs{L}/\bs{K})\) が巡回群とする(= \(\bs{L}/\bs{K}\) が巡回拡大)。拡大次数は \([\bs{L}:\bs{K}]=n\) とする。
このとき、\(\bs{L}\) は \(\bs{K}\) のべき根拡大である。
7.4 べき根拡大と巡回拡大の同値性
\(1\) の原始\(n\)乗根を \(\zeta\) とし、代数体 \(\bs{\bs{K}}\) には \(\bs{\zeta}\) が含まれるとする。また、\(\bs{K}\) の\(n\)次拡大体を \(\bs{L}\) とする( \([\:\bs{L}\::\:\bs{K}\:]=n\) )。
このとき、
の2つは同値である。
7.5 可解性の十分条件
体 \(\bs{K}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とする。\(\mr{Gal}(\bs{L}/\bs{K})=G\) とし、\(G\) は可解群とする。
このとき \(f(x)=0\) の解は四則演算とべき根で表現できる。
7.6 位数2の巡回拡大は平方根拡大:正5角形が作図できる理由
\(p\) を素数とし、原始\(p\)乗根を \(\zeta\) とすると、
\(|\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})|=|(\bs{Z}/p\bs{Z})^{*}|=p-1\)
なので、
\(p-1=2^k\:\:(1\leq k)\)
の条件があると、\(\bs{Q}\) から \(\bs{Q}(\zeta)\) に至る「平方根拡大」の列が存在し、\(\zeta\) は四則演算と平方根 \(\sqrt{\phantom{a}}\) だけで表現できる。従って 正 \(p\)角形は定規とコンパスで作図可能である
7.可解性の十分条件(続き) |
7.8 可解な5次方程式
大多数の5次方程式のガロア群は、対称群 \(S_5\) か 交代群 \(A_5\) であり、従って可解ではありません(65G)。しかし特別な形の5次方程式は可解です。
|
しかし、\(x^5-2=0\) のガロア群は可解な5次方程式のガロア群としては最も複雑なのです。方程式の "見た目の" 単純・複雑さと、ガロア群の単純・複雑さはリンクしません。以下で \(x^5-2\) のガロア群を計算します。
\(x^5-2\) のガロア群
\(1\) の原始\(5\)乗根の一つを \(\zeta\) とします。\(x^5-1=0\) は、
\((x-1)(x^4+x^3+x^2+x+1)=0\)
と因数分解できるので、\(\zeta\) は、
\(x^4+x^3+x^2+x+1=0\)
の根です。7.1節で計算したように、たとえば、
\(\zeta=\dfrac{1}{4}(-1+\sqrt{5}+i\sqrt{10+2\sqrt{5}})\)
です。また、
\(\al=\sqrt[5]{2}\)
とします。そうすると、\(x^5-2=0\) の解は、
\(\al,\:\:\al\zeta,\:\:\al\zeta^2,\:\:\al\zeta^3,\:\:\al\zeta^4\)
の5つです。\(f(x)=x^5-2\) の最小分解体 \(\bs{L}\) は、
\(\begin{eqnarray}
&&\:\:\bs{L}&=\bs{Q}(\al,\:\al\zeta,\:\al\zeta^2,\:\al\zeta^3,\:\al\zeta^4)\\
&&&=\bs{Q}(\zeta,\al)\\
\end{eqnarray}\)
です。この \(\bs{L}=\bs{Q}(\zeta,\al)\) は、\(\bs{F}=\bs{Q}(\zeta)\) として、
\(\bs{Q}\:\subset\:\bs{F}\:\subset\:\bs{L}\)
という、体の拡大で作られたものと見なせます。つまり \(\bs{L}=\bs{F}(\al)\) です。
\(\zeta\) の \(\bs{Q}\) 上最小多項式は、\(x^4+x^3+x^2+x+1\) という4次多項式なので、拡大次数は、
\([\:\bs{F}:\:\bs{Q}\:]=4\)
です。\(\bs{Q}(\zeta)\) は単拡大体であり、単拡大体の同型写像の定理(51G)によって、\(\zeta\) に作用する \(\bs{Q}\) 上の同型写像はちょうど \(4\)個あります。
\(\bs{L}=\bs{Q}(\zeta,\al)\) は \(\bs{F}=\bs{Q}(\zeta)\) 上の5次既約多項式 \(x^5-2\) の解 \(\al\) を \(\bs{F}\) に添加した単拡大体です。従って、
\([\:\bs{L}\::\:\bs{F}\:]=5\)
です。\(\bs{L}=\bs{F}(\al)\) も単拡大体であり、\(\al\) に作用する \(\bs{\bs{F}}\) 上の同型写像は \(5\)個です。
拡大次数の連鎖律(33H)により、
\([\:\bs{L}\::\:\bs{Q}\:]=[\:\bs{L}\::\:\bs{F}\:]\cdot[\:\bs{F}\::\:\bs{Q}\:]=20\)
がわかります。従って \(\mr{Gal}(\bs{L}/\bs{Q})\) の位数は \(20\) です。\(\bs{L}=\bs{Q}(\zeta,\al)\) の自己同型写像を\(20\)個見つければ、それが \(\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q})\) です。
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\)
自己同型写像は、方程式の解を共役な解に移します。\(\zeta\) は \(1\) の原始\(5\)乗根であり、4次方程式 \(x^4+x^3+x^2+x+1=0\) の解なので、
\(\zeta,\:\:\zeta^2,\:\:\zeta^3,\:\:\zeta^4\)
が互いに共役です。そこで、自己同型写像 \(\tau_i\:(i=1,2,3,4)\) を、\(\zeta\) を \(\zeta^i\) に置き換える写像、つまり、
\(\tau_i\::\:\zeta\:\longrightarrow\:\zeta^i\) |
\(\tau_i(\zeta)=\zeta^i\:\:(i=1,2,3,4)\)
と表記します。\(\tau_i\:(i=1,2,3,4)\) の集合を、
\(G_{\large t}=\{\tau_1,\:\tau_2,\:\tau_3,\:\tau_4\}\)
とすると、\(G_{\large t}\) は \(\bs{Q}(\zeta)\) の4つの自己同型写像の集合なので、
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})=G_{\large t}\)
です。恒等写像を \(e\) とすると、
\(\tau_1=e\)
ですが、
\(\tau_2(\zeta)=\zeta^2\)
\(\begin{eqnarray}
&&\:\:\tau_2^{\:2}(\zeta)&=\tau_2(\tau_2(\zeta))=\tau_2(\zeta^2)\\
&&&=\zeta^4=\tau_4(\zeta)\\
&&\:\:\tau_2^{\:3}(\zeta)&=\tau_2(\tau_2^2(\zeta))=\tau_2(\zeta^4)\\
&&&=\zeta^8=\zeta^3=\tau_3(\zeta)\\
&&\:\:\tau_2^{\:4}(\zeta)&=\zeta^{16}=\tau_1(\zeta)\\
\end{eqnarray}\)
と計算できるので、
\(\tau_1^{\:2}=\tau_4,\:\:\tau_1^{\:3}=\tau_3,\:\:\tau_1^{\:4}=e\)
となります。従って、\(\tau_2\) を \(\tau\) と書くと、
\(G_{\large t}=\{e,\:\tau,\:\tau^2,\:\tau^3\}\)
であり、\(G_{\large t}\) は \(\tau\)(= \(\tau_2\)) を生成元とする位数 \(4\) の巡回群で、既約剰余類群 \((\bs{Z}/5\bs{Z})^{*}\) と同型です。これは一般に \(1\) の原始\(n\)乗根を \(\zeta\) としたときに、
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/n\bs{Z})^{*}\)
という 6.3節の \(\bs{\bs{Q}(\zeta)}\)のガロア群の定理(63E)からもわかります。
\((\bs{Z}/5\bs{Z})^{*}\) の生成元は \(2,\:3\) です。従って、\(G_{\large t}\) の生成元は \(\tau_2,\:\tau_3\) です。\(\tau_4\) については、
\(\tau_4(\zeta)=\zeta^4\)
\(\begin{eqnarray}
&&\:\:\tau_4^{\:2}(\zeta)&=\tau_4(\tau_4(\zeta))=\tau_4(\zeta^4)\\
&&&=\zeta^{16}=\zeta\\
\end{eqnarray}\)
なので、\(\tau_4^{\:2}=\tau_1=e\) であり、生成元ではありません。
\(\mr{Gal}(\bs{F}(\al)/\bs{F})\)
\(\bs{L}=\bs{Q}(\zeta,\al)=\bs{F}(\al)\) は \(\bs{F}=\bs{Q}(\zeta)\) 上の既約方程式 \(x^5-2=0\) の解の一つである \(\al\) を \(\bs{F}\) に添加したべき根拡大体です。\(\bs{F}\) には \(1\)の原始5乗根 \(\zeta\) が含まれるので、\(\bs{F}(\al)/\bs{F}\) はガロア拡大、かつ巡回拡大です。\(\al\) と共役な方程式の根は、
\(\al,\:\:\al\zeta,\:\:\al\zeta^2,\:\:\al\zeta^3,\:\:\al\zeta^4\)
です。そこで \(\al\) に作用する自己同型写像 \(\sg_j\:(j=0,1,2,3,4)\) を、
\(\sg_j:\:\al\:\longrightarrow\:\al\zeta^j\) |
\(\sg_j(\al)=\al\zeta^j\)
と書きます。\(\sg_j\) の集合を、
\(G_{\large s}=\{\sg_0,\:\sg_1,\:\sg_2,\:\sg_3,\:\sg_4\}\)
とすると、\(\mr{Gal}(\bs{F}(\al)/\bs{F})=G_{\large s}\) です。また、
\(\sg_0=e\)
\(\sg_1(\al)=\al\zeta\)
\(\sg_2(\al)=\al\zeta^2=\sg_1^{\:2}(\al)\)
\(\sg_3(\al)=\al\zeta^3=\sg_1^{\:3}(\al)\)
\(\sg_4(\al)=\al\zeta^4=\sg_1^{\:4}(\al)\)
です。\(\sg_1=\sg\) と書くと、
\(G_{\large s}=\{e,\:\sg,\:\sg^2,\:\sg^3,\:\sg^4\}\)
となって、\(G_{\large t}\) は \(\sg\) を生成元とする位数 \(5\) の巡回群であり、剰余群 \(\bs{Z}/5\bs{Z}\) と同型です。なお \(5\) は素数なので、\(\sg_1\) だけでなく、\(\sg_2,\:\sg_3,\:\sg_4\) も生成元です。
\(\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q})\)
\(\sg_j\) を使って、\(\bs{F}=\bs{Q}(\zeta)\) の自己同型写像 \(\tau_i\) を \(\bs{L}=\bs{Q}(\zeta,\al)\) の自己同型写像に延長します。同型写像の延長定理(51H)により、\(\bs{Q}(\zeta,\al)\) の自己同型写像で、その作用を \(\bs{Q}(\zeta)\) に限定すると \(\tau_i\) に一致するものが必ず存在します。
\(\tau_i\) と \(\sg_j\) の合成写像を \(\sg_{ij}\) とし、
\(\sg_{ij}=\sg_j\cdot\tau_i\) \((i=1,2,3,4)\:\:(j=0,1,2,3,4)\) |
\(\sg_{10}=\sg_0\cdot\tau_1=e\cdot e=e\)
\(\sg_{ij}(\zeta)=\tau_i(\zeta)=\zeta^i\)
\(\sg_{ij}(\al)=\sg_j(\al)=\al\zeta^j\)
となります。また、
\(\begin{eqnarray}
&&\:\:\sg_{ij}(\al\zeta)&=\sg_j\tau_i(\al\zeta)\\
&&&=\sg_j(\al\zeta^i)\\
&&&=\al\zeta^j\zeta^i\\
&&&=\al\zeta^{i+j}\\
\end{eqnarray}\)
です。このように定義した \(\sg_{ij}\) 同士の演算(=写像の合成)は \(\sg_{ij}\) で閉じています。\(\tau_i\) も \(\sg_j\) も5次方程式の解を共役な解に移す写像なので、その合成写像もまた、解を共役な解に移す写像ですが(=閉じている)、次のように計算で確認することができます。
\(\tau_i\:(i=1,2,3,4)\) は \(\tau(\)=\(\tau_2)\) を生成元とする巡回群で、\(\sg_j\:(j=0,1,2,3,4)\) は \(\sg(=\sg_1)\) を生成元とする巡回群です。ここで、
\(\tau\sg=\sg^2\tau\)
が成り立ちます。なぜなら、
\(\begin{eqnarray}
&&\:\:\tau\sg(\al\zeta)&=\tau_2\sg_1(\al\zeta)\\
&&&=\tau_2(\al\zeta\cdot\zeta)=\tau_2(\al\zeta^2)\\
&&&=\al\zeta^4\\
&&\:\:\sg^2\tau(\al\zeta)&=\sg_1^{\:2}\tau_2(\al\zeta)\\
&&&=\sg_1^{\:2}(\al\zeta^2)\\
&&&=\sg_1(\al\zeta\cdot\zeta^2)\\
&&&=\al\zeta\cdot\zeta\cdot\zeta^2\\
&&&=\al\zeta^4\\
\end{eqnarray}\)
と計算できるので、
\(\tau\sg(\al\zeta)=\sg^2\tau(\al\zeta)\)
が成り立つからです。\(\sg\) と \(\tau\) は可換ではありませんが(\(\tau\sg\neq\sg\tau\))、\(\tau\sg=\sg^2\tau\) という、いわば "弱可換性" があります("弱可換性" はここだけの言葉)。
なお、一般化すると、
\(\tau^i\sg^j=\sg^k\tau^i\:\:(k=2^{i}j)\)
と計算できます。
\(\tau^i\sg^j=\sg^k\tau^i\:\:(k=2^{i}j)\)
と計算できます。
\(\sg_{ij}\) の 2つの元 \(\sg_{ab},\:\sg_{cd}\) の合成写像は、
\(\sg_{cd}\sg_{ab}=\sg_d\tau_c\sg_b\tau_a=\sg_d(\tau_c\sg_b)\tau_a\)
ですが、\(\tau_c\sg_b\) の部分は、
\(\tau_c\sg_b=\tau\cd\tau\sg\cd\sg\)
の形をしています。この部分に弱可換性 \(\tau\sg=\sg^2\tau\) の関係を繰り返し使って、
\(\tau_c\sg_b=\sg\cd\sg\tau\cd\tau\)
の形に変形できます。ということは、
\(\sg_{cd}\sg_{ab}=\sg\cd\sg\tau\cd\tau\)
にまで変形できます。\(\sg^5=e,\:\tau^4=e\) なので、これは、
\(\sg_{cd}\sg_{ab}=\sg_j\tau_i\)
となる \(i,\:j\) が一意に決まることを示していて、合成写像は \(\sg_{ij}\) で閉じていることがわかります。
2つの写像、\(\sg_{ab}\) と \(\sg_{cd}\) の合成写像を具体的に計算してみると、
\(\begin{eqnarray}
&&\:\:\sg_{cd}\sg_{ab}(\al\zeta)&=\sg_{cd}(\al\zeta^{a+b})\\
&&&=\sg_d\tau_c(\al\zeta^{a+b})\\
&&&=\sg_d\al\zeta^{c(a+b)}\\
&&&=\al\zeta^{ac+bc+d}\\
\end{eqnarray}\)
\((1\leq a,c\leq4,\:\:0\leq b,d\leq4)\)
となります。四則演算はすべて有限体 \(\bs{F}_5\) で(= \(\mr{mod}\:5\) で)行います。
\(\sg_{(ac)(bc+d)}(\al\zeta)=\al\zeta^{ac+bc+d}\)
なので、
\(\sg_{cd}\sg_{ab}=\sg_{(ac)(bc+d)}\)
です。記述を見やすくするため、
\(\sg_{ij}=\)[ \(i,\:j\) ]
|
と書きます。この記法を使うと、
[ \(c,\:d\) ][ \(a,\:b\) ]\(=\)[ \(ac,\:bc+d\) ]
となります。また、
[ \(a,\:b\) ][ \(a^{-1},\:-a^{-1}b\) ]
\(=\)[ \(aa^{-1},\:-aa^{-1}b+b\) ]
\(=\)[ \(1,\:0\) ]\(=e\)
[ \(a^{-1},\:-a^{-1}b\) ][ \(a,\:b\) ]
\(=\)[ \(a^{-1}a,\:a^{-1}b-a^{-1}b\) ]
\(=\)[ \(1,\:0\) ]\(=e\)
なので、[ \(a,\:b\) ] の逆元は、
[ \(a,\:b\) ]\(^{-1}=\)[ \(a^{-1},\:-a^{-1}b\) ]
です。\(a^{-1}\) は \(\bs{F}_5\)(ないしは\((\bs{Z}/5\bs{Z})^{*}\))での逆元で、\(1^{-1}=1\)、\(2^{-1}=3\)、\(3^{-1}=2\)、\(4^{-1}=4\) です。
以上で、演算で閉じていて、単位元と逆元の存在がいえるので、
\(\sg_{ij}\:\:(i=1,2,3,4)\:\:(j=0,1,2,3,4)\)
は群を構成することがわかります。
\(\sg_{ij}\) を共役な解の巡回置換で表現します。\(x^5-2=0\) の5つの解を \(1,\:2\:,3,\:4,\:5\) で表します。つまり、
\(1:\al,\:2:\al\zeta,\:3:\al\zeta^2,\:4:\al\zeta^3,\:5:\al\zeta^4\)
です。
\(\tau_i(\zeta)=\zeta^i\)
ですが、\(\zeta^5=1\) に注意して、\(\tau_i\) を巡回置換で表現すると、
\(\tau_1=\:e\)
\(\tau_2=(2,\:3,\:5,\:4)=\tau\)
\(\tau_3=(2,\:4,\:5,\:3)=\tau^3\)
\(\tau_4=(2,\:5)(3,\:4)=\tau^2\)
となります。同様にして、
\(\sg_j(\al)=\al\zeta^j\)
なので、
\(\sg_0=\:e\)
\(\sg_1=(1,\:2,\:3,\:4,\:5)=\sg\)
\(\sg_2=(1,\:3,\:5,\:2,\:4)=\sg^2\)
\(\sg_3=(1,\:4,\:2,\:5,\:3)=\sg^3\)
\(\sg_4=(1,\:5,\:4,\:3,\:2)=\sg^4\)
です。これらをもとに \(\sg_{ij}\) を計算すると、次のようになります。
\(\sg_{10}=\sg_0\tau_1=\:e\)
\(\sg_{20}=\sg_0\tau_2=(2,\:3,\:5,\:4)\)
\(\sg_{30}=\sg_0\tau_3=(2,\:4,\:5,\:3)\)
\(\sg_{40}=\sg_0\tau_4=(2,\:5)(3,\:4)\)
\(\sg_{11}=\sg_1\tau_1=(1,\:2,\:3,\:4,\:5)\)
\(\sg_{21}=\sg_1\tau_2=(1,\:2,\:4,\:3)\)
\(\sg_{31}=\sg_1\tau_3=(1,\:2,\:5,\:4)\)
\(\sg_{41}=\sg_1\tau_4=(1,\:2)(3,\:5)\)
\(\sg_{12}=\sg_2\tau_1=(1,\:3,\:5,\:2,\:4)\)
\(\sg_{22}=\sg_2\tau_2=(1,\:3,\:2,\:5)\)
\(\sg_{32}=\sg_2\tau_3=(1,\:3,\:4,\:2)\)
\(\sg_{42}=\sg_2\tau_4=(1,\:3)(4,\:5)\)
\(\sg_{13}=\sg_3\tau_1=(1,\:4,\:2,\:5,\:3)\)
\(\sg_{23}=\sg_3\tau_2=(1,\:4,\:5,\:2)\)
\(\sg_{33}=\sg_3\tau_3=(1,\:4,\:3,\:5)\)
\(\sg_{43}=\sg_3\tau_4=(1,\:4)(2,\:3)\)
\(\sg_{14}=\sg_4\tau_1=(1,\:5,\:4,\:3,\:2)\)
\(\sg_{24}=\sg_4\tau_2=(1,\:5,\:3,\:4)\)
\(\sg_{34}=\sg_4\tau_3=(1,\:5,\:2,\:3)\)
\(\sg_{44}=\sg_4\tau_4=(1,\:5)(2,\:4)\)
この巡回置換表示にもとづいて
[ \(c,\:d\) ][ \(a,\:b\) ]\(=\)[ \(ac,\:bc+d\) ]
を検証してみます。たとえば、
\(\sg_{23}\sg_{42}\) | \(=\)[ \(2,\:3\) ][ \(4,\:2\) ] | |
\(=\)[ \(8,\:7\) ]\(=\)[ \(3,\:2\) ] | ||
\(=\sg_{32}\) |
\(\sg_{42}\) | \(=(1,\:3)(4,\:5)\) | |
\(=\left(\begin{array}{c}1&2&3&4&5\\3&2&1&5&4\end{array}\right)\) | ||
\(\sg_{23}\) | \(=(1,\:4,\:5,\:2)\) | |
\(=\left(\begin{array}{c}3&2&1&5&4\\3&1&4&2&5\end{array}\right)\) |
\(\sg_{23}\sg_{42}\) | \(=\left(\begin{array}{c}1&2&3&4&5\\3&1&4&2&5\end{array}\right)\) | |
\(=(1\:3\:4\:2)=\sg_{32}\) |
となって、確かに成り立っています。また逆元の式、
[ \(a,\:b\) ]\(^{-1}=\)[ \(a^{-1},\:-a^{-1}b\) ]
ですが、
\(\sg_{23}^{\:\:-1}\) | \(=\)[ \(2,\:3\) ]\(^{-1}\) | |
\(=\)[ \(3,\:-3\cdot3\) ]\(=\)[ \(3,\:-9\) ] | ||
\(=\)[ \(3,\:1\) ]\(=\sg_{31}\) | ||
\(=(1,\:2,\:5,\:4)\) | ||
\(\sg_{23}^{\:\:-1}\) | \(=(1,\:4,\:5,\:2)^{-1}\) | |
\(=(2,\:5,\:4,\:1)\) | ||
\(=(1,\:2,\:5,\:4)\) |
となり、成り立っています。\(\bs{F}_5\) での演算では \(2^{-1}=3\) です。
以上により、
\(\begin{eqnarray}
&&\:\:G=\{\sg_{ij}\:| &i=1,2,3,4\\
&&&j=0,1,2,3,4\}\\
\end{eqnarray}\)
とおくと、
\(G=\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q})\)
であることがわかりました。ここで、
\(G_{\large s}=\{e,\:\sg,\:\sg^2,\:\sg^3,\:\sg^4\}\)
は \(G\) の正規部分群になります。なぜなら、\(G_{\large s}=\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q}(\zeta))\) なので、\(G_{\large s}\) の固定体は \(\bs{Q}(\zeta)\) です。一方、\(\bs{Q}(\zeta)/\bs{Q}\) はガロア拡大なので、正規性定理(53C)によって \(G_{\large s}\) は \(G\) の正規部分群になるからです。
\(G_{\large s}\) が \(G\) の正規部分群であることは、計算でも確かめられます。"弱可換性" である、
\(\tau\sg=\sg^2\tau\)
の関係を使うと、
\(\begin{eqnarray}
&&\:\:\tau G_{\large s}&=\{\tau,\:\sg^2\tau,\:\sg^4\tau,\:\sg^6\tau,\:\sg^8\tau\}\\
&&&=\{\tau,\:\sg^2\tau,\:\sg^4\tau,\:\sg\tau,\:\sg^3\tau\}\\
&&&=\{e,\:\sg^2,\:\sg^4,\:\sg,\:\sg^3\}\cdot\tau\\
&&&=G_{\large s}\tau\\
\end{eqnarray}\)
が成り立ち、これを繰り返すと、
\(\tau^iG_{\large s}=G_{\large s}\tau^i\)
が成り立ちます。\(G\) の任意の元を \(\sg^j\tau^i\) とすると、
\(\begin{eqnarray}
&&\:\:(\sg^j\tau^i)G_{\large s}&=\sg^jG_{\large s}\tau^i\\
&&&=G_{\large s}(\sg^j\tau^i)\\
\end{eqnarray}\)
となって(\(\sg^j\) と \(G_{\large s}\) は可換です)、\(G_{\large s}\) が正規部分群の定義を満たします。
また、\(G\) の任意の元 \(x\) を \(x=\sg^j\tau^i\) とし、剰余群 \(G/G_{\large s}\) の任意の元 を \(xG_{\large s}\) とすると、
\(\begin{eqnarray}
&&\:\:xG_{\large s}&=(\sg^j\tau^i)G_{\large s}=\sg^jG_{\large s}\tau^i\\
&&&=G_{\large s}\tau^i\\
\end{eqnarray}\)
となりますが、\(G_{\large s}\tau^i=\tau^iG_{\large s}\) が成り立つので、
\(\begin{eqnarray}
&&\:\:(xG_{\large s})^4&=(G_{\large s}\tau^i)^4\\
&&&=(G_{\large s})^4(\tau^i)^4\\
&&&=G_{\large s}\\
\end{eqnarray}\)
となり、剰余群 \(G/G_{\large s}\) は位数 \(4\) の巡回群です。
もともと \(G_{\large s}=\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q}(\zeta))\) であり、\(\bs{Q}(\zeta)\) の固定体は \(G_{\large s}\) でした。従って、
\(\bs{Q}\:\subset\:\bs{Q}(\zeta)\) | \(\subset\:\bs{Q}(\zeta,\al)\) | |
\(G\:\sp\:G_{\large s}\) | \(\sp\:\{e\}\) |
のガロア対応が得られました。\(G_{\large s}\) は \(G\) の正規部分群で \(G/G_{\large s}\) は巡回群、また \(G_{\large s}\) も巡回群です。従って \(G\) は可解群です。なお、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})=G_{\large t}\) です。以上をまとめると、
\(\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q}))\)
\(=G\)
\(=\{\:\sg_{ij}\:\}=\{\:\sg_j\tau_i\:\}\)
\((i=1,2,3,4)\:\:(j=0,1,2,3,4)\)
\(\sg=(1,\:2,\:3,\:4,\:5)\)
\(\sg_0=e\)
\(\sg_1=\sg\)
\(\sg_2=\sg^2\)
\(\sg_3=\sg^3\)
\(\sg_4=\sg^4\)
\(\tau=(2,\:3,\:5,\:4)\)
\(\tau_1=e\)
\(\tau_2=\tau\)
\(\tau_3=\tau^3\)
\(\tau_4=\tau^2\)
\(\begin{eqnarray}
&&G_{\large s}&=\{e,\:\sg,\:\sg^2,\:\sg^3,\:\sg^4\}\\
&&&=\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q}(\zeta)))\\
&&G_{\large t}&=\{e,\:\tau,\:\tau^2,\:\tau^3\}\\
&&&=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q}))\\
\end{eqnarray}\)
となります。
![]() |
\(\bs{x^5-2=0}\) のガロア群(\(F_{20}\)) |
ガロア群 \(F_{20}\) の \(20\)個の元を、4つの5角形の頂点に配置した図。\((1,2,3,4,5)\) などはガロア群を構成する巡回置換を表す。また \(23451\) などは、その巡回置換によって \(12345\) を置換した結果を表す(白ヌキ数字は置換で不動の点)。この群の生成元は、色を付けた \((1,2,3,4,5)\) と \((2,3,5,4)\) である。 |
位数 \(20\) の元、\(G=\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q})\) は、(位数 \(20\)の)フロベニウス群という名前がついていて、\(F_{20}\) と表記します。フロベニウス群は、高々1点を固定する置換と恒等置換から成る群です。\(G\) は、固定する点がない \(\sg=(1,\:2,\:3,\:4,\:5)\) と、1点だけを固定する \(\tau=(2,\:3,\:5,\:4)\) の2つを生成元とする群なので、フロベニウス群です。この \(F_{20}\) の内部構造を調べます。
\(\tau_i\) には \(\{\tau_1=e,\:\tau_2,\:\tau_3,\:\tau_4\}\) の生成元とはならない \(\tau_4\) があります。\(\sg_i,\:\tau_j\) このような性格をもつのは \(\tau_4\) だけです。その \(\tau_4\) は、
\(\tau_4=(2,\:5)(3,\:4)\)
\(\tau_4^{\:2}=e\)
でした。つまり \(\{e,\:\tau_4\}\) は位数2の巡回群です。
ということは、\(\sg_1=\sg\) と \(t_4\) を生成元として、新たな群を定義できることになります。その群の元を \(\pi_{ij}\) とし、
\(\pi_{ij}=\sg^j\tau_4^i\:\:(i=0,1,\:\:j=0,\:1,\:2,\:3,\:4)\)
\(\begin{eqnarray}
&&\:\: \pi_{0j}&=\sg_j\\
&&\:\: \pi_{1j}&=\sg_j\cdot\tau_4\\
&&&=\sg_j\cdot(2,\:5)(3,\:4)\\
\end{eqnarray}\)
と定義すると、位数 \(10\) の群になります。具体的に計算してみると、
\(\pi_{00}=e\)
\(\pi_{01}=(1,\:2,\:3,\:4,\:5)\)
\(\pi_{02}=(1,\:3,\:5,\:2,\:4)\)
\(\pi_{03}=(1,\:4,\:2,\:5,\:3)\)
\(\pi_{04}=(1,\:5,\:4,\:3,\:2)\)
\(\pi_{10}=(2,\:5)(3,\:4)\)
\(\pi_{11}=(1,\:2)(3,\:5)\)
\(\pi_{12}=(1,\:3)(4,\:5)\)
\(\pi_{13}=(1,\:4)(2,\:3)\)
\(\pi_{24}=(1,\:5)(2,\:4)\)
となります。
この群は5次の2面体群であり、\(D_{10}\) で表します(\(D_5\) と書く流儀もある。幾何学の文脈では \(D_5\))。一般に 2面体群 \(D_{2n}\)(または \(D_n\))とは、裏表のある正\(n\)角形を元の形に一致するように移動する(=対称移動をする)ことを表す群です。正5角形の頂点に1から5の名前を一周する順につけると、たとえば \((1,\:2,\:3,\:4,\:5)\) は \(72^\circ\)の回転であり、\((2,\:5)(3,\:4)\) は頂点1を通る対称軸で折り返す対称移動です。3次の2面体群を1.3節で図示しました。
\(D_{10}\) は \(F_{20}\) の部分群で、位数は \(10\) です。位数が \(20\) の半分なので、半分の部分群は正規部分群の定理(65F)により、\(D_{10}\) は \(F_{20}\) の正規部分群であり、剰余群 \(F_{20}/D_{10}\) は位数が \(2\) なので巡回群です。
さらに \(D_{10}\) の部分群として \(\sg_i\:(i=0,1,2,3,4)\) があり、位数 \(5\) の巡回群です。位数 \(5\) の巡回群は \(C_5\) と表記されます。\(C_5\) の位数もまた \(D_{10}\) の半分なので、\(C_5\) は \(D_{10}\) の正規部分群であり、剰余群 \(D_{10}/C_5\) は巡回群です。結局、\(F_{20}\) には、
\(F_{20}\:\sp\:C_5\:\sp\:\{\:e\:\}\)
\(F_{20}\:\sp\:D_{10}\:\sp\:C_5\:\sp\:\{\:e\:\}\)
という部分群の列(可解列)が存在することになり、これらの部分群は可解群です。実は、可解な5次方程式のガロア群は、\(F_{20}\)、\(D_{10}\)、\(C_5\) の3つしかないことが知られています。以上のように \(x^5-2=0\) のガロア群は、可解なガロア群の全部を含んでいるのでした。
\(x^5+11x-44\)
|
\(x^5+11x-44=0\)
のガロア群は \(D_{10}\) であることが知られています。この方程式は実数解が1つで、虚数解が4つです。実数解を \(\al\) とし、Wolfram Alpha で \(\al\) の近似値と厳密値を求めてみると次のようになります。この厳密値は本当かと心配になりますが、検算してみると正しいことが分かります。
\(\begin{eqnarray}
&&\:\:\al&=1.8777502748964972576\cd\\
&&&=\dfrac{\sqrt[5]{11}}{(\sqrt[5]{5})^4}(\al_1+\al_2-\al_3+\al_4)\\
\end{eqnarray}\)
\(\al_1=\sqrt[5]{\phantom{-}75+50\sqrt{5}-12\sqrt{5-\sqrt{5}}-59\sqrt{5+\sqrt{5}}}\)
\(\al_2=\sqrt[5]{\phantom{-}75-50\sqrt{5}+59\sqrt{5-\sqrt{5}}-12\sqrt{5+\sqrt{5}}}\)
\(\al_3=\sqrt[5]{-75+50\sqrt{5}+59\sqrt{5-\sqrt{5}}-12\sqrt{5+\sqrt{5}}}\)
\(\al_4=\sqrt[5]{\phantom{-}75+50\sqrt{5}+12\sqrt{5-\sqrt{5}}+59\sqrt{5+\sqrt{5}}}\)
8.結論 |
第5章から第7章まで、かなり長い証明のステップでしたが、可解性の必要条件(64B)、
\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つ がべき根で表されているとする。\(f(x)\) の最小分解体を \(\bs{L}\) とするとき、\(\mr{Gal}(\bs{L}/\bs{Q})\) は可解群である。
と、可解性の十分条件(75A)、
体 \(\bs{F}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{K}\) とする。\(\mr{Gal}(\bs{K}/\bs{F})=G\) とし、\(G\) は可解群とする。このとき \(f(x)=0\) の解は四則演算とべき根で表現できる。
および、具体的な5次方程式のガロア群の検討と合わせて、次が結論づけられました。
\(\bs{Q}\) 上の多項式 \(f(x)\) の最小分解体を \(\bs{L}\) とする。方程式 \(f(x)=0\) の解が四則演算とべき根で表現できるための必要十分条件は、ガロア群
\(\mr{Gal}(\bs{L}/\bs{Q})\) が可解群であることである。
5次方程式のガロア群には、可解群でないものと可解群の両方がある。従って、任意の5次方程式の解を四則演算とべき根で統一的に表現する解の公式はない。
(高校数学で理解するガロア理論:終)
定義\(\cdot\)定理一覧 |
2.整数の群
2.1 整数
互除法の原理(21A) |
\(\mr{gcd}(a,\:b)=\mr{gcd}(b,\:r)\)
である。
不定方程式の解の存在(21B) |
\(ax+by=c\)
(\(a,\:b,\:c\) は整数。\(a\neq0,\:b\neq0\))
とし、\(a\) と \(b\) の最大公約数を \(d\) とする。このとき、
\(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。
このことは1次不定方程式が3変数以上であっても成り立つ。つまり
\(a_1x_1+a_2x_2+\:\cd\:+a_nx_n=c\)
(\(a_i\) は \(0\) 以外の整数)
とし、
\(d=\mr{gcd}(a_1,a_2,\:\cd\:,\:a_n)\)
とする。このとき、
\(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。
不定方程式の解の存在(21C) |
\(ax+by=1\)
は整数解をもつ。また、\(n\) を任意の整数とすると、
\(ax+by=n\)
は整数解をもつ。あるいは、任意の整数 \(n\) は、
\(n=ax+by\) \((x,\:y\) は整数)
の形で表現できる。
これは3変数以上であっても成り立つ。たとえば3変数の場合は、\(0\) でない整数 \(a,\:b,\:c\) が互いに素、つまり、
\(\mr{gcd}(a,b,c)=1\)
であるとき、\(n\) を任意の整数として、1次不定方程式、
\(ax+by+cz=n\)
は整数解を持つ。
法による演算の定義(21D) |
\(a\equiv b\:\:(\mr{mod}\:n)\)
と書き、\(a\) と \(b\) は「法 \(n\) で合同」という。あるいは「\(\mr{mod}\:n\) で合同」、「\(\mr{mod}\:n\) で(見て)等しい」とも記述する。
法による演算規則(21E) |
\(a\equiv b\:\:(\mr{mod}\:n)\)
\(c\equiv d\:\:(\mr{mod}\:n)\)
とする。このとき、
\((1)\:a+c\) | \(\equiv b+d\) | \((\mr{mod}\:n)\) | |
\((2)\:a-c\) | \(\equiv b-d\) | \((\mr{mod}\:n)\) | |
\((3)\:ac\) | \(\equiv bd\) | \((\mr{mod}\:n)\) | |
\((4)\:a^r\) | \(\equiv b^r\) | \((\mr{mod}\:n)\) |
中国剰余定理(21F) |
\(x\equiv a_1\:\:(\mr{mod}\:n_1)\)
\(x\equiv a_2\:\:(\mr{mod}\:n_2)\)
の連立方程式を満たす整数 \(x\) が存在する。この \(x\) は \(\mr{mod}\:n_1n_2\) でみて唯一である。つまり、\(0\leq x < n_1n_2\) の範囲に解が唯一存在する。
中国剰余定理・多連立(21G) |
\(x\equiv a_1\:\:(\mr{mod}\:n_1)\)
\(x\equiv a_2\:\:(\mr{mod}\:n_2)\)
\(\vdots\)
\(x\equiv a_k\:\:(\mr{mod}\:n_k)\)
の連立合同方程式を満たす整数 \(x\) が存在する。この \(x\) は \(\mr{mod}\:n_1n_2\cd n_k\) でみて唯一である。つまり、\(0\leq x < n_1n_2\cd n_k\) の範囲では唯一の解が存在する。
2.2 群
群の定義(22A) |
\(G\) の任意の元 \(x,\:y\) に対して演算(\(\cdot\)で表す)が定義されていて、\(x\cdot y\in G\) である。 | |
演算について結合法則が成り立つ。つまり、 \((x\cdot y)\cdot z=x\cdot(y\cdot z)\) | |
\(G\) の任意の元 \(x\) に対して \(x\cdot e=e\cdot x=x\) を満たす元 \(e\) が存在する。\(e\) を単位元という。 | |
\(G\) の任意の元 \(x\) に対して \(x\cdot y=y\cdot x=e\) となる元 \(y\) が存在する。\(y\) を \(x\) の逆元といい、\(x^{-1}\) と表す。 |
2.3 既約剰余類群
既約剰余類群(23A) |
「既約剰余類」は、乗算に関して群になる。これを「既約剰余類群」といい、\((\bs{Z}/n\bs{Z})^{*}\) で表す。
定義により、\((\bs{Z}/n\bs{Z})^{*}\) の群位数は \(\varphi(n)\) である。\(\varphi\) はオイラー関数で、\(\varphi(n)\) は \(n\) 以下で \(n\) と互いに素な自然数の数を表す。\(n\) が素数 \(p\) の場合の群位数は \(\varphi(p)=p-1\) である。
2.4 有限体 \(\bs{\bs{F}_p}\)
有限体上の方程式1(24A) |
\(ax+b=c\)
は1個の解をもつ。
有限体上の方程式2(24B) |
\(f(a)=0\) なら、\(f(x)\) は \(x-a\) で割り切れる。
有限体上の方程式3(24C) |
\(f_n(x)=0\)
の解は、高々 \(n\) 個である。
2.5 既約剰余類群は巡回群
既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) は巡回群の直積に同型である
位数の定理(25A) |
[補題1]
\(a^x=1\) となる \(x\:\:(1\leq x)\) が必ず存在する。\(x\) のうち最小のものを \(d\) とすると、\(d\) を \(a\) の位数(order)と呼ぶ。
[補題2]
\(a,\:a^2,\:a^3,\:\cd\:,\:a^d=1\) は 全て異なる。ないしは、
\(a^0=1,\:a,\:a^2,\:\cd\:,a^{d-1}\) は 全て異なる。
[補題3]
\(n=p\)(素数)とする。\(d\) 乗すると \(1\) になる \((\bs{Z}/p\bs{Z})^{*}\) の元は、\(a,\:a^2,\:a^3,\:\cd\:,\:a^d\) がそのすべてである。
[補題4]
\(a^x=1\) となる \(x\) は \(d\) の倍数である。
[補題5]
\(a\) の位数を \(d\) とすると、\(d\) は 群位数 の約数である。
オイラーの定理(25B) |
\(a^{\varphi(n)}=1\:\:(\mr{mod}\:n)\)
が成り立つ(オイラーの定理)。\(\varphi\) はオイラー関数で、\(\varphi(n)\) は \(n\) 以下で \(n\) と互いに素な自然数の数を表す。
\(n=p\)(素数)の場合は、\(p\) と素な数 \(a\) について、
\(a^{p-1}=1\:\:(\mr{mod}\:p)\)
となる(フェルマの小定理)。
位数 \(d\) の元の数(25C) |
生成元の存在1(25D) |
なお、素数 \(p\) に対して、
\(a^x\equiv1\:\:(\mr{mod}\:p)\)
となる \(x\) の最小値が \(p-1\) であるような \(a\) を、\(p\) の「原始根」という。既約剰余類群 \((\bs{Z}/p\bs{Z})^{*}\) の生成元=原始根である。
\(a^x\equiv1\:\:(\mr{mod}\:p)\)
となる \(x\) の最小値が \(p-1\) であるような \(a\) を、\(p\) の「原始根」という。既約剰余類群 \((\bs{Z}/p\bs{Z})^{*}\) の生成元=原始根である。
生成元の探索アルゴリズム(25D’) |
[補題6]
\(a,\:b\) を自然数とすると、2つの数、\(a\,',\:b\,'\) をとって、
\(a\,'|a\)
\(b\,'|b\)
\(\mr{gcd}(a\,',b\,')=1\)
\(\mr{lcm}(a,b)=a\,'b\,'\)
となるようにできる。
[補題7]
\(p\) を素数とし、\((\bs{Z}/p\bs{Z})^{*}\) の元の一つを \(a\) とする。\(a\) の位数を \(d\) とし、\(a^k\:\:(1\leq k\leq p-1)\) の位数を \(e\) とすると、
\(e=\dfrac{d}{\mr{gcd}(k,d)}\)
である。
[補題8]
\(p\) を奇素数とし、\(k\) を \(p\) と素な数とする(\(\mr{gcd}(k,p)=1\))。また、整数 \(m\) を \(m\geq1\) とする。
このとき、
\((1+kp^m)^p=1+k\,'p^{m+1}\)
と表すことができて、\(k\,'\) は \(p\) と素である。
生成元の存在2(25E) |
このとき \(g\) または \(g+p\) は \((\bs{Z}/p^n\bs{Z})^{*}\) の生成元である。つまり、\((\bs{Z}/p^n\bs{Z})^{*}\) には生成元が存在する。
生成元の存在2(その1)
\(p\) を奇素数とし、\(g\) を \((\bs{Z}/p\bs{Z})^{*}\) の生成元とする。また、\(g\) は、
\(g^{p-1}=1+kp\)
\(\mr{gcd}(k,p)=1\)
と表されているとする。
この条件で、\(g\) は \((\bs{Z}/p^n\bs{Z})^{*}\) の生成元でもある。
生成元の存在2(その2)
\(p\) を奇素数とし、\(g\) を \((\bs{Z}/p\bs{Z})^{*}\) の生成元とする。また、\(g\) は、
\(g^{p-1}=1+kp^m\:\:(m\geq2)\)
\(\mr{gcd}(k,p)=1\)
と表されているとする。
この条件では、\(g+p\) が \((\bs{Z}/p^n\bs{Z})^{*}\) の生成元である。
2のべき乗の既約剰余類群(25F) |
\((\bs{Z}/2^n\bs{Z})^{*}\cong(\bs{Z}/2\bs{Z})\times(\bs{Z}/2^{n-2}\bs{Z})\)
である。つまり2つの巡回群の直積に同型である。
[補題9]
\(n\geq2\) のとき、\(5\) の \(\mr{mod}\:2^n\) での位数は \(2^{n-2}\) である。
既約剰余類群の構造(25G) |
3.多項式と体
3.1 多項式
多項式の不定方程式(31A) |
\(a(x)f(x)+b(x)g(x)=1\)
を満たす多項式 \(f(x)\)、\(g(x)\)で、
\(\mr{deg}\:g(x)\: < \:\mr{deg}\:a(x)\)
のものが存在する。
また、\(a(x)\) と \(b(x)\) が互いに素な多項式で、\(h(x)\) が任意の多項式のとき、
\(a(x)f(x)+b(x)g(x)=h(x)\)
を満たす多項式 \(f(x)\)、\(g(x)\) で、
\(\mr{deg}\:g(x)\: < \:\mr{deg}\:a(x)\)
のものが存在する。
既約多項式の定義(31B) |
整数係数多項式の既約性(31C) |
既約多項式と素数の類似性(31D) |
\(p(x)\) を既約多項式とし、\(f(x),\:g(x)\) を多項式とする。\(f(x)g(x)\) が \(p(x)\) で割り切れるなら、\(f(x),\:g(x)\) の少なくとも1つは \(p(x)\) で割り切れる。
\(p(x)\) を既約多項式とし、\(g(x)\) を多項式とする。\((g(x))^2\) が \(p(x)\) で割り切れるなら、\(g(x)\) は \(p(x)\) で割り切れる。また、\((g(x))^k\:\:(2\leq k)\) が \(p(x)\) で割り切れるなら、\(g(x)\) は \(p(x)\) で割り切れる。
既約多項式の定理1(31E) |
方程式 \(p(x)=0\) と \(f(x)=0\) が(複素数の範囲で)共通の解を1つでも持てば、\(f(x)\) は \(p(x)\) で割り切れる。
既約多項式の定理2(31F) |
\(f(x)\) の次数が1次以上で \(p(x)\) の次数未満のとき、方程式 \(p(x)=0\) と \(f(x)=0\) は(複素数の範囲で)共通の解を持たない。
既約多項式の定理3(31G) |
最小多項式の定義(31H) |
最小多項式は既約多項式(31I) |
\(f(x)\) が 体 \(\bs{Q}\) 上の既約多項式である | |
\(f(x)\) が \(\al\) の \(\bs{Q}\) 上の最小多項式である |
の2つは同値である。
3.2 体
最小分解体の定義(32A) |
\(f(x)=(x-\al_1)(x-\al_2)\cd(x-\al_n)\)
と、1次多項式で因数分解したとき、
\(\bs{Q}(\al_1,\:\al_2,\:\cd\:,\:\al_n)\)
を \(f(x)\) の最小分解体と言う。\(f(x)\) は既約多項式でなくてもよい。
単拡大定理(32B) |
単拡大の体(32C) |
\(\bs{K}\) | \(\overset{\text{ }}{=}\) | \(\{a_{n-1}\al^{n-1}+\)\(\:\cd\:+\)\(a_2\al^2+\)\(a_1\al+\)\(a_0\:|\:a_i\in\bs{Q}\:\}\) | |
\((0\leq i\leq n-1)\) |
と定義すると、\(\bs{K}\) は体になり、\(\bs{K}=\bs{Q}(\al)\) である。その元の表し方は一意である。
3.3 線形空間
線形空間の定義(33A) |
加算の定義
\(V\) の任意の元 \(u,\:v\) に対して \((u+v)\in V\) が定義されていて、この加算(\(+)\) の定義に関して \(V\) は可換群である。すなわち、
\((1)\) 単位元の存在
\(u+x=x\) となる \(x\) が存在する。これを \(0\) と書く。
\((2)\) 逆元の存在
\(u+x=0\) となる \(x\) が存在する。これを \(-u\) と書く。
\((3)\) 結合則が成り立つ
任意の元 \(u,\:v\:,w\) について、\((u+v)+w=u+(v+w)\)
\((4)\) 交換則が成り立つ
\(u+v=v+u\)
スカラー倍の定義
\(V\) の任意の元 \(u\) と \(\bs{K}\) の任意の元 \(k\) に対して、スカラー倍 \(ku\in V\) が定義されていて、加算との間に次の性質がある。\(u,\:v\) を \(V\) の元、\(k,\:m\) を \(\bs{K}\) の元とし、\(\bs{K}\) の乗法の単位元を \(1\) とする。
\((1)\:\:k(mu)=(km)u\)
\((2)\:\:(k+m)u=ku+mu\)
\((3)\:\:k(u+v)=ku+kv\)
\((4)\:\:1v=v\)
1次独立と1次従属(33B) |
線形空間 \(V\) の元の組、\(\{v_1,v_2,\cd,v_n\}\) に対して、
\(a_1v_1+a_2v_2+\)..\(+a_nv_n=0\)
を満たす \(\bs{K}\) の元 \(a_1,a_2,\cd,a_n\) が、\(a_1=a_2=\cd=a_n=0\) しかないとき、\(\{v_1,v_2,\cd,v_n\}\) は1次独立であるという。
1次従属
1次独立でないときが1次従属である。つまり、線形空間 \(V\) の元の組、\(\{v_1,v_2,\cd,v_n\}\) に対して、
\(a_1v_1+a_2v_2+\)..\(+a_nv_n=0\)
を満たす、少なくとも一つは \(0\) でない \(\bs{K}\) の元 \(a_1,a_2,\cd,a_n\) があるとき、\(\{v_1,v_2,\cd,v_n\}\) は1次従属であるという。
基底の定義(33C) |
\({v_1,v_2,\cd,v_n}\) は1次独立である。 | |
\(V\) の任意の元 \(v\) は、\(\bs{K}\) の元 \(a_1,a_2,\cd,a_n\) を選んで、
\(v=a_1v_1+a_2v_2+\)..\(+a_nv_n\)
と表せる。 |
基底から1つの元を除外したものは基底ではなくなる。また基底に1つの元を加えたものも基底ではない。
基底の数の不変性(33D) |
次元の不変性(33E) |
単拡大体の基底(33F) |
拡大次数の定義(33G) |
\([\:\bs{K}\::\:\bs{F}\:]\)
で表す。
拡大次数の連鎖律(33H) |
\([\:\bs{K}\::\:\bs{F}\:]=[\:\bs{K}\::\:\bs{M}\:][\:\bs{M}\::\:\bs{F}\:]\)
が成り立つ。
体の一致(33I) |
4.一般の群
4.1 部分群\(\bs{\cdot}\)正規部分群、剰余類\(\bs{\cdot}\)剰余群
部分集合の演算(41A) |
\(HN\:=\:\{\:hn\:|\:h\in H,\:n\in N,\:hn\) は群の演算定義による \(\}\)
群 \(G\) の元の演算では結合則が成り立つから、部分集合の演算でも結合則が成り立つ。つまり \(H_1,\:H_2,\:H_3\) をを3つの部分群とすると、
\((H_1H_2)H_3=H_1(H_2H_3)\)
である。部分集合の元は \(1\)つでもよいから、\(x\) が \(G\) の元で \(x\) だけの部分集合を \(\{x\}\) とすると、
\(H_1(\{x\}H_2)=(H_1\{x\})H_2\)
である。これを、
\(H_1(xH_2)=(H_1x)H_2\)
と記述する。
部分群の十分条件(41B) |
\(xy\in N,\:x^{-1}\in N\)
なら、\(N\) は \(G\) の部分群である。
部分群の元の条件(41C) |
① \(xN\:=\:N\)
② \(x\:\in\:N\)
部分群の共通部分は部分群(41D) |
剰余類の定義(41E) |
\(g_1H,\:g_2H,\:\cd\:,g_nH\)
を作る。
\(g_1H,\:g_2H,\:\cd\:,g_nH\) から、同じになる集合を集めたものを剰余類と呼ぶ。その同じになる集合から代表的なものを一つ取り出し、
\(xH\:\:(x\in G)\)
の形で剰余類を表す。\(g_1H,\:g_2H,\:\cd\:,g_nH\) から剰余類が \(d\) 個できたとし、それらを、
\(x_1H,\:x_2H,\:\cd\:,x_dH\)
とすると、
\(i\neq j\) のとき \(x_iH\:\cap\:x_jH=\phi\)
\(G=x_1H\:\cup\:x_2H\:\cup\:\cd\:\cup\:x_dH\)
である。剰余類は、群 \(G\) の元を部分群 \(H\) によって分類したものといえる。
\(x_1H,\:x_2H,\:\cd\:,x_dH\) を「左剰余類」という。同じことが \(G\) の元を右からかけたときにも成り立ち、\(Hx_1{}^{\prime},\:Hx_2{}^{\prime},\:\cd\:,Hx_d\,'\) を「右剰余類」という。
群 \(G\) の 部分群 \(H\) による剰余類の個数 \(d\) について、\(d\cdot|H|=|G|\) が成り立つ。この \(d\) を「\(G\) の \(H\) による指数」といい、\([\:G\::\:H\:]\) で表す。つまり、
\(|G|=[\:G\::\:H\:]\cdot|H|\)
である(ラグランジュの定理)。
群 \(G\) の元 \(g\) の位数(\(g^x=e\) となる最小の \(x\))を \(n\) とすると、\(n\) は群位数 \(|G|\) の約数である。
群位数が素数の群は巡回群である。
正規部分群の定義(41F) |
\(gH=Hg\)
が成り立つとき、\(H\) を \(G\) の正規部分群(normal subgroup)という。正規部分群では左剰余類と右剰余類が一致する。
定義により、\(G\) および \(\{e\}\) は \(G\) の正規部分群である。また \(G\) が可換群であると、その部分群は正規部分群である。巡回群は可換群だから、巡回群の部分群は正規部分群である。
剰余群の定義(41G) |
\(x_1H,\:x_2H,\:\cd\:,x_dH\:\:(\:x_i\in G,\:d=[\:G\::\:H\:]\:)\)
は部分集合の演算の定義(41A)で群になる。この群を \(G\) の \(H\) による剰余群(quotient group)といい、\(G/H\) で表す。剰余群は商群とも言う。
巡回群の剰余群は巡回群(41H) |
部分群と正規部分群(41I) |
(a) \(NH\) は \(G\) の部分群である。
(b) \(G\:\sp\:N\:\sp\:H\) なら、\(H\) は \(N\) の正規部分群である。
(c) \(N\cap H\) は \(N\) の正規部分群である。
(b) \(G\:\sp\:N\:\sp\:H\) なら、\(H\) は \(N\) の正規部分群である。
(c) \(N\cap H\) は \(N\) の正規部分群である。
が成り立つ。
4.2 準同型写像
準同型写像と同型写像(42A) |
\(f(xy)=f(x)f(y)\)
が成り立つとき、\(f\) を \(G\) から \(G\,'\) への準同型写像(homomorphism)という。右辺は群 \(G\,'\) の演算定義に従う。
また、\(f\) が全単射写像のとき、\(f\) を同型写像(isomorphism)という。群 \(G\) から \(G\,'\) への同型写像が存在するとき、\(G\) と \(G\,'\) は同型であるといい、
\(G\:\cong\:G\,'\)
で表す。
準同型写像の像と核(42B) |
\(\mr{Im}\:f\) は \(G\,'\) の部分群である。
\(G\) の単位元を \(e\)、\(G\,'\) の単位元を \(e\,'\) とする。準同型写像 \(f\) によって \(e\,'\) に移る \(G\) の元の集合を「\(f\) の核(kernel)」といい、\(\mr{Ker}\:f\) と書く。
\(\mr{Ker}\:f\) は \(G\) の部分群である。
核が単位元なら単射(42C) |
\(\mr{Im}\:f\) | \(=\:G\,'\) | なら \(f\) は全射 | |
\(\mr{Ker}\:f\) | \(=\:\{e\}\) | なら \(f\) は単射 |
である。
核は正規部分群(42D) |
4.3 同型定理
準同型定理(43A) |
\(G/H\:\cong\:\mr{Im}\:f\)
が成り立つ。
第2同型定理(43B) |
\(N/(N\cap H)\:\cong\:NH/H\)
が成り立つ。
5.ガロア群とガロア対応
5.1 体の同型写像
体の同型写像(51A) |
\(\begin{eqnarray}
&&\:\:f(x+y)&=f(x)+f(y)\\
&&\:\:f(xy)&=f(x)f(y)\\
\end{eqnarray}\)
が成り立つとき、\(f\) を体の同型写像という。この定義による同型写像は、加法と乗法のみならず、四則演算を保存する。
特に、\(\bs{K}\) から \(\bs{K}\) への同型写像を自己同型写像という。
\(\bs{K}\) から \(\bs{F}\) への同型写像が存在するとき、体 \(\bs{K}\) と 体 \(\bs{F}\) は同型であるといい、\(\bs{K}\:\cong\:\bs{F}\) で表す。
体 \(\bs{K}\) と \(\bs{F}\) がともに \(\bs{Q}\) を含むとき、\(a\in\bs{Q}\) に対して、
\(f(a)=a\)
である。つまり有理数は同型写像で不変である。
有理式の定義(51B) |
同型写像と有理式の順序交換(51C) |
\(\sg(f(a))=f(\sg(a))\)
である。これは多変数の有理式でも成り立つ。\(a_1,a_2,\cd,a_n\) を \(\bs{K}\) の元、\(f(x_1,x_2,\cd,x_n)\) を \(\bs{Q}\) 上の有理式とすると、
\(\sg(f(a_1,a_2,\cd,a_n))=f(\sg(a_1),\sg(a_1),\cd,\sg(a_n))\)
である。
\(\bs{Q}\) を含む体を \(\bs{K}\) とし、\(\bs{K}\)の拡大体を \(\bs{F}\:,\bs{F}\,'\) とする。\(\sg\) を \(\bs{K}\) を不変にする \(\bs{F}\) から \(\bs{F}\,'\) への同型写像とし、\(a\) を \(\bs{F}\) の元とする。\(f(x)\) を \(\bs{K}\) 上の有理式とすると、
\(\sg(f(a))=f(\sg(a))\)
である。
同型写像での移り先(51D) |
同型写像による解の置換(51E) |
すると \(\sg(\al_1),\sg(\al_2),\cd,\sg(\al_n)\) は、\(\al_1,\al_2,\cd,\al_n\) を入れ替えたものである。
同型写像の存在(51F) |
すると \(\sg(\al)=\beta\) を満たす \(\bs{Q}(\al)\) から \(\bs{Q}(\beta)\) への唯一の同型写像 \(\sg\) が存在する。
単拡大体の同型写像(51G) |
\(\sg_i(\al)=\al_i\) \((1\leq i\leq n)\)
で定められ、\(\sg_i\) は \(\bs{Q}(\al)\) から \(\bs{Q}(\al_i)\) への同型写像となる。
同型写像の延長(51H) |
\(\bs{\bs{Q}(\al)}\) 上の \(m\)次既約多項式を \(g(x)\) とし、方程式 \(g(x)=0\) の解の一つを \(\beta\) とする。また、\(\bs{Q}(\al)\) の同型写像の一つを \(\tau\) とする。
このとき、\(\tau\) は \(\bs{Q}(\al,\beta)\) の同型写像 \(\sg_j\) に延長できる。延長とは、\(\sg_j\) の作用を \(\bs{Q}(\al)\) に限定した写像の作用が \(\tau\) と一致することを言う。\(\tau\) を延長した同型写像 \(\sg_j\) は \(m\)個ある(\(0\leq j < m\))。
5.2 ガロア拡大とガロア群
ガロア拡大(52A) |
(最小分解体定義)体 \(\bs{F}\) 上の多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とするとき、\(\bs{L}/\bs{F}\) をガロア拡大という。 | |
(自己同型定義)体 \(\bs{F}\) の代数拡大体 \(\bs{K}\) があったとき、\(\bs{F}\) の元を不動にする \(\bs{K}\) の同型写像がすべて自己同型写像になるとき、\(\bs{K}/\bs{F}\) をガロア拡大という。 |
\(\bs{K}/\bs{F}\) がガロア拡大のとき、\(\bs{\bs{F}}\) を不変にする \(\bs{K}\) の自己同型写像の集合は群になる。これをガロア群といい、\(\mr{Gal}(\bs{K}/\bs{F})\) で表す。
次数と位数の同一性(52B) |
\(\bs{F}\) を代数拡大体とし、\(\bs{F}\) のガロア拡大を \(\bs{L}\) とする。\(\bs{L}\) のガロア群の位数は \(\bs{F}\) から \(\bs{L}\) への拡大次数に等しい。つまり、
\([\:\bs{L}\::\:\bs{F}\:]=|\mr{Gal}(\bs{L}/\bs{F})|\)
である。
中間体からのガロア拡大(52C) |
5.3 ガロア対応
固定体と固定群(53A) |
また \(\bs{K}\) の中間体 \(\bs{M}\) のすべての元を不変にする \(G\) の部分集合 \(H\) は群になる。これを \(G\) における \(\bs{M}\) の固定群と呼び、\(G(\bs{M})\) で表す(または \(G^M\))。
ガロア対応(53B) |
\(\begin{eqnarray}
&&G\:\sp\:H &\sp\:\{e\}\\
&&\bs{F}\:\subset\:\bs{K}(H)=\bs{M} &\subset\:\bs{K}\\
\end{eqnarray}\)
\(\bs{M}\)の固定群を \(G(\bs{M})\) とする(次式)。ガロア群の定義により \(G(\bs{M})=\mr{Gal}(\bs{K}/\bs{M})\) である。
\(\begin{eqnarray}
&&\bs{F}\:\subset\:\bs{M} &\subset\:\bs{K}\\
&&G\:\sp\:G(\bs{M}) &\sp\:\{e\}\\
\end{eqnarray}\)
このとき、
\(G(\bs{M})=H\)
つまり、
\(\begin{eqnarray}
&&\:\:\mr{Gal}(\bs{K}/\bs{M})&=H \\
&&\:\:\bs{K}(G(\bs{M}))&=\bs{M}\\
\end{eqnarray}\)
が成り立つ。
正規性定理(53C) |
\(\bs{M}/\bs{Q}\) がガロア拡大である | |
\(H\)が\(G\)の正規部分群である |
の2つは同値である。また、これが成り立つとき、
\(\mr{Gal}(\bs{M}/\bs{Q})\:\cong\:G/H\)
という群の同型が成り立つ。
6.可解性の必要条件
6.1 可解群
可解群の定義(61A) |
\(G=H_0\:\sp H_1\sp\cd\sp H_i\sp H_{i+1}\sp\cd\sp H_k=\{\:e\:\}\)
があって、\(H_{i+1}\) は \(H_i\) の正規部分群であり、剰余群 \(H_i/H_{i+1}\) が巡回群であるとき、\(G\) を可解群(solvable group)と言う。
\(H_{i+1}\) が \(H_i\) の正規部分群であるとき、\(H_i\) を正規列と言う。また、\(H_i/H_{i+1}\) が巡回群のとき、\(H_i\) を可解列という。
巡回群は可解群(61B) |
可解群の部分群は可解群(61C) |
可解群の像は可解群(61D) |
このことより、
可解群の剰余群は可解群
であることが分かる。なぜなら、群 \(G\) の部分群を \(N\) とすると、\(G\) から \(G/N\) への自然準同型、つまり \(x\in G\) として、
\(x\:\longmapsto\:xN\)
の準同型写像を定義できるからである。
6.2 巡回拡大
巡回拡大の定義(62A) |
累巡回拡大の定義(62B) |
\(\bs{Q}=\bs{K}_0\subset\bs{K}_1\subset\cd\subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cd\subset\bs{K}_k=\bs{K}\)
となる拡大列があって(\(k > 1\))、\(\bs{K}_{i+1}/\bs{K}_i\:(0\leq i < k)\) が巡回拡大のとき、\(\bs{K}/\bs{Q}\) は累巡回拡大であると言う。ただし、\(\bs{\bs{K}/\bs{Q}}\) が累巡回拡大だとしても、\(\bs{\bs{K}/\bs{Q}}\) がガロア拡大であるとは限らない。
累巡回拡大ガロア群の可解性(62C) |
\(G\) が可解群である | |
\(\bs{K}/\bs{Q}\) が累巡回拡大である |
の2つは同値である。
6.3 原始\(\bs{n}\)乗根を含む体とべき根拡大
1の原始\(n\)乗根を \(\zeta\) とする。このとき
・\(\bs{Q}(\zeta)/\bs{Q}\) はガロア拡大
・\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\:\cong\:(\bs{Z}/n\bs{Z})^{*}\)
が成り立つ。
原始n乗根の数(63A) |
原始\(n\)乗根は \(\varphi(n)\) 個ある。\(\varphi(n)\) はオイラー関数で、\(n\) と互いに素である \(n\) 以下の自然数の数を表す。
原始n乗根の累乗(63B) |
\(\zeta^m\:\:(1\leq m\leq n)\)
は、\(1\) の\(n\)乗根の全体を表す。また、
\(\zeta^m\:\:(\mr{gcd}(m,n)=1)\)
は、\(1\) の原始\(n\)乗根の全体を表す。
原始n乗根の最小多項式(63C) |
このとき \(f(\zeta^k)=0\) である。
円分多項式(63D) |
従って、原始\(n\)乗根は互いに共役である。最小多項式は既約多項式なので、円分多項式は既約多項式である。
\(\bs{Q}\) に \(\zeta\) を添加した単拡大体 \(\bs{Q}(\zeta)\) は \(f(x)\) の最小分解体であり、\(\bs{Q}(\zeta)/\bs{Q}\) はガロア拡大である。
Q(ζ)のガロア群(63E) |
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/n\bs{Z})^{*}\)
である。つまり \(1\) の原始\(n\)乗根の一つを \(\bs{Q}\) に添加した拡大体のガロア群は、既約剰余類群に同型である。
Q(ζ)のガロア群は巡回群(63F) |
従って、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は可解群であり(61B)、累巡回拡大である(62C)。
べき根拡大の定義(63G) |
また、\(\bs{K}\) からのべき根拡大を繰り返して拡大体 \(\bs{F}\) ができるとき、\(\bs{F}/\bs{K}\) を累べき根拡大と言う。
原始n乗根を含むべき根拡大(63H) |
\(\bs{L}/\bs{K}\) は巡回拡大である | |
\(\mr{Gal}(\bs{L}/\bs{K})\) の位数は \(n\) の約数である |
6.4 可解性の必要条件
ガロア閉包の存在(64A) |
可解性の必要条件(64B) |
6.5 5次方程式の解の公式はない
置換は巡回置換の積(65A) |
置換は互換の積(65B) |
置換の偶奇性(65C) |
交代群は正規部分群(65D) |
\([\:S_n\::\:A_n\:]=2\)
である。
\(A_n\) は \(S_n\) の正規部分群であり、\(S_n/A_n\) は巡回群である。
交代群は3文字巡回置換の積(65E) |
半分の部分群は正規部分群(65F) |
\(|G|=2|N|\)
のとき(つまり 群の指数 \([G:N]=2\) のとき)、\(N\) は \(G\) の正規部分群である。
対称群の可解性(65G) |
5次方程式の解の公式はない(65H) |
\(\begin{eqnarray}
&&\:\:f(x)&=(x-b_1)(x-b_2)(x-b_3)(x-b_4)(x-b_5)\:\:(b_i\in\bs{K})\\
&&&=x^5-a_4x^4+a_3x^3-a_2x^2+a_1x-a_0\\
\end{eqnarray}\)
とし、\(\bs{Q}\) に \(a_0,a_1,a_2,a_3,a_4,\)を添加した代数拡大体を \(\bs{F}\) とする。つまり、
\(\bs{F}=\bs{Q}(a_0,\:a_1,\:a_2,\:a_3,\:a_4)\)
である。
このとき、\(\bs{K}\) の \(\bs{F}\) 上の ガロア群 \(G\) は5次対称群 \(S_5\) である。\(S_5\) は可解群ではないので(65G)、従って \(b_i\) を \(a_i\) のべき根で表すことはできない。
6.6 可解ではない5次方程式
コーシーの定理(66A) |
実数解が3つの5次方程式(66B) |
7.可解性の十分条件
7.1 1の原始\(\bs{n}\)乗根
原始n乗根はべき根で表現可能(71A) |
7.2 べき根拡大の十分条件のため補題
べき根拡大の十分条件のため補題1(72A) |
\(g(x)\) | \(\overset{\text{ }}{=}\) | \(x+a_1\sg(x)+a_2\sg^2(x)+\:\cd\:+a_{n-1}\sg^{n-1}(x)=0\) | |
\((a_i\in\bs{L},\:1\leq i\leq n-1)\) |
と定義する。このとき、\(\bs{L}\) の全ての元 \(x\) について、\(g(x)=0\) となるような \(\bs{L}\) の元、\(a_1,\:a_2,\:\cd\:,a_{n-1}\) は存在しない。
べき根拡大の十分条件のため補題2(72B) |
\(g(x)=x+\zeta^{n-1}\sg(x)+\zeta^{n-2}\sg^2(x)+\cd+\zeta\sg^{n-1}(x)\)
とおくと、\(g(\theta),\:g(\theta^2),\:\cd\:,g(\theta^{n-1})\) のうち少なくとも一つは \(0\) ではない。
7.3 べき根拡大の十分条件
べき根拡大の十分条件(73A) |
このとき、\(\bs{L}\) は \(\bs{K}\) のべき根拡大である。
7.4 べき根拡大と巡回拡大の同値性
べき根拡大と巡回拡大は同値(74A) |
このとき、
\(\bs{L}/\bs{K}\) は巡回拡大である | |
\(\bs{L}/\bs{K}\) はべき根拡大である。 |
7.5 可解性の十分条件
可解性の十分条件(75A) |
このとき \(f(x)=0\) の解は四則演算とべき根で表現できる。
7.6 位数2の巡回拡大は平方根拡大:正5角形が作図できる理由
\(p\) を素数とし、原始\(p\)乗根を \(\zeta\) とすると、
\(|\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})|=|(\bs{Z}/p\bs{Z})^{*}|=p-1\)
なので、
\(p-1=2^k\:\:(1\leq k)\)
の条件があると、\(\bs{Q}\) から \(\bs{Q}(\zeta)\) に至る「平方根拡大」の列が存在し、\(\zeta\) は四則演算と平方根 \(\sqrt{\phantom{a}}\) だけで表現できる。従って 正 \(p\)角形は定規とコンパスで作図可能である
(定義・定理一覧:終)
2023-05-13 08:05
nice!(0)
No.358 - 高校数学で理解するガロア理論(5) [科学]
\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{#1}} \newcommand{\ol}[1]{\overline{#1}} \newcommand{\sb}{\subset} \newcommand{\sp}{\supset} \newcommand{\al}{\alpha} \newcommand{\sg}{\sigma}\newcommand{\cd}{\cdots}\)
第6章では、方程式が可解であれば(=解が四則演算とべき根で表現できれば)ガロア群が可解群であることをみました。第7章ではその逆、つまり、ガロア群が可解群であれば方程式が可解であることを証明します。
7.1 1の原始\(n\)乗根
可解性の十分条件を証明するために、まず、\(1\) の原始\(n\)乗根がべき根で表せることを証明します。このことを前提にした証明を最後で行うからです。念のために「1.1 方程式とその可解性」でのべき根の定義を振り返ると、
\(\sqrt[n]{\:a\:}\) (\(n=2\) の場合は \(\sqrt{\:a\:}\))
という表記は、
のでした。\(\sqrt{2}\) は \(1.4142\cd\) と \(-1.4142\cd\) のどちらかを表わすのではなく、\(1.4142\cd\) のことです。\(\sqrt[3]{2}\) は \(3\)乗して \(2\) になる3つの数のうちの正の実数(\(\fallingdotseq1.26\))を表わします。一方、\(\sqrt{-1\:}\) は\(2\)乗して \(-1\) になる2つの数のうちのどちらかで、その一方を \(i\) と書くと、もう一方が \(-i\) です。
この定義から、方程式 \(x^n-1=0\) の解を \(\sqrt[n]{\:1\:}\) と書くと、それは \(1\) のことです。従って、
ことを証明しておく必要があります。その証明はガロア理論とは無関係にできます。それが以下です。
\(1\) の 原始\(n\)乗根はべき根で表現できる。
[証明]
\(n\) についての数学的帰納法で証明する。\(n=2,\:3\) のときにべき根で表現できるのは根の公式で明らかである。また、原始4乗根は \(\pm i\) なので、\(n\leq4\) のとき題意は成り立つ。そこで、\(n\) 未満のときにべき根で表現できると仮定し、\(n\) のときにもべき根で表現できることを証明する。
\(n\) が合成数のときと素数のときに分ける。まず \(n\) が合成数なら、
\(n=s\cdot t\)
と表現できる。
\(1\) の原始\(s\)乗根を \(\zeta\)
\(1\) の原始\(t\)乗根を \(\eta\)
とし、\(X=x^{s}\) とおく。方程式 \(X^{t}-1=0\) の \(t\)個の解は \(\eta^k\:\:(0\leq k\leq t-1)\) と表わされる(63B)から、\(x^n-1\) は、
\(\begin{eqnarray}
&&\:\:x^n-1&=x^{st}-1=X^{t}-1\\
&&&=\displaystyle\prod_{k=0}^{t-1}(X-\eta^k)\\
&&&=\displaystyle\prod_{k=0}^{t-1}(x^{s}-\eta^k)\\
\end{eqnarray}\)
と因数分解できる。従って、方程式 \(x^n-1=0\) の解は、
\(x^{s}=\eta^k\:\:\:(0\leq k\leq t-1)\)
の解である。これを解くと、
\(x=\sqrt[s]{\eta^k}\cdot\zeta^j\:\:\:(0\leq j\leq s-1,\:\:0\leq k\leq t-1)\)
である(\(k=0\) のときは根号の規則に従って \(\sqrt[s]{1}=1\))。帰納法の仮定により、\(\zeta,\:\eta\) はべき根で表現できるから、上式により \(1\) の \(n\) 乗根はべき根で表現できる。従って原始\(n\)乗根もべき根で表現できる。
以降は \(n\) が素数の場合を証明する。\(n\) を \(p\)(= 素数)と表記する。以下では数式を見やすくするため \(p=5\) の場合を例示するが、証明の過程は一般性を失わない論理で進める。
位数 \(p-1\) の2つの巡回群、\((\bs{Z}/p\bs{Z})^{*}\) と \(\bs{Z}/(p-1)\bs{Z}\) の性質を利用する。\(p=5\) の場合は、位数 \(4\) の既約剰余類群 \((\bs{Z}/5\bs{Z})^{*}\) と、剰余群 \(\bs{Z}/4\bs{Z}\) である。
\(p\) が素数のとき、既約剰余類群 \((\bs{Z}/p\bs{Z})^{*}\) は生成元をもつ(25D)。\((\bs{Z}/5\bs{Z})^{*}\) の生成元の一つは \(2\) である(もう一つは \(3\))。生成元を \(2\) とすると、
\(\begin{eqnarray}
&&\:\:(\bs{Z}/5\bs{Z})^{*}&=\{2,\:2^2,\:2^3,\:2^4\}\\
&&&=\{2,\:4,\:3,\:1\}\\
\end{eqnarray}\)
の巡回群となる。演算は乗算である。一方、\(\bs{Z}/4\bs{Z}\) は、演算が加算、生成元が \(1\)(または \(3\))の巡回群で、
\(\begin{eqnarray}
&&\:\:\bs{Z}/4\bs{Z}&=\{1,\:1+1,\:1+1+1,\:1+1+1+1\}\\
&&&=\{1,\:2,\:3,\:0\}\\
\end{eqnarray}\)
である。ここで、2つの変数 \(x,\:y\) をもつ関数を、
とおく。この関数は、4つある項の \(x,\:y\) の指数について、
\(y\) の指数は \([\:2,\:4,\:3,\:1\:]\) : \((\bs{Z}/5\bs{Z})^{*}\) の巡回パターン
\(x\) の指数は \([\:1,\:2,\:3,\:0\:]\) : \(\bs{Z}/4\bs{Z}\) の巡回パターン
となるようにしてある。
次に、2つの数 \(a,\:b\) を、
\(\begin{eqnarray}
&&\:\:a^5&=1\:(a\neq1)\\
&&\:\:b^4&=1\\
\end{eqnarray}\)
であるような数とする。\(a\) は \(1\) の原始5乗根でもよいし、その任意の累乗でもよい。とにかく \(a^5=1\:(a\neq1)\) を満たす数である。このとき、
\(a^5-1=0\)
\((a-1)(a^4+a^3+a^2+a+1)=0\)
なので、
\(a^4+a^3+a^2+a+1=0\) ないしは
\(a^4+a^3+a^2+a=-1\)
が成り立つ。\(b\) も \(1\) の原始4乗根か、その任意の累乗であるが、\(b=1\) であってもよい。
そうすると \(f(b,a)\) は、
\(f(b,a)=a^2b+a^4b^2+a^3b^3+a\)
\(a\) の指数は \([\:2,\:4,\:3,\:1\:]\)
\(b\) の指数は \([\:1,\:2,\:3,\:0\:]\)
である。
次に \(f(b,a^2)\) を計算すると、
\(\begin{eqnarray}
&&\:\:f(b,a^2)&=a^4b+a^8b^2+a^6b^3+a^2\\
&&&=a^4+a^3b+a^1b^2+a^2b^3\\
\end{eqnarray}\)
\(a\) の指数は \([\:4,\:3,\:1,\:2\:]\)
\(b\) の指数は \([\:1,\:2,\:3,\:0\:]\)
となる。
\(f(b,a^2)\) を \(f(b,a)\) と比べると、\(a\) の指数が \(1\) ステップだけ巡回している。ということは、\(b\) の指数も \([\:2,\:3,\:0,\:1\:]\) と \(1\) ステップだけ巡回させれば、\(a\) の指数と \(b\) の指数が同期することになり、\(f(b,a^2)\) の式は \(f(b,a)\) と同じものになる。同期させるには \(f(b,a^2)\) に \(b\) を掛ければよい。従って、
\(bf(b,a^2)=f(b,a)\)
である。
全く同様にして、
\(\begin{eqnarray}
&&\:\:b^2f(b,a^4)&=f(b,a)\\
&&\:\:b^3f(b,a^8)&=b^3f(b,a^3)\\
&&&=f(b,a)\\
\end{eqnarray}\)
となる。まとめると、
\(\begin{eqnarray}
&&\:\:bf(b,a^2)&=f(b,a)\\
&&\:\:b^2f(b,a^4)&=f(b,a)\\
&&\:\:b^3f(b,a^3)&=f(b,a)\\
\end{eqnarray}\)
である。\(b^4=1\) だから、各両辺を \(4\)乗すると、
\(f(b,a^2)^4=f(b,a)^4\)
\(f(b,a^4)^4=f(b,a)^4\)
\(f(b,a^3)^4=f(b,a)^4\)
の式を得る。
本題に戻って、次に \(f(b,a)^4\) を展開する。
であるが、このまま展開したのでは \(p=5\) のときに固有のものになり、一般性を失う。そこで、上式を展開して整理した形を、
とする。\(a^2,\:a^4,\:a^3,\:a\) の係数となっている \(h_i(b)\:(i=1,2,3,0)\) は \(b\) の多項式である。この展開形の決め方は次のように行う。
\((\br{B})\) 式においては、
であることに注意する。
次に \(f(b,a^2)^4\) を計算する。これは \((\br{B})\) 式において \(a\) を \(a^2\) に置き換えればよいから、
\(\begin{eqnarray}
&&\:\:f(b,a^2)^4&=h_1(b)a^4+h_2(b)a^8+h_3(b)a^6+h_0(b)a^2\\
&&&=h_1(b)a^4+h_2(b)a^3+h_3(b)a+h_0(b)a^2\\
\end{eqnarray}\)
となるが、これは \(f(b,a)^4\) において、
としたものと同じである。つまり、
\(f(b,a^2)^4=h_0(b)a^2+h_1(b)a^4+h_2(b)a^3+h_3(b)a\)
である。同様に、
\(f(b,a^4)^4=h_3(b)a^2+h_0(b)a^4+h_1(b)a^3+h_2(b)a\)
\(h_i(b)\) の添字 \(:\:[\:3,\:0,\:1,\:2\:]\)
\(f(b,a^3)^4=h_2(b)a^2+h_3(b)a^4+h_0(b)a^3+h_1(b)a\)
\(h_i(b)\) の添字 \(:\:[\:2,\:3,\:0,\:1\:]\)
である。
従って、\(f(b,a^i)^4\:\:(i=1,2,4,3)\) において、\(a^j\:(j=2,4,3,1)\) の係数は \(h_k(b)\:(k=1,2,3,0)\) の全てを巡回する。つまり、\(f(b,a^i)^4\:\:(i=1,2,4,3)\) の全部を足すと、\(a^j\:(j=2,4,3,1)\) の係数は全て同じになる。その計算をすると、
\(\displaystyle\sum_{i=1}^{4}f(b,a^i)^4\)
\(\begin{eqnarray}
&&\:\: =&(h_1(b)+h_2(b)+h_3(b)+h_0(b))\\
&&&\cdot(a^2+a^4+a^3+a)\\
\end{eqnarray}\)
となる。上式の左辺については、
\(\begin{eqnarray}
&&\:\:f(b,a^2)^4&=f(b,a)^4\\
&&\:\:f(b,a^4)^4&=f(b,a)^4\\
&&\:\:f(b,a^3)^4&=f(b,a)^4\\
\end{eqnarray}\)
だったので、左辺は \(4f(b,a)^4\) に等しい。また \(a^5-1=0\) なので \(a^2+a^4+a^3+a=-1\) である。従って、
\(4f(b,a)^4=-(h_1(b)+h_2(b)+h_3(b)+h_0(b))\)
である。ここで、
\(g(b)=-\dfrac{1}{4}\:(h_1(b)+h_2(b)+h_3(b)+h_0(b))\)
と定義すると、
を得る。\((\br{C})\) 式における \(\sqrt[4]{g(b)}\) とは「\(4\)乗すると \(g(b)\) になる数」という意味である。従って、実際には \(4\)次方程式の \(4\)つの解のどれかを表している。
なお、\(g(b)\) を具体的に計算すると、計算過程は省くが、
今までの計算をまとめると、
\(\begin{eqnarray}
&&\:\:a^5=1\:(a\neq1)&\\
&&\:\:b^4=1&\\
\end{eqnarray}\)
\(\begin{eqnarray}
&&\:\:f(b,a)&=a^2b+a^4b^2+a^3b^3+a\\
&&\:\:f(b,a)^4&=h_1(b)a^2+h_2(b)a^4+h_3(b)a^3+h_0(b)a\\
&&\:\:g(b)&=-\dfrac{1}{4}(h_1(b)+h_2(b)+h_3(b)+h_0(b))\\
&&\:\:f(b,a)&=\sqrt[4]{g(b)}\\
\end{eqnarray}\)
である。この過程で、\(a,\:b\) については \(a^5=1\:(a\neq1),\:b^4=1\) という条件しか使っていない。従って、この条件が満たせれば \(a,\:b\) は任意である。そこで \(1\) の原始5乗根を \(\zeta\) とし、\(1\) の原始4乗根を \(\omega\) として、
\(a=\zeta\)
\(b=\omega^j\:\:(j=1,2,3,4)\)
とおく。\(b\) は \(1\) にもなりうる(\(\omega^4=1\))。なお、\(\omega\) は普通 \(1\) の原始3乗根の記号であるが、ここでは原始4乗根として使う。
すると、
という、4つの式が得られる。これは、
\(\zeta^2,\:\:\zeta^4,\:\:\zeta^3,\:\:\zeta\)
を4つの未知数とする連立1次方程式である。帰納法の仮定により \(\omega\) はべき根で表されているから、方程式を解いて \(\zeta\) が \(\omega\) のべき根(と四則演算)で表されば、証明が完成することになる。
\((\br{E})\) の連立方程式を具体的に書くと、
\(\zeta^2+\omega^j\zeta^4+(\omega^j)^2\zeta^3+(\omega^j)^3\zeta=\sqrt[4]{g(\omega^j)}\)
\((j=1,2,3,4)\)
であり、全てを陽に書くと、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&\zeta^2+\omega\:\:\zeta^4+(\omega\:\:)^2\zeta^3+(\omega\:\:)^3\zeta&=\sqrt[4]{g(\omega)}& \br{①}&\\
&&\zeta^2+\omega^2\zeta^4+(\omega^2)^2\zeta^3+(\omega^2)^3\zeta&=\sqrt[4]{g(\omega^2)}& \br{②}&\\
&&\zeta^2+\omega^3\zeta^4+(\omega^3)^2\zeta^3+(\omega^3)^3\zeta&=\sqrt[4]{g(\omega^3)}& \br{③}&\\
&&\zeta^2+\omega^4\zeta^4+(\omega^4)^2\zeta^3+(\omega^4)^3\zeta&=\sqrt[4]{g(\omega^4)}& \br{④}&\\
\end{eqnarray}
\end{array}\right.\)
となる。この連立方程式を解くため、\(\zeta\) の項だけを残し、他の未知数である \(\zeta^2,\:\zeta^4,\:\zeta^3\) の項を消去することを考える。そのために、
\(A\::\:\br{①}\times\omega\:+\:\br{②}\times\omega^2\:+\:\br{③}\times\omega^3\:+\:\br{④}\times\omega^4\)
とおくと、
\(A\) の左辺 \(=\)
\(\omega\:\:\zeta^2+(\omega\:\:)^2\zeta^4+(\omega\:\:)^3\zeta^3+(\omega\:\:)^4\zeta+\)
\(\omega^2\zeta^2+(\omega^2)^2\zeta^4+(\omega^2)^3\zeta^3+(\omega^2)^4\zeta+\)
\(\omega^3\zeta^2+(\omega^3)^2\zeta^4+(\omega^3)^3\zeta^3+(\omega^3)^4\zeta+\)
\(\omega^4\zeta^2+(\omega^4)^2\zeta^4+(\omega^4)^3\zeta^3+(\omega^4)^4\zeta\)
となる。\(\zeta\) の4つの項は、係数が \((\omega^j)^4=(\omega^4)^j=1\) であり、
\(\zeta\) の項の合計 \(=\:4\zeta\)
である。
\(\zeta^2,\:\zeta^4,\:\zeta^3\) の項の係数は、
\(\omega^j+\omega^{2j}+\omega^{3j}+\omega^{4j}\:\:(j=1,2,3)\)
である。\(\omega^4=1\) なので、
\(\omega^j+\omega^{2j}+\omega^{3j}+1\:\:(j=1,2,3)\)
の形をしている。\(\omega\) は \(1\) の原始4乗根であり、\(x^4-1=0\) の根である。\(x^4-1\) は、
\(x^4-1=(x-1)(x^3+x^2+x+1)\)
と因数分解されるから、\(\omega,\:\omega^2,\:\omega^3\) は方程式
\(x^3+x^2+x+1=0\)
の3つの根である。つまり、
\(x^3+x^2+x+1=(x-\omega)(x-\omega^2)(x-\omega^3)\)
と因数分解される。この式に \(x=\omega^j\:(j=1,2,3)\) を代入すると、
\((\omega^j)^3+(\omega^j)^2+\omega^j+1\)
\(\begin{eqnarray}
&&\:\: &=\omega^{3j}+\omega^{2j}+\omega^j+1\\
&&&=(\omega^j-\omega)(\omega^j-\omega^2)(\omega^j-\omega^3)\\
&&&=0\:\:(j=1,2,3)\\
\end{eqnarray}\)
となる。つまり、\(\zeta^2,\:\zeta^4,\:\zeta^3\) の項の係数、\(\omega^j+\omega^{2j}+\omega^{3j}+1\) は全て \(0\) ということである。以上をまとめると、\(A\) の左辺は \(\zeta\) の項だけが残り、
\(A\) の左辺 \(=\:4\zeta\)
である。一方、\(A\) 式の右辺は、
\(A\) の右辺 \(=\:\displaystyle\sum_{j=1}^{4}\omega^j\sqrt[4]{g(\omega^j)}\)
である。従って、
\(4\zeta=\displaystyle\sum_{j=1}^{4}\omega^j\sqrt[4]{g(\omega^j)}\)
\((\br{F})\) 式における \(\sqrt[4]{g(\omega^j)}\) とは「\(4\)乗すると \(g(\omega^j)\) になる数」という意味であり、\(4\)次方程式の\(4\)つの解のどれかである。従って、実際に \(\omega\) に数を入れて(この場合は \(1\) の原始4乗根だから \(i\) か \(-i\))計算するときには、\(\zeta^5=1\) になるように \((\br{F})\) 式の \(4\)つの項のそれぞれについて、\(4\)つの解のどれかを選択する必要がある。しかしそうであっても、\(\zeta\) が \(\omega\) の多項式のべき根と四則演算で表現できるということは変わらない。
これまでの論理展開では、\(p=5\) であることの特殊性は何も使っていない。唯一、使ったのは、\(p\) が素数であり、そのときに \((\bs{Z}/p\bs{Z})^{*}\) に生成元がある(25D)ということである。
従って、\(\zeta\) が \(1\) の原始\(p\)乗根であり、\(\omega\) が \(1\) の原始\((p-1)\)乗根であっても \((\br{F})\) 式は、\(4\) を \((p-1)\) に置き換えれば成り立つ。
帰納法の仮定により、\(1\) の原始\((p-1)\)乗根 \(\omega\) はべき根で表される。従って \((\br{F})\) 式から、\(1\) の原始\(p\)乗根 である \(\zeta\) もべき根で表される。[証明終]
ためしに \((\br{F})\) 式を使って、\(1\) の原始5乗根、\(\zeta\) を計算してみます。\(\omega\) は \(1\) の原始4乗根(の一つ)なので \(\omega=i\)(虚数単位)とすると、\((\br{D})\) 式も含めて、
\(\begin{eqnarray}
&&\:\:g(b)&=-16b^3+14b^2+4b-1 (\br{D})\\
&&\:\:b&=\omega^j\:\:(j=1,2,3,4)\\
&&&=\:\{\:i,\:-1,\:-i,\:1\:\}\\
&&\:\:g(\omega)&=-15+20i\\
&&\:\:g(\omega^2)&=25\\
&&\:\:g(\omega^3)&=-15-20i\\
&&\:\:g(\omega^4)&=1\\
\end{eqnarray}\)
となり、これらを \((\br{F})\) 式に代入すると、
\(\zeta=\dfrac{1}{4}(\sqrt[4]{1}-\sqrt[4]{25}+i(\sqrt[4]{-15+20i}-\sqrt[4]{-15-20i}))\)
となります。\(\sqrt[4]{\cd}\) は「\(4\)乗して \(\cd\) になる数」の意味です。この式を、
\(4\zeta=r+is\)
\(\begin{eqnarray}
&&\:\: r&=\sqrt[4]{1}-\sqrt[4]{25}\\
&&\:\: s&=\sqrt[4]{-15+20i}-\sqrt[4]{15-20i}\\
\end{eqnarray}\)
と表すことにします。そして \(\sqrt[4]{\cd}\) を \(\sqrt{\cd}\) に変換するために2乗すると、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&r^2=\pm6\pm2\sqrt{5}&\\
&&s^2=\pm10\pm2\sqrt{5}&\\
\end{eqnarray}
\end{array}\right.\)
と計算できます。但し \(r^2+s^2=4\) の条件があるので、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&r^2=6\pm2\sqrt{5}&\\
&&s^2=10\pm2\sqrt{5}&\\
\end{eqnarray}
\end{array}\right.\)
となります(複合異順)。ここから \(r,\:s\) を求めると、\(r\) の方は2重根号をはずすことができて、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&r=\pm(1+\sqrt{5}),\:\:s=\pm\sqrt{10-2\sqrt{5}}&\\
&&r=\pm(1-\sqrt{5}),\:\:s=\pm\sqrt{10+2\sqrt{5}}&\\
\end{eqnarray}
\end{array}\right.\)
の合計8つの解が求まります。このうちの4つは方程式 \(x^5-1=0\) の解 \((=\zeta)\) で、残りの4つは方程式 \(x^5+1=0\) の解 \((=-\zeta)\) です。\(\zeta\) を表記すると、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&\zeta=\dfrac{1}{4}\left(-1+\sqrt{5}\pm i\sqrt{10+2\sqrt{5}}\right)&\\
&&\zeta=\dfrac{1}{4}\left(-1-\sqrt{5}\pm i\sqrt{10-2\sqrt{5}}\right)&\\
\end{eqnarray}
\end{array}\right.\)
の4つとなり、\(1\) の原始5乗根が求まりました。一般的な原始5乗根の計算方法とは違いますが、\((\br{F})\) 式によっても原始5乗根が求まることが確認できました。
7.2 べき根拡大の十分条件のため補題
ここでは「7.3 べき根拡大の十分条件」を証明するための補題を2つ証明します。以下に出てくる多項式 \(g(x)\) は、方程式を解くために考えられた「ラグランジュの分解式」と呼ばれるものです。分解式はレゾルベント(resolvent)とも言います。
補題(1)
\(\bs{L}\) を \(\bs{K}\) のガロア拡大とし、\(\mr{Gal}(\bs{L}/\bs{K})\) を \(\sg\) で生成される位数 \(n\) の巡回群とする。式 \(g(x)\) を、
と定義する。このとき、\(\bs{L}\) の全ての元 \(x\) について、\(g(x)=0\) となるような \(\bs{L}\) の元、\(a_1,\:a_2,\:\cd\:,a_{n-1}\) は存在しない。
[証明]
\(\bs{L}\) が原始元 \(\theta\) によって \(\bs{L}=\bs{K}(\theta)\) と表されているとし(32B)、\(\theta\) の \(\bs{K}\) 上の最小多項式を \(f(x)\) とする。最小多項式は既約多項式の定理(31I)により \(f(x)\) は既約多項式である。そうすると、\(\theta,\:\sg^i(\theta)\:(1\leq i\leq n-1)\) の \(n\)個は \(f(x)=0\) の解であり、既約多項式の定理3(31G)によって \(n\)個の解は全て異なる。つまり、
\(\theta-\sg^i(\theta)\neq0\:(1\leq i\leq n-1)\)
である。このことを踏まえて背理法で証明する。\(\bs{L}\) の任意の元 \(x\) について、
となるような \(\bs{L}\) の元 \(a_1,\:a_2,\:\cd\:,a_{n-1}\) が存在したとする。この \(g(x)=0\) の式から \(\sg^{n-1}(x)\) の項を消去することを考える。そのためにまず \(g(\theta x)\) を計算すると、
となる。この式から \(\sg^{n-1}(x)\) の項を消去するには、この式の \(\sg^{n-1}(x)\)の係数が \(a_{n-1}\sg^{n-1}(\theta)\) であり、また \(g(x)\) の \(\sg^{n-1}(x)\) の項の係数が \(a_{n-1}\) なので、
\(\sg^{n-1}(\theta)g(x)=0\)
の式を作って両辺から引けばよい。その計算をすると、
となる。ここで、\(x\) の係数である \((\theta-\sg^{n-1}(\theta))\) は、証明の最初に書いたように \(0\) ではない。そこで、全体を \((\theta-\sg^{n-1}(\theta))\) で割ると、
の形になる。ここで \(b_i\) は、
\(b_i=\dfrac{\sg^i(\theta)-\sg^{n-1}(\theta)}{\theta-\sg^{n-1}(\theta)}a_i\)
である。\((\br{B})\) 式は、基本的に \((\br{A})\) 式と同じで、\((\br{A})\) 式から \(\sg(x)^{n-1}\) の項を消去した形であり、\(x\) の最大次数の項は \(\sg(x)^{n-2}\) になっている。以上の、\((\br{A})\) から \((\br{B})\) への変換は繰り返し行えるから、\(n-2\) 回の変換を繰り返すと、
\(x+c_1\sg(x)=0\)
の形が得られる。この式にもう一度、\(n-1\) 回目の変換をすると、
となる。\(x\) は \(\bs{L}\) の任意の元だったから、\(\bs{L}\) のすべての元は \(0\) となってしまい、矛盾が生じた。従って背理法の仮定は誤りであり、\(\bs{L}\) の全ての元 \(x\) について、
補題(2)
\(\zeta\) を \(1\) の原始\(n\)乗根とし、\(\zeta\)を含む代数体を \(\bs{K}\) とする。\(\bs{K}\) のガロア拡大体を \(\bs{L}\) とし、\(\mr{Gal}(\bs{L}/\bs{K})\) は \(\sg\) で生成される位数 \(n\) の巡回群とする(= \(\bs{L}/\bs{K}\) が巡回拡大)。また \(f(x)\) を \(\bs{K}\) 上の \(n\)次既約多項式とし、\(\bs{L}\) が方程式 \(f(x)=0\) の解 \(\theta\) を用いて、\(\bs{L}=\bs{K}(\theta)\) と表されているものとする。このとき、
\(g(x)=x+\zeta^{n-1}\sg(x)+\zeta^{n-2}\sg^2(x)+\cd+\zeta\sg^{n-1}(x)\)
とおくと、\(g(\theta),\:g(\theta^2),\:\cd\:,g(\theta^{n-1})\) のうち少なくとも一つは \(0\) ではない。
[証明]
\(g(x)\) の形は、べき根拡大の十分条件のため補題1(72A)で、
\(a_i=\zeta^{n-i}\:(1\leq i\leq n-1)\)
と置いたものである。\(\zeta\) は \(\bs{K}\) の元 = \(\bs{L}\) の元だから、補題(1)により \(\bs{L}\) の任意の元 \(x\) について \(g(x)=0\) となることはない。
この \(g(x)\) は次のような性質をもっている。まず \(\bs{K}\) の任意の元を \(a\) とすると、\(\mr{Gal}(\bs{L}/\bs{K})\) の 元 \(\sg\) は \(a\) を不動にするから、
\(\sg^i(a)=a\)
である。従って、\(g(a)\) を計算すると、
\(g(a)=ag(1)\)
となる。また、\(\bs{K}\) の任意の元を \(a\)、\(\bs{L}\) の任意の元を \(x\) とすると、
\(\sg^i(ax)=\sg^i(a)\sg^i(x)=a\sg^i(x)\)
なので、
\(g(ax)=ag(x)\)
である。さらに \(\bs{L}\) の任意の2つの元を \(x,\:y\) とすると、
\(\sg^i(x+y)=\sg^i(x)+\sg^i(y)\)
なので、
\(g(x+y)=g(x)+g(y)\)
である。
\(\bs{L}\) は、\(\bs{K}\) 上の既約多項式 \(f(x)\) を用いた方程式 \(f(x)=0\) の解 \(\theta\) の単拡大体 \(\bs{K}(\theta)\) だから、単拡大の体の定理(32C)により、\(\bs{L}\) の任意の元 \(x\) は、
\(x=b_0+b_1\theta+b_2\theta^2+\cd+b_{n-1}\theta^{n-1}\:(b^i\in\bs{K})\)
と表せる。\(g(x)\) の式にこの \(x\) を代入すると、
\(\begin{eqnarray}
&&\:\:g(x)&=g(b_0+b_1\theta+b_2\theta^2+\cd+b_{n-1}\theta^{n-1})\\
&&&=g(b_0)+g(b_1\theta)+g(b_2\theta^2)+\cd+g(b_{n-1}\theta^{n-1})\\
&&&=b_0g(1)+b_1g(\theta)+b_2g(\theta^2)+\cd+b_{n-1}g(\theta^{n-1})\\
\end{eqnarray}\)
となる。ここで、
\(g(1)=1+\zeta^{n-1}+\zeta^{n-2}+\cd+\zeta\)
だが、\(g(1)(1-\zeta)=\zeta^n-1=0\) なので \(g(1)=0\) である。従って、\(g(\theta),\:g(\theta^2),\:\cd\:,g(\theta^{n-1})\) の全てが \(0\) だと、\(\bs{L}\) の全ての元 \(x\) について \(g(x)=0\) となり、矛盾が生じる。ゆえに、\(g(\theta),\:g(\theta^2),\:\cd\:,g(\theta^{n-1})\) のうち、少なくとも一つは \(0\) ではない。[証明終]
7.3 べき根拡大の十分条件
補題(1)と補題(2)を使って、体の拡大がべき根拡大になるための十分条件を証明します。
1の原始\(n\)乗根を \(\zeta\) とし、代数体 \(\bs{\bs{K}}\) には \(\bs{\zeta}\) が含まれるとする。\(\bs{L}/\bs{K}\) をガロア拡大とし、\(\mr{Gal}(\bs{L}/\bs{K})\) が巡回群とする(= \(\bs{L}/\bs{K}\) が巡回拡大)。拡大次数は \([\bs{L}:\bs{K}]=n\) とする。
このとき、\(\bs{L}\) は \(\bs{K}\) のべき根拡大である。
[証明]
\(\mr{Gal}(\bs{L}/\bs{K})\) は位数 \(n\) の巡回群なので、生成元を \(\sg\) とし、
\(\mr{Gal}(\bs{L}/\bs{K})=\{e,\:\sg,\:\sg^2,\:\cd\:,\sg^{n-1}\}\)
とする。\(\bs{L}\) の 元 \(c\) に対して、
\(\al=c+\zeta^{n-1}\sg(c)+\zeta^{n-2}\sg^2(c)+\:\cd+\zeta^2\sg^{n-2}(c)+\zeta\sg^{n-1}(c)\)
と定める。このとき \(\al\neq0\) となるように \(c\) を選べる。なぜなら、もし \(\al\neq0\) となる \(c\) が選べないとすると、\(\bs{L}\) の全ての元 \(x\) について、
\(x+\zeta^{n-1}\sg(x)+\zeta^{n-2}\sg^2(x)+\:\cd\:+\zeta\sg^{n-1}(x)=0\)
となるはずだが、これはべき根拡大の十分条件のため補題1(72A)、つまり、
\(\bs{L}\) の全ての元 \(x\) について、
\(x+a_1\sg(x)+a_2\sg^2(x)+\:\cd\:+a_{n-1}\sg^{n-1}(x)=0\)
となるような \(\bs{L}\) の元、\(a_1,\:a_2,\:\cd\:,a_{n-1}\) は存在しない
において、\(a_1=\zeta^{n-1},\:a_2=\zeta^{n-2},\:\cd\:,a_{n-1}=\zeta\) と置いたことに相当し、そのような \(a_i\:(1\leq i\leq n-1)\) は存在しないとする補題1の結論に反するからである。またべき根拡大の十分条件のため補題2(72B)では、\(c\) の選び方の例が示されている。そこで、\(\al\neq0\) となるように \(c\) を選んだとする。
\(\sg\)は \(\bs{K}\) の元である \(\zeta\) を不変にするので、
\(\sg(\zeta^{n-i}\sg^i(c))=\zeta^{n-i}\sg^{i+1}(c)\)
である。これを用いて \(\sg(\al)\) を計算すると、
\(\sg(\al)\)
\(=\sg(c)+\zeta^{n-1}\sg^2(c)+\zeta^{n-2}\sg^3(c)+\:\cd+\zeta^2\sg^{n-1}(c)+\zeta\sg^n(c)\)
\(=\zeta^n\sg(c)+\zeta^{n-1}\sg^2(c)+\zeta^{n-2}\sg^3(c)+\:\cd+\zeta^2\sg^{n-1}(c)+\zeta c\)
\(=\zeta(\zeta^{n-1}\sg(c)+\zeta^{n-2}\sg^2(c)+\zeta^{n-3}\sg^3(c)+\:\cd+\zeta\sg^{n-1}(c)+c)\)
\(=\zeta\al\)
となる。計算では、\(\zeta^n=1\) であることと(第1項)、\(\sg^n=e\) なので \(\sg^n(c)=c\) となること(最終項)を用いた。
ここで、\(\al=\zeta\al\) となるのは、\(\al=0\) のときだけであるが、\(\al\neq0\) なので \(\al\neq\zeta\al\) である。つまり \(\sg(\al)\neq\al\) であり、\(\al\) は \(\sg\) を作用させると不変ではない。従って \(\al\) は \(\bs{K}\) の元ではない \(\bs{L}\) の元である。さらに \(\sg^i(\al)\) を求めていくと、
\(\begin{eqnarray}
&&\:\:\sg^2(\al)&=\sg(\sg(\al))=\sg(\zeta\al)=\zeta\sg(\al)=\zeta\zeta\al\\
&&&=\zeta^2\al\\
&&\:\:\sg^3(\al)&=\sg(\sg^2(\al))=\sg(\zeta^2\al)=\zeta^2\sg(\al)=\zeta^2\zeta\al\\
&&&=\zeta^3\al\\
\end{eqnarray}\)
というように計算でき、
\(\sg^i(\al)=\zeta^i\al\)
である。これを使うと、
\(\begin{eqnarray}
&&\:\:\sg(\al^n)&=\sg(\al)^n=(\zeta\al)^n=\zeta^n\al^n\\
&&&=\al^n\\
\end{eqnarray}\)
であり、\(\al^n\) は \(\sg\) を作用させても不変である。従って \(\al^n\) は \(\bs{K}\) の元である。そこで \(\al^n=a\:\:(a\in\bs{K})\) とおく。
方程式 \(x^n-a=0\) の解は、\(\al,\:\zeta\al,\:\zeta^2\al,\:\cd,\:\zeta^{n-1}\al\) であり、\(x^n-a=0\) の \(\bs{K}\) 上の最小分解体は、\(\bs{K}\) には \(\zeta\) が含まれているから、
\(\bs{K}(\al,\:\zeta\al,\:\zeta^2\al,\:\cd,\:\zeta^{n-1}\al)=\bs{K}(\al,\zeta)=\bs{K}(\al)\)
である。この式から、\(\bs{K}\) の同型写像による \(\al\) の移り先は全て \(\bs{K}(\al)\) に含まれることが分かる。従って \(\sg^i\:\:(1\leq i\leq n-1)\) はすべて \(\bs{K}(\al)\) の自己同型写像である。また、同型写像での移り先の定理(51D)により、同型写像は \(\al\) を共役な元に移すが、\(\al\) と共役な元は \(n-1\) 個しかない。従って \(\sg^i\) 以外に同型写像はない。つまり、
\(\mr{Gal}(\bs{K}(\al)/\bs{K})=\{e,\:\sg,\:\sg^2,\:\cd\:,\:\sg^{n-1}\}\)
であり、これは \(\mr{Gal}(\bs{L}/\bs{K})\) と同じである。次数と位数の同一性の定理(52B)により、ガロア群に含まれる自己同型写像の数は体の拡大次数に等しいから、
\([\:\bs{K}(\al)\::\:\bs{K}\:]=[\:\bs{L}\::\:\bs{K}\:]\)
である。もともと \(\al\) は \(\bs{L}\) の元だったので、\(\bs{K}(\al)\) の元は全て \(\bs{L}\) の元である。つまり、
\(\bs{K}(\al)\:\subset\:\bs{L}\)
であるが、\(\bs{K}(\al)\) と \(\bs{L}\) の線形空間の次元が等しいので、体の一致の定理(33I)により2つは一致し、
\(\bs{K}(\al)=\bs{L}\)
である。以上により、\(\bs{L}\) は \(\bs{K}\) の上の方程式 \(x^n-a=0\:(a\in\bs{K})\) の解の一つ \(\al\) を用いて \(\bs{L}=\bs{K}(\al)\) と表されるから、\(\bs{L}\) は \(\bs{K}\) の べき根拡大である。[証明終]
証明の過程で出てきた、
\(\al=c+\zeta^{n-1}\sg(c)+\zeta^{n-2}\sg^2(c)+\:\cd+\zeta^2\sg^{n-2}(c)+\zeta\sg^{n-1}(c)\)
の式は、方程式を解くために考えられた「ラグランジュの分解式」と呼ばれるものです。分解式はレゾルベント(resolvent)とも言い、数学史においてはガロア理論より前に考えられたものです。この証明を振り返ってまとめてみると、
という条件のもとで、レゾルベントをうまく定義すると、
が成り立つという論理展開でした。つまりポイントは \(\bs{\al^n\in\bs{K}}\) のところであり、そういう \(\bs{\al\in\bs{L}}\) の存在が証明の核心です。
しかし、その鍵である \(\al\) を具体的に見つけようとすると、\(\al\) の式に現れる \(c\) を決めなければなりません。その \(c\) の値ですが、\(\bs{L}\) が方程式 \(f(x)=0\) の解 \(\theta\) を用いて \(\bs{L}=\bs{K}(\theta)\) と表されているとき(= \(\theta\) が原始元のとき)、\(c=\theta\) にできることがべき根拡大の十分条件のため補題2(72B)に示されています。しかし、方程式の形から原始元が分かるわけではありません。
べき根拡大の十分条件(73A)は、その十分条件があればべき根拡大体の中に方程式の解が含まれる(= 方程式の解が四則演算とべき根で記述できる)ことだけを言っています。つまり四則演算とべき根で記述できる解の存在証明であり、そこが注意点です。
原始\(n\)乗根はべき根で表現可能
べき根拡大の十分条件(73A)を用いて原始\(\bs{n}\)乗根はべき根で表現可能(71A)であることを証明できます。(71A)ではガロア理論と関係なく証明しましたが、ガロア理論の枠組みを使っても証明できるということです。
まず \(n\) が合成数のとき、つまり \(n=s\cdot t\) と分解できるときには、原始\(n\)乗根は、原始\(s\)乗根と原始\(t\)乗根のべき根で表現できます(71A)。\(s\) や \(t\) が合成数なら、さらに "分解" を続けられるので、結局、\(n\) が素数 \(p\) のときに原始\(p\)乗根がべき根で表せることを示せればよいことになります。
いま、\(\bs{p}\) 未満の素数すべての原始\(\bs{n}\)乗根がべき根で表されると仮定します。これは帰納法の仮定です。原始\(p\)乗根を \(\eta\)(イータ) とし、その最小多項式を \(f(x)\) とすると、\(f(x)\) は既約多項式で、円分多項式です(63D)。原始\(p\)乗根は 方程式 \(x^p-1=0\) の \(1\) 以外の根なので、
\(x^p-1=(x-1)f(x)\)
であり、
\(f(x)=x^{p-1}+x^{p-2}+\:\cd\:+x+1\)
です。
原始\(p\)乗根による拡大体 \(\bs{Q}(\eta)\) のガロア群は、
\(\mr{Gal}(\bs{Q}(\eta)/\bs{Q})\cong(\bs{Z}/p\bs{Z})^{*}\)
です(63E)。\((\bs{Z}/p\bs{Z})^{*}\) は位数 \((p-1)\) の巡回群で(25D)、\(\bs{Q}(\eta)/\bs{Q}\) の拡大次数は、\([\:\bs{Q}(\eta):\bs{Q}\:]=p-1\) です。原始\((p-1)\)乗根を \(\zeta\) とすると、\(\eta\notin\bs{Q}(\zeta)\) なので、\(\bs{Q}\) 上の既約多項式である \(f(x)\) は \(\bs{Q}(\zeta)\) 上でも既約多項式です。従って、
\(\mr{Gal}(\bs{Q}(\zeta,\eta)/\bs{Q}(\zeta))\cong\mr{Gal}(\bs{Q}(\eta)/\bs{Q})\)
であり、\(\mr{Gal}(\bs{Q}(\zeta,\eta)/\bs{Q}(\zeta))\) も位数 \((p-1)\) の巡回群です。すると、べき根拡大の十分条件(73A)により、\(\bs{Q}(\zeta,\eta)/\bs{Q}(\zeta)\) はべき根拡大になります。つまり \(\eta\) は "有理数と \(\zeta\) の四則演算から成る式" のべき根で表現できます。
「\(p\) 未満の素数すべての原始\(n\)乗根がべき根で表される」という仮定により、\(\zeta\) はべき根で表現できます。従って \(\eta\) もべき根で表されます。
原始\(2\)乗根は \(-1\) であり、原始\(3\)乗根は根の公式によって、べき根で表現できます。従って帰納法により \(5\) 以上の素数 \(p\) の原始\(p\)乗根もべき根で表現できることが分かります。これで証明ができました。
ここで、原始\(\bs{n}\)乗根はべき根で表現可能(71A)とべき根拡大の十分条件(73A)の関係ですが、(73A)の証明の鍵になったのは、ラグランジュの分解式、
\(\al=c+\zeta^{n-1}\sg(c)+\zeta^{n-2}\sg^2(c)+\:\cd+\zeta^2\sg^{n-2}(c)+\zeta\sg^{n-1}(c)\)
でした。いま、原始\(5\)乗根を \(\eta\) とし、\(\bs{Q}(\eta)/\bs{Q}\) の巡回拡大を考えます。原始\(4\)乗根を \(\zeta\) とします(\(\zeta=i,\:-i\))。
\(\bs{Q}(\eta)\) の自己同型写像 \(\sg\) を、
\(\sg(\eta)=\eta^2\)
となる写像と定義します。そして、\(c=\eta,\:n=4\) を分解式に入れると、
\(\begin{eqnarray}
&&\:\:\al&=\eta+\zeta^3\sg(\eta)+\zeta^2\sg^2(\eta)+\zeta\sg^3(\eta)\\
&&&=\eta+\zeta^3\eta^2+\zeta^2\eta^4+\zeta\eta^3\\
\end{eqnarray}\)
となります。このラグランジュの分解式と、原始\(\bs{n}\)乗根はべき根で表現可能(71A)の証明で使った \(f(x,y)\) は本質的に同じものです。つまり
と定義すると、\(x,\:y\) の指数はそれぞれ、
\(x\) の指数:\([\:1,\:2,\:3,\:0\:]\)
\(\bs{Z}/4\bs{Z}\) の巡回パターン(生成元 \(=1\))
\(y\) の指数:\([\:3,\:4,\:2,\:1\:]\)
\((\bs{Z}/5\bs{Z})^{*}\) の巡回パターン(生成元 \(=3\))
となります。(71A)では \((\bs{Z}/5\bs{Z})^{*}\) の巡回パターンを \([\:2,\:4\:,3,\:1\:]\)(生成元 \(=2\))としたので式の形は少々違いますが、本質的に同じです。ここで、
\(x=\zeta,\:\:y=\eta\)
と置くと、
\(\begin{eqnarray}
&&\:\:f(x,y)&=\eta+\zeta^3\eta^2+\zeta^2\eta^4+\zeta\eta^3\\
&&&=\al\\
\end{eqnarray}\)
となり、\(f(x,y)\) が ラグランジュの分解式と同じものであることが確認できました。つまり、原始\(\bs{n}\)乗根はべき根で表現可能(71A)の証明は、
ものなのでした。
7.4 べき根拡大と巡回拡大の同値性
6.3節の "べき根拡大は巡回拡大である"(63H)と、7.3節の "巡回拡大はべき根拡大である"(73A)を合わせると、次にまとめることができます。
\(1\) の原始\(n\)乗根を \(\zeta\) とし、代数体 \(\bs{\bs{K}}\) には \(\bs{\zeta}\) が含まれるとする。また、\(\bs{K}\) の\(n\)次拡大体を \(\bs{L}\) とする( \([\:\bs{L}\::\:\bs{K}\:]=n\) )。
このとき、
の2つは同値である。
\(\bs{1}\) の原始\(\bs{n}\)乗根が代数体に含まれるという条件をつけるのが巧妙なアイデアで、この条件によって可解性の必要十分条件が導けます。
7.5 可解性の十分条件
以上の準備をもとに、可解性の必要条件(64B)の逆である、可解性の十分条件の証明を行います。
代数拡大体 \(\bs{K}\) 上の多項式 \(f(x)\) の最小分解体を \(\bs{L}\) とし、拡大次数を \([\:\bs{L}\::\:\bs{K}\:]=n\) とします。そして、ガロア群 \(\mr{Gal}(\bs{L}/\bs{K})\) が可解群であるとき、もし \(\bs{K}\) に \(1\) の原始\(n\)乗根が含まれるなら、べき根拡大と巡回拡大は同値の定理(74A)により、\(\bs{K}\) の巡回拡大とべき根拡大は同じことです。従って、
可解群 \(\rightarrow\) 累巡回拡大 \(\rightarrow\) 累べき根拡大 \(\rightarrow\) 可解
というルートで、方程式 \(f(x)=0\) の可解性が証明できます。しかし、\(\bs{K}\) に \(1\) の原始\(n\)乗根が含まれるとは限りません。\(\bs{K}\) が有理数体 \(\bs{Q}\) だとすると、そこに(原始2乗根以外の)原始\(n\)乗根はありません。しかし、このようなケースでも方程式の可解性が証明できます。それが以下です。
体 \(\bs{K}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とする。\(\mr{Gal}(\bs{L}/\bs{K})=G\) とし、\(G\) は可解群とする。
このとき \(f(x)=0\) の解は四則演算とべき根で表現できる。
[証明]
\([\:\bs{L}\::\:\bs{K}\:]=n\:\:(|G|=n)\) とし、\(\zeta\) を \(1\) の原始\(n\)乗根とする。\(\bs{K}\) に \(\zeta\) を添加した拡大体 \(\bs{K}(\zeta)\)と、\(\bs{L}\) に \(\zeta\) を添加した拡大体 \(\bs{L}(\zeta)\) を考える。
\(\bs{L}(\zeta)\) は \(\bs{K}\) 上の方程式 \(f(x)(x^n-1)=0\) の最小分解体だから、\(\bs{L}(\zeta)/\bs{K}\) はガロア拡大である。
また \(\bs{K}(\zeta)\) は、\(\bs{K}\)のガロア拡大体 \(\bs{L}(\zeta)\) の中間体なので、中間体からのガロア拡大の定理(52C)によって、\(\bs{L}(\zeta)/\bs{K}(\zeta)\) もガロア拡大である。そこで、
\(\mr{Gal}(\bs{L}(\zeta)/\bs{K}(\zeta))=G\,'\)
とおく。
\(G\) の元を \(g\)、\(G\) の単位元を \(e\) とする。\(G\,'\)の元を \(g\,'\)、\(G\,'\) の単位元を \(e\,'\) とする。また、\(G\,'\) の元 \(g\,'\) を \(\bs{L}\) の元に限定して作用させるときの同型写像を \(\sg(g\,')\) とする。
\(g\,'\)は \(\bs{L}(\zeta)\) の自己同型写像だから、\(\bs{L}(\zeta)\) の元を共役な元に移す。従って 作用範囲を \(\bs{L}\) に限定した \(\sg(g\,')\) も \(\bs{L}\) の元を共役な元に移す。\(\bs{L}\) はガロア拡大体だから、\(\bs{L}\)の元の共役な元は \(\bs{L}\) に含まれる。従って \(\sg(g\,')\) は \(\bs{L}\) の自己同型写像である。
また \(g\,'\) は \(\mr{Gal}(\bs{L}(\zeta)/\bs{K}(\zeta))\) の元だから、\(\bs{K}(\zeta)\) の元を固定する。従って、\(\bs{K}(\zeta)\) の部分集合である \(\bs{K}\) の元も固定する。ゆえに、\(g\,'\) の作用範囲を \(\bs{L}\) に限定した \(\sg(g\,')\) も、\(\bs{L}\) の部分集合である \(\bs{K}\) の元を固定する。
以上により \(\sg(g\,')\) は、\(\bs{K}\)の元を固定する \(\bs{L}\) の自己同型写像だから、\(\mr{Gal}(\bs{L}/\bs{K})\) の元、つまり \(G\) の元である。
\(\sg\) を \(G\,'\) から \(G\) への写像と見なして考える。\(G\,'\) の元 を \(g\,'\) とし、\(x\) を \(\bs{L}\) の元とすると、\(g\,'(x)=\sg(g\,')(x)\) である。つまり、作用する対象が \(\bs{L}\) の元なら、2つの写像、\(g\,'\) と \(\sg(g\,')\) は同じ効果を生む。
\(G\,'\)の任意の2つの元を \(g_1{}^{\prime},\:g_2{}^{\prime}\) とすると、\(g_1{}^{\prime}g_2{}^{\prime}\) も \(G\,'\) の元だから、
\(g_1{}^{\prime}g_2{}^{\prime}(x)=g_1{}^{\prime}(\sg(g_2{}^{\prime})(x))\)
であるが、\(\sg(g_2{}^{\prime})(x)\) もまた \(\bs{L}\) の元だから、
\(\sg(g_1{}^{\prime}g_2{}^{\prime})=\sg(g_1{}^{\prime})\sg(g_2{}^{\prime})\)
となって、\(\sg\) は準同型写像(42A)である。
\(\sg(g\,')\) が \(G\) の元であり \(\sg\) が準同型写像なので、準同型写像の像と核の定理(42B)により、\(\sg\) による \(G\,'\) の 像 \(\sg(G\,')\) は \(G\) の部分群である。もちろん、\(G\) の部分群には \(G\) の自明な部分群である \(G\) 自身も含まれる。
いま、ある \(G\,'\) の元 \(h\) があって、\(\sg(h)=e\)(\(e\) は \(G\) の単位元)とする。つまり、\(h\) を \(\bs{L}\) に限定して適用すると、\(\bs{L}\) の元すべてを固定するものとする。
\(G\,'\) は \(\mr{Gal}(\bs{L}(\zeta)/\bs{K}(\zeta))\) であり、そのすべての元は \(\bs{K}(\zeta)\) の元を固定する。従って、\(G\,'\) の元 \(h\) は \(\zeta\) も固定する。ということは、\(h\) は「\(\bs{L}\) の元すべてを固定し、かつ \(\zeta\) を固定する」から、\(\bs{L}(\zeta)\) の元すべてを固定する。つまり \(h\) は \(G\,'\) の単位元であり、\(h=e\,'\) である。
ゆえに、準同型写像の像と核(42B)における核の定義によって、
\(\mr{Ker}\:\sg=e\,'\)
であり、核が単位元なら単射の定理(42C)によって、\(\sg\) は単射である。このことから、準同型定理(43A)により、
\(G\,'/\mr{Ker}\:\sg\:\cong\:\sg(G\,')\)
すなわち、
\(G\,'\:\cong\:\sg(G\,')\)
である。つまり \(\bs{G\,'}\) は \(\bs{G}\) の部分群 \(\bs{\sg(G\,')}\) と同型である。
\(G\) は可解群なので、可解群の部分群は可解群の定理(61C)によって、\(G\) の部分群である \(\sg(G\,')\) も可解群であり、さらにそれと同型である \(G\,'\) も可解群である。\(G\,'\) が可解群なので、可解群の定義により \(G\,'\) から \(e\,'\) に至る部分群の列、
\(|G\,'|=m\) とおくと、\(G\,'\) は \(G\) の部分群である \(\sg(G\,')\) と同型なので、ラグランジュの定理(41E)によって、\(m\) は \(|G|=n\) の約数である。
ガロア対応(53B)による \(H_i\) の固定体を \(\bs{K}_i\) とすると、
\(\bs{L}(\zeta)/\bs{K}(\zeta)\) の拡大次数は、
\([\:\bs{L}(\zeta)\::\:\bs{K}(\zeta)\:]=|G\,'|=m\)
であり、\(n\) の約数である。
固定体の系列における一つの拡大 \(\bs{K}_{i+1}/\bs{K}_i\)を考える。その拡大次数 \([\:\bs{K}_{i+1}\::\:\bs{K}_i\:]=m_i\) は、拡大次数の連鎖律(33H)によって \([\:\bs{L}(\zeta)\::\:\bs{K}(\zeta)\:]=m\) の約数であり、従って \(n\) の約数である。
\(\bs{K}_i\) は \(1\) の原始\(n\)乗根 \(\zeta\) を含むから、\(\zeta^{\frac{n}{m_i}}\) も含んでいる。\(\zeta^{\frac{n}{m_i}}\) は \(1\) の原始\(m_i\)乗根である。つまり、\(\bs{K}_i\) は \(1\) の原始\(m_i\)乗根(\(m_i=[\:\bs{K}_{i+1}\::\:\bs{K}_i\:]\))を含む。従って、べき根拡大の十分条件の定理(73A)により、巡回拡大である \(\bs{K}_{i+1}/\bs{K}_i\) はべき根拡大である。
以上のことは \((0\leq i < k)\) のすべてで成り立つから、\(\bs{K}_i\) の系列は累べき根拡大である。
\(f(x)=0\) の解は \(\bs{L}\) に含まれるが、\(\bs{L}\:\subset\:\bs{L}(\zeta)\) だから \(f(x)=0\) の解は \(\bs{L}(\zeta)\) に含まれる。その \(\bs{L}(\zeta)\) は \(\bs{K}(\zeta)\) の累べき根拡大であり、また \(1\) の原始\(n\)乗根である \(\zeta\) は \(\bs{Q}\:(\in\bs{K})\) の元の四則演算とべき根で表現できるから(71A)、\(\bs{L}(\zeta)\) の元はすべて \(\bs{K}\) の元の四則演算とべき根で表現できる。従って \(f(x)=0\) の解も \(\bs{K}\) の元の四則演算とべき根で表現できる。[証明終]
この定理では「体 \(\bs{K}\) 上の方程式 \(f(x)=0\)」としましたが、もちろん、体 \(\bs{K}\) が 有理数体 \(\bs{Q}\) であっても同じです。以降、\(\bs{K}\) を \(\bs{Q}\) と書きます。
証明のポイントは、\(G=\mr{Gal}(\bs{L}/\bs{Q})\) とし、\(G\,'=\mr{Gal}(\bs{L}(\zeta)/\bs{Q}(\zeta))\) とするとき、\(G\,'\) が \(G\) の部分群と同型であることです。たとえば、\(f(x)\) が既約な3次多項式だと、\(G\cong S_3\) か \(G\cong C_3\) であり、基本的に \(G\,'\cong G\) です。しかし、そうならない場合もあります。たとえば \(f(x)=x^3-2\) では \(G\cong S_3\) ですが、
\(\bs{Q}\:\subset\:\bs{Q}(\omega)\:\subset\:\bs{Q}(\omega,\sqrt[3]{2})=\bs{L}\)
(\(\omega\) は \(1\) の原始3乗根)
という体の拡大列でわかるように、\(\bs{L}(\omega)=\bs{L}\) です。つまり、\(\bs{L}(\omega)/\bs{Q}(\omega)\) の拡大次数は \(3\) であり、\(\bs{L}/\bs{Q}\) の拡大次数の \(6\) とは違います。しかしそうであっても \(G\,'=\mr{Gal}(\bs{L}(\omega)/\bs{Q}(\omega))\cong C_3\) であり、\(G\,'\) は \(G\cong S_3\) の部分群と同型です。
\(G\,'\) は \(G\) の部分群と同型なので、\(G\) が可解群なら \(G\,'\) も可解群であり(61C)、\(\bs{L}(\omega)/\bs{Q}(\omega)\) は累巡回拡大であり(62C)、従って、累べき根拡大です(73A)。
さらに、\(1\) の原始\(n\)乗根が \(\bs{Q}\) の元の四則演算とべき根で表現できる(71A)ことも証明のポイントになっています。
この可解性の十分条件の定理(75A)によって、有理数係数の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) として、\(\mr{Gal}(\bs{L}/\bs{Q})\) が可解群のとき、\(f(x)=0\) の解は四則演算とべき根で表現可能なことが証明できました。
ここがゴールで「ガロア理論=可解性の必要十分条件」が完結しました。
7.6 位数2の巡回拡大は平方根拡大:正5角形が作図できる理由
可解性の必要十分条件の証明は前節で尽きていますが、これ以降は可解な方程式の代表的なものを取り上げ、ガロア群の分析をします。まず最初は、
です。これらの方程式が可解であることは当然ですが、ガロア群の分析をすると正5角形と正\(17\)角形が定規とコンパスで作図できることを証明できます。
\(x^5-1=0\)
まず \(x^5-1=0\) の解を分析します。
\(x^5-1=(x-1)(x^4+x^3+x^2+x+1)\)
なので、\(1\) 以外の解を \(\zeta\) とすると、\(\zeta\) は4次方程式、
\(x^4+x^3+x^2+x+1=0\)
の解です。「7.1 1 の原始n乗根」で書いたように、この方程式の解は、
\(\zeta=\dfrac{1}{4}\left(-1+\sqrt{5}\pm\sqrt{-10-2\sqrt{5}}\right)\)
\(\zeta=\dfrac{1}{4}\left(-1-\sqrt{5}\pm\sqrt{-10+2\sqrt{5}}\right)\)
の4つであり、これが \(1\) の原始5乗根です。以下の論旨を明瞭にするために、虚数単位 \(i\) を使わずに、外側の \(\sqrt{\phantom{a}}\) の中を負の数にして記述しました。
この原始5乗根は、4次方程式の解であるにもかかわらず、四則演算と平方根 \(\sqrt{\phantom{a}}\) のみを使って表現されています。なぜそうなるのか、それをガロア理論にのっとって説明します。実は、\(p\) を素数としたとき、
ことが知られています。定規というのは「目盛りのない、与えられた2点を通る直線を引くことだけができる道具」であり、コンパスというのは「角度目盛りのない、与えられた2点のうちの1点を中心として別の点を通る円\(\cdot\)円弧を描くことだけができる道具」です。長さや角度を測ることはできません。作図可能の原理は次の項で説明します
\(f(x)=x^4+x^3+x^2+x+1\) とし、\(f(x)=0\) の解の一つを \(\zeta\) とすると、\(f(x)\) の最小分解体は \(\bs{Q}(\zeta)\) です。そのガロア群を、
\(G=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\)
と書くと、\(\zeta\) の最小多項式は \(f(x)\) なので(63C)、\(|G|=4\) です。また、\(\bs{\bs{Q}(\zeta)}\) のガロア群の定理(63E)により、\(G\) は既約剰余類群と同型で、
\(G\cong(\bs{Z}/5\bs{Z})^{*}\)
です。
\((\bs{Z}/5\bs{Z})^{*}=\{1,\:2,\:3,\:4\}\)
ですが、この群の生成元は \(2\) か \(3\) です。以下、生成元を \(2\) として話を進めると、
\(\begin{eqnarray}
&&\:\:(\bs{Z}/5\bs{Z})^{*}&=\{2,\:2^2,\:2^3,\:2^4\}\\
&&&=\{2,\:4,\:3,\:1\}\\
\end{eqnarray}\)
と表現できます。一方、\(f(x)=0\) の4つの解は、
\(\zeta,\:\:\zeta^2,\:\:\zeta^3,\:\:\zeta^4\)
です。そこで、
\(\sg(\zeta)=\zeta^2\)
で定義される自己同型写像を考えると、ガロア群は、
\(G=\{\sg,\:\sg^2,\:\sg^3,\:\sg^4=e\}\)
となり、位数 \(4\) の巡回群、かつ可解群です。また、体の拡大次数は、
\([\:\bs{Q}(\zeta):\bs{Q}\:]=4\)
です。
ガロア群 \(G\) には部分群が含まれています。つまり、
\(H=\{\sg^2,\:e\}\)
\(\sg^2(\zeta)=\zeta^4\)
と定義すると、\((\sg^2)^2=e\) なので \(H\) は部分群(\(\sg H=H\sg\) なので正規部分群)であり、位数 \(2\) の巡回群です。また、剰余群は、
\(G/H\cong\{e,\:\sg\}\)
です。従って、
\(G\:\sp\:H\:\:\sp\:\{\:e\:\}\)
は可解列です。ガロア対応の定理(53B)により、この可解列に対応する拡大体の列があって、
\(G\sp H\sp\{\:e\:\}\)
\(\bs{Q}\subset\bs{F}\subset\bs{Q}(\zeta)\)
となります。\(\bs{F}\) は \(H\) の固定体であり、\(\bs{Q}(\zeta)\) の中間体です。すると、正規性定理(53C)により、
\(\mr{Gal}(\bs{F}/\bs{Q})\cong G/H\)
なので、\(\mr{Gal}(\bs{F}/\bs{Q})\) は位数 \(2\) の巡回群です。またガロア群の定義により、
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{F})\cong H\)
であり、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{F})\) も位数 \(2\) の巡回群です。従って、次数と位数の同一性の定理(52B)より拡大次数は、
であり、2つの拡大は巡回拡大です。原始2乗根(\(=-1\))は \(\bs{Q}\) に含まれるので、巡回拡大はべき根拡大です(73A)。拡大次数 \(2\) のべき根拡大を(一般的な数学用語ではありませんが)「平方根拡大」と呼ぶことにすると、
と結論づけられます。原始5乗根が四則演算と平方根 \(\sqrt{\phantom{a}}\) のみを使って表現できる理由がここにあります。
ここまでは、中間体 \(\bs{F}\) がどういう拡大体かに触れていませんが、\(\bs{F}\) を具体的に表現することもできます。\(\bs{F}\) は \(H=\{e,\:\sg^2\}\) の固定体なので、\(\bs{F}=\bs{Q}(\theta)\) として、
\(\sg^2(\theta)=\theta\)
となる \(\theta\) を探します。\(\theta\) の選び方には自由度があり、たとえば \(\theta=\zeta^4+\zeta\) としてもよいのですが、ここでは、
\(\theta=(\zeta^2-\zeta^3)(\zeta^4-\zeta)\)
とします。このように選ぶと、\(\sg^2(\zeta)=\zeta^4\) なので、
\(\begin{eqnarray}
&&\:\:\sg^2(\theta)&=(\zeta^8-\zeta^{12})(\zeta^{16}-\zeta^4)\\
&&&=(\zeta^3-\zeta^2)(\zeta-\zeta^4)=\theta\\
\end{eqnarray}\)
となって、\(\theta\) は \(\sg^2\) で不変です。と同時に、\(\sg(\zeta)=\zeta^2\) なので、
\(\begin{eqnarray}
&&\:\:\sg(\theta)&=(\zeta^4-\zeta^6)(\zeta^8-\zeta^2)\\
&&&=(\zeta^4-\zeta)(\zeta^3-\zeta^2)=-\theta\\
\end{eqnarray}\)
となります。ということは、
\(\sg(\theta^2)=(\sg(\theta))^2=(-\theta)^2=\theta^2\)
であり、\(\theta^2\) は \(\sg\) で不変、つまり \(G\) のすべての元で不変となり、\(\theta^2\) は有理数です。そこで、
\(\zeta^5=1\)
\(\zeta^4+\zeta^3+\zeta^2+\zeta+1=0\)
の関係を使って \(\theta^2\) を計算すると、
\(\begin{eqnarray}
&&\:\:\theta^2&=(\zeta^2-\zeta^3)^2(\zeta^4-\zeta)^2\\
&&&=(\zeta^4-2\zeta^5+\zeta^6)(\zeta^8-2\zeta^5+\zeta^2)\\
&&&=(\zeta^4-2+\zeta)(\zeta^3-2+\zeta^2)\\
&&&=\zeta^7-2\zeta^4+\zeta^6-2\zeta^3+4-2\zeta^2+\zeta^4-2\zeta+\zeta^3\\
&&&=\zeta^2-2\zeta^4+\zeta-2\zeta^3+4-2\zeta^2+\zeta^4-2\zeta+\zeta^3\\
&&&=-\zeta^4-\zeta^3-\zeta^2-\zeta+4\\
&&&=5\\
\end{eqnarray}\)
となり、確かに\(\theta^2\) は有理数であることが分かります。つまり、
\(\theta=\sqrt{5}\)
です。従ってガロア対応は、
となります。原始5乗根に \(\sqrt{-10+2\sqrt{5}}\) のような項が現れるのは、中間体が \(\bs{Q}(\sqrt{5})\) であるという、体の拡大構造からくるのでした。
ここまでの論証を振り返ってみると、
\(p\) を素数とし、原始\(p\)乗根を \(\zeta\) とすると、
\(|\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})|=|(\bs{Z}/p\bs{Z})^{*}|=p-1\)
なので、
\(p-1=2^k\:\:(1\leq k)\)
の条件があると、\(\bs{Q}\) から \(\bs{Q}(\zeta)\) に至る「平方根拡大」の列が存在し、\(\zeta\) は四則演算と平方根 \(\sqrt{\phantom{a}}\) だけで表現できる。従って 正 \(p\)角形は定規とコンパスで作図可能である
ことが分かります。この条件は \(p=3,\:5\) で成立しますが、その次に成立するのは \(p=17\) です。
\(x^{17}-1=0\)
\(1\) の原始\(17\)乗根を \(\zeta\) とします。\(p=17\) の最小原始根は \(3\) で(25D)、\((\bs{Z}/17\bs{Z})^{*}\) の位数は \(16\) です。\((\bs{Z}/17\bs{Z})^{*}\) において \(3\) の累乗は、
\(\phantom{1}3,\:\phantom{1}9,\:10,\:13,\:\phantom{1}5,\:15,\:11,\:16,\)
\(14,\:\phantom{1}8,\:\phantom{1}7,\:\phantom{1}4,\:12,\:\phantom{1}2,\:\phantom{1}6,\:\phantom{1}1\)
と、すべての元を巡回します。従って、
\(\sg(\zeta)=\zeta^3\)
という自己同型写像 \(\sg\) を定義すると、
\(G=\{\sg,\sg^2,\sg^3,\cd,\sg^{15},\sg^{16}=e\}\)
が \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) です。
\(x^5-1=0\) のときと同様の考察をすると、\(G\) には3つの部分群があります。
\(H_1=\{\sg^2,\sg^4,\sg^6,\sg^8,\sg^{10},\sg^{12},\sg^{14},e\}\)
\(\sg^2(\zeta)=\zeta^9\)
\(H_2=\{\sg^4,\sg^8,\sg^{12},e\}\)
\(\sg^4(\zeta)=\zeta^{13}\:\:(\phantom{1}9^2\equiv13\:\:(\mr{mod}\:17))\)
\(H_3=\{\sg^8,e\}\)
\(\sg^8(\zeta)=\zeta^{16}\:\:(13^2\equiv16\:\:(\mr{mod}\:17))\)
の3つで、
\(G\sp H_1\sp H_2\sp H_3\sp\{\:e\:\}\)
は可解列です。ガロア対応の定理(53B)により、\(H_1,\:H_2,\:H_3\) にはそれぞれに対応した固定体 \(\bs{F}_1,\:\bs{F}_2,\:\bs{F}_3\) があって、
\(G\sp H_1\sp H_2\sp H_3\sp\{\:e\:\}\)
\(\bs{Q}\subset\bs{F}_1\subset\bs{F}_2\subset\bs{F}_3\subset\bs{Q}(\zeta)\)
のガロア対応になります。\(\bs{Q}\) から \(\bs{Q}(\zeta)\) までの4つの拡大次数は、剰余群の位数に等しいのですべて \(2\) です。つまり、\(\bs{\bs{Q}(\zeta)}\) は \(\bs{\bs{Q}}\) からの「平方根拡大」を4回繰り返したものであり、原始\(17\)乗根は四則演算と平方根 \(\sqrt{\phantom{a}}\) のみを使って表現できます。従って正\(17\)角形は定規とコンパスで作図可能です。
これは、ドイツの大数学者\(\cdot\)ガウス(\(1777-1855\))が\(19\)才のときに発見した定理として有名です。
作図可能の原理
ここで改めて、平面上の図形が定規とコンパスで「作図可能」という意味を明確にします。ここで "定規" は「目盛りのない、与えられた2点を通る線を引くことだけができる道具」であり、"コンパス" は「角度目盛りのない、与えられた2点のうちの1点を中心として別の点を通る円\(\bs{\cdot}\)円弧を描くことだけができる道具」でした。
平面上の図形は点と線でできています。線は2点を与えると描けるので、「作図可能」の意味は「平面上で作図可能な点とは何か」を定義することに帰着します。
平面を複素平面(\(=\bs{C}\))として考えます。以降、
の記号を使います。「作図可能」の意味は「複素平面上で作図可能な複素数(実数を含む)とは何か」を定義することです。
\(1,\:0\) は作図可能である。また複素平面の実軸と虚軸は作図できる。
任意の線分を単位長さとし、端点を \(1,\:0\) とします。2点を結ぶ直線が実軸で、\(0\) を通り実軸と垂直な直線を作図するとそれが虚軸です。
\(\al=a+b\:i\) とすると、\(a,\:b\) が作図可能なら \(\al\) も作図可能である。また、\(\al\) が作図可能なら \(a,\:b\) も作図可能である。
\(a\) が作図可能なら、\(-a\) も作図可能である。従って \(\al\) が作図可能なら \(-\al\) も作図可能である。
また \(a,\:b\) が作図可能なら \(a+b\) も作図可能である。従って、\(\al,\:\beta\) が作図可能なら \(\al+\beta\) も作図可能である。
\(a,\:b\) が作図可能なら \(ab\)も作図可能である。従って \(\al,\:\beta\) が作図可能なら \(\al\beta\) も作図可能である。
\(a\:\:(a\neq0)\) が作図可能なら \(a^{-1}\) も作図可能である。従って \(\al\:\:(\al\neq0)\) が作図可能なら \(\al^{-1}\) も作図可能である。
作図可能な \(\al\) を \(\al=a+b\:i\) とすると、
\(\al^{-1}=\dfrac{a}{a^2+b^2}-\dfrac{b}{a^2+b^2}\:i\)
です。\(a,\:b\) が作図可能なので、その四則演算の結果は作図可能です。従って \(\al^{-1}\) も作図可能です。
有理数 \(\bs{Q}\) は作図可能である。
実数のなかで作図可能な点は四則演算で閉じています。かつ、\(0,\:1\) は作図可能です。従って有理数は作図可能です。
\(a\) が正の実数のとき、\(\sqrt{a}\) は作図可能である。
\(a\) と \(-1\) を結ぶ線分を直径とする円を描き、虚軸との交点を \(x\cdot i\:(x\):実数) とすると、
\(1:x=x:a\)
なので、\(x=\pm\sqrt{a}\) です。従って \(\sqrt{a}\) は作図可能です。
\(\al\) を作図可能な複素数とするとき、\(\sqrt\al\) は作図可能である。
極形式を使って、
\(\al=r(\mr{cos}\theta+i\cdot\mr{sin}\theta)\)
とすると、\(r\) は作図可能であり、つまり \(\sqrt{r}\) も作図可能です。また、角 \(\theta\) を2等分する線も、定規とコンパスで作図可能です。従って \(\sqrt\al\) は作図可能です。
\(\al,\:\beta\) が作図可能な複素数とするとき、2次方程式 \(x^2+\al x+\beta=0\) の解は作図可能である。
ある複素数 \(\al\) は、作図可能な複素数を係数とする2次方程式、あるいは1次方程式の解となるときのみ、作図可能である。
2次方程式 \(x^2+\al x+\beta=0\) の解は、根の公式により、係数 \(\al,\:\beta\) の四則演算と平方根で表わされます。従って作図可能です。
定規とコンパスで作図可能な点は、作図可能な円や直線の交点として求まる点です。2次元 \(xy\) 平面( \(\bs{R}^2\) )で考えると、直線と直線の交点は1次方程式の解です。また円と直線の交点は2次方程式の解です。円と円の交点がどうかですが、\(a,\:b,\:c,\:d\) を実数として、2つの円の方程式を、
実数(\(a,\:b\))が作図可能と、複素数(\(a+bi\))が複素平面上で作図可能は同値です。従って、ある複素数 \(\al\) は、作図可能な複素数を係数とする2次方程式、あるいは1次方程式の解となるときのみ、作図可能です。
\(\bs{Q}\) の代数拡大体 \(\bs{K}\) があり、
\(\bs{Q}=\bs{K}_0\subset\bs{K}_1\subset\cd\subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cd\subset\bs{K}_n=\bs{K}\)
\([\:\bs{K}_{i+1}:\bs{K}_i\:]=2\:\:(0\leq i < n)\)
を満たす \(\bs{Q}\) から \(\bs{K}\) の拡大列が存在するとき、\(\bs{K}\) の元
\(\al\in\bs{K}\)
は作図可能である。
\([\:\bs{K}_{i+1}:\bs{K}_i\:]=2\) であれば、\(\bs{K}_{i+1}/\bs{K}_i\) は次数2のべき根拡大であり、
\(x^2-a=0\:\:\:(a\in\bs{K}_i)\)
の解、\(\sqrt{a}\) を用いて、
\(\bs{K}_{i+1}=\bs{K}_i(\sqrt{a})\)
と表されます。従って、\(\bs{K}_i\) の元が作図可能なら、\(\bs{K}_{i+1}\) の元は「作図可能な点の四則演算と平方根の組み合わせ」で表現できるので、作図可能です。体の拡大列の出発点である \(\bs{Q}\) の元は作図可能なので、到達点である \(\bs{K}\) の元も作図可能になります。
\(1\) の原始\(p\)乗根(\(p\):素数)を \(\zeta\) とすると、\(G=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) の位数は \(p-1\) であり、それが2の累乗であれば、\(G\) の可解列にガロア対応する体の拡大系列、
\(\bs{Q}=\bs{K}_0\subset\bs{K}_1\subset\cd\subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cd\subset\bs{K}_n=\bs{Q}(\zeta)\)
\([\:\bs{K}_{i+1}:\bs{K}_i\:]=2\:\:(0\leq i < n)\)
が存在します(前項での証明)。従って複素数平面上の点 \(\zeta\) は作図可能であり、正 \(p\)角形は作図可能です。条件に合致する素数は \(p=3\)、\(5\)、\(17\)、\(257\)、\(65537\)であることが知られています。これらの素数をフェルマ素数と呼びます。フェルマ素数 \(p\) とは、\(p-1\) が2の累乗であるような素数です。
さらに、一般の正 \(n\)角形が作図可能である条件は、次のようになります。
正 \(n\)角形は、
\(n=2^k\:\:\:(2\leq k)\)
\(n=2^k\cdot p_1p_2\cd p_r\:\:\:(0\leq k,\:\:1\leq r)\)
\(p_i\) は相異なるフェルマ素数
のとき、作図可能である。
[証明]
角度の2等分線は作図可能なので、\(n=2^k\:\:(2\leq k)\) のとき、正 \(n\)角形は作図可能である。と同時に、正 \(m\)角形が作図可能なとき、
\(n=2^k\cdot m\:\:(0\leq k)\)
とおくと、正 \(n\)角形は作図可能になる。\(p\) がフェルマ素数のとき、正 \(p\)角形は作図可能なので、
\(m_1\) と \(m_2\) を互いに素な3以上の数とするとき、正 \(m_1\) 角形と正 \(m_2\)角形が作図可能であれば、正 \(m\)角形(\(m=m_1m_2\))は作図可能である
ことが証明できれば十分である。
\(\theta,\:\theta_1,\:\theta_2\) を任意の角度とする。
\(\mr{sin}\theta=\sqrt{1-\mr{cos}^2\theta}\)
だから、\(\mr{cos}\theta\) が作図できれば \(\mr{sin}\theta\) も作図できる。また三角関数の加法定理より、
\(\mr{cos}(\theta_1+\theta_2)=\mr{cos}\theta_1\cdot\mr{cos}\theta_2-\mr{sin}\theta_1\cdot\mr{sin}\theta_2\)
なので、\(\mr{cos}\theta_1,\:\mr{cos}\theta_2\) が作図できれば \(\mr{cos}(\theta_1+\theta_2)\) も作図できる。このことから \(\mr{cos}\theta\) が作図できれば \(\mr{cos}(k\theta)\:\:(k\) は整数)も作図できる。
複素平面上で原点を中心とする半径1の円に正 \(m\)角形を描いたとき、その頂点の複素数は
\(\mr{cos}\left(\dfrac{2\pi}{m}k\right)+i\:\mr{sin}\left(\dfrac{2\pi}{m}k\right)\:\:(0\leq k\leq m-1)\)
である。\(k=1\) の点が作図できれば、残りの点が作図できるから、
\(\mr{cos}\left(\dfrac{2\pi}{m}\right)\)
が作図できれば、正 \(m\)角形は作図できる。
\(m_1\) と \(m_2\) は互いに素だから、不定方程式の解の存在の定理(21C)により、
\(k_1m_1+k_2m_2=1\)
を満たす \(k_1,\:k_2\) が存在する。両辺を \(m=m_1m_2\) で割ると
\(\dfrac{k_1}{m_2}+\dfrac{k_2}{m_1}=\dfrac{1}{m}\)
\(\dfrac{2\pi}{m_2}k_1+\dfrac{2\pi}{m_1}k_2=\dfrac{2\pi}{m}\)
が得られる。正 \(m_1\)角形と正 \(m_2\)角形 は作図できるから、
\(\mr{cos}\left(\dfrac{2\pi}{m_1}\right),\:\:\mr{cos}\left(\dfrac{2\pi}{m_2}\right)\)
は作図できる。従って
\(\mr{cos}\left(\dfrac{2\pi}{m_2}k_1+\dfrac{2\pi}{m_1}k_2\right)\)
は作図でき、
\(\mr{cos}\left(\dfrac{2\pi}{m}\right)\)
も作図できることになって、正 \(m\)角形は作図できる。[証明終]
証明の鍵は「\(m_1\) と \(m_2\) が互いに素」です。従って、正3角形が作図できても、正9角形は作図できません。正\(15\)角形なら作図できます。計算すると、作図可能な正 \(n\)角形(\(n\leq100\))は、
です。「正\(50\)角形は作図できないが、正\(51\)角形は作図できる」というのも不思議な感じがします。
7.7 巡回拡大はべき根拡大:3次方程式が解ける理由
この節では可解な方程式がなぜ解けるのかを、3次方程式を例にとってガロア理論で説明します。また3次方程式の根の公式をガロア理論に沿った形て導出します。「7.5 可解性の十分条件」で証明したことは、
体 \(\bs{K}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とする。\(\mr{Gal}(\bs{L}/\bs{K})=G\) とし、\(G\) は可解群とする。このとき \(f(x)=0\) の解は四則演算とべき根で表現できる。
でした。この証明の核となっているのは「7.3 べき根拡大の十分条件」であり、それは、
1の原始\(n\)乗根を \(\zeta\) とし、代数体 \(\bs{\bs{K}}\) には \(\bs{\zeta}\) が含まれるとする。\(\bs{L}/\bs{K}\) をガロア拡大とし、\(\mr{Gal}(\bs{L}/\bs{K})\) が巡回群とする(= \(\bs{L}/\bs{K}\) が巡回拡大)。拡大次数は \([\bs{L}:\bs{K}]=n\) とする。このとき、\(\bs{L}\) は \(\bs{K}\) のべき根拡大である。
でした。このことを証明した論理展開は、次のようでした。
次の条件があるとする。
このとき、レゾルベント(分解式)を定義することで、
となる。
つまり、レゾルベントを使って、巡回拡大=べき根拡大(但し、体に \(1\) の原始\(n\)乗根が含まれることが条件)を証明したわけです。この証明プロセスを、具体的な3次方程式で順にたどります。まず、3次方程式のガロア群を再度整理します。
3次方程式のガロア群
3次方程式のガロア群は「1.3 ガロア群」で計算しましたが、改めて書きます。3次方程式のガロア群は、3次方程式の3つの解、\(\al,\:\beta,\gamma\) を入れ替える(置換する)群であり、一般的には、
\(G=\{e,\:\sg,\:\sg^2,\:\tau,\:\sg\tau,\:\sg^2\tau\}\)
です。3つの解をそれぞれ \(1,\:2,\:3\) の文字で表し、巡回置換の記法(6.5節)で書くと、
で(\(\sg,\:\tau\) の演算は右から行う)、これは3次の対称群(\(S_3\)。6.5節)です。この群はもちろん可換群ではなく \(\tau\sg\neq\sg\tau\) ですが、\(\tau\sg\) を計算すると、
\(\tau\sg=(1,\:3)\)
であり、
\(\tau\sg=\sg^2\tau\)
との関係が成り立っています。これを "弱可換性" と呼ぶことにします(ここだけの用語です)。ここで、
\(H=\{e,\:\sg,\:\sg^2\}\)
という \(G\) の部分群を考えると、\(H\) は巡回群であると同時に \(G\) の正規部分群です。"弱可換性" を使って検証してみると、
\(\begin{eqnarray}
&&\:\:\tau H&=\{\tau,\:\tau\sg,\:\tau\sg^2\}\\
&&&=\{\tau,\:\sg^2\tau,\:\sg^2\tau\sg\}\\
&&&=\{\tau,\:\sg^2\tau,\:\sg^4\tau\}\\
&&&=\{\tau,\:\sg^2\tau,\:\sg\tau\}\\
&&&=\{\tau,\:\sg\tau,\:\sg^2\tau\}\\
&&&=H\tau\\
\end{eqnarray}\)
となります。つまり、
\(\tau H=H\tau\)
です。さらに、この式に左から \(\sg\) をかけると、
\(\sg\tau H=\sg H\tau\)
ですが、\(H\) のすべての元は \(\sg\) で表現できるので、\(\sg H=H\sg\) です。従って、
\(\sg\tau H=H\sg\tau\)
であり、同様にして、
\(\sg^2\tau H=H\sg^2\tau\)
も分かります。つまり、任意の \(\bs{G}\) の元 \(\bs{x\in G}\) について、\(\bs{xH=Hx}\) が成り立つので \(H\) は \(G\) の正規部分群です。
\(G\) の \(H\) による剰余群は、
\(G/H=\{H,\tau H\}\)
であり、単位元は \(H\) で、
\((\tau H)^2=\tau H\tau H=\tau\tau HH=H\)
となる、位数\(2\) の巡回群です(\(G/H\cong C_2)\)。この結果、
\(G\:\sp\:H\:\sp\:\{\:e\:\}\)
は可解列になり、\(G\) は可解群で、従って3次方程式は可解です(=四則演算とべき根で解が表現可能)。この節ではそれを具体例で確認していきます。
一方、「3.3 線形空間」の「代数拡大体の構造」で書いたように、3次方程式のガロア群が \(S_3\) ではなく、位数 \(3\) の巡回群( \(C_3\) )になる場合があります。それを再度整理します。
\(x^3+ax^2+bx+c=0\) の3次方程式は、\(x=X-\dfrac{a}{3}\) とおくと、
\(X^3+\left(b-\dfrac{a^2}{3}\right)X+\left(\dfrac{2}{27}a^3-\dfrac{1}{3}ab+c\right)=0\)
となって、2乗の項が消えます。従って以降、3次方程式を、
\(x^3+px+q=0\)
の形で扱います。
\(f(x)=x^3+px+q\)
とおき、\(f(x)\) は既約多項式とします。3次方程式の根を \(\al,\:\beta,\:\gamma\) とすると、
\(x^3+px+q=(x-\al)(x-\beta)(x-\gamma)\)
であり、根と係数の関係から、
\(\al+\beta+\gamma=0\)
\(\al\beta+\beta\gamma+\gamma\al=p\)
\(\al\beta\gamma=-q\)
です。3次方程式のガロア群が \(S_3\) か \(C_3\) かを決めるポイントとなるのは、
\(\theta=(\al-\beta)(\beta-\gamma)(\gamma-\al)\)
で定義される、根の差積と呼ばれる値です。差積は普通、\(\Delta\)(ギリシャ文字・デルタの大文字)で表しますが、後の説明の都合で \(\theta\) と書きます。差積は、任意の2つの根の互換で \(-\theta\) となるので、3つの根を \(\al,\:\beta,\:\gamma\) に割り当てる方法によって、\(\theta\) は2つの値をとり得ます。差積の2乗が判別式であり、
\(D=(\al-\beta)^2(\beta-\gamma)^2(\gamma-\al)^2\)
です。つまり \(\theta=\sqrt{D}\) と書けますが、\(\sqrt{D}\) は「2乗して \(D\) となる2つの数のどちらか」の意味です。\(D\) は \(\al,\:\beta,\:\gamma\) の任意の置換で不変な対称式なので、3次方程式の係数である \(p,\:q\) で表すことができる有理数です。
その \(D\) を方程式の係数で表すために、\(f(x)\) を微分します。
\(f(x)=(x-\al)(x-\beta)(x-\gamma)\)
なので、
\(\begin{eqnarray}
&&\:\:f\,'(x)=&(x-\al)(x-\beta)+(x-\beta)(x-\gamma)+\\
&&&(x-\gamma)(x-\al)\\
\end{eqnarray}\)
であり、
\(f\,'(\al)=(\al-\beta)(\al-\gamma)\)
\(f\,'(\beta)=(\beta-\gamma)(\beta-\al)\)
\(f\,'(\gamma)=(\gamma-\al)(\gamma-\beta)\)
となります。従って、
\(D=-f\,'(\al)f\,'(\beta)f\,'(\gamma)\)
です。一方、
\(f\,'(x)=3x^2+p\)
なので、
\(D=-(3\al^2+p)(3\beta^2+p)(3\gamma^2+p)\)
となります。ここからの計算を進めるために、次の2つの対称式を、根と係数の関係を使って \(p\) で表しておきます。
・\(\al^2+\beta^2+\gamma^2\)
\(=(\al+\beta+\gamma)^2-2(\al\beta+\beta\gamma+\gamma\al)\)
\(=-2p\)
・\(\al^2\beta^2+\beta^2\gamma^2+\gamma^2\al^2\)
\(=(\al\beta+\beta\gamma+\gamma\al)^2-2\al\beta\gamma(\al+\beta+\gamma)\)
\(=p^2\)
これを用いると、
\(\begin{eqnarray}
&&\:\:D&=&-(3\al^2+p)(3\beta^2+p)(3\gamma^2+p)\\
&&&=&-27(\al\beta\gamma)^2-9(\al^2\beta^2+\beta^2\gamma^2+\gamma^2\al^2)p\\
&&&&-3(\al^2+\beta^2+\gamma^2)p^2-p^3\\
&&&=&-27q^2-9\cdot p^2\cdot p-3\cdot(-2p)\cdot p^2-p^3\\
&&&=&-4p^3-27q^2\\
\end{eqnarray}\)
と計算できます。つまり、
\(D=-4p^3-27q^2\)
です。ここでもし、\(D\) がある有理数 \(a\) の2乗(\(D=a^2\))なら、
\(\theta=\sqrt{D}=\pm a\)
となり、\(\theta\) は有理数です。\(\theta\) が有理数(\(\theta=\pm a\))の場合、
\(f\,'(\al)=(\al-\beta)(\al-\gamma)\)
\(f\,'(\al)=3\al^2+p\)
の関係があるので、
\(\begin{eqnarray}
&&\:\:\theta&=(\al-\beta)(\beta-\gamma)(\gamma-\al)\\
&&&=-f\,'(\al)(\beta-\gamma)\\
&&&=-(3\al^2+p)(\beta-\gamma)\\
\end{eqnarray}\)
ですが、\(\theta=\pm a\) なので、
\(\beta-\gamma=\pm\dfrac{a}{3\al^2+p}\)
です。この式と、根と係数の関係である、
\(\beta+\gamma=-\al\)
を使うと、\(\bs{\beta}\) と \(\bs{\gamma}\) が \(\bs{\al}\) の有理式(=分母・分子が \(\bs{\al}\) の多項式)で表現できることになります。計算すると(\(\pm\)は省略して)、
\(\beta=\dfrac{2p\al+3q-a}{2(3\al^2+p)}\)
\(\gamma=\dfrac{2p\al+3q+a}{2(3\al^2+p)}\)
です(\(\beta\) と \(\gamma\) は逆でもよい)。\(\beta,\:\gamma\) が \(\al\) の有理式で表現できるので、
\(\bs{Q}(\al,\beta,\gamma)\subset\bs{Q}(\al)\)
であり、もちろん \(\bs{Q}(\al,\beta,\gamma)\sp\bs{Q}(\al)\) なので。
\(\bs{Q}(\al,\beta,\gamma)=\bs{Q}(\al)\)
です。\(\bs{Q}(\al)\) のところは \(\bs{Q}(\beta)\) や \(\bs{Q}(\gamma)\) とすることができます。
つまり、\(\bs{Q}\) 上の既約多項式 \(f(x)=x^3+px+q\) の最小分解体 \(\bs{L}=\bs{Q}(\al,\beta,\gamma)\) は、方程式の解の一つである \(\al\) の(または \(\beta,\:\gamma\) の)単拡大体であり、単拡大体の基底の定理(33F)により \(\bs{L}\) の次元は \(3\) です。すると次数と位数の同一性(52B)により、\(G=\mr{Gal}(\bs{L}/\bs{Q})\) の群位数は \(3\) です。従って、ラグランジュの定理(41E)により群位数が素数の群は巡回群なので、\(G\) は群位数 \(3\) の巡回群( \(C_3\) )です。
以上をまとめると、3次方程式の最小分解体のガロア群は、次のようになります。
前提として、
・\(f(x)=x^3+px+q\:\:(p,\:q\in\bs{Q})\)
( \(f(x)\) は既約多項式 )
・\(f(x)=0\) の解を \(\al,\:\beta,\:\gamma\)
・\(\theta=(\al-\beta)(\beta-\gamma)(\gamma-\al)\)
・\(f(x)\) の最小分解体を \(\bs{L}=\bs{Q}(\al,\beta,\gamma)\)
・\(G=\mr{Gal}(\bs{L}/\bs{Q})\)
とする。この前提のもとで、
\(\bs{\theta}\):有理数のとき
\(G\cong C_3\)
\(G=\{\:e,\:\sg,\:\sg^2\:\}\)
\(\sg=(1,\:2,\:3)\)
\(G\) は巡回群なので可解群
\(\bs{\theta}\):有理数でないとき
\(G\cong S_3\)
\(G=\{e,\:\sg,\:\sg^2,\:\tau,\:\sg\tau,\:\sg^2\tau\}\)
\(\sg=(1,\:2,\:3)\:\:\tau=(2,\:3)\)
\(H=\{e,\:\sg,\:\sg^2\}\) は \(G\) の正規部分群
\(G\:\sp\:H\:\:\sp\:\{\:e\:\}\) は可解列
\(G\) は可解群
なお、\((1,\:2,\:3)\:\:(2,\:3)\) の巡回置換は \((1,\:3,\:2)\:\:(1,\:2)\:\:(1,\:3)\) などとしても同じです。
\(C_3\::\:x^3-3x+1\)
まずガロア群が \(C_3\) の方程式 \(x^3-3x+1=0\) を取り上げ、巡回拡大がべき根拡大になる原理を確認します。この原理はガロア群が \(S_3\) のときにもそのまま応用できます。ちなみに \(C_3\) の方程式は \(p,\:q\) が \(-9\leq p\leq-1,\:\:1\leq q\leq9\) の整数だと、他に、
\(x^3-7x+6=0\:\:\:(D=400,\:\sqrt{D}=20)\)
\(x^3-7x+7=0\:\:\:(D=\phantom{0}49,\:\sqrt{D}=\phantom{0}7)\)
\(x^3-9x+9=0\:\:\:(D=729,\:\sqrt{D}=27)\)
があります。
\(x^3-3x+1=0\) の場合、\(p=-3,\:q=1\) なので、
\(\begin{eqnarray}
&&\:\:D&=-4p^3-27q^2=81=9^2\\
&&\:\:\theta&=\pm\sqrt{D}=\pm9\\
\end{eqnarray}\)
となります。3つの解を \(\al,\:\beta,\:\gamma\) とすると、
\(\bs{L}=\bs{Q}(\al,\beta,\gamma)=\bs{Q}(\al)=\bs{Q}(\beta)=\bs{Q}(\gamma)\)
で、\(\bs{L}\) の次元は \(3\) で、\(G=\mr{Gal}(\bs{L}/\bs{Q})\cong C_3\) です。
以下「7.3 べき根拡大の十分条件」の証明の論理に沿います。7.3 の証明では、体に \(1\) の原始\(n\)乗根が含まれているのが条件でした。そこで \(1\) の原始3乗根 を \(\omega\) とし、
\(\bs{Q}(\omega)\:\subset\:\bs{Q}(\omega,\:\al)=\bs{L}(\omega)\)
という体の拡大を考えます。\(\omega\) は \(x^2+x+1=0\) の2つある根のどちらかで、
\(\omega=\dfrac{1}{2}(-1\pm\sqrt{3}i)\)
です。7.3 ではラグランジュのレゾルベントを \(\al\) と書きましたが、方程式の根の表記との重複を避けるため、ここでは \(S\) とします。そうするとレゾルベントは、
です。\(\bs{Q}(\omega,\:\al)\) は \(\bs{Q}(\omega)\) に \(\al\) を添加した単拡大体なので、べき根拡大の十分条件のため補題2(72B)に従って、\(c=\al\) と定めます。そうすると、
\(S=\al+\omega^2\sg(\al)+\omega\sg^2(\al)\)
となり、\(\al,\:\beta,\:\gamma\) で表すと、\((\br{A})\) 式は、
です。この \(S\) は \(\bs{Q}(\omega,\al,\beta,\gamma)\) の元ですが、
\(\bs{Q}(\omega,\al,\beta,\gamma)=\bs{Q}(\omega,\al)\)
なので、\(S\) は \(\bs{Q}(\omega,\al)\) の元であり、ということは、
\(\bs{Q}(\omega,\:S)\subset\bs{Q}(\omega,\al)\)
です。方程式の3つの解を \(\al,\:\beta,\:\gamma\) に割り当てる方法の数(\(=3!\) )により、\(S\) は6通りの可能性があります。
7.3 での証明のポイントは、\(\bs{S^3}\) が \(\bs{\bs{Q}(\omega)}\) の元である、というところでした。それを計算で確かめるため、もうひとつのレゾルベントを導入します。ガロア群 \(G=\{e,\sg,\sg^2\}\) は、\(\sg\) が生成元であると同時に、\(\sg^2\) も生成元です。レゾルベントの定義における \(\sg\) は \(G\) の生成元であることが条件でした(73A)。そこで \((\br{A})\) 式の \(\sg\) を \(\sg^2\) で置き換えた式を \(T\) とすると、
\(\begin{eqnarray}
&&\:\:T&=c+\omega^2\sg^2(c)+\omega\sg^4(c)\\
&&&=c+\omega^2\sg^2(c)+\omega\sg(c)\\
\end{eqnarray}\)
となります。この式で \(c=\al\) とおくと
\(T=\al+\omega\beta+\omega^2\gamma\)
です。\(S\) には6通りの可能性がありますが、\(S\) をそのうちの一つに決めると \(T\) は一意に決まります。ここで、
は \(\al,\:\beta,\:\gamma\) を未知数とする連立1次方程式なので、\(\al,\:\beta,\:\gamma\) を \(S\) と \(T\) の式で表せます。連立方程式を解くと、
\(\al=\dfrac{1}{3}(S+T)\)
です。さらに、\(S\) と \(T\) には特別の関係があります。
\(ST=(\al+\omega^2\beta+\omega\gamma)(\al+\omega\beta+\omega^2\gamma)\)
という式を考えると、
\(\begin{eqnarray}
&&\:\:ST&=&\al^2+\beta^2+\gamma^2+\\
&&&&(\omega^2+\omega)\al\beta+(\omega^4+\omega^2)\beta\gamma+(\omega^2+\omega)\gamma\al\\
&&&=&(\al+\beta+\gamma)^2-2(\al\beta+\beta\gamma+\gamma\al)+\\
&&&&(-\al\beta-\beta\gamma-\gamma\al)\\
&&&=&-3(\al\beta+\beta\gamma+\gamma\al)\\
&&&=&-3p\\
\end{eqnarray}\)
となり、つまり、
という関係です。上の式の変形では、根と係数の関係と \(\omega^2+\omega+1=0\)、および \(\omega^3=1\) を使いました。
次に、\(S^3\) を求めるために \(S^3+T^3\) を計算してみると、
\(\begin{eqnarray}
&&\:\:S^3+T^3&=(S+T)(S^2-ST+T^2)\\
&&&=(S+T)(S+\omega T)(S+\omega^2T)\\
\end{eqnarray}\)
です。ここで \((\br{C})\) 式を変形すると、
が得られるので、
\(\begin{eqnarray}
&&\:\:S^3+T^3&=3\al\cdot3\omega^2\beta\cdot3\omega\gamma\\
&&&=27\al\beta\gamma=-27q\\
\end{eqnarray}\)
となります。まとめると、
\(S^3+T^3=-27q\)
\(ST=-3p\)
であり、
\(S^3-\dfrac{27p^3}{S^3}+27q=0\)
です。つまり、
という \(S^3\) についての2次方程式を解くことで \(S^3\) が求まり、そこから \(S\) が求まります。\(S\) の値の可能性は6通りです。また \(T^3\) についても、
が成り立ちます。2次方程式、
の2つの解が \(S^3\) と \(T^3\) です。
ここまでの計算は \(x^3+px+q=0\) の形の既約方程式なら成り立ちます。ここで \(x^3-3x+1=0\) に即した、\(p=-3,\:q=1\) を \((\br{E})\) 式に入れると、
\((S^3)^2+27S^3+27^2=0\)
\(\begin{eqnarray}
&&\:\:S^3&=\dfrac{1}{2}\left(-27\pm\sqrt{27^2-4\cdot27^2}\right)\\
&&&=27\dfrac{-1\pm i\sqrt{3}}{2}\\
&&&=27\omega\\
\end{eqnarray}\)
となります。最後の式の \(\omega\) は、2つある \(1\) の原始3乗根のどちらか、という意味にとらえます。\(S^3=27\omega\) なら \(T^3=27\omega^2\) で、その逆でもよいわけです。
\((\br{C})\) 式と \((\br{D})\) 式により、\(\al\) は \(S\) と \(\omega\) の四則演算で表現できます。つまり、
\(\bs{Q}(\omega,\al)\subset\bs{Q}(\omega,\:S)\)
です。従って、さきほどの \(\bs{Q}(\omega,\:S)\subset\bs{Q}(\omega,\:\al)\) と合わせると、
\(\bs{Q}(\omega,\:S)=\bs{Q}(\omega,\:\al)\)
です。以上をまとめると、レゾルベント \(S\) について、
\(\begin{eqnarray}
&&\:\:S^3&\in\bs{Q}(\omega)\\
&&\:\:S&\in\bs{Q}(\omega,\:S)=\bs{Q}(\omega,\:\al)\\
\end{eqnarray}\)
です。つまり、
\(\bs{Q}(\omega)\) 上の方程式、
\(x^3-a=0\:\:(\:a=27\omega\in\bs{Q}(\omega)\:)\)
の解の一つ、\(\sqrt[3]{a}\) を \(\bs{Q}(\omega)\) に添加したのが \(\bs{Q}(\omega,\:\al)\)
であり、\(\bs{\bs{Q}(\omega,\:\al)}\) は \(\bs{\bs{Q}(\omega)}\) のべき根拡大体であることがわかりました。\(\bs{Q}(\omega,\:\al)\) は \(x^3-a=0\) の解、\(\sqrt[3]{a},\:\sqrt[3]{a}\:\omega,\:\sqrt[3]{a}\:\omega^2\) の全部を含むので、\(\bs{Q}(\omega)\) のガロア拡大体です。結論として、
ことになります。\(x^3-3x+1=0\) の場合、\(a=27\omega\) です。
巡回拡大がべき根拡大になることの証明のフォローはここまでですが、\(x^3-3x+1=0\) の解を具体的に求めることもできます。\(S^3=27\omega\) から、\(S=3\cdot\sqrt[3]{\omega}\) であり、また \(ST=9\) なので、
\(\begin{eqnarray}
&&\:\:\al&=\dfrac{1}{3}(S+T)=\dfrac{1}{3}\left(S+\dfrac{9}{S}\right)\\
&&&=\sqrt[3]{\omega}+\dfrac{1}{\sqrt[3]{\omega}}=\sqrt[3]{\omega}+\sqrt[3]{\omega^2}\\
&&&=\sqrt[3]{-\dfrac{1}{2}+\dfrac{\sqrt{3}}{2}i}+\sqrt[3]{-\dfrac{1}{2}-\dfrac{\sqrt{3}}{2}i}\\
\end{eqnarray}\)
が解の一つです。「1.3 ガロア群」の「ガロア群の例」に書いたように、
\(\al=1.53208888623796\:\cd\)
であり、正真正銘の正の実数ですが、\(\bs{\al}\) をべき根で表わそうとすると虚数単位が登場します。その理由がガロア理論から分かるのでした。
\(S_3\::\:x^3+px+q\)
方程式 \(x^3+px+q=0\) の係数を変数のままで扱い、ガロア群が \(S_3\) の方程式の一般論として話を進めます。3つの根を \(\al,\:\beta,\:\gamma\) とし(置換での表示では、それぞれ \(1,\:2,\:3\))、差積 \(\theta\) を、
\(\begin{eqnarray}
&&\:\:\theta&=(\al-\beta)(\beta-\gamma)(\gamma-\al)\\
&&&=\sqrt{D}\\
&&\:\:D&=-4p^3-27q^2\\
\end{eqnarray}\)
と定義すると、\(\bs{\theta}\) が有理数でないとき、
となります(前述)。\(G\cong S_3\) は巡回群ではありません。しかし可解群なので "巡回群の入れ子構造" になっていて(=可解列が存在する)、「巡回拡大はべき根拡大」の定理(73A)を2段階に使うことで、方程式の解が四則演算とべき根で表現できることを証明できます。
まず、上記の可解列とガロア対応(53B)になっている「体の拡大列」は何かです。具体的には \(H\) の固定体は何かですが、それは \(\bs{Q}(\theta)\) です。実際、
\(\sg(\theta)=\theta,\:\:\sg^2(\theta)=\theta\)
なので、\(H\) のすべての元は \(\bs{Q}(\theta)\) の元を固定します。また、
\(\tau(\theta)=-\theta\)
なので、\(\tau\)(および \(\sg\tau,\:\sg^2\tau\))は \(\bs{Q}(\theta)\) の元 を固定しません。従って、\(H\) の固定体は \(\bs{Q}(\theta)\) です。つまり、\(\bs{L}=\bs{Q}(\al,\beta,\gamma)\) と書くと、
というガロア対応になっています。
次に体の拡大次元を検証します。まず、\(|G|=6\) なので、次数と位数の同一性(52B)により、\(\bs{L}/\bs{Q}\) の拡大次数は、
\([\:\bs{L}:\bs{Q}\:]=6\)
です。\(\bs{Q}(\theta)\) は \(\bs{Q}\) 上の既約な2次方程式、
\(x^2-D=0\)
の解である \(\theta\) で \(\bs{Q}\) を単拡大した体なので、単拡大体の基底の定理(33F)により、
\([\:\bs{Q}(\theta):\bs{Q}\:]=2\)
です。そうすると、拡大次数の連鎖律(33H)により、
\([\:\bs{L}:\bs{Q}\:]=[\:\bs{L}:\bs{Q}(\theta)\:]\cdot[\:\bs{Q}(\theta):\bs{Q}\:]\)
\([\:\bs{L}:\bs{Q}(\theta)\:]=3\)
となるはずです。\([\:\bs{L}:\bs{Q}(\theta)\:]=3\) であることを、具体的な体の拡大の様子を検証することで確かめます。2つのことを証明します。
\(\bs{L}=\bs{Q}(\al,\beta,\gamma)\) とするとき、\(\bs{Q}(\theta,\al)=\bs{L}\) である。
[証明]
\(\theta=(\al-\beta)(\beta-\gamma)(\gamma-\al)\) だから、\(\theta\) は \(\al,\:\beta,\:\gamma\) で表現されている。従って
\(\bs{Q}(\theta,\al)\:\subset\:\bs{Q}(\al,\beta,\gamma)\)
である。この逆である、
\(\bs{Q}(\al,\beta,\gamma)\:\subset\:\bs{Q}(\theta,\al)\)
であることを証明する。そのためには \(\beta,\:\gamma\) が「有理数と \(\theta,\:\al\) の四則演算」で表現できることを示せばよい。根と係数の関係により、
である。これを利用して \(\theta\) の定義式を変形すると、
\(\begin{eqnarray}
&&\:\:\theta=&(\al-\beta)(\beta-\gamma)(\gamma-\al)\\
&&&=(\beta-\gamma)(-\al^2+(\beta+\gamma)\al-\beta\gamma)\\
&&&=(\beta-\gamma)\left(-\al^2-\al^2+\dfrac{q}{\al}\right)\\
&&&=(\beta-\gamma)\dfrac{-2\al^3+q}{\al}\\
\end{eqnarray}\)
となり、
\(\bs{Q}(\al,\beta,\gamma)\:\subset\:\bs{Q}(\theta,\al)\)
であり、\(\bs{Q}(\theta,\al)\:\subset\:\bs{Q}(\al,\beta,\gamma)\) と合わせて、
\(\bs{Q}(\theta,\al)=\bs{Q}(\al,\beta,\gamma)\)
である。[証明終]
\(x^3+px+q\) は \(\bs{\bs{Q}(\theta)}\) 上の既約多項式である。
[証明]
\(\bs{Q}\) 上の既約な3次方程式 \(x^3+px+q=0\) の解 \(\al\) による \(\bs{Q}\) の単拡大体 \(\bs{Q}(\al)\) を考えると、単拡大体の基底の定理(33F)により、
\([\:\bs{Q}(\al):\bs{Q}\:]=3\)
である。従って \(\al\notin\bs{Q}(\theta)\) である。なぜなら、もし \(\al\in\bs{Q}(\theta)\) なら \(\bs{Q}(\theta)\) の次元は \(3\) 以上になるが、\([\:\bs{Q}(\theta):\bs{Q}\:]=2\) なので矛盾が生じるからである。同様に、\(\beta,\:\gamma\notin\bs{Q}(\theta)\) である。\(x^3+px+q\) は、
\(x^3+px+q=(x-\al)(x-\beta)(x-\gamma)\)
と表されるから、\(x^3+px+q\) は \(\bs{Q}(\theta)\) 上では因数分解できない。つまり \(x^3+px+q\) は \(\bs{Q}(\theta)\) 上の既約多項式である。[証明終]
以上により、
ことが検証できました。これを踏まえて、3次方程式が解ける理由をガロア理論で説明します。ガロア対応である、
を2つの部分に分けます。
\(\bs{Q}\:\subset\:\bs{Q}(\theta)\)
\(\mr{Gal}(\bs{Q}(\theta)/\bs{Q})\cong G/H\cong C_2\) であり、\(\bs{Q}(\theta)/\bs{Q}\) は巡回拡大で、拡大次数は \(2\) です。\(1\) の原始2乗根は \(-1\) であり、\(\bs{Q}\) に含まれています。従って \(\bs{Q}(\theta)/\bs{Q}\) はべき根拡大です。具体的には、
\(x^2-D=0\:\:(D\in\bs{Q})\)
\(D=-4p^3-27q^2\)
の解が \(\theta\) であり、
\(\theta=\sqrt{D}=\sqrt{-4p^3-27q^2}\)
です。これはレゾルベントを持ち出すまでもなく分かります。
\(\bs{Q}(\theta)\:\subset\:\bs{L}\)
\(\mr{Gal}(\bs{L}/\bs{Q}(\theta))=H\cong C_3\) であり、\(\bs{L}/\bs{Q}(\theta)\) は巡回拡大で、拡大次数は \(3\) です。また \(\bs{L}\) は \(\bs{Q}(\theta)\) 上の既約な3次方程式 \(x^3+px+q=0\) の解の一つである \(\al\) を \(\bs{Q}(\theta)\) に添加した単拡大体で、\(\bs{L}=\bs{Q}(\theta,\al)\) でした。
\(\bs{Q}(\theta)\) には(一般には)\(1\) の原始3乗根が含まれていません。そこで、\(\bs{L}/\bs{Q}(\theta)\) の体の拡大の代わりに、\(\bs{L}(\omega)/\bs{Q}(\omega,\theta)\) という拡大を考えます。
\(\bs{L}(\omega)=\bs{Q}(\omega,\theta,\al)\)
レゾルベント \(S,\:T\) を導入して \(S^3\) と \(T^3\) を求めます。計算は、方程式 \(x^3-3x+1=0\) のときと全く同じです。つまり、
\(\al=\dfrac{1}{3}(S+T)\)
です。方程式 \(x^3-3x+1=0\) の場合、\(\bs{L}(\omega)\) は \(\bs{Q}(\omega)\) からの巡回拡大でしたが、\(x^3-3p+1q=0\) では \(\bs{Q}(\omega,\theta)\) からの巡回拡大であり、ガロア群が位数 \(3\) の巡回群であるという点では全く同じなのです。
\((\br{F})\) 式から \(X\) を求めると、
\(\begin{eqnarray}
&&\:\:X&=\dfrac{1}{2}\left(-27q\pm\sqrt{27^2q^2+27\cdot4p^3}\right)\\
&&&=\dfrac{1}{2}\left(-27q\pm\sqrt{-27\theta^2}\right)\\
&&&=\dfrac{1}{2}(-27q\pm3\sqrt{3}i\cdot\theta)\\
\end{eqnarray}\)
となるので、
\(S^3=\dfrac{1}{2}(-27q+3\sqrt{3}i\cdot\theta)\)
\(T^3=\dfrac{1}{2}(-27q-3\sqrt{3}i\cdot\theta)\)
となります。\(S^3\) と \(T^3\) は逆でもかまいません。\(\omega\) は \(1\) の原始3乗根で、
\(\omega=\dfrac{1}{2}(-1\pm\sqrt{3}i)\)
のどちらかです。従って、
\(\sqrt{3}i\in\bs{Q}(\omega,\theta)\)
です。つまり、
\(S^3,\:\:T^3\in\bs{Q}(\omega,\theta)\)
であることがわかりました。従って、\(S,\:T\) は \(\bs{Q}(\omega,\theta)\) 上の3次方程式、\(x^3-a=0\:\:(a\in\bs{Q}(\omega,\theta))\) の解ということになり、\(\bs{Q}(\omega,\theta,\:S)/\bs{Q}(\omega,\theta)\) の体の拡大を考えると、
\(\bs{Q}(\omega,\theta,\:S)=\bs{Q}(\omega,\theta,\:\al)\)
であることが次のようにして分かります。つまり、\(\bs{Q}(\omega,\theta)\) 上の既約な3次方程式 \(x^3+px+q=0\) の解が \(\al,\:\beta,\:\gamma\) であり、\((\br{B})\) 式により \(S\) は \(\al,\:\beta,\:\gamma,\:\omega\) の四則演算で表されているので、
\(S\in\bs{Q}(\omega,\theta,\al,\beta,\gamma)\)
であり、また、
\(\bs{Q}(\omega,\theta,\al,\beta,\gamma)=\bs{Q}(\omega,\theta,\al)\)
だったので、
\(S\in\bs{Q}(\omega,\theta,\al)\)
です。このことから、
\(\bs{Q}(\omega,\theta,\:S)=\bs{Q}(\omega,\theta,\:\al)\)
です。
この説明は「7.3 べき根拡大の十分条件」の証明に従いましたが、3次方程式の場合は、\((\br{C})\) 式と \((\br{D})\) 式により、\(\al,\:\beta,\:\gamma\) が \(S\) と \(\omega\) の四則演算で表現できます。従って、
\(\bs{Q}(\omega,\theta,\al,\beta,\gamma)\subset\bs{Q}(\omega,\theta,S)\)
\(\bs{Q}(\omega,\theta,\al)\subset\bs{Q}(\omega,\theta,S)\)
であり、
\(\bs{Q}(\omega,\theta,S)\subset\bs{Q}(\omega,\theta,\al)\)
と合わせて
\(\bs{Q}(\omega,\theta,\:S)=\bs{Q}(\omega,\theta,\:\al)\)
である、とするのが簡便な説明になります。
以上をまとめると、
\(\bs{Q}(\omega,\theta)\) 上の3次方程式、\(x^3-a=0\:\:(a\in\bs{Q}(\omega,\theta))\) の解の一つ、\(S\) を \(\bs{Q}(\omega,\theta)\) に添加したべき根拡大体が \(\bs{Q}(\omega,\theta,\al)=\bs{L}(\omega)\) である
となり、体に \(\bs{\omega}\) が含まれる前提で、巡回拡大はべき根拡大であることが検証できました。ここから、\(\bs{L}(\omega)\) を \(\bs{Q}\) の拡大体として、方程式の係数 \(p,\:q\) を使って、できるだけ簡潔な形で表してみます。
\(\begin{eqnarray}
&&\:\:\theta&=\sqrt{-4p^3-27q^2}\\
&&&=6\cdot\sqrt{3}i\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}\\
\end{eqnarray}\)
ですが、\(\sqrt{3}i\in\bs{Q}(\omega)\) なので、
\(\bs{Q}(\omega,\theta)=\bs{Q}\left(\omega,\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}\right)\)
と表せます。また、
\(\begin{eqnarray}
&&\:\:X^3&=\dfrac{1}{2}\left(-27q+\sqrt{27^2q^2+27\cdot4p^3}\right)\\
&&&=\dfrac{1}{2}\left(-27q+27\cdot2\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}\right)\\
&&&=27\left(-\dfrac{q}{2}+\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}\right)\\
\end{eqnarray}\)
なので、
\(S=3\cdot\sqrt[3]{-\dfrac{q}{2}+\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\)
\(T=3\cdot\sqrt[3]{-\dfrac{q}{2}-\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\)
が \(S,\:T\) です。\(\sqrt[3]{\phantom{I}\cd\phantom{I}}\) は3乗して \(\cd\) になる数の意味です。従って、\(S\) の選び方は3通りですが、\(S\) を一つに決めると、
\(ST=-3p\)
が成り立つように \(T\) を選ぶ必要があります。以上の \(S\) を用いて \(\bs{L}(\omega)\) を表すと、
\(\bs{L}(\omega)\)
\(=\bs{Q}(\omega,\theta,\al,\beta,\gamma)=\bs{Q}(\omega,\theta,\al)=\bs{Q}(\omega,\theta,S)\)
\(=\bs{Q}\left(\omega,\:\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}},\:\sqrt[3]{-\dfrac{q}{2}+\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\right)\)
となります。この式が意味するところは、
ということです。べき根拡大の出発点は 有理数に \(\omega\) を添加した体です。「7.1 1の原始n乗根」で証明したように、原始\(n\)乗根はべき根で表現可能であり(71A)、もちろん \(\omega\) もそうです。これが3次方程式が解ける原理(一般化するとガロア群が可解群である方程式が解ける原理)です。補足すると、\(p=0\) のときは、
\(\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}=\pm\dfrac{q}{2}\in\bs{Q}\)
なので、べき根拡大は \(\sqrt[3]{\phantom{A}}\) の1回だけになります。
さらに、ここまでの計算で3次方程式の解も求まりました。解は、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&\al=\dfrac{1}{3}(S+T)&\\
&&\beta=\dfrac{1}{3}(\omega S+\omega^2T)&\\
&&\gamma=\dfrac{1}{3}(\omega^2S+\omega T)&\\
\end{eqnarray}
\end{array}\right.\)
であり、記号を、
\(S=3s\)
\(T=3t\)
に置き換えると、
3次方程式の解の公式
\(x^3+px+q=0\) の3つの解を \(\al,\:\beta,\:\gamma\) とする。
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&\al=s+t&\\
&&\beta=\omega s+\omega^2t&\\
&&\gamma=\omega^2s+\omega t&\\
\end{eqnarray}
\end{array}\right.\)
\(s=\sqrt[3]{-\dfrac{q}{2}+\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\)
\(t=\sqrt[3]{-\dfrac{q}{2}-\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\)
\(st=-\dfrac{p}{3}\)
が、3次方程式の解の公式です。
3次方程式の解による体の拡大を振り返ってみます。\(\bs{Q}\) 上の既約な方程式 \(x^3+px+q=0\) の根を \(\al,\:\beta,\:\gamma\) とし、\(\bs{Q}\) の最小分解体 を \(\bs{L}=\bs{Q}(\al,\beta,\gamma)\)、ガロア群を \(G=\mr{Gal}(\bs{L}/\bs{Q})\) とすると、
のガロア対応が成り立ちます。\(\bs{L}/\bs{Q}\) の拡大次数は \(6\)(\(|G|=6\))です。この、
\(\bs{Q}\:\subset\:\bs{Q}(\theta)\:\subset\:\bs{L}\)
という体の拡大列で、\(\bs{Q}\:\subset\:\bs{Q}(\theta)\) のところはべき根拡大ですが、\(\bs{Q}(\theta)\:\subset\:\bs{L}\) は、\(\omega\in\bs{Q}(\theta)\) の場合を除き、べき根拡大ではありません。しかし、
\(\bs{Q}(\omega)\:\subset\:\bs{Q}(\omega,\theta)\:\subset\:\bs{L}(\omega)\)
なら、必ず、すべてがべき根拡大になります。従って、3次方程式の解は \(\bs{Q}(\omega)\) の元である「有理数と \(\omega\)」の四則演算・べき根で記述できます。
\(\omega\) は \(x^2+x+1=0\) の解なので、\([\:\bs{Q}(\omega):\bs{Q}\:]=2\) です。従って、拡大次数の連鎖律(33H)により、\(\omega\notin\bs{Q}(\theta)\) の条件で、
\([\:\bs{L}(\omega):\bs{Q}\:]=12\)
です。これは、\(\bs{Q}\) 上の多項式 \((x^3+px+q)(x^2+x+1)\) の最小分解体が \(\bs{L}(\omega)\) なので、\(\bs{Q}\) からの拡大次数は \(12\) であるとも言えます。3次方程式の「解」は、あくまで \(\bs{Q}\) の \(6\)次拡大体 \(\bs{L}=\bs{Q}(\al,\beta,\gamma)\) の中にありますが、「べき根で表された解」は \(\bs{Q}\) の \(12\)次拡大体 \(\bs{L}(\omega)\) の中にあるのです。
一見、矛盾しているようですが、そうではありません。ある代数拡大体 \(\bs{K}\) があったとして、\(a\) を \(\bs{K}\) の元とし、\(1\) の原始3乗根の一つを \(\omega\) とします。3次方程式、
\(x^3-a=0\:\:(a\in\bs{K})\)
は3つの解をもちます。そのうちのどれか一つを \(\sqrt[3]{a}\) と定義すると、3つの解(べき根)は、
\(\sqrt[3]{a},\:\:\sqrt[3]{a}\:\omega,\:\:\sqrt[3]{a}\:\omega^2\)
です。\(\sqrt[3]{a}\) では \(\omega\) が不要なように見えますが、それは表面上のことで、3つの解は、
\(\sqrt[3]{a}\:\omega,\:\:\sqrt[3]{a}\:\omega^2,\:\:\sqrt[3]{a}\:\omega^3\)
であるというのが正しい認識です。つまり \(\bs{\omega}\) は3つのべき根の関係性を規定していて、\(\sqrt[3]{a}\cdot\omega^i\:\:(i=1,2,3)\) という "ペアの形" によって3つの区別が可能になり、数式としての整合性が保てます。\(\sqrt[3]{\phantom{A}}\) という "曖昧さ" がある記号を用いる限り、\(\omega\) という、曖昧さを解消する "助手" が必然的に登場するのです。
7.可解性の十分条件 |
第6章では、方程式が可解であれば(=解が四則演算とべき根で表現できれば)ガロア群が可解群であることをみました。第7章ではその逆、つまり、ガロア群が可解群であれば方程式が可解であることを証明します。
7.1 1の原始\(n\)乗根
可解性の十分条件を証明するために、まず、\(1\) の原始\(n\)乗根がべき根で表せることを証明します。このことを前提にした証明を最後で行うからです。念のために「1.1 方程式とその可解性」でのべき根の定義を振り返ると、
\(\sqrt[n]{\:a\:}\) (\(n=2\) の場合は \(\sqrt{\:a\:}\))
という表記は、
\(a\) が正の実数のとき、\(n\)乗して \(a\) になる正の実数を表わす | |
\(a\) が負の実数や複素数の場合は、\(n\)乗して \(a\) になる数のどれかを表わす |
のでした。\(\sqrt{2}\) は \(1.4142\cd\) と \(-1.4142\cd\) のどちらかを表わすのではなく、\(1.4142\cd\) のことです。\(\sqrt[3]{2}\) は \(3\)乗して \(2\) になる3つの数のうちの正の実数(\(\fallingdotseq1.26\))を表わします。一方、\(\sqrt{-1\:}\) は\(2\)乗して \(-1\) になる2つの数のうちのどちらかで、その一方を \(i\) と書くと、もう一方が \(-i\) です。
この定義から、方程式 \(x^n-1=0\) の解を \(\sqrt[n]{\:1\:}\) と書くと、それは \(1\) のことです。従って、
\(1\) 以外の「\(n\)乗して \(1\) になる数」がべき根で表現できる
ことを証明しておく必要があります。その証明はガロア理論とは無関係にできます。それが以下です。
(原始n乗根はべき根で表現可能:71A) |
\(1\) の 原始\(n\)乗根はべき根で表現できる。
[証明]
\(n\) についての数学的帰納法で証明する。\(n=2,\:3\) のときにべき根で表現できるのは根の公式で明らかである。また、原始4乗根は \(\pm i\) なので、\(n\leq4\) のとき題意は成り立つ。そこで、\(n\) 未満のときにべき根で表現できると仮定し、\(n\) のときにもべき根で表現できることを証明する。
\(n\) が合成数のときと素数のときに分ける。まず \(n\) が合成数なら、
\(n=s\cdot t\)
と表現できる。
\(1\) の原始\(s\)乗根を \(\zeta\)
\(1\) の原始\(t\)乗根を \(\eta\)
とし、\(X=x^{s}\) とおく。方程式 \(X^{t}-1=0\) の \(t\)個の解は \(\eta^k\:\:(0\leq k\leq t-1)\) と表わされる(63B)から、\(x^n-1\) は、
\(\begin{eqnarray}
&&\:\:x^n-1&=x^{st}-1=X^{t}-1\\
&&&=\displaystyle\prod_{k=0}^{t-1}(X-\eta^k)\\
&&&=\displaystyle\prod_{k=0}^{t-1}(x^{s}-\eta^k)\\
\end{eqnarray}\)
と因数分解できる。従って、方程式 \(x^n-1=0\) の解は、
\(x^{s}=\eta^k\:\:\:(0\leq k\leq t-1)\)
の解である。これを解くと、
\(x=\sqrt[s]{\eta^k}\cdot\zeta^j\:\:\:(0\leq j\leq s-1,\:\:0\leq k\leq t-1)\)
である(\(k=0\) のときは根号の規則に従って \(\sqrt[s]{1}=1\))。帰納法の仮定により、\(\zeta,\:\eta\) はべき根で表現できるから、上式により \(1\) の \(n\) 乗根はべき根で表現できる。従って原始\(n\)乗根もべき根で表現できる。
以降は \(n\) が素数の場合を証明する。\(n\) を \(p\)(= 素数)と表記する。以下では数式を見やすくするため \(p=5\) の場合を例示するが、証明の過程は一般性を失わない論理で進める。
位数 \(p-1\) の2つの巡回群、\((\bs{Z}/p\bs{Z})^{*}\) と \(\bs{Z}/(p-1)\bs{Z}\) の性質を利用する。\(p=5\) の場合は、位数 \(4\) の既約剰余類群 \((\bs{Z}/5\bs{Z})^{*}\) と、剰余群 \(\bs{Z}/4\bs{Z}\) である。
\(p\) が素数のとき、既約剰余類群 \((\bs{Z}/p\bs{Z})^{*}\) は生成元をもつ(25D)。\((\bs{Z}/5\bs{Z})^{*}\) の生成元の一つは \(2\) である(もう一つは \(3\))。生成元を \(2\) とすると、
\(\begin{eqnarray}
&&\:\:(\bs{Z}/5\bs{Z})^{*}&=\{2,\:2^2,\:2^3,\:2^4\}\\
&&&=\{2,\:4,\:3,\:1\}\\
\end{eqnarray}\)
の巡回群となる。演算は乗算である。一方、\(\bs{Z}/4\bs{Z}\) は、演算が加算、生成元が \(1\)(または \(3\))の巡回群で、
\(\begin{eqnarray}
&&\:\:\bs{Z}/4\bs{Z}&=\{1,\:1+1,\:1+1+1,\:1+1+1+1\}\\
&&&=\{1,\:2,\:3,\:0\}\\
\end{eqnarray}\)
である。ここで、2つの変数 \(x,\:y\) をもつ関数を、
\(f(x,y)=y^2x+y^4x^2+y^3x^3+y\) |
とおく。この関数は、4つある項の \(x,\:y\) の指数について、
\(y\) の指数は \([\:2,\:4,\:3,\:1\:]\) : \((\bs{Z}/5\bs{Z})^{*}\) の巡回パターン
\(x\) の指数は \([\:1,\:2,\:3,\:0\:]\) : \(\bs{Z}/4\bs{Z}\) の巡回パターン
となるようにしてある。
次に、2つの数 \(a,\:b\) を、
\(\begin{eqnarray}
&&\:\:a^5&=1\:(a\neq1)\\
&&\:\:b^4&=1\\
\end{eqnarray}\)
であるような数とする。\(a\) は \(1\) の原始5乗根でもよいし、その任意の累乗でもよい。とにかく \(a^5=1\:(a\neq1)\) を満たす数である。このとき、
\(a^5-1=0\)
\((a-1)(a^4+a^3+a^2+a+1)=0\)
なので、
\(a^4+a^3+a^2+a+1=0\) ないしは
\(a^4+a^3+a^2+a=-1\)
が成り立つ。\(b\) も \(1\) の原始4乗根か、その任意の累乗であるが、\(b=1\) であってもよい。
そうすると \(f(b,a)\) は、
\(f(b,a)=a^2b+a^4b^2+a^3b^3+a\)
\(a\) の指数は \([\:2,\:4,\:3,\:1\:]\)
\(b\) の指数は \([\:1,\:2,\:3,\:0\:]\)
である。
次に \(f(b,a^2)\) を計算すると、
\(\begin{eqnarray}
&&\:\:f(b,a^2)&=a^4b+a^8b^2+a^6b^3+a^2\\
&&&=a^4+a^3b+a^1b^2+a^2b^3\\
\end{eqnarray}\)
\(a\) の指数は \([\:4,\:3,\:1,\:2\:]\)
\(b\) の指数は \([\:1,\:2,\:3,\:0\:]\)
となる。
\(f(b,a^2)\) を \(f(b,a)\) と比べると、\(a\) の指数が \(1\) ステップだけ巡回している。ということは、\(b\) の指数も \([\:2,\:3,\:0,\:1\:]\) と \(1\) ステップだけ巡回させれば、\(a\) の指数と \(b\) の指数が同期することになり、\(f(b,a^2)\) の式は \(f(b,a)\) と同じものになる。同期させるには \(f(b,a^2)\) に \(b\) を掛ければよい。従って、
\(bf(b,a^2)=f(b,a)\)
である。
全く同様にして、
\(\begin{eqnarray}
&&\:\:b^2f(b,a^4)&=f(b,a)\\
&&\:\:b^3f(b,a^8)&=b^3f(b,a^3)\\
&&&=f(b,a)\\
\end{eqnarray}\)
となる。まとめると、
\(\begin{eqnarray}
&&\:\:bf(b,a^2)&=f(b,a)\\
&&\:\:b^2f(b,a^4)&=f(b,a)\\
&&\:\:b^3f(b,a^3)&=f(b,a)\\
\end{eqnarray}\)
である。\(b^4=1\) だから、各両辺を \(4\)乗すると、
\(f(b,a^2)^4=f(b,a)^4\)
\(f(b,a^4)^4=f(b,a)^4\)
\(f(b,a^3)^4=f(b,a)^4\)
の式を得る。
本題から少々はずれるが、この仕組みは、\(a\) の指数が「\(2\) の乗算の巡回群」であるため、
\(a^k\:\rightarrow\:a^{2k}=(a^k)^2\)
と巡回し、\(b\) の指数は「\(1\) の足し算の巡回群」であるため、
\(b^k\:\rightarrow\:b^{k+1}=b\cdot b^k\)
と巡回することを利用したものである。
なお、\((\bs{Z}/5\bs{Z})^{*}\) の生成元として \(2\) を選んだが、一般の \((\bs{Z}/p\bs{Z})^{*}\) では \(2\) が生成元とは限らない(25D)。その場合は任意の生成元を選んでよい。例えば \((\bs{Z}/5\bs{Z})^{*}\) の生成元として \(3\) を選ぶと
\([\:3,\:3^2,\:3^3,\:3^4\:]=[\:3,\:4,\:2,\:1\:]\)
と巡回する。従って \(f(x,y)\) を、
\(f(x,y)=y^3x+y^4x^2+y^2x^3+y\)
と定義すると、\(y,\:a\) の指数は「\(3\) の乗算の巡回群」だから、
\(a^k\:\rightarrow\:a^{3k}=(a^k)^3\)
と巡回する(\(x,\:b\) については同じ)。つまり、
\(\begin{eqnarray} &&\:\:bf(b,a^3)&=f(b,a)\\ &&\:\:b^2f(b,a^4)&=f(b,a)\\ &&\:\:b^3f(b,a^2)&=f(b,a)\\ \end{eqnarray}\)
となり、
\(f(b,a^3)=f(b,a)^4\)
\(f(b,a^4)=f(b,a)^4\)
\(f(b,a^2)=f(b,a)^4\)
となり、同じ結果を得る。
\(a^k\:\rightarrow\:a^{2k}=(a^k)^2\)
と巡回し、\(b\) の指数は「\(1\) の足し算の巡回群」であるため、
\(b^k\:\rightarrow\:b^{k+1}=b\cdot b^k\)
と巡回することを利用したものである。
なお、\((\bs{Z}/5\bs{Z})^{*}\) の生成元として \(2\) を選んだが、一般の \((\bs{Z}/p\bs{Z})^{*}\) では \(2\) が生成元とは限らない(25D)。その場合は任意の生成元を選んでよい。例えば \((\bs{Z}/5\bs{Z})^{*}\) の生成元として \(3\) を選ぶと
\([\:3,\:3^2,\:3^3,\:3^4\:]=[\:3,\:4,\:2,\:1\:]\)
と巡回する。従って \(f(x,y)\) を、
\(f(x,y)=y^3x+y^4x^2+y^2x^3+y\)
と定義すると、\(y,\:a\) の指数は「\(3\) の乗算の巡回群」だから、
\(a^k\:\rightarrow\:a^{3k}=(a^k)^3\)
と巡回する(\(x,\:b\) については同じ)。つまり、
\(\begin{eqnarray} &&\:\:bf(b,a^3)&=f(b,a)\\ &&\:\:b^2f(b,a^4)&=f(b,a)\\ &&\:\:b^3f(b,a^2)&=f(b,a)\\ \end{eqnarray}\)
となり、
\(f(b,a^3)=f(b,a)^4\)
\(f(b,a^4)=f(b,a)^4\)
\(f(b,a^2)=f(b,a)^4\)
となり、同じ結果を得る。
本題に戻って、次に \(f(b,a)^4\) を展開する。
\(f(b,a)^4=(a^2b+a^4b^2+a^3b^3+a)^4\)
\((\br{A})\)
であるが、このまま展開したのでは \(p=5\) のときに固有のものになり、一般性を失う。そこで、上式を展開して整理した形を、
\(f(b,a)^4=h_1(b)a^2+h_2(b)a^4+h_3(b)a^3+h_0(b)a\)
\((\br{B})\)
とする。\(a^2,\:a^4,\:a^3,\:a\) の係数となっている \(h_i(b)\:(i=1,2,3,0)\) は \(b\) の多項式である。この展開形の決め方は次のように行う。
\((\br{A})\) 式の次数は最大 \(a^{16}\) であるが、\(a^5=1\) の関係を利用して最大次数が \(a^4\) になるように「次数下げ」を行う。 | |
そうすると、\(a\) を含まない \(b\) だけの項が出てくる。そこで、 \(1=-(a^4+a^3+a^2+a)\) の関係を利用し、\(b\) だけの項に \(-(a^4+a^3+a^2+a)\) を掛けて「次数上げ」を行う。 | |
以上の結果を、\(a^2,\:a^4,\:a^3,\:a\) ごとに整理したものを \((\br{B})\) とする。 |
\((\br{B})\) 式においては、
\(a\) の指数 | \(:\:[\:2,\:4,\:3,\:1\:]\) | |
\(h_i(b)\) の添字 | \(:\:[\:1,\:2,\:3,\:0\:]\) |
次に \(f(b,a^2)^4\) を計算する。これは \((\br{B})\) 式において \(a\) を \(a^2\) に置き換えればよいから、
\(\begin{eqnarray}
&&\:\:f(b,a^2)^4&=h_1(b)a^4+h_2(b)a^8+h_3(b)a^6+h_0(b)a^2\\
&&&=h_1(b)a^4+h_2(b)a^3+h_3(b)a+h_0(b)a^2\\
\end{eqnarray}\)
\(a\) の指数 | \(:\:[\:4,\:3,\:1,\:2\:]\) | |
\(h_i(b)\) の添字 | \(:\:[\:1,\:2,\:3,\:0\:]\) |
\(a\) の指数 | \(:\:[\:2,\:4,\:3,\:1\:]\) | |
\(h_i(b)\) の添字 | \(:\:[\:0,\:1,\:2,\:3\:]\) |
\(f(b,a^2)^4=h_0(b)a^2+h_1(b)a^4+h_2(b)a^3+h_3(b)a\)
である。同様に、
\(f(b,a^4)^4=h_3(b)a^2+h_0(b)a^4+h_1(b)a^3+h_2(b)a\)
\(h_i(b)\) の添字 \(:\:[\:3,\:0,\:1,\:2\:]\)
\(f(b,a^3)^4=h_2(b)a^2+h_3(b)a^4+h_0(b)a^3+h_1(b)a\)
\(h_i(b)\) の添字 \(:\:[\:2,\:3,\:0,\:1\:]\)
である。
従って、\(f(b,a^i)^4\:\:(i=1,2,4,3)\) において、\(a^j\:(j=2,4,3,1)\) の係数は \(h_k(b)\:(k=1,2,3,0)\) の全てを巡回する。つまり、\(f(b,a^i)^4\:\:(i=1,2,4,3)\) の全部を足すと、\(a^j\:(j=2,4,3,1)\) の係数は全て同じになる。その計算をすると、
\(\displaystyle\sum_{i=1}^{4}f(b,a^i)^4\)
\(\begin{eqnarray}
&&\:\: =&(h_1(b)+h_2(b)+h_3(b)+h_0(b))\\
&&&\cdot(a^2+a^4+a^3+a)\\
\end{eqnarray}\)
となる。上式の左辺については、
\(\begin{eqnarray}
&&\:\:f(b,a^2)^4&=f(b,a)^4\\
&&\:\:f(b,a^4)^4&=f(b,a)^4\\
&&\:\:f(b,a^3)^4&=f(b,a)^4\\
\end{eqnarray}\)
だったので、左辺は \(4f(b,a)^4\) に等しい。また \(a^5-1=0\) なので \(a^2+a^4+a^3+a=-1\) である。従って、
\(4f(b,a)^4=-(h_1(b)+h_2(b)+h_3(b)+h_0(b))\)
である。ここで、
\(g(b)=-\dfrac{1}{4}\:(h_1(b)+h_2(b)+h_3(b)+h_0(b))\)
と定義すると、
\(f(b,a)^4\) | \(=g(b)\) | ||
\(f(b,a)\) | \(=\sqrt[4]{g(b)}\) | \((\br{C})\) |
を得る。\((\br{C})\) 式における \(\sqrt[4]{g(b)}\) とは「\(4\)乗すると \(g(b)\) になる数」という意味である。従って、実際には \(4\)次方程式の \(4\)つの解のどれかを表している。
なお、\(g(b)\) を具体的に計算すると、計算過程は省くが、
\(g(b)=-16b^3+14b^2+4b-1\)
となる。この表現は \(p=5\) のときのもので、一般論につながるものではない。 \((\br{D})\)
今までの計算をまとめると、
\(\begin{eqnarray}
&&\:\:a^5=1\:(a\neq1)&\\
&&\:\:b^4=1&\\
\end{eqnarray}\)
\(\begin{eqnarray}
&&\:\:f(b,a)&=a^2b+a^4b^2+a^3b^3+a\\
&&\:\:f(b,a)^4&=h_1(b)a^2+h_2(b)a^4+h_3(b)a^3+h_0(b)a\\
&&\:\:g(b)&=-\dfrac{1}{4}(h_1(b)+h_2(b)+h_3(b)+h_0(b))\\
&&\:\:f(b,a)&=\sqrt[4]{g(b)}\\
\end{eqnarray}\)
である。この過程で、\(a,\:b\) については \(a^5=1\:(a\neq1),\:b^4=1\) という条件しか使っていない。従って、この条件が満たせれば \(a,\:b\) は任意である。そこで \(1\) の原始5乗根を \(\zeta\) とし、\(1\) の原始4乗根を \(\omega\) として、
\(a=\zeta\)
\(b=\omega^j\:\:(j=1,2,3,4)\)
とおく。\(b\) は \(1\) にもなりうる(\(\omega^4=1\))。なお、\(\omega\) は普通 \(1\) の原始3乗根の記号であるが、ここでは原始4乗根として使う。
すると、
\(f(\omega^j,\zeta)=\sqrt[4]{g(\omega^j)}\:\:(j=1,2,3,4)\)
\((\br{E})\)
という、4つの式が得られる。これは、
\(\zeta^2,\:\:\zeta^4,\:\:\zeta^3,\:\:\zeta\)
を4つの未知数とする連立1次方程式である。帰納法の仮定により \(\omega\) はべき根で表されているから、方程式を解いて \(\zeta\) が \(\omega\) のべき根(と四則演算)で表されば、証明が完成することになる。
\((\br{E})\) の連立方程式を具体的に書くと、
\(\zeta^2+\omega^j\zeta^4+(\omega^j)^2\zeta^3+(\omega^j)^3\zeta=\sqrt[4]{g(\omega^j)}\)
\((j=1,2,3,4)\)
であり、全てを陽に書くと、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&\zeta^2+\omega\:\:\zeta^4+(\omega\:\:)^2\zeta^3+(\omega\:\:)^3\zeta&=\sqrt[4]{g(\omega)}& \br{①}&\\
&&\zeta^2+\omega^2\zeta^4+(\omega^2)^2\zeta^3+(\omega^2)^3\zeta&=\sqrt[4]{g(\omega^2)}& \br{②}&\\
&&\zeta^2+\omega^3\zeta^4+(\omega^3)^2\zeta^3+(\omega^3)^3\zeta&=\sqrt[4]{g(\omega^3)}& \br{③}&\\
&&\zeta^2+\omega^4\zeta^4+(\omega^4)^2\zeta^3+(\omega^4)^3\zeta&=\sqrt[4]{g(\omega^4)}& \br{④}&\\
\end{eqnarray}
\end{array}\right.\)
となる。この連立方程式を解くため、\(\zeta\) の項だけを残し、他の未知数である \(\zeta^2,\:\zeta^4,\:\zeta^3\) の項を消去することを考える。そのために、
\(A\::\:\br{①}\times\omega\:+\:\br{②}\times\omega^2\:+\:\br{③}\times\omega^3\:+\:\br{④}\times\omega^4\)
とおくと、
\(A\) の左辺 \(=\)
\(\omega\:\:\zeta^2+(\omega\:\:)^2\zeta^4+(\omega\:\:)^3\zeta^3+(\omega\:\:)^4\zeta+\)
\(\omega^2\zeta^2+(\omega^2)^2\zeta^4+(\omega^2)^3\zeta^3+(\omega^2)^4\zeta+\)
\(\omega^3\zeta^2+(\omega^3)^2\zeta^4+(\omega^3)^3\zeta^3+(\omega^3)^4\zeta+\)
\(\omega^4\zeta^2+(\omega^4)^2\zeta^4+(\omega^4)^3\zeta^3+(\omega^4)^4\zeta\)
となる。\(\zeta\) の4つの項は、係数が \((\omega^j)^4=(\omega^4)^j=1\) であり、
\(\zeta\) の項の合計 \(=\:4\zeta\)
である。
\(\zeta^2,\:\zeta^4,\:\zeta^3\) の項の係数は、
\(\omega^j+\omega^{2j}+\omega^{3j}+\omega^{4j}\:\:(j=1,2,3)\)
である。\(\omega^4=1\) なので、
\(\omega^j+\omega^{2j}+\omega^{3j}+1\:\:(j=1,2,3)\)
の形をしている。\(\omega\) は \(1\) の原始4乗根であり、\(x^4-1=0\) の根である。\(x^4-1\) は、
\(x^4-1=(x-1)(x^3+x^2+x+1)\)
と因数分解されるから、\(\omega,\:\omega^2,\:\omega^3\) は方程式
\(x^3+x^2+x+1=0\)
の3つの根である。つまり、
\(x^3+x^2+x+1=(x-\omega)(x-\omega^2)(x-\omega^3)\)
と因数分解される。この式に \(x=\omega^j\:(j=1,2,3)\) を代入すると、
\((\omega^j)^3+(\omega^j)^2+\omega^j+1\)
\(\begin{eqnarray}
&&\:\: &=\omega^{3j}+\omega^{2j}+\omega^j+1\\
&&&=(\omega^j-\omega)(\omega^j-\omega^2)(\omega^j-\omega^3)\\
&&&=0\:\:(j=1,2,3)\\
\end{eqnarray}\)
となる。つまり、\(\zeta^2,\:\zeta^4,\:\zeta^3\) の項の係数、\(\omega^j+\omega^{2j}+\omega^{3j}+1\) は全て \(0\) ということである。以上をまとめると、\(A\) の左辺は \(\zeta\) の項だけが残り、
\(A\) の左辺 \(=\:4\zeta\)
である。一方、\(A\) 式の右辺は、
\(A\) の右辺 \(=\:\displaystyle\sum_{j=1}^{4}\omega^j\sqrt[4]{g(\omega^j)}\)
である。従って、
\(4\zeta=\displaystyle\sum_{j=1}^{4}\omega^j\sqrt[4]{g(\omega^j)}\)
\(\zeta=\dfrac{1}{4}\displaystyle\sum_{j=1}^{4}\omega^j\sqrt[4]{g(\omega^j)}\)
となり、\(\zeta\) が \(\omega\) の多項式のべき根として求まった。 \((\br{F})\)
\((\br{F})\) 式における \(\sqrt[4]{g(\omega^j)}\) とは「\(4\)乗すると \(g(\omega^j)\) になる数」という意味であり、\(4\)次方程式の\(4\)つの解のどれかである。従って、実際に \(\omega\) に数を入れて(この場合は \(1\) の原始4乗根だから \(i\) か \(-i\))計算するときには、\(\zeta^5=1\) になるように \((\br{F})\) 式の \(4\)つの項のそれぞれについて、\(4\)つの解のどれかを選択する必要がある。しかしそうであっても、\(\zeta\) が \(\omega\) の多項式のべき根と四則演算で表現できるということは変わらない。
これまでの論理展開では、\(p=5\) であることの特殊性は何も使っていない。唯一、使ったのは、\(p\) が素数であり、そのときに \((\bs{Z}/p\bs{Z})^{*}\) に生成元がある(25D)ということである。
従って、\(\zeta\) が \(1\) の原始\(p\)乗根であり、\(\omega\) が \(1\) の原始\((p-1)\)乗根であっても \((\br{F})\) 式は、\(4\) を \((p-1)\) に置き換えれば成り立つ。
帰納法の仮定により、\(1\) の原始\((p-1)\)乗根 \(\omega\) はべき根で表される。従って \((\br{F})\) 式から、\(1\) の原始\(p\)乗根 である \(\zeta\) もべき根で表される。[証明終]
ためしに \((\br{F})\) 式を使って、\(1\) の原始5乗根、\(\zeta\) を計算してみます。\(\omega\) は \(1\) の原始4乗根(の一つ)なので \(\omega=i\)(虚数単位)とすると、\((\br{D})\) 式も含めて、
\(\begin{eqnarray}
&&\:\:g(b)&=-16b^3+14b^2+4b-1 (\br{D})\\
&&\:\:b&=\omega^j\:\:(j=1,2,3,4)\\
&&&=\:\{\:i,\:-1,\:-i,\:1\:\}\\
&&\:\:g(\omega)&=-15+20i\\
&&\:\:g(\omega^2)&=25\\
&&\:\:g(\omega^3)&=-15-20i\\
&&\:\:g(\omega^4)&=1\\
\end{eqnarray}\)
となり、これらを \((\br{F})\) 式に代入すると、
\(\zeta=\dfrac{1}{4}(\sqrt[4]{1}-\sqrt[4]{25}+i(\sqrt[4]{-15+20i}-\sqrt[4]{-15-20i}))\)
となります。\(\sqrt[4]{\cd}\) は「\(4\)乗して \(\cd\) になる数」の意味です。この式を、
\(4\zeta=r+is\)
\(\begin{eqnarray}
&&\:\: r&=\sqrt[4]{1}-\sqrt[4]{25}\\
&&\:\: s&=\sqrt[4]{-15+20i}-\sqrt[4]{15-20i}\\
\end{eqnarray}\)
と表すことにします。そして \(\sqrt[4]{\cd}\) を \(\sqrt{\cd}\) に変換するために2乗すると、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&r^2=\pm6\pm2\sqrt{5}&\\
&&s^2=\pm10\pm2\sqrt{5}&\\
\end{eqnarray}
\end{array}\right.\)
と計算できます。但し \(r^2+s^2=4\) の条件があるので、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&r^2=6\pm2\sqrt{5}&\\
&&s^2=10\pm2\sqrt{5}&\\
\end{eqnarray}
\end{array}\right.\)
となります(複合異順)。ここから \(r,\:s\) を求めると、\(r\) の方は2重根号をはずすことができて、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&r=\pm(1+\sqrt{5}),\:\:s=\pm\sqrt{10-2\sqrt{5}}&\\
&&r=\pm(1-\sqrt{5}),\:\:s=\pm\sqrt{10+2\sqrt{5}}&\\
\end{eqnarray}
\end{array}\right.\)
の合計8つの解が求まります。このうちの4つは方程式 \(x^5-1=0\) の解 \((=\zeta)\) で、残りの4つは方程式 \(x^5+1=0\) の解 \((=-\zeta)\) です。\(\zeta\) を表記すると、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&\zeta=\dfrac{1}{4}\left(-1+\sqrt{5}\pm i\sqrt{10+2\sqrt{5}}\right)&\\
&&\zeta=\dfrac{1}{4}\left(-1-\sqrt{5}\pm i\sqrt{10-2\sqrt{5}}\right)&\\
\end{eqnarray}
\end{array}\right.\)
の4つとなり、\(1\) の原始5乗根が求まりました。一般的な原始5乗根の計算方法とは違いますが、\((\br{F})\) 式によっても原始5乗根が求まることが確認できました。
7.2 べき根拡大の十分条件のため補題
ここでは「7.3 べき根拡大の十分条件」を証明するための補題を2つ証明します。以下に出てくる多項式 \(g(x)\) は、方程式を解くために考えられた「ラグランジュの分解式」と呼ばれるものです。分解式はレゾルベント(resolvent)とも言います。
補題(1)
(べき根拡大の十分条件のため補題1:72A) |
\(\bs{L}\) を \(\bs{K}\) のガロア拡大とし、\(\mr{Gal}(\bs{L}/\bs{K})\) を \(\sg\) で生成される位数 \(n\) の巡回群とする。式 \(g(x)\) を、
\(g(x)\) | \(\overset{\text{ }}{=}\) | \(x+a_1\sg(x)+a_2\sg^2(x)+\:\cd\:+a_{n-1}\sg^{n-1}(x)=0\) | |
\((a_i\in\bs{L},\:1\leq i\leq n-1)\) |
と定義する。このとき、\(\bs{L}\) の全ての元 \(x\) について、\(g(x)=0\) となるような \(\bs{L}\) の元、\(a_1,\:a_2,\:\cd\:,a_{n-1}\) は存在しない。
[証明]
\(\bs{L}\) が原始元 \(\theta\) によって \(\bs{L}=\bs{K}(\theta)\) と表されているとし(32B)、\(\theta\) の \(\bs{K}\) 上の最小多項式を \(f(x)\) とする。最小多項式は既約多項式の定理(31I)により \(f(x)\) は既約多項式である。そうすると、\(\theta,\:\sg^i(\theta)\:(1\leq i\leq n-1)\) の \(n\)個は \(f(x)=0\) の解であり、既約多項式の定理3(31G)によって \(n\)個の解は全て異なる。つまり、
\(\theta-\sg^i(\theta)\neq0\:(1\leq i\leq n-1)\)
である。このことを踏まえて背理法で証明する。\(\bs{L}\) の任意の元 \(x\) について、
\(g(x)=x+a_1\sg(x)+a_2\sg^2(x)+\:\cd\:+a_{n-1}\sg^{n-1}(x)=0\)
\((\br{A})\)
となるような \(\bs{L}\) の元 \(a_1,\:a_2,\:\cd\:,a_{n-1}\) が存在したとする。この \(g(x)=0\) の式から \(\sg^{n-1}(x)\) の項を消去することを考える。そのためにまず \(g(\theta x)\) を計算すると、
\(g(\theta x)\) | \(\overset{\text{ }}{=}\) | \(\theta x+\)\(a_1\sg(\theta x)+\)\(a_2\sg^2(\theta x)+\)\(\:\cd\:+\)\(a_{n-1}\sg^{n-1}(\theta x)\) | |
\(\overset{\text{ }}{=}\) | \(\theta x+\)\(a_1\sg(\theta)\sg(x)+\)\(a_2\sg^2(\theta)\sg^2(x)+\)\(\:\cd\:+\)\(a_{n-1}\sg^{n-1}(\theta)\sg^{n-1}(x)\) | ||
\(\overset{\text{ }}{=}\) | \(0\) |
となる。この式から \(\sg^{n-1}(x)\) の項を消去するには、この式の \(\sg^{n-1}(x)\)の係数が \(a_{n-1}\sg^{n-1}(\theta)\) であり、また \(g(x)\) の \(\sg^{n-1}(x)\) の項の係数が \(a_{n-1}\) なので、
\(\sg^{n-1}(\theta)g(x)=0\)
の式を作って両辺から引けばよい。その計算をすると、
\(g(\theta x)-\sg^{n-1}(\theta)g(x)\)
\(\overset{\text{ }}{=}\) | \((\theta-\sg^{n-1}(\theta))x+\)\((\sg(\theta)-\sg^{n-1}(\theta))a_1\sg(x)+\)\((\sg^2(\theta)-\sg^{n-1}(\theta))a_2\sg(x)^2+\)\(\:\cd\:+\)\((\sg^{n-2}(\theta)-\sg^{n-1}(\theta))a_{n-2}\sg(x)^{n-2}\) | ||
\(\overset{\text{ }}{=}\) | \(0\) |
となる。ここで、\(x\) の係数である \((\theta-\sg^{n-1}(\theta))\) は、証明の最初に書いたように \(0\) ではない。そこで、全体を \((\theta-\sg^{n-1}(\theta))\) で割ると、
\(x+b_1\sg(x)+b_2\sg(x)^2+\:\cd\:+b_{n-2}\sg(x)^{n-2}=0\)
\((\br{B})\)
の形になる。ここで \(b_i\) は、
\(b_i=\dfrac{\sg^i(\theta)-\sg^{n-1}(\theta)}{\theta-\sg^{n-1}(\theta)}a_i\)
である。\((\br{B})\) 式は、基本的に \((\br{A})\) 式と同じで、\((\br{A})\) 式から \(\sg(x)^{n-1}\) の項を消去した形であり、\(x\) の最大次数の項は \(\sg(x)^{n-2}\) になっている。以上の、\((\br{A})\) から \((\br{B})\) への変換は繰り返し行えるから、\(n-2\) 回の変換を繰り返すと、
\(x+c_1\sg(x)=0\)
の形が得られる。この式にもう一度、\(n-1\) 回目の変換をすると、
\(\theta x+c_1\sg(\theta x)-\sg(\theta)(x+c_1\sg(x))=0\)
\(\theta x+c_1\sg(\theta)\sg(x)-\sg(\theta)x+c_1\sg(\theta)\sg(x)=0\)
\(\theta x-\sg(\theta)x=0\)
\((\theta-\sg(\theta))x=0\)
\(x=0\)
\(\theta x+c_1\sg(\theta)\sg(x)-\sg(\theta)x+c_1\sg(\theta)\sg(x)=0\)
\(\theta x-\sg(\theta)x=0\)
\((\theta-\sg(\theta))x=0\)
\(x=0\)
となる。\(x\) は \(\bs{L}\) の任意の元だったから、\(\bs{L}\) のすべての元は \(0\) となってしまい、矛盾が生じた。従って背理法の仮定は誤りであり、\(\bs{L}\) の全ての元 \(x\) について、
\(x+a_1\sg(x)+a_2\sg^2(x)+\:\cd\:+a_{n-1}\sg^{n-1}(x)=0\)
となるような \(\bs{L}\) の元、\(a_1,\:a_2,\:\cd\:,a_{n-1}\) は存在しない。[証明終]補題(2)
(べき根拡大の十分条件のため補題2:72B) |
\(\zeta\) を \(1\) の原始\(n\)乗根とし、\(\zeta\)を含む代数体を \(\bs{K}\) とする。\(\bs{K}\) のガロア拡大体を \(\bs{L}\) とし、\(\mr{Gal}(\bs{L}/\bs{K})\) は \(\sg\) で生成される位数 \(n\) の巡回群とする(= \(\bs{L}/\bs{K}\) が巡回拡大)。また \(f(x)\) を \(\bs{K}\) 上の \(n\)次既約多項式とし、\(\bs{L}\) が方程式 \(f(x)=0\) の解 \(\theta\) を用いて、\(\bs{L}=\bs{K}(\theta)\) と表されているものとする。このとき、
\(g(x)=x+\zeta^{n-1}\sg(x)+\zeta^{n-2}\sg^2(x)+\cd+\zeta\sg^{n-1}(x)\)
とおくと、\(g(\theta),\:g(\theta^2),\:\cd\:,g(\theta^{n-1})\) のうち少なくとも一つは \(0\) ではない。
[証明]
\(g(x)\) の形は、べき根拡大の十分条件のため補題1(72A)で、
\(a_i=\zeta^{n-i}\:(1\leq i\leq n-1)\)
と置いたものである。\(\zeta\) は \(\bs{K}\) の元 = \(\bs{L}\) の元だから、補題(1)により \(\bs{L}\) の任意の元 \(x\) について \(g(x)=0\) となることはない。
この \(g(x)\) は次のような性質をもっている。まず \(\bs{K}\) の任意の元を \(a\) とすると、\(\mr{Gal}(\bs{L}/\bs{K})\) の 元 \(\sg\) は \(a\) を不動にするから、
\(\sg^i(a)=a\)
である。従って、\(g(a)\) を計算すると、
\(g(a)=ag(1)\)
となる。また、\(\bs{K}\) の任意の元を \(a\)、\(\bs{L}\) の任意の元を \(x\) とすると、
\(\sg^i(ax)=\sg^i(a)\sg^i(x)=a\sg^i(x)\)
なので、
\(g(ax)=ag(x)\)
である。さらに \(\bs{L}\) の任意の2つの元を \(x,\:y\) とすると、
\(\sg^i(x+y)=\sg^i(x)+\sg^i(y)\)
なので、
\(g(x+y)=g(x)+g(y)\)
である。
\(\bs{L}\) は、\(\bs{K}\) 上の既約多項式 \(f(x)\) を用いた方程式 \(f(x)=0\) の解 \(\theta\) の単拡大体 \(\bs{K}(\theta)\) だから、単拡大の体の定理(32C)により、\(\bs{L}\) の任意の元 \(x\) は、
\(x=b_0+b_1\theta+b_2\theta^2+\cd+b_{n-1}\theta^{n-1}\:(b^i\in\bs{K})\)
と表せる。\(g(x)\) の式にこの \(x\) を代入すると、
\(\begin{eqnarray}
&&\:\:g(x)&=g(b_0+b_1\theta+b_2\theta^2+\cd+b_{n-1}\theta^{n-1})\\
&&&=g(b_0)+g(b_1\theta)+g(b_2\theta^2)+\cd+g(b_{n-1}\theta^{n-1})\\
&&&=b_0g(1)+b_1g(\theta)+b_2g(\theta^2)+\cd+b_{n-1}g(\theta^{n-1})\\
\end{eqnarray}\)
となる。ここで、
\(g(1)=1+\zeta^{n-1}+\zeta^{n-2}+\cd+\zeta\)
だが、\(g(1)(1-\zeta)=\zeta^n-1=0\) なので \(g(1)=0\) である。従って、\(g(\theta),\:g(\theta^2),\:\cd\:,g(\theta^{n-1})\) の全てが \(0\) だと、\(\bs{L}\) の全ての元 \(x\) について \(g(x)=0\) となり、矛盾が生じる。ゆえに、\(g(\theta),\:g(\theta^2),\:\cd\:,g(\theta^{n-1})\) のうち、少なくとも一つは \(0\) ではない。[証明終]
7.3 べき根拡大の十分条件
補題(1)と補題(2)を使って、体の拡大がべき根拡大になるための十分条件を証明します。
(べき根拡大の十分条件:73A) |
1の原始\(n\)乗根を \(\zeta\) とし、代数体 \(\bs{\bs{K}}\) には \(\bs{\zeta}\) が含まれるとする。\(\bs{L}/\bs{K}\) をガロア拡大とし、\(\mr{Gal}(\bs{L}/\bs{K})\) が巡回群とする(= \(\bs{L}/\bs{K}\) が巡回拡大)。拡大次数は \([\bs{L}:\bs{K}]=n\) とする。
このとき、\(\bs{L}\) は \(\bs{K}\) のべき根拡大である。
[証明]
\(\mr{Gal}(\bs{L}/\bs{K})\) は位数 \(n\) の巡回群なので、生成元を \(\sg\) とし、
\(\mr{Gal}(\bs{L}/\bs{K})=\{e,\:\sg,\:\sg^2,\:\cd\:,\sg^{n-1}\}\)
とする。\(\bs{L}\) の 元 \(c\) に対して、
\(\al=c+\zeta^{n-1}\sg(c)+\zeta^{n-2}\sg^2(c)+\:\cd+\zeta^2\sg^{n-2}(c)+\zeta\sg^{n-1}(c)\)
と定める。このとき \(\al\neq0\) となるように \(c\) を選べる。なぜなら、もし \(\al\neq0\) となる \(c\) が選べないとすると、\(\bs{L}\) の全ての元 \(x\) について、
\(x+\zeta^{n-1}\sg(x)+\zeta^{n-2}\sg^2(x)+\:\cd\:+\zeta\sg^{n-1}(x)=0\)
となるはずだが、これはべき根拡大の十分条件のため補題1(72A)、つまり、
\(\bs{L}\) の全ての元 \(x\) について、
\(x+a_1\sg(x)+a_2\sg^2(x)+\:\cd\:+a_{n-1}\sg^{n-1}(x)=0\)
となるような \(\bs{L}\) の元、\(a_1,\:a_2,\:\cd\:,a_{n-1}\) は存在しない
において、\(a_1=\zeta^{n-1},\:a_2=\zeta^{n-2},\:\cd\:,a_{n-1}=\zeta\) と置いたことに相当し、そのような \(a_i\:(1\leq i\leq n-1)\) は存在しないとする補題1の結論に反するからである。またべき根拡大の十分条件のため補題2(72B)では、\(c\) の選び方の例が示されている。そこで、\(\al\neq0\) となるように \(c\) を選んだとする。
\(\sg\)は \(\bs{K}\) の元である \(\zeta\) を不変にするので、
\(\sg(\zeta^{n-i}\sg^i(c))=\zeta^{n-i}\sg^{i+1}(c)\)
である。これを用いて \(\sg(\al)\) を計算すると、
\(\sg(\al)\)
\(=\sg(c)+\zeta^{n-1}\sg^2(c)+\zeta^{n-2}\sg^3(c)+\:\cd+\zeta^2\sg^{n-1}(c)+\zeta\sg^n(c)\)
\(=\zeta^n\sg(c)+\zeta^{n-1}\sg^2(c)+\zeta^{n-2}\sg^3(c)+\:\cd+\zeta^2\sg^{n-1}(c)+\zeta c\)
\(=\zeta(\zeta^{n-1}\sg(c)+\zeta^{n-2}\sg^2(c)+\zeta^{n-3}\sg^3(c)+\:\cd+\zeta\sg^{n-1}(c)+c)\)
\(=\zeta\al\)
となる。計算では、\(\zeta^n=1\) であることと(第1項)、\(\sg^n=e\) なので \(\sg^n(c)=c\) となること(最終項)を用いた。
ここで、\(\al=\zeta\al\) となるのは、\(\al=0\) のときだけであるが、\(\al\neq0\) なので \(\al\neq\zeta\al\) である。つまり \(\sg(\al)\neq\al\) であり、\(\al\) は \(\sg\) を作用させると不変ではない。従って \(\al\) は \(\bs{K}\) の元ではない \(\bs{L}\) の元である。さらに \(\sg^i(\al)\) を求めていくと、
\(\begin{eqnarray}
&&\:\:\sg^2(\al)&=\sg(\sg(\al))=\sg(\zeta\al)=\zeta\sg(\al)=\zeta\zeta\al\\
&&&=\zeta^2\al\\
&&\:\:\sg^3(\al)&=\sg(\sg^2(\al))=\sg(\zeta^2\al)=\zeta^2\sg(\al)=\zeta^2\zeta\al\\
&&&=\zeta^3\al\\
\end{eqnarray}\)
というように計算でき、
\(\sg^i(\al)=\zeta^i\al\)
である。これを使うと、
\(\begin{eqnarray}
&&\:\:\sg(\al^n)&=\sg(\al)^n=(\zeta\al)^n=\zeta^n\al^n\\
&&&=\al^n\\
\end{eqnarray}\)
であり、\(\al^n\) は \(\sg\) を作用させても不変である。従って \(\al^n\) は \(\bs{K}\) の元である。そこで \(\al^n=a\:\:(a\in\bs{K})\) とおく。
方程式 \(x^n-a=0\) の解は、\(\al,\:\zeta\al,\:\zeta^2\al,\:\cd,\:\zeta^{n-1}\al\) であり、\(x^n-a=0\) の \(\bs{K}\) 上の最小分解体は、\(\bs{K}\) には \(\zeta\) が含まれているから、
\(\bs{K}(\al,\:\zeta\al,\:\zeta^2\al,\:\cd,\:\zeta^{n-1}\al)=\bs{K}(\al,\zeta)=\bs{K}(\al)\)
である。この式から、\(\bs{K}\) の同型写像による \(\al\) の移り先は全て \(\bs{K}(\al)\) に含まれることが分かる。従って \(\sg^i\:\:(1\leq i\leq n-1)\) はすべて \(\bs{K}(\al)\) の自己同型写像である。また、同型写像での移り先の定理(51D)により、同型写像は \(\al\) を共役な元に移すが、\(\al\) と共役な元は \(n-1\) 個しかない。従って \(\sg^i\) 以外に同型写像はない。つまり、
\(\mr{Gal}(\bs{K}(\al)/\bs{K})=\{e,\:\sg,\:\sg^2,\:\cd\:,\:\sg^{n-1}\}\)
であり、これは \(\mr{Gal}(\bs{L}/\bs{K})\) と同じである。次数と位数の同一性の定理(52B)により、ガロア群に含まれる自己同型写像の数は体の拡大次数に等しいから、
\([\:\bs{K}(\al)\::\:\bs{K}\:]=[\:\bs{L}\::\:\bs{K}\:]\)
である。もともと \(\al\) は \(\bs{L}\) の元だったので、\(\bs{K}(\al)\) の元は全て \(\bs{L}\) の元である。つまり、
\(\bs{K}(\al)\:\subset\:\bs{L}\)
であるが、\(\bs{K}(\al)\) と \(\bs{L}\) の線形空間の次元が等しいので、体の一致の定理(33I)により2つは一致し、
\(\bs{K}(\al)=\bs{L}\)
である。以上により、\(\bs{L}\) は \(\bs{K}\) の上の方程式 \(x^n-a=0\:(a\in\bs{K})\) の解の一つ \(\al\) を用いて \(\bs{L}=\bs{K}(\al)\) と表されるから、\(\bs{L}\) は \(\bs{K}\) の べき根拡大である。[証明終]
証明の過程で出てきた、
\(\al=c+\zeta^{n-1}\sg(c)+\zeta^{n-2}\sg^2(c)+\:\cd+\zeta^2\sg^{n-2}(c)+\zeta\sg^{n-1}(c)\)
の式は、方程式を解くために考えられた「ラグランジュの分解式」と呼ばれるものです。分解式はレゾルベント(resolvent)とも言い、数学史においてはガロア理論より前に考えられたものです。この証明を振り返ってまとめてみると、
\(\bs{L}\) は \(\bs{K}\) の代数拡大体であり、拡大次元は \(n\) である。 | |
\(\bs{K}\) には \(1\) の原始\(n\)乗根が含まれている。 | |
\(\bs{L}/\bs{K}\) はガロア拡大である。 | |
\(\mr{Gal}(\bs{L}/\bs{K})\) は巡回群である(=\(\bs{L}/\bs{K}\) は巡回拡大) |
という条件のもとで、レゾルベントをうまく定義すると、
ある \(\bs{L}\) の元 \(\al\:(\notin\bs{K})\) が存在し、\(\al^n\) は \(\bs{K}\) の元である。 | |
すなわち \(\al\) は、方程式 \(x^n-a=0\:\:(a\in\bs{K})\) の解である。 | |
\(\bs{L}=\bs{K}(\al)\) であり、従って \(\bs{L}/\bs{K}\) はべき根拡大である。 |
が成り立つという論理展開でした。つまりポイントは \(\bs{\al^n\in\bs{K}}\) のところであり、そういう \(\bs{\al\in\bs{L}}\) の存在が証明の核心です。
しかし、その鍵である \(\al\) を具体的に見つけようとすると、\(\al\) の式に現れる \(c\) を決めなければなりません。その \(c\) の値ですが、\(\bs{L}\) が方程式 \(f(x)=0\) の解 \(\theta\) を用いて \(\bs{L}=\bs{K}(\theta)\) と表されているとき(= \(\theta\) が原始元のとき)、\(c=\theta\) にできることがべき根拡大の十分条件のため補題2(72B)に示されています。しかし、方程式の形から原始元が分かるわけではありません。
べき根拡大の十分条件(73A)は、その十分条件があればべき根拡大体の中に方程式の解が含まれる(= 方程式の解が四則演算とべき根で記述できる)ことだけを言っています。つまり四則演算とべき根で記述できる解の存在証明であり、そこが注意点です。
原始\(n\)乗根はべき根で表現可能
べき根拡大の十分条件(73A)を用いて原始\(\bs{n}\)乗根はべき根で表現可能(71A)であることを証明できます。(71A)ではガロア理論と関係なく証明しましたが、ガロア理論の枠組みを使っても証明できるということです。
まず \(n\) が合成数のとき、つまり \(n=s\cdot t\) と分解できるときには、原始\(n\)乗根は、原始\(s\)乗根と原始\(t\)乗根のべき根で表現できます(71A)。\(s\) や \(t\) が合成数なら、さらに "分解" を続けられるので、結局、\(n\) が素数 \(p\) のときに原始\(p\)乗根がべき根で表せることを示せればよいことになります。
いま、\(\bs{p}\) 未満の素数すべての原始\(\bs{n}\)乗根がべき根で表されると仮定します。これは帰納法の仮定です。原始\(p\)乗根を \(\eta\)(イータ) とし、その最小多項式を \(f(x)\) とすると、\(f(x)\) は既約多項式で、円分多項式です(63D)。原始\(p\)乗根は 方程式 \(x^p-1=0\) の \(1\) 以外の根なので、
\(x^p-1=(x-1)f(x)\)
であり、
\(f(x)=x^{p-1}+x^{p-2}+\:\cd\:+x+1\)
です。
原始\(p\)乗根による拡大体 \(\bs{Q}(\eta)\) のガロア群は、
\(\mr{Gal}(\bs{Q}(\eta)/\bs{Q})\cong(\bs{Z}/p\bs{Z})^{*}\)
です(63E)。\((\bs{Z}/p\bs{Z})^{*}\) は位数 \((p-1)\) の巡回群で(25D)、\(\bs{Q}(\eta)/\bs{Q}\) の拡大次数は、\([\:\bs{Q}(\eta):\bs{Q}\:]=p-1\) です。原始\((p-1)\)乗根を \(\zeta\) とすると、\(\eta\notin\bs{Q}(\zeta)\) なので、\(\bs{Q}\) 上の既約多項式である \(f(x)\) は \(\bs{Q}(\zeta)\) 上でも既約多項式です。従って、
\(\mr{Gal}(\bs{Q}(\zeta,\eta)/\bs{Q}(\zeta))\cong\mr{Gal}(\bs{Q}(\eta)/\bs{Q})\)
であり、\(\mr{Gal}(\bs{Q}(\zeta,\eta)/\bs{Q}(\zeta))\) も位数 \((p-1)\) の巡回群です。すると、べき根拡大の十分条件(73A)により、\(\bs{Q}(\zeta,\eta)/\bs{Q}(\zeta)\) はべき根拡大になります。つまり \(\eta\) は "有理数と \(\zeta\) の四則演算から成る式" のべき根で表現できます。
「\(p\) 未満の素数すべての原始\(n\)乗根がべき根で表される」という仮定により、\(\zeta\) はべき根で表現できます。従って \(\eta\) もべき根で表されます。
原始\(2\)乗根は \(-1\) であり、原始\(3\)乗根は根の公式によって、べき根で表現できます。従って帰納法により \(5\) 以上の素数 \(p\) の原始\(p\)乗根もべき根で表現できることが分かります。これで証明ができました。
ここで、原始\(\bs{n}\)乗根はべき根で表現可能(71A)とべき根拡大の十分条件(73A)の関係ですが、(73A)の証明の鍵になったのは、ラグランジュの分解式、
\(\al=c+\zeta^{n-1}\sg(c)+\zeta^{n-2}\sg^2(c)+\:\cd+\zeta^2\sg^{n-2}(c)+\zeta\sg^{n-1}(c)\)
でした。いま、原始\(5\)乗根を \(\eta\) とし、\(\bs{Q}(\eta)/\bs{Q}\) の巡回拡大を考えます。原始\(4\)乗根を \(\zeta\) とします(\(\zeta=i,\:-i\))。
\(\bs{Q}(\eta)\) の自己同型写像 \(\sg\) を、
\(\sg(\eta)=\eta^2\)
となる写像と定義します。そして、\(c=\eta,\:n=4\) を分解式に入れると、
\(\begin{eqnarray}
&&\:\:\al&=\eta+\zeta^3\sg(\eta)+\zeta^2\sg^2(\eta)+\zeta\sg^3(\eta)\\
&&&=\eta+\zeta^3\eta^2+\zeta^2\eta^4+\zeta\eta^3\\
\end{eqnarray}\)
となります。このラグランジュの分解式と、原始\(\bs{n}\)乗根はべき根で表現可能(71A)の証明で使った \(f(x,y)\) は本質的に同じものです。つまり
\(f(x,y)=y^3x+y^4x^2+y^2x^3+y\) |
と定義すると、\(x,\:y\) の指数はそれぞれ、
\(x\) の指数:\([\:1,\:2,\:3,\:0\:]\)
\(\bs{Z}/4\bs{Z}\) の巡回パターン(生成元 \(=1\))
\(y\) の指数:\([\:3,\:4,\:2,\:1\:]\)
\((\bs{Z}/5\bs{Z})^{*}\) の巡回パターン(生成元 \(=3\))
となります。(71A)では \((\bs{Z}/5\bs{Z})^{*}\) の巡回パターンを \([\:2,\:4\:,3,\:1\:]\)(生成元 \(=2\))としたので式の形は少々違いますが、本質的に同じです。ここで、
\(x=\zeta,\:\:y=\eta\)
と置くと、
\(\begin{eqnarray}
&&\:\:f(x,y)&=\eta+\zeta^3\eta^2+\zeta^2\eta^4+\zeta\eta^3\\
&&&=\al\\
\end{eqnarray}\)
となり、\(f(x,y)\) が ラグランジュの分解式と同じものであることが確認できました。つまり、原始\(\bs{n}\)乗根はべき根で表現可能(71A)の証明は、
ラグランジュの分解式での証明(73A)と同じことを、"分解式"、"体"、"ガロア群" などの概念を使わずに証明し、かつ、\((p-1)\)乗根をもとに \(p\)乗根を求める計算式を示した
ものなのでした。
7.4 べき根拡大と巡回拡大の同値性
6.3節の "べき根拡大は巡回拡大である"(63H)と、7.3節の "巡回拡大はべき根拡大である"(73A)を合わせると、次にまとめることができます。
(べき根拡大と巡回拡大は同値:74A) |
\(1\) の原始\(n\)乗根を \(\zeta\) とし、代数体 \(\bs{\bs{K}}\) には \(\bs{\zeta}\) が含まれるとする。また、\(\bs{K}\) の\(n\)次拡大体を \(\bs{L}\) とする( \([\:\bs{L}\::\:\bs{K}\:]=n\) )。
このとき、
\(\bs{L}/\bs{K}\) は巡回拡大である | |
\(\bs{L}/\bs{K}\) はべき根拡大である。 |
\(\bs{1}\) の原始\(\bs{n}\)乗根が代数体に含まれるという条件をつけるのが巧妙なアイデアで、この条件によって可解性の必要十分条件が導けます。
7.5 可解性の十分条件
以上の準備をもとに、可解性の必要条件(64B)の逆である、可解性の十分条件の証明を行います。
代数拡大体 \(\bs{K}\) 上の多項式 \(f(x)\) の最小分解体を \(\bs{L}\) とし、拡大次数を \([\:\bs{L}\::\:\bs{K}\:]=n\) とします。そして、ガロア群 \(\mr{Gal}(\bs{L}/\bs{K})\) が可解群であるとき、もし \(\bs{K}\) に \(1\) の原始\(n\)乗根が含まれるなら、べき根拡大と巡回拡大は同値の定理(74A)により、\(\bs{K}\) の巡回拡大とべき根拡大は同じことです。従って、
可解群 \(\rightarrow\) 累巡回拡大 \(\rightarrow\) 累べき根拡大 \(\rightarrow\) 可解
というルートで、方程式 \(f(x)=0\) の可解性が証明できます。しかし、\(\bs{K}\) に \(1\) の原始\(n\)乗根が含まれるとは限りません。\(\bs{K}\) が有理数体 \(\bs{Q}\) だとすると、そこに(原始2乗根以外の)原始\(n\)乗根はありません。しかし、このようなケースでも方程式の可解性が証明できます。それが以下です。
(可解性の十分条件:75A) |
体 \(\bs{K}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とする。\(\mr{Gal}(\bs{L}/\bs{K})=G\) とし、\(G\) は可解群とする。
このとき \(f(x)=0\) の解は四則演算とべき根で表現できる。
[証明]
\([\:\bs{L}\::\:\bs{K}\:]=n\:\:(|G|=n)\) とし、\(\zeta\) を \(1\) の原始\(n\)乗根とする。\(\bs{K}\) に \(\zeta\) を添加した拡大体 \(\bs{K}(\zeta)\)と、\(\bs{L}\) に \(\zeta\) を添加した拡大体 \(\bs{L}(\zeta)\) を考える。
\(\bs{L}(\zeta)\) は \(\bs{K}\) 上の方程式 \(f(x)(x^n-1)=0\) の最小分解体だから、\(\bs{L}(\zeta)/\bs{K}\) はガロア拡大である。
また \(\bs{K}(\zeta)\) は、\(\bs{K}\)のガロア拡大体 \(\bs{L}(\zeta)\) の中間体なので、中間体からのガロア拡大の定理(52C)によって、\(\bs{L}(\zeta)/\bs{K}(\zeta)\) もガロア拡大である。そこで、
\(\mr{Gal}(\bs{L}(\zeta)/\bs{K}(\zeta))=G\,'\)
とおく。
![]() |
ポイントは、\(G\,'\) が \(G\) の部分群(\(G\) そのものも含む)と同型であることの証明である。これが成り立てば、① \(G\) は可解群なのでその部分群は可解群、② 可解群と同型な \(G\,'\) は可解群、③ \(G\,'\) が可解群なので \(\bs{L}(\zeta)/\bs{K}(\zeta)\) は累巡回拡大、④ \(\bs{K}(\zeta)\) は原始\(n\)乗根を含むので、累巡回拡大である \(\bs{L}(\zeta)/\bs{K}(\zeta)\) は累べき根拡大、が言える。 |
\(G\) の元を \(g\)、\(G\) の単位元を \(e\) とする。\(G\,'\)の元を \(g\,'\)、\(G\,'\) の単位元を \(e\,'\) とする。また、\(G\,'\) の元 \(g\,'\) を \(\bs{L}\) の元に限定して作用させるときの同型写像を \(\sg(g\,')\) とする。
\(g\,'\)は \(\bs{L}(\zeta)\) の自己同型写像だから、\(\bs{L}(\zeta)\) の元を共役な元に移す。従って 作用範囲を \(\bs{L}\) に限定した \(\sg(g\,')\) も \(\bs{L}\) の元を共役な元に移す。\(\bs{L}\) はガロア拡大体だから、\(\bs{L}\)の元の共役な元は \(\bs{L}\) に含まれる。従って \(\sg(g\,')\) は \(\bs{L}\) の自己同型写像である。
また \(g\,'\) は \(\mr{Gal}(\bs{L}(\zeta)/\bs{K}(\zeta))\) の元だから、\(\bs{K}(\zeta)\) の元を固定する。従って、\(\bs{K}(\zeta)\) の部分集合である \(\bs{K}\) の元も固定する。ゆえに、\(g\,'\) の作用範囲を \(\bs{L}\) に限定した \(\sg(g\,')\) も、\(\bs{L}\) の部分集合である \(\bs{K}\) の元を固定する。
以上により \(\sg(g\,')\) は、\(\bs{K}\)の元を固定する \(\bs{L}\) の自己同型写像だから、\(\mr{Gal}(\bs{L}/\bs{K})\) の元、つまり \(G\) の元である。
\(\sg\) を \(G\,'\) から \(G\) への写像と見なして考える。\(G\,'\) の元 を \(g\,'\) とし、\(x\) を \(\bs{L}\) の元とすると、\(g\,'(x)=\sg(g\,')(x)\) である。つまり、作用する対象が \(\bs{L}\) の元なら、2つの写像、\(g\,'\) と \(\sg(g\,')\) は同じ効果を生む。
\(G\,'\)の任意の2つの元を \(g_1{}^{\prime},\:g_2{}^{\prime}\) とすると、\(g_1{}^{\prime}g_2{}^{\prime}\) も \(G\,'\) の元だから、
\(g_1{}^{\prime}g_2{}^{\prime}(x)=\sg(g_1{}^{\prime}g_2{}^{\prime})(x)\)
である。左辺の \(g_2{}^{\prime}(x)\) は \(\sg(g_2{}^{\prime})(x)\) と同じなので、 \((\br{A})\)
\(g_1{}^{\prime}g_2{}^{\prime}(x)=g_1{}^{\prime}(\sg(g_2{}^{\prime})(x))\)
であるが、\(\sg(g_2{}^{\prime})(x)\) もまた \(\bs{L}\) の元だから、
\(g_1{}^{\prime}g_2{}^{\prime}x=\sg(g_1{}^{\prime})\sg(g_2{}^{\prime})(x)\)
である。\((\br{A})\) と \((\br{B})\) より、 \((\br{B})\)
\(\sg(g_1{}^{\prime}g_2{}^{\prime})=\sg(g_1{}^{\prime})\sg(g_2{}^{\prime})\)
となって、\(\sg\) は準同型写像(42A)である。
\(\sg(g\,')\) が \(G\) の元であり \(\sg\) が準同型写像なので、準同型写像の像と核の定理(42B)により、\(\sg\) による \(G\,'\) の 像 \(\sg(G\,')\) は \(G\) の部分群である。もちろん、\(G\) の部分群には \(G\) の自明な部分群である \(G\) 自身も含まれる。
いま、ある \(G\,'\) の元 \(h\) があって、\(\sg(h)=e\)(\(e\) は \(G\) の単位元)とする。つまり、\(h\) を \(\bs{L}\) に限定して適用すると、\(\bs{L}\) の元すべてを固定するものとする。
\(G\,'\) は \(\mr{Gal}(\bs{L}(\zeta)/\bs{K}(\zeta))\) であり、そのすべての元は \(\bs{K}(\zeta)\) の元を固定する。従って、\(G\,'\) の元 \(h\) は \(\zeta\) も固定する。ということは、\(h\) は「\(\bs{L}\) の元すべてを固定し、かつ \(\zeta\) を固定する」から、\(\bs{L}(\zeta)\) の元すべてを固定する。つまり \(h\) は \(G\,'\) の単位元であり、\(h=e\,'\) である。
ゆえに、準同型写像の像と核(42B)における核の定義によって、
\(\mr{Ker}\:\sg=e\,'\)
であり、核が単位元なら単射の定理(42C)によって、\(\sg\) は単射である。このことから、準同型定理(43A)により、
\(G\,'/\mr{Ker}\:\sg\:\cong\:\sg(G\,')\)
すなわち、
\(G\,'\:\cong\:\sg(G\,')\)
である。つまり \(\bs{G\,'}\) は \(\bs{G}\) の部分群 \(\bs{\sg(G\,')}\) と同型である。
\(G\) は可解群なので、可解群の部分群は可解群の定理(61C)によって、\(G\) の部分群である \(\sg(G\,')\) も可解群であり、さらにそれと同型である \(G\,'\) も可解群である。\(G\,'\) が可解群なので、可解群の定義により \(G\,'\) から \(e\,'\) に至る部分群の列、
\(G\,'=H_0\sp H_1\sp\cd\sp H_i\sp H_{i+1}\sp\cd\sp H_k=\{e\,'\}\)
があって、\(H_{i+1}\) は \(H_i\) の正規部分群であり、\(H_i/H_{i+1}\) は巡回群である。\(|G\,'|=m\) とおくと、\(G\,'\) は \(G\) の部分群である \(\sg(G\,')\) と同型なので、ラグランジュの定理(41E)によって、\(m\) は \(|G|=n\) の約数である。
ガロア対応(53B)による \(H_i\) の固定体を \(\bs{K}_i\) とすると、
\(\bs{K}(\zeta)=\bs{K}_0\subset\bs{K}_1\subset\cd\subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cd\subset\bs{K}_k=\bs{L}(\zeta)\)
という固定体の系列が定義できる。\(H_i/H_{i+1}\) は巡回群なので、\(\bs{K}_{i+1}/\bs{K}_i\) は巡回拡大である。\(\bs{L}(\zeta)/\bs{K}(\zeta)\) の拡大次数は、
\([\:\bs{L}(\zeta)\::\:\bs{K}(\zeta)\:]=|G\,'|=m\)
であり、\(n\) の約数である。
固定体の系列における一つの拡大 \(\bs{K}_{i+1}/\bs{K}_i\)を考える。その拡大次数 \([\:\bs{K}_{i+1}\::\:\bs{K}_i\:]=m_i\) は、拡大次数の連鎖律(33H)によって \([\:\bs{L}(\zeta)\::\:\bs{K}(\zeta)\:]=m\) の約数であり、従って \(n\) の約数である。
\(\bs{K}_i\) は \(1\) の原始\(n\)乗根 \(\zeta\) を含むから、\(\zeta^{\frac{n}{m_i}}\) も含んでいる。\(\zeta^{\frac{n}{m_i}}\) は \(1\) の原始\(m_i\)乗根である。つまり、\(\bs{K}_i\) は \(1\) の原始\(m_i\)乗根(\(m_i=[\:\bs{K}_{i+1}\::\:\bs{K}_i\:]\))を含む。従って、べき根拡大の十分条件の定理(73A)により、巡回拡大である \(\bs{K}_{i+1}/\bs{K}_i\) はべき根拡大である。
以上のことは \((0\leq i < k)\) のすべてで成り立つから、\(\bs{K}_i\) の系列は累べき根拡大である。
\(f(x)=0\) の解は \(\bs{L}\) に含まれるが、\(\bs{L}\:\subset\:\bs{L}(\zeta)\) だから \(f(x)=0\) の解は \(\bs{L}(\zeta)\) に含まれる。その \(\bs{L}(\zeta)\) は \(\bs{K}(\zeta)\) の累べき根拡大であり、また \(1\) の原始\(n\)乗根である \(\zeta\) は \(\bs{Q}\:(\in\bs{K})\) の元の四則演算とべき根で表現できるから(71A)、\(\bs{L}(\zeta)\) の元はすべて \(\bs{K}\) の元の四則演算とべき根で表現できる。従って \(f(x)=0\) の解も \(\bs{K}\) の元の四則演算とべき根で表現できる。[証明終]
この定理では「体 \(\bs{K}\) 上の方程式 \(f(x)=0\)」としましたが、もちろん、体 \(\bs{K}\) が 有理数体 \(\bs{Q}\) であっても同じです。以降、\(\bs{K}\) を \(\bs{Q}\) と書きます。
証明のポイントは、\(G=\mr{Gal}(\bs{L}/\bs{Q})\) とし、\(G\,'=\mr{Gal}(\bs{L}(\zeta)/\bs{Q}(\zeta))\) とするとき、\(G\,'\) が \(G\) の部分群と同型であることです。たとえば、\(f(x)\) が既約な3次多項式だと、\(G\cong S_3\) か \(G\cong C_3\) であり、基本的に \(G\,'\cong G\) です。しかし、そうならない場合もあります。たとえば \(f(x)=x^3-2\) では \(G\cong S_3\) ですが、
\(\bs{Q}\:\subset\:\bs{Q}(\omega)\:\subset\:\bs{Q}(\omega,\sqrt[3]{2})=\bs{L}\)
(\(\omega\) は \(1\) の原始3乗根)
という体の拡大列でわかるように、\(\bs{L}(\omega)=\bs{L}\) です。つまり、\(\bs{L}(\omega)/\bs{Q}(\omega)\) の拡大次数は \(3\) であり、\(\bs{L}/\bs{Q}\) の拡大次数の \(6\) とは違います。しかしそうであっても \(G\,'=\mr{Gal}(\bs{L}(\omega)/\bs{Q}(\omega))\cong C_3\) であり、\(G\,'\) は \(G\cong S_3\) の部分群と同型です。
\(G\,'\) は \(G\) の部分群と同型なので、\(G\) が可解群なら \(G\,'\) も可解群であり(61C)、\(\bs{L}(\omega)/\bs{Q}(\omega)\) は累巡回拡大であり(62C)、従って、累べき根拡大です(73A)。
さらに、\(1\) の原始\(n\)乗根が \(\bs{Q}\) の元の四則演算とべき根で表現できる(71A)ことも証明のポイントになっています。
この可解性の十分条件の定理(75A)によって、有理数係数の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) として、\(\mr{Gal}(\bs{L}/\bs{Q})\) が可解群のとき、\(f(x)=0\) の解は四則演算とべき根で表現可能なことが証明できました。
ここがゴールで「ガロア理論=可解性の必要十分条件」が完結しました。
7.6 位数2の巡回拡大は平方根拡大:正5角形が作図できる理由
可解性の必要十分条件の証明は前節で尽きていますが、これ以降は可解な方程式の代表的なものを取り上げ、ガロア群の分析をします。まず最初は、
\(x^5\) | \(-1=0\) | |
\(x^{17}\) | \(-1=0\) |
\(x^5-1=0\)
まず \(x^5-1=0\) の解を分析します。
\(x^5-1=(x-1)(x^4+x^3+x^2+x+1)\)
なので、\(1\) 以外の解を \(\zeta\) とすると、\(\zeta\) は4次方程式、
\(x^4+x^3+x^2+x+1=0\)
の解です。「7.1 1 の原始n乗根」で書いたように、この方程式の解は、
\(\zeta=\dfrac{1}{4}\left(-1+\sqrt{5}\pm\sqrt{-10-2\sqrt{5}}\right)\)
\(\zeta=\dfrac{1}{4}\left(-1-\sqrt{5}\pm\sqrt{-10+2\sqrt{5}}\right)\)
の4つであり、これが \(1\) の原始5乗根です。以下の論旨を明瞭にするために、虚数単位 \(i\) を使わずに、外側の \(\sqrt{\phantom{a}}\) の中を負の数にして記述しました。
この原始5乗根は、4次方程式の解であるにもかかわらず、四則演算と平方根 \(\sqrt{\phantom{a}}\) のみを使って表現されています。なぜそうなるのか、それをガロア理論にのっとって説明します。実は、\(p\) を素数としたとき、
原始\(\bs{p}\)乗根が四則演算と平方根 \(\bs{\sqrt{\phantom{a}}}\) のみで表現できれば、正 \(\bs{p}\)角形は定規とコンパスで作図可能である
ことが知られています。定規というのは「目盛りのない、与えられた2点を通る直線を引くことだけができる道具」であり、コンパスというのは「角度目盛りのない、与えられた2点のうちの1点を中心として別の点を通る円\(\cdot\)円弧を描くことだけができる道具」です。長さや角度を測ることはできません。作図可能の原理は次の項で説明します
\(f(x)=x^4+x^3+x^2+x+1\) とし、\(f(x)=0\) の解の一つを \(\zeta\) とすると、\(f(x)\) の最小分解体は \(\bs{Q}(\zeta)\) です。そのガロア群を、
\(G=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\)
と書くと、\(\zeta\) の最小多項式は \(f(x)\) なので(63C)、\(|G|=4\) です。また、\(\bs{\bs{Q}(\zeta)}\) のガロア群の定理(63E)により、\(G\) は既約剰余類群と同型で、
\(G\cong(\bs{Z}/5\bs{Z})^{*}\)
です。
\((\bs{Z}/5\bs{Z})^{*}=\{1,\:2,\:3,\:4\}\)
ですが、この群の生成元は \(2\) か \(3\) です。以下、生成元を \(2\) として話を進めると、
\(\begin{eqnarray}
&&\:\:(\bs{Z}/5\bs{Z})^{*}&=\{2,\:2^2,\:2^3,\:2^4\}\\
&&&=\{2,\:4,\:3,\:1\}\\
\end{eqnarray}\)
と表現できます。一方、\(f(x)=0\) の4つの解は、
\(\zeta,\:\:\zeta^2,\:\:\zeta^3,\:\:\zeta^4\)
です。そこで、
\(\sg(\zeta)=\zeta^2\)
で定義される自己同型写像を考えると、ガロア群は、
\(G=\{\sg,\:\sg^2,\:\sg^3,\:\sg^4=e\}\)
となり、位数 \(4\) の巡回群、かつ可解群です。また、体の拡大次数は、
\([\:\bs{Q}(\zeta):\bs{Q}\:]=4\)
です。
ガロア群 \(G\) には部分群が含まれています。つまり、
\(H=\{\sg^2,\:e\}\)
\(\sg^2(\zeta)=\zeta^4\)
と定義すると、\((\sg^2)^2=e\) なので \(H\) は部分群(\(\sg H=H\sg\) なので正規部分群)であり、位数 \(2\) の巡回群です。また、剰余群は、
\(G/H\cong\{e,\:\sg\}\)
です。従って、
\(G\:\sp\:H\:\:\sp\:\{\:e\:\}\)
\(G/H\) | \(\cong\{e,\:\sg\}\) | :位数 \(2\) | |
\(H/\{\:e\:\}\) | \(\cong H\) | :位数 \(2\) |
は可解列です。ガロア対応の定理(53B)により、この可解列に対応する拡大体の列があって、
\(G\sp H\sp\{\:e\:\}\)
\(\bs{Q}\subset\bs{F}\subset\bs{Q}(\zeta)\)
となります。\(\bs{F}\) は \(H\) の固定体であり、\(\bs{Q}(\zeta)\) の中間体です。すると、正規性定理(53C)により、
\(\mr{Gal}(\bs{F}/\bs{Q})\cong G/H\)
なので、\(\mr{Gal}(\bs{F}/\bs{Q})\) は位数 \(2\) の巡回群です。またガロア群の定義により、
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{F})\cong H\)
であり、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{F})\) も位数 \(2\) の巡回群です。従って、次数と位数の同一性の定理(52B)より拡大次数は、
\([\:\bs{F}\) | \(:\bs{Q}\:]=2\) | |
\([\:\bs{Q}(\zeta)\) | \(:\bs{F}\:]=2\) |
\(\bs{\bs{Q}(\zeta)}\) は \(\bs{\bs{Q}}\) からの平方根拡大を2回繰り返したものである
と結論づけられます。原始5乗根が四則演算と平方根 \(\sqrt{\phantom{a}}\) のみを使って表現できる理由がここにあります。
ここまでは、中間体 \(\bs{F}\) がどういう拡大体かに触れていませんが、\(\bs{F}\) を具体的に表現することもできます。\(\bs{F}\) は \(H=\{e,\:\sg^2\}\) の固定体なので、\(\bs{F}=\bs{Q}(\theta)\) として、
\(\sg^2(\theta)=\theta\)
となる \(\theta\) を探します。\(\theta\) の選び方には自由度があり、たとえば \(\theta=\zeta^4+\zeta\) としてもよいのですが、ここでは、
\(\theta=(\zeta^2-\zeta^3)(\zeta^4-\zeta)\)
とします。このように選ぶと、\(\sg^2(\zeta)=\zeta^4\) なので、
\(\begin{eqnarray}
&&\:\:\sg^2(\theta)&=(\zeta^8-\zeta^{12})(\zeta^{16}-\zeta^4)\\
&&&=(\zeta^3-\zeta^2)(\zeta-\zeta^4)=\theta\\
\end{eqnarray}\)
となって、\(\theta\) は \(\sg^2\) で不変です。と同時に、\(\sg(\zeta)=\zeta^2\) なので、
\(\begin{eqnarray}
&&\:\:\sg(\theta)&=(\zeta^4-\zeta^6)(\zeta^8-\zeta^2)\\
&&&=(\zeta^4-\zeta)(\zeta^3-\zeta^2)=-\theta\\
\end{eqnarray}\)
となります。ということは、
\(\sg(\theta^2)=(\sg(\theta))^2=(-\theta)^2=\theta^2\)
であり、\(\theta^2\) は \(\sg\) で不変、つまり \(G\) のすべての元で不変となり、\(\theta^2\) は有理数です。そこで、
\(\zeta^5=1\)
\(\zeta^4+\zeta^3+\zeta^2+\zeta+1=0\)
の関係を使って \(\theta^2\) を計算すると、
\(\begin{eqnarray}
&&\:\:\theta^2&=(\zeta^2-\zeta^3)^2(\zeta^4-\zeta)^2\\
&&&=(\zeta^4-2\zeta^5+\zeta^6)(\zeta^8-2\zeta^5+\zeta^2)\\
&&&=(\zeta^4-2+\zeta)(\zeta^3-2+\zeta^2)\\
&&&=\zeta^7-2\zeta^4+\zeta^6-2\zeta^3+4-2\zeta^2+\zeta^4-2\zeta+\zeta^3\\
&&&=\zeta^2-2\zeta^4+\zeta-2\zeta^3+4-2\zeta^2+\zeta^4-2\zeta+\zeta^3\\
&&&=-\zeta^4-\zeta^3-\zeta^2-\zeta+4\\
&&&=5\\
\end{eqnarray}\)
となり、確かに\(\theta^2\) は有理数であることが分かります。つまり、
\(\theta=\sqrt{5}\)
です。従ってガロア対応は、
\(G\sp H\) | \(\sp\{\:e\:\}\) | |
\(\bs{Q}\subset\bs{Q}(\sqrt{5})\) | \(\subset\:\bs{Q}(\zeta)\) |
となります。原始5乗根に \(\sqrt{-10+2\sqrt{5}}\) のような項が現れるのは、中間体が \(\bs{Q}(\sqrt{5})\) であるという、体の拡大構造からくるのでした。
ここまでの論証を振り返ってみると、
\(p\) を素数とし、原始\(p\)乗根を \(\zeta\) とすると、
\(|\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})|=|(\bs{Z}/p\bs{Z})^{*}|=p-1\)
なので、
\(p-1=2^k\:\:(1\leq k)\)
の条件があると、\(\bs{Q}\) から \(\bs{Q}(\zeta)\) に至る「平方根拡大」の列が存在し、\(\zeta\) は四則演算と平方根 \(\sqrt{\phantom{a}}\) だけで表現できる。従って 正 \(p\)角形は定規とコンパスで作図可能である
ことが分かります。この条件は \(p=3,\:5\) で成立しますが、その次に成立するのは \(p=17\) です。
\(x^{17}-1=0\)
\(1\) の原始\(17\)乗根を \(\zeta\) とします。\(p=17\) の最小原始根は \(3\) で(25D)、\((\bs{Z}/17\bs{Z})^{*}\) の位数は \(16\) です。\((\bs{Z}/17\bs{Z})^{*}\) において \(3\) の累乗は、
\(\phantom{1}3,\:\phantom{1}9,\:10,\:13,\:\phantom{1}5,\:15,\:11,\:16,\)
\(14,\:\phantom{1}8,\:\phantom{1}7,\:\phantom{1}4,\:12,\:\phantom{1}2,\:\phantom{1}6,\:\phantom{1}1\)
と、すべての元を巡回します。従って、
\(\sg(\zeta)=\zeta^3\)
という自己同型写像 \(\sg\) を定義すると、
\(G=\{\sg,\sg^2,\sg^3,\cd,\sg^{15},\sg^{16}=e\}\)
が \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) です。
\(x^5-1=0\) のときと同様の考察をすると、\(G\) には3つの部分群があります。
\(H_1=\{\sg^2,\sg^4,\sg^6,\sg^8,\sg^{10},\sg^{12},\sg^{14},e\}\)
\(\sg^2(\zeta)=\zeta^9\)
\(H_2=\{\sg^4,\sg^8,\sg^{12},e\}\)
\(\sg^4(\zeta)=\zeta^{13}\:\:(\phantom{1}9^2\equiv13\:\:(\mr{mod}\:17))\)
\(H_3=\{\sg^8,e\}\)
\(\sg^8(\zeta)=\zeta^{16}\:\:(13^2\equiv16\:\:(\mr{mod}\:17))\)
の3つで、
\(G\sp H_1\sp H_2\sp H_3\sp\{\:e\:\}\)
\(G\) | \(/H_1\) | \(\cong\{\sg^{\phantom{2}},\:e\}\) | |
\(H_1\) | \(/H_2\) | \(\cong\{\sg^2,\:e\}\) | |
\(H_2\) | \(/H_3\) | \(\cong\{\sg^4,\:e\}\) | |
\(H_3\) | \(/\{\:e\:\}\) | \(\cong\{\sg^8,\:e\}\) |
は可解列です。ガロア対応の定理(53B)により、\(H_1,\:H_2,\:H_3\) にはそれぞれに対応した固定体 \(\bs{F}_1,\:\bs{F}_2,\:\bs{F}_3\) があって、
\(G\sp H_1\sp H_2\sp H_3\sp\{\:e\:\}\)
\(\bs{Q}\subset\bs{F}_1\subset\bs{F}_2\subset\bs{F}_3\subset\bs{Q}(\zeta)\)
のガロア対応になります。\(\bs{Q}\) から \(\bs{Q}(\zeta)\) までの4つの拡大次数は、剰余群の位数に等しいのですべて \(2\) です。つまり、\(\bs{\bs{Q}(\zeta)}\) は \(\bs{\bs{Q}}\) からの「平方根拡大」を4回繰り返したものであり、原始\(17\)乗根は四則演算と平方根 \(\sqrt{\phantom{a}}\) のみを使って表現できます。従って正\(17\)角形は定規とコンパスで作図可能です。
これは、ドイツの大数学者\(\cdot\)ガウス(\(1777-1855\))が\(19\)才のときに発見した定理として有名です。
作図可能の原理
ここで改めて、平面上の図形が定規とコンパスで「作図可能」という意味を明確にします。ここで "定規" は「目盛りのない、与えられた2点を通る線を引くことだけができる道具」であり、"コンパス" は「角度目盛りのない、与えられた2点のうちの1点を中心として別の点を通る円\(\bs{\cdot}\)円弧を描くことだけができる道具」でした。
平面上の図形は点と線でできています。線は2点を与えると描けるので、「作図可能」の意味は「平面上で作図可能な点とは何か」を定義することに帰着します。
平面を複素平面(\(=\bs{C}\))として考えます。以降、
\(a,\:b\) | \(\in\:\bs{R}\) | |
\(\al,\:\beta\) | \(\in\:\bs{C}\) |
\(1,\:0\) は作図可能である。また複素平面の実軸と虚軸は作図できる。
![]() |
任意の線分を単位長さとし、端点を \(1,\:0\) とします。2点を結ぶ直線が実軸で、\(0\) を通り実軸と垂直な直線を作図するとそれが虚軸です。
\(\al=a+b\:i\) とすると、\(a,\:b\) が作図可能なら \(\al\) も作図可能である。また、\(\al\) が作図可能なら \(a,\:b\) も作図可能である。
![]() |
\(a\) が作図可能なら、\(-a\) も作図可能である。従って \(\al\) が作図可能なら \(-\al\) も作図可能である。
また \(a,\:b\) が作図可能なら \(a+b\) も作図可能である。従って、\(\al,\:\beta\) が作図可能なら \(\al+\beta\) も作図可能である。
![]() |
\(a,\:b\) が作図可能なら \(ab\)も作図可能である。従って \(\al,\:\beta\) が作図可能なら \(\al\beta\) も作図可能である。
![]() |
\(a\:\:(a\neq0)\) が作図可能なら \(a^{-1}\) も作図可能である。従って \(\al\:\:(\al\neq0)\) が作図可能なら \(\al^{-1}\) も作図可能である。
![]() |
作図可能な \(\al\) を \(\al=a+b\:i\) とすると、
\(\al^{-1}=\dfrac{a}{a^2+b^2}-\dfrac{b}{a^2+b^2}\:i\)
です。\(a,\:b\) が作図可能なので、その四則演算の結果は作図可能です。従って \(\al^{-1}\) も作図可能です。
有理数 \(\bs{Q}\) は作図可能である。
実数のなかで作図可能な点は四則演算で閉じています。かつ、\(0,\:1\) は作図可能です。従って有理数は作図可能です。
\(a\) が正の実数のとき、\(\sqrt{a}\) は作図可能である。
![]() |
\(a\) と \(-1\) を結ぶ線分を直径とする円を描き、虚軸との交点を \(x\cdot i\:(x\):実数) とすると、
\(1:x=x:a\)
なので、\(x=\pm\sqrt{a}\) です。従って \(\sqrt{a}\) は作図可能です。
\(\al\) を作図可能な複素数とするとき、\(\sqrt\al\) は作図可能である。
![]() |
極形式を使って、
\(\al=r(\mr{cos}\theta+i\cdot\mr{sin}\theta)\)
とすると、\(r\) は作図可能であり、つまり \(\sqrt{r}\) も作図可能です。また、角 \(\theta\) を2等分する線も、定規とコンパスで作図可能です。従って \(\sqrt\al\) は作図可能です。
\(\al,\:\beta\) が作図可能な複素数とするとき、2次方程式 \(x^2+\al x+\beta=0\) の解は作図可能である。
ある複素数 \(\al\) は、作図可能な複素数を係数とする2次方程式、あるいは1次方程式の解となるときのみ、作図可能である。
2次方程式 \(x^2+\al x+\beta=0\) の解は、根の公式により、係数 \(\al,\:\beta\) の四則演算と平方根で表わされます。従って作図可能です。
定規とコンパスで作図可能な点は、作図可能な円や直線の交点として求まる点です。2次元 \(xy\) 平面( \(\bs{R}^2\) )で考えると、直線と直線の交点は1次方程式の解です。また円と直線の交点は2次方程式の解です。円と円の交点がどうかですが、\(a,\:b,\:c,\:d\) を実数として、2つの円の方程式を、
\(x^2+y^2=a^2\)
\((\br{A})\)
\((x-b)^2+(y-c)^2=d^2\)
とします。\((\br{A}),\:(\br{B})\) の両辺を引き算して整理すると、 \((\br{B})\)
\(2bx+2cy-(b^2+c^2+a^2-d^2)=0\)
という直線の方程式になります。2つの円の交点は \((\br{A}),\:(\br{C})\) の連立方程式の解であり、2次方程式の解です。つまり、作図可能な実数は、作図可能な実数を係数とする2次方程式(あるいは1次方程式)の解となる実数です。 \((\br{C})\)
実数(\(a,\:b\))が作図可能と、複素数(\(a+bi\))が複素平面上で作図可能は同値です。従って、ある複素数 \(\al\) は、作図可能な複素数を係数とする2次方程式、あるいは1次方程式の解となるときのみ、作図可能です。
\(\bs{Q}\) の代数拡大体 \(\bs{K}\) があり、
\(\bs{Q}=\bs{K}_0\subset\bs{K}_1\subset\cd\subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cd\subset\bs{K}_n=\bs{K}\)
\([\:\bs{K}_{i+1}:\bs{K}_i\:]=2\:\:(0\leq i < n)\)
を満たす \(\bs{Q}\) から \(\bs{K}\) の拡大列が存在するとき、\(\bs{K}\) の元
\(\al\in\bs{K}\)
は作図可能である。
\([\:\bs{K}_{i+1}:\bs{K}_i\:]=2\) であれば、\(\bs{K}_{i+1}/\bs{K}_i\) は次数2のべき根拡大であり、
\(x^2-a=0\:\:\:(a\in\bs{K}_i)\)
の解、\(\sqrt{a}\) を用いて、
\(\bs{K}_{i+1}=\bs{K}_i(\sqrt{a})\)
と表されます。従って、\(\bs{K}_i\) の元が作図可能なら、\(\bs{K}_{i+1}\) の元は「作図可能な点の四則演算と平方根の組み合わせ」で表現できるので、作図可能です。体の拡大列の出発点である \(\bs{Q}\) の元は作図可能なので、到達点である \(\bs{K}\) の元も作図可能になります。
\(1\) の原始\(p\)乗根(\(p\):素数)を \(\zeta\) とすると、\(G=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) の位数は \(p-1\) であり、それが2の累乗であれば、\(G\) の可解列にガロア対応する体の拡大系列、
\(\bs{Q}=\bs{K}_0\subset\bs{K}_1\subset\cd\subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cd\subset\bs{K}_n=\bs{Q}(\zeta)\)
\([\:\bs{K}_{i+1}:\bs{K}_i\:]=2\:\:(0\leq i < n)\)
が存在します(前項での証明)。従って複素数平面上の点 \(\zeta\) は作図可能であり、正 \(p\)角形は作図可能です。条件に合致する素数は \(p=3\)、\(5\)、\(17\)、\(257\)、\(65537\)であることが知られています。これらの素数をフェルマ素数と呼びます。フェルマ素数 \(p\) とは、\(p-1\) が2の累乗であるような素数です。
さらに、一般の正 \(n\)角形が作図可能である条件は、次のようになります。
正 \(n\)角形は、
\(n=2^k\:\:\:(2\leq k)\)
\(n=2^k\cdot p_1p_2\cd p_r\:\:\:(0\leq k,\:\:1\leq r)\)
\(p_i\) は相異なるフェルマ素数
のとき、作図可能である。
[証明]
角度の2等分線は作図可能なので、\(n=2^k\:\:(2\leq k)\) のとき、正 \(n\)角形は作図可能である。と同時に、正 \(m\)角形が作図可能なとき、
\(n=2^k\cdot m\:\:(0\leq k)\)
とおくと、正 \(n\)角形は作図可能になる。\(p\) がフェルマ素数のとき、正 \(p\)角形は作図可能なので、
\(m_1\) と \(m_2\) を互いに素な3以上の数とするとき、正 \(m_1\) 角形と正 \(m_2\)角形が作図可能であれば、正 \(m\)角形(\(m=m_1m_2\))は作図可能である
ことが証明できれば十分である。
\(\theta,\:\theta_1,\:\theta_2\) を任意の角度とする。
\(\mr{sin}\theta=\sqrt{1-\mr{cos}^2\theta}\)
だから、\(\mr{cos}\theta\) が作図できれば \(\mr{sin}\theta\) も作図できる。また三角関数の加法定理より、
\(\mr{cos}(\theta_1+\theta_2)=\mr{cos}\theta_1\cdot\mr{cos}\theta_2-\mr{sin}\theta_1\cdot\mr{sin}\theta_2\)
なので、\(\mr{cos}\theta_1,\:\mr{cos}\theta_2\) が作図できれば \(\mr{cos}(\theta_1+\theta_2)\) も作図できる。このことから \(\mr{cos}\theta\) が作図できれば \(\mr{cos}(k\theta)\:\:(k\) は整数)も作図できる。
複素平面上で原点を中心とする半径1の円に正 \(m\)角形を描いたとき、その頂点の複素数は
\(\mr{cos}\left(\dfrac{2\pi}{m}k\right)+i\:\mr{sin}\left(\dfrac{2\pi}{m}k\right)\:\:(0\leq k\leq m-1)\)
である。\(k=1\) の点が作図できれば、残りの点が作図できるから、
\(\mr{cos}\left(\dfrac{2\pi}{m}\right)\)
が作図できれば、正 \(m\)角形は作図できる。
\(m_1\) と \(m_2\) は互いに素だから、不定方程式の解の存在の定理(21C)により、
\(k_1m_1+k_2m_2=1\)
を満たす \(k_1,\:k_2\) が存在する。両辺を \(m=m_1m_2\) で割ると
\(\dfrac{k_1}{m_2}+\dfrac{k_2}{m_1}=\dfrac{1}{m}\)
\(\dfrac{2\pi}{m_2}k_1+\dfrac{2\pi}{m_1}k_2=\dfrac{2\pi}{m}\)
が得られる。正 \(m_1\)角形と正 \(m_2\)角形 は作図できるから、
\(\mr{cos}\left(\dfrac{2\pi}{m_1}\right),\:\:\mr{cos}\left(\dfrac{2\pi}{m_2}\right)\)
は作図できる。従って
\(\mr{cos}\left(\dfrac{2\pi}{m_2}k_1+\dfrac{2\pi}{m_1}k_2\right)\)
は作図でき、
\(\mr{cos}\left(\dfrac{2\pi}{m}\right)\)
も作図できることになって、正 \(m\)角形は作図できる。[証明終]
証明の鍵は「\(m_1\) と \(m_2\) が互いに素」です。従って、正3角形が作図できても、正9角形は作図できません。正\(15\)角形なら作図できます。計算すると、作図可能な正 \(n\)角形(\(n\leq100\))は、
\(3\)、\(4\)、\(5\)、\(6\)、\(8\)、\(10\)、\(12\)、\(15\)、\(16\)、\(17\)、\(20\)、\(24\)、\(30\)、\(32\)、\(34\)、\(40\)、\(48\)、\(51\)、\(60\)、\(64\)、\(68\)、\(80\)、\(85\)、\(96\) |
です。「正\(50\)角形は作図できないが、正\(51\)角形は作図できる」というのも不思議な感じがします。
7.7 巡回拡大はべき根拡大:3次方程式が解ける理由
この節では可解な方程式がなぜ解けるのかを、3次方程式を例にとってガロア理論で説明します。また3次方程式の根の公式をガロア理論に沿った形て導出します。「7.5 可解性の十分条件」で証明したことは、
体 \(\bs{K}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とする。\(\mr{Gal}(\bs{L}/\bs{K})=G\) とし、\(G\) は可解群とする。このとき \(f(x)=0\) の解は四則演算とべき根で表現できる。
でした。この証明の核となっているのは「7.3 べき根拡大の十分条件」であり、それは、
1の原始\(n\)乗根を \(\zeta\) とし、代数体 \(\bs{\bs{K}}\) には \(\bs{\zeta}\) が含まれるとする。\(\bs{L}/\bs{K}\) をガロア拡大とし、\(\mr{Gal}(\bs{L}/\bs{K})\) が巡回群とする(= \(\bs{L}/\bs{K}\) が巡回拡大)。拡大次数は \([\bs{L}:\bs{K}]=n\) とする。このとき、\(\bs{L}\) は \(\bs{K}\) のべき根拡大である。
でした。このことを証明した論理展開は、次のようでした。
次の条件があるとする。
\(\bs{L}\) は \(\bs{K}\) の代数拡大体であり、拡大次元は \(n\) である。 | |
\(\bs{K}\) には \(1\) の原始\(n\)乗根が含まれる。 | |
\(\bs{L}/\bs{K}\) はガロア拡大である。 | |
\(\mr{Gal}(\bs{L}/\bs{K})\) は巡回群である(=\(\bs{L}/\bs{K}\) は巡回拡大) |
このとき、レゾルベント(分解式)を定義することで、
\(\al^n\) が \(\bs{K}\) の元であるような \(\bs{L}\) の元 \(\al\) が存在する。すなわち、\(x^n-a=0\:\:(a\in\bs{K})\) の解が \(\al\in\bs{L}\) | |
このとき \(\bs{L}=\bs{K}(\al)\) になり、従って \(\bs{L}/\bs{K}\) はべき根拡大 |
つまり、レゾルベントを使って、巡回拡大=べき根拡大(但し、体に \(1\) の原始\(n\)乗根が含まれることが条件)を証明したわけです。この証明プロセスを、具体的な3次方程式で順にたどります。まず、3次方程式のガロア群を再度整理します。
3次方程式のガロア群
3次方程式のガロア群は「1.3 ガロア群」で計算しましたが、改めて書きます。3次方程式のガロア群は、3次方程式の3つの解、\(\al,\:\beta,\gamma\) を入れ替える(置換する)群であり、一般的には、
\(G=\{e,\:\sg,\:\sg^2,\:\tau,\:\sg\tau,\:\sg^2\tau\}\)
です。3つの解をそれぞれ \(1,\:2,\:3\) の文字で表し、巡回置換の記法(6.5節)で書くと、
\(\sg\) | \(=(1,\:2,\:3)\) | |
\(\sg^2\) | \(=(1,\:3,\:2)\) | |
\(\tau\) | \(=(2,\:3)\) | |
\(\sg\tau\) | \(=(1,\:2)\) | |
\(\sg^2\tau\) | \(=(1,\:3)\) |
\(\tau\sg=(1,\:3)\)
であり、
\(\tau\sg=\sg^2\tau\)
との関係が成り立っています。これを "弱可換性" と呼ぶことにします(ここだけの用語です)。ここで、
\(H=\{e,\:\sg,\:\sg^2\}\)
という \(G\) の部分群を考えると、\(H\) は巡回群であると同時に \(G\) の正規部分群です。"弱可換性" を使って検証してみると、
\(\begin{eqnarray}
&&\:\:\tau H&=\{\tau,\:\tau\sg,\:\tau\sg^2\}\\
&&&=\{\tau,\:\sg^2\tau,\:\sg^2\tau\sg\}\\
&&&=\{\tau,\:\sg^2\tau,\:\sg^4\tau\}\\
&&&=\{\tau,\:\sg^2\tau,\:\sg\tau\}\\
&&&=\{\tau,\:\sg\tau,\:\sg^2\tau\}\\
&&&=H\tau\\
\end{eqnarray}\)
となります。つまり、
\(\tau H=H\tau\)
です。さらに、この式に左から \(\sg\) をかけると、
\(\sg\tau H=\sg H\tau\)
ですが、\(H\) のすべての元は \(\sg\) で表現できるので、\(\sg H=H\sg\) です。従って、
\(\sg\tau H=H\sg\tau\)
であり、同様にして、
\(\sg^2\tau H=H\sg^2\tau\)
も分かります。つまり、任意の \(\bs{G}\) の元 \(\bs{x\in G}\) について、\(\bs{xH=Hx}\) が成り立つので \(H\) は \(G\) の正規部分群です。
\(G\) の \(H\) による剰余群は、
\(G/H=\{H,\tau H\}\)
であり、単位元は \(H\) で、
\((\tau H)^2=\tau H\tau H=\tau\tau HH=H\)
となる、位数\(2\) の巡回群です(\(G/H\cong C_2)\)。この結果、
\(G\:\sp\:H\:\sp\:\{\:e\:\}\)
は可解列になり、\(G\) は可解群で、従って3次方程式は可解です(=四則演算とべき根で解が表現可能)。この節ではそれを具体例で確認していきます。
一方、「3.3 線形空間」の「代数拡大体の構造」で書いたように、3次方程式のガロア群が \(S_3\) ではなく、位数 \(3\) の巡回群( \(C_3\) )になる場合があります。それを再度整理します。
\(x^3+ax^2+bx+c=0\) の3次方程式は、\(x=X-\dfrac{a}{3}\) とおくと、
\(X^3+\left(b-\dfrac{a^2}{3}\right)X+\left(\dfrac{2}{27}a^3-\dfrac{1}{3}ab+c\right)=0\)
となって、2乗の項が消えます。従って以降、3次方程式を、
\(x^3+px+q=0\)
の形で扱います。
\(f(x)=x^3+px+q\)
とおき、\(f(x)\) は既約多項式とします。3次方程式の根を \(\al,\:\beta,\:\gamma\) とすると、
\(x^3+px+q=(x-\al)(x-\beta)(x-\gamma)\)
であり、根と係数の関係から、
\(\al+\beta+\gamma=0\)
\(\al\beta+\beta\gamma+\gamma\al=p\)
\(\al\beta\gamma=-q\)
です。3次方程式のガロア群が \(S_3\) か \(C_3\) かを決めるポイントとなるのは、
\(\theta=(\al-\beta)(\beta-\gamma)(\gamma-\al)\)
で定義される、根の差積と呼ばれる値です。差積は普通、\(\Delta\)(ギリシャ文字・デルタの大文字)で表しますが、後の説明の都合で \(\theta\) と書きます。差積は、任意の2つの根の互換で \(-\theta\) となるので、3つの根を \(\al,\:\beta,\:\gamma\) に割り当てる方法によって、\(\theta\) は2つの値をとり得ます。差積の2乗が判別式であり、
\(D=(\al-\beta)^2(\beta-\gamma)^2(\gamma-\al)^2\)
です。つまり \(\theta=\sqrt{D}\) と書けますが、\(\sqrt{D}\) は「2乗して \(D\) となる2つの数のどちらか」の意味です。\(D\) は \(\al,\:\beta,\:\gamma\) の任意の置換で不変な対称式なので、3次方程式の係数である \(p,\:q\) で表すことができる有理数です。
その \(D\) を方程式の係数で表すために、\(f(x)\) を微分します。
\(f(x)=(x-\al)(x-\beta)(x-\gamma)\)
なので、
\(\begin{eqnarray}
&&\:\:f\,'(x)=&(x-\al)(x-\beta)+(x-\beta)(x-\gamma)+\\
&&&(x-\gamma)(x-\al)\\
\end{eqnarray}\)
であり、
\(f\,'(\al)=(\al-\beta)(\al-\gamma)\)
\(f\,'(\beta)=(\beta-\gamma)(\beta-\al)\)
\(f\,'(\gamma)=(\gamma-\al)(\gamma-\beta)\)
となります。従って、
\(D=-f\,'(\al)f\,'(\beta)f\,'(\gamma)\)
です。一方、
\(f\,'(x)=3x^2+p\)
なので、
\(D=-(3\al^2+p)(3\beta^2+p)(3\gamma^2+p)\)
となります。ここからの計算を進めるために、次の2つの対称式を、根と係数の関係を使って \(p\) で表しておきます。
・\(\al^2+\beta^2+\gamma^2\)
\(=(\al+\beta+\gamma)^2-2(\al\beta+\beta\gamma+\gamma\al)\)
\(=-2p\)
・\(\al^2\beta^2+\beta^2\gamma^2+\gamma^2\al^2\)
\(=(\al\beta+\beta\gamma+\gamma\al)^2-2\al\beta\gamma(\al+\beta+\gamma)\)
\(=p^2\)
これを用いると、
\(\begin{eqnarray}
&&\:\:D&=&-(3\al^2+p)(3\beta^2+p)(3\gamma^2+p)\\
&&&=&-27(\al\beta\gamma)^2-9(\al^2\beta^2+\beta^2\gamma^2+\gamma^2\al^2)p\\
&&&&-3(\al^2+\beta^2+\gamma^2)p^2-p^3\\
&&&=&-27q^2-9\cdot p^2\cdot p-3\cdot(-2p)\cdot p^2-p^3\\
&&&=&-4p^3-27q^2\\
\end{eqnarray}\)
と計算できます。つまり、
\(D=-4p^3-27q^2\)
です。ここでもし、\(D\) がある有理数 \(a\) の2乗(\(D=a^2\))なら、
\(\theta=\sqrt{D}=\pm a\)
となり、\(\theta\) は有理数です。\(\theta\) が有理数(\(\theta=\pm a\))の場合、
\(f\,'(\al)=(\al-\beta)(\al-\gamma)\)
\(f\,'(\al)=3\al^2+p\)
の関係があるので、
\(\begin{eqnarray}
&&\:\:\theta&=(\al-\beta)(\beta-\gamma)(\gamma-\al)\\
&&&=-f\,'(\al)(\beta-\gamma)\\
&&&=-(3\al^2+p)(\beta-\gamma)\\
\end{eqnarray}\)
ですが、\(\theta=\pm a\) なので、
\(\beta-\gamma=\pm\dfrac{a}{3\al^2+p}\)
です。この式と、根と係数の関係である、
\(\beta+\gamma=-\al\)
を使うと、\(\bs{\beta}\) と \(\bs{\gamma}\) が \(\bs{\al}\) の有理式(=分母・分子が \(\bs{\al}\) の多項式)で表現できることになります。計算すると(\(\pm\)は省略して)、
\(\beta=\dfrac{2p\al+3q-a}{2(3\al^2+p)}\)
\(\gamma=\dfrac{2p\al+3q+a}{2(3\al^2+p)}\)
です(\(\beta\) と \(\gamma\) は逆でもよい)。\(\beta,\:\gamma\) が \(\al\) の有理式で表現できるので、
\(\bs{Q}(\al,\beta,\gamma)\subset\bs{Q}(\al)\)
であり、もちろん \(\bs{Q}(\al,\beta,\gamma)\sp\bs{Q}(\al)\) なので。
\(\bs{Q}(\al,\beta,\gamma)=\bs{Q}(\al)\)
です。\(\bs{Q}(\al)\) のところは \(\bs{Q}(\beta)\) や \(\bs{Q}(\gamma)\) とすることができます。
つまり、\(\bs{Q}\) 上の既約多項式 \(f(x)=x^3+px+q\) の最小分解体 \(\bs{L}=\bs{Q}(\al,\beta,\gamma)\) は、方程式の解の一つである \(\al\) の(または \(\beta,\:\gamma\) の)単拡大体であり、単拡大体の基底の定理(33F)により \(\bs{L}\) の次元は \(3\) です。すると次数と位数の同一性(52B)により、\(G=\mr{Gal}(\bs{L}/\bs{Q})\) の群位数は \(3\) です。従って、ラグランジュの定理(41E)により群位数が素数の群は巡回群なので、\(G\) は群位数 \(3\) の巡回群( \(C_3\) )です。
以上をまとめると、3次方程式の最小分解体のガロア群は、次のようになります。
前提として、
・\(f(x)=x^3+px+q\:\:(p,\:q\in\bs{Q})\)
( \(f(x)\) は既約多項式 )
・\(f(x)=0\) の解を \(\al,\:\beta,\:\gamma\)
・\(\theta=(\al-\beta)(\beta-\gamma)(\gamma-\al)\)
・\(f(x)\) の最小分解体を \(\bs{L}=\bs{Q}(\al,\beta,\gamma)\)
・\(G=\mr{Gal}(\bs{L}/\bs{Q})\)
とする。この前提のもとで、
\(\bs{\theta}\):有理数のとき
\(G\cong C_3\)
\(G=\{\:e,\:\sg,\:\sg^2\:\}\)
\(\sg=(1,\:2,\:3)\)
\(G\) は巡回群なので可解群
\(\bs{\theta}\):有理数でないとき
\(G\cong S_3\)
\(G=\{e,\:\sg,\:\sg^2,\:\tau,\:\sg\tau,\:\sg^2\tau\}\)
\(\sg=(1,\:2,\:3)\:\:\tau=(2,\:3)\)
\(H=\{e,\:\sg,\:\sg^2\}\) は \(G\) の正規部分群
\(G\:\sp\:H\:\:\sp\:\{\:e\:\}\) は可解列
\(G/H\) | \(=\{H,\:\tau H\}\) | \(\cong C_2\) | |
\(H/{e}\) | \(=H\) | \(\cong C_3\) |
なお、\((1,\:2,\:3)\:\:(2,\:3)\) の巡回置換は \((1,\:3,\:2)\:\:(1,\:2)\:\:(1,\:3)\) などとしても同じです。
\(C_3\::\:x^3-3x+1\)
まずガロア群が \(C_3\) の方程式 \(x^3-3x+1=0\) を取り上げ、巡回拡大がべき根拡大になる原理を確認します。この原理はガロア群が \(S_3\) のときにもそのまま応用できます。ちなみに \(C_3\) の方程式は \(p,\:q\) が \(-9\leq p\leq-1,\:\:1\leq q\leq9\) の整数だと、他に、
\(x^3-7x+6=0\:\:\:(D=400,\:\sqrt{D}=20)\)
\(x^3-7x+7=0\:\:\:(D=\phantom{0}49,\:\sqrt{D}=\phantom{0}7)\)
\(x^3-9x+9=0\:\:\:(D=729,\:\sqrt{D}=27)\)
があります。
\(x^3-3x+1=0\) の場合、\(p=-3,\:q=1\) なので、
\(\begin{eqnarray}
&&\:\:D&=-4p^3-27q^2=81=9^2\\
&&\:\:\theta&=\pm\sqrt{D}=\pm9\\
\end{eqnarray}\)
となります。3つの解を \(\al,\:\beta,\:\gamma\) とすると、
\(\bs{L}=\bs{Q}(\al,\beta,\gamma)=\bs{Q}(\al)=\bs{Q}(\beta)=\bs{Q}(\gamma)\)
で、\(\bs{L}\) の次元は \(3\) で、\(G=\mr{Gal}(\bs{L}/\bs{Q})\cong C_3\) です。
以下「7.3 べき根拡大の十分条件」の証明の論理に沿います。7.3 の証明では、体に \(1\) の原始\(n\)乗根が含まれているのが条件でした。そこで \(1\) の原始3乗根 を \(\omega\) とし、
\(\bs{Q}(\omega)\:\subset\:\bs{Q}(\omega,\:\al)=\bs{L}(\omega)\)
という体の拡大を考えます。\(\omega\) は \(x^2+x+1=0\) の2つある根のどちらかで、
\(\omega=\dfrac{1}{2}(-1\pm\sqrt{3}i)\)
です。7.3 ではラグランジュのレゾルベントを \(\al\) と書きましたが、方程式の根の表記との重複を避けるため、ここでは \(S\) とします。そうするとレゾルベントは、
\(S=c+\omega^2\sg(c)+\omega\sg^2(c)\)
\((\br{A})\)
です。\(\bs{Q}(\omega,\:\al)\) は \(\bs{Q}(\omega)\) に \(\al\) を添加した単拡大体なので、べき根拡大の十分条件のため補題2(72B)に従って、\(c=\al\) と定めます。そうすると、
\(S=\al+\omega^2\sg(\al)+\omega\sg^2(\al)\)
となり、\(\al,\:\beta,\:\gamma\) で表すと、\((\br{A})\) 式は、
\(S=\al+\omega^2\beta+\omega\gamma\)
\((\br{B})\)
です。この \(S\) は \(\bs{Q}(\omega,\al,\beta,\gamma)\) の元ですが、
\(\bs{Q}(\omega,\al,\beta,\gamma)=\bs{Q}(\omega,\al)\)
なので、\(S\) は \(\bs{Q}(\omega,\al)\) の元であり、ということは、
\(\bs{Q}(\omega,\:S)\subset\bs{Q}(\omega,\al)\)
です。方程式の3つの解を \(\al,\:\beta,\:\gamma\) に割り当てる方法の数(\(=3!\) )により、\(S\) は6通りの可能性があります。
7.3 での証明のポイントは、\(\bs{S^3}\) が \(\bs{\bs{Q}(\omega)}\) の元である、というところでした。それを計算で確かめるため、もうひとつのレゾルベントを導入します。ガロア群 \(G=\{e,\sg,\sg^2\}\) は、\(\sg\) が生成元であると同時に、\(\sg^2\) も生成元です。レゾルベントの定義における \(\sg\) は \(G\) の生成元であることが条件でした(73A)。そこで \((\br{A})\) 式の \(\sg\) を \(\sg^2\) で置き換えた式を \(T\) とすると、
\(\begin{eqnarray}
&&\:\:T&=c+\omega^2\sg^2(c)+\omega\sg^4(c)\\
&&&=c+\omega^2\sg^2(c)+\omega\sg(c)\\
\end{eqnarray}\)
となります。この式で \(c=\al\) とおくと
\(T=\al+\omega\beta+\omega^2\gamma\)
です。\(S\) には6通りの可能性がありますが、\(S\) をそのうちの一つに決めると \(T\) は一意に決まります。ここで、
\(\al+\omega^2\beta\) | \(+\omega\gamma\) | \(=S\) | |
\(\al+\omega\beta\) | \(+\omega^2\gamma\) | \(=T\) | |
\(\al+\beta\) | \(+\gamma\) | \(=0\) (根と係数の関係) |
\(\al=\dfrac{1}{3}(S+T)\)
\(\beta=\dfrac{1}{3}(\omega S+\omega^2T)\)
\(\gamma=\dfrac{1}{3}(\omega^2S+\omega T)\) \((\br{C})\)
です。さらに、\(S\) と \(T\) には特別の関係があります。
\(ST=(\al+\omega^2\beta+\omega\gamma)(\al+\omega\beta+\omega^2\gamma)\)
という式を考えると、
\(\begin{eqnarray}
&&\:\:ST&=&\al^2+\beta^2+\gamma^2+\\
&&&&(\omega^2+\omega)\al\beta+(\omega^4+\omega^2)\beta\gamma+(\omega^2+\omega)\gamma\al\\
&&&=&(\al+\beta+\gamma)^2-2(\al\beta+\beta\gamma+\gamma\al)+\\
&&&&(-\al\beta-\beta\gamma-\gamma\al)\\
&&&=&-3(\al\beta+\beta\gamma+\gamma\al)\\
&&&=&-3p\\
\end{eqnarray}\)
となり、つまり、
\(ST=-3p\)
\((\br{D})\)
という関係です。上の式の変形では、根と係数の関係と \(\omega^2+\omega+1=0\)、および \(\omega^3=1\) を使いました。
次に、\(S^3\) を求めるために \(S^3+T^3\) を計算してみると、
\(\begin{eqnarray}
&&\:\:S^3+T^3&=(S+T)(S^2-ST+T^2)\\
&&&=(S+T)(S+\omega T)(S+\omega^2T)\\
\end{eqnarray}\)
です。ここで \((\br{C})\) 式を変形すると、
\(3\al\) | \(=S+T\) | |
\(3\omega^2\beta\) | \(=S+\omega T\) | |
\(3\omega\gamma\) | \(=S+\omega^2T\) |
\(\begin{eqnarray}
&&\:\:S^3+T^3&=3\al\cdot3\omega^2\beta\cdot3\omega\gamma\\
&&&=27\al\beta\gamma=-27q\\
\end{eqnarray}\)
となります。まとめると、
\(S^3+T^3=-27q\)
\(ST=-3p\)
であり、
\(S^3-\dfrac{27p^3}{S^3}+27q=0\)
です。つまり、
\((S^3)^2+27qS^3-27p^3=0\)
\((\br{E})\)
という \(S^3\) についての2次方程式を解くことで \(S^3\) が求まり、そこから \(S\) が求まります。\(S\) の値の可能性は6通りです。また \(T^3\) についても、
\((T^3)^2+27qT^3-27p^3=0\)
\((\br{E}')\)
が成り立ちます。2次方程式、
\(X^2+27qX-27p^3=0\)
\((\br{F})\)
の2つの解が \(S^3\) と \(T^3\) です。
ここまでの計算は \(x^3+px+q=0\) の形の既約方程式なら成り立ちます。ここで \(x^3-3x+1=0\) に即した、\(p=-3,\:q=1\) を \((\br{E})\) 式に入れると、
\((S^3)^2+27S^3+27^2=0\)
\(\begin{eqnarray}
&&\:\:S^3&=\dfrac{1}{2}\left(-27\pm\sqrt{27^2-4\cdot27^2}\right)\\
&&&=27\dfrac{-1\pm i\sqrt{3}}{2}\\
&&&=27\omega\\
\end{eqnarray}\)
となります。最後の式の \(\omega\) は、2つある \(1\) の原始3乗根のどちらか、という意味にとらえます。\(S^3=27\omega\) なら \(T^3=27\omega^2\) で、その逆でもよいわけです。
\((\br{C})\) 式と \((\br{D})\) 式により、\(\al\) は \(S\) と \(\omega\) の四則演算で表現できます。つまり、
\(\bs{Q}(\omega,\al)\subset\bs{Q}(\omega,\:S)\)
です。従って、さきほどの \(\bs{Q}(\omega,\:S)\subset\bs{Q}(\omega,\:\al)\) と合わせると、
\(\bs{Q}(\omega,\:S)=\bs{Q}(\omega,\:\al)\)
です。以上をまとめると、レゾルベント \(S\) について、
\(\begin{eqnarray}
&&\:\:S^3&\in\bs{Q}(\omega)\\
&&\:\:S&\in\bs{Q}(\omega,\:S)=\bs{Q}(\omega,\:\al)\\
\end{eqnarray}\)
です。つまり、
\(\bs{Q}(\omega)\) 上の方程式、
\(x^3-a=0\:\:(\:a=27\omega\in\bs{Q}(\omega)\:)\)
の解の一つ、\(\sqrt[3]{a}\) を \(\bs{Q}(\omega)\) に添加したのが \(\bs{Q}(\omega,\:\al)\)
であり、\(\bs{\bs{Q}(\omega,\:\al)}\) は \(\bs{\bs{Q}(\omega)}\) のべき根拡大体であることがわかりました。\(\bs{Q}(\omega,\:\al)\) は \(x^3-a=0\) の解、\(\sqrt[3]{a},\:\sqrt[3]{a}\:\omega,\:\sqrt[3]{a}\:\omega^2\) の全部を含むので、\(\bs{Q}(\omega)\) のガロア拡大体です。結論として、
方程式 \(x^3-3x+1=0\) の解は、
の四則演算で表現できる
有理数 | |
\(\omega\)(\(1\) の原始3乗根) | |
\(\sqrt[3]{a}\:\:(\:a\in\bs{Q}(\omega)\:)\) |
ことになります。\(x^3-3x+1=0\) の場合、\(a=27\omega\) です。
巡回拡大がべき根拡大になることの証明のフォローはここまでですが、\(x^3-3x+1=0\) の解を具体的に求めることもできます。\(S^3=27\omega\) から、\(S=3\cdot\sqrt[3]{\omega}\) であり、また \(ST=9\) なので、
\(\begin{eqnarray}
&&\:\:\al&=\dfrac{1}{3}(S+T)=\dfrac{1}{3}\left(S+\dfrac{9}{S}\right)\\
&&&=\sqrt[3]{\omega}+\dfrac{1}{\sqrt[3]{\omega}}=\sqrt[3]{\omega}+\sqrt[3]{\omega^2}\\
&&&=\sqrt[3]{-\dfrac{1}{2}+\dfrac{\sqrt{3}}{2}i}+\sqrt[3]{-\dfrac{1}{2}-\dfrac{\sqrt{3}}{2}i}\\
\end{eqnarray}\)
が解の一つです。「1.3 ガロア群」の「ガロア群の例」に書いたように、
\(\al=1.53208888623796\:\cd\)
であり、正真正銘の正の実数ですが、\(\bs{\al}\) をべき根で表わそうとすると虚数単位が登場します。その理由がガロア理論から分かるのでした。
\(S_3\::\:x^3+px+q\)
方程式 \(x^3+px+q=0\) の係数を変数のままで扱い、ガロア群が \(S_3\) の方程式の一般論として話を進めます。3つの根を \(\al,\:\beta,\:\gamma\) とし(置換での表示では、それぞれ \(1,\:2,\:3\))、差積 \(\theta\) を、
\(\begin{eqnarray}
&&\:\:\theta&=(\al-\beta)(\beta-\gamma)(\gamma-\al)\\
&&&=\sqrt{D}\\
&&\:\:D&=-4p^3-27q^2\\
\end{eqnarray}\)
と定義すると、\(\bs{\theta}\) が有理数でないとき、
\(G\cong S_3\) \(G=\{e,\:\sg,\:\sg^2,\:\tau,\:\sg\tau,\:\sg^2\tau\}\) \(\sg=(1,\:2,\:3)\:\:\tau=(2,\:3)\) \(H=\{e,\:\sg,\:\sg^2\}\) は \(G\) の正規部分群 \(G\:\sp\:H\:\:\sp\:\{\:e\:\}\) は可解列 \(G/H=\{H,\:\tau H\}\cong C_2\) \(H/{\:e\:}=H\cong C_3\) \(G\) は可解群 |
となります(前述)。\(G\cong S_3\) は巡回群ではありません。しかし可解群なので "巡回群の入れ子構造" になっていて(=可解列が存在する)、「巡回拡大はべき根拡大」の定理(73A)を2段階に使うことで、方程式の解が四則演算とべき根で表現できることを証明できます。
まず、上記の可解列とガロア対応(53B)になっている「体の拡大列」は何かです。具体的には \(H\) の固定体は何かですが、それは \(\bs{Q}(\theta)\) です。実際、
\(\sg(\theta)=\theta,\:\:\sg^2(\theta)=\theta\)
なので、\(H\) のすべての元は \(\bs{Q}(\theta)\) の元を固定します。また、
\(\tau(\theta)=-\theta\)
なので、\(\tau\)(および \(\sg\tau,\:\sg^2\tau\))は \(\bs{Q}(\theta)\) の元 を固定しません。従って、\(H\) の固定体は \(\bs{Q}(\theta)\) です。つまり、\(\bs{L}=\bs{Q}(\al,\beta,\gamma)\) と書くと、
\(G\:\sp\:H\:\) | \(\:\sp\:\{\:e\:\}\) | |
\(\bs{Q}\:\subset\:\bs{Q}(\theta)\:\) | \(\:\subset\:\bs{L}\) |
というガロア対応になっています。
次に体の拡大次元を検証します。まず、\(|G|=6\) なので、次数と位数の同一性(52B)により、\(\bs{L}/\bs{Q}\) の拡大次数は、
\([\:\bs{L}:\bs{Q}\:]=6\)
です。\(\bs{Q}(\theta)\) は \(\bs{Q}\) 上の既約な2次方程式、
\(x^2-D=0\)
の解である \(\theta\) で \(\bs{Q}\) を単拡大した体なので、単拡大体の基底の定理(33F)により、
\([\:\bs{Q}(\theta):\bs{Q}\:]=2\)
です。そうすると、拡大次数の連鎖律(33H)により、
\([\:\bs{L}:\bs{Q}\:]=[\:\bs{L}:\bs{Q}(\theta)\:]\cdot[\:\bs{Q}(\theta):\bs{Q}\:]\)
\([\:\bs{L}:\bs{Q}(\theta)\:]=3\)
となるはずです。\([\:\bs{L}:\bs{Q}(\theta)\:]=3\) であることを、具体的な体の拡大の様子を検証することで確かめます。2つのことを証明します。
\(\bs{L}=\bs{Q}(\al,\beta,\gamma)\) とするとき、\(\bs{Q}(\theta,\al)=\bs{L}\) である。
[証明]
\(\theta=(\al-\beta)(\beta-\gamma)(\gamma-\al)\) だから、\(\theta\) は \(\al,\:\beta,\:\gamma\) で表現されている。従って
\(\bs{Q}(\theta,\al)\:\subset\:\bs{Q}(\al,\beta,\gamma)\)
である。この逆である、
\(\bs{Q}(\al,\beta,\gamma)\:\subset\:\bs{Q}(\theta,\al)\)
であることを証明する。そのためには \(\beta,\:\gamma\) が「有理数と \(\theta,\:\al\) の四則演算」で表現できることを示せばよい。根と係数の関係により、
\(\beta+\gamma=-\al\)
\(\beta\gamma=-\dfrac{q}{\al}\) \((\br{G})\)
である。これを利用して \(\theta\) の定義式を変形すると、
\(\begin{eqnarray}
&&\:\:\theta=&(\al-\beta)(\beta-\gamma)(\gamma-\al)\\
&&&=(\beta-\gamma)(-\al^2+(\beta+\gamma)\al-\beta\gamma)\\
&&&=(\beta-\gamma)\left(-\al^2-\al^2+\dfrac{q}{\al}\right)\\
&&&=(\beta-\gamma)\dfrac{-2\al^3+q}{\al}\\
\end{eqnarray}\)
となり、
\(\beta-\gamma=\dfrac{\al\theta}{q-2\al^3}\)
である。\((\br{G})\) 式と \((\br{H})\) 式は \(\beta\) と \(\gamma\) についての連立1次方程式なので解が求まり、\(\beta\) と \(\gamma\) は \(\al,\:\theta,\:q\) の四則演算で表現できる。従って、 \((\br{H})\)
\(\bs{Q}(\al,\beta,\gamma)\:\subset\:\bs{Q}(\theta,\al)\)
であり、\(\bs{Q}(\theta,\al)\:\subset\:\bs{Q}(\al,\beta,\gamma)\) と合わせて、
\(\bs{Q}(\theta,\al)=\bs{Q}(\al,\beta,\gamma)\)
である。[証明終]
\(x^3+px+q\) は \(\bs{\bs{Q}(\theta)}\) 上の既約多項式である。
[証明]
\(\bs{Q}\) 上の既約な3次方程式 \(x^3+px+q=0\) の解 \(\al\) による \(\bs{Q}\) の単拡大体 \(\bs{Q}(\al)\) を考えると、単拡大体の基底の定理(33F)により、
\([\:\bs{Q}(\al):\bs{Q}\:]=3\)
である。従って \(\al\notin\bs{Q}(\theta)\) である。なぜなら、もし \(\al\in\bs{Q}(\theta)\) なら \(\bs{Q}(\theta)\) の次元は \(3\) 以上になるが、\([\:\bs{Q}(\theta):\bs{Q}\:]=2\) なので矛盾が生じるからである。同様に、\(\beta,\:\gamma\notin\bs{Q}(\theta)\) である。\(x^3+px+q\) は、
\(x^3+px+q=(x-\al)(x-\beta)(x-\gamma)\)
と表されるから、\(x^3+px+q\) は \(\bs{Q}(\theta)\) 上では因数分解できない。つまり \(x^3+px+q\) は \(\bs{Q}(\theta)\) 上の既約多項式である。[証明終]
以上により、
\(\bs{L}=\bs{Q}(\al,\beta,\gamma)\) は、\(\bs{\bs{Q}(\theta)}\) 上の既約な3次方程式 \(x^3+px+q=0\) の解の一つである \(\al\) を \(\bs{Q}(\theta)\) に添加した単拡大体、\(\bs{L}=\bs{Q}(\theta,\al)\) であり、その拡大次数は \([\:\bs{L}:\bs{Q}(\theta)\:]=\:3\) である
ことが検証できました。これを踏まえて、3次方程式が解ける理由をガロア理論で説明します。ガロア対応である、
\(G\:\sp\:H\:\) | \(\:\sp\:\{\:e\:\}\) | |
\(\bs{Q}\:\subset\:\bs{Q}(\theta)\:\) | \(\:\subset\:\bs{L}\) |
を2つの部分に分けます。
\(\bs{Q}\:\subset\:\bs{Q}(\theta)\)
\(\mr{Gal}(\bs{Q}(\theta)/\bs{Q})\cong G/H\cong C_2\) であり、\(\bs{Q}(\theta)/\bs{Q}\) は巡回拡大で、拡大次数は \(2\) です。\(1\) の原始2乗根は \(-1\) であり、\(\bs{Q}\) に含まれています。従って \(\bs{Q}(\theta)/\bs{Q}\) はべき根拡大です。具体的には、
\(x^2-D=0\:\:(D\in\bs{Q})\)
\(D=-4p^3-27q^2\)
の解が \(\theta\) であり、
\(\theta=\sqrt{D}=\sqrt{-4p^3-27q^2}\)
です。これはレゾルベントを持ち出すまでもなく分かります。
\(\bs{Q}(\theta)\:\subset\:\bs{L}\)
\(\mr{Gal}(\bs{L}/\bs{Q}(\theta))=H\cong C_3\) であり、\(\bs{L}/\bs{Q}(\theta)\) は巡回拡大で、拡大次数は \(3\) です。また \(\bs{L}\) は \(\bs{Q}(\theta)\) 上の既約な3次方程式 \(x^3+px+q=0\) の解の一つである \(\al\) を \(\bs{Q}(\theta)\) に添加した単拡大体で、\(\bs{L}=\bs{Q}(\theta,\al)\) でした。
\(\bs{Q}(\theta)\) には(一般には)\(1\) の原始3乗根が含まれていません。そこで、\(\bs{L}/\bs{Q}(\theta)\) の体の拡大の代わりに、\(\bs{L}(\omega)/\bs{Q}(\omega,\theta)\) という拡大を考えます。
\(\bs{L}(\omega)=\bs{Q}(\omega,\theta,\al)\)
\([\:\bs{Q}(\omega,\theta,\al):\bs{Q}(\omega,\theta)\:]=3\)
です。 \((\br{I})\)
方程式によっては \(\theta\in\bs{Q}(\omega)\) の場合があります。たとえば、\(p=0\) だと、
\(\theta=\sqrt{-27q^2}=3\sqrt{3}i\cdot q\)
ですが、\(\omega=\dfrac{1}{2}(-1\pm\sqrt{3}i)\) なので、\(\theta\in\bs{Q}(\omega)\) です。この場合は、
\(\bs{Q}(\omega,\theta)=\bs{Q}(\omega)=\bs{Q}(\theta)\)
ですが、\((\br{I})\) 式は成り立ちます。レゾルベント \(S,\:T\) を導入して \(S^3\) と \(T^3\) を求めます。計算は、方程式 \(x^3-3x+1=0\) のときと全く同じです。つまり、
\(S=\al+\omega^2\beta+\omega\gamma\)
\(T=\al+\omega\beta+\omega^2\gamma\) \((\br{B})\)
\(ST=-3p\)
\(S^3+T^3=-27q\) \((\br{D})\)
\(\al=\dfrac{1}{3}(S+T)\)
\(\beta=\dfrac{1}{3}(\omega S+\omega^2T)\)
\(\gamma=\dfrac{1}{3}(\omega^2S+\omega T)\) \((\br{C})\)
\(X^2+27qX-27p^3=0\)
の2つの解が \(S^3\) と \(T^3\) \((\br{F})\)
です。方程式 \(x^3-3x+1=0\) の場合、\(\bs{L}(\omega)\) は \(\bs{Q}(\omega)\) からの巡回拡大でしたが、\(x^3-3p+1q=0\) では \(\bs{Q}(\omega,\theta)\) からの巡回拡大であり、ガロア群が位数 \(3\) の巡回群であるという点では全く同じなのです。
\((\br{F})\) 式から \(X\) を求めると、
\(\begin{eqnarray}
&&\:\:X&=\dfrac{1}{2}\left(-27q\pm\sqrt{27^2q^2+27\cdot4p^3}\right)\\
&&&=\dfrac{1}{2}\left(-27q\pm\sqrt{-27\theta^2}\right)\\
&&&=\dfrac{1}{2}(-27q\pm3\sqrt{3}i\cdot\theta)\\
\end{eqnarray}\)
となるので、
\(S^3=\dfrac{1}{2}(-27q+3\sqrt{3}i\cdot\theta)\)
\(T^3=\dfrac{1}{2}(-27q-3\sqrt{3}i\cdot\theta)\)
となります。\(S^3\) と \(T^3\) は逆でもかまいません。\(\omega\) は \(1\) の原始3乗根で、
\(\omega=\dfrac{1}{2}(-1\pm\sqrt{3}i)\)
のどちらかです。従って、
\(\sqrt{3}i\in\bs{Q}(\omega,\theta)\)
です。つまり、
\(S^3,\:\:T^3\in\bs{Q}(\omega,\theta)\)
であることがわかりました。従って、\(S,\:T\) は \(\bs{Q}(\omega,\theta)\) 上の3次方程式、\(x^3-a=0\:\:(a\in\bs{Q}(\omega,\theta))\) の解ということになり、\(\bs{Q}(\omega,\theta,\:S)/\bs{Q}(\omega,\theta)\) の体の拡大を考えると、
\([\:\bs{Q}(\omega,\theta,\:S):\bs{Q}(\omega,\theta)\:]=3\)
です。\(\bs{Q}(\omega,\theta,\:S)\) は \(\bs{Q}(\omega,\theta,\:T)\) としても同じことです。ここで、 \((\br{J})\)
\(\bs{Q}(\omega,\theta,\:S)=\bs{Q}(\omega,\theta,\:\al)\)
であることが次のようにして分かります。つまり、\(\bs{Q}(\omega,\theta)\) 上の既約な3次方程式 \(x^3+px+q=0\) の解が \(\al,\:\beta,\:\gamma\) であり、\((\br{B})\) 式により \(S\) は \(\al,\:\beta,\:\gamma,\:\omega\) の四則演算で表されているので、
\(S\in\bs{Q}(\omega,\theta,\al,\beta,\gamma)\)
であり、また、
\(\bs{Q}(\omega,\theta,\al,\beta,\gamma)=\bs{Q}(\omega,\theta,\al)\)
だったので、
\(S\in\bs{Q}(\omega,\theta,\al)\)
です。このことから、
\(\bs{Q}(\omega,\theta,\:S)\subset\bs{Q}(\omega,\theta,\:\al)\)
です。\((\br{I})\) 式と \((\br{J})\) 式により、\(\bs{Q}(\omega,\theta,\:S)\) と \(\bs{Q}(\omega,\theta,\:\al)\) の次元は等しく、かつ \((\br{K})\) 式の関係があるので、体の一致の定理(33I)により2つの体は一致し、 \((\br{K})\)
\(\bs{Q}(\omega,\theta,\:S)=\bs{Q}(\omega,\theta,\:\al)\)
です。
この説明は「7.3 べき根拡大の十分条件」の証明に従いましたが、3次方程式の場合は、\((\br{C})\) 式と \((\br{D})\) 式により、\(\al,\:\beta,\:\gamma\) が \(S\) と \(\omega\) の四則演算で表現できます。従って、
\(\bs{Q}(\omega,\theta,\al,\beta,\gamma)\subset\bs{Q}(\omega,\theta,S)\)
\(\bs{Q}(\omega,\theta,\al)\subset\bs{Q}(\omega,\theta,S)\)
であり、
\(\bs{Q}(\omega,\theta,S)\subset\bs{Q}(\omega,\theta,\al)\)
と合わせて
\(\bs{Q}(\omega,\theta,\:S)=\bs{Q}(\omega,\theta,\:\al)\)
である、とするのが簡便な説明になります。
以上をまとめると、
\(\bs{Q}(\omega,\theta)\) 上の3次方程式、\(x^3-a=0\:\:(a\in\bs{Q}(\omega,\theta))\) の解の一つ、\(S\) を \(\bs{Q}(\omega,\theta)\) に添加したべき根拡大体が \(\bs{Q}(\omega,\theta,\al)=\bs{L}(\omega)\) である
となり、体に \(\bs{\omega}\) が含まれる前提で、巡回拡大はべき根拡大であることが検証できました。ここから、\(\bs{L}(\omega)\) を \(\bs{Q}\) の拡大体として、方程式の係数 \(p,\:q\) を使って、できるだけ簡潔な形で表してみます。
\(\begin{eqnarray}
&&\:\:\theta&=\sqrt{-4p^3-27q^2}\\
&&&=6\cdot\sqrt{3}i\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}\\
\end{eqnarray}\)
ですが、\(\sqrt{3}i\in\bs{Q}(\omega)\) なので、
\(\bs{Q}(\omega,\theta)=\bs{Q}\left(\omega,\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}\right)\)
と表せます。また、
\(\begin{eqnarray}
&&\:\:X^3&=\dfrac{1}{2}\left(-27q+\sqrt{27^2q^2+27\cdot4p^3}\right)\\
&&&=\dfrac{1}{2}\left(-27q+27\cdot2\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}\right)\\
&&&=27\left(-\dfrac{q}{2}+\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}\right)\\
\end{eqnarray}\)
なので、
\(S=3\cdot\sqrt[3]{-\dfrac{q}{2}+\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\)
\(T=3\cdot\sqrt[3]{-\dfrac{q}{2}-\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\)
が \(S,\:T\) です。\(\sqrt[3]{\phantom{I}\cd\phantom{I}}\) は3乗して \(\cd\) になる数の意味です。従って、\(S\) の選び方は3通りですが、\(S\) を一つに決めると、
\(ST=-3p\)
が成り立つように \(T\) を選ぶ必要があります。以上の \(S\) を用いて \(\bs{L}(\omega)\) を表すと、
\(\bs{L}(\omega)\)
\(=\bs{Q}(\omega,\theta,\al,\beta,\gamma)=\bs{Q}(\omega,\theta,\al)=\bs{Q}(\omega,\theta,S)\)
\(=\bs{Q}\left(\omega,\:\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}},\:\sqrt[3]{-\dfrac{q}{2}+\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\right)\)
となります。この式が意味するところは、
\(\dfrac{q^2}{4}+\dfrac{p^3}{27}\) が有理数なので、\(\bs{L}(\omega)\) は \(\bs{Q}(\omega)\) からのべき根拡大を、\(\sqrt{\phantom{A}}\) と \(\sqrt[3]{\phantom{A}}\) の2回繰り返したものである
ということです。べき根拡大の出発点は 有理数に \(\omega\) を添加した体です。「7.1 1の原始n乗根」で証明したように、原始\(n\)乗根はべき根で表現可能であり(71A)、もちろん \(\omega\) もそうです。これが3次方程式が解ける原理(一般化するとガロア群が可解群である方程式が解ける原理)です。補足すると、\(p=0\) のときは、
\(\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}=\pm\dfrac{q}{2}\in\bs{Q}\)
なので、べき根拡大は \(\sqrt[3]{\phantom{A}}\) の1回だけになります。
さらに、ここまでの計算で3次方程式の解も求まりました。解は、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&\al=\dfrac{1}{3}(S+T)&\\
&&\beta=\dfrac{1}{3}(\omega S+\omega^2T)&\\
&&\gamma=\dfrac{1}{3}(\omega^2S+\omega T)&\\
\end{eqnarray}
\end{array}\right.\)
であり、記号を、
\(S=3s\)
\(T=3t\)
に置き換えると、
3次方程式の解の公式
\(x^3+px+q=0\) の3つの解を \(\al,\:\beta,\:\gamma\) とする。
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&\al=s+t&\\
&&\beta=\omega s+\omega^2t&\\
&&\gamma=\omega^2s+\omega t&\\
\end{eqnarray}
\end{array}\right.\)
\(s=\sqrt[3]{-\dfrac{q}{2}+\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\)
\(t=\sqrt[3]{-\dfrac{q}{2}-\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\)
\(st=-\dfrac{p}{3}\)
が、3次方程式の解の公式です。
3次方程式の解による体の拡大を振り返ってみます。\(\bs{Q}\) 上の既約な方程式 \(x^3+px+q=0\) の根を \(\al,\:\beta,\:\gamma\) とし、\(\bs{Q}\) の最小分解体 を \(\bs{L}=\bs{Q}(\al,\beta,\gamma)\)、ガロア群を \(G=\mr{Gal}(\bs{L}/\bs{Q})\) とすると、
\(\bs{Q}\:\subset\:\bs{Q}(\theta)\:\:\) | \(\:\subset\:\bs{L}\) | |
\(G\:\sp\:H\:\:\:\) | \(\:\sp\:\{\:e\:\}\) |
\(\bs{Q}\:\subset\:\bs{Q}(\theta)\:\subset\:\bs{L}\)
という体の拡大列で、\(\bs{Q}\:\subset\:\bs{Q}(\theta)\) のところはべき根拡大ですが、\(\bs{Q}(\theta)\:\subset\:\bs{L}\) は、\(\omega\in\bs{Q}(\theta)\) の場合を除き、べき根拡大ではありません。しかし、
\(\bs{Q}(\omega)\:\subset\:\bs{Q}(\omega,\theta)\:\subset\:\bs{L}(\omega)\)
なら、必ず、すべてがべき根拡大になります。従って、3次方程式の解は \(\bs{Q}(\omega)\) の元である「有理数と \(\omega\)」の四則演算・べき根で記述できます。
\(\omega\) は \(x^2+x+1=0\) の解なので、\([\:\bs{Q}(\omega):\bs{Q}\:]=2\) です。従って、拡大次数の連鎖律(33H)により、\(\omega\notin\bs{Q}(\theta)\) の条件で、
\([\:\bs{L}(\omega):\bs{Q}\:]=12\)
です。これは、\(\bs{Q}\) 上の多項式 \((x^3+px+q)(x^2+x+1)\) の最小分解体が \(\bs{L}(\omega)\) なので、\(\bs{Q}\) からの拡大次数は \(12\) であるとも言えます。3次方程式の「解」は、あくまで \(\bs{Q}\) の \(6\)次拡大体 \(\bs{L}=\bs{Q}(\al,\beta,\gamma)\) の中にありますが、「べき根で表された解」は \(\bs{Q}\) の \(12\)次拡大体 \(\bs{L}(\omega)\) の中にあるのです。
一見、矛盾しているようですが、そうではありません。ある代数拡大体 \(\bs{K}\) があったとして、\(a\) を \(\bs{K}\) の元とし、\(1\) の原始3乗根の一つを \(\omega\) とします。3次方程式、
\(x^3-a=0\:\:(a\in\bs{K})\)
は3つの解をもちます。そのうちのどれか一つを \(\sqrt[3]{a}\) と定義すると、3つの解(べき根)は、
\(\sqrt[3]{a},\:\:\sqrt[3]{a}\:\omega,\:\:\sqrt[3]{a}\:\omega^2\)
です。\(\sqrt[3]{a}\) では \(\omega\) が不要なように見えますが、それは表面上のことで、3つの解は、
\(\sqrt[3]{a}\:\omega,\:\:\sqrt[3]{a}\:\omega^2,\:\:\sqrt[3]{a}\:\omega^3\)
であるというのが正しい認識です。つまり \(\bs{\omega}\) は3つのべき根の関係性を規定していて、\(\sqrt[3]{a}\cdot\omega^i\:\:(i=1,2,3)\) という "ペアの形" によって3つの区別が可能になり、数式としての整合性が保てます。\(\sqrt[3]{\phantom{A}}\) という "曖昧さ" がある記号を用いる限り、\(\omega\) という、曖昧さを解消する "助手" が必然的に登場するのです。
「7.7 巡回拡大はべき根拡大」終わり
(「7.可解性の十分条件」は次回に続く)
(「7.可解性の十分条件」は次回に続く)
2023-04-30 07:54
nice!(0)
No.357 - 高校数学で理解するガロア理論(4) [科学]
\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{#1}} \newcommand{\ol}[1]{\overline{#1}} \newcommand{\sb}{\subset} \newcommand{\sp}{\supset} \newcommand{\al}{\alpha} \newcommand{\sg}{\sigma}\newcommand{\cd}{\cdots}\)
6.1 可解群
正規部分群の概念、および剰余群と巡回群を使って「可解群」を定義します。可解群は純粋に群の性質として定義できますが、方程式の可解性と結びつきます。
群 \(G\) から 単位元 \(e\) に至る部分群の列、
があって、\(H_{i+1}\) は \(H_i\) の正規部分群であり、剰余群 \(H_i/H_{i+1}\) が巡回群であるとき、\(G\) を可解群(solvable group)と言う。
\(H_{i+1}\) が \(H_i\) の正規部分群であるとき、\(H_i\) を正規列と言う。加えて、\(H_i/H_{i+1}\) が巡回群のとき、\(H_i\) を可解列という。
巡回群は可解群である。また、巡回群の直積も可解群である。
[証明]
群 \(G\) を巡回群とし、\(G\) から 単位元 \(e\) に至る部分群の列として、
\(G=H_0\:\sp\:H_1=\{\:e\:\}\)
をとる。\(H_1=\{\:e\:\}\) は \(H_0=G\) の正規部分群である。また、
\(H_0/H_1\:\cong\:H_0\:(=G)\)
であり、\(G\) は巡回群だから、\(H_0/H_1\) は巡回群である。従って \(G\) は可解群である。
3つの巡回群の直積 \(G\) で考える。\(G\) を、
\(\begin{eqnarray}
&&\:\:G&=\bs{Z}/k\bs{Z}\times\bs{Z}/m\bs{Z}\times\bs{Z}/n\bs{Z}\\
&&&=\{(a,b,c)\:|\:a\in\bs{Z}/k\bs{Z},\:b\in\bs{Z}/m\bs{Z},\:c\in\bs{Z}/n\bs{Z}\}\\
\end{eqnarray}\)
とする。このとき、
\(\begin{eqnarray}
&&\:\:&H_1&=\{(a,b,0)\:|\:a\in\bs{Z}/k\bs{Z},\:b\in\bs{Z}/m\bs{Z}\}\\
&&&H_2&=\{(a,0,0)\:|\:a\in\bs{Z}/k\bs{Z}\}\\
&&&\{e\}&=\{(0,0,0)\}\\
\end{eqnarray}\)
とおくと、
\(G\:\sp\:H_1\:\sp\:H_2\:\sp\:\{e\}\)
となる。巡回群は可換群であり、巡回群の直積 \(G\) も可換群である。従って、\(G\) の部分群である \(H_1,\:H_2\) も可換群であり、すなわち \(G\) の正規部分群である(41F)。
\(G\) の任意の2つの元を
\(g=(g_a,\:g_b,\:g_c)\)
\(h=(h_a,\:h_b,\:h_c)\)
とする。剰余類 \(g+H_1\) と \(h+H_1\) を考える。\((g_a,0,0)+H_1=H_1\)、\((0,g_b,0)+H_1=H_1\) だから、\((g_a,g_b,0)+H_1=H_1\) である。また同様に\((h_a,h_b,0)+H_1=H_1\) である。従って、\(g_c=h_c\) なら、\(g_a\)、\(g_b\)、\(h_a\)、\(h_b\) の値に関わらず \(g+H_1=h+H_1\) である。逆に、\(g_c\neq h_c\) なら \(g+H_1\neq h+H_1\) である。このことから剰余類の代表元(41E)として、\((0,0,0)\)、\((0,0,1)\)、\(\cd\)、\((0,0,n-1)\) の \(n\)個をとることができる。つまり、
\(\begin{eqnarray}
&&\:\:G/H_1=\{&(0,0,0)+H_1,\\
&&&(0,0,1)+H_1,\\
&&&(0,0,2)+H_1,\\
&&& \vdots\\
&&&(0,0,n-1)+H_1\}\\
\end{eqnarray}\)
である。これは \((0,0,1)+H_1\) を生成元とする位数 \(n\) の巡回群である。まったく同様の議論により、
\(\begin{eqnarray}
&&\:\:H_1/H_2=\{&(0,0,0)+H_2,\\
&&&(0,1,0)+H_2,\\
&&&(0,2,0)+H_2,\\
&&& \vdots\\
&&&(0,m-1,0)+H_2\}\\
\end{eqnarray}\)
であり、\(H_1/H_2\) は \((0,1,0)+H_2\) を生成元とする位数 \(m\) の巡回群である。以上により、
\(G=H_0\:\sp\:H_1\:\sp\:H_2\:\sp\:H_3=\{e\}\)
は、正規列であり、\(H_i/H_{i+1}\) が巡回群なので、\(G\) は可解群である。この議論は \(G\) が\(4\)個以上の巡回群の直積の場合でも全く同様に成り立つ。つまり、巡回群の直積は可解群である。[証明終]
可解群の部分群は可解群である。
[証明]
可解群を \(G\) とすると、可解群の定義により、
\(G=H_0\sp H_1\sp H_2\sp\cd H_{n-1}\sp H_n=\{e\}\)
という列で、\(H_{i+1}\) が \(H_i\) の正規部分群であり、\(H_i/H_{i+1}\) が巡回群のものが存在する。
ここで、\(G\) の任意の部分群を \(N\) としたとき、
\(N=N\cap H_0\sp N\cap H_1\sp N\cap H_2\sp\cd N\cap H_{n-1}\sp N\cap H_n=\{e\}\)
という集合の列を考える。部分群の共通部分は部分群の定理(41D)により、\(N\cap H_i\:(0\leq i\leq n)\) は \(G\) の部分群の列である。と同時に、これが可解列であることを以下で証明する。
列の \(N\cap H_{i-1}\sp N\cap H_i\) の部分を取り出して考える。\(H_i\) は \(H_{i-1}\) の正規部分群なので、\(H_{i-1}\) の任意の元 \(x\) について \(xH_i=H_ix\) が成り立つ。
\(N\cap H_{i-1}\) の任意の元を \(y\) とすると、\(y\in N\) かつ \(y\in H_{i-1}\) であるが、\(y\in N\) なので \(yN=Ny=N\) である。また \(y\in H_{i-1}\) なので、正規部分群の定義により、\(yH_i=H_iy\) が成り立つ。ゆえに、
\(y(N\cap H_i)=yN\cap yH_i=Ny\cap H_iy=(N\cap H_i)y\)
となり、定義によって \(\bs{N\cap H_i}\) は \(\bs{N\cap H_{i-1}}\) の正規部分群である。
次に第2同型定理(43B)によると、\(N\) が \(G\) の部分群、\(H\) が \(G\) の正規部分群のとき、
\(N/(N\cap H)\:\cong\:NH/H\)
が成り立つ。\(N\) を \(N\cap H_{i-1}\) とし、\(H\) を \(H_i\) として定理を適用すると、
となる。ここで、\(H_i\:\subset\:H_{i-1}\) なので、\((N\cap H_{i-1})\cap H_i=N\cap H_i\) である。従って、
\(H_{i-1}H_i\:\subset\:H_{i-1}H_{i-1}\)
\((N\cap H_{i-1})H_i\:\subset\:H_{i-1}H_i\)
となるが、これと \((\br{C})\) 式を合わせると、
\((N\cap H_{i-1})H_i\:\subset\:H_{i-1}\)
となる。従って、\((N\cap H_{i-1})H_i\) と \(H_{i-1}\) の \(H_i\) による剰余類を考えると、
\((N\cap H_{i-1})H_i/H_i\:\subset\:H_{i-1}/H_i\)
の関係にある。これで、
以上の \((\br{A})\:\:(\br{A}\,')\:\:(\br{A}\,'')\) をあわせると、
\((N\cap H_{i-1})/(N\cap H_i)\:\cong\:H_{i-1}/H_i\) の部分群
である。\(G\) は可解群なので \(H_{i-1}/H_i\) は巡回群である。巡回群の部分群は巡回群なので、それと同型である \(\bs{(N\cap H_{i-1})/(N\cap H_i)}\) は巡回群である。まとめると、
\(N\cap H_i\) は \(N\cap H_{i-1}\) の正規部分群
\((N\cap H_{i-1})/(N\cap H_i)\) は巡回群
となる。このことは \(1\leq i\leq n\) のすべてで成り立つから、\(N\cap H_0\:=\:N\cap G\:=\:N\) は可解群である。つまり、可解群 \(G\) の任意の部分群 \(N\) は可解群である。[証明終]
可解群の準同型写像による像は可解群である。
このことより、
可解群の剰余群は可解群
であることが分かる。なぜなら、群 \(G\) の部分群を \(N\) とすると、\(G\) から \(G/N\) への自然準同型、つまり \(x\in G\) として、
\(x\:\longmapsto\:xN\)
の準同型写像を定義できるからである。
[証明]
可解群を \(G\) とすると、可解群の定義により、
\(G=H_0\sp H_1\sp\:H_2\sp\cd H_{n-1}\sp H_n=\{e\}\)
という列で、\(H_i\) が \(H_{i-1}\) の正規部分群であり、剰余群 \(H_{i-1}/H_i\) が巡回群の列(=可解列)が存在する。群 \(G\) に作用する準同型写像を \(\sg\) とすると、上記の可解列の \(\sg\) による像、
\(\sg\) による像の列から \(\sg(H_{i-1})\sp\sg(H_i)\) を取り出して考える。\(\sg\) を \(H_{i-1}\) から \(\sg(H_{i-1})\) への写像と考えると、\(\sg(H_{i-1})\) は \(\sg\) による \(H_{i-1}\) の像なので、\(\sg\) は全射である。従って、\(H_{i-1}\) の元 \(h\) を選ぶことによって \(\sg(h)\) で \(\sg(H_{i-1})\) の全ての元を表すことができる。
\(\sg(H_{i-1})\) の任意の元を \(\sg(h)\) とおくと、
\(\begin{eqnarray}
&&\:\:\sg(h)\sg(H_i)&=\sg(hH_i)=\sg(H_ih)\\
&&&=\sg(H_i)\sg(h)\\
\end{eqnarray}\)
であるから、\(\sg(H_i)\) は \(\sg(H_{i-1})\) の正規部分群である。つまり \((\br{D})\) は正規列である。従って、\(\sg(H_{i-1})\) の \(\sg(H_i)\) による剰余類は群であり、剰余群 \(\sg(H_{i-1})/\sg(H_i)\) になる。
次に、剰余群 \(\sg(H_{i-1})/\sg(H_i)\) が巡回群であることを示す。\(H_{i-1}\) の任意の元を \(x\) とし、剰余群 \(H_{i-1}/H_i\) の元を \(xH_i\) で表す。\(H_{i-1}/H_i\) から \(\sg(H_{i-1})/\sg(H_i)\) への写像 \(f\) を、
\(f\::\:xH_i\:\longmapsto\:\sg(x)\sg(H_i)\)
と定める。もし、剰余群 \(H_{i-1}/H_i\) の元が \(xH_i\) と \(yH_i\:(x,y\in H_{i-1})\) という異なる表現を持っているとすると、
\(xH_i=yH_i\)
\(\sg(xH_i)=\sg(yH_i)\)
\(\sg(x)\sg(H_i)=\sg(y)\sg(H_i)\)
であるが、\(f\) の定義によって、
\(f(xH_i)=\sg(x)\sg(H_i)\)
\(f(yH_i)=\sg(y)\sg(H_i)\)
であり、異なる表現の \(f\) による写像先は一致する。従って \(f\) は2つの剰余群の間の写像として矛盾なく定義されている。また \(f\) は、
\(\begin{eqnarray}
&&f(xH_iyH_i)&=f(xyH_iH_i)=f(xyH_i)\\
&&&=\sg(xy)\sg(H_i)=\sg(x)\sg(y)\sg(H_i)\\
&&&=\sg(x)\sg(y)\sg(H_iH_i)=\sg(x)\sg(yH_iH_i)\\
&&&=\sg(x)\sg(H_iyH_i)=\sg(x)\sg(H_i)\sg(yH_i)\\
&&&=\sg(xH_i)\sg(yH_i)=\sg(x)\sg(H_i)\sg(y)\sg(H_i)\\
&&&=f(xH_i)f(yH_i)\\
\end{eqnarray}\)
を満たすが、この式は \(xH_i\) と \(yH_i\) が剰余群 \(H_{i-1}/H_i\) の異なる元を表現していても成り立つ。従って \(f\) は準同型写像である(=\(\:\br{①}\:\))。また、\(f\) は \(H_{i-1}/H_i\) から \(\sg(H_{i-1})/\sg(H_i)\) への写像で、
\(f\::\:xH_i\:\longmapsto\:\sg(x)\sg(H_i)\)
と定義されたが、\(\sg(xH_i)=\sg(x)\sg(H_i)\) だから \(f\)は全射であり、
\(\mr{Im}\:f\:=\:\sg(H_{i-1})/\sg(H_i)\)
である(=\(\:\br{②}\:\))。\(\br{①}\) と \(\br{②}\)、および準同型定理(43A)により、
\((H_{i-1}/H_i)/\mr{Ker}\:f\:=\:\sg(H_{i-1})/\sg(H_i)\)
である。\(H_{i-1}/H_i\) は巡回群なので、巡回群の剰余群は巡回群の定理(41H)により、\((H_{i-1}/H_i)/\mr{Ker}\:f\) は巡回群である。従って、それと同型である \(\sg(H_{i-1})/\sg(H_i)\) も巡回群である。
結局、\((\br{D})\) は正規列であると同時に \(\sg(H_{i-1})/\sg(H_i)\) が巡回群なので、\(\sg(G)\) は可解群である。[証明終]
6.2 巡回拡大
巡回拡大
\(\bs{Q}\) のガロア拡大を \(\bs{K}\) とする。\(\mr{Gal}(\bs{K}/\bs{Q})\) が巡回群のとき、\(\bs{K}/\bs{Q}\) を巡回拡大(cyclic extension)と言う。
累巡回拡大
\(\bs{Q}\) の拡大体を \(\bs{K}\) とする。
となる拡大列があって(\(k > 1\))、\(\bs{K}_{i+1}/\bs{K}_i\:(0\leq i < k)\) が巡回拡大のとき、\(\bs{K}/\bs{Q}\) は累巡回拡大であると言う。ただし、\(\bs{\bs{K}/\bs{Q}}\) が累巡回拡大だとしても、\(\bs{\bs{K}/\bs{Q}}\) がガロア拡大であるとは限らない。
\(\bs{K}/\bs{Q}\) が累巡回拡大だとしてもガロア拡大であるとは限りません。たとえばシンプルな例で考えてみると、
\(\al=\sqrt{\sqrt{2}+1}\)
という代数的数があったとします。この式から \(\sqrt{\phantom{A}}\) を消去すると \(\al^4-2\al^2-1=0\) なので、\(\al\) の最小多項式 \(f(x)\) は、
\(f(x)=x^4-2x^2-1\)
です。\(f(x)\) は、
\(f(x)=(x^2-(\sqrt{2}+1))(x^2+(\sqrt{2}-1))\)
と変形できるので、方程式 \(f(x)=0\) の解は
\(x=\pm\sqrt{\sqrt{2}+1},\:\:\pm i\sqrt{\sqrt{2}-1}\)
です。従って \(f(x)\) の最小分解体 \(\bs{L}\) は、
\(\bs{L}=\bs{Q}(\sqrt{\sqrt{2}+1},\:i\sqrt{\sqrt{2}-1})\)
であり、また、
\(\sqrt{\sqrt{2}+1}\cdot\sqrt{\sqrt{2}-1}=1\)
の関係があるので、
\(\bs{L}=\bs{Q}(i,\:\al)\)
と表現できます。\(\bs{L}/\bs{Q}\) はガロア拡大です。
一方、
\(\bs{K}=\bs{Q}(\al)\)
と定義すると、\(\bs{K}\) は \(f(x)=0\) の一つの解 \(\al\) だけによる単拡大体なので、\(\bs{K}/\bs{Q}\) はガロア拡大ではありません( \(\bs{Q}(\al)\neq\bs{Q}(i,\:\al)\) )。ここで、
\(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\:\subset\:\bs{Q}(\al)=\bs{K}\)
という体の拡大列を考えます。\(\bs{Q}\) 上の方程式 \(x^2-2=0\) の解は \(\pm\sqrt{2}\) なので、\(\bs{Q}(\sqrt{2})/\bs{Q}\) はガロア拡大です。また、ガロア群は、
\(\mr{Gal}(\bs{Q}(\sqrt{2})/\bs{Q})=\{e,\:\sg\}\)
\(\sg(\sqrt{2})=-\sqrt{2}\)
\(\sg^2=e\)
なので巡回群であり、\(\bs{Q}(\sqrt{2})/\bs{Q}\) は巡回拡大です。
同様に、\(\bs{Q}(\sqrt{2})\) 上の方程式 \(x^2-(\sqrt{2}+1)=0\) の解は \(\pm\al\) で、\(\bs{Q}(\sqrt{2},\al)\) は \(\bs{Q}(\sqrt{2})\) の巡回拡大です。\(\sqrt{2}=\al^2-1\) なので、\(\bs{Q}(\sqrt{2},\al)=\bs{Q}(\al)\) であり、\(\bs{Q}(\al)/\bs{Q}(\sqrt{2})\) が巡回拡大となります。
結局、\(\bs{K}/\bs{Q}\) は \(\bs{Q}(\sqrt{2})/\bs{Q},\:\:\bs{Q}(\al)/\bs{Q}(\sqrt{2})\) という2つの巡回拡大の列で表されるので、定義(62B)により累巡回拡大です。しかしそうであっても、\(\bs{K}/\bs{Q}\) は ガロア拡大ではないのです。
これがもし \(\al=\sqrt{2}+\sqrt{3}\) だとすると、\(2\) も \(3\) も \(\bs{Q}\) の元なので、
\(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\:\subset\:\bs{Q}(\sqrt{2},\sqrt{3})=\bs{K}\)
の拡大列は累巡回拡大であり、かつ \(\bs{K}/\bs{Q}\) がガロア拡大です。
このように、\(\bs{K}/\bs{Q}\) が累巡回拡大だとしてもガロア拡大であるとは限らないのですが、もし \(\bs{K}/\bs{Q}\) が累巡回拡大でかつガロア拡大だとすると、\(\mr{Gal}(\bs{K}/\bs{Q})\) は可解群になります。それが、累巡回拡大と可解群を結びつける次の定理です。
累巡回拡大ガロア群の可解性
\(\bs{Q}\) のガロア拡大を \(\bs{K}\)、そのガロア群を \(G\) とする。このとき、
の2つは同値である。
[① \(\bs{\Rightarrow}\) ②の証明]
\(G\) が可解群であることを示す部分群の列と、それとガロア対応をする体の拡大列を、
とする。\(G\) が可解群なので、\(H_{i+1}\) は \(H_i\) の正規部分群であり、\(H_{i+1}/H_i\:(0\leq i\leq k-1)\) は巡回群である。以降、\(H_i,\:H_{i+1}\) を取り出して考える。
\(H_i\:\sp\:H_{i+1}\:\sp\:\{e\}\)
\(\bs{F}_i\:\subset\:\bs{F}_{i+1}\:\subset\:\bs{K}\)
\(\bs{K}/\bs{Q}\) がガロア拡大なので、中間体からのガロア拡大の定理(52C)により、\(\bs{K}/\bs{F}_i\) もガロア拡大である。\(\bs{F}_i\) の固定群は \(H_i\) なので \(\mr{Gal}(\bs{K}/\bs{F}_i)=H_i\) である。同様に、\(\bs{K}/\bs{F}_{i+1}\) もガロア拡大であり、\(\mr{Gal}(\bs{K}/\bs{F}_{i+1})=H_{i+1}\) である。
ここで、\(H_{i+1}\) は \(H_i\) の正規部分群なので、正規性定理(53C)により \(\bs{F}_{i+1}/\bs{F}_i\) はガロア拡大であり、そのガロア群は、
\(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\cong H_i/H_{i+1}\)
となる。\(H_i/H_{i+1}\) は巡回群なので、それと同型の \(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\) も巡回群になる。従って、\(\bs{F}_{i+1}/\bs{F}_i\) は、「ガロア拡大で、かつ \(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\) が巡回群」なので、巡回拡大である。
以上が \(\bs{F}_i\:(0\leq i\leq k-1)\) で成り立つから、\(\bs{K}/\bs{Q}\) は累巡回拡大である。
[② \(\bs{\Rightarrow}\) ①の証明]
\(\bs{K}\) が \(\bs{Q}\) の累巡回拡大であることを示す体の拡大列と、それとガロア対応する \(G\) の部分群の列を、
とする。\(\bs{F}_i\)と \(\bs{F}_{i+1}\) を取り出して考える。
\(\bs{F}_i\:\subset\:\bs{F}_{i+1}\:\subset\:\bs{K}\)
\(H_i\:\sp\:H_{i+1}\:\sp\:\{e\}\)
\(\bs{K}/\bs{Q}\) がガロア拡大なので、\(\bs{K}/\bs{F}_i\) も \(\bs{K}/\bs{F}_{i+1}\) もガロア拡大である。また \(\bs{F}_{i+1}/\bs{F}_i\) は巡回拡大なので、すなわちガロア拡大である。従って正規性定理(53C)により、\(H_{i+1}\) は \(H_i\) の正規部分群であり、
\(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\cong H_i/H_{i+1}\)
となる。\(\bs{F}_{i+1}/\bs{F}_i\) は巡回拡大なので \(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\) は巡回群であり、それと同型である \(H_i/H_{i+1}\) も巡回群である。まとめると「\(H_{i+1}\) は \(H_i\) の正規部分群であり、かつ \(H_i/H_{i+1}\) は巡回群」である。
このことは \(H_i\:(0\leq i\leq k-1)\) で成り立つから、定義によって \(G\) は可解群である。[証明終]
6.3 原始\(n\)乗根を含む体とべき根拡大
この節の目的は「1の原始\(\bs{n}\)乗根を含む体のべき根拡大」の性質を解明することです。そのためにまず、1の原始\(n\)乗根を \(\zeta\) を含む体 \(\bs{Q}(\zeta)\)に関する次の定理を数ステップに分けて証明します。
1の原始\(n\)乗根を \(\zeta\) とする。このとき
・\(\bs{Q}(\zeta)/\bs{Q}\) はガロア拡大
・\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\:\cong\:(\bs{Z}/n\bs{Z})^{*}\)
が成り立つ。
\(1\) の原始\(n\)乗根
\(x^n-1=0\) の \(n\)個の解のうち、\(n\)乗して初めて \(1\) になる解を \(1\)の原始\(n\)乗根という。
原始\(n\)乗根は \(\varphi(n)\) 個ある。\(\varphi(n)\) はオイラー関数で、\(n\) と互いに素である \(n\) 以下の自然数の数を表す。
[証明]
まず、
\(\omega=\mr{cos}\dfrac{2\pi}{n}+i\:\mr{sin}\dfrac{2\pi}{n}\)
とおくと、明らかに \(\omega\) は原始\(n\)乗根である。さらに、
\(\omega^k=\mr{cos}\dfrac{2\pi k}{n}+i\:\mr{sin}\dfrac{2\pi k}{n}\:(1\leq k\leq n)\)
で \(1\) の\(n\)乗根の全体を表現できる。ここで \(\omega^k\) が原始\(n\)乗根になる条件を考える。いま、
\(\dfrac{2\pi k}{n}x=2\pi j\)
のときである。つまり、
\(\dfrac{k}{n}x=j\)
のときである。いま、\(k\) と \(n\) の最大公約数を \(d\) とすると( \(\mr{gcd}(k,n)=d\:)\)、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&k=sd&\\
&&n=td&\\
\end{eqnarray}
\end{array}\right.\)
と表せて、このとき \(s\) と \(t\) は互いに素である。これを使うと、
\(\dfrac{s}{t}x=j\)
のときに \(x\) は \((\br{A})\) 式を満たすことになる。\(s\) と \(t\) は互いに素であり、\(j\) は任意の整数だったから、\(x\) は \(t\) の倍数でなければならない。つまり、\(x\) は \(t=\dfrac{n}{d}\) の倍数である。ということは、\(x\) の最小値は \(\dfrac{n}{d}\) である。そして、\(\dfrac{n}{d}\) が \(n\) に等しいのは \(d=1\) の場合に限る。つまり \(\mr{gcd}(k,n)=1\) なら、\((\br{A})\) 式を満たす最小の \(x\) は \(n\) ということになる。従って、そのときに限り \(\omega^k\) は原始\(n\)乗根である。
\(\mr{gcd}(k,n)=1\) となる \(k\) は \(\varphi(n)\) 個あり、\(1\) の原始\(n\)乗根は \(\varphi(n)\) 個ある。[証明終]
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、
\(\zeta^m\:\:(1\leq m\leq n)\)
は、\(1\) の\(n\)乗根の全体を表す。また、
\(\zeta^m\:\:(\mr{gcd}(m,n)=1)\)
は、\(1\) の原始\(n\)乗根の全体を表す。
[証明]
\(\zeta^m\:(1\leq m\leq n)\) の \(n\) 個の値は全部異なっている。なぜなら、もし、 \(\zeta^j=\zeta^i\:(1\leq i < j\leq n)\)
だとすると、
\(\zeta^{j-i}=1\:(1\leq i < j\leq n)\)
となり、\(j-i < n\) だから、\(\zeta\) が原始\(n\)乗根という前提に反するからである。\(\zeta^m\:(1\leq m\leq n)\) は全部異なっているので、これら \(n\) 個の値は \(1\) の\(n\)乗根全体を表す。
\(\zeta\) は、\(\mr{gcd}(k,n)=1\) である \(k\) を用いて、
\(\zeta=\omega^k\)
\(\omega=\mr{cos}\dfrac{2\pi}{n}+i\:\mr{sin}\dfrac{2\pi}{n}\)
と表せる(63A)。すると
\(\zeta^m=(\omega^k)^m=\omega^{km}\)
である。\(\mr{gcd}(k,n)=1\) なので \(\mr{gcd}(m,n)=1\) なら \(\mr{gcd}(km,n)=1\) である。逆に、\(\mr{gcd}(km,n)=1\) が成り立つのは \(\mr{gcd}(m,n)=1\) のときに限る。従って、
\(\zeta^m\:(=\omega^{km})\)
は \(\mr{gcd}(m,n)=1\) のとき(かつ、そのときに限って)\(1\) の原始\(n\)乗根である。[証明終]
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とする。\(\zeta\) の最小多項式を \(f(x)\) とし、\(k\) を \(n\) とは素な数とする。
このとき \(f(\zeta^k)=0\) である。
[証明]
証明を2つのステップで行う
第1ステップ(\(p\) は \(\bs{n}\) と素な素数)
本論に入る前に、2つことを確認する。まず、\(p\) を素数とし \(a\) を \(p\) とは素な整数とするとき、\(a\neq0\) ならフェルマの小定理(25B)により、
\(a^{p-1}\equiv1\:(\mr{mod}\:p)\)
が成り立つ。この両辺に \(a\) をかけると、
次に、有限体 \(\bs{F}_p\) 上の多項式(係数が \(\bs{F}_p\) の元である多項式。「2.4 有限体」参照)についての定理である。\(p\) を素数とし \(x,\:y\) を変数とするとき、
\((x+y)^p=x^p+y^p\:\:\:[\bs{F}_p]\)
が成り立つ。その理由であるが、等式の左辺を整数係数として2項展開すると、
\(\begin{eqnarray}
&&\:\:(x+y)^p=&x^p+{}_{p}\mr{C}_{1}x^{p-1}y+\:\cd\:+{}_{p}\mr{C}_{p-1}xy^{p-1}+y^p\\
\end{eqnarray}\)
となる。この展開における \(x^p\) と \(y^p\) 以外の項の係数は、
\({}_{p}\mr{C}_{k}=\dfrac{p!}{k!\cdot(p-k)!}\:\:(1\leq k\leq p-1)\)
であるが、\(p\) が素数なので、分母の素因数に \(p\) はなく、分子の素因数にある \(p\) は分母で割り切れない。従って、
\({}_{p}\mr{C}_{k}\equiv0\:\:(\mr{mod}\:p)\:\:(1\leq k\leq p-1)\)
となり、\(\bs{F}_p\) 上の多項式としては、
\((x+y)^p=x^p+y^p\:\:\:[\bs{F}_p]\)
が成り立つ。
さらに、3変数、\(x,\:y,\:z\) では、
\(\begin{eqnarray}
&&\:\:(x+y+z)^p&=(x+y)^p+z^p\\
&&&=x^p+y^p+z^p\:\:\:[\bs{F}_p]\\
\end{eqnarray}\)
となり、これを繰り返すと \(n\) 変数に拡張できるのは明らかだから、\(x_1,\:\cd\:,\:x_n\) を変数として、
\((x_1+x_2+\:\cd\:+x_n)^p=\)
以上の \((\br{A})\) 式と \((\br{B})\) 式を前提として以下の本論を進める。
\(\zeta\) の最小多項式 \(f(x)\) は、最小多項式は既約多項式(31I)によって \(\bs{Q}\) 上の既約多項式である。\(\zeta\) は \(x^n-1=0\) と \(f(x)=0\) の共通の解だから、既約多項式の定理1(31E)により、\(x^n-1\) は \(f(x)\) で割り切れる。そこで、商の多項式を \(g(x)\) として、
とおく。この式の左辺の \(x^n-1\) は整数係数の多項式である。つまり上の式は、整数係数の多項式が \(\bs{Q}\) 上で(有理数係数の多項式として)因数分解できることになり、整数係数多項式の既約性の定理(31C)によって、\(x^n-1\) は整数係数の多項式で因数分解できる。従って、\(f(x)\) と \(g(x)\) は整数係数としてよい。ということは、\(f(x)\) と \(g(x)\) を有限体 \(\bs{F}_p\) 上の多項式と見なすこともできる。以降の証明にはこのことを使う。
\(p\) は \(n\) と互いに素だから \(\zeta^p\) も \(1\) の原始\(n\)乗根である(63B)。従って \((\br{C})\) 式に \(x=\zeta^p\) を代入すると、左辺は \(0\) だから、
\(f(\zeta^p)g(\zeta^p)=0\)
となり、\(f(\zeta^p)=0\) もしくは \(g(\zeta^p)=0\) である。
ここから、\(f(\zeta^p)=0\) であることを言うために背理法を使う。以下に \(f(\zeta^p)\neq0\) と仮定すると矛盾が生じることを証明する。
この背理法の仮定のもとでは \(g(\zeta^p)=0\) だから、\(\zeta\) は方程式 \(g(x^p)=0\) の解である。ということは、\(f(x)=0\) と \(g(x^p)=0\) は \(\zeta\) という共通の解をもつことになり、かつ \(f(x)\) は既約多項式であるから、既約多項式の定理1(31E)によって、\(g(x^p)\) は \(f(x)\) で割り切れる。その商を \(h(x)\) とすると、
\(g(x)\) を、
\(g(x)=a_mx^m+a_{m-1}x^{m-1}+\:\cd\:+\:a_1x+a_0\)
とし、これを \(\bs{F}_p\) 上の多項式とみなして \(g(x^p)\) を計算する。\((\br{A})\) 式を使って係数を \(\mr{mod}\:p\) でみると、
と変形できる。2行目への変形で \((\br{A})\) 式を用いた。
この最後の式は、\((\br{B})\) 式の右辺の \(x_1\) を \(a_mx^m\)、\(x_2\) を \(a_{m-1}x^{m-1}\)、\(\cd\:x_n\) を \(a_0\) と置き換えた形をしている。従って \((\br{B})\) 式を使うと、
となる。つまり \(g(x)\) を \(\bs{F}_p\) 上の多項式と見なすと、
\(f(x)\) は \(\bs{Q}\) 上の(整数係数の)既約多項式であった。しかし \(f(x)\) を \(\bs{F}_p\) 上の多項式と見なしたとき、それが既約多項式だとは限らない。たとえば \(x^2+1=0\) は \(\bs{Q}\) 上の既約多項式であるが、\(\bs{F}_5\) では、
\(x^2+1=(x-2)(x-3)\:\:\:[\bs{F}_5]\)
と因数分解できるから既約ではない。そこで、\(\bs{F}_p\) 上の多項式 \(f(x)\) を割り切る \(\bs{F}_p\) 上の既約多項式を \(q(x)\) とする。もし \(f(x)\) が \(\bs{F}_p\) 上でもなおかつ既約であれば \(q(x)=f(x)\) である。そうすると \(q(x)\) は \((\br{F})\) 式の右辺を割り切るから、左辺の \((g(x))^p\) も割り切る。ということは、既約多項式と素数の類似性(31D)によって、\(q(x)\) は \(g(x)\) を割り切る。
ここで \((\br{C})\) 式に戻って考えると、\((\br{C})\) 式は、
ここで \((\br{G})\) 式の両辺の導多項式(多項式の形式的微分)を求める。\(\bs{F}_p\) では距離が定義されていないので極限による微分の定義はできないが、形式的微分( \(x^k\:\rightarrow\:kx^{k-1}\) の変換)はできる。すると、
となる。
\((\br{G})\) 式と \((\br{H})\) 式により、\(\bs{F}_p\) 上の多項式として、
\(x^n-1\) と \(nx^{n-1}\) は共通の因数をもつ
ことになる。ここで矛盾が生じる。
なぜなら、\(n\) と \(p\) は互いに素だから、\(\bs{F}_p\) における \(n\) の逆数 \(n^{-1}\) がある。これを用いて \(x^n-1\) と \(nx^{n-1}\) に多項式の互除法を適用すると、
\(x^n-1=n^{-1}x(nx^{n-1})-1\:\:\:[\bs{F}_p]\)
となって、\(x^n-1\) と \(nx^{n-1}\) の最大公約数は \(-1\:(=p-1)\:\:[\bs{F}_p]\) という定数である。つまり、\(\bs{F}_p\) 上の多項式として、
\(x^n-1\) と \(nx^{n-1}\) は互いに素
である。これは明らかに矛盾している。この矛盾の発端は \(f(x)=0\) と \(g(x^p)=0\) が \(\zeta\) という共通の解をもつとしたことにあり、つまり \(g(\zeta^p)=0\) としたことにある。
従って、そもそもの仮定である \(f(\zeta^p)\neq0\) は間違っている。つまり \(f(\zeta^p)=0\) である。[第1ステップの証明終]
第2ステップ(\(k\) は \(\bs{n}\) と素な数)
\(k\) を \(n\) とは素な(しかし素数ではない)数とし、\(k\) の素因数分解を、
\(k=p_1p_2\cd p_m\)
とする。この形での素因数分解は、素因数が重複することもありうる。\(k\) は \(n\) と素だから、\(p_1,\:p_2,\:\cd\:,p_m\) のすべての素数は \(n\) と素である。
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とし、第1ステップの \(p=p_1\) とする。\(p_1\) は \(n\) と素だから、原始\(\bs{n}\)乗根の累乗の定理(63B)により、\(\zeta^{p_1}\) も \(1\) の原始\(n\)乗根である。また、第1ステップの証明により、\(f(\zeta^{p_1})=0\) である。
次に、その \(\zeta^{p_1}\) を原始\(n\)乗根としてとりあげ、\(p=p_2\) とする。\(p_2\) は \(n\) と素だから、\((\zeta^{p_1})^{p_2}=\zeta^{p_1p_2}\) もまた原始\(n\)乗根になる(63B)。従って、第1ステップでの証明を適用して \(f(\zeta^{p_1p_2})=0\) である。
このプロセスは次々と続けることができる。結局 \(\zeta^{p_1p_2\:\cd\:p_m}=\zeta^k\) は \(1\) の原始\(n\)乗根であると同時に、\(f(\zeta^k)=0\) を満たす。\(k\) につけた条件は「\(n\) と互いに素」だけである。
原始\(\bs{n}\)乗根の累乗の定理(63B)により、\(k\) が \(n\) と素という条件で、\(\zeta^k\) は原始\(n\)乗根のすべてを表す。従って、\(f(x)=0\) は原始\(n\)乗根のすべてを解とする方程式である。[証明終]
この原始\(\bs{n}\)乗根の最小多項式の定理(63C)より、次の定理がすぐに導けます。
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とし、\(\zeta\) の最小多項式を \(f(x)\) とすると、\(f(x)\) は円分多項式である。円分多項式とは、方程式 \(f(x)=0\) が \(\varphi(n)\) 個の解をもち、それらすべてが原始\(n\)乗根である多項式である。
従って、原始\(\bs{n}\)乗根は互いに共役である。最小多項式は既約多項式なので(31I)、円分多項式は既約多項式である。
\(\bs{Q}\) に \(\zeta\) を添加した単拡大体 \(\bs{Q}(\zeta)\) は円分多項式の最小分解体であり、\(\bs{\bs{Q}(\zeta)/\bs{Q}}\) はガロア拡大である。
\(\bs{Q}(\zeta)\)のガロア群
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/n\bs{Z})^{*}\)
である。つまり \(1\) の原始\(n\)乗根の一つを \(\bs{Q}\) に添加した拡大体のガロア群は、既約剰余類群に同型である。
[証明]
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とし、最小多項式を \(f(x)\) とすると、円分多項式の定理(63D)により、\(f(x)=0\) の解は \(\varphi(n)=m\) 個の原始\(n\)乗根である。
原始\(n\)乗根を
\(\zeta^{k_i}\:(\:1\leq i\leq m,\:1\leq k_i\leq n\) かつ \(\mr{gcd}(k_i,n)=1\:)\)
と表すと、それらは互いに共役である。また、\(f(x)\) の最小分解体は、
\(\bs{Q}(\zeta^{k_1},\zeta^{k_2},\cd,\zeta^{k_m})=\bs{Q}(\zeta)\)
である。
\(\zeta\) に作用する同型写像 \(\sg\) を考えると、\(\sg\) は \(\zeta\) を共役な元に移すから、
\(\sg_{k_i}(\zeta)=\zeta^{k_i}\)
で \(m\) 個の同型写像が定義できる。この \(\sg\) による移り先はすべて \(\bs{Q}(\zeta)\) の元だから、\(\sg\) は \(\bs{Q}(\zeta)\) の自己同型写像である。また、\(\sg_{k_i}\) と \(\sg_{k_j}\) の積は、
\(\begin{eqnarray}
&&\:\:\sg_{k_i}(\sg_{k_j})&=\sg_{k_i}(\zeta^{k_j})\\
&&&=(\zeta^{k_j})^{k_i}\\
&&&=\zeta^{k_ik_j}\\
\end{eqnarray}\)
と計算できる。そこで \(\sg\) の演算規則を、
\(\sg_{k_i}\sg_{k_j}=\sg_{k_ik_j}\)
と定める。
ここで \(k_ik_j\) は、\(1\leq k_i,\:k_j\leq n\) かつ \(\mr{gcd}(k_i,n)=1\) かつ \(\mr{gcd}(k_j,n)=1\) だから、既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) の元であり、乗算で閉じている。すなわち \(\sg_{k_ik_j}\) は \(\sg\) のどれかである。つまり、自己同型写像である \(\sg\) は上の演算規則で群になり、ガロア群 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) である。
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) から \((\bs{Z}/n\bs{Z})^{*}\) への写像 \(f\) を、
で定めると、
が成り立つから、\(f\) は群の同型写像になる。従って、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) と \((\bs{Z}/n\bs{Z})^{*}\) は同型である。[証明終]
既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) は巡回群の直積と同型です(25G)。従って次の定理が得られます。
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は巡回群の直積と同型である。
従って、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は可解群であり(61B)、累巡回拡大である(62C)。
累巡回拡大は、可解性の必要条件を証明する重要ポイントです。そこで次に、\(\bs{Q}(\zeta)/\bs{Q}\) が累巡回拡大になる様子を、ガロア群の計算で示します。
円分拡大は累巡回拡大
\(1\) の原始\(n\)乗根 \(\zeta\) を \(\bs{Q}\) に添加する拡大、\(\bs{Q}(\zeta)/\bs{Q}\) を円分拡大と言います。\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は巡回群の直積と同型で、従って 円分拡大 \(\bs{Q}(\zeta)/\bs{Q}\) は累巡回拡大です。
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) が巡回群の直積と同型になる理由は、既約剰余類群と同型であること、つまり、
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/n\bs{Z})^{*}\)
でした(63E)。その \((\bs{Z}/n\bs{Z})^{*}\) について振り返ってみると、次の通りです。\(\varphi\) はオイラー関数です。
\(\bs{n}\) が奇素数 \(\bs{p}\) 、ないしは奇素数 のべき乗のとき
(\(n=p^k,\:1\leq k\))(25D)(25E)
\((\bs{Z}/p^k\bs{Z})^{*}\) は生成元をもつ巡回群
群位数:\(\varphi(p^k)=p^{k-1}(p-1)\)
\(\bs{n}\) が2のべき乗のとき
(\(n=2^k,\:2\leq k\))(25F)
\((\bs{Z}/2^k\bs{Z})^{*}\cong(\bs{Z}/2\bs{Z})\times(\bs{Z}/2^{k-2}\bs{Z})\)
群位数:\(\varphi(2^k)=2^{k-1}\)
\(\bs{n=p^a\cdot q^b\cdot r^c}\)のとき
(\(p,\:q,\:r\) は素数)(25G)
\((\bs{Z}/n\bs{Z})^{*}\cong(\bs{Z}/p^a\bs{Z})^{*}\times(\bs{Z}/q^b\bs{Z})^{*}\times(\bs{Z}/r^c\bs{Z})^{*}\)
群位数:\(\varphi(n)=\varphi(p^a)\varphi(q^b)\varphi(r^c)\)
もちろん最後の式は、素因数が4個以上でも同様に成り立ちます。以下、それぞれの例をあげます。
\(\zeta\) が 原始\(25\)乗根のとき
\(\zeta\) が 原始\(25\)乗根の(一つ)のとき、原始\(25\)乗根の全体は \(\zeta^k\:\:(\mr{gcd}(k,25)=1)\) で表され(63B)、その数は \(25\) と互いに素な自然数の数、\(\varphi(25)=20\) です。\(\bs{Q}(\zeta)\) のガロア群は、
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/5^2\bs{Z})^{*}\)
でした(63E)。\((\bs{Z}/5\bs{Z})^{*}\) の最小の生成元は \(2\) ですが(25D)、ほどんどの場合、\((\bs{Z}/p\bs{Z})^{*}\) の生成元は同時に \((\bs{Z}/p^2\bs{Z})^{*}\) の生成元です(25E)。実際、\(2\) は \((\bs{Z}/25\bs{Z})^{*}\) の生成元であることが確認できます。
そこで、\(\bs{Q}(\zeta)\) の自己同型写像 \(\sg\) を、
\(\sg(\zeta)=\zeta^2\)
と定義すると、\(\sg^k(\zeta)\:\:(1\leq k\leq20)\) は、
\(\zeta^2,\:\zeta^4,\:\zeta^8,\:\zeta^{16},\:\zeta^7,\:\zeta^{14},\:\zeta^3,\:\zeta^6,\:\zeta^{12},\:\zeta^{24},\)
\(\zeta^{23},\:\zeta^{21},\:\zeta^{17},\:\zeta^9,\:\zeta^{18},\:\zeta^{11},\:\zeta^{22},\:\zeta^{19},\:\zeta^{13},\:\zeta\)
となって、原始\(25\)乗根の全部を尽くします。つまり、
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})=\{e,\:\sg,\:\sg^2,\:\cd,\:\sg^{19}\}\)
\(\sg(\zeta)=\zeta^2\)
であり、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は位数 \(20\) の巡回群で、
\(\bs{Q}\:\subset\:\bs{Q}(\zeta)\)
は巡回拡大です。
\(\zeta\) が 原始\(16\)乗根のとき
原始\(16\)乗根は、自然数 \(k\) を \(16\) 以下の奇数として \(\zeta^k\) で表され、次の8個です。
\(\zeta,\:\zeta^3,\:\zeta^5,\:\zeta^7,\:\zeta^9,\:\zeta^{11},\:\zeta^{13},\:\zeta^{15}\)
ここで、\(n\) が2のべき乗のときの同型は、
\((\bs{Z}/16\bs{Z})^{*}\cong(\bs{Z}/2\bs{Z})\times(\bs{Z}/4\bs{Z})\)
でした(25F)。つまり、\((\bs{Z}/16\bs{Z})^{*}\) は巡回群ではありませんが、位数 \(2\) の巡回群と位数 \(4\) の巡回群の直積に同型です。このことの証明(25F)を振り返ってみると、\(\mr{mod}\:16\) でみて \(5^k\:\:(0\leq k\leq3)\) は、
\(1,\:5,\:9,\:13\)
であり、\((\bs{Z}/16\bs{Z})^{*}\) の元のうちの「4で割って1余る数」が全部現れるのでした。そこで、\(\bs{Q}(\zeta)\) の自己同型写像 \(\sg\) を、
\(\sg(\zeta)=\zeta^5\)
と定義すると、\(\sg^k(\zeta)\:\:(0\leq k\leq3)\) は、
\(\zeta,\:\zeta^5,\:\zeta^9,\:\zeta^{13}\)
で、原始\(16\)乗根の半数を表現します。
\(G=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\)
\(H=\{e,\:\sg,\:\sg^2,\:\sg^3\}\)
と書くと、\(H\) は \(G\) の部分群で、\(H\) の位数 \(4\) は \(G\) の位数 \(8\) の半分です。
\(H\) の固定体を \(\bs{K}\) とします。
\(\sg(\zeta^4)=\sg(\zeta)^4=(\zeta^5)^4=\zeta^{20}\)
ですが、\(\zeta^{16}=1\) なので、
\(\sg(\zeta^4)=\zeta^4\)
です。\(\zeta^4\) は \(\sg\) で不変であり、従って \(\zeta^4\) は \(H\) のすべての元で不変です。\(\zeta^4\) は4乗して初めて \(1\) になる数で、\(1\) の原始4乗根、つまり \(i\)(または \(-i\)。\(i\) は虚数単位)です。つまり \(i\) は固定体 \(\bs{K}\) の元であり、
\(\bs{Q}(i)\:\subset\:\bs{K}\)
です。\(\bs{K}\) が \(H\) の固定体なので、ガロア対応は、
\(G\:\sp\:H\:\sp\:\{\:e\:\}\)
\(\bs{Q}\:\subset\:\bs{K}\:\subset\:\bs{Q}(\zeta)\)
です。ガロア対応の定理(53B)により、
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{K})=H\)
であり、次数と位数の同一性(52B)により、体の拡大次数はガロア群の位数と等しいので、
\([\:\bs{Q}(\zeta):\bs{K}\:]=|H|=4\)
です。また、
\([\:\bs{Q}(\zeta):\bs{Q}\:]=\varphi(16)=8\)
なので、拡大次数の連鎖律(33H)により、
\([\:\bs{K}:\bs{Q}\:]=2\)
です。一方、\(i\) は既約な2次方程式 \(x^2+1=0\) の根なので、\([\:\bs{Q}(i):\bs{Q}\:]=2\) です。つまり \(\bs{K}\) と \(\bs{Q}(i)\) は次元(\(=\:2\))が一致し、かつ \(\bs{Q}(i)\:\subset\:\bs{K}\) なので、体の一致の定理(33I)によって、
\(\bs{K}=\bs{Q}(i)\)
です。まとめると、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q}(i))\) は位数 \(4\) の巡回群であり、\(\bs{Q}(\zeta)/\bs{Q}(i)\) は巡回拡大です。
また、
\(\tau(i)=-i\)
と定義すると、\(\tau\) は \(\bs{Q}(i)\) の自己同型写像です。従って、
\(\mr{Gal}(\bs{Q}(i)/\bs{Q})=\{e,\:\tau\}\)
であり、\(\mr{Gal}(\bs{Q}(i)/\bs{Q})\) は位数 \(2\) の巡回群で、\(\bs{Q}(i)/\bs{Q}\) は巡回拡大です。
以上で、
\(\bs{Q}\:\subset\:\bs{Q}(i)\:\subset\:\bs{Q}(\zeta)\)
は2つの巡回拡大を連鎖させた累巡回拡大です。
\(\zeta\) が 原始\(360\)乗根のとき
\(n\) が複数の素因数をもつ一般的な場合を確認します。分かりやすいように \(n=360\) とします。\(360=2^3\cdot3^2\cdot5\) なので、既約剰余類群の構造の定理(25G)によって、
\((\bs{Z}/360\bs{Z})^{*}\cong(\bs{Z}/8\bs{Z})^{*}\times(\bs{Z}/9\bs{Z})^{*}\times(\bs{Z}/5\bs{Z})^{*}\)
です。右辺の群位数はそれぞれ、
\(|(\bs{Z}/8\bs{Z})^{*}|=\varphi(8)=4\)
\(|(\bs{Z}/9\bs{Z})^{*}|=\varphi(9)=6\)
\(|(\bs{Z}/5\bs{Z})^{*}|=\varphi(5)=4\)
なので、
\(|(\bs{Z}/360\bs{Z})^{*}|=4\cdot6\cdot4=96=\varphi(360)\)
です。ここで、
\(1\) の原始\(8\)乗根 \(:\:\zeta^{45}\)
\(1\) の原始\(9\)乗根 \(:\:\zeta^{40}\)
\(1\) の原始\(5\)乗根 \(:\:\zeta^{72}\)
ですが、これらを用いると、
\(\bs{Q}(\zeta)=\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
が成り立ちます。その理由ですが、
\(\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\subset\bs{Q}(\zeta)\)
であるのは当然として、その逆である、
\(\bs{Q}(\zeta)\subset\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
も成り立つからです。なぜなら、
\(45x+40y+72z=1\)
の1次不定方程式を考えると、\(\mr{gcd}(45,40,72)=1\) なので不定方程式の解の存在の定理(21C)により必ず整数解があります。具体的には、
\(x=5,\:\:y=7,\:\:z=-7\)
が解(の一つ)です。従って、
\(\zeta=(\zeta^{45})^5\cdot(\zeta^{40})^7\cdot(\zeta^{72})^{-7}\)
であり、\(\zeta\) が \(\zeta^{45},\:\zeta^{40},\:\zeta^{72}\) の四則演算で表現できるので、
\(\bs{Q}(\zeta)\subset\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
です。この結果、
\(\bs{Q}(\zeta)=\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
となります。
以上を踏まえると、\(\bs{Q}\) から \(\bs{Q}(\zeta)\) への体の拡大は、
\(\begin{eqnarray}
&&\:\:\bs{Q}&\subset\bs{Q}(\zeta^{45})\\
&&&\subset\bs{Q}(\zeta^{45},\zeta^{40})\\
&&&\subset\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})=\bs{Q}(\zeta)\\
\end{eqnarray}\)
と、\(\bs{Q}\) からの単拡大を3回繰り返したものと言えます。以降で、それぞれの単拡大が巡回拡大になることを確認します。
\(\bs{Q}\:\subset\:\bs{Q}(\zeta^{45})\)
\(\zeta^{45}\) は原始\(8\)乗根なので、上で検討した原始\(16\)乗根の結果がそのまま使えます。つまり、
\(\bs{Q}\subset\bs{Q}(i)\subset\bs{Q}(\zeta^{45})\)
と表され、
\([\:\bs{Q}(i):\bs{Q}\:]=2\)
\([\:\bs{Q}(\zeta^{45}):\bs{Q}(i)\:]=2\)
\([\:\bs{Q}(\zeta^{45}):\bs{Q}\:]=4\)
であり、\(\mr{Gal}(\bs{Q}(i)/\bs{Q}),\:\mr{Gal}(\bs{Q}(\zeta^{45})/\bs{Q}(i))\) は位数2の巡回群です。原始8乗根は簡単に計算できて、たとえばその一つは、
\(\begin{eqnarray}
&&\:\:\zeta^{45}&=\mr{cos}\dfrac{\pi}{4}+i\:\mr{sin}\dfrac{\pi}{4}\\
&&&=\dfrac{1}{2}(\sqrt{2}+\sqrt{2}\:i)\\
\end{eqnarray}\)
なので、
\(\bs{Q}\subset\bs{Q}(i)\subset\bs{Q}(i,\sqrt{2})=\bs{Q}(\zeta^{45})\)
と表現することができます。この結果を使って、2つのガロア群 \(G_1\) と\(G_2\) の元を表現すると、
\(G_1=\mr{Gal}(\bs{Q}(i)/\bs{Q})=\{e,\:\sg_1\}\)
\(\sg_1(i)=-i\)
\(G_2=\mr{Gal}(\bs{Q}(\zeta^{45})/\bs{Q}(i))=\{e,\:\sg_2\}\)
\(\sg_2(\sqrt{2})=-\sqrt{2}\)
となります。
\(\bs{Q}(\zeta^{45})\subset\bs{Q}(\zeta^{45},\zeta^{40})\)
\(\zeta^{40}\) は原始\(9\)乗根です。原始\(9\)乗根の一つを \(\al\) と書くと、原始\(9\)乗根の全体は \(1\)~\(8\) の数で \(9\) と素なものを選んで、
\(\al,\:\al^2,\:\al^4,\:\al^5,\:\al^7,\:\al^8\)
の6つになり、これらが共役な元です。\((\bs{Z}/9\bs{Z})^{*}\) の元は、
\((\bs{Z}/9\bs{Z})^{*}=\{1,\:2,\:4,\:5,\:7,\:8\}\)
ですが、生成元は \(2\) か \(5\) です。生成元として \(2\) を採用すると、\(2^k\:(\mr{mod}\:9)\:(1\leq k\leq6)\) は、
\(2,\:4,\:8,\:7,\:5,\:1\)
と、\((\bs{Z}/9\bs{Z})^{*}\) の元を巡回します。
\(G_3=\mr{Gal}(\bs{Q}(\zeta^{45},\zeta^{40})/\bs{Q}(\zeta^{45}))\)
と書くことにし、ガロア群 \(G_3\) の元 \(\sg\) を、
\(\sg(\al)=\al^2\)
と定義すると、
\(G_3=\{e,\:\sg,\:\sg^2,\:\sg^3,\:\sg^4,\:\sg^5\}\)
となります。\(\al\) を \(\zeta\) で表すと、
ただし、ガロア群の定義によって \(\sg\) は \(\zeta^{45}\) を不動にします。従って、
\(40x\equiv80\:\:(\mr{mod}\:360)\)
\(45x\equiv45\:\:(\mr{mod}\:360)\)
\(x=65\)
です。当然ですが、\(65\)の累乗を \((\mr{mod}\:9)\) で計算してみると、
\(65^{\phantom{1}}\equiv2\:\:(\mr{mod}\:9)\)
\(65^2\equiv4\:\:(\mr{mod}\:9)\)
\(65^3\equiv8\:\:(\mr{mod}\:9)\)
\(65^4\equiv7\:\:(\mr{mod}\:9)\)
\(65^5\equiv5\:\:(\mr{mod}\:9)\)
\(65^6\equiv1\:\:(\mr{mod}\:9)\)
となって、\(2\) の累乗 \((\mr{mod}\:9)\) と一致します。\(\mr{mod}\:360\) に戻すと、
\(40\cdot65^{\phantom{1}}\equiv40\cdot2\:\:(\mr{mod}\:360)\)
\(40\cdot65^2\equiv40\cdot4\:\:(\mr{mod}\:360)\)
\(40\cdot65^3\equiv40\cdot8\:\:(\mr{mod}\:360)\)
\(40\cdot65^4\equiv40\cdot7\:\:(\mr{mod}\:360)\)
\(40\cdot65^5\equiv40\cdot5\:\:(\mr{mod}\:360)\)
\(40\cdot65^6\equiv40\phantom{\cdot5\:\:(}(\mr{mod}\:360)\)
です。この結果、
と定義すると、\(\sg_3\) は \(\al=\zeta^{40}\) を、
\(\sg_3^{\:\phantom{1}}(\al)=\al^2,\:\:\sg_3^{\:2}(\al)=\al^4,\:\:\sg_3^{\:3}(\al)=\al^8\)
\(\sg_3^{\:4}(\al)=\al^7,\:\:\sg_3^{\:5}(\al)=\al^5,\:\:\sg_3^{\:6}(\al)=\al\)
と巡回させます \((\zeta^{360}=1)\)。また、
\(65\cdot45=2925\equiv45\:\:(\mr{mod}\:360)\)
なので、
\(\sg_3(\zeta^{45})=\zeta^{45}\)
です。結局、
\(\begin{eqnarray}
&&\:\:G_3&=\mr{Gal}(\bs{Q}(\zeta^{45},\zeta^{40})/\bs{Q}(\zeta^{45}))\\
&&&=\{e,\:\sg_3,\:\sg_3^{\:2},\:\sg_3^{\:3},\:\sg_3^{\:4},\:\sg_3^{\:5}\}\\
\end{eqnarray}\)
\(\sg_3(\zeta)=\zeta^{65}\)
がガロア群です。
\(\bs{Q}(\zeta^{45},\zeta^{40})\subset\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
\(\zeta^{72}\) は原始\(5\)乗根で、\((\bs{Z}/5\bs{Z})^{*}\) の生成元は \(2\) か \(3\) です。生成元として \(2\) を採用すると、ガロア群の元 \(\sg\) は、先ほどと同じように考えて、
ですが、これを簡単にして、
が得られます。この連立合同方程式も中国剰余定理\(\bs{\cdot}\)多連立(21G)によって、\(0\leq x < 9\cdot8\cdot5=360\) の範囲に唯一の解があります。それを求めると、
\(x=217\)
です。従って、
と定義すると、
\(G_4=\{e,\:\sg_4,\:\sg_4^{\:2},\:\sg_4^{\:3}\}\)
\(\sg_4(\zeta)=\zeta^{217}\)
がガロア群になります。\(217^4\equiv1\:\:(\mr{mod}\:360)\) です。なお、
\(\bs{Q}(\zeta^{45},\zeta^{40})=\bs{Q}(\zeta^5)\)
と簡略化できます。なぜなら、\(40\) と \(45\) の最大公約数は \(5\) なので、
\(45x+40y=5\)
の1次不定方程式には整数解があり(21B)、具体的には、
\(x=1,\:\:y=-1\)
が解(の一つ)で、
\(\zeta^5=\zeta^{45}\cdot(\zeta^{40})^{-1}\)
と表せるからです。また、
\(\bs{Q}(\zeta)=\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
だったので、
\(\begin{eqnarray}
&&\:\:G_4&=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q}(\zeta^5))\\
&&&=\{e,\:\sg_4,\:\sg_4^{\:2},\:\sg_4^{\:3}\}\\
\end{eqnarray}\)
\(\sg_4(\zeta)=\zeta^{217}\)
と表記できます。\(G_4\) は位数 \(4\) の巡回群であり、\(\bs{Q}(\zeta)/\bs{Q}(\zeta^5)\) は巡回拡大です。さらに、
\(\begin{eqnarray}
&&\:\:\sg_4(\zeta^5)&=\zeta^{5\cdot217}=\zeta^{1085}\\
&&&=\zeta^{3\cdot360+5}=\zeta^5\\
\end{eqnarray}\)
なので、\(\sg_4\) が \(\zeta^5\) を固定することが確認できました。
以上の考察をまとめると、\(\zeta\) が \(1\) の原始\(360\)乗根のとき、
\(\bs{Q}\subset\bs{Q}(i)\subset\bs{Q}(\zeta^{45})\subset\bs{Q}(\zeta^5)\subset\bs{Q}(\zeta)\)
という、4段階の巡回拡大が得られました。\(i\) は原始\(4\)乗根なので、\(\bs{Q}(i)\) は \(\bs{Q}(\zeta^{90})\) と同じ意味です。それそれの拡大のガロア群を \(G_1,\:G_2,\:G_3,\:G_4\) とすると、
\(G_1=\{e,\:\sg_1\}\)
\(\sg_1(i)=-i\)
\(G_2=\{e,\:\sg_2\}\)
\(\sg_2(\sqrt{2})=-\sqrt{2}\)
\(G_3=\{e,\:\sg_3,\:\sg_3^{\:2},\:\sg_3^{\:3},\:\sg_3^{\:4},\:\sg_3^{\:5}\}\)
\(\sg_3(\zeta)=\zeta^{65}\)
\(G_4=\{e,\:\sg_4,\:\sg_4^{\:2},\:\sg_4^{\:3}\}\)
\(\sg_4(\zeta)=\zeta^{217}\)
であり、これらすべてが巡回群です。また、体の拡大次数はガロア群の位数と一致し、順に \(2,\:2,\:6,\:4\) です。以上のことは、\(\zeta\) を \(1\) の\(360\)乗根とするとき、
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/360\bs{Z})^{*}\)
\(\begin{eqnarray}
&&\:\:(\bs{Z}/360\bs{Z})^{*}&\cong(\bs{Z}/8\bs{Z})^{*}\times(\bs{Z}/9\bs{Z})^{*}\times(\bs{Z}/5\bs{Z})^{*}\\
&&&\cong(\bs{Z}/2\bs{Z})\times(\bs{Z}/2\bs{Z})\times(\bs{Z}/9\bs{Z})^{*}\times(\bs{Z}/5\bs{Z})^{*}\\
\end{eqnarray}\)
であることの必然的な結果です。
以上のガロア群の計算を通して、\(\bs{Q}(\zeta)/\bs{Q}\) は累巡回拡大であることが確認できました。
べき根拡大
\(\bs{K}\) 上の方程式 \(x^n-a=0\:(a\in\bs{K}\)、\(a\neq1)\) の解の一つで、\(\bs{K}\) に含まれないものを \(\sqrt[n]{a}\) とするとき、\(\bs{K}(\sqrt[n]{a})\) を \(\bs{K}\) のべき根拡大(radical extension)と呼ぶ。
また、\(\bs{K}\) からのべき根拡大を繰り返して拡大体 \(\bs{F}\) ができるとき、\(\bs{F}/\bs{K}\) を累べき根拡大と言う。
\(x^n-a\) は既約多項式とは限らないので、\(\bs{K}(\sqrt[n]{a})/\bs{K}\) の拡大次数は \(n\) とは限りません。
また一般に、べき根拡大はガロア拡大ではありません。しかし \(\bs{K}\) に特別の条件(= \(\bs{K}\) に \(1\) の原始\(n\)乗根 \(\zeta\) が含まれる)があるときは、べき根拡大がガロア拡大、かつ巡回拡大になります。この「原始\(\bs{n}\)乗根を含む体からのべき根拡大」を考えるのが、ガロア理論の巧妙なアイデアです。
\(1\) の原始\(n\)乗根を含むべき根拡大
\(1\) の原始\(n\)乗根を \(\zeta\) とし、\(\bs{K}\) に \(\zeta\) が含まれるとする。\(\bs{K}\) 上の方程式 \(x^n-a=0\:(a\in\bs{K}\)、\(a\neq1)\) の解の一つで、\(\bs{K}\) に含まれないものを \(\sqrt[n]{a}\) とし、\(\bs{L}=\bs{K}(\sqrt[n]{a})\) とすると、
が成り立つ。
[証明]
\(\bs{K}(\sqrt[n]{a})\) 上の同型写像を \(\tau\) とする。\(x^n-a=0\) の解は、
\(\sqrt[n]{a},\:\sqrt[n]{a}\:\zeta,\:\sqrt[n]{a}\:\zeta^2,\:\cd\:,\:\sqrt[n]{a}\:\zeta^{n-1}\)
であり、\(\tau\) を \(\sqrt[n]{a}\) に作用させたときの移り先は、このうちのどれかである。もともと \(\bs{K}\) には \(1\) の原始\(n\)乗根 \(\zeta\) が 含まれているから、これらの移り先はすべて \(\bs{K}(\sqrt[n]{a})\) の元である。従って \(\tau\) は自己同型写像であり、\(\bs{K}(\sqrt[n]{a})/\bs{K}\) はガロア拡大である。
次にガロア群 \(\mr{Gal}(\bs{K}(\sqrt[n]{a})/\bs{K})\) の元と、\(\bs{K}(\sqrt[n]{a})/\bs{K}\) の拡大次数を求める。\(\sqrt[n]{a}\) の \(\bs{K}\) 上の最小多項式を \(f(x)\) とする。最小多項式は既約多項式(31I)により \(f(x)\) は既約多項式であり、\(f(x)=0\) と \(x^n-a=0\) は共通の解 \(\sqrt[n]{a}\) を持つから、\(x^n-a=0\) は \(f(x)\) で割り切れる。従って \(f(x)=0\) の解は、\(x^n-a=0\) の解、\(\sqrt[n]{a},\:\sqrt[n]{a}\:\zeta,\:\sqrt[n]{a}\:\zeta^2,\:\cd\:,\:\sqrt[n]{a}\:\zeta^{n-1}\) の全部、またはその一部である。\(f(x)=0\) の解で、\(\sqrt[n]{a}\:\zeta^{t}\) の\(t\) が最小となる 正の数を \(d\:(1\leq d\leq n-1)\) とする。そして \(\bs{K}\) の元を固定する \(\bs{K}(\sqrt[n]{a})\) の同型写像、\(\sg\) を、
\(\sg(\sqrt[n]{a})=\sqrt[n]{a}\:\zeta^{d}\)
と定義する。これは自己同型写像になるから、\(\mr{Gal}(\bs{K}(\sqrt[n]{a})/\bs{K})\) の元である。\(\sg\) は \(\bs{K}\) の元を固定するから \(\sg(\zeta)=\zeta\) である。これを用いて \(\sg^i(\sqrt[n]{a})\) を求めると、
\(\begin{eqnarray}
&&\:\:\sg^2(\sqrt[n]{a})&=\sg(\sg(\sqrt[n]{a}))=\sg(\sqrt[n]{a}\:\zeta^{d})=\sg(\sqrt[n]{a})\zeta^{d}\\
&&&=\sqrt[n]{a}\:\zeta^{d}\zeta^{d}=\sqrt[n]{a}\:\zeta^{2d}\\
&&\:\:\sg^3(\sqrt[n]{a})&=\sg(\sg^2(\sqrt[n]{a}))=\sg(\sqrt[n]{a}\:\zeta^{2d})=\sg(\sqrt[n]{a})\zeta^{2d}\\
&&&=\sqrt[n]{a}\:\zeta^{d}\zeta^{2}d=\sqrt[n]{a}\:\zeta^{3d}\\
\end{eqnarray}\)
となり、一般的には、
\(\sg^i(\sqrt[n]{a})=\sqrt[n]{a}\:\zeta^{id}\:(1\leq i)\)
となる。\(i=n\) とおくと、
\(\sg^n(\sqrt[n]{a})=\sqrt[n]{a}\:\zeta^{nd}=\sqrt[n]{a}\)
となるから、\(\sg^n=e\) である。
\(n\) を \(d\) で割ったときの商を \(s\)、余りを \(r\) とする。
\(n=sd+r\:(1 < s\leq n,\:0\leq r < d)\)
である。ここで \(\sg^i(\sqrt[n]{a})\) の \(i\) を \(n-s\) とおくと、
\(\begin{eqnarray}
&&\:\:\sg^{n-s}(\sqrt[n]{a})&=\sqrt[n]{a}\:\zeta^{nd-sd}\\
&&&=\sqrt[n]{a}\:\zeta^{n(d-1)+n-sd}\\
\end{eqnarray}\)
となる。\(\zeta^n=e\) なので、\(\zeta^{n(d-1)}=e\) であることを用いると、
\(\begin{eqnarray}
&&\:\:\sg^{n-s}(\sqrt[n]{a})&=\sqrt[n]{a}\:\zeta^{n-sd}\\
&&&=\sqrt[n]{a}\:\zeta^{r}\\
\end{eqnarray}\)
と計算できる。\(\sg^{s}\) はガロア群の元なので、\(\sg^{n-s}=\sg^{-s}\) もガロア群の元である。従って \(\sg^{n-s}(\sqrt[n]{a})\) は \(f(x)=0\) の解である。
ここでもし \(r\) がゼロでないとすると、\(1\) 以上、\(d\) 未満の数である \(r\) があって、\(\sqrt[n]{a}\:\zeta^{r}\) が \(f(x)=0\) の解となってしまう。しかしこれは、\(f(x)=0\) の解である \(\sqrt[n]{a}\:\zeta^{t}\) の \(t\) の最小値が \(d\) との仮定に反する。従って \(r=0\) である。
\(n=sd\) なので、
\(\sqrt[n]{a},\:\sqrt[n]{a}\:\zeta,\:\sqrt[n]{a}\:\zeta^2,\:\cd\:,\:\sqrt[n]{a}\:\zeta^{n-1}\)
の中に \(f(x)=0\) の解は \(s\) 個あり、
\(\sqrt[n]{a},\:\sqrt[n]{a}\:\zeta^{d},\:\:\sqrt[n]{a}\:\zeta^{2d},\:\cd\:,\:\sqrt[n]{a}\:\zeta^{(s-1)d}\)
である。\(\mr{Gal}(\bs{K}(\sqrt[n]{a})/\bs{K})\) は位数 \(s\) の巡回群であり、位数は \(n\) の約数である。\(n\) が素数 \(p\) であれば、\(\mr{Gal}(\bs{K}(\sqrt[p]{a})/\bs{K})\) は \(p\)次の巡回群である。[証明終]
この定理から分かることは、あらかじめ必要な原始\(n\)乗根を "仕込んで" おけば、べき根拡大列は巡回拡大列になるということです。たとえば、べき根拡大の列、
\(\bs{Q}\:\subset\:\bs{K}\:\subset\:\bs{L}\)
があり、\(\bs{K}/\bs{Q}\) の拡大次数を \(n_1\)、\(\bs{L}/\bs{K}\) の拡大次数を \(n_2\) とします。\(n_1,\:n_2\) の最小公倍数を \(n\)、\(1\) の原始\(n\)乗根を \(\zeta\) とします。そして、
\(\bs{Q}\:\subset\:\bs{Q}(\zeta)\:\subset\:\bs{K}\:\subset\:\bs{L}\)
の拡大列を考えると、\(\bs{Q}(\zeta)\) には、
\(1\) の原始\(n_1\)乗根 : \(\zeta^{\frac{n}{n_1}}\)
\(1\) の原始\(n_2\)乗根 : \(\zeta^{\frac{n}{n_2}}\)
が含まれているので、
となり、合わせると
\(\bs{L}/\bs{Q}\) : 累巡回拡大
になります。ここまでくると、可解性の必要条件の証明まであと一歩です。
6.4 可解性の必要条件
可解性の必要条件を証明する最終段階にきました。\(\bs{Q}\) 上の既約な方程式の解の一つを \(\al\) とし、\(\bs{K}=\bs{Q}(\al)\) の拡大体を考えます。\(\al\) が四則演算とべき根で表現できるということは、\(\bs{K}/\bs{Q}\) が累べき根拡大(63G)であるということです。ここが出発点です。そして証明の方針として、
の4つが密接に関係していることを示します。
まず、原始\(\bs{n}\)乗根を含むべき根拡大の定理(63H)により、累べき根拡大の拡大のステップに必要な原始\(n\)乗根の全種類をあらかじめ \(\bs{Q}\) に含めておけば、① 累べき根拡大は ② 累巡回拡大と同じことなります。
さらに、累巡回拡大ガロア群の可解性(62C)の定理により、もし \(\bs{K}/\bs{Q}\) が ③ ガロア拡大であれば、累巡回拡大 \(\bs{K}/\bs{Q}\) のガロア群 \(\mr{Gal}(\bs{K}/\bs{Q})\) は ④ 可解群です。
しかし、累巡回拡大の定義(62B)のところで書いたように、\(\bs{K}/\bs{Q}\) が累巡回拡大であってもガロア拡大であるとは限りません。そこで、
\(\bs{Q}\:\subset\:\bs{K}\:\subset\:\bs{E}\)
となるような \(\bs{E}\) で、\(\bs{E}/\bs{Q}\) が累巡回拡大、かつガロア拡大である \(\bs{E}\) が必ず存在することを証明できれば、① \(\rightarrow\) ② \(\rightarrow\) ③ \(\rightarrow\) ④ が一気通貫でつながることになります。このような \(\bs{E}\)(そこには \(\al\) が含まれる)の存在を、累巡回拡大の定義(62B)の説明で書いたシンプルな例で考察します。
代数的数 \(\al\) を、
\(\al=\sqrt{\sqrt{2}+1}\)
とします。この \(\al\) は \(\bs{Q}\) 上の既約な方程式、
\(f(x)=x^4-2x^2-1=0\)
の解の一つです。この \(f(x)\) は \(\al\) の最小多項式です。ちなみに \(f(x)\) は、
\(f(x)=(x^2-(\sqrt{2}+1))(x^2+(\sqrt{2}-1))\)
と変形できるので、方程式 \(f(x)=0\) の解は
\(x=\pm\sqrt{\sqrt{2}+1},\:\:\:\pm i\sqrt{\sqrt{2}-1}\)
の4つです。
\(\al\) を含む \(\bs{Q}\) の拡大体 \(\bs{Q}(\al)\) を考えます。\(\bs{Q}\:\subset\:\bs{Q}(\al)\) ですが、べき根拡大だけで表現すると、
\(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\:\:\subset\:\bs{Q}(\sqrt{\sqrt{2}+1})\)
の累べき根拡大になります。つまり、\(\bs{Q}\) 上の方程式、
\(x^2-2=0\)
の解の一つ \(\sqrt{2}\) を \(\bs{Q}\) に添加してべき根拡大をし、\(\bs{Q}(\sqrt{2})\) 上の方程式、
\(x^2-(\sqrt{2}+1)=0\)
の解の一つ \(\sqrt{\sqrt{2}+1}\) を \(\bs{Q}(\sqrt{2})\) に添加したのが \(\bs{Q}(\sqrt{\sqrt{2}+1})\) です。2つのべき根拡大の拡大次数は2です。\(1\) の原始2乗根は \(-1\) なので、始めから \(\bs{Q}\) に含まれています。従って、
\(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\) は
・べき根拡大
・巡回拡大
\(\mr{Gal}(\bs{Q}(\sqrt{2})=\{\sg_1,\:\sg_2\}\)
\(\sg_1=e\)
\(\sg_2(\sqrt{2})=-\sqrt{2}\)
・\(\bs{Q}(\sqrt{2})\) は \(\bs{Q}\) 上の多項式 \(x^2-2\) の最小分解体
となります。まったく同様に、
\(\bs{Q}(\sqrt{2})\:\subset\:\bs{Q}(\sqrt{\sqrt{2}+1})\) は
・べき根拡大
・巡回拡大
です。しかし、\(\bs{Q}(\sqrt{\sqrt{2}+1})/\bs{Q}\) がガロア拡大ではありません。というのも、\(\bs{Q}(\sqrt{\sqrt{2}+1})\) は \(\bs{Q}\) 上ではなく \(\bs{Q}(\sqrt{2})\) 上の方程式、
\(x^2-(\sqrt{2}+1)=0\)
の解の一つ \(\sqrt{\sqrt{2}+1}\) を \(\bs{Q}(\sqrt{2})\) に添加したものだからです。
そこで、\(\bs{Q}(\sqrt{2})\) 上の2つの方程式、
・\(x^2-\sg_1(\sqrt{2}+1)=0\)
・\(x^2-\sg_2(\sqrt{2}+1)=0\)
の解を順に \(\bs{Q}(\sqrt{2})\) に追加することにします。つまり、
・\(\sqrt{\phantom{-}\sqrt{2}+1}\)
・\(\sqrt{-\sqrt{2}+1}\)
の2つを \(\bs{Q}(\sqrt{2})\) に追加します。ガロア群は必ず単位元 \(e\) を含むので、\(\sg_1(\sqrt{2}+1)\) と \(\sg_2(\sqrt{2}+1)\) のどちらかは \(\al=\sqrt{\sqrt{2}+1}\) になります。この追加は2つともべき根拡大であり、巡回拡大です。こうして出来上がった拡大体を \(\bs{E}\) とすると、
\(\bs{E}=\bs{Q}(\sqrt{\sqrt{2}+1},\sqrt{-\sqrt{2}+1})\)
です。以上のことを別の観点で言うと、多項式 \(g(x)\) を、
\(g(x)=(x^2-\sg_1(\sqrt{2}+1))(x^2-\sg_2(\sqrt{2}+1))\)
と定義するとき、
\(g(x)=0\) の解を \(\bs{Q}(\sqrt{2})\) に追加したのが \(\bs{E}\)
ということになります。\(g(x)\) を計算すると、
\(\begin{eqnarray}
&&\:\:g(x)&=(x^2-\sg_1(\sqrt{2}+1))(x^2-\sg_2(\sqrt{2}+1))\\
&&&=(x^2-(\sqrt{2}+1))(x^2+(\sqrt{2}-1))\\
&&&=x^4-2x^2-1\\
\end{eqnarray}\)
となり、\(g(x)\) は \(\bs{Q}\) 上の多項式です。なぜそうなるかと言うと、\(g(x)\) の係数は \(\sg_1(\sqrt{2}+1)\) と \(\sg_2(\sqrt{2}+1)\) の対称式で表されるからで、従ってガロア群の元 \(\sg_1,\:\sg_2\) を作用させても不変であり、つまり係数が有理数だからです。ここから得られる結論は、
\(\bs{E}\) は \(\bs{Q}\) 上の多項式 \(g(x)\) の最小分解体である
ということです。このことは、\(\al=\sqrt{\sqrt{2}+1}\) の最小多項式が \(x^4-2x^2-1=g(x)\) であったことからも確認できます。従ってガロア拡大の定義(52A)により、
\(\bs{E}/\bs{Q}\) はガロア拡大
です。まとめると、
\(\bs{Q}\:\subset\:\bs{Q}(\al)\:\subset\:\bs{E}\)
\(\bs{E}/\bs{Q}\) は累巡回拡大、かつガロア拡大
である \(\bs{E}\) の存在が証明できました。
以上は "2段階の2次拡大" という非常にシンプルな例ですが、このことを一般的に(多段階の \(n\)次拡大で)述べると次のようになります。
ガロア閉包
\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つである \(\al\) がべき根で表されているとする。このとき「\(\bs{Q}\) のガロア拡大 \(\bs{E}\) で、\(\al\) を含み、\(\bs{E}/\bs{Q}\) が累巡回拡大」であるような 代数拡大体 \(\bs{E}\) が存在する。
[証明]
\(\bs{Q}\)上の方程式 \(f(x)=0\) の解の一つ \(\al\) がべき根で表されているとき、
となる、べき根拡大列 \(\bs{K}_i\) が存在する(= \(\bs{K}/\bs{Q}\) が累べき根拡大)。このべき根拡大列を修正して、
とできることを以下に示す。まず、\(n_i\:(0\leq i < k)\) の最小公倍数を \(n\) とし、\(1\) の原始\(n\)乗根を \(\zeta\) とする。そして、
\(\bs{F}_0=\bs{Q}(\zeta)\)
とおくと、\(\bs{K}_0(=\bs{Q})\:\subset\:\bs{F}_0\) であり、\(\bs{F}_0\) は \(1\) の原始\(n_i\)乗根 \((0\leq i < k)\) を全て含むことになる。
\(\bs{F}_0\) は \(\bs{Q}(\zeta)\) だから、\(\mr{Gal}(\bs{F}_0/\bs{Q})=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は巡回群の直積に同型であり(63F)、従って可解群である(61B)。つまり、\(\bs{F}_0/\bs{Q}\) は累巡回拡大である(62C)。
次に、
\(\bs{F}_1=\bs{F}_0(\al_1)\)
とおく。\(\al_1\) は \(\bs{K}_0=\bs{Q}\) 上の方程式 \(x^{n_0}-a_0=0\:(a_0\in\bs{K}_0\:\subset\:\bs{F}_0)\) の根の一つで、\(\al_1=\sqrt[n_0]{a_0}\) であるから、\(\bs{F}_1\) は \(\bs{F}_0\) のべき根拡大になる。
すると、\(\bs{F}_0\)は \(1\) の原始\(n_0\)乗根を含むから、原始\(\bs{n}\)乗根を含むべき根拡大の定理(63H)により、\(\bs{F}_1/\bs{F}_0\) は巡回拡大である。この拡大次数は \([\bs{F}_1:\bs{F}_0]=[\bs{K}_1:\bs{K}_0(=\bs{Q})]=n_0\) である。
また \(\bs{F}_1\)は、\(\bs{Q}\) 上の方程式 \(x^{n_0}-a_0=0\) の解 \(\al_1\eta^j\)(\(\eta\) は \(1\) の原始\(n_0\)乗根。\(0\leq j < n_0\))をすべて含むから、\(\bs{F}_1/\bs{Q}\) はガロア拡大である。
次に \(\bs{K}_2\) を修正した \(\bs{F}_2\) を考える。\(\mr{Gal}(\bs{F}_1/\bs{Q})\) の元を \(\sg_j\:(1\leq j\leq m,\:\sg_1=e)\) の \(m\)個とする。
\(\al_2\) は \(x^{n_1}-a_1=0\:\:(a_1\in\bs{K}_1\:\subset\:\bs{F}_1)\) の根の一つであった。そこで、
\(\sg_j(a_1)\) \((1\leq j\leq m)\)
という \(m\)個の元をもとに、
\(x^{n_1}-\sg_j(a_1)=0\:(a_1\in\bs{K}_1\:\subset\:\bs{F}_1,\:\:1\leq j\leq m)\)
という \(m\)個の方程式群を考える。\(\sg_j\) の中には単位元 \(e\) が含まれるため、\(x^{n_1}-a_1=0\) も方程式群の中の一つである。
この \(m\)個の方程式の \(m\)個の解、
\(\sqrt[n_1]{\sg_j(a_1)}\) \((1\leq j\leq m)\)
を \(\bs{F}_1\) に順々に添加していき、最終的にできた体を \(\bs{F}_2\) とする。\(\bs{F}_1\) は \(1\) の原始 \(n_1\)乗根を含むから、\(\sqrt[n_1]{\sg_j(a_1)}\) \((1\leq j\leq m)\) の添加はすべて巡回拡大である(63H)。つまり、\(\bs{F}_2\) は \(\bs{F}_1\) の累巡回拡大である。\(\sg_j\) の中には単位元があるから、\(\bs{F}_2\) には \(\al_2=\sqrt[n_1]{a_1}\) を含む。
ここで多項式 \(g(x)\) を、
\(g(x)=\displaystyle\prod_{j=1}^{m}(x^{n_1}-\sg_j(a_1))\)
と定義する。\(\bs{F}_1\) は \(1\) の原始 \(n_1\)乗根を含むから、\(\bs{F}_2\) は \(g(x)=0\) のすべての解を \(\bs{F}_1\) に添加した拡大体である。
多項式 \(g(x)\) の係数は、根と係数の関係から \(\sg_j(a_1)\:\:(1\leq j\leq m)\) の対称式であり、係数に任意の \(\sg_j\:(=\mr{Gal}(\bs{F}_1/\bs{Q})\) の元\()\) を作用させても不変である。つまり係数は有理数であり、\(g(x)\) は \(\bs{Q}\) 上の多項式である。結局、\(\bs{F}_2\) は \(\bs{Q}\) 上の多項式 \(g(x)\) の最小分解体であり、\(\bs{F}_2/\bs{Q}\) はガロア拡大である(52A)。
まとめると、
で、かつ、
\(g(x)=\displaystyle\prod_{j=1}^{m}(x^{n_1}-\sg_j(a_1))\)
の条件で、\(g(x)=0\) のすべての解を \(\bs{F}_1\) に添加した拡大体を \(\bs{F}_2\) とすると、
となる。
この \(\bs{K}_i\) を \(\bs{F}_i\) に修正する操作は、\(\bs{K}_k\) を修正して \(\bs{F}_k\) にするまで続けることができる。従って、
とすることができる。[証明終]
\(1\) の原始\(n\)乗根を含む \(\bs{Q}(\zeta)\) からのべき根拡大を考えることによって、体の拡大が巡回拡大(=ガロア群が巡回群であるガロア拡大)になり(63H)、その繰り返しは累巡回拡大になります。しかし累巡回拡大が "全体としてガロア拡大になる" とは限りません(62B)。
そこで、ひと工夫して、\(\bs{\bs{F}_i}\) が常に \(\bs{\bs{Q}}\) 上の方程式 \(\bs{g(x)}\) の最小分解体で、かつ \(\bs{\al_i}\) を含むようにすると、\(\bs{F}_i/\bs{Q}\) が常にガロア拡大になっているので、\(\bs{E}/\bs{Q}\) もガロア拡大になります。しかも最終到達点である \(\bs{F}_k=\bs{E}\) の中には、元々の方程式の解である \(\al\) がある。このような \(\bs{E}\) の存在が重要です。この \(\bs{Q}(\zeta)\:\rightarrow\:\bs{E}\) の拡大を考えることで、単なるべき根拡大列だった \(\bs{Q}\:\rightarrow\:\bs{K}\) をガロア理論の俎上に乗せることができます。
一方、\(\bs{\bs{Q}(\zeta)/\bs{Q}}\) が累巡回拡大になるのは、全く別のロジックによります。つまり、\(\bs{Q}(\zeta)/\bs{Q}\) がガロア拡大で(63D)かつ、ガロア群が巡回群の直積に同型(63F)であり、従ってガロア群が可解群(61B)だからです。そうすると累巡回拡大ガロア群の可解性(62C)によって \(\bs{Q}(\zeta)/\bs{Q}\) は累巡回拡大です。
以上の2つの合わせ技で、\(\bs{Q}\) から \(\bs{E}\) に至る累巡回拡大の列ができ、しかも \(\bs{E}/\bs{Q}\) がガロア拡大になっていて、次の可解性の必要条件の証明につながります。
可解性の必要条件
\(\bs{Q}\) 上の \(n\)次既約方程式 \(f(x)=0\) の解の一つ がべき根で表されているとする。\(f(x)\) の最小分解体を \(\bs{L}\) とするとき、\(\mr{Gal}(\bs{L}/\bs{Q})\) は可解群である。
[証明]
ガロア閉包の存在定理(64A)により、\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つがべき根で表されているとすると、
となるものが存在する。\(\bs{E}/\bs{Q}\) がガロア拡大なので、\(\mr{Gal}(\bs{E}/\bs{Q})\) による \(\al\) の移り先(\(f(x)=0\) の解)は \(\bs{E}\) に含まれる。最小分解体 \(\bs{L}\) は \(f(x)=0\) の \(n\)個の解を含む最小の体である。ゆえに \(\bs{E}\) は最小分解体 \(\bs{L}\) を含んでいる。
また、\(\bs{E}/\bs{Q}\) がガロア拡大ということは、中間体からのガロア拡大の定理(52C)により、\(\bs{E}/\bs{L}\) もガロア拡大である。従って、
\(\mr{Gal}(\bs{E}/\bs{Q})=G\)
\(\mr{Gal}(\bs{E}/\bs{L})=H\)
と書くと、
\(G\) \(\sp\) \(H\) \(\sp\) \(\{\:e\:\}\)
\(\bs{Q}\) \(\subset\) \(\bs{L}\) \(\subset\) \(\bs{E}\)
のガロア対応(53B)が成り立つ。
\(\bs{L}\) は \(\bs{Q}\) 上の既約多項式 \(f(x)\) の最小分解体だから、\(\bs{L}/\bs{Q}\) はガロア拡大である(52A)。ゆえに正規性定理(53C)により、\(H\) は \(G\) の正規部分群であり、
\(\mr{Gal}(\bs{L}/\bs{Q})\:\cong\:G/H\)
が成り立つ。
\(\bs{E}/\bs{Q}\) はガロア拡大かつ累巡回拡大だから、累巡回拡大ガロア群の可解性(62C)の定理によって \(G\) は可解群である。\(G\) が可解群なので、その剰余群である \(G/H\) も可解群である(61D)。従って、\(G/H\) と同型である \(\mr{Gal}(\bs{L}/\bs{Q})\) も可解群である。[証明終]
この定理の対偶をとると、
となります。これを用いて、非可解な5次方程式があることを証明できます。
6.5 5次方程式の解の公式はない
5次方程式には解の公式はないことをガロア理論で証明します。そのためにまず、対称群、交代群、置換の説明をします。
対称群 \(S_n\)
集合 \(\Omega_n=\{1,\:2,\:\cd\:n\}\) から \(\Omega_n\) への全単射写像(1対1写像)の全体を \(S_n\) と書き、\(n\)次の対称群(symmetric group)と言います。\(1,\:2,\:\cd\) は整数ではなく、集合の元を表す文字です。一般に集合 \(X\) から \(X\) への全単射写像を置換(permutation)と呼ぶので、\(S_n\) の元は \(n\) 個の文字の置換です。
\(S_n\) の元の一つを \(\sg\) とします。\(1\leq k\leq n\) とし、\(\sg\)による \(k\) の移り先を \(\sg(k)\) とすると、\(\sg\) は全単射写像なので、\(k\neq k\,'\) なら\(\sg(k)\neq\sg(k\,')\) です。従って、\((\sg(1),\sg(2),\cd,\sg(n))\) は、\((1,2,\cd n)\) の一つの順列になります。逆に、\((1,2,\cd n)\) の順列の一つを \((i_1,i_2,\cd i_n)\) とすると、\(\sg(k)=i_k\) で \(\Omega_n\) から \(\Omega_n\) への全単射写像が得られます。つまり \(S_n\) は \((1,2,\cd n)\) のすべての順列と同一視できます。
\(S_n\) の元の2つを \(\sg\)、\(\tau\) とし、\(\sg\) と \(\tau\) の合成写像 \(\sg\tau\) を、
\(\sg\tau(k)=\sg(\tau(k))\:\:(1\leq k\leq n)\)
で定義すると、\(\sg\tau\) も全単射写像なので \(S_n\) の元であり、\(S_n\) は群になります。単位元 \(e\) は \(e(k)=k\:(1\leq k\leq n)\) である恒等写像です。また、\(\sg\) は全単射写像なので逆写像 \(\sg^{-1}\) があり、群の定義を満たしています。
\(S_n\) は \((1,2,\cd n)\) のすべての順列と同一視できるので、その位数は
\(|S_n|=n\:!\)
です。\(S_n\) の元 \(\sg\) を、
\(\sg=\left(\begin{array}{c}1&2&\cd&n\\\sg(1)&\sg(2)&\cd&\sg(n)\end{array}\right)\)
と表します。この表記では縦の列が合っていればよく、並び順に意味はありません。これを使うと \(\sg\) の逆元は、
\(\sg^{-1}=\left(\begin{array}{c}\sg(1)&\sg(2)&\cd&\sg(n)\\1&2&\cd&n\end{array}\right)\)
です。
\(S_3\) の元を \(\sg_1,\sg_2,\:\cd\:\sg_6\) とし、具体的に書いてみると、
\(\sg_1=\left(\begin{array}{c}1&2&3\\1&2&3\end{array}\right)\) \(\sg_2=\left(\begin{array}{c}1&2&3\\2&3&1\end{array}\right)\)
\(\sg_3=\left(\begin{array}{c}1&2&3\\3&1&2\end{array}\right)\) \(\sg_4=\left(\begin{array}{c}1&2&3\\1&3&2\end{array}\right)\)
\(\sg_5=\left(\begin{array}{c}1&2&3\\3&2&1\end{array}\right)\) \(\sg_6=\left(\begin{array}{c}1&2&3\\2&1&3\end{array}\right)\)
となります。\(\sg_1\) は恒等置換 \(e\) です。なお \(S_3\) は、1.3節に出てきた3次の2面体群と同じものです。
巡回置換
\(S_n\) に現れる \(n\)文字からその一部を取り出します。例えば3つ取り出して、\(i,\:j,\:k\) とします。そして、
\(i\rightarrow j,\:\:j\rightarrow k,\:\:k\rightarrow i\)
と文字を循環させ、その他の文字は不動にする置換 \(\sg\) を考えます。これが巡回置換(cyclic permutation)です。
\(\sg=\left(\begin{array}{c}\cd&i&\cd&j&\cd&k&\cd\\\cd&j&\cd&k&\cd&i&\cd\end{array}\right)\)
と表せて、\(\cd\) の部分は不動です。これを簡略化して、
\(\sg=(i,\:j,\:k)\)
と表記します。\(\sg\) の逆元は、
です。一般に \(m\)文字の巡回置換 \((1\leq m\leq n)\) は、
\(\sg=(i_1,\:i_2,\:\cd\:,i_m)\)
です。長さ \(m\) の巡回置換、とも言います。逆元は文字の順序を逆順にした、
\(\sg^{-1}=(i_m,\:i_{m-1},\:\cd\:,i_1)\)
です。\(m\)文字の巡回置換を群としてとらえたとき、 \(C_m\) で表します。\(C_m\) は位数 \(m\) の巡回群で、可換群です。
特に、2文字の巡回置換を互換(transposition)と言います。巡回置換と互換について、次の定理が成り立ちます。
すべての置換は共通文字を含まない巡回置換の積で表せる。
[証明]
\(n\)次対称群 \(S_n\) の任意の元を \(\sg\) とすると、\(\sg\) は \(n\)文字の任意の置換である。\(n\)文字の中から \(\sg(a)\neq a\) である文字 \(a\) を選ぶ。そして \(\sg(a),\:\sg^2(a),\:\sg^3(a),\:\cd\) という、\(\sg\) による \(a\) の写像を繰り返す列を考える。\(\sg\)による \(a\) の移り先は最大 \(n\)個なので、列の中には、
\(\sg^j(a)=\sg^i(a)\:\:(i < j)\)
となる \(i,\:j\) が必ず出てくる。つまり、
\(\sg^{j-i}(a)=a\)
となる \(i,\:j\) が存在する。\(k_a\) を \(\sg^{k_a}(a)=a\) となる最小の数とすると、
\(\sg_1=(\sg(a),\:\sg^2(a),\:\cd\:,\sg^{k_a}(a))\)
の巡回置換と定義する。
もし仮に列 \((\br{A})\) が、\(\sg\) で変化する文字全部を尽くしているなら、題意は正しい。そうでないとき、列 \((\br{A})\) に現れない文字で \(\sg(b)\neq b\) である \(b\) を選ぶ。上と同様にして、
\(\sg_2=(\sg(b),\:\sg^2(b),\:\cd\:,\sg^{k_b}(b)=b)\)
という、2つ目の巡回置換が定義できる。列 \((\br{A})\) と \((\br{B})\) が \(\sg\) で変化する文字全部を尽くすなら、\(\sg=\sg_2\sg_1\) である。\(\sg_1\) と \(\sg_2\) に共通の文字は現れないので、\(\sg=\sg_1\sg_2\) と書いてもよい。
以上の操作は、\(\sg\) で変化する文字全部を尽くすまで繰り返すことができる。その繰り返し回数を \(m\) とすると、
\(\sg=\sg_1\sg_2\:\cd\:\sg_m\)
であり、任意の置換 \(\sg\) は巡回置換の積で表せることになる。なお、恒等置換 \(e\) は、
\(e=(i,\:j)^2\)
\(e=(i,\:j,\:k)^3\)
などであり、巡回置換の積で表せることに変わりはない。[証明終]
置換を巡回置換の積で表すと、例えば、
となります。
すべての置換は互換の積で表せる。
[証明]
巡回置換 \((1,\:2,\:3)\) は
\((1,\:2,\:3)=(1,\:3)(1,\:2)\)
と表せる(積は右から読む)。また、巡回置換 \((1,\:2,\:3\). \(4)\) は、
\((1,\:2,\:3,\:4)=(1,\:4)(1,\:3)(1,\:2)\)
である。一般に、
\((i_1,\:i_2,\:\cd\:,i_m)=(i_1,\:i_m)\:\cd\:(i_1,\:i_2)\)
である。このように巡回置換は互換の積で表せる。すべての置換は巡回置換の積で表せる(65A)ので、題意は正しい。[証明終]
交代群 \(A_n\)
一つの置換を互換の積で表す方法が一意に決まるわけではありません。たとえば、
です(積は右から読む)。ただし、積に現れる互換の数が偶数か奇数かは一意に決まります。
一つの置換を互換の積で表したとき、その互換の数は奇数か偶数かのどちらかに決まる。
[証明]
\(n\)変数の多項式 \(f(x_1,x_2,\cd,x_n)\) を、
\(f(x_1,x_2,\cd,x_n)=\displaystyle\prod_{1\leq i < j\leq n}^{}(x_i-x_j)\)
と定義する(差積と呼ばれる)。\(S_n\) の一つの元を \(\sg\) とし、\(\sg\) を \(f(x_1,x_2,\cd,x_n)\) に作用させることを、
\(\sg\cdot f(x_1,x_2,\cd,x_n)=f(x_{\sg(1)},x_{\sg(2)},\cd,x_{\sg(n)})\)
と定義する。\(\sg\) が互換、つまり \(\sg=(i,\:j)\) であれば、
\((i,\:j)\cdot f(x_1,x_2,\cd,x_n)=-f(x_1,x_2,\cd,x_n)\)
となる。これはすべての互換で成り立つ。
\(\sg\) が \(k\)個の互換の積で表されていると、
\(\sg\cdot f(x_1,x_2,\cd,x_n)=(-1)^kf(x_1,x_2,\cd,x_n)\)
である。もし、\(m\neq k\) として \(\sg\) が \(m\)個の互換の積で表せたとしたら、
\(\sg\cdot f(x_1,x_2,\cd,x_n)=(-1)^mf(x_1,x_2,\cd,x_n)\)
である。従って、
\((-1)^k=(-1)^m\)
であり、\(k\) と \(m\) の偶奇は等しい。[証明終]
置換の偶奇性(65C)により、置換は2つのタイプに分けることができます。偶数個の互換の積で表す置換を偶置換(even permutaion)、奇数個の互換の積で表す置換を奇置換(odd permutaion)と言います。
偶置換の積は偶置換です。従って、\(S_n\) の偶置換の元を集めた集合は群になります。これを \(n\)次交代群(alternating group)といい、\(A_n\) で表します。
\(S_n\) の元は同数の偶置換と奇置換から成る。従って、
\([\:S_n\::\:A_n\:]=2\)
である。
\(A_n\) は \(S_n\) の正規部分群であり、\(S_n/A_n\) は巡回群である。
[証明]
\(B_n\) を \(S_n\) に含まれる奇置換の集合とする。\(S_n\) の任意の互換を \(\sg\) とすると、集合 \(\sg A_n\) のすべての元は奇置換だから、
\(\sg A_n\subset B_n\)
が成り立つ。それとは逆に、集合 \(\sg B_n\) のすべての元は偶置換だから、
\(\sg B_n\subset A_n\)
も成り立つ。この式に左から \(\sg\) を作用させると、
\(\sg^2B_n\subset\sg A_n\)
\(B_n\subset\sg A_n\)
となる。\(\sg A_n\subset B_n\) かつ \(B_n\subset\sg A_n\) なので、
\(B_n=\sg A_n\)
となり、\(B_n\) と \(A_n\) の元の数は等しい。\(S_n=A_n\cup B_n\) なので、
\([\:S_n\::\:A_n\:]=2\)
である。
\(S_n\) の部分群 \(A_n\) の元の数は \(S_n\) の元の数の半分なので、\(S_n\) は \(A_n\) の2つの左剰余類(または右剰余類)の和集合である。従って、\(B_n\) の 任意の元を \(b\) とすると、
(\(A_n\) の左剰余類) \(S_n=A_n\cup bA_n\:\:(A_n\cap bA_n=\phi)\)
(\(A_n\) の右剰余類) \(S_n=A_n\cup A_nb\:\:(A_n\cap A_nb=\phi)\)
となり、\(bA_n=A_nb\) である。また \(A_n\) の元 \(a\) については、\(A_n\) が群なので \(aA_n=A_n,\:A_na=A_n\) である。従って \(S_n\) の任意の元 \(\sg\) について \(\sg A_n=A_n\sg\) が成り立ち、\(A_n\) は \(S_n\) の正規部分群である。
\(A_n\) が正規部分群なので、\(S_n/A_n\) は剰余群である。\(S_n\) の任意の元を \(\sg\) とし、\(S_n/A_n\) の元を \(\sg A_n\) とすると、
\((\sg A_n)^2=\sg A_n\sg A_n=\sg\sg A_nA_n=\sg^2A_n\)
となるが、\(\sg A_n=B_n\) であり \(\sg B_n=A_n\) だから、\(\sg^2A_n=A_n\) である。つまり、
\((\sg A_n)^2=A_n\)
を満たす。\(A_n\) は 剰余群 \(S_n/A_n\) の単位元だから、\(S_n/A_n\) は巡回群でである。[証明終]
交代群 \(A_n\) の任意の元は、3文字の巡回置換の積で表せる。
[証明]
\(A_n\) の任意の元は偶数個の互換の積で表せる。この互換の積を2つずつ右から(ないしは左から)取り出すことを考える。2つの互換の積には4つの文字があるが、それには次の2つパターンがある。
異なる4文字
\((i,\:j)(k,\:m)\)
異なる3文字
\((i,\:j)(i,\:k)\)
異なる3文字のうち、\((i,\:j)(j,\:k)\) のパターンは、\(i\) を \(j\) と読み替え、\(j\) を \(i\) と読み替えると \((j,\:i)(i,\:k)\) となり、\((i,\:j)(i,\:k)\) と同じである。また、\((i,\:j)(k,\:i)\) や \((i,\:j)(k,\:j)\) も \((i,\:j)(i,\:k)\) と同じである。
異なる2文字から成る \((i,\:j)(i,\:j)\) は恒等互換なので無視してよい。
2つの互換の積の2パターンは、いずれも3文字の巡回置換の積で表せる。つまり、
\(\left(\begin{array}{c}i&j&k&m\\k&i&j&m\end{array}\right)=(i,\:k,\:j)\)
\(\left(\begin{array}{c}k&i&j&m\\j&i&m&k\end{array}\right)=(j,\:m,\:k)\)
\(\left(\begin{array}{c}i&j&k&m\\j&i&m&k\end{array}\right)=(i,\:j)(k,\:m)\)
なので、
\((i,\:j)(k,\:m)=(j,\:m,\:k)(i,\:k,\:j)\)
である。また、巡回置換を互換の積で表す標準的な方法(65B)から、
\((i,\:j)(i,\:k)=(i,\:k,\:j)\)
である。
\(A_n\) は「2つの互換の積」の積、で表現でき、「2つの互換の積」は「3文字の巡回置換の積」で表せるので、題意は正しい。[証明終]
なお、上の交代群は正規部分群(65D)の証明では、「交代群 \(A_n\) の元の数が、対称群 \(S_n\) の元の数の半分である」ことしか使っていません。従って次の定理が成り立ちます。
群 \(G\) の部分群を \(N\) とする。
\(|G|=2|N|\)
のとき(つまり 群の指数 \([G:N]=2\) のとき)、\(N\) は \(G\) の正規部分群である。
対称群の可解性
5次以上の対称群、\(S_n\:\:(n\geq5)\) は可解群ではない。
[証明]
\(S_n\) の交代群を \(A_n\) とする。\(A_n\) は \(S_n\) の部分群なので、もし \(A_n\) が可解群でなければ、可解群の部分群は可解群の定理(61C)の対偶により、\(S_n\) は可解群ではない。以下、\(A_n\) が可解群でないことを背理法で証明する。
\(A_n\) が可解群と仮定して矛盾を導く。\(A_n\) が可解群とすると、定義により \(A_n\) には正規部分群 \(N\:(N\neq A_n)\) があり、\(A_n/N\) が巡回群である。
\(A_n\) の任意の2つの元を \(x,\:y\) とし、剰余類 \(xN\) と \(yN\) を考える。\(A_n/N\) は巡回群なので可換群であり、\(xNyN=yNxN\) である。\(N\) は正規部分群なので、\(Ny=yN\)、\(Nx=xN\) であり、これを用いて \(xNyN=yNxN\) を変形していくと、
\(xNyN=yNxN\)
\(xyNN=yxNN\)
\(xyN=yxN\)
となる。この式に左から \(x^{-1}y^{-1}\) をかけると、
\(x^{-1}y^{-1}xyN=x^{-1}y^{-1}yxN\)
\(x^{-1}y^{-1}xyN=N\)
となる。部分群の元の条件の定理(41C)より、\(aN=N\) と \(a\in N\) は同値である。従って、
\(x^{-1}y^{-1}xy\in N\)
である。
一般に \(x^{-1}y^{-1}xy\) を \(x\) と \(y\) の交換子と呼ぶ。上の式の変形プロセスから言えることは、\(A_n\) の任意の2つの元(\(N\) の元である必要はない)の交換子は \(N\) の元になるということである。
\(S_n\:\:(n\geq5)\) の任意の3文字巡回置換を \((i,\:j,\:k)\) とする。
\((i,\:j,\:k)=(i,\:k)(i,\:j)\)
なので、\((i,\:j,\:k)\) は偶置換であり、
\((i,\:j,\:k)\in A_n\)
である。ここで、\(\bs{i,\:j,\:k}\) とは違う2つの文字 \(\bs{l,\:m}\) を選ぶ。\(\bs{n\geq5}\) ならこれは常に可能である。そして、
\(x=(i,\:m,\:j)\)
\(y=(i,\:l,\:k)\)
とし、\(x,\:y\) の交換子を作ってみる。計算すると以下のようになる。
\(x^{-1}y^{-1}xy\)
\(=(i,\:m,\:j)^{-1}(i,\:l,\:k)^{-1}(i,\:m,\:j)(i,\:l,\:k)\)
\(=(j,\:m,\:i)(k,\:l,\:i)(i,\:m,\:j)(i,\:l,\:k)\)
\(x^{-1}y^{-1}xy\)
\(=(j,\:m,\:i)(k,\:l,\:i)(i,\:m,\:j)(i,\:l,\:k)\)
\(=\left(\begin{array}{c}i&j&k&l&m\\j&k&i&l&m\end{array}\right)\)
\(=(i,\:j,\:k)\)
\(x^{-1}y^{-1}xy\in N\) なので、
\((i,\:j,\:k)\in N\)
である。つまり任意の3文字巡回置換は \(N\) に含まれる。
\(A_n\) のすべての元は3文字巡回置換の積で表される(65E)から、\(A_n\) は \(N\) の元の積で表せることになる。つまり、
\(A_n\subset N\)
だが、もともと \(N\) は \(A_n\) の部分集合だから、
\(A_n=N\)
である。これは \(N\neq A_n\) という仮定と矛盾する。従って、\(A_n\) の正規部分群 \(N\:(N\neq A_n)\) で、\(A_n/N\) が巡回群であるようなものはなく、\(A_n\) は可解群ではない。
\(S_n\:\:(n\geq5)\) は可解群ではない部分群 \(A_n\) をもつから、可解群の部分群は可解群の定理(61C)の対偶によって、\(S_n\) は可解群ではない。[証明終]
\(S_5\)(位数 \(120\)) や、その部分群 \(A_5\)(位数 \(60\))は可解群ではありません。しかし、「\(S_5\) のすべての部分群が可解群ではない」というわけではありません。\(S_5\) の部分群では、\(F_{20}\)(位数 \(20\))、\(D_{10}\)(位数 \(10\))、\(C_5\)(位数 \(5\))が可解群であることが知られています。これについては第7章で述べます。
一般5次方程式
5次方程式には代数的に解けるものと解けないものがあります。従って、全ての5次方程式に適用可能な根の公式はありません。5次方程式に根の公式がないことはガロア以前に証明されていたのですが、なぜ根の公式がないのか、その理由を明らかにしたのがガロア理論です。
係数が変数の方程式を「一般方程式」と言います。根の公式があるということは一般方程式が解けることを意味します。以下は、一般5次方程式が代数的に解けないことの証明ですが、この証明では係数が変数ではなく、解を変数としています。
\(\bs{Q}\) の代数拡大体を \(\bs{K}\) とする。\(\bs{K}\) の任意の元である5つの変数 \(b_1,b_2,b_3,b_4,b_5\) を根とする多項式を、
\(\begin{eqnarray}
&&\:\:f(x)&=(x-b_1)(x-b_2)(x-b_3)(x-b_4)(x-b_5)\:\:(b_i\in\bs{K})\\
&&&=x^5-a_4x^4+a_3x^3-a_2x^2+a_1x-a_0\\
\end{eqnarray}\)
とし、\(\bs{Q}\) に \(a_0,a_1,a_2,a_3,a_4,\)を添加した代数拡大体を \(\bs{F}\) とする。つまり、
\(\bs{F}=\bs{Q}(a_0,\:a_1,\:a_2,\:a_3,\:a_4)\)
である。
このとき、\(\bs{K}\) の \(\bs{F}\) 上の ガロア群 \(G\) は5次対称群 \(S_5\) である。\(S_5\) は可解群ではないので(65G)、従って \(b_i\) を \(a_i\) のべき根で表すことはできない。
[証明]
代数拡大体 \(\bs{F}\) の作り方から、\(\bs{K}\) は \(\bs{F}\) 上の多項式 \(f(x)\) の最小分解体である。従って \(\bs{K}/\bs{F}\) はガロア拡大である。\(G=\mr{Gal}(\bs{K}/\bs{F})\) とおくと、\(G\) は \(\bs{F}\) の元を固定する自己同型写像が作る群である。
対称群 \(S_5\) の元の一つを \(s\) とし、
\(s=\left(\begin{array}{c}1&2&3&4&5\\s(1)&s(2)&s(3)&s(4)&s(5)\end{array}\right)\)
とする。このとき、
\(\sg(b_i)=b_{s(i)}\:\:(i=1,2,3,4,5)\)
で、\(b_i\) に作用する写像 \(\sg\) を定義する。そうすると \(\sg\) は \(f(x)=0\) の解 \(b_i\) を共役な解に移す写像だから、自己同型写像である。また、
\(\begin{eqnarray}
&&\:\:f(x)&=(x-b_1)(x-b_2)(x-b_3)(x-b_4)(x-b_5)\:\:(b_i\in\bs{K})\\
&&&=x^5-a_4x^4+a_3x^3-a_2x^2+a_1x-a_0\\
\end{eqnarray}\)
の根と係数の関係から、
である。つまり \(a_i\:(0\leq i\leq4)\) は \(b_i\:(1\leq i\leq5)\) の対称式で表される。
従って、\(\sg(a_0)=a_0\)、\(\sg(a_1)=a_1\)、\(\sg(a_2)=a_2\)、\(\sg(a_3)=a_3\)、\(\sg(a_4)=a_4\) である。つまり \(\sg\) は \(\bs{F}=\bs{Q}(a_0,\:a_1,\:a_2,\:a_3,\:a_4)\) の元を固定する。従って \(\sg\) は \(\bs{F}\) の元を固定する \(\bs{K}\) の自己同型写像であり、\(G\) の元である。以上のことは \(S_5\) の任意の元 \(s\) について言えるから \(S_5\subset G\) である。
これを踏まえて \(\bs{F}\) 上の \(\bs{K}\) の拡大次数 \([\:\bs{K}\::\:\bs{F}\:]\) を考えると、\([\:\bs{K}\::\:\bs{F}\:]\) は \(\mr{Gal}(\bs{K}/\bs{F})\) の位数に等しいから、
\([\:\bs{K}\::\:\bs{F}\:]=|G|\geq|S_5|=5!=120\)
である。
次に、
という体の拡大列を考える。最初の拡大 \(\bs{F}\subset\bs{F}(b_1)\) をみると、\(b_1\) は \(\bs{F}\) 上の 5次方程式 \(f(x)=0\) の根だから、
\([\:\bs{F}(b_1)\::\:\bs{F}\:]\leq\mr{deg}\:f(x)\:=5\)
である。等号は \(f(x)\) が既約多項式のときである。さらに、\(b_2\) は
4次方程式 \(f(x)/(x-b_1)\) の根だから、
\([\:\bs{F}(b_1,b_2)\::\:\bs{F}(b_1)\:]\leq4\)
である。以上を順に続けると、体の拡大次数の連鎖律(33H)により、
\([\:\bs{K}\::\:\bs{F}\:]\)
である。従って、\([\:\bs{K}\::\:\bs{F}\:]\geq5!\) と合わせると \([\:\bs{K}\::\:\bs{F}\:]=5!\) であり、
\(|G|=|S_5|\)
となって、
\(G\cong S_5\)
である。つまり、一般5次方程式のガロア群は \(S_5\) と同型であることが証明できた。\(S_5\) は可解群ではないので(65G)、それと同型である \(G\) も可解群ではない。従って \(b_i\) を \(a_i\) のべき根で表すことはできず、一般5次方程式に解の公式はない。[証明終]
6.6 可解ではない5次方程式
5次方程式の全てに適用できる解の公式がないことは、ガロア以前に証明されていました(アーベル・ルフィニの定理)。しかしガロア理論によって、解の公式がないことの「原理」が明確になりました。つまり係数が変数である一般5次方程式は、解が四則演算とべき根で表現できる(=可解である)ための必要条件を満たさないから公式は作れないのです(65H)。
ということは、この「原理」を用いて、可解ではない、係数が数値の方程式を具体的に構成できることになります。それを以下で行います。そのためにまず、コーシーの定理を証明します。なお、コーシー(19世紀フランスの数学者)の名がついた定理はいくつかありますが、これは「群論のコーシーの定理」です。
コーシーの定理
群 \(G\) の位数 \(|G|\) が素数 \(p\) を約数にもつとき、\(g^p=e\:\:(g\neq e)\) となる \(G\) の元 \(g\) が存在する。つまり、\(G\) は位数 \(p\) の巡回群を部分群としてもつ。
[証明]
本論に入る前に、証明に使う定義を行う。\(X\) を、元の数が \(N\) の集合とし、そこから重複を許して \(n\)個の元を取り出して1列に並べた順列を考える。このような順列の集合を \(P\) とする。つまり、
\(P=\{\:(x_1,x_2,\cd,x_n)\:|\:x_i\in X\:\}\)
である。\((x_1,x_2,\cd,x_n)\) は並べる順序に意味がある、いわゆる重複順列で、集合 \(P\) の元の数は、
\(|P|=N^n\)
である。
\(P\) から自分自身 \(P\) への写像 \(\sg\) を、
\(\sg\::\:(x_1,x_2,\cd,x_n)\longmapsto(x_n,x_1,x_2,\cd,x_{n-1})\)
と定義する。最後尾の元を先頭に持ってくる "循環写像" である(ここだけの用語)。そうすると、集合 \(P\) の任意の元、\(\bs{a}\) について、
\(\sg^n(\bs{a})=\bs{a}\)
となり、\(\sg^n=e\) (\(e\::\) 恒等写像)である。
次に、集合 \(P\) のある元を \(\bs{a}\) としたとき、
\(\sg^d(\bs{a})=\bs{a}\)
となる最小の \(d\:\:(1\leq d\leq n)\) を、"\(\bs{a}\) の循環位数" と定義する(ここだけの用語)。そうすると、循環位数 \(\bs{d}\) は \(\bs{n}\) の約数になる。なぜなら、もし
\(n=kd+r\:\:(1\leq r < d)\)
だとすると、
\(\begin{eqnarray}
&&\:\:\sg^n(\bs{a})&=\sg^{kd+r}(\bs{a})\\
&&&=\sg^r((\sg^d)^k(\bs{a}))\\
&&&=\sg^r(\bs{a})\\
&&\:\:\sg^r(\bs{a})&=\bs{a}\\
\end{eqnarray}\)
となって、\(d\) が \(\sg^d(\bs{a})=\bs{a}\) となる最小の数ではなくなるからである。
循環位数の例をあげると、
\(\begin{eqnarray}
&&\:\:N&=6\\
&&\:\:X&=\{\:1,\:2,\:3,\:4,\:5,\:6\:\}\\
&&\:\:n&=6\\
\end{eqnarray}\)
の場合、
\(\bs{a}=(1,\:2,\:3,\:4,\:5,\:6)\:\:\rightarrow\:\:d=6\)
\(\bs{a}=(1,\:2,\:2,\:2,\:2,\:2)\:\:\rightarrow\:\:d=6\)
\(\bs{a}=(1,\:2,\:3,\:1,\:2,\:3)\:\:\rightarrow\:\:d=3\)
\(\bs{a}=(1,\:2,\:1,\:2,\:1,\:2)\:\:\rightarrow\:\:d=2\)
\(\bs{a}=(1,\:1,\:1,\:1,\:1,\:1)\:\:\rightarrow\:\:d=1\)
などである。以上を踏まえて本論に入る。
積が単位元になるような \(G\) の \(p\)個(\(p\):素数)の元の組の集合、
\(S\:=\:\{\:(x_1,x_2,\cd,x_p)\:\:|\:\:x_i\in G,\:x_1x_2\cd x_p=e\:\}\)
を考える。まず、\(S\) の元の数 \(|S|\) を求める。\(S\) の始めから \(p-1\) 個までの \(x_i\:(1\leq i\leq p-1)\) は、全く任意に選ぶことができる。なぜなら、そうしておいて
\(x_p=(x_1x_2\cd x_{p-1})^{-1}\)
とすれば、
\(x_1x_2\cd x_{p-1}x_p\)
\(=x_1x_2\cd x_{p-1}(x_1x_2\cd x_{p-1})^{-1}\)
\(=e\)
となり、\(S\) の元になるからである。\(x_i\:(1\leq i\leq p-1)\) の選び方はそのすべてについて \(|G|\) 通りあるから、
\(|S|=|G|^{p-1}\)
である。
次に、\(S\) の任意の元を \(\bs{a}\) とすると、\(\sg(\bs{a})\) もまた \(S\) の元になる。なぜなら、
\(\bs{a}=(x_1,x_2,\cd,x_p)\:\:\:(x_i\in G)\)
とおくと、
\(x_1x_2\cd x_{p-1}x_p=e\)
だが、この式に左から \(x_p\) をかけ、右から \(x_p^{-1}\) をかけると、
\(x_px_1x_2\cd x_{p-1}x_px_p^{-1}=x_pex_p^{-1}\)
\(x_px_1x_2\cd x_{p-1}=e\)
となり、これは \(\sg(\bs{a})\in S\) を意味しているからである。
\(S\) のすべての元に循環位数を割り振ると、\(\bs{p}\) が素数なので、循環位数は \(\bs{1}\) か \(\bs{p}\) のどちらかである。循環位数が \(1\) である \(S\) の元とは、
\((\overbrace{x,\:x,\:\cd\:,\:x}^{p\:個})\:\:(x\in G)\)
のように、\(G\) の同じ元を \(p\) 個並べたものである。また、循環位数が \(p\) の元とは、\(p\)個の \(G\) の元に1つでも違うものがあるような \(S\) の元である。
そこで、循環位数 \(p\) の \(S\) の元に着目する。その一つを \(\bs{a}_1\) とすると、
\(S_1=\{\bs{a}_1,\:\sg(\bs{a}_1),\:\sg^2(\bs{a}_1),\:\cd\:,\sg^{p-1}(\bs{a}_1)\}\)
は、すべて相異なる \(p\) 個 の \(S\) の元である。さらに、\(S_1\) に含まれない循環位数 \(p\) の元を \(\bs{a}_2\) とすると、
\(S_2=\{\bs{a}_2,\:\sg(\bs{a}_2),\:\sg^2(\bs{a}_2),\:\cd\:,\sg^{p-1}(\bs{a}_2)\}\)
も、すべて相異なる \(p\) 個 の \(S\) の元であり、しかも \(S_1\) とは重複しない。この操作は順々に繰り返せるから、いずれ循環位数 \(p\) の元は \(S_1,\:S_2,\:\cd\) でカバーできることとなる。循環位数 \(p\) の \(S\) の元の全部が、
\(S_1\:\cup\:S_2\:\cup\:\cd\:\cup\:S_q\)
と表現できたとしたら、その元の数は \(pq\) である。
循環位数 \(1\) の \(S\) の元の数は、\(S\) の元の数から循環位数 \(p\) の元の数を引いたものである。
\(|S|=|G|^{p-1}\)
だったから、\(p\) が \(|G|\) の約数である、つまり \(|G|\) が \(p\) の倍数であることに注意すると、
循環位数 \(1\) の元の数
\(=|G|^{p-1}-pq\equiv0\:\:(\mr{mod}\:p)\)
となる。この、循環位数 \(1\) の元の数は \(0\) ではない。なぜなら、
\((\overbrace{e,\:e,\:\cd\:,\:e}^{p\:個})\)
は 循環位数が \(1\) の元だからである。つまり、循環位数 \(1\) の元の数は \(p\) 以上の \(p\) の倍数である。従って、\(S\) には \((e,\:e,\:\cd\:,\:e)\) 以外に、
\((\overbrace{g,\:g,\:\cd\:,\:g}^{p\:個})\:\:\:\:(g\neq e,\:g\in G)\)
が必ず存在する。従って、
\(g^p=e\:\:(g\neq e)\)
である \(g\) が存在する。この式が成立するということは、\(g\) の位数は \(p\) の約数であるが、\(p\) が素数なので、\(g\) の位数は \(p\) である。従って、
\(\{\:g,\:g^2,\:\cd\:,g^{p-1},\:g^p=e\:\}\)
は位数 \(p\) の巡回群である。[証明終]
実数解3つの5次方程式は可解ではない
\(f(x)\) を既約な5次多項式とする。方程式 \(f(x)=0\) が複素数解を2つ、実数解を3つもつなら、方程式は可解ではない。
[証明]
\(f(x)=0\) の複素数解を \(\al_1,\:\al_2\)、実数解を \(\al_3,\:\al_4,\:\al_5\) とする。また、それらを \(\bs{Q}\) に付加した体を \(\bs{L}=\bs{Q}(\al_1,\al_2,\al_3,\al_4,\al_5)\) とする。また、ガロア群 \(\mr{Gal}(\bs{L}/\bs{Q})\) を \(G\) と書く。
一般に、複素数 \(z=r+is\) が有理数係数の方程式の解なら、\(\ol{\,z\,}=r-is\) も解である。つまり \(z\) と \(\ol{\,z\,}\) は共役(同じ方程式の解同士)である(=共役複素数)。その理由は以下である。
まず、\(z_1\) と \(z_2\) を2つの複素数とすると、
\(\ol{z_1+z_2}=\ol{z_1}+\ol{z_2}\)
が成り立つ。また、
\(z_1=r+is\)
\(z_2=u+iv\)
とすると、
\(\begin{eqnarray}
&&\:\:z_1z_2&=ru-sv+i(su+rv)\\
&&\:\:\ol{z_1}\cdot\ol{z_2}&=(r-is)(u-iv)\\
&&&=ru-sv-i(su+rv)\\
\end{eqnarray}\)
なので、
\(\ol{z_1z_2}=\ol{z_1}\cdot\ol{z_2}\)
である。有理数係数の方程式を、3次方程式の例で、
\(x^3+ax^2+bx+c=0\)
とし、\(z\) をこの方程式の解だとすると、
\(z^3+az^2+bz+c=0\)
\(\ol{z^3+az^2+bz+c}=\ol{\,0\,}\)
\(\ol{z^3}+\ol{az^2}+\ol{bz}+\ol{\,c\,}=0\)
\(\ol{\,z\,}^3+\ol{\,a\,}\ol{\,z\,}^2+\ol{\,b\,}\ol{\,z\,}+c=0\)
\(\ol{\,z\,}^3+a\ol{\,z\,}^2+b\ol{\,z\,}+c=0\)
となって、\(\ol{\,z\,}\) も方程式の解である。もちろんこれは \(n\)次方程式でも成り立つ。
そこで、\(f(x)=0\) の複素数解 \(\al_1,\:\al_2\) を、
\(\al_1=a+ib\)
\(\al_2=a-ib\)
とする。ここで、複素数 \(r+is\) に作用する \(\bs{L}\) の写像を \(\tau\) を、
\(\tau(r+is)=r-is\)
と定める。そうすると、
\(\tau(\al_1)=\al_2,\:\tau(\al_2)=\al_1,\)
\(\tau(\al_3)=\al_3,\:\tau(\al_4)=\al_4,\:\tau(\al_5)=\al_5\)
となり(\(\al_3,\:\al_4,\:\al_5\) は実数なので \(\tau\) で不変)、\(\tau\) は \(f(x)=0\) の2つの解を入れ替えるから \(\bs{L}\) の自己同型写像になり(51E)、すなわち \(G\) の元である。\(\al_1\) を \(1\)、\(\al_2\) を \(2\) と書き、巡回置換の記法を使うと、
\(\tau=(1,\:2)\)
である。
一方、\(f(x)\) は既約多項式なので単拡大体の基底の定理(33F)により、\(\bs{Q}(\al_1)\) の次元は \(5\)、つまり \([\bs{Q}(\al_1)\::\:\bs{Q}]=5\) である。そうすると、拡大次数の連鎖律(33H)により、
\([\:\bs{L}\::\:\bs{Q}\:]=[\:\bs{L}\::\:\bs{Q}(\al_1)\:][\bs{Q}(\al_1)\::\:\bs{Q}]\)
が成り立つので、\([\:\bs{L}\::\:\bs{Q}\:]\) は \(5\) の倍数である。\(|G|=[\:\bs{L}\::\:\bs{Q}\:]\) なので(52B)、ガロア群 \(G\) の位数は \(5\) を約数にもつ。
そうするとコーシーの定理(66A)より、\(G\) の部分群には位数 \(5\) の巡回群がある。それを、
\(H=\{\:\sg,\:\sg^2,\:\sg^3,\:\sg^4,\:\sg^5=e\:\}\)
とする。5つの解の置換の中で、位数 \(5\) の巡回群を生成する \(\sg\) は、巡回置換の記法で書くと、
\(\sg_1=(1,\:2\:,3,\:4,\:5)\)
\(\sg_2=(1,\:3\:,5,\:2,\:4)\)
\(\sg_3=(1,\:4\:,2,\:5,\:3)\)
\(\sg_4=(1,\:5\:,4,\:3,\:2)\)
の4つである。これらには、
\(\sg_1^{\:2}=\sg_2\)
\(\sg_1^{\:3}=\sg_3\)
\(\sg_1^{\:4}=\sg_4\)
の関係がある。そこで、\(G\) の中にある位数 \(5\) の巡回群は、
\(\sg=(1,\:2\:,3,\:4,\:5)\)
だとして一般性を失わない。そうすると、\(G\) の中には、
\(\tau=(1,\:2)\)
\(\sg=(1,\:2\:,3,\:4,\:5)\)
の2つの元があることになる。実は、
のである。それを証明する。
\(G\) は群なので \(\sg^{-1}\) も \(G\) に含まれる(\(\sg\) は位数 \(5\) の巡回群の元なので \(\sg^{-1}=\sg^4\))。まず、\(\sg\tau\sg^{-1}\) を計算してみると、
\(\sg\tau\sg^{-1}=(1,2,3,4,5)(1,2)(5,4,3,2,1)\)
なので、
\(\begin{eqnarray}
&&\:\:\sg\tau\sg^{-1}&=\left(\begin{array}{c}1&2&3&4&5\\1&3&2&4&5\end{array}\right)\\
&&&=(2,\:3)\\
\end{eqnarray}\)
となる。同様にして、
なので、
\(\begin{eqnarray}
&&\:\:\sg^2\tau\sg^{-2}&=\sg(\sg\tau\sg^{-1})\sg^{-1}\\
&&&=\sg\cdot(2,3)\cdot\sg^{-1}\\
&&&=\left(\begin{array}{c}1&2&3&4&5\\1&2&4&3&5\end{array}\right)\\
&&&=(3,\:4)\\
\end{eqnarray}\)
である。以下、
となる。つまり、
\((1,\:2)\)、\((2,\:3)\)、\((3,\:4)\)、\((1,\:5)\)
は \(G\) の元である。
一般に、
\((i,\:j)=(1,\:i)(1,\:j)(1,\:i)\)
である。なぜなら、
\(\begin{eqnarray}
&&\:\:(1,\:i)(1,\:j)(1,\:i)\cdot1&=(1,\:i)(1,\:j)\cdot i\\
&&&=(1,\:i)\cdot i=1\\
&&\:\:(1,\:i)(1,\:j)(1,\:i)\cdot i&=(1,\:i)(1,\:j)\cdot1\\
&&&=(1,\:i)\cdot j=j\\
&&\:\:(1,\:i)(1,\:j)(1,\:i)\cdot j&=(1,\:i)(1,\:j)\cdot j\\
&&&=(1,\:i)\cdot1=i\\
\end{eqnarray}\)
が成り立つからである。従って、
\((2,\:3)=(1,\:2)(1,\:3)(1,\:2)\)
である。この両辺に左と右から \((1,\:2)\) をかけると、
\((1,\:2)(2,\:3)(1,\:2)=(1,\:3)\)
となり、\((2,\:3),\:(1,\:2)\) が \(G\) の元なので \((1,\:3)\) も \(G\) の元である。同様に、
\((3,\:4)=(1,\:3)(1,\:4)(1,\:3)\)
であるが、\((3,\:4),\:(1,\:3)\) が \(G\) の元なので、\((1,\:4)\) も \(G\) の元である。結局、
\((1,\:2)\)、\((1,\:3)\)、\((1,\:4)\)、\((1,\:5)\)
が \(G\) の元であることが分かった。
\(S_5\) は5文字の置換をすべて集めた集合である。すべての置換は互換の積で表せて(65B)、かつ任意の互換 \((i,\:j)\) は、
\((i,\:j)=(1,\:i)(1,\:j)(1,\:i)\)
と表せるから、5文字の置換はすべて、
\((1,\:2)\)、\((1,\:3)\)、\((1,\:4)\)、\((1,\:5)\)
という4つの互換の積で表現できる。つまり、\(S_5\) はこの4つの互換で生成できる。以上をまとめると、
\((1,\:2)\)、\((1,\:2\:,3,\:4,\:5)\)
\(\Downarrow\)
\((1,\:2)\)、\((2,\:3)\)、\((3,\:4)\)、\((1,\:5)\)
\(\Downarrow\)
\((1,\:2)\)、\((1,\:3)\)、\((1,\:4)\)、\((1,\:5)\)
\(\Downarrow\)
\(S_5\) のすべての元
という、"\(S_5\)を生成する連鎖" の存在が証明できた。従って \(G\cong S_5\) である。\(S_5\) は可解群ではない(65G)。従って、複素数解を2つ、実数解を3つもつ既約な5次方程式は可解ではない。[証明終]
この、実数解が3つの5次方程式の定理(66B)から、可解ではない5次方程式の実例を簡単に構成できます。たとえば、
\(f(x)=x^5-5x+a\)
とおき、\(f(x)=0\) の方程式を考えます。
\(f\,'(x)=5x^4-5\)
なので、\(f\,'(x)=0\) の実数解は \(1,\:-1\) の2つです。
\(f(\phantom{-}1)=a-4\)
\(f(-1)=a+4\)
なので、
\(a-4 < 0 < a+4\)
なら、\(f(x)=0\) には3つの実数解があります。この条件は、
\(-4 < a < 4\)
ですが、\(a=0\) のときは \(f(x)\) は既約多項式ではありません。また \(a=3,\:-3\) のときも、
\(x^5-5x+3=(x^2+x-1)(x^3-x^2+2x-3)\)
\(x^5-5x-3=(x^2-x-1)(x^3+x^2+2x+3)\)
と因数分解できるので、既約多項式ではありません。従って、
\(x^5-5x+2=0\)
\(x^5-5x+1=0\)
\(x^5-5x-1=0\)
\(x^5-5x-2=0\)
が可解ではない5次方程式の例(\(G\cong S_5\))であり、これらの方程式の解を四則演算とべき根で表すのは不可能です。
6.可解性の必要条件 |
6.1 可解群
正規部分群の概念、および剰余群と巡回群を使って「可解群」を定義します。可解群は純粋に群の性質として定義できますが、方程式の可解性と結びつきます。
(可解群の定義:61A) |
群 \(G\) から 単位元 \(e\) に至る部分群の列、
\(G=H_0\:\sp H_1\sp\cd\sp H_i\sp H_{i+1}\sp\cd\sp H_k=\{\:e\:\}\)
があって、\(H_{i+1}\) は \(H_i\) の正規部分群であり、剰余群 \(H_i/H_{i+1}\) が巡回群であるとき、\(G\) を可解群(solvable group)と言う。
\(H_{i+1}\) が \(H_i\) の正規部分群であるとき、\(H_i\) を正規列と言う。加えて、\(H_i/H_{i+1}\) が巡回群のとき、\(H_i\) を可解列という。
(巡回群は可解群:61B) |
巡回群は可解群である。また、巡回群の直積も可解群である。
[証明]
群 \(G\) を巡回群とし、\(G\) から 単位元 \(e\) に至る部分群の列として、
\(G=H_0\:\sp\:H_1=\{\:e\:\}\)
をとる。\(H_1=\{\:e\:\}\) は \(H_0=G\) の正規部分群である。また、
\(H_0/H_1\:\cong\:H_0\:(=G)\)
であり、\(G\) は巡回群だから、\(H_0/H_1\) は巡回群である。従って \(G\) は可解群である。
3つの巡回群の直積 \(G\) で考える。\(G\) を、
\(\begin{eqnarray}
&&\:\:G&=\bs{Z}/k\bs{Z}\times\bs{Z}/m\bs{Z}\times\bs{Z}/n\bs{Z}\\
&&&=\{(a,b,c)\:|\:a\in\bs{Z}/k\bs{Z},\:b\in\bs{Z}/m\bs{Z},\:c\in\bs{Z}/n\bs{Z}\}\\
\end{eqnarray}\)
とする。このとき、
\(\begin{eqnarray}
&&\:\:&H_1&=\{(a,b,0)\:|\:a\in\bs{Z}/k\bs{Z},\:b\in\bs{Z}/m\bs{Z}\}\\
&&&H_2&=\{(a,0,0)\:|\:a\in\bs{Z}/k\bs{Z}\}\\
&&&\{e\}&=\{(0,0,0)\}\\
\end{eqnarray}\)
とおくと、
\(G\:\sp\:H_1\:\sp\:H_2\:\sp\:\{e\}\)
となる。巡回群は可換群であり、巡回群の直積 \(G\) も可換群である。従って、\(G\) の部分群である \(H_1,\:H_2\) も可換群であり、すなわち \(G\) の正規部分群である(41F)。
\(G\) の任意の2つの元を
\(g=(g_a,\:g_b,\:g_c)\)
\(h=(h_a,\:h_b,\:h_c)\)
とする。剰余類 \(g+H_1\) と \(h+H_1\) を考える。\((g_a,0,0)+H_1=H_1\)、\((0,g_b,0)+H_1=H_1\) だから、\((g_a,g_b,0)+H_1=H_1\) である。また同様に\((h_a,h_b,0)+H_1=H_1\) である。従って、\(g_c=h_c\) なら、\(g_a\)、\(g_b\)、\(h_a\)、\(h_b\) の値に関わらず \(g+H_1=h+H_1\) である。逆に、\(g_c\neq h_c\) なら \(g+H_1\neq h+H_1\) である。このことから剰余類の代表元(41E)として、\((0,0,0)\)、\((0,0,1)\)、\(\cd\)、\((0,0,n-1)\) の \(n\)個をとることができる。つまり、
\(\begin{eqnarray}
&&\:\:G/H_1=\{&(0,0,0)+H_1,\\
&&&(0,0,1)+H_1,\\
&&&(0,0,2)+H_1,\\
&&& \vdots\\
&&&(0,0,n-1)+H_1\}\\
\end{eqnarray}\)
である。これは \((0,0,1)+H_1\) を生成元とする位数 \(n\) の巡回群である。まったく同様の議論により、
\(\begin{eqnarray}
&&\:\:H_1/H_2=\{&(0,0,0)+H_2,\\
&&&(0,1,0)+H_2,\\
&&&(0,2,0)+H_2,\\
&&& \vdots\\
&&&(0,m-1,0)+H_2\}\\
\end{eqnarray}\)
であり、\(H_1/H_2\) は \((0,1,0)+H_2\) を生成元とする位数 \(m\) の巡回群である。以上により、
\(G=H_0\:\sp\:H_1\:\sp\:H_2\:\sp\:H_3=\{e\}\)
は、正規列であり、\(H_i/H_{i+1}\) が巡回群なので、\(G\) は可解群である。この議論は \(G\) が\(4\)個以上の巡回群の直積の場合でも全く同様に成り立つ。つまり、巡回群の直積は可解群である。[証明終]
(可解群の部分群は可解群:61C) |
可解群の部分群は可解群である。
[証明]
可解群を \(G\) とすると、可解群の定義により、
\(G=H_0\sp H_1\sp H_2\sp\cd H_{n-1}\sp H_n=\{e\}\)
という列で、\(H_{i+1}\) が \(H_i\) の正規部分群であり、\(H_i/H_{i+1}\) が巡回群のものが存在する。
ここで、\(G\) の任意の部分群を \(N\) としたとき、
\(N=N\cap H_0\sp N\cap H_1\sp N\cap H_2\sp\cd N\cap H_{n-1}\sp N\cap H_n=\{e\}\)
という集合の列を考える。部分群の共通部分は部分群の定理(41D)により、\(N\cap H_i\:(0\leq i\leq n)\) は \(G\) の部分群の列である。と同時に、これが可解列であることを以下で証明する。
列の \(N\cap H_{i-1}\sp N\cap H_i\) の部分を取り出して考える。\(H_i\) は \(H_{i-1}\) の正規部分群なので、\(H_{i-1}\) の任意の元 \(x\) について \(xH_i=H_ix\) が成り立つ。
\(N\cap H_{i-1}\) の任意の元を \(y\) とすると、\(y\in N\) かつ \(y\in H_{i-1}\) であるが、\(y\in N\) なので \(yN=Ny=N\) である。また \(y\in H_{i-1}\) なので、正規部分群の定義により、\(yH_i=H_iy\) が成り立つ。ゆえに、
\(y(N\cap H_i)=yN\cap yH_i=Ny\cap H_iy=(N\cap H_i)y\)
となり、定義によって \(\bs{N\cap H_i}\) は \(\bs{N\cap H_{i-1}}\) の正規部分群である。
次に第2同型定理(43B)によると、\(N\) が \(G\) の部分群、\(H\) が \(G\) の正規部分群のとき、
\(N/(N\cap H)\:\cong\:NH/H\)
が成り立つ。\(N\) を \(N\cap H_{i-1}\) とし、\(H\) を \(H_i\) として定理を適用すると、
\(N\cap H_{i-1}/((N\cap H_{i-1})\cap H_i)\:\cong\:(N\cap H_{i-1})H_i/H_i\)
\((\br{A})\)
となる。ここで、\(H_i\:\subset\:H_{i-1}\) なので、\((N\cap H_{i-1})\cap H_i=N\cap H_i\) である。従って、
\((\br{A})\) 式の左辺 \(=\:(N\cap H_{i-1})/(N\cap H_i)\)
となる。また、 \((\br{A}\,')\)
\((N\cap H_{i-1})\:\subset\:H_{i-1}\)
は常に成り立つ。さらに、\(H_i\:\subset\:H_{i-1}\) だから、この式に左から \(H_{i-1}\) をかけて、 \((\br{B})\)
\(H_{i-1}H_i\:\subset\:H_{i-1}H_{i-1}\)
\(H_{i-1}H_i\:\subset\:H_{i-1}\)
が成り立つ。\((\br{B})\) 式に右から \(H_i\) をかけると、 \((\br{C})\)
\((N\cap H_{i-1})H_i\:\subset\:H_{i-1}H_i\)
となるが、これと \((\br{C})\) 式を合わせると、
\((N\cap H_{i-1})H_i\:\subset\:H_{i-1}\)
となる。従って、\((N\cap H_{i-1})H_i\) と \(H_{i-1}\) の \(H_i\) による剰余類を考えると、
\((N\cap H_{i-1})H_i/H_i\:\subset\:H_{i-1}/H_i\)
の関係にある。これで、
\((\br{A})\) 式の右辺 \(=\:H_{i-1}/H_i\) の部分群
であることが分かった。 \((\br{A}\,'')\)
以上の \((\br{A})\:\:(\br{A}\,')\:\:(\br{A}\,'')\) をあわせると、
\((N\cap H_{i-1})/(N\cap H_i)\:\cong\:H_{i-1}/H_i\) の部分群
である。\(G\) は可解群なので \(H_{i-1}/H_i\) は巡回群である。巡回群の部分群は巡回群なので、それと同型である \(\bs{(N\cap H_{i-1})/(N\cap H_i)}\) は巡回群である。まとめると、
\(N\cap H_i\) は \(N\cap H_{i-1}\) の正規部分群
\((N\cap H_{i-1})/(N\cap H_i)\) は巡回群
となる。このことは \(1\leq i\leq n\) のすべてで成り立つから、\(N\cap H_0\:=\:N\cap G\:=\:N\) は可解群である。つまり、可解群 \(G\) の任意の部分群 \(N\) は可解群である。[証明終]
(可解群の像は可解群:61D) |
可解群の準同型写像による像は可解群である。
このことより、
可解群の剰余群は可解群
であることが分かる。なぜなら、群 \(G\) の部分群を \(N\) とすると、\(G\) から \(G/N\) への自然準同型、つまり \(x\in G\) として、
\(x\:\longmapsto\:xN\)
の準同型写像を定義できるからである。
[証明]
可解群を \(G\) とすると、可解群の定義により、
\(G=H_0\sp H_1\sp\:H_2\sp\cd H_{n-1}\sp H_n=\{e\}\)
という列で、\(H_i\) が \(H_{i-1}\) の正規部分群であり、剰余群 \(H_{i-1}/H_i\) が巡回群の列(=可解列)が存在する。群 \(G\) に作用する準同型写像を \(\sg\) とすると、上記の可解列の \(\sg\) による像、
\(\sg(G)=\sg(H_0)\sp\sg(H_1)\sp\sg(H_2)\sp\cd\sg(H_{n-1})\sp\sg(H_n)\)
が正規列になっていることを以下に示す。 \((\br{D})\)
\(\sg\) による像の列から \(\sg(H_{i-1})\sp\sg(H_i)\) を取り出して考える。\(\sg\) を \(H_{i-1}\) から \(\sg(H_{i-1})\) への写像と考えると、\(\sg(H_{i-1})\) は \(\sg\) による \(H_{i-1}\) の像なので、\(\sg\) は全射である。従って、\(H_{i-1}\) の元 \(h\) を選ぶことによって \(\sg(h)\) で \(\sg(H_{i-1})\) の全ての元を表すことができる。
\(\sg(H_{i-1})\) の任意の元を \(\sg(h)\) とおくと、
\(\begin{eqnarray}
&&\:\:\sg(h)\sg(H_i)&=\sg(hH_i)=\sg(H_ih)\\
&&&=\sg(H_i)\sg(h)\\
\end{eqnarray}\)
であるから、\(\sg(H_i)\) は \(\sg(H_{i-1})\) の正規部分群である。つまり \((\br{D})\) は正規列である。従って、\(\sg(H_{i-1})\) の \(\sg(H_i)\) による剰余類は群であり、剰余群 \(\sg(H_{i-1})/\sg(H_i)\) になる。
次に、剰余群 \(\sg(H_{i-1})/\sg(H_i)\) が巡回群であることを示す。\(H_{i-1}\) の任意の元を \(x\) とし、剰余群 \(H_{i-1}/H_i\) の元を \(xH_i\) で表す。\(H_{i-1}/H_i\) から \(\sg(H_{i-1})/\sg(H_i)\) への写像 \(f\) を、
\(f\::\:xH_i\:\longmapsto\:\sg(x)\sg(H_i)\)
と定める。もし、剰余群 \(H_{i-1}/H_i\) の元が \(xH_i\) と \(yH_i\:(x,y\in H_{i-1})\) という異なる表現を持っているとすると、
\(xH_i=yH_i\)
\(\sg(xH_i)=\sg(yH_i)\)
\(\sg(x)\sg(H_i)=\sg(y)\sg(H_i)\)
であるが、\(f\) の定義によって、
\(f(xH_i)=\sg(x)\sg(H_i)\)
\(f(yH_i)=\sg(y)\sg(H_i)\)
であり、異なる表現の \(f\) による写像先は一致する。従って \(f\) は2つの剰余群の間の写像として矛盾なく定義されている。また \(f\) は、
\(\begin{eqnarray}
&&f(xH_iyH_i)&=f(xyH_iH_i)=f(xyH_i)\\
&&&=\sg(xy)\sg(H_i)=\sg(x)\sg(y)\sg(H_i)\\
&&&=\sg(x)\sg(y)\sg(H_iH_i)=\sg(x)\sg(yH_iH_i)\\
&&&=\sg(x)\sg(H_iyH_i)=\sg(x)\sg(H_i)\sg(yH_i)\\
&&&=\sg(xH_i)\sg(yH_i)=\sg(x)\sg(H_i)\sg(y)\sg(H_i)\\
&&&=f(xH_i)f(yH_i)\\
\end{eqnarray}\)
を満たすが、この式は \(xH_i\) と \(yH_i\) が剰余群 \(H_{i-1}/H_i\) の異なる元を表現していても成り立つ。従って \(f\) は準同型写像である(=\(\:\br{①}\:\))。また、\(f\) は \(H_{i-1}/H_i\) から \(\sg(H_{i-1})/\sg(H_i)\) への写像で、
\(f\::\:xH_i\:\longmapsto\:\sg(x)\sg(H_i)\)
と定義されたが、\(\sg(xH_i)=\sg(x)\sg(H_i)\) だから \(f\)は全射であり、
\(\mr{Im}\:f\:=\:\sg(H_{i-1})/\sg(H_i)\)
である(=\(\:\br{②}\:\))。\(\br{①}\) と \(\br{②}\)、および準同型定理(43A)により、
\((H_{i-1}/H_i)/\mr{Ker}\:f\:=\:\sg(H_{i-1})/\sg(H_i)\)
である。\(H_{i-1}/H_i\) は巡回群なので、巡回群の剰余群は巡回群の定理(41H)により、\((H_{i-1}/H_i)/\mr{Ker}\:f\) は巡回群である。従って、それと同型である \(\sg(H_{i-1})/\sg(H_i)\) も巡回群である。
結局、\((\br{D})\) は正規列であると同時に \(\sg(H_{i-1})/\sg(H_i)\) が巡回群なので、\(\sg(G)\) は可解群である。[証明終]
6.2 巡回拡大
巡回拡大
(巡回拡大の定義:62A) |
\(\bs{Q}\) のガロア拡大を \(\bs{K}\) とする。\(\mr{Gal}(\bs{K}/\bs{Q})\) が巡回群のとき、\(\bs{K}/\bs{Q}\) を巡回拡大(cyclic extension)と言う。
累巡回拡大
(累巡回拡大の定義:62B) |
\(\bs{Q}\) の拡大体を \(\bs{K}\) とする。
\(\bs{Q}=\bs{K}_0\subset\bs{K}_1\subset\cd\subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cd\subset\bs{K}_k=\bs{K}\)
となる拡大列があって(\(k > 1\))、\(\bs{K}_{i+1}/\bs{K}_i\:(0\leq i < k)\) が巡回拡大のとき、\(\bs{K}/\bs{Q}\) は累巡回拡大であると言う。ただし、\(\bs{\bs{K}/\bs{Q}}\) が累巡回拡大だとしても、\(\bs{\bs{K}/\bs{Q}}\) がガロア拡大であるとは限らない。
\(\bs{K}/\bs{Q}\) が累巡回拡大だとしてもガロア拡大であるとは限りません。たとえばシンプルな例で考えてみると、
\(\al=\sqrt{\sqrt{2}+1}\)
という代数的数があったとします。この式から \(\sqrt{\phantom{A}}\) を消去すると \(\al^4-2\al^2-1=0\) なので、\(\al\) の最小多項式 \(f(x)\) は、
\(f(x)=x^4-2x^2-1\)
です。\(f(x)\) は、
\(f(x)=(x^2-(\sqrt{2}+1))(x^2+(\sqrt{2}-1))\)
と変形できるので、方程式 \(f(x)=0\) の解は
\(x=\pm\sqrt{\sqrt{2}+1},\:\:\pm i\sqrt{\sqrt{2}-1}\)
です。従って \(f(x)\) の最小分解体 \(\bs{L}\) は、
\(\bs{L}=\bs{Q}(\sqrt{\sqrt{2}+1},\:i\sqrt{\sqrt{2}-1})\)
であり、また、
\(\sqrt{\sqrt{2}+1}\cdot\sqrt{\sqrt{2}-1}=1\)
の関係があるので、
\(\bs{L}=\bs{Q}(i,\:\al)\)
と表現できます。\(\bs{L}/\bs{Q}\) はガロア拡大です。
一方、
\(\bs{K}=\bs{Q}(\al)\)
と定義すると、\(\bs{K}\) は \(f(x)=0\) の一つの解 \(\al\) だけによる単拡大体なので、\(\bs{K}/\bs{Q}\) はガロア拡大ではありません( \(\bs{Q}(\al)\neq\bs{Q}(i,\:\al)\) )。ここで、
\(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\:\subset\:\bs{Q}(\al)=\bs{K}\)
という体の拡大列を考えます。\(\bs{Q}\) 上の方程式 \(x^2-2=0\) の解は \(\pm\sqrt{2}\) なので、\(\bs{Q}(\sqrt{2})/\bs{Q}\) はガロア拡大です。また、ガロア群は、
\(\mr{Gal}(\bs{Q}(\sqrt{2})/\bs{Q})=\{e,\:\sg\}\)
\(\sg(\sqrt{2})=-\sqrt{2}\)
\(\sg^2=e\)
なので巡回群であり、\(\bs{Q}(\sqrt{2})/\bs{Q}\) は巡回拡大です。
同様に、\(\bs{Q}(\sqrt{2})\) 上の方程式 \(x^2-(\sqrt{2}+1)=0\) の解は \(\pm\al\) で、\(\bs{Q}(\sqrt{2},\al)\) は \(\bs{Q}(\sqrt{2})\) の巡回拡大です。\(\sqrt{2}=\al^2-1\) なので、\(\bs{Q}(\sqrt{2},\al)=\bs{Q}(\al)\) であり、\(\bs{Q}(\al)/\bs{Q}(\sqrt{2})\) が巡回拡大となります。
結局、\(\bs{K}/\bs{Q}\) は \(\bs{Q}(\sqrt{2})/\bs{Q},\:\:\bs{Q}(\al)/\bs{Q}(\sqrt{2})\) という2つの巡回拡大の列で表されるので、定義(62B)により累巡回拡大です。しかしそうであっても、\(\bs{K}/\bs{Q}\) は ガロア拡大ではないのです。
これがもし \(\al=\sqrt{2}+\sqrt{3}\) だとすると、\(2\) も \(3\) も \(\bs{Q}\) の元なので、
\(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\:\subset\:\bs{Q}(\sqrt{2},\sqrt{3})=\bs{K}\)
の拡大列は累巡回拡大であり、かつ \(\bs{K}/\bs{Q}\) がガロア拡大です。
このように、\(\bs{K}/\bs{Q}\) が累巡回拡大だとしてもガロア拡大であるとは限らないのですが、もし \(\bs{K}/\bs{Q}\) が累巡回拡大でかつガロア拡大だとすると、\(\mr{Gal}(\bs{K}/\bs{Q})\) は可解群になります。それが、累巡回拡大と可解群を結びつける次の定理です。
累巡回拡大ガロア群の可解性
(累巡回拡大ガロア群の可解性:62C) |
\(\bs{Q}\) のガロア拡大を \(\bs{K}\)、そのガロア群を \(G\) とする。このとき、
\(G\) が可解群である | |
\(\bs{K}/\bs{Q}\) が累巡回拡大である |
の2つは同値である。
[① \(\bs{\Rightarrow}\) ②の証明]
\(G\) が可解群であることを示す部分群の列と、それとガロア対応をする体の拡大列を、
\(G=H_0\sp H_1\sp H_2\sp\cd\sp H_i\sp H_{i+1}\sp\cd\sp H_k=\{e\}\)
\(\bs{Q}=\bs{F}_0\subset\bs{F}_1\subset\bs{F}_2\subset\cd\subset\bs{F}_i\subset\bs{F}_{i+1}\subset\cd\subset\bs{F}_k=\bs{K}\)
\(\bs{Q}=\bs{F}_0\subset\bs{F}_1\subset\bs{F}_2\subset\cd\subset\bs{F}_i\subset\bs{F}_{i+1}\subset\cd\subset\bs{F}_k=\bs{K}\)
とする。\(G\) が可解群なので、\(H_{i+1}\) は \(H_i\) の正規部分群であり、\(H_{i+1}/H_i\:(0\leq i\leq k-1)\) は巡回群である。以降、\(H_i,\:H_{i+1}\) を取り出して考える。
\(H_i\:\sp\:H_{i+1}\:\sp\:\{e\}\)
\(\bs{F}_i\:\subset\:\bs{F}_{i+1}\:\subset\:\bs{K}\)
\(\bs{K}/\bs{Q}\) がガロア拡大なので、中間体からのガロア拡大の定理(52C)により、\(\bs{K}/\bs{F}_i\) もガロア拡大である。\(\bs{F}_i\) の固定群は \(H_i\) なので \(\mr{Gal}(\bs{K}/\bs{F}_i)=H_i\) である。同様に、\(\bs{K}/\bs{F}_{i+1}\) もガロア拡大であり、\(\mr{Gal}(\bs{K}/\bs{F}_{i+1})=H_{i+1}\) である。
ここで、\(H_{i+1}\) は \(H_i\) の正規部分群なので、正規性定理(53C)により \(\bs{F}_{i+1}/\bs{F}_i\) はガロア拡大であり、そのガロア群は、
\(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\cong H_i/H_{i+1}\)
となる。\(H_i/H_{i+1}\) は巡回群なので、それと同型の \(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\) も巡回群になる。従って、\(\bs{F}_{i+1}/\bs{F}_i\) は、「ガロア拡大で、かつ \(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\) が巡回群」なので、巡回拡大である。
以上が \(\bs{F}_i\:(0\leq i\leq k-1)\) で成り立つから、\(\bs{K}/\bs{Q}\) は累巡回拡大である。
[② \(\bs{\Rightarrow}\) ①の証明]
\(\bs{K}\) が \(\bs{Q}\) の累巡回拡大であることを示す体の拡大列と、それとガロア対応する \(G\) の部分群の列を、
\(\bs{Q}=\bs{F}_0\subset\bs{F}_1\subset\bs{F}_2\subset\cd\subset\bs{F}_i\subset\bs{F}_{i+1}\subset\cd\subset\bs{F}_k=\bs{K}\)
\(G=H_0\sp H_1\sp H_2\sp\cd\sp H_i\sp H_{i+1}\sp\cd\sp H_k=\{e\}\)
\(G=H_0\sp H_1\sp H_2\sp\cd\sp H_i\sp H_{i+1}\sp\cd\sp H_k=\{e\}\)
とする。\(\bs{F}_i\)と \(\bs{F}_{i+1}\) を取り出して考える。
\(\bs{F}_i\:\subset\:\bs{F}_{i+1}\:\subset\:\bs{K}\)
\(H_i\:\sp\:H_{i+1}\:\sp\:\{e\}\)
\(\bs{K}/\bs{Q}\) がガロア拡大なので、\(\bs{K}/\bs{F}_i\) も \(\bs{K}/\bs{F}_{i+1}\) もガロア拡大である。また \(\bs{F}_{i+1}/\bs{F}_i\) は巡回拡大なので、すなわちガロア拡大である。従って正規性定理(53C)により、\(H_{i+1}\) は \(H_i\) の正規部分群であり、
\(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\cong H_i/H_{i+1}\)
となる。\(\bs{F}_{i+1}/\bs{F}_i\) は巡回拡大なので \(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\) は巡回群であり、それと同型である \(H_i/H_{i+1}\) も巡回群である。まとめると「\(H_{i+1}\) は \(H_i\) の正規部分群であり、かつ \(H_i/H_{i+1}\) は巡回群」である。
このことは \(H_i\:(0\leq i\leq k-1)\) で成り立つから、定義によって \(G\) は可解群である。[証明終]
6.3 原始\(n\)乗根を含む体とべき根拡大
この節の目的は「1の原始\(\bs{n}\)乗根を含む体のべき根拡大」の性質を解明することです。そのためにまず、1の原始\(n\)乗根を \(\zeta\) を含む体 \(\bs{Q}(\zeta)\)に関する次の定理を数ステップに分けて証明します。
1の原始\(n\)乗根を \(\zeta\) とする。このとき
・\(\bs{Q}(\zeta)/\bs{Q}\) はガロア拡大
・\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\:\cong\:(\bs{Z}/n\bs{Z})^{*}\)
が成り立つ。
\(1\) の原始\(n\)乗根
(原始n乗根の数:63A) |
\(x^n-1=0\) の \(n\)個の解のうち、\(n\)乗して初めて \(1\) になる解を \(1\)の原始\(n\)乗根という。
原始\(n\)乗根は \(\varphi(n)\) 個ある。\(\varphi(n)\) はオイラー関数で、\(n\) と互いに素である \(n\) 以下の自然数の数を表す。
[証明]
まず、
\(\omega=\mr{cos}\dfrac{2\pi}{n}+i\:\mr{sin}\dfrac{2\pi}{n}\)
とおくと、明らかに \(\omega\) は原始\(n\)乗根である。さらに、
\(\omega^k=\mr{cos}\dfrac{2\pi k}{n}+i\:\mr{sin}\dfrac{2\pi k}{n}\:(1\leq k\leq n)\)
で \(1\) の\(n\)乗根の全体を表現できる。ここで \(\omega^k\) が原始\(n\)乗根になる条件を考える。いま、
\((\omega^k)^x=1\:(1\leq x\leq n)\)
とすると、この式を満たす \(x\) の最小値が \(n\) であれば、\(\omega^k\) は原始\(n\)乗根である。これを満たす \(x\) は、\(j\) を任意の整数として、 \((\br{A})\)
\(\dfrac{2\pi k}{n}x=2\pi j\)
のときである。つまり、
\(\dfrac{k}{n}x=j\)
のときである。いま、\(k\) と \(n\) の最大公約数を \(d\) とすると( \(\mr{gcd}(k,n)=d\:)\)、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&k=sd&\\
&&n=td&\\
\end{eqnarray}
\end{array}\right.\)
と表せて、このとき \(s\) と \(t\) は互いに素である。これを使うと、
\(\dfrac{s}{t}x=j\)
のときに \(x\) は \((\br{A})\) 式を満たすことになる。\(s\) と \(t\) は互いに素であり、\(j\) は任意の整数だったから、\(x\) は \(t\) の倍数でなければならない。つまり、\(x\) は \(t=\dfrac{n}{d}\) の倍数である。ということは、\(x\) の最小値は \(\dfrac{n}{d}\) である。そして、\(\dfrac{n}{d}\) が \(n\) に等しいのは \(d=1\) の場合に限る。つまり \(\mr{gcd}(k,n)=1\) なら、\((\br{A})\) 式を満たす最小の \(x\) は \(n\) ということになる。従って、そのときに限り \(\omega^k\) は原始\(n\)乗根である。
\(\mr{gcd}(k,n)=1\) となる \(k\) は \(\varphi(n)\) 個あり、\(1\) の原始\(n\)乗根は \(\varphi(n)\) 個ある。[証明終]
(原始n乗根の累乗:63B) |
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、
\(\zeta^m\:\:(1\leq m\leq n)\)
は、\(1\) の\(n\)乗根の全体を表す。また、
\(\zeta^m\:\:(\mr{gcd}(m,n)=1)\)
は、\(1\) の原始\(n\)乗根の全体を表す。
[証明]
\(\zeta^m\:(1\leq m\leq n)\) の \(n\) 個の値は全部異なっている。なぜなら、もし、 \(\zeta^j=\zeta^i\:(1\leq i < j\leq n)\)
だとすると、
\(\zeta^{j-i}=1\:(1\leq i < j\leq n)\)
となり、\(j-i < n\) だから、\(\zeta\) が原始\(n\)乗根という前提に反するからである。\(\zeta^m\:(1\leq m\leq n)\) は全部異なっているので、これら \(n\) 個の値は \(1\) の\(n\)乗根全体を表す。
\(\zeta\) は、\(\mr{gcd}(k,n)=1\) である \(k\) を用いて、
\(\zeta=\omega^k\)
\(\omega=\mr{cos}\dfrac{2\pi}{n}+i\:\mr{sin}\dfrac{2\pi}{n}\)
と表せる(63A)。すると
\(\zeta^m=(\omega^k)^m=\omega^{km}\)
である。\(\mr{gcd}(k,n)=1\) なので \(\mr{gcd}(m,n)=1\) なら \(\mr{gcd}(km,n)=1\) である。逆に、\(\mr{gcd}(km,n)=1\) が成り立つのは \(\mr{gcd}(m,n)=1\) のときに限る。従って、
\(\zeta^m\:(=\omega^{km})\)
は \(\mr{gcd}(m,n)=1\) のとき(かつ、そのときに限って)\(1\) の原始\(n\)乗根である。[証明終]
(原始n乗根の最小多項式:63C) |
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とする。\(\zeta\) の最小多項式を \(f(x)\) とし、\(k\) を \(n\) とは素な数とする。
このとき \(f(\zeta^k)=0\) である。
[証明]
証明を2つのステップで行う
第1ステップ
\(p\) を \(\bs{n}\) と素な素数とし、\(k=p\) のとき題意が成り立つことを証明する。
第2ステップ
\(k\) を \(\bs{n}\) と素な数とし、第1ステップを使って題意が成り立つことを証明する。
第1ステップ(\(p\) は \(\bs{n}\) と素な素数)
本論に入る前に、2つことを確認する。まず、\(p\) を素数とし \(a\) を \(p\) とは素な整数とするとき、\(a\neq0\) ならフェルマの小定理(25B)により、
\(a^{p-1}\equiv1\:(\mr{mod}\:p)\)
が成り立つ。この両辺に \(a\) をかけると、
\(a^p\equiv a\:(\mr{mod}\:p)\)
となるが、この形の式にすると \(a=0,\:p\) でも成り立つ。つまり \(a\) が任意の整数のとき \((\br{A})\) 式が成り立つ。 \((\br{A})\)
次に、有限体 \(\bs{F}_p\) 上の多項式(係数が \(\bs{F}_p\) の元である多項式。「2.4 有限体」参照)についての定理である。\(p\) を素数とし \(x,\:y\) を変数とするとき、
\((x+y)^p=x^p+y^p\:\:\:[\bs{F}_p]\)
が成り立つ。その理由であるが、等式の左辺を整数係数として2項展開すると、
\(\begin{eqnarray}
&&\:\:(x+y)^p=&x^p+{}_{p}\mr{C}_{1}x^{p-1}y+\:\cd\:+{}_{p}\mr{C}_{p-1}xy^{p-1}+y^p\\
\end{eqnarray}\)
となる。この展開における \(x^p\) と \(y^p\) 以外の項の係数は、
\({}_{p}\mr{C}_{k}=\dfrac{p!}{k!\cdot(p-k)!}\:\:(1\leq k\leq p-1)\)
であるが、\(p\) が素数なので、分母の素因数に \(p\) はなく、分子の素因数にある \(p\) は分母で割り切れない。従って、
\({}_{p}\mr{C}_{k}\equiv0\:\:(\mr{mod}\:p)\:\:(1\leq k\leq p-1)\)
となり、\(\bs{F}_p\) 上の多項式としては、
\((x+y)^p=x^p+y^p\:\:\:[\bs{F}_p]\)
が成り立つ。
さらに、3変数、\(x,\:y,\:z\) では、
\(\begin{eqnarray}
&&\:\:(x+y+z)^p&=(x+y)^p+z^p\\
&&&=x^p+y^p+z^p\:\:\:[\bs{F}_p]\\
\end{eqnarray}\)
となり、これを繰り返すと \(n\) 変数に拡張できるのは明らかだから、\(x_1,\:\cd\:,\:x_n\) を変数として、
\((x_1+x_2+\:\cd\:+x_n)^p=\)
\(x_1^p+x_2^p+\:\cd\:+x_n^p\:\:\:[\bs{F}_p]\)
が成り立つ。 \((\br{B})\)
以上の \((\br{A})\) 式と \((\br{B})\) 式を前提として以下の本論を進める。
\(\zeta\) の最小多項式 \(f(x)\) は、最小多項式は既約多項式(31I)によって \(\bs{Q}\) 上の既約多項式である。\(\zeta\) は \(x^n-1=0\) と \(f(x)=0\) の共通の解だから、既約多項式の定理1(31E)により、\(x^n-1\) は \(f(x)\) で割り切れる。そこで、商の多項式を \(g(x)\) として、
\(x^n-1=f(x)g(x)\)
\((\br{C})\)
とおく。この式の左辺の \(x^n-1\) は整数係数の多項式である。つまり上の式は、整数係数の多項式が \(\bs{Q}\) 上で(有理数係数の多項式として)因数分解できることになり、整数係数多項式の既約性の定理(31C)によって、\(x^n-1\) は整数係数の多項式で因数分解できる。従って、\(f(x)\) と \(g(x)\) は整数係数としてよい。ということは、\(f(x)\) と \(g(x)\) を有限体 \(\bs{F}_p\) 上の多項式と見なすこともできる。以降の証明にはこのことを使う。
\(p\) は \(n\) と互いに素だから \(\zeta^p\) も \(1\) の原始\(n\)乗根である(63B)。従って \((\br{C})\) 式に \(x=\zeta^p\) を代入すると、左辺は \(0\) だから、
\(f(\zeta^p)g(\zeta^p)=0\)
となり、\(f(\zeta^p)=0\) もしくは \(g(\zeta^p)=0\) である。
ここから、\(f(\zeta^p)=0\) であることを言うために背理法を使う。以下に \(f(\zeta^p)\neq0\) と仮定すると矛盾が生じることを証明する。
この背理法の仮定のもとでは \(g(\zeta^p)=0\) だから、\(\zeta\) は方程式 \(g(x^p)=0\) の解である。ということは、\(f(x)=0\) と \(g(x^p)=0\) は \(\zeta\) という共通の解をもつことになり、かつ \(f(x)\) は既約多項式であるから、既約多項式の定理1(31E)によって、\(g(x^p)\) は \(f(x)\) で割り切れる。その商を \(h(x)\) とすると、
\(g(x^p)=f(x)h(x)\)
と表せる。\(h(x)\) も整数係数の多項式である。 \((\br{D})\)
\(g(x)\) を、
\(g(x)=a_mx^m+a_{m-1}x^{m-1}+\:\cd\:+\:a_1x+a_0\)
とし、これを \(\bs{F}_p\) 上の多項式とみなして \(g(x^p)\) を計算する。\((\br{A})\) 式を使って係数を \(\mr{mod}\:p\) でみると、
\(g(x^p)\) | \(\overset{\text{ }}{=}\) | \(a_m(x^p)^m+a_{m-1}(x^p)^{m-1}+\:\cd\:+a_1(x^p)+a_0\) | |
\(\overset{\text{ }}{=}\) | \(a_m^p(x^p)^m+a_{m-1}^p(x^p)^{m-1}+\:\cd\:+a_1^p(x^p)+a_0^p\) | ||
\(\overset{\text{ }}{=}\) | \((a_mx^m)^p+(a_{m-1}x^{m-1})^p+\:\cd\:+(a_1x)^p+a_0^p\:\:\:[\bs{F}_p]\) |
この最後の式は、\((\br{B})\) 式の右辺の \(x_1\) を \(a_mx^m\)、\(x_2\) を \(a_{m-1}x^{m-1}\)、\(\cd\:x_n\) を \(a_0\) と置き換えた形をしている。従って \((\br{B})\) 式を使うと、
\(g(x^p)\) | \(\overset{\text{ }}{=}\) | \((a_mx^m+a_{m-1}x^{m-1}+\:\cd\:+a_1x+a_0)^p\) | |
\(\overset{\text{ }}{=}\) | \((g(x))^p\:\:\:[\bs{F}_p]\) |
\(g(x^p)=(g(x))^p\:\:\:[\bs{F}_p]\)
となる。同時に、\((\br{D})\) 式の \(f(x),\:h(x)\) も \(\bs{F}_p\) 上の多項式と見なして \((\br{E})\) 式 を \((\br{D})\) 式に代入すると、 \((\br{E})\)
\((g(x))^p=f(x)h(x)\:\:\:[\bs{F}_p]\)
が得られる。 \((\br{F})\)
\(f(x)\) は \(\bs{Q}\) 上の(整数係数の)既約多項式であった。しかし \(f(x)\) を \(\bs{F}_p\) 上の多項式と見なしたとき、それが既約多項式だとは限らない。たとえば \(x^2+1=0\) は \(\bs{Q}\) 上の既約多項式であるが、\(\bs{F}_5\) では、
\(x^2+1=(x-2)(x-3)\:\:\:[\bs{F}_5]\)
と因数分解できるから既約ではない。そこで、\(\bs{F}_p\) 上の多項式 \(f(x)\) を割り切る \(\bs{F}_p\) 上の既約多項式を \(q(x)\) とする。もし \(f(x)\) が \(\bs{F}_p\) 上でもなおかつ既約であれば \(q(x)=f(x)\) である。そうすると \(q(x)\) は \((\br{F})\) 式の右辺を割り切るから、左辺の \((g(x))^p\) も割り切る。ということは、既約多項式と素数の類似性(31D)によって、\(q(x)\) は \(g(x)\) を割り切る。
ここで \((\br{C})\) 式に戻って考えると、\((\br{C})\) 式は、
\(x^n-1=f(x)g(x)\)
であった。この式を \(\bs{F}_p\) 上の多項式とみなすと、\(f(x)\) と \(g(x)\) は共に \(q(x)\) という因数をもつから、\((\br{C})\) 式の右辺は \(q(x)^2\) という因数をもつ。従って \((\br{C})\) 式は、 \((\br{C})\)
\(x^n-1=q(x)^2\cdot r(x)\:\:\:[\bs{F}_p]\)
と書ける。\(r(x)\) は \(f(x)g(x)\) を \(q(x)^2\) で割ったときの商である。 \((\br{G})\)
ここで \((\br{G})\) 式の両辺の導多項式(多項式の形式的微分)を求める。\(\bs{F}_p\) では距離が定義されていないので極限による微分の定義はできないが、形式的微分( \(x^k\:\rightarrow\:kx^{k-1}\) の変換)はできる。すると、
\(nx^{n-1}\) | \(=2q(x)q\,'(x)r(x)+q(x)^2\cdot r\,'(x)\) | ||
\(=q(x)\cdot(2q\,'(x)r(x)+q(x)r\,'(x))\:\:\:[\bs{F}_p]\) | \((\br{H})\) |
\((\br{G})\) 式と \((\br{H})\) 式により、\(\bs{F}_p\) 上の多項式として、
\(x^n-1\) と \(nx^{n-1}\) は共通の因数をもつ
ことになる。ここで矛盾が生じる。
なぜなら、\(n\) と \(p\) は互いに素だから、\(\bs{F}_p\) における \(n\) の逆数 \(n^{-1}\) がある。これを用いて \(x^n-1\) と \(nx^{n-1}\) に多項式の互除法を適用すると、
\(x^n-1=n^{-1}x(nx^{n-1})-1\:\:\:[\bs{F}_p]\)
となって、\(x^n-1\) と \(nx^{n-1}\) の最大公約数は \(-1\:(=p-1)\:\:[\bs{F}_p]\) という定数である。つまり、\(\bs{F}_p\) 上の多項式として、
\(x^n-1\) と \(nx^{n-1}\) は互いに素
である。これは明らかに矛盾している。この矛盾の発端は \(f(x)=0\) と \(g(x^p)=0\) が \(\zeta\) という共通の解をもつとしたことにあり、つまり \(g(\zeta^p)=0\) としたことにある。
従って、そもそもの仮定である \(f(\zeta^p)\neq0\) は間違っている。つまり \(f(\zeta^p)=0\) である。[第1ステップの証明終]
第2ステップ(\(k\) は \(\bs{n}\) と素な数)
\(k\) を \(n\) とは素な(しかし素数ではない)数とし、\(k\) の素因数分解を、
\(k=p_1p_2\cd p_m\)
とする。この形での素因数分解は、素因数が重複することもありうる。\(k\) は \(n\) と素だから、\(p_1,\:p_2,\:\cd\:,p_m\) のすべての素数は \(n\) と素である。
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とし、第1ステップの \(p=p_1\) とする。\(p_1\) は \(n\) と素だから、原始\(\bs{n}\)乗根の累乗の定理(63B)により、\(\zeta^{p_1}\) も \(1\) の原始\(n\)乗根である。また、第1ステップの証明により、\(f(\zeta^{p_1})=0\) である。
次に、その \(\zeta^{p_1}\) を原始\(n\)乗根としてとりあげ、\(p=p_2\) とする。\(p_2\) は \(n\) と素だから、\((\zeta^{p_1})^{p_2}=\zeta^{p_1p_2}\) もまた原始\(n\)乗根になる(63B)。従って、第1ステップでの証明を適用して \(f(\zeta^{p_1p_2})=0\) である。
このプロセスは次々と続けることができる。結局 \(\zeta^{p_1p_2\:\cd\:p_m}=\zeta^k\) は \(1\) の原始\(n\)乗根であると同時に、\(f(\zeta^k)=0\) を満たす。\(k\) につけた条件は「\(n\) と互いに素」だけである。
原始\(\bs{n}\)乗根の累乗の定理(63B)により、\(k\) が \(n\) と素という条件で、\(\zeta^k\) は原始\(n\)乗根のすべてを表す。従って、\(f(x)=0\) は原始\(n\)乗根のすべてを解とする方程式である。[証明終]
この原始\(\bs{n}\)乗根の最小多項式の定理(63C)より、次の定理がすぐに導けます。
(円分多項式:63D) |
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とし、\(\zeta\) の最小多項式を \(f(x)\) とすると、\(f(x)\) は円分多項式である。円分多項式とは、方程式 \(f(x)=0\) が \(\varphi(n)\) 個の解をもち、それらすべてが原始\(n\)乗根である多項式である。
従って、原始\(\bs{n}\)乗根は互いに共役である。最小多項式は既約多項式なので(31I)、円分多項式は既約多項式である。
\(\bs{Q}\) に \(\zeta\) を添加した単拡大体 \(\bs{Q}(\zeta)\) は円分多項式の最小分解体であり、\(\bs{\bs{Q}(\zeta)/\bs{Q}}\) はガロア拡大である。
\(\bs{Q}(\zeta)\)のガロア群
(Q(ζ)のガロア群:63E) |
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/n\bs{Z})^{*}\)
である。つまり \(1\) の原始\(n\)乗根の一つを \(\bs{Q}\) に添加した拡大体のガロア群は、既約剰余類群に同型である。
[証明]
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とし、最小多項式を \(f(x)\) とすると、円分多項式の定理(63D)により、\(f(x)=0\) の解は \(\varphi(n)=m\) 個の原始\(n\)乗根である。
原始\(n\)乗根を
\(\zeta^{k_i}\:(\:1\leq i\leq m,\:1\leq k_i\leq n\) かつ \(\mr{gcd}(k_i,n)=1\:)\)
と表すと、それらは互いに共役である。また、\(f(x)\) の最小分解体は、
\(\bs{Q}(\zeta^{k_1},\zeta^{k_2},\cd,\zeta^{k_m})=\bs{Q}(\zeta)\)
である。
\(\zeta\) に作用する同型写像 \(\sg\) を考えると、\(\sg\) は \(\zeta\) を共役な元に移すから、
\(\sg_{k_i}(\zeta)=\zeta^{k_i}\)
で \(m\) 個の同型写像が定義できる。この \(\sg\) による移り先はすべて \(\bs{Q}(\zeta)\) の元だから、\(\sg\) は \(\bs{Q}(\zeta)\) の自己同型写像である。また、\(\sg_{k_i}\) と \(\sg_{k_j}\) の積は、
\(\begin{eqnarray}
&&\:\:\sg_{k_i}(\sg_{k_j})&=\sg_{k_i}(\zeta^{k_j})\\
&&&=(\zeta^{k_j})^{k_i}\\
&&&=\zeta^{k_ik_j}\\
\end{eqnarray}\)
と計算できる。そこで \(\sg\) の演算規則を、
\(\sg_{k_i}\sg_{k_j}=\sg_{k_ik_j}\)
と定める。
ここで \(k_ik_j\) は、\(1\leq k_i,\:k_j\leq n\) かつ \(\mr{gcd}(k_i,n)=1\) かつ \(\mr{gcd}(k_j,n)=1\) だから、既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) の元であり、乗算で閉じている。すなわち \(\sg_{k_ik_j}\) は \(\sg\) のどれかである。つまり、自己同型写像である \(\sg\) は上の演算規則で群になり、ガロア群 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) である。
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) から \((\bs{Z}/n\bs{Z})^{*}\) への写像 \(f\) を、
\(f\::\) | \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) | \(\longrightarrow\) | \((\bs{Z}/n\bs{Z})^{*}\) | |
\(\sg_{k_i}\) | \(\longmapsto\) | \(k_i\) |
\(f(\sg_{k_i}\sg_{k_j})\) | \(=f(\sg_{k_ik_j})\) | |
\(=k_ik_j\) | ||
\(f(\sg_{k_i})f(\sg_{k_j})\) | \(=k_ik_j\) |
既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) は巡回群の直積と同型です(25G)。従って次の定理が得られます。
(Q(ζ)のガロア群は巡回群:63F) |
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は巡回群の直積と同型である。
従って、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は可解群であり(61B)、累巡回拡大である(62C)。
累巡回拡大は、可解性の必要条件を証明する重要ポイントです。そこで次に、\(\bs{Q}(\zeta)/\bs{Q}\) が累巡回拡大になる様子を、ガロア群の計算で示します。
円分拡大は累巡回拡大
\(1\) の原始\(n\)乗根 \(\zeta\) を \(\bs{Q}\) に添加する拡大、\(\bs{Q}(\zeta)/\bs{Q}\) を円分拡大と言います。\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は巡回群の直積と同型で、従って 円分拡大 \(\bs{Q}(\zeta)/\bs{Q}\) は累巡回拡大です。
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) が巡回群の直積と同型になる理由は、既約剰余類群と同型であること、つまり、
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/n\bs{Z})^{*}\)
でした(63E)。その \((\bs{Z}/n\bs{Z})^{*}\) について振り返ってみると、次の通りです。\(\varphi\) はオイラー関数です。
\(\bs{n}\) が奇素数 \(\bs{p}\) 、ないしは奇素数 のべき乗のとき
(\(n=p^k,\:1\leq k\))(25D)(25E)
\((\bs{Z}/p^k\bs{Z})^{*}\) は生成元をもつ巡回群
群位数:\(\varphi(p^k)=p^{k-1}(p-1)\)
\(\bs{n}\) が2のべき乗のとき
(\(n=2^k,\:2\leq k\))(25F)
\((\bs{Z}/2^k\bs{Z})^{*}\cong(\bs{Z}/2\bs{Z})\times(\bs{Z}/2^{k-2}\bs{Z})\)
群位数:\(\varphi(2^k)=2^{k-1}\)
\(\bs{n=p^a\cdot q^b\cdot r^c}\)のとき
(\(p,\:q,\:r\) は素数)(25G)
\((\bs{Z}/n\bs{Z})^{*}\cong(\bs{Z}/p^a\bs{Z})^{*}\times(\bs{Z}/q^b\bs{Z})^{*}\times(\bs{Z}/r^c\bs{Z})^{*}\)
群位数:\(\varphi(n)=\varphi(p^a)\varphi(q^b)\varphi(r^c)\)
もちろん最後の式は、素因数が4個以上でも同様に成り立ちます。以下、それぞれの例をあげます。
\(\zeta\) が 原始\(25\)乗根のとき
\(\zeta\) が 原始\(25\)乗根の(一つ)のとき、原始\(25\)乗根の全体は \(\zeta^k\:\:(\mr{gcd}(k,25)=1)\) で表され(63B)、その数は \(25\) と互いに素な自然数の数、\(\varphi(25)=20\) です。\(\bs{Q}(\zeta)\) のガロア群は、
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/5^2\bs{Z})^{*}\)
でした(63E)。\((\bs{Z}/5\bs{Z})^{*}\) の最小の生成元は \(2\) ですが(25D)、ほどんどの場合、\((\bs{Z}/p\bs{Z})^{*}\) の生成元は同時に \((\bs{Z}/p^2\bs{Z})^{*}\) の生成元です(25E)。実際、\(2\) は \((\bs{Z}/25\bs{Z})^{*}\) の生成元であることが確認できます。
そこで、\(\bs{Q}(\zeta)\) の自己同型写像 \(\sg\) を、
\(\sg(\zeta)=\zeta^2\)
と定義すると、\(\sg^k(\zeta)\:\:(1\leq k\leq20)\) は、
\(\zeta^2,\:\zeta^4,\:\zeta^8,\:\zeta^{16},\:\zeta^7,\:\zeta^{14},\:\zeta^3,\:\zeta^6,\:\zeta^{12},\:\zeta^{24},\)
\(\zeta^{23},\:\zeta^{21},\:\zeta^{17},\:\zeta^9,\:\zeta^{18},\:\zeta^{11},\:\zeta^{22},\:\zeta^{19},\:\zeta^{13},\:\zeta\)
となって、原始\(25\)乗根の全部を尽くします。つまり、
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})=\{e,\:\sg,\:\sg^2,\:\cd,\:\sg^{19}\}\)
\(\sg(\zeta)=\zeta^2\)
であり、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は位数 \(20\) の巡回群で、
\(\bs{Q}\:\subset\:\bs{Q}(\zeta)\)
は巡回拡大です。
\(\zeta\) が 原始\(16\)乗根のとき
原始\(16\)乗根は、自然数 \(k\) を \(16\) 以下の奇数として \(\zeta^k\) で表され、次の8個です。
\(\zeta,\:\zeta^3,\:\zeta^5,\:\zeta^7,\:\zeta^9,\:\zeta^{11},\:\zeta^{13},\:\zeta^{15}\)
ここで、\(n\) が2のべき乗のときの同型は、
\((\bs{Z}/16\bs{Z})^{*}\cong(\bs{Z}/2\bs{Z})\times(\bs{Z}/4\bs{Z})\)
でした(25F)。つまり、\((\bs{Z}/16\bs{Z})^{*}\) は巡回群ではありませんが、位数 \(2\) の巡回群と位数 \(4\) の巡回群の直積に同型です。このことの証明(25F)を振り返ってみると、\(\mr{mod}\:16\) でみて \(5^k\:\:(0\leq k\leq3)\) は、
\(1,\:5,\:9,\:13\)
であり、\((\bs{Z}/16\bs{Z})^{*}\) の元のうちの「4で割って1余る数」が全部現れるのでした。そこで、\(\bs{Q}(\zeta)\) の自己同型写像 \(\sg\) を、
\(\sg(\zeta)=\zeta^5\)
と定義すると、\(\sg^k(\zeta)\:\:(0\leq k\leq3)\) は、
\(\zeta,\:\zeta^5,\:\zeta^9,\:\zeta^{13}\)
で、原始\(16\)乗根の半数を表現します。
\(G=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\)
\(H=\{e,\:\sg,\:\sg^2,\:\sg^3\}\)
と書くと、\(H\) は \(G\) の部分群で、\(H\) の位数 \(4\) は \(G\) の位数 \(8\) の半分です。
\(H\) の固定体を \(\bs{K}\) とします。
\(\sg(\zeta^4)=\sg(\zeta)^4=(\zeta^5)^4=\zeta^{20}\)
ですが、\(\zeta^{16}=1\) なので、
\(\sg(\zeta^4)=\zeta^4\)
です。\(\zeta^4\) は \(\sg\) で不変であり、従って \(\zeta^4\) は \(H\) のすべての元で不変です。\(\zeta^4\) は4乗して初めて \(1\) になる数で、\(1\) の原始4乗根、つまり \(i\)(または \(-i\)。\(i\) は虚数単位)です。つまり \(i\) は固定体 \(\bs{K}\) の元であり、
\(\bs{Q}(i)\:\subset\:\bs{K}\)
です。\(\bs{K}\) が \(H\) の固定体なので、ガロア対応は、
\(G\:\sp\:H\:\sp\:\{\:e\:\}\)
\(\bs{Q}\:\subset\:\bs{K}\:\subset\:\bs{Q}(\zeta)\)
です。ガロア対応の定理(53B)により、
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{K})=H\)
であり、次数と位数の同一性(52B)により、体の拡大次数はガロア群の位数と等しいので、
\([\:\bs{Q}(\zeta):\bs{K}\:]=|H|=4\)
です。また、
\([\:\bs{Q}(\zeta):\bs{Q}\:]=\varphi(16)=8\)
なので、拡大次数の連鎖律(33H)により、
\([\:\bs{K}:\bs{Q}\:]=2\)
です。一方、\(i\) は既約な2次方程式 \(x^2+1=0\) の根なので、\([\:\bs{Q}(i):\bs{Q}\:]=2\) です。つまり \(\bs{K}\) と \(\bs{Q}(i)\) は次元(\(=\:2\))が一致し、かつ \(\bs{Q}(i)\:\subset\:\bs{K}\) なので、体の一致の定理(33I)によって、
\(\bs{K}=\bs{Q}(i)\)
です。まとめると、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q}(i))\) は位数 \(4\) の巡回群であり、\(\bs{Q}(\zeta)/\bs{Q}(i)\) は巡回拡大です。
また、
\(\tau(i)=-i\)
と定義すると、\(\tau\) は \(\bs{Q}(i)\) の自己同型写像です。従って、
\(\mr{Gal}(\bs{Q}(i)/\bs{Q})=\{e,\:\tau\}\)
であり、\(\mr{Gal}(\bs{Q}(i)/\bs{Q})\) は位数 \(2\) の巡回群で、\(\bs{Q}(i)/\bs{Q}\) は巡回拡大です。
以上で、
\(\bs{Q}\:\subset\:\bs{Q}(i)\:\subset\:\bs{Q}(\zeta)\)
は2つの巡回拡大を連鎖させた累巡回拡大です。
\(\zeta\) が 原始\(360\)乗根のとき
\(n\) が複数の素因数をもつ一般的な場合を確認します。分かりやすいように \(n=360\) とします。\(360=2^3\cdot3^2\cdot5\) なので、既約剰余類群の構造の定理(25G)によって、
\((\bs{Z}/360\bs{Z})^{*}\cong(\bs{Z}/8\bs{Z})^{*}\times(\bs{Z}/9\bs{Z})^{*}\times(\bs{Z}/5\bs{Z})^{*}\)
です。右辺の群位数はそれぞれ、
\(|(\bs{Z}/8\bs{Z})^{*}|=\varphi(8)=4\)
\(|(\bs{Z}/9\bs{Z})^{*}|=\varphi(9)=6\)
\(|(\bs{Z}/5\bs{Z})^{*}|=\varphi(5)=4\)
なので、
\(|(\bs{Z}/360\bs{Z})^{*}|=4\cdot6\cdot4=96=\varphi(360)\)
です。ここで、
\(1\) の原始\(8\)乗根 \(:\:\zeta^{45}\)
\(1\) の原始\(9\)乗根 \(:\:\zeta^{40}\)
\(1\) の原始\(5\)乗根 \(:\:\zeta^{72}\)
ですが、これらを用いると、
\(\bs{Q}(\zeta)=\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
が成り立ちます。その理由ですが、
\(\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\subset\bs{Q}(\zeta)\)
であるのは当然として、その逆である、
\(\bs{Q}(\zeta)\subset\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
も成り立つからです。なぜなら、
\(45x+40y+72z=1\)
の1次不定方程式を考えると、\(\mr{gcd}(45,40,72)=1\) なので不定方程式の解の存在の定理(21C)により必ず整数解があります。具体的には、
\(x=5,\:\:y=7,\:\:z=-7\)
が解(の一つ)です。従って、
\(\zeta=(\zeta^{45})^5\cdot(\zeta^{40})^7\cdot(\zeta^{72})^{-7}\)
であり、\(\zeta\) が \(\zeta^{45},\:\zeta^{40},\:\zeta^{72}\) の四則演算で表現できるので、
\(\bs{Q}(\zeta)\subset\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
です。この結果、
\(\bs{Q}(\zeta)=\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
となります。
以上を踏まえると、\(\bs{Q}\) から \(\bs{Q}(\zeta)\) への体の拡大は、
\(\begin{eqnarray}
&&\:\:\bs{Q}&\subset\bs{Q}(\zeta^{45})\\
&&&\subset\bs{Q}(\zeta^{45},\zeta^{40})\\
&&&\subset\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})=\bs{Q}(\zeta)\\
\end{eqnarray}\)
と、\(\bs{Q}\) からの単拡大を3回繰り返したものと言えます。以降で、それぞれの単拡大が巡回拡大になることを確認します。
\(\bs{Q}\:\subset\:\bs{Q}(\zeta^{45})\)
\(\zeta^{45}\) は原始\(8\)乗根なので、上で検討した原始\(16\)乗根の結果がそのまま使えます。つまり、
\(\bs{Q}\subset\bs{Q}(i)\subset\bs{Q}(\zeta^{45})\)
と表され、
\([\:\bs{Q}(i):\bs{Q}\:]=2\)
\([\:\bs{Q}(\zeta^{45}):\bs{Q}(i)\:]=2\)
\([\:\bs{Q}(\zeta^{45}):\bs{Q}\:]=4\)
であり、\(\mr{Gal}(\bs{Q}(i)/\bs{Q}),\:\mr{Gal}(\bs{Q}(\zeta^{45})/\bs{Q}(i))\) は位数2の巡回群です。原始8乗根は簡単に計算できて、たとえばその一つは、
\(\begin{eqnarray}
&&\:\:\zeta^{45}&=\mr{cos}\dfrac{\pi}{4}+i\:\mr{sin}\dfrac{\pi}{4}\\
&&&=\dfrac{1}{2}(\sqrt{2}+\sqrt{2}\:i)\\
\end{eqnarray}\)
なので、
\(\bs{Q}\subset\bs{Q}(i)\subset\bs{Q}(i,\sqrt{2})=\bs{Q}(\zeta^{45})\)
と表現することができます。この結果を使って、2つのガロア群 \(G_1\) と\(G_2\) の元を表現すると、
\(G_1=\mr{Gal}(\bs{Q}(i)/\bs{Q})=\{e,\:\sg_1\}\)
\(\sg_1(i)=-i\)
\(G_2=\mr{Gal}(\bs{Q}(\zeta^{45})/\bs{Q}(i))=\{e,\:\sg_2\}\)
\(\sg_2(\sqrt{2})=-\sqrt{2}\)
となります。
\(\bs{Q}(\zeta^{45})\subset\bs{Q}(\zeta^{45},\zeta^{40})\)
\(\zeta^{40}\) は原始\(9\)乗根です。原始\(9\)乗根の一つを \(\al\) と書くと、原始\(9\)乗根の全体は \(1\)~\(8\) の数で \(9\) と素なものを選んで、
\(\al,\:\al^2,\:\al^4,\:\al^5,\:\al^7,\:\al^8\)
の6つになり、これらが共役な元です。\((\bs{Z}/9\bs{Z})^{*}\) の元は、
\((\bs{Z}/9\bs{Z})^{*}=\{1,\:2,\:4,\:5,\:7,\:8\}\)
ですが、生成元は \(2\) か \(5\) です。生成元として \(2\) を採用すると、\(2^k\:(\mr{mod}\:9)\:(1\leq k\leq6)\) は、
\(2,\:4,\:8,\:7,\:5,\:1\)
と、\((\bs{Z}/9\bs{Z})^{*}\) の元を巡回します。
\(G_3=\mr{Gal}(\bs{Q}(\zeta^{45},\zeta^{40})/\bs{Q}(\zeta^{45}))\)
と書くことにし、ガロア群 \(G_3\) の元 \(\sg\) を、
\(\sg(\al)=\al^2\)
と定義すると、
\(G_3=\{e,\:\sg,\:\sg^2,\:\sg^3,\:\sg^4,\:\sg^5\}\)
となります。\(\al\) を \(\zeta\) で表すと、
\(\sg(\zeta^{40})=\zeta^{80}\)
です。 \((\br{A})\)
ただし、ガロア群の定義によって \(\sg\) は \(\zeta^{45}\) を不動にします。従って、
\(\sg(\zeta^{45})=\zeta^{45}\)
を満たさなければなりません。ここで、\(\sg\) が \(\zeta\) に作用したとき、 \((\br{B})\)
\(\sg(\zeta)=\zeta^x\)
であると仮定します。すると \((\br{A})\) 式と \((\br{C})\) 式から、 \((\br{C})\)
\(40x\equiv80\:\:(\mr{mod}\:360)\)
\(x\equiv2\:\:(\mr{mod}\:9)\)
です。また、\((\br{B})\) 式と \((\br{C})\) 式から、 \((\br{D})\)
\(45x\equiv45\:\:(\mr{mod}\:360)\)
\(x\equiv1\:\:(\mr{mod}\:8)\)
です。\(9\) と \(8\) は互いに素です。そうすると中国剰余定理(21F)によって、\((\br{D})\) 式と \((\br{E})\) 式の連立合同方程式は \(0\leq x < 9\cdot8\) の範囲に唯一の解があります。それを求めると、 \((\br{E})\)
\(x=65\)
です。当然ですが、\(65\)の累乗を \((\mr{mod}\:9)\) で計算してみると、
\(65^{\phantom{1}}\equiv2\:\:(\mr{mod}\:9)\)
\(65^2\equiv4\:\:(\mr{mod}\:9)\)
\(65^3\equiv8\:\:(\mr{mod}\:9)\)
\(65^4\equiv7\:\:(\mr{mod}\:9)\)
\(65^5\equiv5\:\:(\mr{mod}\:9)\)
\(65^6\equiv1\:\:(\mr{mod}\:9)\)
となって、\(2\) の累乗 \((\mr{mod}\:9)\) と一致します。\(\mr{mod}\:360\) に戻すと、
\(40\cdot65^{\phantom{1}}\equiv40\cdot2\:\:(\mr{mod}\:360)\)
\(40\cdot65^2\equiv40\cdot4\:\:(\mr{mod}\:360)\)
\(40\cdot65^3\equiv40\cdot8\:\:(\mr{mod}\:360)\)
\(40\cdot65^4\equiv40\cdot7\:\:(\mr{mod}\:360)\)
\(40\cdot65^5\equiv40\cdot5\:\:(\mr{mod}\:360)\)
\(40\cdot65^6\equiv40\phantom{\cdot5\:\:(}(\mr{mod}\:360)\)
です。この結果、
\(\sg_3(\zeta)=\zeta^{65}\) |
\(\sg_3^{\:\phantom{1}}(\al)=\al^2,\:\:\sg_3^{\:2}(\al)=\al^4,\:\:\sg_3^{\:3}(\al)=\al^8\)
\(\sg_3^{\:4}(\al)=\al^7,\:\:\sg_3^{\:5}(\al)=\al^5,\:\:\sg_3^{\:6}(\al)=\al\)
と巡回させます \((\zeta^{360}=1)\)。また、
\(65\cdot45=2925\equiv45\:\:(\mr{mod}\:360)\)
なので、
\(\sg_3(\zeta^{45})=\zeta^{45}\)
です。結局、
\(\begin{eqnarray}
&&\:\:G_3&=\mr{Gal}(\bs{Q}(\zeta^{45},\zeta^{40})/\bs{Q}(\zeta^{45}))\\
&&&=\{e,\:\sg_3,\:\sg_3^{\:2},\:\sg_3^{\:3},\:\sg_3^{\:4},\:\sg_3^{\:5}\}\\
\end{eqnarray}\)
\(\sg_3(\zeta)=\zeta^{65}\)
がガロア群です。
\(\bs{Q}(\zeta^{45},\zeta^{40})\subset\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
\(\zeta^{72}\) は原始\(5\)乗根で、\((\bs{Z}/5\bs{Z})^{*}\) の生成元は \(2\) か \(3\) です。生成元として \(2\) を採用すると、ガロア群の元 \(\sg\) は、先ほどと同じように考えて、
\(\sg(\zeta^{72})=\zeta^{144}\)
です。また \(\sg\) は \(\zeta^{45}\) と \(\zeta^{40}\) を固定するので、 \((\br{A}\,')\)
\(\sg(\zeta^{45})=\zeta^{45},\:\:\:\sg(\zeta^{40})=\zeta^{40}\)
です。\(\sg\) が \(\zeta\) に作用したときに、 \((\br{B}\,')\)
\(\sg(\zeta)=\zeta^x\)
だとすると、\((\br{A}\,')\:\:(\br{B}\,')\) と \((\br{C})\) により、 \((\br{C})\)
\(72x\equiv144\) | \((\mr{mod}\:360)\) | |
\(45x\equiv45\) | \((\mr{mod}\:360)\) | |
\(40x\equiv40\) | \((\mr{mod}\:360)\) |
\(x\equiv2\) | \((\mr{mod}\:5)\) | |
\(x\equiv1\) | \((\mr{mod}\:8)\) | |
\(x\equiv1\) | \((\mr{mod}\:9)\) |
\(x=217\)
です。従って、
\(\sg_4(\zeta)=\zeta^{217}\) |
\(G_4=\{e,\:\sg_4,\:\sg_4^{\:2},\:\sg_4^{\:3}\}\)
\(\sg_4(\zeta)=\zeta^{217}\)
がガロア群になります。\(217^4\equiv1\:\:(\mr{mod}\:360)\) です。なお、
\(\bs{Q}(\zeta^{45},\zeta^{40})=\bs{Q}(\zeta^5)\)
と簡略化できます。なぜなら、\(40\) と \(45\) の最大公約数は \(5\) なので、
\(45x+40y=5\)
の1次不定方程式には整数解があり(21B)、具体的には、
\(x=1,\:\:y=-1\)
が解(の一つ)で、
\(\zeta^5=\zeta^{45}\cdot(\zeta^{40})^{-1}\)
と表せるからです。また、
\(\bs{Q}(\zeta)=\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
だったので、
\(\begin{eqnarray}
&&\:\:G_4&=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q}(\zeta^5))\\
&&&=\{e,\:\sg_4,\:\sg_4^{\:2},\:\sg_4^{\:3}\}\\
\end{eqnarray}\)
\(\sg_4(\zeta)=\zeta^{217}\)
と表記できます。\(G_4\) は位数 \(4\) の巡回群であり、\(\bs{Q}(\zeta)/\bs{Q}(\zeta^5)\) は巡回拡大です。さらに、
\(\begin{eqnarray}
&&\:\:\sg_4(\zeta^5)&=\zeta^{5\cdot217}=\zeta^{1085}\\
&&&=\zeta^{3\cdot360+5}=\zeta^5\\
\end{eqnarray}\)
なので、\(\sg_4\) が \(\zeta^5\) を固定することが確認できました。
以上の考察をまとめると、\(\zeta\) が \(1\) の原始\(360\)乗根のとき、
\(\bs{Q}\subset\bs{Q}(i)\subset\bs{Q}(\zeta^{45})\subset\bs{Q}(\zeta^5)\subset\bs{Q}(\zeta)\)
という、4段階の巡回拡大が得られました。\(i\) は原始\(4\)乗根なので、\(\bs{Q}(i)\) は \(\bs{Q}(\zeta^{90})\) と同じ意味です。それそれの拡大のガロア群を \(G_1,\:G_2,\:G_3,\:G_4\) とすると、
\(G_1=\{e,\:\sg_1\}\)
\(\sg_1(i)=-i\)
\(G_2=\{e,\:\sg_2\}\)
\(\sg_2(\sqrt{2})=-\sqrt{2}\)
\(G_3=\{e,\:\sg_3,\:\sg_3^{\:2},\:\sg_3^{\:3},\:\sg_3^{\:4},\:\sg_3^{\:5}\}\)
\(\sg_3(\zeta)=\zeta^{65}\)
\(G_4=\{e,\:\sg_4,\:\sg_4^{\:2},\:\sg_4^{\:3}\}\)
\(\sg_4(\zeta)=\zeta^{217}\)
であり、これらすべてが巡回群です。また、体の拡大次数はガロア群の位数と一致し、順に \(2,\:2,\:6,\:4\) です。以上のことは、\(\zeta\) を \(1\) の\(360\)乗根とするとき、
\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/360\bs{Z})^{*}\)
\(\begin{eqnarray}
&&\:\:(\bs{Z}/360\bs{Z})^{*}&\cong(\bs{Z}/8\bs{Z})^{*}\times(\bs{Z}/9\bs{Z})^{*}\times(\bs{Z}/5\bs{Z})^{*}\\
&&&\cong(\bs{Z}/2\bs{Z})\times(\bs{Z}/2\bs{Z})\times(\bs{Z}/9\bs{Z})^{*}\times(\bs{Z}/5\bs{Z})^{*}\\
\end{eqnarray}\)
であることの必然的な結果です。
以上のガロア群の計算を通して、\(\bs{Q}(\zeta)/\bs{Q}\) は累巡回拡大であることが確認できました。
べき根拡大
(べき根拡大の定義:63G) |
\(\bs{K}\) 上の方程式 \(x^n-a=0\:(a\in\bs{K}\)、\(a\neq1)\) の解の一つで、\(\bs{K}\) に含まれないものを \(\sqrt[n]{a}\) とするとき、\(\bs{K}(\sqrt[n]{a})\) を \(\bs{K}\) のべき根拡大(radical extension)と呼ぶ。
また、\(\bs{K}\) からのべき根拡大を繰り返して拡大体 \(\bs{F}\) ができるとき、\(\bs{F}/\bs{K}\) を累べき根拡大と言う。
\(x^n-a\) は既約多項式とは限らないので、\(\bs{K}(\sqrt[n]{a})/\bs{K}\) の拡大次数は \(n\) とは限りません。
また一般に、べき根拡大はガロア拡大ではありません。しかし \(\bs{K}\) に特別の条件(= \(\bs{K}\) に \(1\) の原始\(n\)乗根 \(\zeta\) が含まれる)があるときは、べき根拡大がガロア拡大、かつ巡回拡大になります。この「原始\(\bs{n}\)乗根を含む体からのべき根拡大」を考えるのが、ガロア理論の巧妙なアイデアです。
\(1\) の原始\(n\)乗根を含むべき根拡大
(原始n乗根を含むべき根拡大:63H) |
\(1\) の原始\(n\)乗根を \(\zeta\) とし、\(\bs{K}\) に \(\zeta\) が含まれるとする。\(\bs{K}\) 上の方程式 \(x^n-a=0\:(a\in\bs{K}\)、\(a\neq1)\) の解の一つで、\(\bs{K}\) に含まれないものを \(\sqrt[n]{a}\) とし、\(\bs{L}=\bs{K}(\sqrt[n]{a})\) とすると、
\(\bs{L}/\bs{K}\) は巡回拡大である | |
\(\mr{Gal}(\bs{L}/\bs{K})\) の位数は \(n\) の約数である |
[証明]
\(\bs{K}(\sqrt[n]{a})\) 上の同型写像を \(\tau\) とする。\(x^n-a=0\) の解は、
\(\sqrt[n]{a},\:\sqrt[n]{a}\:\zeta,\:\sqrt[n]{a}\:\zeta^2,\:\cd\:,\:\sqrt[n]{a}\:\zeta^{n-1}\)
であり、\(\tau\) を \(\sqrt[n]{a}\) に作用させたときの移り先は、このうちのどれかである。もともと \(\bs{K}\) には \(1\) の原始\(n\)乗根 \(\zeta\) が 含まれているから、これらの移り先はすべて \(\bs{K}(\sqrt[n]{a})\) の元である。従って \(\tau\) は自己同型写像であり、\(\bs{K}(\sqrt[n]{a})/\bs{K}\) はガロア拡大である。
次にガロア群 \(\mr{Gal}(\bs{K}(\sqrt[n]{a})/\bs{K})\) の元と、\(\bs{K}(\sqrt[n]{a})/\bs{K}\) の拡大次数を求める。\(\sqrt[n]{a}\) の \(\bs{K}\) 上の最小多項式を \(f(x)\) とする。最小多項式は既約多項式(31I)により \(f(x)\) は既約多項式であり、\(f(x)=0\) と \(x^n-a=0\) は共通の解 \(\sqrt[n]{a}\) を持つから、\(x^n-a=0\) は \(f(x)\) で割り切れる。従って \(f(x)=0\) の解は、\(x^n-a=0\) の解、\(\sqrt[n]{a},\:\sqrt[n]{a}\:\zeta,\:\sqrt[n]{a}\:\zeta^2,\:\cd\:,\:\sqrt[n]{a}\:\zeta^{n-1}\) の全部、またはその一部である。\(f(x)=0\) の解で、\(\sqrt[n]{a}\:\zeta^{t}\) の\(t\) が最小となる 正の数を \(d\:(1\leq d\leq n-1)\) とする。そして \(\bs{K}\) の元を固定する \(\bs{K}(\sqrt[n]{a})\) の同型写像、\(\sg\) を、
\(\sg(\sqrt[n]{a})=\sqrt[n]{a}\:\zeta^{d}\)
と定義する。これは自己同型写像になるから、\(\mr{Gal}(\bs{K}(\sqrt[n]{a})/\bs{K})\) の元である。\(\sg\) は \(\bs{K}\) の元を固定するから \(\sg(\zeta)=\zeta\) である。これを用いて \(\sg^i(\sqrt[n]{a})\) を求めると、
\(\begin{eqnarray}
&&\:\:\sg^2(\sqrt[n]{a})&=\sg(\sg(\sqrt[n]{a}))=\sg(\sqrt[n]{a}\:\zeta^{d})=\sg(\sqrt[n]{a})\zeta^{d}\\
&&&=\sqrt[n]{a}\:\zeta^{d}\zeta^{d}=\sqrt[n]{a}\:\zeta^{2d}\\
&&\:\:\sg^3(\sqrt[n]{a})&=\sg(\sg^2(\sqrt[n]{a}))=\sg(\sqrt[n]{a}\:\zeta^{2d})=\sg(\sqrt[n]{a})\zeta^{2d}\\
&&&=\sqrt[n]{a}\:\zeta^{d}\zeta^{2}d=\sqrt[n]{a}\:\zeta^{3d}\\
\end{eqnarray}\)
となり、一般的には、
\(\sg^i(\sqrt[n]{a})=\sqrt[n]{a}\:\zeta^{id}\:(1\leq i)\)
となる。\(i=n\) とおくと、
\(\sg^n(\sqrt[n]{a})=\sqrt[n]{a}\:\zeta^{nd}=\sqrt[n]{a}\)
となるから、\(\sg^n=e\) である。
\(n\) を \(d\) で割ったときの商を \(s\)、余りを \(r\) とする。
\(n=sd+r\:(1 < s\leq n,\:0\leq r < d)\)
である。ここで \(\sg^i(\sqrt[n]{a})\) の \(i\) を \(n-s\) とおくと、
\(\begin{eqnarray}
&&\:\:\sg^{n-s}(\sqrt[n]{a})&=\sqrt[n]{a}\:\zeta^{nd-sd}\\
&&&=\sqrt[n]{a}\:\zeta^{n(d-1)+n-sd}\\
\end{eqnarray}\)
となる。\(\zeta^n=e\) なので、\(\zeta^{n(d-1)}=e\) であることを用いると、
\(\begin{eqnarray}
&&\:\:\sg^{n-s}(\sqrt[n]{a})&=\sqrt[n]{a}\:\zeta^{n-sd}\\
&&&=\sqrt[n]{a}\:\zeta^{r}\\
\end{eqnarray}\)
と計算できる。\(\sg^{s}\) はガロア群の元なので、\(\sg^{n-s}=\sg^{-s}\) もガロア群の元である。従って \(\sg^{n-s}(\sqrt[n]{a})\) は \(f(x)=0\) の解である。
ここでもし \(r\) がゼロでないとすると、\(1\) 以上、\(d\) 未満の数である \(r\) があって、\(\sqrt[n]{a}\:\zeta^{r}\) が \(f(x)=0\) の解となってしまう。しかしこれは、\(f(x)=0\) の解である \(\sqrt[n]{a}\:\zeta^{t}\) の \(t\) の最小値が \(d\) との仮定に反する。従って \(r=0\) である。
\(n=sd\) なので、
\(\sqrt[n]{a},\:\sqrt[n]{a}\:\zeta,\:\sqrt[n]{a}\:\zeta^2,\:\cd\:,\:\sqrt[n]{a}\:\zeta^{n-1}\)
の中に \(f(x)=0\) の解は \(s\) 個あり、
\(\sqrt[n]{a},\:\sqrt[n]{a}\:\zeta^{d},\:\:\sqrt[n]{a}\:\zeta^{2d},\:\cd\:,\:\sqrt[n]{a}\:\zeta^{(s-1)d}\)
である。\(\mr{Gal}(\bs{K}(\sqrt[n]{a})/\bs{K})\) は位数 \(s\) の巡回群であり、位数は \(n\) の約数である。\(n\) が素数 \(p\) であれば、\(\mr{Gal}(\bs{K}(\sqrt[p]{a})/\bs{K})\) は \(p\)次の巡回群である。[証明終]
この定理から分かることは、あらかじめ必要な原始\(n\)乗根を "仕込んで" おけば、べき根拡大列は巡回拡大列になるということです。たとえば、べき根拡大の列、
\(\bs{Q}\:\subset\:\bs{K}\:\subset\:\bs{L}\)
があり、\(\bs{K}/\bs{Q}\) の拡大次数を \(n_1\)、\(\bs{L}/\bs{K}\) の拡大次数を \(n_2\) とします。\(n_1,\:n_2\) の最小公倍数を \(n\)、\(1\) の原始\(n\)乗根を \(\zeta\) とします。そして、
\(\bs{Q}\:\subset\:\bs{Q}(\zeta)\:\subset\:\bs{K}\:\subset\:\bs{L}\)
の拡大列を考えると、\(\bs{Q}(\zeta)\) には、
\(1\) の原始\(n_1\)乗根 : \(\zeta^{\frac{n}{n_1}}\)
\(1\) の原始\(n_2\)乗根 : \(\zeta^{\frac{n}{n_2}}\)
が含まれているので、
\(\bs{Q}(\zeta)/\bs{Q}\) | : 累巡回拡大(63F) | |
\(\bs{K}/\bs{Q}(\zeta)\) | : 巡回拡大(63H) | |
\(\bs{L}/\bs{K}\) | : 巡回拡大(63H) |
\(\bs{L}/\bs{Q}\) : 累巡回拡大
になります。ここまでくると、可解性の必要条件の証明まであと一歩です。
6.4 可解性の必要条件
可解性の必要条件を証明する最終段階にきました。\(\bs{Q}\) 上の既約な方程式の解の一つを \(\al\) とし、\(\bs{K}=\bs{Q}(\al)\) の拡大体を考えます。\(\al\) が四則演算とべき根で表現できるということは、\(\bs{K}/\bs{Q}\) が累べき根拡大(63G)であるということです。ここが出発点です。そして証明の方針として、
\(\bs{K}/\bs{Q}\) が累べき根拡大 | |
\(\bs{K}/\bs{Q}\) が累巡回拡大 | |
ガロア拡大 | |
ガロア群が可解群 |
の4つが密接に関係していることを示します。
まず、原始\(\bs{n}\)乗根を含むべき根拡大の定理(63H)により、累べき根拡大の拡大のステップに必要な原始\(n\)乗根の全種類をあらかじめ \(\bs{Q}\) に含めておけば、① 累べき根拡大は ② 累巡回拡大と同じことなります。
さらに、累巡回拡大ガロア群の可解性(62C)の定理により、もし \(\bs{K}/\bs{Q}\) が ③ ガロア拡大であれば、累巡回拡大 \(\bs{K}/\bs{Q}\) のガロア群 \(\mr{Gal}(\bs{K}/\bs{Q})\) は ④ 可解群です。
しかし、累巡回拡大の定義(62B)のところで書いたように、\(\bs{K}/\bs{Q}\) が累巡回拡大であってもガロア拡大であるとは限りません。そこで、
\(\bs{Q}\:\subset\:\bs{K}\:\subset\:\bs{E}\)
となるような \(\bs{E}\) で、\(\bs{E}/\bs{Q}\) が累巡回拡大、かつガロア拡大である \(\bs{E}\) が必ず存在することを証明できれば、① \(\rightarrow\) ② \(\rightarrow\) ③ \(\rightarrow\) ④ が一気通貫でつながることになります。このような \(\bs{E}\)(そこには \(\al\) が含まれる)の存在を、累巡回拡大の定義(62B)の説明で書いたシンプルな例で考察します。
代数的数 \(\al\) を、
\(\al=\sqrt{\sqrt{2}+1}\)
とします。この \(\al\) は \(\bs{Q}\) 上の既約な方程式、
\(f(x)=x^4-2x^2-1=0\)
の解の一つです。この \(f(x)\) は \(\al\) の最小多項式です。ちなみに \(f(x)\) は、
\(f(x)=(x^2-(\sqrt{2}+1))(x^2+(\sqrt{2}-1))\)
と変形できるので、方程式 \(f(x)=0\) の解は
\(x=\pm\sqrt{\sqrt{2}+1},\:\:\:\pm i\sqrt{\sqrt{2}-1}\)
の4つです。
\(\al\) を含む \(\bs{Q}\) の拡大体 \(\bs{Q}(\al)\) を考えます。\(\bs{Q}\:\subset\:\bs{Q}(\al)\) ですが、べき根拡大だけで表現すると、
\(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\:\:\subset\:\bs{Q}(\sqrt{\sqrt{2}+1})\)
の累べき根拡大になります。つまり、\(\bs{Q}\) 上の方程式、
\(x^2-2=0\)
の解の一つ \(\sqrt{2}\) を \(\bs{Q}\) に添加してべき根拡大をし、\(\bs{Q}(\sqrt{2})\) 上の方程式、
\(x^2-(\sqrt{2}+1)=0\)
の解の一つ \(\sqrt{\sqrt{2}+1}\) を \(\bs{Q}(\sqrt{2})\) に添加したのが \(\bs{Q}(\sqrt{\sqrt{2}+1})\) です。2つのべき根拡大の拡大次数は2です。\(1\) の原始2乗根は \(-1\) なので、始めから \(\bs{Q}\) に含まれています。従って、
\(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\) は
・べき根拡大
・巡回拡大
\(\mr{Gal}(\bs{Q}(\sqrt{2})=\{\sg_1,\:\sg_2\}\)
\(\sg_1=e\)
\(\sg_2(\sqrt{2})=-\sqrt{2}\)
・\(\bs{Q}(\sqrt{2})\) は \(\bs{Q}\) 上の多項式 \(x^2-2\) の最小分解体
となります。まったく同様に、
\(\bs{Q}(\sqrt{2})\:\subset\:\bs{Q}(\sqrt{\sqrt{2}+1})\) は
・べき根拡大
・巡回拡大
です。しかし、\(\bs{Q}(\sqrt{\sqrt{2}+1})/\bs{Q}\) がガロア拡大ではありません。というのも、\(\bs{Q}(\sqrt{\sqrt{2}+1})\) は \(\bs{Q}\) 上ではなく \(\bs{Q}(\sqrt{2})\) 上の方程式、
\(x^2-(\sqrt{2}+1)=0\)
の解の一つ \(\sqrt{\sqrt{2}+1}\) を \(\bs{Q}(\sqrt{2})\) に添加したものだからです。
そこで、\(\bs{Q}(\sqrt{2})\) 上の2つの方程式、
・\(x^2-\sg_1(\sqrt{2}+1)=0\)
・\(x^2-\sg_2(\sqrt{2}+1)=0\)
の解を順に \(\bs{Q}(\sqrt{2})\) に追加することにします。つまり、
・\(\sqrt{\phantom{-}\sqrt{2}+1}\)
・\(\sqrt{-\sqrt{2}+1}\)
の2つを \(\bs{Q}(\sqrt{2})\) に追加します。ガロア群は必ず単位元 \(e\) を含むので、\(\sg_1(\sqrt{2}+1)\) と \(\sg_2(\sqrt{2}+1)\) のどちらかは \(\al=\sqrt{\sqrt{2}+1}\) になります。この追加は2つともべき根拡大であり、巡回拡大です。こうして出来上がった拡大体を \(\bs{E}\) とすると、
\(\bs{E}=\bs{Q}(\sqrt{\sqrt{2}+1},\sqrt{-\sqrt{2}+1})\)
です。以上のことを別の観点で言うと、多項式 \(g(x)\) を、
\(g(x)=(x^2-\sg_1(\sqrt{2}+1))(x^2-\sg_2(\sqrt{2}+1))\)
と定義するとき、
\(g(x)=0\) の解を \(\bs{Q}(\sqrt{2})\) に追加したのが \(\bs{E}\)
ということになります。\(g(x)\) を計算すると、
\(\begin{eqnarray}
&&\:\:g(x)&=(x^2-\sg_1(\sqrt{2}+1))(x^2-\sg_2(\sqrt{2}+1))\\
&&&=(x^2-(\sqrt{2}+1))(x^2+(\sqrt{2}-1))\\
&&&=x^4-2x^2-1\\
\end{eqnarray}\)
となり、\(g(x)\) は \(\bs{Q}\) 上の多項式です。なぜそうなるかと言うと、\(g(x)\) の係数は \(\sg_1(\sqrt{2}+1)\) と \(\sg_2(\sqrt{2}+1)\) の対称式で表されるからで、従ってガロア群の元 \(\sg_1,\:\sg_2\) を作用させても不変であり、つまり係数が有理数だからです。ここから得られる結論は、
\(\bs{E}\) は \(\bs{Q}\) 上の多項式 \(g(x)\) の最小分解体である
ということです。このことは、\(\al=\sqrt{\sqrt{2}+1}\) の最小多項式が \(x^4-2x^2-1=g(x)\) であったことからも確認できます。従ってガロア拡大の定義(52A)により、
\(\bs{E}/\bs{Q}\) はガロア拡大
です。まとめると、
\(\bs{Q}\:\subset\:\bs{Q}(\al)\:\subset\:\bs{E}\)
\(\bs{E}/\bs{Q}\) は累巡回拡大、かつガロア拡大
である \(\bs{E}\) の存在が証明できました。
以上は "2段階の2次拡大" という非常にシンプルな例ですが、このことを一般的に(多段階の \(n\)次拡大で)述べると次のようになります。
ガロア閉包
(ガロア閉包の存在:64A) |
\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つである \(\al\) がべき根で表されているとする。このとき「\(\bs{Q}\) のガロア拡大 \(\bs{E}\) で、\(\al\) を含み、\(\bs{E}/\bs{Q}\) が累巡回拡大」であるような 代数拡大体 \(\bs{E}\) が存在する。
[証明]
\(\bs{Q}\)上の方程式 \(f(x)=0\) の解の一つ \(\al\) がべき根で表されているとき、
\(\bs{Q}=\bs{K}_0\subset\bs{K}_1\subset\cd\subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cd\subset\bs{K}_k=\bs{K}\)
\(\bs{K}_{i+1}=\bs{K}_i(\al_{i+1})\) | |
\(\al_{i+1}\) は \(x^{n_i}-a_i=0\:(a_i\in\bs{K}_i)\) の根の一つ | |
\([\bs{K}_{i+1}:\bs{K}_i]=n_i\) | |
\(\al_k=\al\:\in\:\bs{K}_k=\bs{K}\) |
となる、べき根拡大列 \(\bs{K}_i\) が存在する(= \(\bs{K}/\bs{Q}\) が累べき根拡大)。このべき根拡大列を修正して、
\(\bs{Q}\subset\bs{F}_0\subset\bs{F}_1\subset\cd\subset\bs{F}_i\subset\bs{F}_{i+1}\subset\cd\subset\bs{F}_k=\bs{E}\)
\(\bs{K}_i\:\subset\:\bs{F}_i\) | |
\(\bs{F}_{i+1}/\bs{F}_i\) は累巡回拡大 | |
\(\bs{E}/\bs{Q}\) はガロア拡大 | |
\(\al_k=\al\:\in\:\bs{K}_k\:\subset\:\bs{F}_k=\bs{E}\) |
とできることを以下に示す。まず、\(n_i\:(0\leq i < k)\) の最小公倍数を \(n\) とし、\(1\) の原始\(n\)乗根を \(\zeta\) とする。そして、
\(\bs{F}_0=\bs{Q}(\zeta)\)
とおくと、\(\bs{K}_0(=\bs{Q})\:\subset\:\bs{F}_0\) であり、\(\bs{F}_0\) は \(1\) の原始\(n_i\)乗根 \((0\leq i < k)\) を全て含むことになる。
\(\bs{F}_0\) は \(\bs{Q}(\zeta)\) だから、\(\mr{Gal}(\bs{F}_0/\bs{Q})=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は巡回群の直積に同型であり(63F)、従って可解群である(61B)。つまり、\(\bs{F}_0/\bs{Q}\) は累巡回拡大である(62C)。
次に、
\(\bs{F}_1=\bs{F}_0(\al_1)\)
とおく。\(\al_1\) は \(\bs{K}_0=\bs{Q}\) 上の方程式 \(x^{n_0}-a_0=0\:(a_0\in\bs{K}_0\:\subset\:\bs{F}_0)\) の根の一つで、\(\al_1=\sqrt[n_0]{a_0}\) であるから、\(\bs{F}_1\) は \(\bs{F}_0\) のべき根拡大になる。
すると、\(\bs{F}_0\)は \(1\) の原始\(n_0\)乗根を含むから、原始\(\bs{n}\)乗根を含むべき根拡大の定理(63H)により、\(\bs{F}_1/\bs{F}_0\) は巡回拡大である。この拡大次数は \([\bs{F}_1:\bs{F}_0]=[\bs{K}_1:\bs{K}_0(=\bs{Q})]=n_0\) である。
また \(\bs{F}_1\)は、\(\bs{Q}\) 上の方程式 \(x^{n_0}-a_0=0\) の解 \(\al_1\eta^j\)(\(\eta\) は \(1\) の原始\(n_0\)乗根。\(0\leq j < n_0\))をすべて含むから、\(\bs{F}_1/\bs{Q}\) はガロア拡大である。
次に \(\bs{K}_2\) を修正した \(\bs{F}_2\) を考える。\(\mr{Gal}(\bs{F}_1/\bs{Q})\) の元を \(\sg_j\:(1\leq j\leq m,\:\sg_1=e)\) の \(m\)個とする。
\(\al_2\) は \(x^{n_1}-a_1=0\:\:(a_1\in\bs{K}_1\:\subset\:\bs{F}_1)\) の根の一つであった。そこで、
\(\sg_j(a_1)\) \((1\leq j\leq m)\)
という \(m\)個の元をもとに、
\(x^{n_1}-\sg_j(a_1)=0\:(a_1\in\bs{K}_1\:\subset\:\bs{F}_1,\:\:1\leq j\leq m)\)
という \(m\)個の方程式群を考える。\(\sg_j\) の中には単位元 \(e\) が含まれるため、\(x^{n_1}-a_1=0\) も方程式群の中の一つである。
この \(m\)個の方程式の \(m\)個の解、
\(\sqrt[n_1]{\sg_j(a_1)}\) \((1\leq j\leq m)\)
を \(\bs{F}_1\) に順々に添加していき、最終的にできた体を \(\bs{F}_2\) とする。\(\bs{F}_1\) は \(1\) の原始 \(n_1\)乗根を含むから、\(\sqrt[n_1]{\sg_j(a_1)}\) \((1\leq j\leq m)\) の添加はすべて巡回拡大である(63H)。つまり、\(\bs{F}_2\) は \(\bs{F}_1\) の累巡回拡大である。\(\sg_j\) の中には単位元があるから、\(\bs{F}_2\) には \(\al_2=\sqrt[n_1]{a_1}\) を含む。
ここで多項式 \(g(x)\) を、
\(g(x)=\displaystyle\prod_{j=1}^{m}(x^{n_1}-\sg_j(a_1))\)
と定義する。\(\bs{F}_1\) は \(1\) の原始 \(n_1\)乗根を含むから、\(\bs{F}_2\) は \(g(x)=0\) のすべての解を \(\bs{F}_1\) に添加した拡大体である。
多項式 \(g(x)\) の係数は、根と係数の関係から \(\sg_j(a_1)\:\:(1\leq j\leq m)\) の対称式であり、係数に任意の \(\sg_j\:(=\mr{Gal}(\bs{F}_1/\bs{Q})\) の元\()\) を作用させても不変である。つまり係数は有理数であり、\(g(x)\) は \(\bs{Q}\) 上の多項式である。結局、\(\bs{F}_2\) は \(\bs{Q}\) 上の多項式 \(g(x)\) の最小分解体であり、\(\bs{F}_2/\bs{Q}\) はガロア拡大である(52A)。
まとめると、
\(a_1\:\in\:\bs{K}_1\:\subset\:\bs{F}_1\) | |
\(\bs{F}_1\) には \(1\) の原始\(n_1\)乗根が含まれる | |
\(\al_2\) は \(x^{n_1}-a_1=0\) の根の一つ | |
\(\mr{Gal}(\bs{F}_1/\bs{Q})\) の元が \(\sg_j\:(1\leq j\leq m,\:\:\:\sg_1=e)\) |
\(g(x)=\displaystyle\prod_{j=1}^{m}(x^{n_1}-\sg_j(a_1))\)
の条件で、\(g(x)=0\) のすべての解を \(\bs{F}_1\) に添加した拡大体を \(\bs{F}_2\) とすると、
\(\bs{F}_2/\bs{F}_1\) 累巡回拡大 | |
\(\bs{F}_2/\bs{Q}\) はガロア拡大 | |
\(\al_2\:\in\:\bs{K}_2\:\subset\:\bs{F}_2\) |
この \(\bs{K}_i\) を \(\bs{F}_i\) に修正する操作は、\(\bs{K}_k\) を修正して \(\bs{F}_k\) にするまで続けることができる。従って、
\(\bs{Q}\subset\bs{F}_0\subset\bs{F}_1\subset\cd\subset\bs{F}_i\subset\bs{F}_{i+1}\subset\cd\subset\bs{F}_k=\bs{E}\)
の拡大列が存在し、\(\bs{K}\:\subset\:\bs{F}_i\) | |
\(\bs{F}_{i+1}/\bs{F}_i\) は累巡回拡大 | |
\(\bs{F}_k/\bs{Q}\) はガロア拡大 | |
\(\al_k=\al\:\in\:\bs{F}_k(=\bs{E})\) |
![]() |
\(1\) の原始\(n\)乗根を含む \(\bs{Q}(\zeta)\) からのべき根拡大を考えることによって、体の拡大が巡回拡大(=ガロア群が巡回群であるガロア拡大)になり(63H)、その繰り返しは累巡回拡大になります。しかし累巡回拡大が "全体としてガロア拡大になる" とは限りません(62B)。
そこで、ひと工夫して、\(\bs{\bs{F}_i}\) が常に \(\bs{\bs{Q}}\) 上の方程式 \(\bs{g(x)}\) の最小分解体で、かつ \(\bs{\al_i}\) を含むようにすると、\(\bs{F}_i/\bs{Q}\) が常にガロア拡大になっているので、\(\bs{E}/\bs{Q}\) もガロア拡大になります。しかも最終到達点である \(\bs{F}_k=\bs{E}\) の中には、元々の方程式の解である \(\al\) がある。このような \(\bs{E}\) の存在が重要です。この \(\bs{Q}(\zeta)\:\rightarrow\:\bs{E}\) の拡大を考えることで、単なるべき根拡大列だった \(\bs{Q}\:\rightarrow\:\bs{K}\) をガロア理論の俎上に乗せることができます。
一方、\(\bs{\bs{Q}(\zeta)/\bs{Q}}\) が累巡回拡大になるのは、全く別のロジックによります。つまり、\(\bs{Q}(\zeta)/\bs{Q}\) がガロア拡大で(63D)かつ、ガロア群が巡回群の直積に同型(63F)であり、従ってガロア群が可解群(61B)だからです。そうすると累巡回拡大ガロア群の可解性(62C)によって \(\bs{Q}(\zeta)/\bs{Q}\) は累巡回拡大です。
以上の2つの合わせ技で、\(\bs{Q}\) から \(\bs{E}\) に至る累巡回拡大の列ができ、しかも \(\bs{E}/\bs{Q}\) がガロア拡大になっていて、次の可解性の必要条件の証明につながります。
可解性の必要条件
(可解性の必要条件:64B) |
\(\bs{Q}\) 上の \(n\)次既約方程式 \(f(x)=0\) の解の一つ がべき根で表されているとする。\(f(x)\) の最小分解体を \(\bs{L}\) とするとき、\(\mr{Gal}(\bs{L}/\bs{Q})\) は可解群である。
[証明]
ガロア閉包の存在定理(64A)により、\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つがべき根で表されているとすると、
\(\bs{Q}=\bs{K}_0\subset\bs{K}_1\subset\cd\subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cd\subset\bs{K}_k=\bs{E}\)
という拡大列で、\(\bs{E}/\bs{Q}\) は累巡回拡大 | |
\(\bs{E}/\bs{Q}\) はガロア拡大 | |
\(\al\:\in\:\bs{E}\) |
また、\(\bs{E}/\bs{Q}\) がガロア拡大ということは、中間体からのガロア拡大の定理(52C)により、\(\bs{E}/\bs{L}\) もガロア拡大である。従って、
\(\mr{Gal}(\bs{E}/\bs{Q})=G\)
\(\mr{Gal}(\bs{E}/\bs{L})=H\)
と書くと、
\(G\) \(\sp\) \(H\) \(\sp\) \(\{\:e\:\}\)
\(\bs{Q}\) \(\subset\) \(\bs{L}\) \(\subset\) \(\bs{E}\)
のガロア対応(53B)が成り立つ。
\(\bs{L}\) は \(\bs{Q}\) 上の既約多項式 \(f(x)\) の最小分解体だから、\(\bs{L}/\bs{Q}\) はガロア拡大である(52A)。ゆえに正規性定理(53C)により、\(H\) は \(G\) の正規部分群であり、
\(\mr{Gal}(\bs{L}/\bs{Q})\:\cong\:G/H\)
が成り立つ。
\(\bs{E}/\bs{Q}\) はガロア拡大かつ累巡回拡大だから、累巡回拡大ガロア群の可解性(62C)の定理によって \(G\) は可解群である。\(G\) が可解群なので、その剰余群である \(G/H\) も可解群である(61D)。従って、\(G/H\) と同型である \(\mr{Gal}(\bs{L}/\bs{Q})\) も可解群である。[証明終]
この定理の対偶をとると、
\(\bs{Q}\) 上の既約方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とするとき、\(\mr{Gal}(\bs{L}/\bs{Q})\) が可解群でなければ、\(f(x)=0\) の解のすべてはべき根で表されない(=非可解)
となります。これを用いて、非可解な5次方程式があることを証明できます。
6.5 5次方程式の解の公式はない
5次方程式には解の公式はないことをガロア理論で証明します。そのためにまず、対称群、交代群、置換の説明をします。
対称群 \(S_n\)
集合 \(\Omega_n=\{1,\:2,\:\cd\:n\}\) から \(\Omega_n\) への全単射写像(1対1写像)の全体を \(S_n\) と書き、\(n\)次の対称群(symmetric group)と言います。\(1,\:2,\:\cd\) は整数ではなく、集合の元を表す文字です。一般に集合 \(X\) から \(X\) への全単射写像を置換(permutation)と呼ぶので、\(S_n\) の元は \(n\) 個の文字の置換です。
\(S_n\) の元の一つを \(\sg\) とします。\(1\leq k\leq n\) とし、\(\sg\)による \(k\) の移り先を \(\sg(k)\) とすると、\(\sg\) は全単射写像なので、\(k\neq k\,'\) なら\(\sg(k)\neq\sg(k\,')\) です。従って、\((\sg(1),\sg(2),\cd,\sg(n))\) は、\((1,2,\cd n)\) の一つの順列になります。逆に、\((1,2,\cd n)\) の順列の一つを \((i_1,i_2,\cd i_n)\) とすると、\(\sg(k)=i_k\) で \(\Omega_n\) から \(\Omega_n\) への全単射写像が得られます。つまり \(S_n\) は \((1,2,\cd n)\) のすべての順列と同一視できます。
\(S_n\) の元の2つを \(\sg\)、\(\tau\) とし、\(\sg\) と \(\tau\) の合成写像 \(\sg\tau\) を、
\(\sg\tau(k)=\sg(\tau(k))\:\:(1\leq k\leq n)\)
で定義すると、\(\sg\tau\) も全単射写像なので \(S_n\) の元であり、\(S_n\) は群になります。単位元 \(e\) は \(e(k)=k\:(1\leq k\leq n)\) である恒等写像です。また、\(\sg\) は全単射写像なので逆写像 \(\sg^{-1}\) があり、群の定義を満たしています。
\(S_n\) は \((1,2,\cd n)\) のすべての順列と同一視できるので、その位数は
\(|S_n|=n\:!\)
です。\(S_n\) の元 \(\sg\) を、
\(\sg=\left(\begin{array}{c}1&2&\cd&n\\\sg(1)&\sg(2)&\cd&\sg(n)\end{array}\right)\)
と表します。この表記では縦の列が合っていればよく、並び順に意味はありません。これを使うと \(\sg\) の逆元は、
\(\sg^{-1}=\left(\begin{array}{c}\sg(1)&\sg(2)&\cd&\sg(n)\\1&2&\cd&n\end{array}\right)\)
です。
\(S_3\) の元を \(\sg_1,\sg_2,\:\cd\:\sg_6\) とし、具体的に書いてみると、
\(\sg_1=\left(\begin{array}{c}1&2&3\\1&2&3\end{array}\right)\) \(\sg_2=\left(\begin{array}{c}1&2&3\\2&3&1\end{array}\right)\)
\(\sg_3=\left(\begin{array}{c}1&2&3\\3&1&2\end{array}\right)\) \(\sg_4=\left(\begin{array}{c}1&2&3\\1&3&2\end{array}\right)\)
\(\sg_5=\left(\begin{array}{c}1&2&3\\3&2&1\end{array}\right)\) \(\sg_6=\left(\begin{array}{c}1&2&3\\2&1&3\end{array}\right)\)
となります。\(\sg_1\) は恒等置換 \(e\) です。なお \(S_3\) は、1.3節に出てきた3次の2面体群と同じものです。
巡回置換
\(S_n\) に現れる \(n\)文字からその一部を取り出します。例えば3つ取り出して、\(i,\:j,\:k\) とします。そして、
\(i\rightarrow j,\:\:j\rightarrow k,\:\:k\rightarrow i\)
と文字を循環させ、その他の文字は不動にする置換 \(\sg\) を考えます。これが巡回置換(cyclic permutation)です。
\(\sg=\left(\begin{array}{c}\cd&i&\cd&j&\cd&k&\cd\\\cd&j&\cd&k&\cd&i&\cd\end{array}\right)\)
と表せて、\(\cd\) の部分は不動です。これを簡略化して、
\(\sg=(i,\:j,\:k)\)
と表記します。\(\sg\) の逆元は、
\(\sg^{-1}\) | \(=(i,\:j,\:k)^{-1}\) | |
\(=\left(\begin{array}{c}\cd&i&\cd&j&\cd&k&\cd\\\cd&j&\cd&k&\cd&i&\cd\end{array}\right)^{-1}\) | ||
\(=\left(\begin{array}{c}\cd&j&\cd&k&\cd&i&\cd\\\cd&i&\cd&j&\cd&k&\cd\end{array}\right)\) | ||
\(=\left(\begin{array}{c}\cd&i&\cd&j&\cd&k&\cd\\\cd&k&\cd&i&\cd&j&\cd\end{array}\right)\) | ||
\(=(k,\:j,\:i)\) |
\(\sg=(i_1,\:i_2,\:\cd\:,i_m)\)
です。長さ \(m\) の巡回置換、とも言います。逆元は文字の順序を逆順にした、
\(\sg^{-1}=(i_m,\:i_{m-1},\:\cd\:,i_1)\)
です。\(m\)文字の巡回置換を群としてとらえたとき、 \(C_m\) で表します。\(C_m\) は位数 \(m\) の巡回群で、可換群です。
特に、2文字の巡回置換を互換(transposition)と言います。巡回置換と互換について、次の定理が成り立ちます。
(置換は巡回置換の積:65A) |
すべての置換は共通文字を含まない巡回置換の積で表せる。
[証明]
\(n\)次対称群 \(S_n\) の任意の元を \(\sg\) とすると、\(\sg\) は \(n\)文字の任意の置換である。\(n\)文字の中から \(\sg(a)\neq a\) である文字 \(a\) を選ぶ。そして \(\sg(a),\:\sg^2(a),\:\sg^3(a),\:\cd\) という、\(\sg\) による \(a\) の写像を繰り返す列を考える。\(\sg\)による \(a\) の移り先は最大 \(n\)個なので、列の中には、
\(\sg^j(a)=\sg^i(a)\:\:(i < j)\)
となる \(i,\:j\) が必ず出てくる。つまり、
\(\sg^{j-i}(a)=a\)
となる \(i,\:j\) が存在する。\(k_a\) を \(\sg^{k_a}(a)=a\) となる最小の数とすると、
\(\sg(a),\:\sg^2(a),\:\cd\:,\sg^{k_a}(a)=a,\:\sg(a),\:\cd\)
となり、\(k_a+1\)番目で \(\sg(a)\) に戻って以降は巡回する。\(\sg_1\) を、 \((\br{A})\)
\(\sg_1=(\sg(a),\:\sg^2(a),\:\cd\:,\sg^{k_a}(a))\)
の巡回置換と定義する。
もし仮に列 \((\br{A})\) が、\(\sg\) で変化する文字全部を尽くしているなら、題意は正しい。そうでないとき、列 \((\br{A})\) に現れない文字で \(\sg(b)\neq b\) である \(b\) を選ぶ。上と同様にして、
\(\sg(b),\:\sg^2(b),\:\cd\:,\sg^{k_b}(b)=b\)
の列が作れる。\((\br{B})\) 列に \((\br{A})\) 列と同じ文字は現れない。なぜなら、もし列 \((\br{B})\) の \(\sg^i(b)\) が \((\br{A})\) 列に現れるとすると、\(\sg^i(b)\) に \(\sg\) による置換を繰り返すといずれは \(b\) になるから、\(b\) が \((\br{A})\) 列に現れることになってしまい、「列 \((\br{A})\) に現れない文字 \(b\)」ではなくなるからである。従って、 \((\br{B})\)
\(\sg_2=(\sg(b),\:\sg^2(b),\:\cd\:,\sg^{k_b}(b)=b)\)
という、2つ目の巡回置換が定義できる。列 \((\br{A})\) と \((\br{B})\) が \(\sg\) で変化する文字全部を尽くすなら、\(\sg=\sg_2\sg_1\) である。\(\sg_1\) と \(\sg_2\) に共通の文字は現れないので、\(\sg=\sg_1\sg_2\) と書いてもよい。
以上の操作は、\(\sg\) で変化する文字全部を尽くすまで繰り返すことができる。その繰り返し回数を \(m\) とすると、
\(\sg=\sg_1\sg_2\:\cd\:\sg_m\)
であり、任意の置換 \(\sg\) は巡回置換の積で表せることになる。なお、恒等置換 \(e\) は、
\(e=(i,\:j)^2\)
\(e=(i,\:j,\:k)^3\)
などであり、巡回置換の積で表せることに変わりはない。[証明終]
置換を巡回置換の積で表すと、例えば、
\(\sg\) | \(=\left(\begin{array}{c}1&2&3&4&5&6\\1&4&5&6&3&2\end{array}\right)\) | |
\(=(2,\:4,\:6)(3,\:5)\) |
(置換は互換の積:65B) |
すべての置換は互換の積で表せる。
[証明]
巡回置換 \((1,\:2,\:3)\) は
\((1,\:2,\:3)=(1,\:3)(1,\:2)\)
と表せる(積は右から読む)。また、巡回置換 \((1,\:2,\:3\). \(4)\) は、
\((1,\:2,\:3,\:4)=(1,\:4)(1,\:3)(1,\:2)\)
である。一般に、
\((i_1,\:i_2,\:\cd\:,i_m)=(i_1,\:i_m)\:\cd\:(i_1,\:i_2)\)
である。このように巡回置換は互換の積で表せる。すべての置換は巡回置換の積で表せる(65A)ので、題意は正しい。[証明終]
交代群 \(A_n\)
一つの置換を互換の積で表す方法が一意に決まるわけではありません。たとえば、
\((1,\:2,\:3)\) | \(=(1,\:3)(1,\:2)\) | |
\(=(1,\:3)(2,\:3)(1,\:2)(1,\:3)\) |
(置換の偶奇性:65C) |
一つの置換を互換の積で表したとき、その互換の数は奇数か偶数かのどちらかに決まる。
[証明]
\(n\)変数の多項式 \(f(x_1,x_2,\cd,x_n)\) を、
\(f(x_1,x_2,\cd,x_n)=\displaystyle\prod_{1\leq i < j\leq n}^{}(x_i-x_j)\)
と定義する(差積と呼ばれる)。\(S_n\) の一つの元を \(\sg\) とし、\(\sg\) を \(f(x_1,x_2,\cd,x_n)\) に作用させることを、
\(\sg\cdot f(x_1,x_2,\cd,x_n)=f(x_{\sg(1)},x_{\sg(2)},\cd,x_{\sg(n)})\)
と定義する。\(\sg\) が互換、つまり \(\sg=(i,\:j)\) であれば、
\((i,\:j)\cdot f(x_1,x_2,\cd,x_n)=-f(x_1,x_2,\cd,x_n)\)
となる。これはすべての互換で成り立つ。
\(\sg\) が \(k\)個の互換の積で表されていると、
\(\sg\cdot f(x_1,x_2,\cd,x_n)=(-1)^kf(x_1,x_2,\cd,x_n)\)
である。もし、\(m\neq k\) として \(\sg\) が \(m\)個の互換の積で表せたとしたら、
\(\sg\cdot f(x_1,x_2,\cd,x_n)=(-1)^mf(x_1,x_2,\cd,x_n)\)
である。従って、
\((-1)^k=(-1)^m\)
であり、\(k\) と \(m\) の偶奇は等しい。[証明終]
置換の偶奇性(65C)により、置換は2つのタイプに分けることができます。偶数個の互換の積で表す置換を偶置換(even permutaion)、奇数個の互換の積で表す置換を奇置換(odd permutaion)と言います。
偶置換の積は偶置換です。従って、\(S_n\) の偶置換の元を集めた集合は群になります。これを \(n\)次交代群(alternating group)といい、\(A_n\) で表します。
(交代群は正規部分群:65D) |
\(S_n\) の元は同数の偶置換と奇置換から成る。従って、
\([\:S_n\::\:A_n\:]=2\)
である。
\(A_n\) は \(S_n\) の正規部分群であり、\(S_n/A_n\) は巡回群である。
[証明]
\(B_n\) を \(S_n\) に含まれる奇置換の集合とする。\(S_n\) の任意の互換を \(\sg\) とすると、集合 \(\sg A_n\) のすべての元は奇置換だから、
\(\sg A_n\subset B_n\)
が成り立つ。それとは逆に、集合 \(\sg B_n\) のすべての元は偶置換だから、
\(\sg B_n\subset A_n\)
も成り立つ。この式に左から \(\sg\) を作用させると、
\(\sg^2B_n\subset\sg A_n\)
\(B_n\subset\sg A_n\)
となる。\(\sg A_n\subset B_n\) かつ \(B_n\subset\sg A_n\) なので、
\(B_n=\sg A_n\)
となり、\(B_n\) と \(A_n\) の元の数は等しい。\(S_n=A_n\cup B_n\) なので、
\([\:S_n\::\:A_n\:]=2\)
である。
\(S_n\) の部分群 \(A_n\) の元の数は \(S_n\) の元の数の半分なので、\(S_n\) は \(A_n\) の2つの左剰余類(または右剰余類)の和集合である。従って、\(B_n\) の 任意の元を \(b\) とすると、
(\(A_n\) の左剰余類) \(S_n=A_n\cup bA_n\:\:(A_n\cap bA_n=\phi)\)
(\(A_n\) の右剰余類) \(S_n=A_n\cup A_nb\:\:(A_n\cap A_nb=\phi)\)
となり、\(bA_n=A_nb\) である。また \(A_n\) の元 \(a\) については、\(A_n\) が群なので \(aA_n=A_n,\:A_na=A_n\) である。従って \(S_n\) の任意の元 \(\sg\) について \(\sg A_n=A_n\sg\) が成り立ち、\(A_n\) は \(S_n\) の正規部分群である。
\(A_n\) が正規部分群なので、\(S_n/A_n\) は剰余群である。\(S_n\) の任意の元を \(\sg\) とし、\(S_n/A_n\) の元を \(\sg A_n\) とすると、
\((\sg A_n)^2=\sg A_n\sg A_n=\sg\sg A_nA_n=\sg^2A_n\)
となるが、\(\sg A_n=B_n\) であり \(\sg B_n=A_n\) だから、\(\sg^2A_n=A_n\) である。つまり、
\((\sg A_n)^2=A_n\)
を満たす。\(A_n\) は 剰余群 \(S_n/A_n\) の単位元だから、\(S_n/A_n\) は巡回群でである。[証明終]
(交代群は3文字巡回置換の積:65E) |
交代群 \(A_n\) の任意の元は、3文字の巡回置換の積で表せる。
[証明]
\(A_n\) の任意の元は偶数個の互換の積で表せる。この互換の積を2つずつ右から(ないしは左から)取り出すことを考える。2つの互換の積には4つの文字があるが、それには次の2つパターンがある。
異なる4文字
\((i,\:j)(k,\:m)\)
異なる3文字
\((i,\:j)(i,\:k)\)
異なる3文字のうち、\((i,\:j)(j,\:k)\) のパターンは、\(i\) を \(j\) と読み替え、\(j\) を \(i\) と読み替えると \((j,\:i)(i,\:k)\) となり、\((i,\:j)(i,\:k)\) と同じである。また、\((i,\:j)(k,\:i)\) や \((i,\:j)(k,\:j)\) も \((i,\:j)(i,\:k)\) と同じである。
異なる2文字から成る \((i,\:j)(i,\:j)\) は恒等互換なので無視してよい。
2つの互換の積の2パターンは、いずれも3文字の巡回置換の積で表せる。つまり、
\(\left(\begin{array}{c}i&j&k&m\\k&i&j&m\end{array}\right)=(i,\:k,\:j)\)
\(\left(\begin{array}{c}k&i&j&m\\j&i&m&k\end{array}\right)=(j,\:m,\:k)\)
\(\left(\begin{array}{c}i&j&k&m\\j&i&m&k\end{array}\right)=(i,\:j)(k,\:m)\)
なので、
\((i,\:j)(k,\:m)=(j,\:m,\:k)(i,\:k,\:j)\)
である。また、巡回置換を互換の積で表す標準的な方法(65B)から、
\((i,\:j)(i,\:k)=(i,\:k,\:j)\)
である。
\(A_n\) は「2つの互換の積」の積、で表現でき、「2つの互換の積」は「3文字の巡回置換の積」で表せるので、題意は正しい。[証明終]
なお、上の交代群は正規部分群(65D)の証明では、「交代群 \(A_n\) の元の数が、対称群 \(S_n\) の元の数の半分である」ことしか使っていません。従って次の定理が成り立ちます。
(半分の部分群は正規部分群:65F) |
群 \(G\) の部分群を \(N\) とする。
\(|G|=2|N|\)
のとき(つまり 群の指数 \([G:N]=2\) のとき)、\(N\) は \(G\) の正規部分群である。
対称群の可解性
(対称群の可解性:65G) |
5次以上の対称群、\(S_n\:\:(n\geq5)\) は可解群ではない。
[証明]
\(S_n\) の交代群を \(A_n\) とする。\(A_n\) は \(S_n\) の部分群なので、もし \(A_n\) が可解群でなければ、可解群の部分群は可解群の定理(61C)の対偶により、\(S_n\) は可解群ではない。以下、\(A_n\) が可解群でないことを背理法で証明する。
\(A_n\) が可解群と仮定して矛盾を導く。\(A_n\) が可解群とすると、定義により \(A_n\) には正規部分群 \(N\:(N\neq A_n)\) があり、\(A_n/N\) が巡回群である。
\(A_n\) の任意の2つの元を \(x,\:y\) とし、剰余類 \(xN\) と \(yN\) を考える。\(A_n/N\) は巡回群なので可換群であり、\(xNyN=yNxN\) である。\(N\) は正規部分群なので、\(Ny=yN\)、\(Nx=xN\) であり、これを用いて \(xNyN=yNxN\) を変形していくと、
\(xNyN=yNxN\)
\(xyNN=yxNN\)
\(xyN=yxN\)
となる。この式に左から \(x^{-1}y^{-1}\) をかけると、
\(x^{-1}y^{-1}xyN=x^{-1}y^{-1}yxN\)
\(x^{-1}y^{-1}xyN=N\)
となる。部分群の元の条件の定理(41C)より、\(aN=N\) と \(a\in N\) は同値である。従って、
\(x^{-1}y^{-1}xy\in N\)
である。
一般に \(x^{-1}y^{-1}xy\) を \(x\) と \(y\) の交換子と呼ぶ。上の式の変形プロセスから言えることは、\(A_n\) の任意の2つの元(\(N\) の元である必要はない)の交換子は \(N\) の元になるということである。
\(S_n\:\:(n\geq5)\) の任意の3文字巡回置換を \((i,\:j,\:k)\) とする。
\((i,\:j,\:k)=(i,\:k)(i,\:j)\)
なので、\((i,\:j,\:k)\) は偶置換であり、
\((i,\:j,\:k)\in A_n\)
である。ここで、\(\bs{i,\:j,\:k}\) とは違う2つの文字 \(\bs{l,\:m}\) を選ぶ。\(\bs{n\geq5}\) ならこれは常に可能である。そして、
\(x=(i,\:m,\:j)\)
\(y=(i,\:l,\:k)\)
とし、\(x,\:y\) の交換子を作ってみる。計算すると以下のようになる。
\(x^{-1}y^{-1}xy\)
\(=(i,\:m,\:j)^{-1}(i,\:l,\:k)^{-1}(i,\:m,\:j)(i,\:l,\:k)\)
\(=(j,\:m,\:i)(k,\:l,\:i)(i,\:m,\:j)(i,\:l,\:k)\)
\((i,\:l,\:k)\) | \(=\left(\begin{array}{c}i&j&k&l&m\\l&j&i&k&m\end{array}\right)\) | |
\((i,\:m,\:j)\) | \(=\left(\begin{array}{c}l&j&i&k&m\\l&i&m&k&j\end{array}\right)\) | |
\((k,\:l,\:i)\) | \(=\left(\begin{array}{c}l&i&m&k&j\\i&k&m&l&j\end{array}\right)\) | |
\((j,\:m,\:i)\) | \(=\left(\begin{array}{c}i&k&m&l&j\\j&k&i&l&m\end{array}\right)\) |
\(x^{-1}y^{-1}xy\)
\(=(j,\:m,\:i)(k,\:l,\:i)(i,\:m,\:j)(i,\:l,\:k)\)
\(=\left(\begin{array}{c}i&j&k&l&m\\j&k&i&l&m\end{array}\right)\)
\(=(i,\:j,\:k)\)
\(x^{-1}y^{-1}xy\in N\) なので、
\((i,\:j,\:k)\in N\)
である。つまり任意の3文字巡回置換は \(N\) に含まれる。
\(A_n\) のすべての元は3文字巡回置換の積で表される(65E)から、\(A_n\) は \(N\) の元の積で表せることになる。つまり、
\(A_n\subset N\)
だが、もともと \(N\) は \(A_n\) の部分集合だから、
\(A_n=N\)
である。これは \(N\neq A_n\) という仮定と矛盾する。従って、\(A_n\) の正規部分群 \(N\:(N\neq A_n)\) で、\(A_n/N\) が巡回群であるようなものはなく、\(A_n\) は可解群ではない。
\(S_n\:\:(n\geq5)\) は可解群ではない部分群 \(A_n\) をもつから、可解群の部分群は可解群の定理(61C)の対偶によって、\(S_n\) は可解群ではない。[証明終]
\(S_5\)(位数 \(120\)) や、その部分群 \(A_5\)(位数 \(60\))は可解群ではありません。しかし、「\(S_5\) のすべての部分群が可解群ではない」というわけではありません。\(S_5\) の部分群では、\(F_{20}\)(位数 \(20\))、\(D_{10}\)(位数 \(10\))、\(C_5\)(位数 \(5\))が可解群であることが知られています。これについては第7章で述べます。
一般5次方程式
5次方程式には代数的に解けるものと解けないものがあります。従って、全ての5次方程式に適用可能な根の公式はありません。5次方程式に根の公式がないことはガロア以前に証明されていたのですが、なぜ根の公式がないのか、その理由を明らかにしたのがガロア理論です。
係数が変数の方程式を「一般方程式」と言います。根の公式があるということは一般方程式が解けることを意味します。以下は、一般5次方程式が代数的に解けないことの証明ですが、この証明では係数が変数ではなく、解を変数としています。
(5次方程式の解の公式はない:65H) |
\(\bs{Q}\) の代数拡大体を \(\bs{K}\) とする。\(\bs{K}\) の任意の元である5つの変数 \(b_1,b_2,b_3,b_4,b_5\) を根とする多項式を、
\(\begin{eqnarray}
&&\:\:f(x)&=(x-b_1)(x-b_2)(x-b_3)(x-b_4)(x-b_5)\:\:(b_i\in\bs{K})\\
&&&=x^5-a_4x^4+a_3x^3-a_2x^2+a_1x-a_0\\
\end{eqnarray}\)
とし、\(\bs{Q}\) に \(a_0,a_1,a_2,a_3,a_4,\)を添加した代数拡大体を \(\bs{F}\) とする。つまり、
\(\bs{F}=\bs{Q}(a_0,\:a_1,\:a_2,\:a_3,\:a_4)\)
である。
このとき、\(\bs{K}\) の \(\bs{F}\) 上の ガロア群 \(G\) は5次対称群 \(S_5\) である。\(S_5\) は可解群ではないので(65G)、従って \(b_i\) を \(a_i\) のべき根で表すことはできない。
[証明]
代数拡大体 \(\bs{F}\) の作り方から、\(\bs{K}\) は \(\bs{F}\) 上の多項式 \(f(x)\) の最小分解体である。従って \(\bs{K}/\bs{F}\) はガロア拡大である。\(G=\mr{Gal}(\bs{K}/\bs{F})\) とおくと、\(G\) は \(\bs{F}\) の元を固定する自己同型写像が作る群である。
対称群 \(S_5\) の元の一つを \(s\) とし、
\(s=\left(\begin{array}{c}1&2&3&4&5\\s(1)&s(2)&s(3)&s(4)&s(5)\end{array}\right)\)
とする。このとき、
\(\sg(b_i)=b_{s(i)}\:\:(i=1,2,3,4,5)\)
で、\(b_i\) に作用する写像 \(\sg\) を定義する。そうすると \(\sg\) は \(f(x)=0\) の解 \(b_i\) を共役な解に移す写像だから、自己同型写像である。また、
\(\begin{eqnarray}
&&\:\:f(x)&=(x-b_1)(x-b_2)(x-b_3)(x-b_4)(x-b_5)\:\:(b_i\in\bs{K})\\
&&&=x^5-a_4x^4+a_3x^3-a_2x^2+a_1x-a_0\\
\end{eqnarray}\)
の根と係数の関係から、
\(a_4\) | \(\overset{\text{ }}{=}\) | \(b_1+b_2+b_3+b_4+b_5\) | |
\(a_3\) | \(\overset{\text{ }}{=}\) | \(b_1b_2+b_1b_3+b_1b_4+b_1b_5+b_2b_3+b_2b_4+b_2b_5+b_3b_4+b_3b_5+b_4b_5\) | |
\(a_2\) | \(\overset{\text{ }}{=}\) | \(b_1b_2b_3+\)\(b_1b_2b_4+\)\(b_1b_2b_5+\)\(b_1b_3b_4+\)\(b_1b_3b_5+\)\(b_1b_4b_5+\)\(b_2b_3b_4+\)\(b_2b_3b_5+\)\(b_2b_4b_5+\)\(b_3b_4b_5\) | |
\(a_1\) | \(\overset{\text{ }}{=}\) | \(b_1b_2b_3b_4+b_1b_2b_3b_5+b_1b_2b_4b_5+b_1b_3b_4b_5+b_2b_3b_4b_5\) | |
\(a_0\) | \(\overset{\text{ }}{=}\) | \(b_1b_2b_3b_4b_5\) |
従って、\(\sg(a_0)=a_0\)、\(\sg(a_1)=a_1\)、\(\sg(a_2)=a_2\)、\(\sg(a_3)=a_3\)、\(\sg(a_4)=a_4\) である。つまり \(\sg\) は \(\bs{F}=\bs{Q}(a_0,\:a_1,\:a_2,\:a_3,\:a_4)\) の元を固定する。従って \(\sg\) は \(\bs{F}\) の元を固定する \(\bs{K}\) の自己同型写像であり、\(G\) の元である。以上のことは \(S_5\) の任意の元 \(s\) について言えるから \(S_5\subset G\) である。
これを踏まえて \(\bs{F}\) 上の \(\bs{K}\) の拡大次数 \([\:\bs{K}\::\:\bs{F}\:]\) を考えると、\([\:\bs{K}\::\:\bs{F}\:]\) は \(\mr{Gal}(\bs{K}/\bs{F})\) の位数に等しいから、
\([\:\bs{K}\::\:\bs{F}\:]=|G|\geq|S_5|=5!=120\)
である。
次に、
\(\bs{F}\subset\)\( \bs{F}(b_1)\subset\)\( \bs{F}(b_1,b_2)\subset\)\( \cd\subset\)\( \bs{F}(b_1,b_2,b_3,b_4,b_5)=\bs{K}\) |
\([\:\bs{F}(b_1)\::\:\bs{F}\:]\leq\mr{deg}\:f(x)\:=5\)
である。等号は \(f(x)\) が既約多項式のときである。さらに、\(b_2\) は
4次方程式 \(f(x)/(x-b_1)\) の根だから、
\([\:\bs{F}(b_1,b_2)\::\:\bs{F}(b_1)\:]\leq4\)
である。以上を順に続けると、体の拡大次数の連鎖律(33H)により、
\([\:\bs{K}\::\:\bs{F}\:]\)
\(=\) | \([\:\bs{F}(b_1,b_2,b_3,b_4,b_5)\::\:\bs{F}\:]\) | ||
\(=\) | \([\:\bs{F}(b_1,b_2,b_3,b_4,b_5)\::\:\bs{F}(b_1,b_2,b_3,b_4)\:]\cdot\) | ||
\([\:\bs{F}(b_1,b_2,b_3,b_4)\::\:\bs{F}(b_1,b_2,b_3)\:]\cdot\) | |||
\([\:\bs{F}(b_1,b_2,b_3)\::\:\bs{F}(b_1,b_2)\:]\cdot\) | |||
\([\:\bs{F}(b_1,b_2)\::\:\bs{F}(b_1)\:]\cdot\) | |||
\([\:\bs{F}(b_1)\::\:\bs{F}\:]\) | |||
\(\leq\) | \(5\cdot4\cdot3\cdot2\cdot1=5!=120\) |
である。従って、\([\:\bs{K}\::\:\bs{F}\:]\geq5!\) と合わせると \([\:\bs{K}\::\:\bs{F}\:]=5!\) であり、
\(|G|=|S_5|\)
となって、
\(G\cong S_5\)
である。つまり、一般5次方程式のガロア群は \(S_5\) と同型であることが証明できた。\(S_5\) は可解群ではないので(65G)、それと同型である \(G\) も可解群ではない。従って \(b_i\) を \(a_i\) のべき根で表すことはできず、一般5次方程式に解の公式はない。[証明終]
6.6 可解ではない5次方程式
5次方程式の全てに適用できる解の公式がないことは、ガロア以前に証明されていました(アーベル・ルフィニの定理)。しかしガロア理論によって、解の公式がないことの「原理」が明確になりました。つまり係数が変数である一般5次方程式は、解が四則演算とべき根で表現できる(=可解である)ための必要条件を満たさないから公式は作れないのです(65H)。
ということは、この「原理」を用いて、可解ではない、係数が数値の方程式を具体的に構成できることになります。それを以下で行います。そのためにまず、コーシーの定理を証明します。なお、コーシー(19世紀フランスの数学者)の名がついた定理はいくつかありますが、これは「群論のコーシーの定理」です。
コーシーの定理
(コーシーの定理:66A) |
群 \(G\) の位数 \(|G|\) が素数 \(p\) を約数にもつとき、\(g^p=e\:\:(g\neq e)\) となる \(G\) の元 \(g\) が存在する。つまり、\(G\) は位数 \(p\) の巡回群を部分群としてもつ。
[証明]
本論に入る前に、証明に使う定義を行う。\(X\) を、元の数が \(N\) の集合とし、そこから重複を許して \(n\)個の元を取り出して1列に並べた順列を考える。このような順列の集合を \(P\) とする。つまり、
\(P=\{\:(x_1,x_2,\cd,x_n)\:|\:x_i\in X\:\}\)
である。\((x_1,x_2,\cd,x_n)\) は並べる順序に意味がある、いわゆる重複順列で、集合 \(P\) の元の数は、
\(|P|=N^n\)
である。
\(P\) から自分自身 \(P\) への写像 \(\sg\) を、
\(\sg\::\:(x_1,x_2,\cd,x_n)\longmapsto(x_n,x_1,x_2,\cd,x_{n-1})\)
と定義する。最後尾の元を先頭に持ってくる "循環写像" である(ここだけの用語)。そうすると、集合 \(P\) の任意の元、\(\bs{a}\) について、
\(\sg^n(\bs{a})=\bs{a}\)
となり、\(\sg^n=e\) (\(e\::\) 恒等写像)である。
次に、集合 \(P\) のある元を \(\bs{a}\) としたとき、
\(\sg^d(\bs{a})=\bs{a}\)
となる最小の \(d\:\:(1\leq d\leq n)\) を、"\(\bs{a}\) の循環位数" と定義する(ここだけの用語)。そうすると、循環位数 \(\bs{d}\) は \(\bs{n}\) の約数になる。なぜなら、もし
\(n=kd+r\:\:(1\leq r < d)\)
だとすると、
\(\begin{eqnarray}
&&\:\:\sg^n(\bs{a})&=\sg^{kd+r}(\bs{a})\\
&&&=\sg^r((\sg^d)^k(\bs{a}))\\
&&&=\sg^r(\bs{a})\\
&&\:\:\sg^r(\bs{a})&=\bs{a}\\
\end{eqnarray}\)
となって、\(d\) が \(\sg^d(\bs{a})=\bs{a}\) となる最小の数ではなくなるからである。
循環位数の例をあげると、
\(\begin{eqnarray}
&&\:\:N&=6\\
&&\:\:X&=\{\:1,\:2,\:3,\:4,\:5,\:6\:\}\\
&&\:\:n&=6\\
\end{eqnarray}\)
の場合、
\(\bs{a}=(1,\:2,\:3,\:4,\:5,\:6)\:\:\rightarrow\:\:d=6\)
\(\bs{a}=(1,\:2,\:2,\:2,\:2,\:2)\:\:\rightarrow\:\:d=6\)
\(\bs{a}=(1,\:2,\:3,\:1,\:2,\:3)\:\:\rightarrow\:\:d=3\)
\(\bs{a}=(1,\:2,\:1,\:2,\:1,\:2)\:\:\rightarrow\:\:d=2\)
\(\bs{a}=(1,\:1,\:1,\:1,\:1,\:1)\:\:\rightarrow\:\:d=1\)
などである。以上を踏まえて本論に入る。
積が単位元になるような \(G\) の \(p\)個(\(p\):素数)の元の組の集合、
\(S\:=\:\{\:(x_1,x_2,\cd,x_p)\:\:|\:\:x_i\in G,\:x_1x_2\cd x_p=e\:\}\)
を考える。まず、\(S\) の元の数 \(|S|\) を求める。\(S\) の始めから \(p-1\) 個までの \(x_i\:(1\leq i\leq p-1)\) は、全く任意に選ぶことができる。なぜなら、そうしておいて
\(x_p=(x_1x_2\cd x_{p-1})^{-1}\)
とすれば、
\(x_1x_2\cd x_{p-1}x_p\)
\(=x_1x_2\cd x_{p-1}(x_1x_2\cd x_{p-1})^{-1}\)
\(=e\)
となり、\(S\) の元になるからである。\(x_i\:(1\leq i\leq p-1)\) の選び方はそのすべてについて \(|G|\) 通りあるから、
\(|S|=|G|^{p-1}\)
である。
次に、\(S\) の任意の元を \(\bs{a}\) とすると、\(\sg(\bs{a})\) もまた \(S\) の元になる。なぜなら、
\(\bs{a}=(x_1,x_2,\cd,x_p)\:\:\:(x_i\in G)\)
とおくと、
\(x_1x_2\cd x_{p-1}x_p=e\)
だが、この式に左から \(x_p\) をかけ、右から \(x_p^{-1}\) をかけると、
\(x_px_1x_2\cd x_{p-1}x_px_p^{-1}=x_pex_p^{-1}\)
\(x_px_1x_2\cd x_{p-1}=e\)
となり、これは \(\sg(\bs{a})\in S\) を意味しているからである。
\(S\) のすべての元に循環位数を割り振ると、\(\bs{p}\) が素数なので、循環位数は \(\bs{1}\) か \(\bs{p}\) のどちらかである。循環位数が \(1\) である \(S\) の元とは、
\((\overbrace{x,\:x,\:\cd\:,\:x}^{p\:個})\:\:(x\in G)\)
のように、\(G\) の同じ元を \(p\) 個並べたものである。また、循環位数が \(p\) の元とは、\(p\)個の \(G\) の元に1つでも違うものがあるような \(S\) の元である。
そこで、循環位数 \(p\) の \(S\) の元に着目する。その一つを \(\bs{a}_1\) とすると、
\(S_1=\{\bs{a}_1,\:\sg(\bs{a}_1),\:\sg^2(\bs{a}_1),\:\cd\:,\sg^{p-1}(\bs{a}_1)\}\)
は、すべて相異なる \(p\) 個 の \(S\) の元である。さらに、\(S_1\) に含まれない循環位数 \(p\) の元を \(\bs{a}_2\) とすると、
\(S_2=\{\bs{a}_2,\:\sg(\bs{a}_2),\:\sg^2(\bs{a}_2),\:\cd\:,\sg^{p-1}(\bs{a}_2)\}\)
も、すべて相異なる \(p\) 個 の \(S\) の元であり、しかも \(S_1\) とは重複しない。この操作は順々に繰り返せるから、いずれ循環位数 \(p\) の元は \(S_1,\:S_2,\:\cd\) でカバーできることとなる。循環位数 \(p\) の \(S\) の元の全部が、
\(S_1\:\cup\:S_2\:\cup\:\cd\:\cup\:S_q\)
と表現できたとしたら、その元の数は \(pq\) である。
循環位数 \(1\) の \(S\) の元の数は、\(S\) の元の数から循環位数 \(p\) の元の数を引いたものである。
\(|S|=|G|^{p-1}\)
だったから、\(p\) が \(|G|\) の約数である、つまり \(|G|\) が \(p\) の倍数であることに注意すると、
循環位数 \(1\) の元の数
\(=|G|^{p-1}-pq\equiv0\:\:(\mr{mod}\:p)\)
となる。この、循環位数 \(1\) の元の数は \(0\) ではない。なぜなら、
\((\overbrace{e,\:e,\:\cd\:,\:e}^{p\:個})\)
は 循環位数が \(1\) の元だからである。つまり、循環位数 \(1\) の元の数は \(p\) 以上の \(p\) の倍数である。従って、\(S\) には \((e,\:e,\:\cd\:,\:e)\) 以外に、
\((\overbrace{g,\:g,\:\cd\:,\:g}^{p\:個})\:\:\:\:(g\neq e,\:g\in G)\)
が必ず存在する。従って、
\(g^p=e\:\:(g\neq e)\)
である \(g\) が存在する。この式が成立するということは、\(g\) の位数は \(p\) の約数であるが、\(p\) が素数なので、\(g\) の位数は \(p\) である。従って、
\(\{\:g,\:g^2,\:\cd\:,g^{p-1},\:g^p=e\:\}\)
は位数 \(p\) の巡回群である。[証明終]
実数解3つの5次方程式は可解ではない
(実数解が3つの5次方程式:66B) |
\(f(x)\) を既約な5次多項式とする。方程式 \(f(x)=0\) が複素数解を2つ、実数解を3つもつなら、方程式は可解ではない。
[証明]
\(f(x)=0\) の複素数解を \(\al_1,\:\al_2\)、実数解を \(\al_3,\:\al_4,\:\al_5\) とする。また、それらを \(\bs{Q}\) に付加した体を \(\bs{L}=\bs{Q}(\al_1,\al_2,\al_3,\al_4,\al_5)\) とする。また、ガロア群 \(\mr{Gal}(\bs{L}/\bs{Q})\) を \(G\) と書く。
一般に、複素数 \(z=r+is\) が有理数係数の方程式の解なら、\(\ol{\,z\,}=r-is\) も解である。つまり \(z\) と \(\ol{\,z\,}\) は共役(同じ方程式の解同士)である(=共役複素数)。その理由は以下である。
まず、\(z_1\) と \(z_2\) を2つの複素数とすると、
\(\ol{z_1+z_2}=\ol{z_1}+\ol{z_2}\)
が成り立つ。また、
\(z_1=r+is\)
\(z_2=u+iv\)
とすると、
\(\begin{eqnarray}
&&\:\:z_1z_2&=ru-sv+i(su+rv)\\
&&\:\:\ol{z_1}\cdot\ol{z_2}&=(r-is)(u-iv)\\
&&&=ru-sv-i(su+rv)\\
\end{eqnarray}\)
なので、
\(\ol{z_1z_2}=\ol{z_1}\cdot\ol{z_2}\)
である。有理数係数の方程式を、3次方程式の例で、
\(x^3+ax^2+bx+c=0\)
とし、\(z\) をこの方程式の解だとすると、
\(z^3+az^2+bz+c=0\)
\(\ol{z^3+az^2+bz+c}=\ol{\,0\,}\)
\(\ol{z^3}+\ol{az^2}+\ol{bz}+\ol{\,c\,}=0\)
\(\ol{\,z\,}^3+\ol{\,a\,}\ol{\,z\,}^2+\ol{\,b\,}\ol{\,z\,}+c=0\)
\(\ol{\,z\,}^3+a\ol{\,z\,}^2+b\ol{\,z\,}+c=0\)
となって、\(\ol{\,z\,}\) も方程式の解である。もちろんこれは \(n\)次方程式でも成り立つ。
そこで、\(f(x)=0\) の複素数解 \(\al_1,\:\al_2\) を、
\(\al_1=a+ib\)
\(\al_2=a-ib\)
とする。ここで、複素数 \(r+is\) に作用する \(\bs{L}\) の写像を \(\tau\) を、
\(\tau(r+is)=r-is\)
と定める。そうすると、
\(\tau(\al_1)=\al_2,\:\tau(\al_2)=\al_1,\)
\(\tau(\al_3)=\al_3,\:\tau(\al_4)=\al_4,\:\tau(\al_5)=\al_5\)
となり(\(\al_3,\:\al_4,\:\al_5\) は実数なので \(\tau\) で不変)、\(\tau\) は \(f(x)=0\) の2つの解を入れ替えるから \(\bs{L}\) の自己同型写像になり(51E)、すなわち \(G\) の元である。\(\al_1\) を \(1\)、\(\al_2\) を \(2\) と書き、巡回置換の記法を使うと、
\(\tau=(1,\:2)\)
である。
一方、\(f(x)\) は既約多項式なので単拡大体の基底の定理(33F)により、\(\bs{Q}(\al_1)\) の次元は \(5\)、つまり \([\bs{Q}(\al_1)\::\:\bs{Q}]=5\) である。そうすると、拡大次数の連鎖律(33H)により、
\([\:\bs{L}\::\:\bs{Q}\:]=[\:\bs{L}\::\:\bs{Q}(\al_1)\:][\bs{Q}(\al_1)\::\:\bs{Q}]\)
が成り立つので、\([\:\bs{L}\::\:\bs{Q}\:]\) は \(5\) の倍数である。\(|G|=[\:\bs{L}\::\:\bs{Q}\:]\) なので(52B)、ガロア群 \(G\) の位数は \(5\) を約数にもつ。
そうするとコーシーの定理(66A)より、\(G\) の部分群には位数 \(5\) の巡回群がある。それを、
\(H=\{\:\sg,\:\sg^2,\:\sg^3,\:\sg^4,\:\sg^5=e\:\}\)
とする。5つの解の置換の中で、位数 \(5\) の巡回群を生成する \(\sg\) は、巡回置換の記法で書くと、
\(\sg_1=(1,\:2\:,3,\:4,\:5)\)
\(\sg_2=(1,\:3\:,5,\:2,\:4)\)
\(\sg_3=(1,\:4\:,2,\:5,\:3)\)
\(\sg_4=(1,\:5\:,4,\:3,\:2)\)
の4つである。これらには、
\(\sg_1^{\:2}=\sg_2\)
\(\sg_1^{\:3}=\sg_3\)
\(\sg_1^{\:4}=\sg_4\)
の関係がある。そこで、\(G\) の中にある位数 \(5\) の巡回群は、
\(\sg=(1,\:2\:,3,\:4,\:5)\)
だとして一般性を失わない。そうすると、\(G\) の中には、
\(\tau=(1,\:2)\)
\(\sg=(1,\:2\:,3,\:4,\:5)\)
の2つの元があることになる。実は、
\(\tau,\:\sg\) から出発して、この2つの元とその逆元の演算を繰り返すことによって、5次対称群 \(\bs{S_5}\) の元が全部作り出せる
のである。それを証明する。
\(G\) は群なので \(\sg^{-1}\) も \(G\) に含まれる(\(\sg\) は位数 \(5\) の巡回群の元なので \(\sg^{-1}=\sg^4\))。まず、\(\sg\tau\sg^{-1}\) を計算してみると、
\(\sg\tau\sg^{-1}=(1,2,3,4,5)(1,2)(5,4,3,2,1)\)
\((5,4,3,2,1)\) | \(=\left(\begin{array}{c}1&2&3&4&5\\5&1&2&3&4\end{array}\right)\) | |
\((1\:2)\) | \(=\left(\begin{array}{c}5&1&2&3&4\\5&2&1&3&4\end{array}\right)\) | |
\((1,2,3,4,5)\) | \(=\left(\begin{array}{c}5&2&1&3&4\\1&3&2&4&5\end{array}\right)\) |
\(\begin{eqnarray}
&&\:\:\sg\tau\sg^{-1}&=\left(\begin{array}{c}1&2&3&4&5\\1&3&2&4&5\end{array}\right)\\
&&&=(2,\:3)\\
\end{eqnarray}\)
となる。同様にして、
\((5,4,3,2,1)\) | \(=\left(\begin{array}{c}1&2&3&4&5\\5&1&2&3&4\end{array}\right)\) | |
\((2,\:3)\) | \(=\left(\begin{array}{c}5&1&2&3&4\\5&1&3&2&4\end{array}\right)\) | |
\((1,2,3,4,5)\) | \(=\left(\begin{array}{c}5&1&3&2&4\\1&2&4&3&5\end{array}\right)\) |
\(\begin{eqnarray}
&&\:\:\sg^2\tau\sg^{-2}&=\sg(\sg\tau\sg^{-1})\sg^{-1}\\
&&&=\sg\cdot(2,3)\cdot\sg^{-1}\\
&&&=\left(\begin{array}{c}1&2&3&4&5\\1&2&4&3&5\end{array}\right)\\
&&&=(3,\:4)\\
\end{eqnarray}\)
である。以下、
\((5,4,3,2,1)\) | \(=\left(\begin{array}{c}1&2&3&4&5\\5&1&2&3&4\end{array}\right)\) | |
\((3,\:4)\) | \(=\left(\begin{array}{c}5&1&2&3&4\\5&1&2&4&3\end{array}\right)\) | |
\((1,2,3,4,5)\) | \(=\left(\begin{array}{c}5&1&2&4&3\\1&2&3&5&4\end{array}\right)\) | |
\(\rightarrow\:\sg^3\tau\sg^{-3}\) | \(=\left(\begin{array}{c}1&2&3&4&5\\1&2&3&5&4\end{array}\right)\) | |
\(=(4,\:5)\) |
\((5,4,3,2,1)\) | \(=\left(\begin{array}{c}1&2&3&4&5\\5&1&2&3&4\end{array}\right)\) | |
\((4,\:5)\) | \(=\left(\begin{array}{c}5&1&2&3&4\\4&1&2&3&5\end{array}\right)\) | |
\((1,2,3,4,5)\) | \(=\left(\begin{array}{c}4&1&2&3&5\\5&2&3&4&1\end{array}\right)\) | |
\(\rightarrow\:\sg^4\tau\sg^{-4}\) | \(=\left(\begin{array}{c}1&2&3&4&5\\5&2&3&4&1\end{array}\right)\) | |
\(=(1,\:5)\) |
\((1,\:2)\)、\((2,\:3)\)、\((3,\:4)\)、\((1,\:5)\)
は \(G\) の元である。
一般に、
\((i,\:j)=(1,\:i)(1,\:j)(1,\:i)\)
である。なぜなら、
\(\begin{eqnarray}
&&\:\:(1,\:i)(1,\:j)(1,\:i)\cdot1&=(1,\:i)(1,\:j)\cdot i\\
&&&=(1,\:i)\cdot i=1\\
&&\:\:(1,\:i)(1,\:j)(1,\:i)\cdot i&=(1,\:i)(1,\:j)\cdot1\\
&&&=(1,\:i)\cdot j=j\\
&&\:\:(1,\:i)(1,\:j)(1,\:i)\cdot j&=(1,\:i)(1,\:j)\cdot j\\
&&&=(1,\:i)\cdot1=i\\
\end{eqnarray}\)
が成り立つからである。従って、
\((2,\:3)=(1,\:2)(1,\:3)(1,\:2)\)
である。この両辺に左と右から \((1,\:2)\) をかけると、
\((1,\:2)(2,\:3)(1,\:2)=(1,\:3)\)
となり、\((2,\:3),\:(1,\:2)\) が \(G\) の元なので \((1,\:3)\) も \(G\) の元である。同様に、
\((3,\:4)=(1,\:3)(1,\:4)(1,\:3)\)
であるが、\((3,\:4),\:(1,\:3)\) が \(G\) の元なので、\((1,\:4)\) も \(G\) の元である。結局、
\((1,\:2)\)、\((1,\:3)\)、\((1,\:4)\)、\((1,\:5)\)
が \(G\) の元であることが分かった。
\(S_5\) は5文字の置換をすべて集めた集合である。すべての置換は互換の積で表せて(65B)、かつ任意の互換 \((i,\:j)\) は、
\((i,\:j)=(1,\:i)(1,\:j)(1,\:i)\)
と表せるから、5文字の置換はすべて、
\((1,\:2)\)、\((1,\:3)\)、\((1,\:4)\)、\((1,\:5)\)
という4つの互換の積で表現できる。つまり、\(S_5\) はこの4つの互換で生成できる。以上をまとめると、
\((1,\:2)\)、\((1,\:2\:,3,\:4,\:5)\)
\(\Downarrow\)
\((1,\:2)\)、\((2,\:3)\)、\((3,\:4)\)、\((1,\:5)\)
\(\Downarrow\)
\((1,\:2)\)、\((1,\:3)\)、\((1,\:4)\)、\((1,\:5)\)
\(\Downarrow\)
\(S_5\) のすべての元
という、"\(S_5\)を生成する連鎖" の存在が証明できた。従って \(G\cong S_5\) である。\(S_5\) は可解群ではない(65G)。従って、複素数解を2つ、実数解を3つもつ既約な5次方程式は可解ではない。[証明終]
この、実数解が3つの5次方程式の定理(66B)から、可解ではない5次方程式の実例を簡単に構成できます。たとえば、
\(f(x)=x^5-5x+a\)
とおき、\(f(x)=0\) の方程式を考えます。
\(f\,'(x)=5x^4-5\)
なので、\(f\,'(x)=0\) の実数解は \(1,\:-1\) の2つです。
\(f(\phantom{-}1)=a-4\)
\(f(-1)=a+4\)
なので、
\(a-4 < 0 < a+4\)
なら、\(f(x)=0\) には3つの実数解があります。この条件は、
\(-4 < a < 4\)
ですが、\(a=0\) のときは \(f(x)\) は既約多項式ではありません。また \(a=3,\:-3\) のときも、
\(x^5-5x+3=(x^2+x-1)(x^3-x^2+2x-3)\)
\(x^5-5x-3=(x^2-x-1)(x^3+x^2+2x+3)\)
と因数分解できるので、既約多項式ではありません。従って、
\(x^5-5x+2=0\)
\(x^5-5x+1=0\)
\(x^5-5x-1=0\)
\(x^5-5x-2=0\)
が可解ではない5次方程式の例(\(G\cong S_5\))であり、これらの方程式の解を四則演算とべき根で表すのは不可能です。
![]() |
\(\bs{y=x^5-5x+1}\) のグラフ |
方程式 \(x^5-5x+1=0\) の3つの実数解を小さい方から \(\al,\beta,\gamma\) とし、数式処理ソフトそので近似解を求めると、 \(\al\fallingdotseq-1.5416516841045247594\) \(\beta\fallingdotseq\phantom{-}0.2000641026299753912\) \(\gamma\fallingdotseq\phantom{-}1.4405003973415600893\) である。近似解の精度を上げるのはいくらでも可能であり、方程式の形もシンプルだが、これらの解を四則演算とべき根で表すことはできない。グラフと近似解は WolframAlpha による。 |
「6.可解性の必要条件」終わり
(次回に続く)
(次回に続く)
2023-04-15 08:00
nice!(0)
No.356 - 高校数学で理解するガロア理論(3) [科学]
\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{#1}} \newcommand{\ol}[1]{\overline{#1}} \newcommand{\sb}{\subset} \newcommand{\sp}{\supset} \newcommand{\al}{\alpha} \newcommand{\sg}{\sigma}\newcommand{\cd}{\cdots} \newcommand{\fz}{0^{\tiny F}} \newcommand{\kz}{0^{\tiny K}} \newcommand{\fo}{1^{\tiny F}} \newcommand{\ko}{1^{\tiny K}}\)
3.3 線形空間
ガロア理論の一つの柱は、代数拡大体を線形空間(ベクトル空間)としてとらえることで、線形空間の「次元」や「基底」を使って理論が組み立てられています。線形空間には精緻な理論体系がありますが、ここではガロア理論に必要な事項の説明をします。
線形空間の定義
集合 \(V\) と 体 \(\bs{K}\) が次を満たすとき、\(V\) を \(\bs{\bs{K}}\) 上の線形空間(=ベクトル空間。linear space / vector space)と言う。
加算の定義
\(V\) の任意の元 \(\br{u},\:\br{v}\) に対して \((\br{u}+\br{v})\in V\) が定義されていて、この加算(\(+)\) の定義に関して \(V\) は可換群である。すなわち、
\((1)\) 単位元の存在
スカラー倍の定義
\(V\) の任意の元 \(\br{u}\) と \(\bs{K}\) の任意の元 \(k\) に対して、スカラー倍 \(k\br{u}\in V\) が定義されていて、加算との間に次の性質がある。\(\br{u},\:\br{v}\) を \(V\) の元、\(k,\:m\) を \(\bs{K}\) の元とし、\(\bs{K}\) の乗法の単位元を \(1\) とする。
\((1)\:\:k(m\br{u})=(km)\br{u}\)
\((2)\:\:(k+m)\br{u}=k\br{u}+m\br{u}\)
\((3)\:\:k(\br{u}+\br{v})=k\br{u}+k\br{v}\)
\((4)\:\:1\br{v}=\br{v}\)
高校数学に出てくる "2次元ベクトル" とは、上記の定義の \(\bs{K}\) を \(\bs{R}\)(実数の体)とし、\(V\) を2つの実数のペアの集合 \(\{\:(x,y)\:|\:x,y\in\bs{R}\:\}\) とするベクトル空間(の要素)のことです。
上の定義の \(0\) は線形空間 \(V\) の元です。以下、\(V\) の単位元 \(0\)(= \(0\) ベクトル)と、体 \(\bs{K}\) の加法の単位元 \(0\) が混在しますが、文脈や式から明らかなので、同じ \(0\) で記述します。
1次独立と1次従属
1次独立
線形空間 \(V\) の元の組、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) に対して、
\(a_1\br{v}_1+a_2\br{v}_2+\)..\(+a_n\br{v}_n=0\)
を満たす \(\bs{K}\) の元 \(a_1,a_2,\cd,a_n\) が、\(a_1=a_2=\cd=a_n=0\) しかないとき、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) は1次独立であるという。
1次従属
1次独立でないときが1次従属である。つまり、線形空間 \(V\) の元の組、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) に対して、
\(a_1\br{v}_1+a_2\br{v}_2+\)..\(+a_n\br{v}_n=0\)
を満たす、少なくとも一つは \(0\) でない \(\bs{K}\) の元 \(a_1,a_2,\cd,a_n\) があるとき、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) は1次従属であるという。
基底
線形空間 \(V\) の元の組、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) に対して、次の2つが満たされるとき、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) を基底という。
基底から1つの元を除外したものは基底ではなくなる。また基底に1つの元を加えたものも基底ではない。
\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) が基底だと、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_{n-1}\}\) は基底ではありません。なぜなら、もし \(\{\br{v}_1,\br{v}_2,\cd,\br{v}_{n-1}\}\) が基底だとすると、
\(\br{v}_n=a_1\br{v}_1+a_2\br{v}_2+\)..\(+a_{n-1}\br{v}_{n-1}\)
と表せますが、これは、
\(a_1\br{v}_1+a_2\br{v}_2+\)..\(+a_{n-1}\br{v}_{n-1}-\br{v}_n=0\)
ということであり、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) が1次従属となってしまって、基底の要件を満たさなくなるからです。基底に、別の1つの元を加えるケースも同じことです。
\(\{\br{u}_1,\br{u}_2,\cd,\br{u}_m\}\) と \(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) がともに線形空間 \(V\) の基底であるとき、\(m=n\) である。
[証明]
この定理の証明のために、まず次の補題を証明する。
[補題]
線形空間 \(V\) の任意の \(n\) 個の元を \(\{\br{u}_1,\br{u}_2,\cd,\br{u}_n\}\) とする(基底でなくてもよい)。線形空間 \(V\) の \(n+1\) 個の元 \(\{\br{w}_1,\br{w}_2,\cd,\br{w}_n,\br{w}_{n+1}\}\) がすべて \(\{\br{u}_1,\br{u}_2,\cd,\br{u}_n\}\) の1次結合で表されるなら、\(\{\br{w}_1,\br{w}_2,\cd,\br{w}_n,\br{w}_{n+1}\}\) は1次従属である。
数学的帰納法を使う。まず、\(n=1\) のとき、この定理は成り立つ。つまり、
\(\br{w}_1=k_1\br{u}_1\)
\(\br{w}_2=k_2\br{u}_1\)
と表されるなら、
\(k_2\br{w}_1-k_1\br{w}_2=0\)
であり、\(\br{w}_1\) と \(\br{w}_2\) は1次従属である。そこで、\(n\) が \(k\:\:(\geq1)\) のときに成り立つとし、\(n=k+1\) でも成り立つことを証明する。
以降、表記を見やすくするため、\(k=3\) の場合で記述する。ただし、一般性を失うことがないように記述する。\(\br{w}_1,\br{w}_2,\br{w}_3,\br{w}_4\) が、
\(\br{w}_1=a_{11}\br{u}_1+a_{12}\br{u}_2+a_{13}\br{u}_3\)
\(\br{w}_2=a_{21}\br{u}_1+a_{22}\br{u}_2+a_{23}\br{u}_3\)
\(\br{w}_3=a_{31}\br{u}_1+a_{32}\br{u}_2+a_{33}\br{u}_3\)
\(\br{w}_4=a_{41}\br{u}_1+a_{42}\br{u}_2+a_{43}\br{u}_3\)
と表せたとする。ここで \(\br{w}_4\) の係数に注目する。もし、
\(a_{41}=a_{42}=a_{43}=0\)
であれば、\(\br{w}_1,\br{w}_2,\br{w}_3,\br{w}_4\) は1次従属である。なぜなら、
\(b_1\br{w}_1+b_2\br{w}_2+b_3\br{w}_3+b_4\br{w}_4=0\)
の式を満たす \(b_1,b_2,b_3,b_4\) は、
\(b_1=b_2=b_3=0\)
\(b_4\neq0\)
として実現でき、\(\br{w}_1,\br{w}_2,\br{w}_3,\br{w}_4\) は1次従属の定義を満たすからである。そこで、\(a_{41},a_{42},a_{43}\) のうち \(0\) でないものが少なくとも一つあるとする。それを \(a_{43}\) とし、
\(a_{43}\neq0\)
とする。この仮定で一般性を失うことはない。ここで、
\(\br{x}_i=\br{w}_i-\dfrac{a_{i3}}{a_{43}}\br{w}_4\:\:(i=1,2,3)\)
とおいて \(\br{u}_3\) の項を消去する。計算すると、
\(\begin{eqnarray}
&&\:\:\br{x}_1=&\left(a_{11}-\dfrac{a_{13}a_{41}}{a_{43}}\right)\br{u}_1+\left(a_{12}-\dfrac{a_{13}a_{42}}{a_{43}}\right)\br{u}_2\\
&&\:\:\br{x}_2=&\left(a_{21}-\dfrac{a_{23}a_{41}}{a_{43}}\right)\br{u}_1+\left(a_{22}-\dfrac{a_{23}a_{42}}{a_{43}}\right)\br{u}_2\\
&&\:\:\br{x}_3=&\left(a_{31}-\dfrac{a_{33}a_{41}}{a_{43}}\right)\br{u}_1+\left(a_{32}-\dfrac{a_{33}a_{42}}{a_{43}}\right)\br{u}_2\\
\end{eqnarray}\)
となる。そうすると、\(\br{x}_1,\:\br{x}_2,\:\br{x}_3\) は「線形空間 \(V\) の2つの元 \(\br{u}_1,\br{u}_2\) の1次結合で表された3つの元」である。従って、帰納法の仮定により、\(\br{x}_1,\:\br{x}_2,\:\br{x}_3\) は1次従属である。1次従属だから、
\(\br{x}_1=\br{w}_1-\dfrac{a_{13}}{a_{43}}\br{w}_4\)
\(\br{x}_2=\br{w}_2-\dfrac{a_{23}}{a_{43}}\br{w}_4\)
\(\br{x}_3=\br{w}_3-\dfrac{a_{33}}{a_{43}}\br{w}_4\)
だったから、これを \((\br{A})\) 式に代入すると、
\(b_1\br{w}_1+b_2\br{w}_2+b_3\br{w}_3-\)
\(\dfrac{1}{a_{43}}(b_1a_{13}+b_2a_{23}+b_3a_{33})\br{w}_4=0\)
となる。この式における \(\br{w}_1,\:\br{w}_2,\:\br{w}_3,\:\br{w}_4\) の係数の少なくとも一つは \(0\) ではない。従って、\(a_{41},a_{42},a_{43}\) のうち \(0\) でないものが少なくとも一つある場合にも \(\br{w}_1,\:\br{w}_2,\:\br{w}_3,\:\br{w}_4\) は1次従属である。
以上で、線形空間 \(V\) の \(k=3\) 個の元(\(\br{u}_1,\br{u}_2,\br{u}_3\))の1次結合で、\(k+1=4\) 個の元(\(\br{w}_1,\br{w}_2,\br{w}_3,\br{w}_4\))のすべてが表されば、その4個の元は1次従属であることが証明できた。\(k=3\) としたのは表記を見やすくするためであり、\(k=3\) であることの特殊性は使っていない。つまり、\(k\geq1\) のすべてで成り立つ。従って数学的帰納法により補題が正しいことが証明できた。[補題の証明終]
以上を踏まえて、\(A=\{\br{u}_1,\br{u}_2,\cd,\br{u}_m\}\) と \(B=\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) がともに線形空間 \(V\) の基底であるとき、\(m=n\) となることを証明する。
もし仮に \(m < n\) だとすると、\(B\) の中から \((m+1)\) 個の元を選べる。それを \(B\:'=\{\br{v}_1,\br{v}_2,\cd,\br{v}_{m+1}\}\) とすると、\(A\) は 線形空間 \(V\) の基底だから、\(B\:'\) の元は \(A\) の元の1次結合で表現できる。つまり \(B\:'\) の \((m+1)\)個の元のすべては \(m\)個の元の1次結合で表されるから、[補題]によって \(B\:'\) は1次従属である。\(B\) は \(B\:'\) と同じものか、または \(B\:'\) に数個の元を付け加えたものだから、\(B\:'\) が1次従属なら \(B\) も1次従属である。しかし、\(B\) は線形空間 \(V\) の基底だから1次独立であり、矛盾が生じる。従って、\(m\geq n\) である。
もし仮に \(m > n\) だとしても、全く同様の考察により矛盾が生じる。従って、\(m\leq n\) である。この結果、\(m=n\) であることが証明できた。[証明終]
この基底の数の不変性の定理(33D)により、線形空間には次のように「次元」が定義できることになります。
次元
線形空間の基底に含まれる元の数が有限個のとき、その個数を線形空間の次元と言う。次元は基底の取り方によらない。
線形空間の次元や基底と、代数拡大体を結びつけるのが次の定理です。
単拡大体の基底
\(\bs{Q}\) 上の \(n\)次既約多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の解の一つを \(\al\) とする。単拡大体である \(\bs{Q}(\al)\) は \(\bs{Q}\) 上の \(n\)次元線形空間であり、\(\{1,\:\al,\:\al^2,\:\cd\:,\al^{n-1}\}\) は \(\bs{Q}(\al)\) の基底である。
[証明]
\(\bs{Q}(\al)\) の基底であるための条件は、
の2つである。② は単拡大の体の定理(32C)で証明されているので、① を証明する。多項式 \(g(x)\) を、
\(g(x)=a_0+a_1x+a_2x^2+\cd+a_{n-1}x^{n-1}\)
とおく。\(\{1,\:\al,\:\al^2,\:\cd\:,\al^{n-1}\}\) が1次独立であることを言うには、
\(g(\al)=0\) であれば \(a_i\:\:(0\leq i\leq n-1)\) は全て \(0\)
を言えばよい。以降、背理法を使って証明する。\(g(\al)=0\) で、\(a_i\:\:(0\leq i\leq n-1)\) のうち、少なくとも1つはゼロでないと仮定する。
\(g(x)\) が定数(つまり \(a_0\) の項のみ)のときは、\(g(\al)=0\) なら \(a_0=0\) なので、「少なくとも1つはゼロでない」に反する。そこで \(g(x)\) は1次以上の多項式であるとする。
そうすると、2つの方程式 \(f(x)=0\) と \(g(x)=0\) は共通の解 \(\al\) をもつことになる。しかし、\(f(x)\) は \(n\)次の既約多項式であり、\(g(x)\) は1次以上で \(n\)次未満の多項式である。既約多項式の定理2(31F)により、このような2つの方程式は共通の解を持たない。ゆえに矛盾が生じる。従って、\(g(\al)=0\) のとき \(a_i\:\:(0\leq i\leq n-1)\) は全て \(0\) であり、① が証明された。
基底の数が線形空間の次元であり、\(\bs{Q}(\al)\) は \(\bs{Q}\) 上の \(n\)次元線形空間である。[証明終]
もし、\(f(x)\) が\(n\)次多項式だとしたら(既約多項式を含む)、\(\bs{Q}(\al)\) の次元は \(n\)以下になります。\(f(x)=0\) の解の一つ、\(\al\) の最小多項式(31H)を \(m\)次多項式である \(g(x)\) とすると、\(g(x)\) は既約多項式であり(31I)、\(\al\) は \(f(x)=0\) と \(g(x)=0\) の共通の解なので、既約多項式の定理1(31E)により \(f(x)\) は \(g(x)\) で割り切れます。つまり、
\(f(x)=h(x)g(x)\)
と書けるので、
\(\mr{deg}\:f(x)\:\geq\:\mr{deg}\:g(x)\)
\(n\:\geq\:m\)
ですが、単拡大体の基底の定理(33F)により \(\bs{Q}(\al)\) の次元は \(m\) なので、\(n\)以下です。
拡大次数とその連鎖律
方程式の解になる数が代数的数で、\(\bs{Q}\) に代数的数を添加した体が代数拡大体です。「3.2 体」の「単拡大の体」でとりあげた \(\bs{Q}(\al)\) は代数拡大体であり、次元は \(n\) でした(32C)。この次元を「体の拡大」の視点で考えてみます。
「体 \(\bs{K}\) 上の線形空間 \(V\)」の定義において、\(\bs{K}=\bs{Q}\) とし \(V=\bs{Q}\) とすると、「有理数体 \(\bs{Q}\) は、\(\bs{Q}\) 上の線形空間」であると言えます。\(\bs{Q}\) では加算もスカラー倍(=乗算)も定義されていて、可換だからです。線形空間の定義にある各種の演算は、体の演算の一部です。
線形空間 \(\bs{Q}\) の基底は、\(0\) ではない \(\bs{Q}\) の元 \(v\) です。\(0\) を含む \(\bs{Q}\) の任意の元を \(a\) とすると、
\(av=0\:\:\:(v\neq0)\)
が成り立つのは \(a=0\) しかないので \(v\) は1次独立であり、また \(av\) で全ての \(\bs{Q}\) の元が表されるからです。一方、\(0\) は、
\(a\cdot0=0\)
が \(0\) ではない \(a\) について成り立つので1次従属です。以上から、線形空間 \(\bs{Q}\) の基底として \(1\) を選ぶことにします。次元は \(1\) です。
\(\bs{Q}\) に \(\sqrt{2}\) を添加した \(\bs{Q}(\sqrt{2})\) は \(\bs{Q}\) の代数拡大体で、\(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\) です。\(\bs{Q}(\sqrt{2})\) は \(\bs{\bs{Q}}\) 上の線形空間です。\(\bs{Q}(\sqrt{2})\) の基底としては、まず \(1\) を選ぶことができます。\(1\) を \(\bs{Q}\) の元でスカラー倍すると、\(\bs{Q}(\sqrt{2})\) の部分集合である \(\bs{Q}\) の元の全てが表せます。
\(\bs{Q}(\sqrt{2})\) の元の全てを表現するためには、さらに基底に \(\sqrt{2}\) を追加します。\(\sqrt{2}\) は \(\bs{Q}\) の元の1次結合では表せないので、\(1\) と \(\sqrt{2}\) は 1次独立です。\(1,\:\sqrt{2}\) が \(\bs{Q}(\sqrt{2})\) の基底で、次元は \(2\) です。
さらに \(\bs{Q}(\sqrt{2})\) に \(\sqrt{3}\) を添加した代数拡大体 \(\bs{Q}(\sqrt{2},\sqrt{3})\) を考えてみると、\(\bs{Q}(\sqrt{2},\sqrt{3})\) は \(\bs{\bs{Q}(\sqrt{2})}\) 上の線形空間であり、基底は \(1,\:\sqrt{3}\) です。\(1\) と \(\sqrt{3}\) は 1次独立であり、\(\bs{\bs{Q}(\sqrt{2},\sqrt{3})}\) の全ての元は、\(\bs{\bs{Q}(\sqrt{2})}\) の元を係数とする \(\bs{1}\) と \(\bs{\sqrt{3}}\) の1次結合で表現できるからです。\(\bs{\bs{Q}(\sqrt{2})}\) 上の線形空間 \(\bs{\bs{Q}(\sqrt{2},\sqrt{3})}\) の次元は \(\bs{2}\) です。
ここで \(\bs{Q}(\sqrt{2},\sqrt{3})\) を \(\bs{\bs{Q}}\) 上の線形空間と考えると、その基底はまず、\(1,\:\sqrt{2},\:\sqrt{3}\) ですが、これだけでは不足で、\(\sqrt{6}\) を加える必要があります。\(\sqrt{6}\) は体としての演算(乗算)でできる数ですが、\(1,\:\sqrt{2},\:\sqrt{3}\) の1次結合では表現できないからです。\(\bs{Q}\) 上の線形空間 \(\bs{Q}(\sqrt{2},\sqrt{3})\) の基底は \(1,\:\sqrt{2},\:\sqrt{3},\:\sqrt{6}\) であり、次元は \(4\) です。
ここまでの基底の表現はあくまで一例ですが、どういう基底を選ぼうと基底の数=次元は不変量であるというのが「次元の不変性」でした。以上の考察を踏まえて、拡大次数を定義し、拡大次数の連鎖律を証明します。
代数拡大体 \(\bs{F},\:\bs{K}\) が \(\bs{F}\:\subset\:\bs{K}\) であるとき、\(\bs{K}\) は \(\bs{F}\) 上の線形空間である。\(\bs{K}\) の次元を、\(\bs{K}\)の(\(\bs{F}\)からの)拡大次数といい、
\([\:\bs{K}\::\:\bs{F}\:]\)
で表す。
代数拡大体 \(\bs{F},\:\bs{M},\:\bs{K}\) が \(\bs{F}\:\subset\:\bs{M}\:\subset\:\bs{K}\) であるとき、
\([\:\bs{K}\::\:\bs{F}\:]=[\:\bs{K}\::\:\bs{M}\:][\:\bs{M}\::\:\bs{F}\:]\)
が成り立つ。
[証明]
\([\:\bs{M}\::\:\bs{F}\:]=m\)、\([\:\bs{K}\::\:\bs{M}\:]=n\) とする。以下、表記を見やすくするため、\(m=3,\:n=2\) の場合で記述する。もちろん一般性を失わないように記述する。
\(\bs{F}\) 上の線形空間 \(\bs{M}\) の基底を
\(u_1,\:u_2,\:u_3\)
とすると、\(\bs{M}\) の任意の元 \(b\) は、
\(b=a_1u_1+a_2u_2+a_3u_3\:\:(a_i\in\bs{F},\:u_i\in\bs{M},\:1\leq i\leq m)\)
と表せる。
\(\bs{M}\) 上の線形空間 \(\bs{K}\) の基底を
\(v_1,\:v_2\)
とすると、\(\bs{K}\) の任意の元 \(x\) は、
\(x=b_1v_1+b_2v_2\:\:(b_j\in\bs{M},\:v_j\in\bs{K},\:1\leq j\leq n)\)
と表せる。\(b_1,\:b_2\) を \(\bs{M}\) の基底 \(u_1,u_2,u_3\) で表すと、
\(b_1=a_{11}u_1+a_{21}u_2+a_{31}u_3\)
\(b_2=a_{12}u_1+a_{22}u_2+a_{32}u_3\)
\((\:a_{ij}\in\bs{F}\:)\)
となるが、これを用いて \(x\) を表すと、
\(\begin{eqnarray}
&&\:\:x=&a_{11}u_1v_1+a_{21}u_2v_1+a_{31}u_3v_1+\\
&&&a_{12}u_1v_2+a_{22}u_2v_2+a_{32}u_3v_2\\
\end{eqnarray}\)
となる。つまり、\(\bs{K}\) の任意の元は \(\bs{F}\) の元を係数とする、\(u_1v_1\)、\(u_2v_1\)、\(u_3v_1\)、\(u_1v_2\)、\(u_2v_2\)、\(u_3v_2\) の1次結合で表現できる。
ここで \(x=0\) とすると、
\((a_{11}u_1+a_{21}u_2+a_{31}u_3)v_1+\)
\((a_{12}u_1+a_{22}u_2+a_{32}u_3)v_2=0\)
であるが、\(v_1,v_2\) は \(\bs{K}\) の基底なので1次独立であり、従って、
\(a_{11}u_1+a_{21}u_2+a_{31}u_3=0\)
\(a_{12}u_1+a_{22}u_2+a_{32}u_3=0\)
である。すると、\(u_1,u_2,u_3\) は \(\bs{M}\) の基底なので1次独立であり、
\(a_{11}=a_{21}=a_{31}=a_{12}=a_{22}=a_{32}=0\)
である。従って、\(u_iv_j\:\:(1\leq i\leq m,\:1\leq j\leq n)\) は1次独立である。
\(u_iv_j\:\:(1\leq i\leq m,\:1\leq j\leq n)\) の \(mn\) 個の元は、
から、\(\bs{F}\) 上の線形空間 \(\bs{K}\) の基底であり、\(\bs{K}\) の次元は \(mn\) である。以上により、
\([\:\bs{K}\::\:\bs{F}\:]=[\:\bs{K}\::\:\bs{M}\:][\:\bs{M}\::\:\bs{F}\:]\)
である。[証明終]
体の一致
2つの代数拡大体 \(\bs{F}\) と \(\bs{K}\) の次元が一致するとします。たとえば \(\bs{Q}(\sqrt{2})\) と \(\bs{Q}(\sqrt{3})\) の次元はいずれも \(2\) です。もちろん \(\bs{Q}(\sqrt{2})\) と \(\bs{Q}(\sqrt{3})\) は体として別物です。
それでは、\(\bs{F}\subset\bs{K}\) という関係があり、かつ \(\bs{F}\) と \(\bs{K}\) の次元が一致するとき、\(\bs{F}\) と \(\bs{K}\) は体として一致すると言えるのでしょうか。
これはイエスで、それを次に証明します。この定理は、ガロア理論の証明の過程において、2つの体が実は同じものであることを言うときに使われる論法です。証明の都合上、\(\bs{F}\) ではなく \(\bs{K}_0\) と書きます。
体 \(\bs{K}_0\) と 体 \(\bs{K}\) があり、\(\bs{K}_0\:\subset\:\bs{K}\) を満たしている。\(\bs{K}_0\) と \(\bs{K}\) が有限次元であり、その次元が同じであれば、\(\bs{K}_0=\bs{K}\) である。
[証明]
体 \(\bs{K}_0\) と \(\bs{K}\) を、\(\bs{Q}\) 上の線形空間と見なし、その次元を \(n\) とする。\(\bs{K}_0\) の基底を \(\{a_1,\:a_2,\:\cd\:,a_n\}\) とする。\(\bs{K}_0\) が \(\bs{K}\) の真部分集合である、つまり \(\bs{K}_0\:\subsetneq\:\bs{K}\) と仮定して、背理法で証明する。
\(\bs{K}_0\:\subsetneq\:\bs{K}\) だと、\(a_{n+1}\notin\bs{K}_0,\:a_{n+1}\in\bs{K}\) である元 \(a_{n+1}\) が存在する。この \(a_{n+1}\) は \(\{a_1,\:a_2,\:\cd\:,a_n\}\) の1次結合では表せない。なぜなら、もし表せたとしたら、\(\bs{K}_0\) の全ての元は基底である \(\{a_1,\:a_2,\:\cd\:,a_n\}\) の1次結合で表されるので \(a_{n+1}\in\bs{K}_0\) になってしまうからである。
そこで、\(\{a_1,\:a_2,\:\cd\:,a_n,\:a_{n+1}\}\) を考えると、この元の並びは1次独立である。なぜなら、もし1次従属だとすると、
\(a_1x_1+a_2x_2+\cd+a_nx_n+a_{n+1}x_{n+1}=0\)
となる \(x_i\in\bs{Q}\:\:(1\leq i\leq n+1)\) があって、そのうち少なくとも一つは \(0\) ではない。もし \(x_{n+1}\neq0\) だとすると、\(a_{n+1}\) が \(\{a_1,\:a_2,\:\cd\:,a_n\}\) の1次結合で表されることになり、\(a_{n+1}\in\bs{K}_0\) となって矛盾が生じる。また \(x_{n+1}=0\) だとすると、
\(a_1x_1+a_2x_2+\cd+a_nx_n=0\)
であるが、この場合は \(x_i\:\:(1\leq i\leq n)\) の中に少なくとも一つは \(0\) でないものがあることになり、\(\{a_1,\:a_2,\:\cd\:,a_n\}\) が基底である(=1次独立である)ことに矛盾する。従って \(\{a_1,\:a_2,\:\cd\:,a_n,\:a_{n+1}\}\) は1次独立である。
\(\{a_1,\:a_2,\:\cd\:,a_n,\:a_{n+1}\}\) の1次結合で表される全ての元の集合を \(\bs{K}_1\) とする。\(\{a_1,\:a_2,\:\cd\:,a_n,\:a_{n+1}\}\) はすべて \(\bs{K}\) の元であるから、\(\bs{K}_1\:\subset\:\bs{K}\) である。また \(\bs{K}_1\) の任意の元は1次独立である \(\{a_1,\:a_2,\:\cd\:,a_n,\:a_{n+1}\}\) の1次結合で表されるから、\(\{a_1,\:a_2,\:\cd\:,a_n,\:a_{n+1}\}\) は \(\bs{K}_1\) の基底であり、すなわち \(\bs{K}_1\) の次元は \(n+1\) である。\(\bs{K}_1=\bs{K}\) なら \(\bs{K}\) の次元が \(n+1\) になって矛盾するから、\(\bs{K}_1\neq\bs{K}\) つまり \(\bs{K}_1\:\subsetneq\:\bs{K}\) である。
以上の論理を繰り返すと \(\bs{K}_2\:\subsetneq\:\bs{K}\) である \(n+2\) 次元の \(\bs{K}_2\) の存在を示せるが、この操作は無限に繰り返えせるから、\(\bs{K}\) は無限個の基底をもつ無限次元の体となる。これは \(\bs{K}\) の次元が有限次元の \(n\) であることに矛盾する。従って背理法の仮定は誤りであり、\(\bs{K}_0\:=\:\bs{K}\) である。[証明終]
代数拡大体の構造
多項式と代数拡大体の相互関係をまとめると次のようになります。
以下、例をいくつかあげます。
\(x^4-5x^2+6\)
\(f(x)\) を4次多項式、
\(f(x)=x^4-5x^2+6\)
とします。\(f(x)\) は、
\(f(x)=(x^2-2)(x^2-3)\)
と因数分解できるので既約多項式ではありません。また、
\(f(x)=(x-\sqrt{2})(x+\sqrt{2})(x-\sqrt{3})(x+\sqrt{3})\)
なので、\(f(x)\) の最小分解体は、
\(\bs{Q}(\sqrt{2},\sqrt{3})\)
です。\(\bs{Q}(\sqrt{2},\:\sqrt{3})\) は、\(\bs{Q}\) 上の方程式 \(x^2-2=0\) の解 \(\sqrt{2}\) による拡大体を \(\bs{Q}(\sqrt{2})\) とし、\(\bs{Q}(\sqrt{2})\) 上の方程式 \(x^2-3=0\) の解 \(\sqrt{3}\) による拡大体が \(\bs{Q}(\sqrt{2},\:\sqrt{3})\) であると見なせます。つまり、
\(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\:\subset\:\bs{Q}(\sqrt{2},\sqrt{3})\)
です。拡大次数は
\([\:\bs{Q}(\sqrt{2}):\bs{Q}\:]=2\)
\([\:\bs{Q}(\sqrt{2},\sqrt{3}):\bs{Q}(\sqrt{2})\:]=2\)
\([\:\bs{Q}(\sqrt{2},\sqrt{3}):\bs{Q}\:]=4\)
です。\(\bs{Q}\) 上の線形空間 \(\bs{Q}(\sqrt{2},\sqrt{3})\) の基底は、
\(\begin{eqnarray}
&&\:\:B_1&=(\:1,\:\sqrt{2},\:1\cdot\sqrt{3},\:\sqrt{2}\cdot\sqrt{3}\:)\\
&&&=(\:1,\:\sqrt{2},\:\sqrt{3},\:\sqrt{6}\:)\\
\end{eqnarray}\)
とすることができます。
一方、
\(\theta=\sqrt{2}+\sqrt{3}\)
とおくと、
\(\bs{Q}(\theta)=\bs{Q}(\sqrt{2},\sqrt{3})\)
となります。なぜなら、
\(\sqrt{2}=\dfrac{1}{2}(\theta-\dfrac{1}{\theta})\)
\(\sqrt{3}=\dfrac{1}{2}(\theta+\dfrac{1}{\theta})\)
であり、\(\sqrt{2}\) と \(\sqrt{3}\) が \(\theta\) と有理数の加減乗除で表現できるからです。\(\bs{Q}(\sqrt{2},\sqrt{3})\) は \(\bs{Q}(\sqrt{2}+\sqrt{3})\) という単拡大体です。
\(\theta=\sqrt{2}+\sqrt{3}\) から根号を消去すると、
\(\theta^4-10\theta^2+1=0\)
となるので、\(\theta\)の最小多項式は、
\(g(x)=x^4-10x^2+1\)
であり、この \(g(x)\) は既約多項式です。\(y=x^2-5\) とおくと、
\(\begin{eqnarray}
&&\:\:g(x)&=y^2-24\\
&&&=(y-2\sqrt{6})(y+2\sqrt{6})\\
\end{eqnarray}\)
なので、
\(\begin{eqnarray}
&&\:\:g(x)&=&(x^2-5-2\sqrt{6})(x^2-5+2\sqrt{6})\\
&&&=&(x-\sqrt{2}-\sqrt{3})(x+\sqrt{2}-\sqrt{3})\cdot\\
&&&& (x-\sqrt{2}+\sqrt{3})(x+\sqrt{2}+\sqrt{3})\\
\end{eqnarray}\)
となり、\(g(x)=0\) の解は、\(\sqrt{2}+\sqrt{3}\)、\(-\sqrt{2}+\sqrt{3}\)、\(\sqrt{2}-\sqrt{3}\)、\(-\sqrt{2}-\sqrt{3}\) の4つです。その \(g(x)=0\) の解の一つが \(\theta=\sqrt{2}+\sqrt{3}\) なので、単拡大体の基底の定理(33F)を適用して、\(\bs{Q}(\theta)\) の基底を、
\(B_2=(\:1,\:\:\theta,\:\:\theta^2,\:\:\theta^3\:)\)
の4個に選ぶことができます。拡大次数は \([\:\bs{Q}(\theta):\bs{Q}\:]=4\) です。
\(B_1\) と \(B_2\) は、同じ体である \(\bs{Q}(\theta)=\bs{Q}(\sqrt{2},\sqrt{3})\) の基底なので、相互に1次結合で表現できます。\(B_2\) の1次結合で \(B_1\) を表現すると、
\(\sqrt{2}=\dfrac{1}{2}(\phantom{-}\theta^3-9\theta)\)
\(\sqrt{3}=\dfrac{1}{2}(-\theta^3+11\theta)\)
\(\sqrt{6}=\dfrac{1}{2}(\phantom{-}\theta^2-5)\)
となります。
\(x^3-2\)
\(f(x)\) を3次多項式、
\(f(x)=x^3-2\)
とします。これは既約多項式です。
\(x^3-1=0\) 解で \(1\) でないもの一つを \(\omega\) とします(= \(1\) の原始\(3\)乗根)。
\(x^3-1=(x-1)(x^2+x+1)\)
なので \(\omega\) は、
\(\omega^2+\omega+1=0\)
を満たします。この2次方程式の解は2つありますが、
\(\omega=\dfrac{-1+\sqrt{3}\:i}{2}\)
とします。方程式 \(x^3-2=0\) の解は、
\(\sqrt[3]{2},\:\:\sqrt[3]{2}\omega,\:\:\sqrt[3]{2}\omega^2\)
の3つです、従って、\(f(x)\) の最小分解体は、
\(\bs{Q}(\sqrt[3]{2},\:\sqrt[3]{2}\omega,\:\sqrt[3]{2}\omega^2)=\bs{Q}(\sqrt[3]{2},\:\omega)\)
です。これは、
\(\bs{Q}\:\subset\:\bs{Q}(\sqrt[3]{2})\:\subset\:\bs{Q}(\sqrt[3]{2},\:\omega)\)
という構造をしています。基底は、単拡大体の基底の定理(33F)を順次適用して、
\(\bs{Q}(\sqrt[3]{2})\) の基底(\(\bs{Q}\) 上の線形空間)
\(1,\:\sqrt[3]{2},\:(\sqrt[3]{2})^2\)
\(\bs{Q}(\sqrt[3]{2},\:\omega)\) の基底(\(\bs{Q}(\sqrt[3]{2})\) 上の線形空間\()\)
\(1,\:\omega\)
です。これらを総合すると、
\(\bs{Q}(\sqrt[3]{2},\:\omega)\) の基底(\(\bs{Q}\) 上の線形空間\()\)
です。拡大次数は
\([\:\bs{Q}(\sqrt[3]{2}):\bs{Q}\:]=3\)
\([\:\bs{Q}(\sqrt[3]{2},\:\omega):\bs{Q}(\sqrt[3]{2})\:]=2\)
\([\:\bs{Q}(\sqrt[3]{2},\:\omega):\bs{Q}\:]=6\)
となります。
\(\bs{Q}(\sqrt[3]{2},\:\omega)\) の原始元 \(\theta\) を、
\(\theta=\sqrt[3]{2}+\omega\)
と選ぶことができます。なぜなら、計算は省きますが、
と表せるので、\(\bs{Q}\) に \(\sqrt[3]{2},\:\omega\) を添加した拡大体は \(\theta\) を添加した拡大体と同じものでからです。さらに、
\(\theta=\sqrt[3]{2}+\dfrac{-1+\sqrt{3}\:i}{2}\)
の式を2乗や3乗して \(i\) と根号を消去すると、計算過程は省きますが、
\(\theta^6+3\theta^5+6\theta^4+3\theta^3+9\theta+9=0\)
となります。従って、\(\theta\) の最小多項式を \(g(x)\) とすると、
\(g(x)=x^6+3x^5+6x^4+3x^3+9x+9\)
という6次多項式です。\(\bs{Q}(\sqrt[3]{2},\:\omega)\) は 6次方程式 \(g(x)=0\) の根の一つである \(\theta\) を使って、
\(\bs{Q}(\sqrt[3]{2},\:\omega)=\bs{Q}(\theta)\)
という単拡大体(次元は \(6\))と表現できます。
\(x^3-3x+1\)
「1.3 ガロア群」の「ガロア群の例」で書いたように、\(x^3-3x+1=0\) の解を \(\al,\:\beta,\:\gamma\) とすると、
\(\beta=\al^2-2\)
\(\gamma=\beta^2-2\)
\(\al=\gamma^2-2\)
の関係があり、\(\al,\:\beta,\:\gamma\) のどれか一つの加減乗除で他の2つが表現できます。これにより、\(f(x)=x^3-3x+1\) の最小分解体は、
\(\bs{Q}(\al,\beta,\gamma)=\bs{Q}(\al)=\bs{Q}(\beta)=\bs{Q}(\gamma)\)
です。基底は、たとえば \(1,\:\al,\:\al^2\) であり、
\([\:\bs{Q}(\al,\beta,\gamma):\bs{Q}\:]=3\)
です。\(\al\) の最小多項式は、3次多項式である \(f(x)=x^3-3x+1\) です。
ちなみに、3次多項式の最小分解体の次元が \(3\) になる条件を書いておきます。まず、2次方程式の例ですが、
\(x^2+ax+b=0\)
の方程式の解を \(\al,\:\beta\) とすると、
\(x^2+ax+b=(x-\al)(x-\beta)\)
です。そうすると、根と係数の関係から、
\(a=-(\al+\beta)\)
\(b=\al\beta\)
です。ここで、判別式 \(\bs{D}\) を、
\(D=(\al-\beta)^2\)
と定義すると、
\(\begin{eqnarray}
&&\:\:D=&\al^2-2\al\beta+\beta^2\\
&&&=(\al+\beta)^2-4\al\beta\\
&&&=a^2-4b\\
\end{eqnarray}\)
となります。この判別式を使って解の状況がわかります。つまり、
以上を3次方程式に拡張できます。2乗の項がない既約な3次方程式を、
\(x^3+ax+b=0\)
とし、3つの根を \(\al,\:\beta,\:\gamma\) とすると、
\(\al\beta\gamma=-b\)
となります。3次方程式の判別式 \(D\) は、
\(D=(\al-\beta)^2(\beta-\gamma)^2(\gamma-\al)^2\)
で定義されます。計算すると、
\(D=-4a^3-27b^2\)
となります。
ここで、\(D\) が、ある有理数 \(q\) の2乗の場合を考えます。つまり、
\(D=q^2\)
です。そうすると、
\((\br{A})\) 式の両辺を \(x\) で微分して \(x=\al\) を代入すると、
\(\beta=\dfrac{2a\al+3b-q}{2(3\al^2+a)}\)
\(\gamma=\dfrac{2a\al+3b+q}{2(3\al^2+a)}\)
です。式の形はともかく、要するに、
\(\beta\) と \(\gamma\) が \(\al\) の加減乗除で表現できる
わけです。このことは、
\(\bs{Q}(\al,\beta,\gamma)=\bs{Q}(\al)\)
であることを意味します。\(\bs{Q}(\al,\beta,\gamma)\) は、既約な3次方程式の根の一つである \(\al\) の単拡大体なので、その次元は \(3\) です。
まとめると、判別式 \(D\) が有理数の2乗であるとき、既約 \(3\)次多項式の最小分解体の次元が \(3\) になります。\(x^3-3x+1\) の場合、\(a=-3,\:b=1\) なので、
\(D=-4a^3-27b^2=81=9^2\)
となり、次元が \(3\) です。
既約多項式ではない3次多項式の拡大次数はもっと小さくなります。たとえば \((x-1)(x^2+2)\) の最小分解体は \(\bs{Q}(\sqrt{2}\:i)\) であり、拡大次数は \(2\) です。また \((x-2)^3\) の最小分解体は \(\bs{Q}\) そのもので、拡大次数は \(1\) です。
まとめると、3次多項式 \(f(x)\) の最小分解体の拡大次数は、\(f(x)=0\) の解を \(\al,\:\beta,\:\gamma\) とすると、
\([\:\bs{Q}(\al,\beta,\gamma):\bs{Q}\:]\:=\:6,\:3,\:2,\:1\)
の4種あることになります(この4種しかないことの理由は後の章にあります)。
ガロア理論の核心(第5章以降)に入る前の最後として、群についての各種の定義や定理を説明します。これらはいずれも第5章以降で必要になります。
4.1 部分群\(\cdot\)正規部分群、剰余類\(\cdot\)剰余群
部分集合の演算
以降の証明では集合の演算が多々出てきます。その定義は次の通りでです。これはあくまで群の "部分集合" に関するもので、それが部分群かどうかは別問題です。
群 \(G\) の2つの部分集合を \(H,\:N\) とする。\(H\) と \(N\) の演算結果である \(G\) の部分集合、\(HN\) を次の式で定義する。
\(HN\:=\:\{\:hn\:|\:h\in H,\:n\in N,\:hn\) は群の演算定義による \(\}\)
群 \(G\) の元の演算では結合則が成り立つから、部分集合の演算でも結合則が成り立つ。つまり \(H_1,\:H_2,\:H_3\) をを3つの部分群とすると、
\((H_1H_2)H_3=H_1(H_2H_3)\)
である。部分集合の元は \(1\)つでもよいから、\(x\) が \(G\) の元で \(x\) だけの部分集合を \(\{x\}\) とすると、
\(H_1(\{x\}H_2)=(H_1\{x\})H_2\)
である。これを、
\(H_1(xH_2)=(H_1x)H_2\)
と記述する。
部分群の定理
部分群に関する定理をいくつかあげます。これらはいずれも後の定理の証明の過程で使います。
部分群の十分条件
群 \(G\) の部分集合を \(N\) とし、\(N\) の任意の2つの元を \(x,\:y\) とする。
\(xy\in N,\:x^{-1}\in N\)
なら、\(N\) は \(G\) の部分群である。
[証明]
\(N\) の元 \(x,\:y\) は \(G\) の元でもあるので、\(xy,\:x^{-1},\:y^{-1}\) は \(G\) の演算として定義されている。
\(y=x^{-1}\) とおくと \(xy=xx^{-1}=e\in N\) なので、\(N\) は単位元を含む。つまり、\(N\) は演算で閉じていて、単位元が存在し、逆元が \(N\) の元である。また結合則は \(G\) の元として成り立っている。従って \(N\) は \(G\) の部分群である。[証明終]
部分群の元の条件
群 \(G\) の部分群を \(N\) とし、\(G\) の 元を \(x\) とすると、次の2つは同値である。
① \(xN\:=\:N\)
② \(x\:\in\:N\)
[証明]
[① \(\bs{\Rightarrow}\) ②]
\(N\) には \(G\) の単位元 \(e\) が含まれるから、\(xe\) は \(xN\) に含まれる。
\(x=xe\in xN=N\) \(\Rightarrow\) \(x\in N\)
である。
[② \(\bs{\Rightarrow}\) ①]
\(x\in N\) とし、\(N\) の任意の元を \(a\) とすると、\(N\) は群だから \(xa\in\:N\) である。\(N\) の異なる2つの元を \(a,\:b\:\:(a\neq b)\) とすると、\(xa\neq xb\) である。なぜなら、もし \(xa=xb\) だとすると、\(x\) の逆元 \(x^{-1}\) を左からかけて \(a=b\) となり、矛盾するからである。以上により、\(xH\) は \(H\) の全ての元を含むから \(xH=H\) である。[証明終]
部分群の共通部分
\(G\) の部分群を \(H,\:N\) とすると、\(H\cap N\) は部分群である。
[証明]
\(G\) の部分群を \(H,\:N\) とし、\(H\cap N\) の任意の2つの元を \(x,\:y\) とすると、\(x,\:y\in H,\:\:x,\:y\in N\) なので、
\(xy\in H,\:x^{-1}\in H\)
\(xy\in N,\:x^{-1}\in N\)
であり、
\(xy\in H\cap N,\:x^{-1}\in H\cap N\)
となって、部分群の十分条件の定理(41B)により \(H\cap N\) は部分群である。[証明終]
剰余類
有限群 \(G\) の位数を \(n\) とし( \(|G|=n\) )、\(H\) を \(G\) の部分群とする。\(H\) に左から \(G\) のすべての元、\(g_1,\:g_2,\:\cd\:,\:g_n\) かけて、集合、
\(g_1H,\:g_2H,\:\cd\:,g_nH\)
を作る。
\(g_1H,\:g_2H,\:\cd\:,g_nH\) から、同じになる集合を集めたものを剰余類と呼ぶ。その同じになる集合から代表的なものを一つ取り出し、
\(xH\:\:(x\in G)\)
の形で剰余類を表す。\(g_1H,\:g_2H,\:\cd\:,g_nH\) から剰余類が \(d\) 個できたとし、それらを、
\(x_1H,\:x_2H,\:\cd\:,x_dH\)
とすると、
\(i\neq j\) のとき \(x_iH\:\cap\:x_jH=\phi\)
\(G=x_1H\:\cup\:x_2H\:\cup\:\cd\:\cup\:x_dH\)
である。剰余類は、群 \(G\) の元を部分群 \(H\) によって分類したものといえる。
\(x_1H,\:x_2H,\:\cd\:,x_dH\) を「左剰余類」という。同じことが \(G\) の元を右からかけたときにも成り立ち、\(Hx_1{}^{\prime},\:Hx_2{}^{\prime},\:\cd\:,Hx_d\,'\) を「右剰余類」という。
群 \(G\) の 部分群 \(H\) による剰余類の個数 \(d\) について、\(d\cdot|H|=|G|\) が成り立つ。この \(d\) を「\(G\) の \(H\) による指数」といい、\([\:G\::\:H\:]\) で表す。つまり、
\(|G|=[\:G\::\:H\:]\cdot|H|\)
である(ラグランジュの定理)。
[証明]
\(|G|=[\:G\::\:H\:]\cdot|H|\) であることを証明する。2つの剰余類 \(x_1H\) と \(x_2H\) が共通の元をもつとする。その共通な元が、\(x_1H\) では \(x_1h_i\)、\(x_2H\) では \(x_2h_j\) と表されているものとする。
\(x_1h_i=x_2h_j\)
左から \(x_2^{-1}\)、右から \(h_i^{-1}\) をかけると、
\(x_2^{-1}x_1h_ih_i^{-1}=x_2^{-1}x_2h_jh_i^{-1}\)
\(x_2^{-1}x_1=h_jh_i^{-1}\)
\(h_jh_i^{-1}\in H\) だから、
\(x_2^{-1}x_1\in H\)
を得る。部分群の元の条件の定理(41C)により、\(xH=H\) と \(x\in H\) は同値だから、
\(x_2^{-1}x_1H=H\)
となる。左から \(x_2\) をかけると、
\(x_1H=x_2H\)
を得る。これは、「2つの剰余類 \(x_1H\) と \(x_2H\) が共通の元をもつとすると、2つの剰余類は一致する」ことを示している。従って、
である。\(H\) は 単位元 \(e\) を含むから、
\(g_1H\:\cup\:g_2H\:\cup\:\cd\:\cup\:g_nH\)
という和集合を作ると、そこには \(G\) のすべての元が含まれる。従って、
\(G=g_1H\:\cup\:g_2H\:\cup\:\cd\:\cup\:g_nH\)
である。剰余類 \(x_1H,\:x_2H,\:\cd\:x_dH\) は、\(g_1H,\:g_2H,\:\cd\:,g_nH\) を整理・分類したものだから、
\(G=x_1H\:\cup\:x_2H\:\cup\:\cd\:\cup\:x_dH\)
である。この式の右辺の剰余類は共通の元がなく、それぞれの剰余類の元の数はすべて \(|H|\) だから、
\(|G|=d\cdot|H|\)
である。従ってラグランジュの定理、
\(|G|=[\:G\::\:H\:]\cdot|H|\)
が成り立つ。[証明終]
ラグランジュの定理から、
群 \(G\) の元 \(g\) の位数(\(g^x=e\) となる最小の \(x\))を \(n\) とすると、\(n\) は群位数 \(|G|\) の約数である。
ことがわかります。なぜなら、
\(H=\{e,\:g,\:g^2,\:\cd\:,\:g^{n-1}\}\)
とおくと、\(H\) は \(G\) の部分群(巡回群)になり、ラグランジュの定理によって \(|H|=n\) が \(|G|\) の約数になるからです。これは、位数の定理(25A)の[補題5]、
既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) の元を \(a\) とし、\(a\) の位数を \(d\) とすると、\(d\) は 群位数 の約数である。
の一般化になっています。 \((\bs{Z}/n\bs{Z})^{*}\) の群位数は \(\varphi(n)\)(\(\varphi\)はオイラー関数)なので、ラグランジュの定理はオイラーの定理やフェルマの小定理(25B)の一般化であるとも言えます。さらに、
群位数が素数の群は巡回群である。
こともわかります。なぜなら、群 \(G\) の位数を \(p\)(素数)とすると、単位元ではない \(G\) の任意の元 \(g\:(\neq e)\) の位数は \(p\) であり、つまり \(G\) は \(g\) を生成元とする位数 \(p\) の巡回群(\(C_p\))だからです。
次の「正規部分群」はガロア理論のキモといえる概念です。これは純粋に群の属性として定義できるのでここにあげますが、ガロア理論の核心である第5章以降で展開される論証の多くは正規部分群に関係しています。
正規部分群
有限群 \(G\) の部分群を \(H\) とする。\(G\) の全ての元 \(g\) について、
\(gH=Hg\)
が成り立つとき、\(H\) を \(G\) の正規部分群(normal subgroup)という。正規部分群では左剰余類と右剰余類が一致する。
定義により、\(G\) および \(\{e\}\) は \(G\) の正規部分群である。また \(G\) が可換群であると、その部分群は正規部分群である。巡回群は可換群だから、巡回群の部分群は正規部分群である。
正規部分群 \(H\) の定義は、\(G\) の任意の元 \(g\) に対して、
\(gHg^{-1}=H\)
となる \(H\)、としても同じです。また 任意の \(h\in H\) について、
\(ghg^{-1}\in H\)
となる \(H\)、としても同じです。
剰余群
有限群 \(G\) の正規部分群を \(H\) とする。\(G\) の \(H\) による剰余類
\(x_1H,\:x_2H,\:\cd\:,x_dH\:\:(\:x_i\in G,\:d=[\:G\::\:H\:]\:)\)
は部分集合の演算の定義(41A)で群になる。この群を \(G\) の \(H\) による剰余群(quotient group)といい、\(G/H\) で表す。剰余群は商群とも言う。
[証明]
\(H\) が正規部分群のとき、剰余類が群になることを証明する。\(x_iH\) は \(G\) の剰余類なので、
\(G=x_1H\cup x_2H\cup\cd\cup x_dH\)
\((i\neq j\:のとき\:x_iH\cap x_jH=\phi)\)
と表されている。2つの剰余類、\(x_iH,\:x_jH\) の演算を行うと、
\(\begin{eqnarray}
&&\:\:(x_iH)(x_jH)&=x_iHx_jH=x_i(Hx_j)H\\
&&&=x_i(x_jH)H=x_ix_jHH\\
&&&=x_ix_j(HH)=x_ix_jH\\
\end{eqnarray}\)
つまり、
\(\begin{eqnarray}
&&\:\:(x_iH)(x_jH)&=x_ix_jH\\
\end{eqnarray}\)
となる。\(H\) は正規部分群なので \(Hx_j=x_jH\) であることと、\(H\) は部分群なので \(HH=H\) であることを用いた。
\(x_ix_j\) は \(G\) の元だから、\(x_ix_jH\) は \(G\) の剰余類のうちの一つである。従って \((x_iH)(x_jH)\) の演算は \(G\) の剰余類の中で閉じている。また、
\((x_iH\cdot x_jH)\cdot x_kH=x_ix_jH\cdot x_kH=x_ix_jx_kH\)
\(x_iH\cdot(x_jH\cdot x_kH)=x_iH\cdot x_jx_kH=x_ix_jx_kH\)
\((x_iH\cdot x_jH)\cdot x_kH=x_iH\cdot(x_jH\cdot x_kH)\)
であるから、結合法則が成り立っている。さらに、
\(H\cdot xh=eH\cdot xH=(ex)H=xH\)
\(xH\cdot H=xH\cdot eH=(xe)H=xH\)
なので、剰余類 \(H\) が単位元になる。また、
\(xH\cdot x^{-1}H=(xx^{-1})H=eH=H\)
\(x^{-1}H\cdot xH=(x^{-1}x)H=eH=H\)
であり、\(xH\) に対する逆元は \(x^{-1}H\) である。従って剰余類 \(G/H\) は群である。[証明終]
群の位数、元の位数、ラグランジュの定理、巡回群は、いずれも有限群の概念や定理です。しかし、剰余類、正規部分群、剰余群は、元の数が無限であっても成り立つ概念です。たとえば、整数の加法群 \(\bs{Z}\) は可換群なので、すべての部分群は正規部分群です。従って、\(n\) の倍数から成る部分群を \(n\bs{Z}\) とすると、\(\bs{Z}/n\bs{Z}\) は剰余群です。\(\bs{Z}/n\bs{Z}\) という表記は \(n\bs{Z}\) が \(\bs{Z}\) の正規部分群であることが暗黙の前提なのでした。
巡回群の部分群による剰余群は巡回群である。
[証明]
群 \(G\) を、位数 \(n\)、生成元 \(g\) の巡回群とし、その元を、
\(G\:=\:\{g,\:g^2,\:g^3,\:\cd,\:g^n=e\:\}\)
とする。\(G\) の部分群を \(H\) とし、\(H\) の元のうち \(g\) の指数が一番小さいものを \(g^{d}\:\:(1\leq d\leq n)\) とする。\(d=1\) なら \(H=G\) であり、また \(d=n\) なら \(H=\{\:e\:\}\) である。
\(n\) を \(d\) で割った商を \(q\)、余りを \(r\) とする。つまり、
\(n=qd+r\:\:(1\leq q\leq n,\:0\leq r < d)\)
とする。\(g^d\) は \(H\) の元だから その \(q\) 乗も \(H\) の元であり、
\((g^d)^q=g^{dq}\in H\)
である。また \(g^{dq}\) の逆元も \(H\) に含まれるから
\((g^{dq})^{-1}\in H\)
である。仮にもし \(1\leq r < d\) なら
\(g^{dq}g^{r}=g^{qd+r}=g^n=e\)
となるので、この式に左から \((g^{dq})^{-1}\) をかけると、
\(g^r=(g^{dq})^{-1}\in H\)
となり、\(d\) 未満の数 \(r\) が指数の \(g^r\) が \(H\) の元ということになるが、これは \(d\) が最小の指数であるという仮定に反する。従って \(r=0\) であり、\(qd=n\) である。つまり \(d\) と \(q\) は \(n\) の約数である。そうすると \(g^d\) を \(q\) 乗すると \(g^{dq}=g^n=e\) となるので、\(H\) は \(g^d\) を生成元とする位数 \(q\) の巡回群、
次に、剰余類 \(g^kH\:\:(1\leq k\leq n)\) を考える。\(k\) を \(d\) で割った商を \(m\)、余りを \(i\) とする。\(qd=n\) なので \(m\) の最大値は \(q\) であり、
\(k=md+i\) \((0\leq m\leq q,\:0\leq i < d)\)
と表現できる。以下、\(m,\:i\) の値によって3つに分ける。
\(k=i\:\:(m=0,\:1\leq i < d)\) のときは、\(H\) が単位元を含んでいるので、
\(g^k=g^i\in g^iH\)
である。
\(m\neq0,\:1\leq i < d\) のときは、
\(g^k=g^{md+i}=g^ig^{md}\)
となるが、\((\br{A})\) 式により、
\(g^{md}\in H\:\:(1\leq m\leq q)\)
なので、
\(g^ig^{md}\in g^iH\)
\(g^k\in g^iH\:\:(1\leq i < d)\)
となる。
また、\(m\neq0,\:i=0\) のときは、
\(g^k=g^{md}\in H\)
である。
結局、\(G\) の元 \(g^k\) は、\(\{\:H,\:g^iH\:\:(1\leq i < d)\:\}\) のどれかに含まれる。ここで、形式上 \(g^0H\:=\:H\) と定義すると、\(H,\:g^iH\) は、
\(g^iH\:=\:\{\:g^{i+md}\:|\:0\leq i < d,\:\:0\leq m\leq q\:\}\)
と表記できる。\(0\leq i,j < d,\:\:0\leq m_i,m_j\leq q\) で、\(i\neq j\) なら、
\(i+m_id\neq j+m_jd\)
なので、\(g^iH\) と \(g^jH\) に共通の元はなく、
\(g^iH\:\cap\:g^jH=\phi\:\:(i\neq j)\)
である。
以上より、巡回群 \(G\) は剰余類によって、
\(G=H\:\cup\:gH\:\cup\:g^2H\:\cup\:\cd\:\cup\:g^{d-1}\)
\(g^iH\:\cap\:g^jH=\phi\) \((i\neq j)\)
と分解できる。
\(H\) は \(G\) の正規部分群であった。従って \(G\) の \(H\) による剰余類は剰余群になり、
\(G/H=\{\:H,\:gH,\:g^2H,\:\cd\:,g^{d-1}H\:\}\)
である。ここで \(gH\) の累乗を調べると、
\((gH)^2=gHgH=ggHH=g^2H\)
\((gH)^3=gHgHgH=g^2HgH=g^2gHH=g^3H\)
のように計算でき、
\((gH)^i=g^iH\) \((1\leq i\leq d-1)\)
である。また、同じ計算によって、
\((gH)^d=g^dH\)
となるが、\(g^d\in H\) なので部分群の元の条件の定理(41C)により \(g^dH=H\) であり、つまり、
\((gH)^d=H\)
である。
以上により 剰余群 \(G/H\) は、
\(G/H=\{gH,\:(gH)^2,\:\cd\:,(gH)^{d-1},\:(gH)^{d}=H\}\)
と表され、生成元が \(gH\)、単位元が \(H\)、位数が \(d\) の巡回群である。[証明終]
部分群と正規部分群
\(G\) の正規部分群を \(H\)、部分群を \(N\) とする。このとき、
が成り立つ。
(a) の証明
\(G\) の正規部分群を \(H\)、 部分群を \(N\) とするとき、\(NH\) は部分群である。
\(NH\) の任意の2つの元を
\(nx\:\:(n\in N,\:x\in H),\:\:my\:\:(m\in N,\:y\in H)\)
とすると、
\(nx\in nH,\:my\in mH\)
である。\(H\) は正規部分群だから、\(mH=Hm\) であることを用いると、
\((nx)(my)\in(nH)(mH)=nHmH=nmHH=nmH\)
となる。\(n,m\in N\) なので \(nm\in N\) であり、従って \(nmH\subset NH\) である。結局、
\((nx)(my)\in NH\)
となって、\(NH\) の2つの元の演算は \(NH\) で閉じていることが分かる(=\(\:\br{①}\:\))。
また一般に、\((xy)^{-1}=y^{-1}x^{-1}\) である。なぜなら、
\(xy(y^{-1}x^{-1})=x(yy^{-1})x^{-1}=xex^{-1}=xx^{-1}=e\)
\((y^{-1}x^{-1})xy=y^{-1}(x^{-1}x)y=y^{-1}ey=y^{-1}y=e\)
が成り立つからである。
\(G\) の部分群 \(N\) と正規部分群 \(H\) において、\(n\in N,\:x\in H\) とすると、\(n^{-1}\in N,\:x^{-1}\in H\) なので、
\((nx)^{-1}=x^{-1}n^{-1}\in Hn^{-1}\)
となるが、\(H\) が正規部分群なので、\(Hn^{-1}=n^{-1}H\)である。さらに、\(n^{-1}H\subset NH\) なので、結局、
\((nx)^{-1}\subset NH\)
となり、\(NH\) の任意の元 \(nx\) について逆元 \((nx)^{-1}\) が \(NH\) に含まれる(=\(\:\br{②}\:\))。
\(\br{①}\:\:\br{②}\) が成り立つので、部分群の十分条件の定理(41B)によって \(NH\) は \(G\) の部分群である。[証明終]
(b) の証明
\(G\) の正規部分群を \(H\)、部分群を \(N\) とするとき、\(G\:\sp\:N\:\sp\:H\) なら、\(H\) は \(N\) の正規部分群である。
\(H\) は \(G\) の正規部分群だから、\(G\) の任意の元 \(x\) について
\(xH=Hx\)
が成り立つ。\(N\) は \(G\) の 部分集合だから、\(N\) の任意の元 \(y\) についても、
\(yH=Hy\)
が成り立つ。従って \(H\) は \(N\) の正規部分群である。[証明終]
(c) の証明
\(G\) の正規部分群を \(H\)、 部分群を \(N\) とするとき、\(N\cap H\) は \(N\) の正規部分群である。
\(H\) は \(G\) の正規部分群だから、\(G\) の任意の元 \(x\) について
\(xH=Hx\)
が成り立つ。この式に右から \(x^{-1}\) をかけると、
\(xHx^{-1}=H\)
となる。これは、\(H\) の任意の元 \(h\) を決めると、\(G\) の任意の元 \(x\) について、
\(xhx^{-1}\in H\)
となることを意味する。これは \(H\) が正規部分群であることの定義と等価である。以降、この形で \(N\cap H\) が正規部分群であることを証明する。
部分群 \(N\) の任意の元を \(y\)、正規部分群 \(H\) の任意の元を \(h\)、\(N\cap H\) の任意の元を \(n\) とする。\(y,\:y^{-1},\:n\) は全て \(N\) の元だから、
\(yny^{-1}\in N\)
である(=\(\:\br{①}\:\))。また \(H\) は \(G\) の正規部分群であるから、\(G\) の任意の元 \(x\) について、
\(xhx^{-1}\in H\)
が成り立つ。ここで、\(G\:\sp\:N\) なので \(x=y\) とおくことができ、また \(H\:\sp\:N\cap H\) なので \(h=n\) とおくこともできる。従って、
\(yny^{-1}\in H\)
である(=\(\:\br{②}\:\))。\(\br{①}\:\:\br{②}\) より、\(N\cap H\) の任意の元 \(n\) を決めると、\(N\) の全ての元 \(y\) について、
\(yny^{-1}\in N\cap H\)
となる。つまり \(N\cap H\) は \(N\) の正規部分群である。[証明終]
4.2 準同型写像
この節の写像の説明には「全射」「単射」「全単射」などの用語ができてます。その用語の意味は次の図の通りです。
準同型写像と同型写像
群 \(G\) から群 \(G\,'\) への写像 \(f\) がある。\(G\) の任意の2つの元、\(x,\:y\) について、
\(f(xy)=f(x)f(y)\)
が成り立つとき、\(f\) を \(G\) から \(G\,'\) への準同型写像(homomorphism)という。右辺は群 \(G\,'\) の演算定義に従う。
また、\(f\) が全単射写像のとき、\(f\) を同型写像(isomorphism)という。群 \(G\) から \(G\,'\) への同型写像が存在するとき、\(G\) と \(G\,'\) は同型であるといい、
\(G\:\cong\:G\,'\)
で表す。
準同型写像の像と核
群 \(G\) から群 \(G\,'\) への準同型写像 \(f\) がある。\(G\) の元を \(f\) で移した元の集合を「\(f\) の像(image)」といい、\(\mr{Im}\:f\) と書く。\(\mr{Im}\:f\) を \(f(G)\) と書くこともある。
\(\mr{Im}\:f\) は \(G\,'\) の部分群である。
\(G\) の単位元を \(e\)、\(G\,'\) の単位元を \(e\,'\) とする。準同型写像 \(f\) によって \(e\,'\) に移る \(G\) の元の集合を「\(f\) の核(kernel)」といい、\(\mr{Ker}\:f\) と書く。
\(\mr{Ker}\:f\) は \(G\) の部分群である。
[証明]
\(\mr{Im}\:f\) と \(\mr{Ker}\:f\) が群であることを証明する。
\(\mr{Im}\:f\) は群
\(\mr{Im}\:f\) の任意の2つの元を \(f(x),f(y)\:\:(x,y\in G)\) とすると、
\(f(x)f(y)=f(xy)\:\in\mr{Im}\:f\)
である(=\(\:\br{①}\:\))。
\(\mr{Im}\:f\) の任意の元 \(f(x)\) について、
\(f(e)f(x)=f(ex)=f(x)\)
\(f(x)f(e)=f(xe)=f(x)\)
なので、
\(f(e)=e\,'\)
である。\(G\) は群なので、任意の元 \(x\) について逆元 \(x^{-1}\) が存在する。
\(f(x)f(x^{-1})=f(xx^{-1})=f(e)=e\,'\)
\(f(x^{-1})f(x)=f(x^{-1}x)=f(e)=e\,'\)
であるから、
\(f(x)^{-1}=f(x^{-1})\:\in\mr{Im}\:f\)
である(=\(\:\br{②}\:\))。\(\br{①}\:\:\br{②}\) より、部分群の十分条件の定理(41B)によって \(\mr{Im}\:f\) は \(G\,'\) の部分群である。
\(\mr{Ker}\:f\) は群
\(\mr{Ker}\:f\) の任意の元を \(x,\:y\) とすると、
\(f(xy)=f(x)f(y)=e\,'e\,'=e\,'\)
なので、
\(xy\:\in\mr{Ker}\:f\)
である(\(\:\br{③}\:\))。
また \(x\) は \(G\) の元だから \(x^{-1}\) が定義されている。
\(\begin{eqnarray}
&&\:\:f(x^{-1})&=f(x^{-1})e\,'=f(x^{-1})f(x)\\
&&&=f(x^{-1}x)=f(e)\\
&&&=e\,'\\
\end{eqnarray}\)
となるので、
\(x^{-1}\:\in\mr{Ker}\:f\)
である(\(\:\br{④}\:\))。\(\br{③}\:\:\br{④}\) より、部分群の十分条件の定理(41B)によって \(\mr{Ker}\:f\) は \(G\) の部分群である。[証明終]
核が単位元なら単射
群 \(G\) から群 \(G\,'\) への準同型写像 \(f\) がある。このとき
である。
[証明]
"\(f\) は全射" については、全射の定義そのものである。
\(\mr{Ker}\:f\:=\:\{e\}\) とし、\(G\) の任意の2つの元を \(x,\:y\) とする。ここで、
\(f(x)=f(y)\)
であったとする。\(\mr{Im}\:f\) は群だから \(f(y)^{-1}\in\:\mr{Im}\:f\) である。上の式に左から \(f(y)^{-1}\) をかけると、
\(f(y)^{-1}f(x)=f(y)^{-1}f(y)\)
\(f(y^{-1})f(x)=e\,'\)
\(f(y^{-1}x)\in\:\mr{Ker}\:f\)
\(y^{-1}x=e\)
\(x=y\)
となる。\(f(x)=f(y)\) であれば \(x=y\) なので、\(f\) は単射である。[証明終]
核は正規部分群
群 \(G\) から群 \(G\,'\) への準同型写像を \(f\) とする。このとき \(\mr{Ker}\:f\) は \(G\) の正規部分群である。
[証明]
\(\mr{Ker}\:f\) を \(H\) と記述する。\(G\) の 任意の元を \(x\) とし、\(H\) の任意の元を \(y\) とする。すると、
\(\begin{eqnarray}
&&\:\:f(xyx^{-1})&=f(x)f(y)f(x^{-1})\\
&&&=f(x)e\,'f(x^{-1})=f(x)f(x^{-1})\\
&&&=f(xx^{-1})=f(e)=e\,'\\
\end{eqnarray}\)
と計算できるから、
\(xyx^{-1}\in H\)
である。\(y\) は \(H\) の任意の元だから、
\(xHx^{-1}\subset H\)
である。\(x\) は任意にとることができるので、\(x\) を \(x^{-1}\) に置き換えると、
\(x^{-1}Hx\subset H\)
を得る。この式に左から \(x\)、右から \(x^{-1}\) をかけると、
\(H\subset xHx^{-1}\)
となる。つまり
\(H\subset xHx^{-1}\subset H\)
\(xHx^{-1}=H\)
である。さらに右から \(x\) をかけると、
\(xH=Hx\)
となり、\(x\) は任意の \(G\) の元だから、\(H\:\:(=\mr{Ker}\:f)\) は \(G\) の正規部分群である。[証明終]
4.3 同型定理
準同型定理=第1同型定理
群 \(G\) から群 \(G\,'\) への準同型写像 \(f\) がある。\(H=\mr{Ker}\:f\) とすると、\(G\) の \(H\) による剰余群は、\(G\) の \(f\) による像と同型である。つまり、
\(G/H\:\cong\:\mr{Im}\:f\)
が成り立つ。
[証明]
\(H\:=\:\mr{Ker}\:f\) は、核は正規部分群の定理(42D)により、\(G\) の正規部分群である。従って剰余群 \(G/H\) が定義できる。\(G/H\) から \(\mr{Im}\:f\) への写像 \(\sg\) を、
\(\begin{eqnarray}
&&\:\:\sg\:: &G/H &\longrightarrow&\mr{Im}\:f\\
&&&xH &\longmapsto&f(x)\\
\end{eqnarray}\)
と定義する。まず、この写像が剰余類 \(xN\) の代表元 \(x\) のとりかたに依存しないこと、つまり \(xH=yH\) なら \(f(x)=f(y)\) であることを示す。\(xH=yH\) を変形すると、
\(xH=yH\)
\(y^{-1}xH=y^{-1}yH\)
\(y^{-1}xH=H\)
ゆえに部分群の元の条件の定理(41C)から \(y^{-1}x\in H\) である。そうすると、\(H\) は \(\mr{Ker}\:f\) のことだから、\(f(y^{-1}x)=e\,'\) である。これを変形すると、
\(f(y^{-1}x)=e\,'\)
\(f(y^{-1})f(x)=e\,'\)
\(f(y)^{-1}f(x)=e\,'\)
となる。最後の変形では、準同型写像の像と核の定理(42B)の「\(\mr{Im}\:f\) は群」の証明から、\(f(y^{-1})=f(y)^{-1}\) であることを用いた。ここから、
\(f(y)^{-1}f(x)=e\,'\)
\(f(y)f(y)^{-1}f(x)=f(y)e\,'\)
\(f(x)=f(y)\)
となり、\(f(x)=f(y)\) が証明できた。
以上の変形は逆も辿れる。つまり、
\(f(x)=f(y)\)
\(f(y)f(y)^{-1}f(x)=f(y)e\,'\)
\(f(y)^{-1}f(x)=e\,'\)
\(f(y^{-1})f(x)=e\,'\)
\(f(y^{-1}x)=e\,'\)
\(f(y^{-1}x)\in H\)
\(y^{-1}xH=H\)
\(xH=yH\)
となる。これは \(f(x)=f(y)\) なら \(xH=yH\) であることを示していて、すなわち \(\sg\) は単射である。と同時に、\(\sg\) による写像の先は \(\mr{Im}\:f\) に限定しているので \(\sg\) は全射である。つまり \(\sg\) は 全単射である(=\(\:\br{①}\:\))。
さらに、
\(\begin{eqnarray}
&&\:\:\sg((xH)(yH))&=\sg(x(Hy)H)=\sg(x(yH)H)\\
&&&=\sg(xyH)=f(xy)=f(x)f(y)\\
&&&=\sg(xH)\sg(yH)\\
\end{eqnarray}\)
であり、つまり \(\sg((xH)(yH))=\sg(xH)\sg(yH)\) が成り立っている(=\(\:\br{②}\:\))。
\(\br{①}\:\:\br{②}\) により \(\sg\) は同型写像である。\(G/H\) から \(\mr{Im}\:f\) への同型写像が存在するから、
\(G/H\:\cong\:\mr{Im}\:f\)
である。[証明終]
第2同型定理
群 \(G\) の正規部分群を \(H\)、部分群を \(N\) とすると、
\(N/(N\cap H)\:\cong\:NH/H\)
が成り立つ。
[証明]
まず、部分群と正規部分群の定理(41I)により、\(G\) の正規部分群が \(H\)、部分群が \(N\) の場合、
である。従って剰余群の定義(41G)により、\(N/(N\cap H)\) および \(NH/H\) は剰余群となる。
\(G\) の任意の元を \(x,\:y\) とし、\(G\) から \(G/H\) への写像 \(\sg\) を、
\(\begin{eqnarray}
&&\:\:\sg\:: &G &\longrightarrow&G/H\\
&&&x &\longmapsto&xH\\
\end{eqnarray}\)
と定義する。この写像は、
\(\begin{eqnarray}
&&\:\:\sg(xy)&=xyH=xyHH=xHyH=(xH)(yH)\\
&&&=\sg(x)\sg(y)\\
\end{eqnarray}\)
を満たすから準同型写像である(ちなみに \(G\) とその正規部分群 \(H\) があるとき、上記の定義による \(\sg\) を自然準同型と呼ぶ)。
\(\sg\) の定義域は \(G\) であるが、\(\sg\) の定義域を \(G\) の部分群である \(N\) に制限した写像 \(\tau\)(タウ) を考える。\(N\) の任意の元を \(z\) とすると、
\(\begin{eqnarray}
&&\:\:\tau\:: &N &\longrightarrow&G/H\\
&&&z &\longmapsto&zH\\
\end{eqnarray}\)
である。この \(\tau\) の像 \(\mr{Im}\:\tau\) を考えてみると、\(z\) が \(N\) の元のすべてを動くとき、\(\tau(z)=zH\) として出てくる \(G\) の元は \(NH\) の元である。つまり \(\tau\) は、
\(\begin{eqnarray}
&&\:\:\tau\:: &N &\longrightarrow&G/H\\
\end{eqnarray}\)
として定義したが、\(\tau(z)\) が \(G/H\) の全てを尽くすわけではなく、全射ではない。写像による移り先は、\(G\) の部分群 \(NH\) を \(H\) で分類した剰余群、\(NH/H\) である。つまり \(\tau(N)=NH/H\) であり、
\(\mr{Im}\:\tau=NH/H\)
である。
次に準同型写像の核を考える。\(G/H\) の単位元は、
\(xH\cdot H=xH\)
\(H\cdot xH=HxH=xHH=xH\)
なので、\(H\) である。
\(G\) の元 \(x\) が \(\mr{Ker}\:\sg\) の元とする。つまり、
\(x\in\mr{Ker}\:\sg\)
とする。これは \(\sg(x)\) が \(G/H\) の単位元になるということだから、
\(\sg(x)=H\)
であり、\(\sg(x)=xH\) なので、
\(xH=H\)
である。これは部分群の元の条件の定理(41C)によって、
\(x\in H\)
と同値である。従って、
\(x\in\mr{Ker}\:\sg\)
\(x\in H\)
の2つは同値であり、つまり、
\(\mr{Ker}\:\sg=H\)
である。
\(\tau\) は \(\sg\) の定義域を \(N\) に制限したものなので、\(\mr{Ker}\:\tau\) は「\(\mr{Ker}\:\sg=H\) のうちで \(N\) に含まれるもの」であり、すなわち、
\(\mr{Ker}\:\tau=(N\cap H)\)
である。
ここで、\(\tau\) の定義である、
\(\begin{eqnarray}
&&\:\:\tau\:: &N &\longrightarrow&G/H\\
\end{eqnarray}\)
に準同型定理(43A)を適用すると、
\(\begin{eqnarray}
&&\:\:N/(\mr{Ker}\:\tau) &\cong\:\mr{Im}\:\tau\\
&&\:\:N/(N\cap H) &\cong\:NH/H\\
\end{eqnarray}\)
となって、題意が成り立つ。[証明終]
第2同型定理を整数の剰余群で確認してみます。上の定理における \(G,\:H,\:N\) を、
\(G=\bs{Z}\)
\(H=10\bs{Z}\) (\(10\) の倍数)
\(N=\phantom{1}6\bs{Z}\) (\(\phantom{1}6\) の倍数)
の群とします。この群の演算は加算であり、可換群なので、\(\bs{Z}\) の部分群はすべて正規部分群です。
\(N\cap H\) は「\(10\) の倍数、かつ \(6\) の倍数」の集合なので、
\(N\cap H=30\bs{Z}\)
です。また \(NH\) は、\(10\) の倍数と\(6\) の倍数の加算の結果の集合です。つまり、
\(NH=\{\:10x+6y\:|\:x,y\in\bs{Z}\:\}\)
ですが、これが何を意味するかは不定方程式の解の存在の定理(21B)から分かります。定理を再掲すると、
2変数 \(x,\:y\) の1次不定方程式を、
\(ax+by=c\)
(\(a,\:b,\:c\) は整数。\(a\neq0,\:b\neq0\))
とし、\(a\) と \(b\) の最大公約数を \(d\) とする。このとき、
\(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。
です。\(c=kd\) なら、式を満たす \(x,\:y\) が必ず存在します。また任意の \(x,\:y\) について \(ax+by\) を計算すると、その結果の \(c\) は必ず \(c=kd\) の形になります。そうでなければ、\(c\) が最大公約数の倍数でないにも関わらず不定方程式が解をもつことになって定理に矛盾します。従って、\(ax+by=c\) の \(x,\:y\) を任意の整数とすると、\(c\) は \(a,\:b\) の "最大公約数の整数倍のすべて" になります。
\(NH=\{\:10x+6y\:|\:x,y\in\bs{Z}\:\}\)
とした場合、\(10\) と \(6\) の最大公約数は \(2\) なので、
\(NH=2\bs{Z}\)
です。この結果、
\(N/(N\cap H)\)
\(=6\bs{Z}/30\bs{Z}\)
\(=\{30\bs{Z},\:6+30\bs{Z},\:12+30\bs{Z},\:18+30\bs{Z},\:24+30\bs{Z}\}\)
\(NH/H\)
\(=2\bs{Z}/10\bs{Z}\)
\(=\{10\bs{Z},\:2+10\bs{Z},\:4+10\bs{Z},\:6+10\bs{Z},\:4+10\bs{Z}\}\)
となります。この2つの剰余群は位数 \(5\) の巡回群( \(C_5\) )で、\(\bs{Z}/5\bs{Z}\) に同型です。つまり、
であり、
\(N/(N\cap H)\:\cong\:NH/H\)
となって、第2同型定理が確認できました。
第2同型定理を数式で書くと何だか難しそうな感じがしますが、図にするといかにも自明なことという気がします。数学におけるイメージ図の威力が実感できます。
第2同型定理は、後ほど「可解群の部分群は可解群」という定理の証明に使います。「可解群の部分群は可解群」の定理は、5次方程式に可解でないものがあることを証明する際に鍵となる定理です。その第2同型定理は準同型定理を使って証明される、という構造になっているのでした。
2章から4章までは、多項式、体、線形空間、剰余類、群、剰余群、既約剰余類群、正規部分群といった、ガロア理論の基礎となる概念の説明でした。この第5章から、理論の核心に入っていきます。
5.1 体の同型写像
同型写像の定義
体 \(\bs{K}\) から 体 \(\bs{F}\) への写像 \(f\) が全単射であり、\(\bs{K}\) の任意の元、\(x,\:y\) に対して、
\(\begin{eqnarray}
&&\:\:f(x+y)&=f(x)+f(y)\\
&&\:\:f(xy)&=f(x)f(y)\\
\end{eqnarray}\)
が成り立つとき、\(f\) を体の同型写像という。この定義による同型写像は、加法と乗法のみならず、四則演算を保存する。
特に、\(\bs{K}\) から \(\bs{K}\) への同型写像を自己同型写像という。
\(\bs{K}\) から \(\bs{F}\) への同型写像が存在するとき、体 \(\bs{K}\) と 体 \(\bs{F}\) は同型であるといい、\(\bs{K}\:\cong\:\bs{F}\) で表す。
体 \(\bs{K}\) と \(\bs{F}\) がともに \(\bs{Q}\) を含むとき、\(a\in\bs{Q}\) に対して、
\(f(a)=a\)
である。つまり有理数は同型写像で不変である。
[証明]
上の定義による同型写像が、減法と除法を保存することを証明する。\(\bs{K}\) と \(\bs{F}\) は体だから、加法と乗法について群になっている。\(\bs{K}\) の加法の単位元を \(\kz\)、\(\bs{F}\) の加法の単位元を \(\fz\) とする。また、乗法の単位元をそれぞれ \(\ko\) と \(\fo\) とする。まず、\(f(\ko)=\fo\) で \(f(\kz)=\fz\) であることを示す。
\(f(x+y)=f(x)+f(y)\) において \(x=\kz,\:y=\kz\) とすると、
\(f(\kz+\kz)=f(\kz)+f(\kz)\)
\(f(\kz)=f(\kz)+f(\kz)\)
両辺に \(\bs{F}\) における \(f(\kz)\) の逆元 \(-f(\kz)\) を加えると、
\(f(\kz)+(-f(\kz))=f(\kz)\)
\(\fz=f(\kz)\)
となり、\(f(\kz)=\fz\) である。
\(f(xy)=f(x)f(y)\) において \(x=\ko,\:y=\ko\) とすると、
\(f(\ko\times\ko)=f(\ko)f(\ko)\)
\(f(\ko)=f(\ko)f(\ko)\)
両辺に \(\bs{F}\) における \(f(\ko)\) の逆元 \(-f(\ko)\) を加えると、
\(f(\ko)+(-f(\ko))=f(\ko)f(\ko)+(-f(\ko))\)
\(\fz=f(\ko)f(\ko)+(-f(\ko))\)
この式に現れているのは全て \(\bs{F}\) の元だから、分配則を使って、
\(f(\ko)(f(\ko)-\fo)=\fz\)
ここで \(f(\ko)=\fz\) と仮定すると、\(f(\kz)=\fz\)かつ \(f(\ko)=\fz\) となってしまい \(f\) が単射であることと矛盾する。従って \(f(\ko)\neq\fz\) である。上式の両辺を \(f(\ko)\) で割ると、
\(f(\ko)-\fo=\fz\)
\(f(\ko)=\fo\)
となる。
以上を踏まえると、同型写像が減法を保存することは次のようにしてわかる。\(\bs{K}\) は加法について群なので任意の元 \(x\in\bs{K}\) について逆元 \(-x\) がある。また \(\bs{F}\) も加法についても群だから \(f(x)\) の逆元 \(-f(x)\) がある。
\(f(-x)+f(x)=f(-x+x)=f(\kz)=\fz\)
両辺に \(-f(x)\) を足すと、
\(f(-x)+f(x)+(-f(x))=\fz+(-f(x))\)
\(f(-x)+\fz=\fz+(-f(x))\)
\(f(-x)=-f(x)\)
である。\(\bs{K}\) の任意の元を \(x,\:y\) とすると、
\(\begin{eqnarray}
&&\:\:f(x-y)&=f(x+(-y))\\
&&&=f(x)+f(-y)\\
&&&=f(x)+(-f(y))\\
&&&=f(x)-f(y)\\
\end{eqnarray}\)
となって、減法は保存されている。
除法を保存することは次のようにしてわかる。\(\bs{K}\) は乗法について群なので、任意の元 \(x\:\:(\neq\kz)\) について逆元 \(x^{-1}\) がある。\(\bs{F}\) も乗法についての群だから、\(f(x)\) の逆元である \(f(x)^{-1}\) がある。\(x\neq\kz\) なら \(f(x)\neq\fz\) なので逆元が定義できる。すると、
\(f(x^{-1})f(x)=f(x^{-1}x)=f(\ko)=\fo\)
である。この式の両辺に \(f(x)^{-1}\) をかけると、
\(f(x^{-1})f(x)f(x)^{-1}=\fo\times f(x)^{-1}\)
\(f(x^{-1})\times\fo=\fo\times f(x)^{-1}\)
\(f(x^{-1})=f(x)^{-1}\)
となる。\(\bs{K}\) の任意の元を \(x,\:y\:\:(y\neq\kz)\) とすると、
\(\begin{eqnarray}
&&\:\:f\left(\dfrac{x}{y}\right)&=f(xy^{-1})\\
&&&=f(x)f(y^{-1})\\
&&&=f(x)f(y)^{-1}\\
&&&=\dfrac{f(x)}{f(y)}\\
\end{eqnarray}\)
となり、除法が保存されていることが分かる。
有理数の同型写像を考える。\(n\) を整数とすると、
\(\begin{eqnarray}
&&\:\:f(n)&=f(\:\overbrace{1+1+\cd+1}^{1をn\:個加算}\:)\\
&&&=f(1)+f(1)+\cd+f(1)\\
&&&=nf(1)\\
&&&=n\\
\end{eqnarray}\)
なので、\(f(n)=n\) である。任意の有理数 \(a\) は、2つの整数 \(n\:(\neq0),\:m\) を用いて、
\(a=\dfrac{m}{n}\)
と表されるから、
\(\begin{eqnarray}
&&\:\:f(a)&=f\left(\dfrac{m}{n}\right)=\dfrac{f(m)}{f(n)}=\dfrac{m}{n}\\
&&&=a\\
\end{eqnarray}\)
となり、有理数は同型写像で不変である。[証明終]
同型写像と有理式の順序交換
変数 \(x\) の多項式(係数は \(\bs{Q}\) の元)を分母・分子とする分数式を、\(\bs{Q}\) 上の有理式という。
\(\bs{Q}\) 上の多項式は、有理数と \(x\) の加・減・乗算で作られる式です。一方、\(\bs{Q}\) 上の有理式とは、有理数と \(x\) の除算を含む四則演算で作られる式です。
体 \(\bs{K}\) と 体 \(\bs{F}\) は \(\bs{Q}\) を含むものとする。\(\sg\) を \(\bs{K}\) から \(\bs{F}\) への同型写像とし、\(a\) を \(\bs{K}\) の元とする。\(f(x)\) を \(\bs{Q}\) 上の有理式とすると、
\(\sg(f(a))=f(\sg(a))\)
である。これは多変数の有理式でも成り立つ。\(a_1,a_2,\cd,a_n\) を \(\bs{K}\) の元、\(f(x_1,x_2,\cd,x_n)\) を \(\bs{Q}\) 上の有理式とすると、
\(\sg(f(a_1,a_2,\cd,a_n))=f(\sg(a_1),\sg(a_1),\cd,\sg(a_n))\)
である。
[証明]
\(a\in\bs{K},\:b_i\in\bs{Q},\:c_i\in\bs{Q}\) とし、1変数 \((=a)\) の2次多項式の分数式の場合を例に書くと、
\(\sg\left(\dfrac{b_2a^2+b_1a+b_0}{c_2a^2+c_1a+c_0}\right)\)
\(=\dfrac{\sg(b_2a^2+b_1a+b_0)}{\sg(c_2a^2+c_1a+c_0)}\)
\(=\dfrac{b_2\sg(a^2)+b_1\sg(a)+b_0}{c_2\sg(a^2)+c_1\sg(a)+c_0}\)
\(=\dfrac{b_2\sg(a)^2+b_1\sg(a)+b_0}{c_2\sg(a)^2+c_1\sg(a)+c_0}\)
であるから、題意は成り立つ。これは \(n\)次多項式の場合でも同じである。[証明終]
「同型写像と有理式は順序交換可能」は、\(\bs{Q}\) の拡大体の上の有理式でも成り立ちます。つまり、次が成り立ちます。
\(\bs{Q}\) を含む体を \(\bs{K}\) とし、\(\bs{K}\)の拡大体を \(\bs{F}\:,\bs{F}'\) とする。\(\sg\) を \(\bs{K}\) を不変にする \(\bs{F}\) から \(\bs{F}'\) への同型写像とし、\(a\) を \(\bs{F}\) の元とする。\(f(x)\) を \(\bs{K}\) 上の有理式とすると、
\(\sg(f(a))=f(\sg(a))\)
である。
同型写像は解を共役な解に移す
\(\sg\) を体 \(\bs{K}\) から 体 \(\bs{F}\) への同型写像とする。\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つを \(\al\) とし、\(\al\) は \(\bs{K}\) の元とする。すると \(\sg(\al)\) も \(f(x)=0\) の解である。
[証明]
\(\al\) は \(f(x)=0\) の解なので \(f(\al)=0\) が成り立つ。すると、
\(f(\sg(\al))=\sg(f(\al))=\sg(0)=0\)
となり、\(\sg(\al)\) も \(f(x)=0\) の解である。[証明終]
同じ方程式の解同士を「共役な解」「共役である」と言います。この定理により、同型写像は解を共役な解に移すこと分かります。
同型写像は解を入れ替える
\(\sg\) を体 \(\bs{K}\) から 体 \(\bs{F}\) への同型写像とし、\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。方程式 \(f(x)=0\) の \(n\)個の解を \(\al_1,\al_2,\cd,\al_n\) とし、これらが全て \(\bs{K}\) に含まれるとする。
すると \(\sg(\al_1),\sg(\al_2),\cd,\sg(\al_n)\) は、\(\al_1,\al_2,\cd,\al_n\) を入れ替えたものである。
[証明]
\(f(x)\) は既約多項式なので、方程式 \(f(x)=0\) は \(n\)個の解をもち、それらは全て異なる(31G)。同型写像は解を共役な解に移す(51D)ので、\(\sg(\al_i)\) も \(f(x)=0\) の解である。\(\sg\) は同型写像なので全単射であり、\(i\neq j\) なら \(\sg(\al_i)\neq\sg(\al_j)\) である。従って \(\sg(\al_1),\sg(\al_2),\cd,\sg(\al_n)\) は、\(\al_1,\al_2,\cd,\al_n\) を入れ替えたものである。[証明終]
同型写像を定義してその性質を述べてきましたが、あたかも「同型写像はあるのが当然」のような話でした。しかし、同型写像があったとしたらこういう性質をもつというのが正しく、同型写像が必ずあるとは証明していません。
同型写像の存在を示すには、第1章でやったように、\(\bs{Q}(\sqrt{2})\)において
\(\sg(\sqrt{2})=-\sqrt{2}\)
という写像を定義すると、体のすべての元について \(\sg\) は同型写像の定義を満たす、というような証明が必要です。それが次です。
単拡大体の同型写像の存在
\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。\(\al,\:\beta\) を方程式 \(f(x)=0\) の異なる解とする。
すると \(\sg(\al)=\beta\) を満たす \(\bs{Q}(\al)\) から \(\bs{Q}(\beta)\) への唯一の同型写像 \(\sg\) が存在する。
[証明]
\(\bs{Q}(\al)\) の任意の元を \(a\)、\(\bs{Q}(\beta)\) の任意の元を \(b\) とする。単拡大体の基底の定理(33F)により、\(a,\:b\) は、
\(\begin{eqnarray}
&&\:\:\sg\:: &a_{n-1}\al^{n-1}+\:\cd\:+a_2\al^2+a_1\al+a_0\\
&&&\longmapsto\:a_{n-1}\beta^{n-1}+\:\cd\:+a_2\beta^2+a_1\beta+a_0\\
\end{eqnarray}\)
と定義する。\(a=\al\) の場合は、\(a_1=1,\:a_i=0\:\:(i=0,\:2\leq i\leq n-1)\) だから、\(\sg(\al)=\beta\) である。以下、この \(\sg\) が同型写像であることを証明する。定義により(51A)同型写像であることは加法と乗法を保存することを言えばよい。
\(\bs{Q}(\al)\) の任意の2つの元を \(s,\:t\) とし、
\(p(x)=g(x)+h(x)\) とおくと、
\(p(\al)=g(\al)+h(\al)=s+t\)
である。また \(\sg\)の定義により、
\(\sg(p(\al))=p(\beta)\)
となる。従って、
\(\begin{eqnarray}
&&\:\:\sg(s+t)&=\sg(p(\al))\\
&&&=p(\beta)\\
&&&=g(\beta)+h(\beta)\\
&&&=\sg(s)+\sg(t)\\
\end{eqnarray}\)
となり、加法は保存される。
\(g(x)h(x)\) を \(f(x)\) で割ったときの商を \(q(x)\)、余りを \(r(x)\) とすると、
\(g(x)h(x)=q(x)f(x)+r(x)\)
である。この式に \(x=\al,\:x=\beta\) のそれぞれを代入すると、\(f(\al)=0,\:f(\beta)=0\) なので、
\(g(\al)h(\al)=r(\al)\)
\(g(\beta)h(\beta)=r(\beta)\)
となる。すると、
\(\begin{eqnarray}
&&\:\:\sg(st)&=\sg(g(\al)h(\al))\\
&&&=\sg(r(\al))=r(\sg(\al))\\
&&&=r(\beta)\\
\end{eqnarray}\)
\(\begin{eqnarray}
&&\:\:\sg(s)\sg(t)&=\sg(g(\al))\sg(h(\al))\\
&&&=g(\sg(\al))h(\sg(\al))\\
&&&=g(\beta)h(\beta)\\
&&&=r(\beta)\\
\end{eqnarray}\)
であり、
\(\sg(st)=\sg(s)\sg(t)\)
となって乗法も保存されている。従って \(\sg\) は同型写像である。
逆に、\(\bs{Q}(\al)\) に作用する同型写像 \(\tau\) があったとする。同型写像は \(\al\) を共役な元に移すので、その移り先の元を \(\beta\)、つまり \(\tau(\al)=\beta\) とする。\(\bs{Q}(\al)\) の任意の元 \(a\) に \(\tau\) を作用させると、
\(\begin{eqnarray}
&&\:\:\tau(a)&=\tau(a_{n-1}\al^{n-1}+\:\cd\:+a_2\al^2+a_1\al+a_0)\\
&&&=a_{n-1}\tau(\al^{n-1})+\:\cd\:+a_2\tau(\al^2)+a_1\tau(\al)+a_0\\
&&&=a_{n-1}\tau(\al)^{n-1}+\:\cd\:+a_2\tau(\al)^2+a_1\tau(\al)+a_0\\
&&&=a_{n-1}\beta^{n-1}+\:\cd\:+a_2\beta^2+a_1\beta+a_0\\
\end{eqnarray}\)
となるので、同型写像はこの式を満たさなければならない。従って、上で定義した \(\sg\) が \(\bs{Q}(\al)\) から \(\bs{Q}(\beta)\) の唯一の同型写像である。[証明終]
同型写像の存在(51F)を一般化すると、次のことが言えます。
単拡大体の同型写像は \(n\) 個
\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。\(f(x)=0\) の全ての解を \(\al_1=\al,\:\al_2,\:\cd\:,\al_n\) とする。このとき \(\bs{Q}(\al)\) に作用する同型写像は \(n\)個あり、それらは、
\(\sg_i(\al)=\al_i\) \((1\leq i\leq n)\)
で定められ、\(\sg_i\) は \(\bs{Q}(\al)\) から \(\bs{Q}(\al_i)\) への同型写像となる。
同型写像を別の視点で考えます。\(\bs{Q}\:\subset\:\bs{F}\:\subset\:\bs{K}\) といった体の拡大列があったとき、\(\bs{F}\) の同型写像と \(\bs{K}\) の同型写像には密接な関係があります。それが次の同型写像の延長の定理です。単拡大定理(32B)により、\(\bs{F}=\bs{Q}(\al)\)、\(\bs{K}=\bs{Q}(\al,\beta)\) としてよいので、その形を使います。
同型写像の延長
\(\bs{Q}\) 上の \(n\)次既約多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の解の一つを \(\al\) とする。
\(\bs{\bs{Q}(\al)}\) 上の \(m\)次既約多項式を \(g(x)\) とし、方程式 \(g(x)=0\) の解の一つを \(\beta\) とする。また、\(\bs{Q}(\al)\) の同型写像の一つを \(\tau\) とする。
このとき、\(\tau\) は \(\bs{Q}(\al,\beta)\) の同型写像 \(\sg_j\) に延長できる。延長とは、\(\sg_j\) の作用を \(\bs{Q}(\al)\) に限定した写像の作用が \(\tau\) と一致することを言う。\(\tau\) を延長した同型写像 \(\sg_j\) は \(m\)個ある(\(0\leq j < m\))。
[証明]
\(\bs{Q}(\al)\) 上の \(m\)次既約多項式 \(g(x)\) を、
\(g(x)=x^m+a_1x^{m-1}+\cd+a_m\:\:(a_j\in\bs{Q}(\al))\)
とする。\(\beta\) は \(g(x)=0\) の解だから
\(g(\beta)=\beta^m+a_1\beta^{m-1}+\cd+a_m=0\)
である。また、多項式 \(\tau(g(x))\) を、
\(\tau(g(x))=x^m+\tau(a_1)x^{m-1}+\cd+\tau(a_{m-1})x+\tau(a_m)\)
と定義し、方程式
\(\tau(g(x))=0\)
の解を \(t_j\:\:(0\leq j < m)\)とする。つまり \(\tau(g(t_j))=0\) である。
\(\bs{Q}(\al,\beta)\) は \(\bs{Q}(\al)\) 上の線形空間であり、単拡大体の基底の定理(33F)により、その基底を \(\{1,\:\beta,\:\beta^2,\:\cd\:\beta^{m-1}\}\) にとれるから、\(\bs{Q}(\al,\beta)\) の任意の元 \(k\) は、
と表せる。そこで、\(\bs{Q}(\al,\beta)\) の元に作用する写像 \(\sg_j\) を
と定義する。この定義における \(\sg_j\) は \(\bs{Q}(\al,\beta)\) の同型写像になる。同型写像になることは体の加算と乗算で示せればよい(51A)。\(\bs{Q}(\al,\beta)\) の2つの元を、
\(p=c_0+c_1\beta+c_2\beta^2\:+\cd+\:c_{m-1}\beta^{m-1}\:\:(c_j\in\:\bs{Q}(\al)\:)\)
\(q=d_0+d_1\beta+d_2\beta^2\:+\cd+\:d_{m-1}\beta^{m-1}\:\:(d_j\in\:\bs{Q}(\al)\:)\)
とし、2つの多項式を、
\(p(x)=c_0+c_1x+c_2x^2\:+\cd+\:c_{m-1}x^{m-1}\)
\(q(x)=d_0+d_1x+d_2x^2\:+\cd+\:d_{m-1}x^{m-1}\)
と定義する。加算で同型写像になるのは明白なので、乗算で同型写像になることを示す。
\(p(x)q(x)\) を \(g(x)\) で割ったときの商を \(t(x)\)、余りを \(r(x)\) とすると、
すると \(g(\beta)=0\) だから、
である。そうすると、\(\sg_j(pq)\) は \(\sg_j\) の定義により、
となる。
\(\tau\) は \(\bs{Q}(\al)\) の同型写像だから、\(\bs{Q}(\al)\) の元の有理式である \(s_j(c_j,d_j)\) に作用させると、同型写像と有理式の順序交換の定理(51C)により、
\(\tau(s_j(c_j,d_j))=s_j(\tau(c_j),\tau(d_j))\)
となる。従って、
である。
\(p(x)\) の係数 \(c_j\) を \(\tau(c_j)\) で置き換え、\(q(x)\) の係数 \(d_j\) を \(\tau(d_j)\) で置き換えた2つの多項式を、
\(\tau(p(x))=\tau(c_0)+\tau(c_1)x+\tau(c_2)x^2+\cd+\tau(c_{m-1})x^{m-1}\)
\(\tau(q(x))=\tau(d_0)+\tau(d_1)x+\tau(d_2)x^2+\cd+\tau(d_{m-1})x^{m-1}\)
とする。
\(\tau(p(x))\tau(q(x))\)を\(\tau(g(x))\)で割ったときの商を\(\tau(t(x))\)、余りを\(\tau(r(x))\)とする。つまり、
\(\tau(p(x))\tau(q(x))=\tau(g(x))\tau(t(x))+\tau(r(x))\)
である。\(c_j\) と \(d_j\) の有理式、\(s_j(c_j,d_j)\) を使って \(\tau(r(x))\) を表すと、
となる。\(\sg_j\) の定義により、
である。従って、
また、\(\bs{Q}(\al,\beta)\) の任意の元 \(k\) を、
\(k=b_0+b_1\beta+b_2\beta^2\:+\cd+\:b_{n-1}\beta^{m-1}\:\:(b_j\in\bs{Q}(\al))\)
と表したとき、\(k\) が \(\bs{Q}(\al)\) の元だとすると \(k=b_0\:\:(b_0\in\bs{Q}(\al))\)、\(b_j=0\:\:(1\leq j < m)\) なので、
\(\sg_j(k)=\tau(b_0)=\tau(k)\)
となり、\(\sg_j\) の \(\bs{Q}(\al)\) の元に対する作用は \(\tau\) と一致する。従って、
\(\sg_j\) の定義式、
一方、\(\al\) は \(\bs{Q}\) 上の \(n\)次既約多項式 \(f(x)\) の解の一つだから、\(\bs{Q}(\al)\) の同型写像 \(\tau\) は \(n\)個ある。これを \(\tau_i\:\:(0\leq i < n)\) と書くと、それぞれの \(\tau_i\) に対して同型写像の拡張 \(\sg_{ij}\:\:(0\leq i < n,\:0\leq j < m)\) がある。従って \(\bs{Q}(\al,\beta)\) の 同型写像 \(\sg_{ij}\) は \(nm\)個ある。[証明終]
5.2 ガロア拡大とガロア群
ガロア拡大
ガロア拡大は次のように定義される。この2つの定義は同値である。
\(\bs{K}/\bs{F}\) がガロア拡大のとき、\(\bs{\bs{F}}\) を不変にする \(\bs{K}\) の自己同型写像の集合は群になる。これをガロア群といい、\(\mr{Gal}(\bs{K}/\bs{F})\) で表す。
[① \(\bs{\Rightarrow}\) ②の証明]
単拡大定理(32B)により、\(\bs{L}\) は、\(\bs{L}\) の元 \(\theta\) を用いて \(\bs{L}=\bs{F}(\theta)\) と表すことができる。\(\theta\) の \(\bs{F}\) 上の最小多項式を \(g(x)\) とし、その次数を \(m\) とする。最小多項式は既約多項式の定理(31I)により、\(g(x)\) は既約多項式である。また、既約多項式の定理3(31G)により、方程式 \(g(x)=0\) の \(m\)個の解は全て異なっている。その解の一つは \(\theta\) なので、\(m\)個の解を、
\(\theta=\theta_1,\:\theta_2,\:\cd,\:\theta_m\)
とする。\(\theta_i\:\:(2\leq i\leq m)\) が \(\bs{L}\) の元かどうかは(この段階では)分からない。
\(\bs{F}\) の元を不変にする \(\bs{L}\) 上の同型写像の一つを \(\sg\) とする。\(\sg\) は \(\bs{F}\) の元を不変にするから、\(\bs{L}=\bs{F}(\theta)\) においては \(\sg(\theta)\) を決めることによって \(\sg\) が定義される。その同型写像は、方程式の解を共役な解に移す(51D)。そこで、\(m\)個の同型写像を、
\(\sg_i(\theta)=\theta_i\)
と定義する(\(\sg_1=e\))。
一方、\(\bs{L}\) は \(\bs{F}\) 上の方程式 \(f(x)=0\) の最小分解体であった。\(f(x)=0\) の解を、
\(\al_1,\:\al_2,\:\cd,\:\al_n\)
の \(n\)個とする。そうすると、
\(\bs{L}=\bs{F}(\al_1,\:\al_2,\:\cd,\:\al_n)\)
である。\(\bs{L}\) の任意の元 は、\(\al_1,\:\al_2,\:\cd,\:\al_n\) の有理式(係数は \(\bs{F}\) の元)で表せる。\(\theta\) を有理式で表す式を、\(n\)変数の有理式 \(h(x_1,x_2,\cd,x_n)\) を使って、
\(\theta=h(\al_1,\:\al_2,\:\cd,\:\al_n)\)
と表したとする。\(h(x_i)\)は、\(n\)変数の多項式(係数は \(\bs{F}\) の元)を \(s(x_i)\) と \(t(x_i)\) として、
\(h(\al_1,\:\al_2,\:\cd,\:\al_n)=\dfrac{s(\al_1,\:\al_2,\:\cd,\:\al_n)}{t(\al_1,\:\al_2,\:\cd,\:\al_n)}\)
である。
\(\theta\) に同型写像 \(\sg_i\) を作用させる。\(\bs{F}\) 係数の有理式と \(\bs{F}\) を不変にする同型写像の演算順序は交換可能(51C)だから、
\(\begin{eqnarray}
&&\:\:\sg_i(\theta)&=\sg_i(h(\al_1,\:\al_2,\:\cd,\:\al_n))\\
&&&=h(\sg_i(\al_1),\:\sg_i(\al_2),\:\cd,\:\sg_i(\al_n))\\
\end{eqnarray}\)
となる。同型写像は方程式の解を共役な解に移す(51D)から、\(\sg_i(\al_1),\:\sg_i(\al_2),\:\cd,\:\sg_i(\al_n)\) は \(\al_1,\:\al_2,\:\cd,\:\al_n\) を入れ替えたものである(51E)。つまり \(\sg_i(\theta)\) は \(\al_1,\:\al_2,\:\cd,\:\al_n\) の有理式で表現される。従って、
\(\sg_i(\theta)\:\in\:\bs{L}\)
である。\(\sg_i(\theta)=\theta_i\) と定義したので、
\(\theta_i\:\in\:\bs{L}\)
である。つまり \(m\)個の同型写像 \(\sg_i\:\:(1\leq i\leq m)\) は全て \(\bs{L}\) の自己同型写像である。
[② \(\bs{\Rightarrow}\) ①の証明]
単拡大定理(32B)により、\(\bs{K}\) は、\(\bs{K}\) の元 \(\theta\) を用いて \(\bs{K}=\bs{F}(\theta)\) と表すことができる。\(\theta\) の \(\bs{F}\) 上の最小多項式を \(f(x)\) とし、その次数を \(m\) とする。最小多項式は既約多項式の定理(31I)により、\(f(x)\) は既約多項式である。また既約多項式の定理3(31G)により、方程式 \(f(x)=0\) の \(m\)個の解は全て異なっている。解の一つは \(\theta\) なので、\(m\)個の解を、
\(\theta=\theta_1,\:\theta_2,\:\cd,\:\theta_m\)
とする。
\(\bs{F}\) の元を不変にする \(\bs{K}\) 上の同型写像の一つを \(\sg\) とする。\(\sg\) は \(\bs{F}\) の元を不変にするから、\(\bs{L}=\bs{F}(\theta)\) においては \(\sg(\theta)\) を決めることによって \(\sg\) が定義される。その同型写像は、\(\bs{F}\) 上の方程式の解を共役な解に移す(51D)。そこで、\(m\)個の同型写像を、
\(\sg_i(\theta)=\theta_i\)
と定義する。\(\bs{F}\) の元を不変にする \(\bs{K}\) 上の同型写像は自己同型写像なので、\(\sg_i(\theta)=\theta_i\) は全て \(\bs{K}\) の元である。従って \(\bs{K}\) は \(\bs{F}\) 上の既約多項式 \(f(x)\) の解 \(\theta_i\) を用いて、
\(\begin{eqnarray}
&&\:\:\bs{K}&=\bs{F}(\theta)\\
&&&=\bs{F}(\theta_1,\:\theta_2,\:\cd,\:\theta_m)\\
\end{eqnarray}\)
と表される。\(\bs{K}\) は \(\bs{F}\) 上の既約多項式の最小分解体である。[証明終]
① の定義は、方程式の解のありようを議論するガロア理論にとっては "ノーマルな" 定義のように見えます。しかし ② のように方程式という言葉を全く使わない定義もメリットがあります。たとえば「次数が違う2つの方程式の解によるガロア拡大が同じ」ということは、いくらでもありうるからです。
また、ガロア拡大は次のような定義もできます。
方程式という言葉は使っていますが、拡大体から始まる定義です。言い換えると、\(\bs{K}\) がガロア拡大体のとき \(\bs{K}\) の任意の元に共役な元は \(\bs{K}\) に含まれるということです。
このように、互いに同値である多種の定義ができることがガロア理論の分かりにくいところですが、逆に「それだけ豊かな数学的内容を含んだ理論」とも言えるでしょう。
最小分解体の次数=ガロア群の位数
\(\bs{Q}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\)、ガロア群を \(G\) とするとき、\([\:\bs{L}\::\:\bs{Q}\:]=|G|\) である。
[証明]
単拡大定理(32B)により、\(\bs{L}\) は、\(\bs{L}\) の元 \(\theta\) を用いて \(\bs{L}=\bs{Q}(\theta)\) と表すことができる。\(\theta\) の \(\bs{Q}\) 上の最小多項式を \(g(x)\) とし、その次数を \(m\) とする。最小多項式は既約多項式の定理(31I)により、\(g(x)\) は既約多項式である。また、既約多項式の定理3(31G)により、方程式 \(g(x)=0\) の \(m\)個の解は全て異なっている。解の一つは \(\theta\) なので、\(m\)個の解を、
\(\theta=\theta_1,\:\theta_2,\:\cd,\:\theta_m\)
とする。ここで、\(\theta_i\:\:(2\leq i\leq m)\) が \(\bs{L}\) の元かどうかは(この段階では)分からない。
\(\bs{L}\) 上の同型写像の一つを \(\sg\) とする。\(\sg\) は \(\bs{Q}\) の元を不変にするから、\(\bs{L}=\bs{Q}(\theta)\) においては \(\sg(\theta)\) を決めることによって \(\sg\) が定義される。その同型写像は、方程式の解を共役な解に移す(51D)。そこで、\(m\)個の同型写像を、
\(\sg_i(\theta)=\theta_i\)
と定義する(\(\sg_1=e\))。単拡大体 \(\bs{Q}(\theta)\) に作用する同型写像は \(m\)個だから(51G)、これが同型写像のすべてである。
一方、\(\bs{L}\) は \(\bs{Q}\) 上の方程式 \(f(x)=0\) の最小分解体であった。\(f(x)=0\) の解を、
\(\al_1,\:\al_2,\:\cd,\:\al_n\)
の \(n\)個とする。そうすると、
\(\bs{L}=\bs{Q}(\al_1,\:\al_2,\:\cd,\:\al_n)\)
である。\(\bs{L}\) の任意の元 は、\(\al_1,\:\al_2,\:\cd,\:\al_n\) の有理式で表せる。\(\theta\) を有理式で表す式を、\(n\)変数の有理式 \(h(x_1,x_2,\cd,x_n)\) を使って、
\(\theta=h(\al_1,\:\al_2,\:\cd,\:\al_n)\)
と表したとする。\(h(x_i)\)は、\(n\)変数の多項式(係数は有理数)を \(s(x_i)\) と \(t(x_i)\) として、
\(h(\al_1,\:\al_2,\:\cd,\:\al_n)=\dfrac{s(\al_1,\:\al_2,\:\cd,\:\al_n)}{t(\al_1,\:\al_2,\:\cd,\:\al_n)}\)
である。
\(\theta\) に同型写像 \(\sg_i\) を作用させると、有理式と同型写像の演算順序は交換可能(51C)だから、
\(\begin{eqnarray}
&&\:\:\sg_i(\theta)&=\sg_i(h(\al_1,\:\al_2,\:\cd,\:\al_n))\\
&&&=h(\sg_i(\al_1),\:\sg_i(\al_2),\:\cd,\:\sg_i(\al_n))\\
\end{eqnarray}\)
となる。同型写像は方程式の解を共役な解に移すから(51D)、\(\sg_i(\al_1),\:\sg_i(\al_2),\:\cd,\:\sg_i(\al_n)\) は \(\al_1,\:\al_2,\:\cd,\:\al_n\) を入れ替えたものである(51E)。つまり \(\sg_i(\theta)\) は \(\al_1,\:\al_2,\:\cd,\:\al_n\) の有理式で表現される。従って、
\(\sg_i(\theta)\:\in\:\bs{L}\)
である。\(\sg_i(\theta)=\theta_i\) と定義したので、
\(\theta_i\:\in\:\bs{L}\)
である。つまり \(m\)個の同型写像 \(\sg_i\:\:(1\leq i\leq m)\) は全て \(\bs{L}\) の自己同型写像である。以上により、
\(\mr{Gal}(\bs{L}/\bs{Q})=\{\sg_1,\:\sg_2,\:\cd,\:\sg_m\}\)
であり、\(|G|=m\) である。
\(\theta\) の \(\bs{Q}\) 上の最小多項式(=既約多項式)の次数が \(m\) だから、単拡大体の基底の定理(33F)によって、最小分解体 \(\bs{L}=\bs{Q}(\theta)\) は \(\bs{Q}\) の \(m\)次拡大体であり、
\([\:\bs{L}\::\:\bs{Q}\:]=|G|\)
である。[証明終]
この定理では \(\bs{Q}\) としましたが、任意の代数拡大体 \(\bs{F}\) としても成り立ちます。また、最小分解体はガロア拡大体です。従って、最も一般的に言うと次のようになります。
\(\bs{F}\) を代数拡大体とし、\(\bs{F}\) のガロア拡大を \(\bs{L}\) とする。\(\bs{L}\) のガロア群の位数は \(\bs{F}\) から \(\bs{L}\) への拡大次数に等しい。つまり、
\([\:\bs{L}\::\:\bs{F}\:]=|\mr{Gal}(\bs{L}/\bs{F})|\)
である。
中間体
\(\bs{K}\) を \(\bs{F}\) のガロア拡大体とし、\(\bs{M}\) を \(\bs{F}\subset\bs{M}\subset\bs{K}\) である任意の体(=中間体)とするとき、\(\bs{K}\) は \(\bs{M}\) のガロア拡大体でもある。
[証明]
最小分解体定義による
\(\bs{K}\) が \(\bs{F}\) 上の方程式 \(f(x)=0\) の最小分解体であるとする。この方程式の解を \(\al_1,\:\al_2,\:\cd\:\al_n\) とすると、\(\bs{K}=\bs{F}(\al_1,\:\al_2,\:\cd\:\al_n)\) である。\(\bs{F}\subset\bs{M}\subset\bs{L}\) なので、
\(\bs{F}(\al_1,\:\cd\:\al_n)\:\subset\:\bs{M}(\al_1,\:\cd\:\al_n)\:\subset\:\bs{K}(\al_1,\:\cd\:\al_n)=\bs{K}\)
となるが、すなわち、
\(\bs{F}\:\subset\:\bs{M}(\al_1,\:\al_2,\:\cd\:\al_n)\:\subset\:\bs{K}\)
であり、\(\bs{K}=\bs{M}(\al_1,\:\al_2,\:\cd\:\al_n)\) である。\(f(x)=0\) は \(\bs{M}\) 上の方程式でもあるので、\(\bs{K}\) は \(\bs{M}\) 上の方程式の最小分解体であり、\(\bs{M}\) のガロア拡大体である。
自己同型定義による
\(\bs{L}\) の同型写像のうち、\(\bs{M}\) の元を固定する任意の同型写像を \(\sg\) とする。そうすると \(\sg\) は \(\bs{M}\) の部分集合である \(\bs{F}\) の元も固定する。\(\bs{L}\) は \(\bs{F}\) のガロア拡大体なので、\(\bs{F}\) の元を固定する \(\bs{L}\) の同型写像は自己同型写像である。従って \(\sg\) も自己同型写像であり、\(\bs{L}\) は \(\bs{M}\) のガロア拡大体である。[証明終]
\(\bs{F}\subset\bs{M}\subset\bs{K}\) という体の拡大列があったとき、\(\bs{F}\subset\bs{K}\) がガロア拡大だと上の定理(52C)によって \(\bs{M}\subset\bs{K}\) もガロア拡大です。しかし、\(\bs{F}\subset\bs{M}\) がガロア拡大になるとは限りません。\(\bs{F}\subset\bs{M}\) がガロア拡大になるためには条件が必要で、その条件が満たされば、\(\bs{F}\subset\bs{M}\subset\bs{K}\) は「ガロア拡大の連鎖」になり、そのことが方程式の可解性と結びつきます。それが次の節の大きな主題です。
5.3 ガロア対応
固定体と固定群
体 \(\bs{F}\) 上の方程式の最小分解体(=ガロア拡大体)を \(\bs{K}\) とし、ガロア群を \(G\) とする。\(G\) の部分群 \(H\) によって不変な \(\bs{K}\) の元の集合 \(\bs{M}\) は体になる。これを \(\bs{K}\) における \(H\) の固定体といい、\(\bs{K}(H)\) で表す(または \(\bs{K}^H\))。
また \(\bs{K}\) の中間体 \(\bs{M}\) のすべての元を不変にする \(G\) の部分集合 \(H\) は群になる。これを \(G\) における \(\bs{M}\) の固定群と呼び、\(G(\bs{M})\) で表す(または \(G^M\))。
[証明]
固定体と固定群の定義において、
の2点を証明する。
① の証明
\(\bs{M}\) が体であることを証明するには、四則演算で閉じていることを言えばよい(1.2 体)。\(\bs{M}\) の任意の2つの元を \(x,\:y\) とし、\(H\) の任意の元を \(\sg\) とする。\(x,\:y\) は \(\bs{K}\) の元でもあるから、
\(x+y\in\bs{K}\)
である。\(H\) の元 \(\sg\) は \(G\) の元でもあるから \(\sg(x+y)\) が定義できる。\(x,\:y\) は \(\bs{M}\) の元だから、\(H\) の元である \(\sg\) を作用させても不変であり、
\(\sg(x)=x\)
\(\sg(y)=y\)
である。すると、
\(\sg(x+y)=\sg(x)+\sg(y)=x+y\)
となって、\(x+y\) は \(\sg\) によって不変であり、
\(x+y\in\bs{M}\)
である。以上のことが加減乗除のすべてで成り立つことは明白だから、\(\bs{M}\) は四則演算で閉じていて、体である。
② の証明
\(\bs{M}\) の任意の元を \(x\)、\(H\) の2つの元を \(\sg,\:\tau\) とする。
\(\sg(x)=x\)
\(\tau(x)=x\)
である。すると、
\(\sg\tau(x)=\sg(\tau(x))=\sg(x)=x\)
となり、\(\sg\tau\in H\) となって、\(H\) の元は群演算で閉じている。
また \(H\) の元はもともと \(G\) の元なので、結合法則も成り立つ。\(G\) の単位元を \(e\) とすると、\(e(x)=x\) なので \(e\in H\) である。
さらに \(\sg\) は \(G\) の元なので、\(G\) の中に \(\sg^{-1}\) が存在する。すると、\(\sg(x)=x\) の両辺に左から \(\sg^{-1}\) をかけると、
\(\sg^{-1}\sg(x)=\sg^{-1}(x)\)
\(x=\sg^{-1}(x)\)
となり、
\(\sg^{-1}\in H\)
である。\(H\) は演算で閉じていて、結合法則が成り立ち、単位元と逆元が存在するので、群の定義(22A)を満たしている。[証明終]
以上の固定体と固定群の概念を用いると、次のガロア対応の定理が成り立ちます。以降の論証の基礎となる定理です。
ガロア対応の定理
\(\bs{F}\) のガロア拡大体を \(\bs{K}\) とし、ガロア群を \(G\) とする。\(G\) の任意の部分群を \(H\) とし、\(H\) による \(\bs{K}\) の固定体 \(\bs{K}(H)\) を \(\bs{M}\) とする(次式)。
\(\begin{eqnarray}
&&G\:\sp\:H &\sp\:\{e\}\\
&&\bs{F}\:\subset\:\bs{K}(H)=\bs{M} &\subset\:\bs{K}\\
\end{eqnarray}\)
\(\bs{M}\)の固定群を \(G(\bs{M})\) とする(次式)。ガロア群の定義により \(G(\bs{M})=\mr{Gal}(\bs{K}/\bs{M})\) である。
\(\begin{eqnarray}
&&\bs{F}\:\subset\:\bs{M} &\subset\:\bs{K}\\
&&G\:\sp\:G(\bs{M}) &\sp\:\{e\}\\
\end{eqnarray}\)
このとき、
\(G(\bs{M})=H\)
つまり、
\(\begin{eqnarray}
&&\:\:\mr{Gal}(\bs{K}/\bs{M})&=H \\
&&\:\:\bs{K}(G(\bs{M}))&=\bs{M}\\
\end{eqnarray}\)
が成り立つ。
[証明]
\(G\) の任意の部分群である \(H\) は \(\bs{K}\) の部分集合 \(\bs{M}\) を固定する。一方、\(G(\bs{M})\) は \(\bs{M}\) を固定する \(G\) のすべての元の集合で、それが部分群になっている。従って、\(G(\bs{M})\) は \(H\) を含む。つまり
\(H\:\subset\:G(\bs{M})\)
であり、群位数は、
\(\bs{K}/\bs{F}\) はガロア拡大であり、\(\bs{M}\) はその中間体だから、中間体からのガロア拡大の定理(52C)によって、\(\bs{K}/\bs{M}\) はガロア拡大である。また、すべての代数拡大体は単拡大体だから(32B)、\(\bs{K}\) の元 \(\theta\) があって \(\bs{K}=\bs{F}(\theta)\) と表せる。これは、\(\bs{K}=\bs{M}(\theta)\) ということでもある。
\(H\) の \(|H|\) 個の元を \(\sg_i\:\:(1\leq i\leq|H|)\) とし、多項式
\(f(x)=\displaystyle\prod_{i=1}^{|H|}(x-\sg_i(\theta))\)
を考える。この多項式の次数は \(|H|\) である。\(\sg_i(\theta)\) は \(\theta\) の共役な元のどれかである。
\(f(x)\) を展開すると、その係数は \(\sg_i(\theta)\:\:(1\leq i\leq|H|)\) の対称式になる。また、\(\sg_i(\theta)\) に \(H\) の任意の元 \(\sg_k\) を作用させても、\(\sg_i\) は部分群だから演算で閉じており、\(\sg_i(\theta)\) を入れ替えるだけである(51E)。従って \(\sg_i(\theta)\) の対称式に \(\sg_k\) を作用させても不変である。つまり、\(H\) の任意の元は \(f(x)\) の係数を固定する。ということは、\(\bs{M}\) の定義(= \(H\) による \(\bs{K}\) の固定体が \(\bs{M}\))によって、\(f(x)\) の係数は \(\bs{M}\) の元である。
\(\sg_i\) は群だから単位元を含む。従って、
\(f(\theta)=\displaystyle\prod_{i=1}^{|H|}(\theta-\sg_i(\theta))=0\)
となり、\(\bs{\theta}\) は \(\bs{\bs{M}}\) 上の \(\bs{|H|}\) 次方程式 \(\bs{f(x)=0}\) の解の一つである。ゆえに \(\bs{M}\) から単拡大体 \(\bs{K}=\bs{M}(\theta)\) への拡大次数は、\(f(x)\) が \(\bs{M}\) 上の既約多項式なら単拡大体の基底の定理(33F)により \(|H|\) であり、一般には \(|H|\) 以下である。つまり、
\([\:\bs{K}\::\:\bs{M}\:]\leq|H|\)
である。次数と位数の同一性(52B)によると、拡大次数 \([\:\bs{K}\::\:\bs{M}\:]\) は、ガロア群 \(\mr{Gal}(\bs{K}/\bs{M})\) の位数に等しい。従って、
\(|\mr{Gal}(\bs{K}/\bs{M})|\leq|H|\)
\(|G(\bs{M})|=|H|\)
であり、\(G(\bs{M})\:\subset\:H\) と合わせると、
\(G(\bs{M})=H\)
となる。従って、
\(\begin{eqnarray}
&&\:\:\mr{Gal}(\bs{K}/\bs{M})&=H \\
&&\:\:\bs{K}(G(\bs{M}))&=\bs{M}\\
\end{eqnarray}\)
である。[証明終]
証明の中に対称式という言葉が出てきます。対称式とは、
変数の任意の入れ替えで不変な多項式
です。2変数 \(x,\:y\) だと、
\(x+y,\:xy\)(ここまでが基本対称式)、\(x^2+y^2,\:\:(x-y)^2\)
などです。3変数 \(x,\:y\:,z\) だと、
\(x+y+z,\:xy+yz+zx,\:xyz\)(基本対称式)、\(((x-y)(y-z)(z-x))^2\)
などです。
対称式でよく出てくるのは、方程式の根と係数の関係です。たとえば、\(\bs{Q}\) 上の既約な3次多項式を \(f(x)\) をとし、\(f(x)=0\) の解を \(\al,\beta,\gamma\) とします。
\(\begin{eqnarray}
&&\:\:f(x)&=x^3-ax^2+bx-c\\
&&&=(x-\al)(x-\beta)(x-\gamma)\\
\end{eqnarray}\)
と書くと、
\(a=\al+\beta+\gamma\)
\(b=\al\beta+\beta\gamma+\gamma\al\)
\(c=\al\beta\gamma\)
と、係数が解の基本対称式で表現されます。
また ガロア群 \(\mr{Gal}(\bs{Q}(\al,\beta,\gamma)/\bs{Q})\) の任意の元 を \(\sg\) とします。\(\al,\beta,\gamma\) の任意の対称式を \(S(\al,\beta,\gamma)\in\bs{Q}(\al,\beta,\gamma)\) とすると、
\(\sg(S(\al,\beta,\gamma))=S(\al,\beta,\gamma)\)
です。ガロア群の元は自己同型写像であり、方程式の解を解の一つに置き換えるので、これが成り立ちます。自己同型写像を作用させて不変なのは有理数です(51A)。従って、\(S(\al,\beta,\gamma)\) は有理数です。もちろん \(f(x)\) が \(n\)次多項式であっても成り立ちます。
\(\bs{F}\subset\bs{M}\subset\bs{K}\) という体の拡大列で \(\bs{F}\subset\bs{K}\) がガロア拡大のとき、\(\bs{M}\subset\bs{K}\) は自動的にガロア拡大ですが(52C)、ある条件があれば \(\bs{F}\subset\bs{M}\) もガロア拡大になって、\(\bs{F}\subset\bs{M}\subset\bs{K}\) が「ガロア拡大の連鎖」になります。その条件は「ガロア対応」と「正規部分群」の概念を用いて示されます。それが次の正規性定理です。次では \(\bs{Q}\) から始まる体の拡大列で記述しています。
正規性定理
\(\bs{Q}\) のガロア拡大を \(\bs{K}\) とし、\(\mr{Gal}(\bs{K}/\bs{Q})=G\) とする。\(\bs{K}\) の中間体 \(\bs{M}\) と \(G\) の部分群 \(H\) がガロア対応になっているとする。このとき
の2つは同値である。また、これが成り立つとき、
\(\mr{Gal}(\bs{M}/\bs{Q})\:\cong\:G/H\)
という群の同型が成り立つ。
[① \(\bs{\Rightarrow}\) ②の証明]
\(G\) の任意の元を \(g\) とし、\(\bs{M}\) の任意の元を \(m\) とする。
\(\bs{M}\) が \(\bs{Q}\) のガロア拡大なので、\(m\) の共役な元は \(\bs{M}\) に含まれる。\(g\) は同型写像だから、\(\bs{K}\) の元を共役な元に移す(51D)。つまり、\(g\) を \(m\) に作用させると \(m\) と共役な元に移すことになり、 \(g(m)\in\bs{M}\) である。また \(g^{-1}\) も \(G\) の元だから \(g^{-1}(m)\in\bs{M}\) である。
\(H\) の任意の元を \(h\) とする。\(H\) は \(\bs{M}\) とガロア対応をしているから、\(h\) は \(\bs{M}\) の元を不動にする。ゆえに、
\(hg^{-1}(m)=g^{-1}(m)\)
である。従って、
\(ghg^{-1}(m)=gg^{-1}(m)=m\)
となり、\(ghg^{-1}\) は \(\bs{M}\) の元を不動にするから \(H\) の元である。そうすると、
\(gHg^{-1}\:\subset\:H\)
また、\(g(m)\) も \(\bs{M}\) の元なので、
\(hg(m)=g(m)\)
である。従って、
\(g^{-1}hg(m)=g^{-1}g(m)=m\)
となり、\(g^{-1}hg\) も \(\bs{M}\) の元を不動にするから \(H\) の元である。そうすると、
\(g^{-1}Hg\:\subset\:H\)
\(gH=Hg\)
となって、左剰余類と右剰余類が一致するから、\(H\) は \(G\) の正規部分群である。
[② \(\bs{\Rightarrow}\) ①の証明]
\(\bs{M}\) の任意の元を \(m\) とする。同型写像の延長の定理(51H)により、\(\bs{M}\) の同型写像 \(s\) は \(\bs{K}\) の同型写像 \(g\) に延長できる。つまり、\(g\) を \(\bs{M}\) の元に限定して作用させたとき \(g(m)=s(m)\) となる \(g\) がある。
\(H\) の任意の元を \(h\) とすると、\(h\) は正規部分群の元なので、
\(g^{-1}hg\:\in\:H\)
である。従って、
\(g^{-1}hg(m)=m\)
\(hg(m)=g(m)\)
となり、\(g(m)\) は \(H\) の任意の元で不動である。
ガロア対応の原理により \(\bs{K}(H)=\bs{M}\) なので、
\(g(m)\:\in\:\bs{M}\)
となり、\(g(m)\) は \(H\) の固定体 \(\bs{M}\) の元である。
\(\bs{M}\)の元に \(g\) を作用させるときは \(g(m)\) は \(s(m)\) そのものなので、
\(s(m)\:\in\:\bs{M}\)
となる。
以上により、\(\bs{M}\) の同型写像による \(m\) の移り先(= \(m\) と共役な元)は \(\bs{M}\) に含まれることになり、\(\bs{M}/\bs{Q}\) はガロア拡大である。[証明終]
[\(\bs{\mr{Gal}(\bs{M}/\bs{Q})\:\cong\:G/H}\) の証明]
同型写像の延長の定理(51H)の証明で示したように、\(\bs{M}\) の同型写像 \(s\) を \(\bs{K}\) の同型写像に延長する可能性は複数ある。\(g_1\) と \(g_2\) を \(s\) の2つの延長とし、\(\bs{M}\)の元を \(m\) とする。\(g_1,\:g_2\) は、\(\bs{M}\) に限定して適用すると \(s\) に等しいから、
\(g_1(m)=s(m)\)
\(g_2(m)=s(m)\)
が成り立つ。
\(g_1^{-1}g_2\) を \(m\) に作用させると
\(\begin{eqnarray}
&&\:\:g_1^{-1}g_2(m)&=g_1^{-1}(s(m))\\
&&&=g_1^{-1}(g_1(m))=m\\
\end{eqnarray}\)
となり、\(g_1^{-1}g_2\) は \(\bs{M}\) の元を不動にする。よって、
\(g_1^{-1}g_2\in\:H\)
\(g_2\in\:g_1H\)
である。
つまり、\(g_2\) は \(H\) の剰余類の一つの集合 \(g_1H\) に入る。以上で、\(\bs{M}\) の同型写像 \(s\) は、同型写像の延長を通して 剰余類 \(G/H\) の一つを定めることが分かる。
逆に \(g_1\) と \(g_2\) が 剰余類 \(G/H\) の同じ集合に属すると、
\(g_2\in\:g_1H\)
\(g_1^{-1}g_2\in\:H\)
\(g_1^{-1}g_2(m)=m\)
\(g_2(m)=g_1(m)\)
となり、\(g_1\) と \(g_2\) は \(\bs{M}\) 上で全く同じ作用をする。従って、\(\bs{M}\) 上で \(g_1,\:g_2\) と同じ作用をする \(\mr{Gal}(\bs{M}/\bs{Q})\) の元 \(s\) を定められる。つまり、剰余類 \(G/H\) の一つの集合が \(\mr{Gal}(\bs{M}/\bs{Q})\) の元を一つ定める。
従って、
\(\mr{Gal}(\bs{M}/\bs{Q})\:\cong\:G/H\)
である。[証明終]
3.多項式と体(続き) |
3.3 線形空間
ガロア理論の一つの柱は、代数拡大体を線形空間(ベクトル空間)としてとらえることで、線形空間の「次元」や「基底」を使って理論が組み立てられています。線形空間には精緻な理論体系がありますが、ここではガロア理論に必要な事項の説明をします。
線形空間の定義
(線形空間の定義:33A) |
集合 \(V\) と 体 \(\bs{K}\) が次を満たすとき、\(V\) を \(\bs{\bs{K}}\) 上の線形空間(=ベクトル空間。linear space / vector space)と言う。
加算の定義
\(V\) の任意の元 \(\br{u},\:\br{v}\) に対して \((\br{u}+\br{v})\in V\) が定義されていて、この加算(\(+)\) の定義に関して \(V\) は可換群である。すなわち、
\((1)\) 単位元の存在
\(\br{u}+\br{x}=\br{x}\) となる \(\br{x}\) が存在する。これを \(0\) と書く。
\((2)\) 逆元の存在
\(\br{u}+\br{x}=0\) となる \(\br{x}\) が存在する。これを \(-\br{u}\) と書く。
\((3)\) 結合則が成り立つ
任意の元 \(\br{u},\:\br{v}\:,\br{w}\) について、\((\br{u}+\br{v})+\br{w}=\br{u}+(\br{v}+\br{w})\)
\((4)\) 交換則が成り立つ
\(\br{u}+\br{v}=\br{v}+\br{u}\)
スカラー倍の定義
\(V\) の任意の元 \(\br{u}\) と \(\bs{K}\) の任意の元 \(k\) に対して、スカラー倍 \(k\br{u}\in V\) が定義されていて、加算との間に次の性質がある。\(\br{u},\:\br{v}\) を \(V\) の元、\(k,\:m\) を \(\bs{K}\) の元とし、\(\bs{K}\) の乗法の単位元を \(1\) とする。
\((1)\:\:k(m\br{u})=(km)\br{u}\)
\((2)\:\:(k+m)\br{u}=k\br{u}+m\br{u}\)
\((3)\:\:k(\br{u}+\br{v})=k\br{u}+k\br{v}\)
\((4)\:\:1\br{v}=\br{v}\)
高校数学に出てくる "2次元ベクトル" とは、上記の定義の \(\bs{K}\) を \(\bs{R}\)(実数の体)とし、\(V\) を2つの実数のペアの集合 \(\{\:(x,y)\:|\:x,y\in\bs{R}\:\}\) とするベクトル空間(の要素)のことです。
上の定義の \(0\) は線形空間 \(V\) の元です。以下、\(V\) の単位元 \(0\)(= \(0\) ベクトル)と、体 \(\bs{K}\) の加法の単位元 \(0\) が混在しますが、文脈や式から明らかなので、同じ \(0\) で記述します。
1次独立と1次従属
(1次独立と1次従属:33B) |
1次独立
線形空間 \(V\) の元の組、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) に対して、
\(a_1\br{v}_1+a_2\br{v}_2+\)..\(+a_n\br{v}_n=0\)
を満たす \(\bs{K}\) の元 \(a_1,a_2,\cd,a_n\) が、\(a_1=a_2=\cd=a_n=0\) しかないとき、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) は1次独立であるという。
1次従属
1次独立でないときが1次従属である。つまり、線形空間 \(V\) の元の組、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) に対して、
\(a_1\br{v}_1+a_2\br{v}_2+\)..\(+a_n\br{v}_n=0\)
を満たす、少なくとも一つは \(0\) でない \(\bs{K}\) の元 \(a_1,a_2,\cd,a_n\) があるとき、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) は1次従属であるという。
基底
(基底の定義:33C) |
線形空間 \(V\) の元の組、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) に対して、次の2つが満たされるとき、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) を基底という。
\({\br{v}_1,\br{v}_2,\cd,\br{v}_n}\) は1次独立である。 | |
\(V\) の任意の元 \(\br{v}\) は、\(\bs{K}\) の元 \(a_1,a_2,\cd,a_n\) を選んで、
\(\br{v}=a_1\br{v}_1+a_2\br{v}_2+\)..\(+a_n\br{v}_n\)
と表せる。 |
基底から1つの元を除外したものは基底ではなくなる。また基底に1つの元を加えたものも基底ではない。
\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) が基底だと、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_{n-1}\}\) は基底ではありません。なぜなら、もし \(\{\br{v}_1,\br{v}_2,\cd,\br{v}_{n-1}\}\) が基底だとすると、
\(\br{v}_n=a_1\br{v}_1+a_2\br{v}_2+\)..\(+a_{n-1}\br{v}_{n-1}\)
と表せますが、これは、
\(a_1\br{v}_1+a_2\br{v}_2+\)..\(+a_{n-1}\br{v}_{n-1}-\br{v}_n=0\)
ということであり、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) が1次従属となってしまって、基底の要件を満たさなくなるからです。基底に、別の1つの元を加えるケースも同じことです。
(基底の数の不変性:33D) |
\(\{\br{u}_1,\br{u}_2,\cd,\br{u}_m\}\) と \(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) がともに線形空間 \(V\) の基底であるとき、\(m=n\) である。
[証明]
この定理の証明のために、まず次の補題を証明する。
[補題]
線形空間 \(V\) の任意の \(n\) 個の元を \(\{\br{u}_1,\br{u}_2,\cd,\br{u}_n\}\) とする(基底でなくてもよい)。線形空間 \(V\) の \(n+1\) 個の元 \(\{\br{w}_1,\br{w}_2,\cd,\br{w}_n,\br{w}_{n+1}\}\) がすべて \(\{\br{u}_1,\br{u}_2,\cd,\br{u}_n\}\) の1次結合で表されるなら、\(\{\br{w}_1,\br{w}_2,\cd,\br{w}_n,\br{w}_{n+1}\}\) は1次従属である。
数学的帰納法を使う。まず、\(n=1\) のとき、この定理は成り立つ。つまり、
\(\br{w}_1=k_1\br{u}_1\)
\(\br{w}_2=k_2\br{u}_1\)
と表されるなら、
\(k_2\br{w}_1-k_1\br{w}_2=0\)
であり、\(\br{w}_1\) と \(\br{w}_2\) は1次従属である。そこで、\(n\) が \(k\:\:(\geq1)\) のときに成り立つとし、\(n=k+1\) でも成り立つことを証明する。
以降、表記を見やすくするため、\(k=3\) の場合で記述する。ただし、一般性を失うことがないように記述する。\(\br{w}_1,\br{w}_2,\br{w}_3,\br{w}_4\) が、
\(\br{w}_1=a_{11}\br{u}_1+a_{12}\br{u}_2+a_{13}\br{u}_3\)
\(\br{w}_2=a_{21}\br{u}_1+a_{22}\br{u}_2+a_{23}\br{u}_3\)
\(\br{w}_3=a_{31}\br{u}_1+a_{32}\br{u}_2+a_{33}\br{u}_3\)
\(\br{w}_4=a_{41}\br{u}_1+a_{42}\br{u}_2+a_{43}\br{u}_3\)
と表せたとする。ここで \(\br{w}_4\) の係数に注目する。もし、
\(a_{41}=a_{42}=a_{43}=0\)
であれば、\(\br{w}_1,\br{w}_2,\br{w}_3,\br{w}_4\) は1次従属である。なぜなら、
\(b_1\br{w}_1+b_2\br{w}_2+b_3\br{w}_3+b_4\br{w}_4=0\)
の式を満たす \(b_1,b_2,b_3,b_4\) は、
\(b_1=b_2=b_3=0\)
\(b_4\neq0\)
として実現でき、\(\br{w}_1,\br{w}_2,\br{w}_3,\br{w}_4\) は1次従属の定義を満たすからである。そこで、\(a_{41},a_{42},a_{43}\) のうち \(0\) でないものが少なくとも一つあるとする。それを \(a_{43}\) とし、
\(a_{43}\neq0\)
とする。この仮定で一般性を失うことはない。ここで、
\(\br{x}_i=\br{w}_i-\dfrac{a_{i3}}{a_{43}}\br{w}_4\:\:(i=1,2,3)\)
とおいて \(\br{u}_3\) の項を消去する。計算すると、
\(\begin{eqnarray}
&&\:\:\br{x}_1=&\left(a_{11}-\dfrac{a_{13}a_{41}}{a_{43}}\right)\br{u}_1+\left(a_{12}-\dfrac{a_{13}a_{42}}{a_{43}}\right)\br{u}_2\\
&&\:\:\br{x}_2=&\left(a_{21}-\dfrac{a_{23}a_{41}}{a_{43}}\right)\br{u}_1+\left(a_{22}-\dfrac{a_{23}a_{42}}{a_{43}}\right)\br{u}_2\\
&&\:\:\br{x}_3=&\left(a_{31}-\dfrac{a_{33}a_{41}}{a_{43}}\right)\br{u}_1+\left(a_{32}-\dfrac{a_{33}a_{42}}{a_{43}}\right)\br{u}_2\\
\end{eqnarray}\)
となる。そうすると、\(\br{x}_1,\:\br{x}_2,\:\br{x}_3\) は「線形空間 \(V\) の2つの元 \(\br{u}_1,\br{u}_2\) の1次結合で表された3つの元」である。従って、帰納法の仮定により、\(\br{x}_1,\:\br{x}_2,\:\br{x}_3\) は1次従属である。1次従属だから、
\(b_1\br{x}_1+b_2\br{x}_2+b_3\br{x}_3=0\)
となる少なくとも一つは \(0\) ではない \(b_1,\:b_2,\:b_3\) がある。 \((\br{A})\)
\(\br{x}_1=\br{w}_1-\dfrac{a_{13}}{a_{43}}\br{w}_4\)
\(\br{x}_2=\br{w}_2-\dfrac{a_{23}}{a_{43}}\br{w}_4\)
\(\br{x}_3=\br{w}_3-\dfrac{a_{33}}{a_{43}}\br{w}_4\)
だったから、これを \((\br{A})\) 式に代入すると、
\(b_1\br{w}_1+b_2\br{w}_2+b_3\br{w}_3-\)
\(\dfrac{1}{a_{43}}(b_1a_{13}+b_2a_{23}+b_3a_{33})\br{w}_4=0\)
となる。この式における \(\br{w}_1,\:\br{w}_2,\:\br{w}_3,\:\br{w}_4\) の係数の少なくとも一つは \(0\) ではない。従って、\(a_{41},a_{42},a_{43}\) のうち \(0\) でないものが少なくとも一つある場合にも \(\br{w}_1,\:\br{w}_2,\:\br{w}_3,\:\br{w}_4\) は1次従属である。
以上で、線形空間 \(V\) の \(k=3\) 個の元(\(\br{u}_1,\br{u}_2,\br{u}_3\))の1次結合で、\(k+1=4\) 個の元(\(\br{w}_1,\br{w}_2,\br{w}_3,\br{w}_4\))のすべてが表されば、その4個の元は1次従属であることが証明できた。\(k=3\) としたのは表記を見やすくするためであり、\(k=3\) であることの特殊性は使っていない。つまり、\(k\geq1\) のすべてで成り立つ。従って数学的帰納法により補題が正しいことが証明できた。[補題の証明終]
以上を踏まえて、\(A=\{\br{u}_1,\br{u}_2,\cd,\br{u}_m\}\) と \(B=\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) がともに線形空間 \(V\) の基底であるとき、\(m=n\) となることを証明する。
もし仮に \(m < n\) だとすると、\(B\) の中から \((m+1)\) 個の元を選べる。それを \(B\:'=\{\br{v}_1,\br{v}_2,\cd,\br{v}_{m+1}\}\) とすると、\(A\) は 線形空間 \(V\) の基底だから、\(B\:'\) の元は \(A\) の元の1次結合で表現できる。つまり \(B\:'\) の \((m+1)\)個の元のすべては \(m\)個の元の1次結合で表されるから、[補題]によって \(B\:'\) は1次従属である。\(B\) は \(B\:'\) と同じものか、または \(B\:'\) に数個の元を付け加えたものだから、\(B\:'\) が1次従属なら \(B\) も1次従属である。しかし、\(B\) は線形空間 \(V\) の基底だから1次独立であり、矛盾が生じる。従って、\(m\geq n\) である。
もし仮に \(m > n\) だとしても、全く同様の考察により矛盾が生じる。従って、\(m\leq n\) である。この結果、\(m=n\) であることが証明できた。[証明終]
この基底の数の不変性の定理(33D)により、線形空間には次のように「次元」が定義できることになります。
次元
(次元の不変性:33E) |
線形空間の基底に含まれる元の数が有限個のとき、その個数を線形空間の次元と言う。次元は基底の取り方によらない。
線形空間の次元や基底と、代数拡大体を結びつけるのが次の定理です。
単拡大体の基底
(単拡大体の基底:33F) |
\(\bs{Q}\) 上の \(n\)次既約多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の解の一つを \(\al\) とする。単拡大体である \(\bs{Q}(\al)\) は \(\bs{Q}\) 上の \(n\)次元線形空間であり、\(\{1,\:\al,\:\al^2,\:\cd\:,\al^{n-1}\}\) は \(\bs{Q}(\al)\) の基底である。
[証明]
\(\bs{Q}(\al)\) の基底であるための条件は、
\(\{1,\:\al,\:\al^2,\:\cd\:,\al^{n-1}\}\) が1次独立である | |
\(\bs{Q}(\al)\) の任意の元が \(\{1,\:\al,\:\al^2,\:\cd\:,\al^{n-1}\}\) の1次結合で表される |
の2つである。② は単拡大の体の定理(32C)で証明されているので、① を証明する。多項式 \(g(x)\) を、
\(g(x)=a_0+a_1x+a_2x^2+\cd+a_{n-1}x^{n-1}\)
とおく。\(\{1,\:\al,\:\al^2,\:\cd\:,\al^{n-1}\}\) が1次独立であることを言うには、
\(g(\al)=0\) であれば \(a_i\:\:(0\leq i\leq n-1)\) は全て \(0\)
を言えばよい。以降、背理法を使って証明する。\(g(\al)=0\) で、\(a_i\:\:(0\leq i\leq n-1)\) のうち、少なくとも1つはゼロでないと仮定する。
\(g(x)\) が定数(つまり \(a_0\) の項のみ)のときは、\(g(\al)=0\) なら \(a_0=0\) なので、「少なくとも1つはゼロでない」に反する。そこで \(g(x)\) は1次以上の多項式であるとする。
そうすると、2つの方程式 \(f(x)=0\) と \(g(x)=0\) は共通の解 \(\al\) をもつことになる。しかし、\(f(x)\) は \(n\)次の既約多項式であり、\(g(x)\) は1次以上で \(n\)次未満の多項式である。既約多項式の定理2(31F)により、このような2つの方程式は共通の解を持たない。ゆえに矛盾が生じる。従って、\(g(\al)=0\) のとき \(a_i\:\:(0\leq i\leq n-1)\) は全て \(0\) であり、① が証明された。
基底の数が線形空間の次元であり、\(\bs{Q}(\al)\) は \(\bs{Q}\) 上の \(n\)次元線形空間である。[証明終]
もし、\(f(x)\) が\(n\)次多項式だとしたら(既約多項式を含む)、\(\bs{Q}(\al)\) の次元は \(n\)以下になります。\(f(x)=0\) の解の一つ、\(\al\) の最小多項式(31H)を \(m\)次多項式である \(g(x)\) とすると、\(g(x)\) は既約多項式であり(31I)、\(\al\) は \(f(x)=0\) と \(g(x)=0\) の共通の解なので、既約多項式の定理1(31E)により \(f(x)\) は \(g(x)\) で割り切れます。つまり、
\(f(x)=h(x)g(x)\)
と書けるので、
\(\mr{deg}\:f(x)\:\geq\:\mr{deg}\:g(x)\)
\(n\:\geq\:m\)
ですが、単拡大体の基底の定理(33F)により \(\bs{Q}(\al)\) の次元は \(m\) なので、\(n\)以下です。
拡大次数とその連鎖律
方程式の解になる数が代数的数で、\(\bs{Q}\) に代数的数を添加した体が代数拡大体です。「3.2 体」の「単拡大の体」でとりあげた \(\bs{Q}(\al)\) は代数拡大体であり、次元は \(n\) でした(32C)。この次元を「体の拡大」の視点で考えてみます。
「体 \(\bs{K}\) 上の線形空間 \(V\)」の定義において、\(\bs{K}=\bs{Q}\) とし \(V=\bs{Q}\) とすると、「有理数体 \(\bs{Q}\) は、\(\bs{Q}\) 上の線形空間」であると言えます。\(\bs{Q}\) では加算もスカラー倍(=乗算)も定義されていて、可換だからです。線形空間の定義にある各種の演算は、体の演算の一部です。
線形空間 \(\bs{Q}\) の基底は、\(0\) ではない \(\bs{Q}\) の元 \(v\) です。\(0\) を含む \(\bs{Q}\) の任意の元を \(a\) とすると、
\(av=0\:\:\:(v\neq0)\)
が成り立つのは \(a=0\) しかないので \(v\) は1次独立であり、また \(av\) で全ての \(\bs{Q}\) の元が表されるからです。一方、\(0\) は、
\(a\cdot0=0\)
が \(0\) ではない \(a\) について成り立つので1次従属です。以上から、線形空間 \(\bs{Q}\) の基底として \(1\) を選ぶことにします。次元は \(1\) です。
\(\bs{Q}\) に \(\sqrt{2}\) を添加した \(\bs{Q}(\sqrt{2})\) は \(\bs{Q}\) の代数拡大体で、\(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\) です。\(\bs{Q}(\sqrt{2})\) は \(\bs{\bs{Q}}\) 上の線形空間です。\(\bs{Q}(\sqrt{2})\) の基底としては、まず \(1\) を選ぶことができます。\(1\) を \(\bs{Q}\) の元でスカラー倍すると、\(\bs{Q}(\sqrt{2})\) の部分集合である \(\bs{Q}\) の元の全てが表せます。
\(\bs{Q}(\sqrt{2})\) の元の全てを表現するためには、さらに基底に \(\sqrt{2}\) を追加します。\(\sqrt{2}\) は \(\bs{Q}\) の元の1次結合では表せないので、\(1\) と \(\sqrt{2}\) は 1次独立です。\(1,\:\sqrt{2}\) が \(\bs{Q}(\sqrt{2})\) の基底で、次元は \(2\) です。
さらに \(\bs{Q}(\sqrt{2})\) に \(\sqrt{3}\) を添加した代数拡大体 \(\bs{Q}(\sqrt{2},\sqrt{3})\) を考えてみると、\(\bs{Q}(\sqrt{2},\sqrt{3})\) は \(\bs{\bs{Q}(\sqrt{2})}\) 上の線形空間であり、基底は \(1,\:\sqrt{3}\) です。\(1\) と \(\sqrt{3}\) は 1次独立であり、\(\bs{\bs{Q}(\sqrt{2},\sqrt{3})}\) の全ての元は、\(\bs{\bs{Q}(\sqrt{2})}\) の元を係数とする \(\bs{1}\) と \(\bs{\sqrt{3}}\) の1次結合で表現できるからです。\(\bs{\bs{Q}(\sqrt{2})}\) 上の線形空間 \(\bs{\bs{Q}(\sqrt{2},\sqrt{3})}\) の次元は \(\bs{2}\) です。
ここで \(\bs{Q}(\sqrt{2},\sqrt{3})\) を \(\bs{\bs{Q}}\) 上の線形空間と考えると、その基底はまず、\(1,\:\sqrt{2},\:\sqrt{3}\) ですが、これだけでは不足で、\(\sqrt{6}\) を加える必要があります。\(\sqrt{6}\) は体としての演算(乗算)でできる数ですが、\(1,\:\sqrt{2},\:\sqrt{3}\) の1次結合では表現できないからです。\(\bs{Q}\) 上の線形空間 \(\bs{Q}(\sqrt{2},\sqrt{3})\) の基底は \(1,\:\sqrt{2},\:\sqrt{3},\:\sqrt{6}\) であり、次元は \(4\) です。
ここまでの基底の表現はあくまで一例ですが、どういう基底を選ぼうと基底の数=次元は不変量であるというのが「次元の不変性」でした。以上の考察を踏まえて、拡大次数を定義し、拡大次数の連鎖律を証明します。
(拡大次数の定義:33G) |
代数拡大体 \(\bs{F},\:\bs{K}\) が \(\bs{F}\:\subset\:\bs{K}\) であるとき、\(\bs{K}\) は \(\bs{F}\) 上の線形空間である。\(\bs{K}\) の次元を、\(\bs{K}\)の(\(\bs{F}\)からの)拡大次数といい、
\([\:\bs{K}\::\:\bs{F}\:]\)
で表す。
(拡大次数の連鎖律:33H) |
代数拡大体 \(\bs{F},\:\bs{M},\:\bs{K}\) が \(\bs{F}\:\subset\:\bs{M}\:\subset\:\bs{K}\) であるとき、
\([\:\bs{K}\::\:\bs{F}\:]=[\:\bs{K}\::\:\bs{M}\:][\:\bs{M}\::\:\bs{F}\:]\)
が成り立つ。
[証明]
\([\:\bs{M}\::\:\bs{F}\:]=m\)、\([\:\bs{K}\::\:\bs{M}\:]=n\) とする。以下、表記を見やすくするため、\(m=3,\:n=2\) の場合で記述する。もちろん一般性を失わないように記述する。
\(\bs{F}\) 上の線形空間 \(\bs{M}\) の基底を
\(u_1,\:u_2,\:u_3\)
とすると、\(\bs{M}\) の任意の元 \(b\) は、
\(b=a_1u_1+a_2u_2+a_3u_3\:\:(a_i\in\bs{F},\:u_i\in\bs{M},\:1\leq i\leq m)\)
と表せる。
\(\bs{M}\) 上の線形空間 \(\bs{K}\) の基底を
\(v_1,\:v_2\)
とすると、\(\bs{K}\) の任意の元 \(x\) は、
\(x=b_1v_1+b_2v_2\:\:(b_j\in\bs{M},\:v_j\in\bs{K},\:1\leq j\leq n)\)
と表せる。\(b_1,\:b_2\) を \(\bs{M}\) の基底 \(u_1,u_2,u_3\) で表すと、
\(b_1=a_{11}u_1+a_{21}u_2+a_{31}u_3\)
\(b_2=a_{12}u_1+a_{22}u_2+a_{32}u_3\)
\((\:a_{ij}\in\bs{F}\:)\)
となるが、これを用いて \(x\) を表すと、
\(\begin{eqnarray}
&&\:\:x=&a_{11}u_1v_1+a_{21}u_2v_1+a_{31}u_3v_1+\\
&&&a_{12}u_1v_2+a_{22}u_2v_2+a_{32}u_3v_2\\
\end{eqnarray}\)
となる。つまり、\(\bs{K}\) の任意の元は \(\bs{F}\) の元を係数とする、\(u_1v_1\)、\(u_2v_1\)、\(u_3v_1\)、\(u_1v_2\)、\(u_2v_2\)、\(u_3v_2\) の1次結合で表現できる。
ここで \(x=0\) とすると、
\((a_{11}u_1+a_{21}u_2+a_{31}u_3)v_1+\)
\((a_{12}u_1+a_{22}u_2+a_{32}u_3)v_2=0\)
であるが、\(v_1,v_2\) は \(\bs{K}\) の基底なので1次独立であり、従って、
\(a_{11}u_1+a_{21}u_2+a_{31}u_3=0\)
\(a_{12}u_1+a_{22}u_2+a_{32}u_3=0\)
である。すると、\(u_1,u_2,u_3\) は \(\bs{M}\) の基底なので1次独立であり、
\(a_{11}=a_{21}=a_{31}=a_{12}=a_{22}=a_{32}=0\)
である。従って、\(u_iv_j\:\:(1\leq i\leq m,\:1\leq j\leq n)\) は1次独立である。
\(u_iv_j\:\:(1\leq i\leq m,\:1\leq j\leq n)\) の \(mn\) 個の元は、
1次独立 | |
\(\bs{F}\) の元を係数とする1次結合で \(\bs{K}\) の元のすべてを表せる |
\([\:\bs{K}\::\:\bs{F}\:]=[\:\bs{K}\::\:\bs{M}\:][\:\bs{M}\::\:\bs{F}\:]\)
である。[証明終]
体の一致
2つの代数拡大体 \(\bs{F}\) と \(\bs{K}\) の次元が一致するとします。たとえば \(\bs{Q}(\sqrt{2})\) と \(\bs{Q}(\sqrt{3})\) の次元はいずれも \(2\) です。もちろん \(\bs{Q}(\sqrt{2})\) と \(\bs{Q}(\sqrt{3})\) は体として別物です。
それでは、\(\bs{F}\subset\bs{K}\) という関係があり、かつ \(\bs{F}\) と \(\bs{K}\) の次元が一致するとき、\(\bs{F}\) と \(\bs{K}\) は体として一致すると言えるのでしょうか。
これはイエスで、それを次に証明します。この定理は、ガロア理論の証明の過程において、2つの体が実は同じものであることを言うときに使われる論法です。証明の都合上、\(\bs{F}\) ではなく \(\bs{K}_0\) と書きます。
(体の一致:33I) |
体 \(\bs{K}_0\) と 体 \(\bs{K}\) があり、\(\bs{K}_0\:\subset\:\bs{K}\) を満たしている。\(\bs{K}_0\) と \(\bs{K}\) が有限次元であり、その次元が同じであれば、\(\bs{K}_0=\bs{K}\) である。
[証明]
体 \(\bs{K}_0\) と \(\bs{K}\) を、\(\bs{Q}\) 上の線形空間と見なし、その次元を \(n\) とする。\(\bs{K}_0\) の基底を \(\{a_1,\:a_2,\:\cd\:,a_n\}\) とする。\(\bs{K}_0\) が \(\bs{K}\) の真部分集合である、つまり \(\bs{K}_0\:\subsetneq\:\bs{K}\) と仮定して、背理法で証明する。
\(\bs{K}_0\:\subsetneq\:\bs{K}\) だと、\(a_{n+1}\notin\bs{K}_0,\:a_{n+1}\in\bs{K}\) である元 \(a_{n+1}\) が存在する。この \(a_{n+1}\) は \(\{a_1,\:a_2,\:\cd\:,a_n\}\) の1次結合では表せない。なぜなら、もし表せたとしたら、\(\bs{K}_0\) の全ての元は基底である \(\{a_1,\:a_2,\:\cd\:,a_n\}\) の1次結合で表されるので \(a_{n+1}\in\bs{K}_0\) になってしまうからである。
そこで、\(\{a_1,\:a_2,\:\cd\:,a_n,\:a_{n+1}\}\) を考えると、この元の並びは1次独立である。なぜなら、もし1次従属だとすると、
\(a_1x_1+a_2x_2+\cd+a_nx_n+a_{n+1}x_{n+1}=0\)
となる \(x_i\in\bs{Q}\:\:(1\leq i\leq n+1)\) があって、そのうち少なくとも一つは \(0\) ではない。もし \(x_{n+1}\neq0\) だとすると、\(a_{n+1}\) が \(\{a_1,\:a_2,\:\cd\:,a_n\}\) の1次結合で表されることになり、\(a_{n+1}\in\bs{K}_0\) となって矛盾が生じる。また \(x_{n+1}=0\) だとすると、
\(a_1x_1+a_2x_2+\cd+a_nx_n=0\)
であるが、この場合は \(x_i\:\:(1\leq i\leq n)\) の中に少なくとも一つは \(0\) でないものがあることになり、\(\{a_1,\:a_2,\:\cd\:,a_n\}\) が基底である(=1次独立である)ことに矛盾する。従って \(\{a_1,\:a_2,\:\cd\:,a_n,\:a_{n+1}\}\) は1次独立である。
\(\{a_1,\:a_2,\:\cd\:,a_n,\:a_{n+1}\}\) の1次結合で表される全ての元の集合を \(\bs{K}_1\) とする。\(\{a_1,\:a_2,\:\cd\:,a_n,\:a_{n+1}\}\) はすべて \(\bs{K}\) の元であるから、\(\bs{K}_1\:\subset\:\bs{K}\) である。また \(\bs{K}_1\) の任意の元は1次独立である \(\{a_1,\:a_2,\:\cd\:,a_n,\:a_{n+1}\}\) の1次結合で表されるから、\(\{a_1,\:a_2,\:\cd\:,a_n,\:a_{n+1}\}\) は \(\bs{K}_1\) の基底であり、すなわち \(\bs{K}_1\) の次元は \(n+1\) である。\(\bs{K}_1=\bs{K}\) なら \(\bs{K}\) の次元が \(n+1\) になって矛盾するから、\(\bs{K}_1\neq\bs{K}\) つまり \(\bs{K}_1\:\subsetneq\:\bs{K}\) である。
以上の論理を繰り返すと \(\bs{K}_2\:\subsetneq\:\bs{K}\) である \(n+2\) 次元の \(\bs{K}_2\) の存在を示せるが、この操作は無限に繰り返えせるから、\(\bs{K}\) は無限個の基底をもつ無限次元の体となる。これは \(\bs{K}\) の次元が有限次元の \(n\) であることに矛盾する。従って背理法の仮定は誤りであり、\(\bs{K}_0\:=\:\bs{K}\) である。[証明終]
代数拡大体の構造
多項式と代数拡大体の相互関係をまとめると次のようになります。
体 \(\bs{Q}\) 上の\(\bs{n}\)次多項式 \(f(x)\) が(複素数の範囲で) \(f(x)=(x-\al_1)(x-\al_2)\cd(x-\al_n)\) と因数分解できるとき、 \(\bs{Q}(\al_1,\:\:\al_2,\:\:\cd\:\:,\:\:\al_n)\) を \(f(x)\) の最小分解体と言う(32A)。つまり、\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解のすべてを \(\bs{Q}\) に添加した体が最小分解体である。 | |
すべての代数拡大体は単拡大体である(32B)。従って最小分解体も単拡大体である。つまり原始元 \(\theta\) があって、\(\bs{Q}(\theta)\) と表せる。 | |
\(\theta\) の最小多項式を \(\bs{m}\)次多項式の \(g(x)\) とすると、\(g(x)\) は既約多項式である(31I)。 | |
方程式 \(g(x)=0\) の解の一つが \(\theta\) であるから、 \(1,\:\:\theta,\:\:\theta^2,\:\:\cd,\:\:\theta^{m-1}\) の \(m\)個の元は \(\bs{Q}(\theta)\) の基底である(33F)。つまり \(\bs{Q}(\theta)\) は \(m\)次元である。従って、\(\bs{Q}(\al_1,\:\al_2,\:\cd\:,\:\al_n)\) も \(m\)次元である。 |
以下、例をいくつかあげます。
\(x^4-5x^2+6\)
\(f(x)\) を4次多項式、
\(f(x)=x^4-5x^2+6\)
とします。\(f(x)\) は、
\(f(x)=(x^2-2)(x^2-3)\)
と因数分解できるので既約多項式ではありません。また、
\(f(x)=(x-\sqrt{2})(x+\sqrt{2})(x-\sqrt{3})(x+\sqrt{3})\)
なので、\(f(x)\) の最小分解体は、
\(\bs{Q}(\sqrt{2},\sqrt{3})\)
です。\(\bs{Q}(\sqrt{2},\:\sqrt{3})\) は、\(\bs{Q}\) 上の方程式 \(x^2-2=0\) の解 \(\sqrt{2}\) による拡大体を \(\bs{Q}(\sqrt{2})\) とし、\(\bs{Q}(\sqrt{2})\) 上の方程式 \(x^2-3=0\) の解 \(\sqrt{3}\) による拡大体が \(\bs{Q}(\sqrt{2},\:\sqrt{3})\) であると見なせます。つまり、
\(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\:\subset\:\bs{Q}(\sqrt{2},\sqrt{3})\)
です。拡大次数は
\([\:\bs{Q}(\sqrt{2}):\bs{Q}\:]=2\)
\([\:\bs{Q}(\sqrt{2},\sqrt{3}):\bs{Q}(\sqrt{2})\:]=2\)
\([\:\bs{Q}(\sqrt{2},\sqrt{3}):\bs{Q}\:]=4\)
です。\(\bs{Q}\) 上の線形空間 \(\bs{Q}(\sqrt{2},\sqrt{3})\) の基底は、
\(\begin{eqnarray}
&&\:\:B_1&=(\:1,\:\sqrt{2},\:1\cdot\sqrt{3},\:\sqrt{2}\cdot\sqrt{3}\:)\\
&&&=(\:1,\:\sqrt{2},\:\sqrt{3},\:\sqrt{6}\:)\\
\end{eqnarray}\)
とすることができます。
一方、
\(\theta=\sqrt{2}+\sqrt{3}\)
とおくと、
\(\bs{Q}(\theta)=\bs{Q}(\sqrt{2},\sqrt{3})\)
となります。なぜなら、
\(\sqrt{2}=\dfrac{1}{2}(\theta-\dfrac{1}{\theta})\)
\(\sqrt{3}=\dfrac{1}{2}(\theta+\dfrac{1}{\theta})\)
であり、\(\sqrt{2}\) と \(\sqrt{3}\) が \(\theta\) と有理数の加減乗除で表現できるからです。\(\bs{Q}(\sqrt{2},\sqrt{3})\) は \(\bs{Q}(\sqrt{2}+\sqrt{3})\) という単拡大体です。
\(\theta=\sqrt{2}+\sqrt{3}\) から根号を消去すると、
\(\theta^4-10\theta^2+1=0\)
となるので、\(\theta\)の最小多項式は、
\(g(x)=x^4-10x^2+1\)
であり、この \(g(x)\) は既約多項式です。\(y=x^2-5\) とおくと、
\(\begin{eqnarray}
&&\:\:g(x)&=y^2-24\\
&&&=(y-2\sqrt{6})(y+2\sqrt{6})\\
\end{eqnarray}\)
なので、
\(\begin{eqnarray}
&&\:\:g(x)&=&(x^2-5-2\sqrt{6})(x^2-5+2\sqrt{6})\\
&&&=&(x-\sqrt{2}-\sqrt{3})(x+\sqrt{2}-\sqrt{3})\cdot\\
&&&& (x-\sqrt{2}+\sqrt{3})(x+\sqrt{2}+\sqrt{3})\\
\end{eqnarray}\)
となり、\(g(x)=0\) の解は、\(\sqrt{2}+\sqrt{3}\)、\(-\sqrt{2}+\sqrt{3}\)、\(\sqrt{2}-\sqrt{3}\)、\(-\sqrt{2}-\sqrt{3}\) の4つです。その \(g(x)=0\) の解の一つが \(\theta=\sqrt{2}+\sqrt{3}\) なので、単拡大体の基底の定理(33F)を適用して、\(\bs{Q}(\theta)\) の基底を、
\(B_2=(\:1,\:\:\theta,\:\:\theta^2,\:\:\theta^3\:)\)
の4個に選ぶことができます。拡大次数は \([\:\bs{Q}(\theta):\bs{Q}\:]=4\) です。
\(B_1\) と \(B_2\) は、同じ体である \(\bs{Q}(\theta)=\bs{Q}(\sqrt{2},\sqrt{3})\) の基底なので、相互に1次結合で表現できます。\(B_2\) の1次結合で \(B_1\) を表現すると、
\(\sqrt{2}=\dfrac{1}{2}(\phantom{-}\theta^3-9\theta)\)
\(\sqrt{3}=\dfrac{1}{2}(-\theta^3+11\theta)\)
\(\sqrt{6}=\dfrac{1}{2}(\phantom{-}\theta^2-5)\)
となります。
\(x^3-2\)
\(f(x)\) を3次多項式、
\(f(x)=x^3-2\)
とします。これは既約多項式です。
\(x^3-1=0\) 解で \(1\) でないもの一つを \(\omega\) とします(= \(1\) の原始\(3\)乗根)。
\(x^3-1=(x-1)(x^2+x+1)\)
なので \(\omega\) は、
\(\omega^2+\omega+1=0\)
を満たします。この2次方程式の解は2つありますが、
\(\omega=\dfrac{-1+\sqrt{3}\:i}{2}\)
とします。方程式 \(x^3-2=0\) の解は、
\(\sqrt[3]{2},\:\:\sqrt[3]{2}\omega,\:\:\sqrt[3]{2}\omega^2\)
の3つです、従って、\(f(x)\) の最小分解体は、
\(\bs{Q}(\sqrt[3]{2},\:\sqrt[3]{2}\omega,\:\sqrt[3]{2}\omega^2)=\bs{Q}(\sqrt[3]{2},\:\omega)\)
です。これは、
\(\bs{Q}\:\subset\:\bs{Q}(\sqrt[3]{2})\:\subset\:\bs{Q}(\sqrt[3]{2},\:\omega)\)
という構造をしています。基底は、単拡大体の基底の定理(33F)を順次適用して、
\(\bs{Q}(\sqrt[3]{2})\) の基底(\(\bs{Q}\) 上の線形空間)
\(1,\:\sqrt[3]{2},\:(\sqrt[3]{2})^2\)
\(\bs{Q}(\sqrt[3]{2},\:\omega)\) の基底(\(\bs{Q}(\sqrt[3]{2})\) 上の線形空間\()\)
\(1,\:\omega\)
です。これらを総合すると、
\(\bs{Q}(\sqrt[3]{2},\:\omega)\) の基底(\(\bs{Q}\) 上の線形空間\()\)
\(1,\) | \(\sqrt[3]{2},\) | \((\sqrt[3]{2})^2,\) | |
\(\omega,\) | \(\sqrt[3]{2}\omega,\) | \((\sqrt[3]{2})^2\omega\) |
\([\:\bs{Q}(\sqrt[3]{2}):\bs{Q}\:]=3\)
\([\:\bs{Q}(\sqrt[3]{2},\:\omega):\bs{Q}(\sqrt[3]{2})\:]=2\)
\([\:\bs{Q}(\sqrt[3]{2},\:\omega):\bs{Q}\:]=6\)
となります。
\(\bs{Q}(\sqrt[3]{2},\:\omega)\) の原始元 \(\theta\) を、
\(\theta=\sqrt[3]{2}+\omega\)
と選ぶことができます。なぜなら、計算は省きますが、
\(\sqrt[3]{2}\) | \(=\dfrac{1}{9}(\) | \(2\theta^5+3\theta^4+6\theta^3-6\theta^2+9\theta\) | \(+18)\) | |
\(\omega\) | \(=\dfrac{1}{9}(-\) | \(2\theta^5-3\theta^4-6\theta^3+6\theta^2\) | \(-18)\) |
\(\theta=\sqrt[3]{2}+\dfrac{-1+\sqrt{3}\:i}{2}\)
の式を2乗や3乗して \(i\) と根号を消去すると、計算過程は省きますが、
\(\theta^6+3\theta^5+6\theta^4+3\theta^3+9\theta+9=0\)
となります。従って、\(\theta\) の最小多項式を \(g(x)\) とすると、
\(g(x)=x^6+3x^5+6x^4+3x^3+9x+9\)
という6次多項式です。\(\bs{Q}(\sqrt[3]{2},\:\omega)\) は 6次方程式 \(g(x)=0\) の根の一つである \(\theta\) を使って、
\(\bs{Q}(\sqrt[3]{2},\:\omega)=\bs{Q}(\theta)\)
という単拡大体(次元は \(6\))と表現できます。
\(x^3-3x+1\)
「1.3 ガロア群」の「ガロア群の例」で書いたように、\(x^3-3x+1=0\) の解を \(\al,\:\beta,\:\gamma\) とすると、
\(\beta=\al^2-2\)
\(\gamma=\beta^2-2\)
\(\al=\gamma^2-2\)
の関係があり、\(\al,\:\beta,\:\gamma\) のどれか一つの加減乗除で他の2つが表現できます。これにより、\(f(x)=x^3-3x+1\) の最小分解体は、
\(\bs{Q}(\al,\beta,\gamma)=\bs{Q}(\al)=\bs{Q}(\beta)=\bs{Q}(\gamma)\)
です。基底は、たとえば \(1,\:\al,\:\al^2\) であり、
\([\:\bs{Q}(\al,\beta,\gamma):\bs{Q}\:]=3\)
です。\(\al\) の最小多項式は、3次多項式である \(f(x)=x^3-3x+1\) です。
ちなみに、3次多項式の最小分解体の次元が \(3\) になる条件を書いておきます。まず、2次方程式の例ですが、
\(x^2+ax+b=0\)
の方程式の解を \(\al,\:\beta\) とすると、
\(x^2+ax+b=(x-\al)(x-\beta)\)
です。そうすると、根と係数の関係から、
\(a=-(\al+\beta)\)
\(b=\al\beta\)
です。ここで、判別式 \(\bs{D}\) を、
\(D=(\al-\beta)^2\)
と定義すると、
\(\begin{eqnarray}
&&\:\:D=&\al^2-2\al\beta+\beta^2\\
&&&=(\al+\beta)^2-4\al\beta\\
&&&=a^2-4b\\
\end{eqnarray}\)
となります。この判別式を使って解の状況がわかります。つまり、
\(\cdot D\:\geq\:0\) なら2つの実数解(重根は2と数える)
\(\cdot D\:\geq\:0\) で \(\sqrt{D}\) が有理数なら、2つの有理数解
をもちます。\(\cdot D\:\geq\:0\) で \(\sqrt{D}\) が有理数なら、2つの有理数解
以上を3次方程式に拡張できます。2乗の項がない既約な3次方程式を、
\(x^3+ax+b=0\)
とし、3つの根を \(\al,\:\beta,\:\gamma\) とすると、
\(x^3+ax+b=(x-\al)(x-\beta)(x-\gamma)\)
\((\br{A})\)
\(\al+\beta+\gamma=0\)
\(\al\beta+\beta\gamma+\gamma\al=a\) \((\br{B})\)
\(\al\beta\gamma=-b\)
となります。3次方程式の判別式 \(D\) は、
\(D=(\al-\beta)^2(\beta-\gamma)^2(\gamma-\al)^2\)
で定義されます。計算すると、
\(D=-4a^3-27b^2\)
となります。
ここで、\(D\) が、ある有理数 \(q\) の2乗の場合を考えます。つまり、
\(D=q^2\)
です。そうすると、
\(q=(\al-\beta)(\beta-\gamma)(\gamma-\al)\)
です(\(-q\) でも成り立ちますが割愛します)。 \((\br{C})\)
\((\br{A})\) 式の両辺を \(x\) で微分して \(x=\al\) を代入すると、
\(3\al^2+a=(\al-\beta)(\al-\gamma)\)
が得られます。\((\br{C})\) 式と \((\br{D})\) 式の両辺同士を割り算すると、 \((\br{D})\)
\(\dfrac{q}{3\al^2+a}=-(\beta-\gamma)\)
となります。そうすると、\((\br{B})\) 式と \((\br{E})\) 式を用いて、\(\beta\) と \(\gamma\) を \(\al\) の式として表現できます。その結果は、 \((\br{E})\)
\(\beta=\dfrac{2a\al+3b-q}{2(3\al^2+a)}\)
\(\gamma=\dfrac{2a\al+3b+q}{2(3\al^2+a)}\)
です。式の形はともかく、要するに、
\(\beta\) と \(\gamma\) が \(\al\) の加減乗除で表現できる
わけです。このことは、
\(\bs{Q}(\al,\beta,\gamma)=\bs{Q}(\al)\)
であることを意味します。\(\bs{Q}(\al,\beta,\gamma)\) は、既約な3次方程式の根の一つである \(\al\) の単拡大体なので、その次元は \(3\) です。
まとめると、判別式 \(D\) が有理数の2乗であるとき、既約 \(3\)次多項式の最小分解体の次元が \(3\) になります。\(x^3-3x+1\) の場合、\(a=-3,\:b=1\) なので、
\(D=-4a^3-27b^2=81=9^2\)
となり、次元が \(3\) です。
既約多項式ではない3次多項式の拡大次数はもっと小さくなります。たとえば \((x-1)(x^2+2)\) の最小分解体は \(\bs{Q}(\sqrt{2}\:i)\) であり、拡大次数は \(2\) です。また \((x-2)^3\) の最小分解体は \(\bs{Q}\) そのもので、拡大次数は \(1\) です。
まとめると、3次多項式 \(f(x)\) の最小分解体の拡大次数は、\(f(x)=0\) の解を \(\al,\:\beta,\:\gamma\) とすると、
\([\:\bs{Q}(\al,\beta,\gamma):\bs{Q}\:]\:=\:6,\:3,\:2,\:1\)
の4種あることになります(この4種しかないことの理由は後の章にあります)。
4.一般の群 |
ガロア理論の核心(第5章以降)に入る前の最後として、群についての各種の定義や定理を説明します。これらはいずれも第5章以降で必要になります。
4.1 部分群\(\cdot\)正規部分群、剰余類\(\cdot\)剰余群
部分集合の演算
以降の証明では集合の演算が多々出てきます。その定義は次の通りでです。これはあくまで群の "部分集合" に関するもので、それが部分群かどうかは別問題です。
(部分集合の演算:41A) |
群 \(G\) の2つの部分集合を \(H,\:N\) とする。\(H\) と \(N\) の演算結果である \(G\) の部分集合、\(HN\) を次の式で定義する。
\(HN\:=\:\{\:hn\:|\:h\in H,\:n\in N,\:hn\) は群の演算定義による \(\}\)
群 \(G\) の元の演算では結合則が成り立つから、部分集合の演算でも結合則が成り立つ。つまり \(H_1,\:H_2,\:H_3\) をを3つの部分群とすると、
\((H_1H_2)H_3=H_1(H_2H_3)\)
である。部分集合の元は \(1\)つでもよいから、\(x\) が \(G\) の元で \(x\) だけの部分集合を \(\{x\}\) とすると、
\(H_1(\{x\}H_2)=(H_1\{x\})H_2\)
である。これを、
\(H_1(xH_2)=(H_1x)H_2\)
と記述する。
部分群の定理
部分群に関する定理をいくつかあげます。これらはいずれも後の定理の証明の過程で使います。
部分群の十分条件
(部分群の十分条件:41B) |
群 \(G\) の部分集合を \(N\) とし、\(N\) の任意の2つの元を \(x,\:y\) とする。
\(xy\in N,\:x^{-1}\in N\)
なら、\(N\) は \(G\) の部分群である。
[証明]
\(N\) の元 \(x,\:y\) は \(G\) の元でもあるので、\(xy,\:x^{-1},\:y^{-1}\) は \(G\) の演算として定義されている。
\(y=x^{-1}\) とおくと \(xy=xx^{-1}=e\in N\) なので、\(N\) は単位元を含む。つまり、\(N\) は演算で閉じていて、単位元が存在し、逆元が \(N\) の元である。また結合則は \(G\) の元として成り立っている。従って \(N\) は \(G\) の部分群である。[証明終]
部分群の元の条件
(部分群の元の条件:41C) |
群 \(G\) の部分群を \(N\) とし、\(G\) の 元を \(x\) とすると、次の2つは同値である。
① \(xN\:=\:N\)
② \(x\:\in\:N\)
[証明]
[① \(\bs{\Rightarrow}\) ②]
\(N\) には \(G\) の単位元 \(e\) が含まれるから、\(xe\) は \(xN\) に含まれる。
\(x=xe\in xN=N\) \(\Rightarrow\) \(x\in N\)
である。
[② \(\bs{\Rightarrow}\) ①]
\(x\in N\) とし、\(N\) の任意の元を \(a\) とすると、\(N\) は群だから \(xa\in\:N\) である。\(N\) の異なる2つの元を \(a,\:b\:\:(a\neq b)\) とすると、\(xa\neq xb\) である。なぜなら、もし \(xa=xb\) だとすると、\(x\) の逆元 \(x^{-1}\) を左からかけて \(a=b\) となり、矛盾するからである。以上により、\(xH\) は \(H\) の全ての元を含むから \(xH=H\) である。[証明終]
部分群の共通部分
(部分群の共通部分は部分群:41D) |
\(G\) の部分群を \(H,\:N\) とすると、\(H\cap N\) は部分群である。
[証明]
\(G\) の部分群を \(H,\:N\) とし、\(H\cap N\) の任意の2つの元を \(x,\:y\) とすると、\(x,\:y\in H,\:\:x,\:y\in N\) なので、
\(xy\in H,\:x^{-1}\in H\)
\(xy\in N,\:x^{-1}\in N\)
であり、
\(xy\in H\cap N,\:x^{-1}\in H\cap N\)
となって、部分群の十分条件の定理(41B)により \(H\cap N\) は部分群である。[証明終]
剰余類
(剰余類の定義:41E) |
有限群 \(G\) の位数を \(n\) とし( \(|G|=n\) )、\(H\) を \(G\) の部分群とする。\(H\) に左から \(G\) のすべての元、\(g_1,\:g_2,\:\cd\:,\:g_n\) かけて、集合、
\(g_1H,\:g_2H,\:\cd\:,g_nH\)
を作る。
\(g_1H,\:g_2H,\:\cd\:,g_nH\) から、同じになる集合を集めたものを剰余類と呼ぶ。その同じになる集合から代表的なものを一つ取り出し、
\(xH\:\:(x\in G)\)
の形で剰余類を表す。\(g_1H,\:g_2H,\:\cd\:,g_nH\) から剰余類が \(d\) 個できたとし、それらを、
\(x_1H,\:x_2H,\:\cd\:,x_dH\)
とすると、
\(i\neq j\) のとき \(x_iH\:\cap\:x_jH=\phi\)
\(G=x_1H\:\cup\:x_2H\:\cup\:\cd\:\cup\:x_dH\)
である。剰余類は、群 \(G\) の元を部分群 \(H\) によって分類したものといえる。
\(x_1H,\:x_2H,\:\cd\:,x_dH\) を「左剰余類」という。同じことが \(G\) の元を右からかけたときにも成り立ち、\(Hx_1{}^{\prime},\:Hx_2{}^{\prime},\:\cd\:,Hx_d\,'\) を「右剰余類」という。
群 \(G\) の 部分群 \(H\) による剰余類の個数 \(d\) について、\(d\cdot|H|=|G|\) が成り立つ。この \(d\) を「\(G\) の \(H\) による指数」といい、\([\:G\::\:H\:]\) で表す。つまり、
\(|G|=[\:G\::\:H\:]\cdot|H|\)
である(ラグランジュの定理)。
[証明]
\(|G|=[\:G\::\:H\:]\cdot|H|\) であることを証明する。2つの剰余類 \(x_1H\) と \(x_2H\) が共通の元をもつとする。その共通な元が、\(x_1H\) では \(x_1h_i\)、\(x_2H\) では \(x_2h_j\) と表されているものとする。
\(x_1h_i=x_2h_j\)
左から \(x_2^{-1}\)、右から \(h_i^{-1}\) をかけると、
\(x_2^{-1}x_1h_ih_i^{-1}=x_2^{-1}x_2h_jh_i^{-1}\)
\(x_2^{-1}x_1=h_jh_i^{-1}\)
\(h_jh_i^{-1}\in H\) だから、
\(x_2^{-1}x_1\in H\)
を得る。部分群の元の条件の定理(41C)により、\(xH=H\) と \(x\in H\) は同値だから、
\(x_2^{-1}x_1H=H\)
となる。左から \(x_2\) をかけると、
\(x_1H=x_2H\)
を得る。これは、「2つの剰余類 \(x_1H\) と \(x_2H\) が共通の元をもつとすると、2つの剰余類は一致する」ことを示している。従って、
2つの剰余類 \(x_1H\) と \(x_2H\) は、\(x_1H=x_2H\) か \(x_1H\cap x_2H=\phi\) のどちらか
である。\(H\) は 単位元 \(e\) を含むから、
\(g_1H\:\cup\:g_2H\:\cup\:\cd\:\cup\:g_nH\)
という和集合を作ると、そこには \(G\) のすべての元が含まれる。従って、
\(G=g_1H\:\cup\:g_2H\:\cup\:\cd\:\cup\:g_nH\)
である。剰余類 \(x_1H,\:x_2H,\:\cd\:x_dH\) は、\(g_1H,\:g_2H,\:\cd\:,g_nH\) を整理・分類したものだから、
\(G=x_1H\:\cup\:x_2H\:\cup\:\cd\:\cup\:x_dH\)
である。この式の右辺の剰余類は共通の元がなく、それぞれの剰余類の元の数はすべて \(|H|\) だから、
\(|G|=d\cdot|H|\)
である。従ってラグランジュの定理、
\(|G|=[\:G\::\:H\:]\cdot|H|\)
が成り立つ。[証明終]
ラグランジュの定理から、
群 \(G\) の元 \(g\) の位数(\(g^x=e\) となる最小の \(x\))を \(n\) とすると、\(n\) は群位数 \(|G|\) の約数である。
ことがわかります。なぜなら、
\(H=\{e,\:g,\:g^2,\:\cd\:,\:g^{n-1}\}\)
とおくと、\(H\) は \(G\) の部分群(巡回群)になり、ラグランジュの定理によって \(|H|=n\) が \(|G|\) の約数になるからです。これは、位数の定理(25A)の[補題5]、
既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) の元を \(a\) とし、\(a\) の位数を \(d\) とすると、\(d\) は 群位数 の約数である。
の一般化になっています。 \((\bs{Z}/n\bs{Z})^{*}\) の群位数は \(\varphi(n)\)(\(\varphi\)はオイラー関数)なので、ラグランジュの定理はオイラーの定理やフェルマの小定理(25B)の一般化であるとも言えます。さらに、
群位数が素数の群は巡回群である。
こともわかります。なぜなら、群 \(G\) の位数を \(p\)(素数)とすると、単位元ではない \(G\) の任意の元 \(g\:(\neq e)\) の位数は \(p\) であり、つまり \(G\) は \(g\) を生成元とする位数 \(p\) の巡回群(\(C_p\))だからです。
次の「正規部分群」はガロア理論のキモといえる概念です。これは純粋に群の属性として定義できるのでここにあげますが、ガロア理論の核心である第5章以降で展開される論証の多くは正規部分群に関係しています。
正規部分群
(正規部分群の定義:41F) |
有限群 \(G\) の部分群を \(H\) とする。\(G\) の全ての元 \(g\) について、
\(gH=Hg\)
が成り立つとき、\(H\) を \(G\) の正規部分群(normal subgroup)という。正規部分群では左剰余類と右剰余類が一致する。
定義により、\(G\) および \(\{e\}\) は \(G\) の正規部分群である。また \(G\) が可換群であると、その部分群は正規部分群である。巡回群は可換群だから、巡回群の部分群は正規部分群である。
正規部分群 \(H\) の定義は、\(G\) の任意の元 \(g\) に対して、
\(gHg^{-1}=H\)
となる \(H\)、としても同じです。また 任意の \(h\in H\) について、
\(ghg^{-1}\in H\)
となる \(H\)、としても同じです。
剰余群
(剰余群の定義:41G) |
有限群 \(G\) の正規部分群を \(H\) とする。\(G\) の \(H\) による剰余類
\(x_1H,\:x_2H,\:\cd\:,x_dH\:\:(\:x_i\in G,\:d=[\:G\::\:H\:]\:)\)
は部分集合の演算の定義(41A)で群になる。この群を \(G\) の \(H\) による剰余群(quotient group)といい、\(G/H\) で表す。剰余群は商群とも言う。
[証明]
\(H\) が正規部分群のとき、剰余類が群になることを証明する。\(x_iH\) は \(G\) の剰余類なので、
\(G=x_1H\cup x_2H\cup\cd\cup x_dH\)
\((i\neq j\:のとき\:x_iH\cap x_jH=\phi)\)
と表されている。2つの剰余類、\(x_iH,\:x_jH\) の演算を行うと、
\(\begin{eqnarray}
&&\:\:(x_iH)(x_jH)&=x_iHx_jH=x_i(Hx_j)H\\
&&&=x_i(x_jH)H=x_ix_jHH\\
&&&=x_ix_j(HH)=x_ix_jH\\
\end{eqnarray}\)
つまり、
\(\begin{eqnarray}
&&\:\:(x_iH)(x_jH)&=x_ix_jH\\
\end{eqnarray}\)
となる。\(H\) は正規部分群なので \(Hx_j=x_jH\) であることと、\(H\) は部分群なので \(HH=H\) であることを用いた。
\(x_ix_j\) は \(G\) の元だから、\(x_ix_jH\) は \(G\) の剰余類のうちの一つである。従って \((x_iH)(x_jH)\) の演算は \(G\) の剰余類の中で閉じている。また、
\((x_iH\cdot x_jH)\cdot x_kH=x_ix_jH\cdot x_kH=x_ix_jx_kH\)
\(x_iH\cdot(x_jH\cdot x_kH)=x_iH\cdot x_jx_kH=x_ix_jx_kH\)
\((x_iH\cdot x_jH)\cdot x_kH=x_iH\cdot(x_jH\cdot x_kH)\)
であるから、結合法則が成り立っている。さらに、
\(H\cdot xh=eH\cdot xH=(ex)H=xH\)
\(xH\cdot H=xH\cdot eH=(xe)H=xH\)
なので、剰余類 \(H\) が単位元になる。また、
\(xH\cdot x^{-1}H=(xx^{-1})H=eH=H\)
\(x^{-1}H\cdot xH=(x^{-1}x)H=eH=H\)
であり、\(xH\) に対する逆元は \(x^{-1}H\) である。従って剰余類 \(G/H\) は群である。[証明終]
群の位数、元の位数、ラグランジュの定理、巡回群は、いずれも有限群の概念や定理です。しかし、剰余類、正規部分群、剰余群は、元の数が無限であっても成り立つ概念です。たとえば、整数の加法群 \(\bs{Z}\) は可換群なので、すべての部分群は正規部分群です。従って、\(n\) の倍数から成る部分群を \(n\bs{Z}\) とすると、\(\bs{Z}/n\bs{Z}\) は剰余群です。\(\bs{Z}/n\bs{Z}\) という表記は \(n\bs{Z}\) が \(\bs{Z}\) の正規部分群であることが暗黙の前提なのでした。
(巡回群の剰余群は巡回群:41H) |
巡回群の部分群による剰余群は巡回群である。
[証明]
群 \(G\) を、位数 \(n\)、生成元 \(g\) の巡回群とし、その元を、
\(G\:=\:\{g,\:g^2,\:g^3,\:\cd,\:g^n=e\:\}\)
とする。\(G\) の部分群を \(H\) とし、\(H\) の元のうち \(g\) の指数が一番小さいものを \(g^{d}\:\:(1\leq d\leq n)\) とする。\(d=1\) なら \(H=G\) であり、また \(d=n\) なら \(H=\{\:e\:\}\) である。
\(n\) を \(d\) で割った商を \(q\)、余りを \(r\) とする。つまり、
\(n=qd+r\:\:(1\leq q\leq n,\:0\leq r < d)\)
とする。\(g^d\) は \(H\) の元だから その \(q\) 乗も \(H\) の元であり、
\((g^d)^q=g^{dq}\in H\)
である。また \(g^{dq}\) の逆元も \(H\) に含まれるから
\((g^{dq})^{-1}\in H\)
である。仮にもし \(1\leq r < d\) なら
\(g^{dq}g^{r}=g^{qd+r}=g^n=e\)
となるので、この式に左から \((g^{dq})^{-1}\) をかけると、
\(g^r=(g^{dq})^{-1}\in H\)
となり、\(d\) 未満の数 \(r\) が指数の \(g^r\) が \(H\) の元ということになるが、これは \(d\) が最小の指数であるという仮定に反する。従って \(r=0\) であり、\(qd=n\) である。つまり \(d\) と \(q\) は \(n\) の約数である。そうすると \(g^d\) を \(q\) 乗すると \(g^{dq}=g^n=e\) となるので、\(H\) は \(g^d\) を生成元とする位数 \(q\) の巡回群、
\(H=\{\:g^{d},\:g^{2d},\:\cd,\:g^{qd}=g^n=e\:\}\)
である。また、\(G\) は巡回群、つまり可換群だから、その部分群である \(H\) は \(G\) の正規部分群である。 \((\br{A})\)
次に、剰余類 \(g^kH\:\:(1\leq k\leq n)\) を考える。\(k\) を \(d\) で割った商を \(m\)、余りを \(i\) とする。\(qd=n\) なので \(m\) の最大値は \(q\) であり、
\(k=md+i\) \((0\leq m\leq q,\:0\leq i < d)\)
と表現できる。以下、\(m,\:i\) の値によって3つに分ける。
\(k=i\:\:(m=0,\:1\leq i < d)\) のときは、\(H\) が単位元を含んでいるので、
\(g^k=g^i\in g^iH\)
である。
\(m\neq0,\:1\leq i < d\) のときは、
\(g^k=g^{md+i}=g^ig^{md}\)
となるが、\((\br{A})\) 式により、
\(g^{md}\in H\:\:(1\leq m\leq q)\)
なので、
\(g^ig^{md}\in g^iH\)
\(g^k\in g^iH\:\:(1\leq i < d)\)
となる。
また、\(m\neq0,\:i=0\) のときは、
\(g^k=g^{md}\in H\)
である。
結局、\(G\) の元 \(g^k\) は、\(\{\:H,\:g^iH\:\:(1\leq i < d)\:\}\) のどれかに含まれる。ここで、形式上 \(g^0H\:=\:H\) と定義すると、\(H,\:g^iH\) は、
\(g^iH\:=\:\{\:g^{i+md}\:|\:0\leq i < d,\:\:0\leq m\leq q\:\}\)
と表記できる。\(0\leq i,j < d,\:\:0\leq m_i,m_j\leq q\) で、\(i\neq j\) なら、
\(i+m_id\neq j+m_jd\)
なので、\(g^iH\) と \(g^jH\) に共通の元はなく、
\(g^iH\:\cap\:g^jH=\phi\:\:(i\neq j)\)
である。
以上より、巡回群 \(G\) は剰余類によって、
\(G=H\:\cup\:gH\:\cup\:g^2H\:\cup\:\cd\:\cup\:g^{d-1}\)
\(g^iH\:\cap\:g^jH=\phi\) \((i\neq j)\)
と分解できる。
\(H\) は \(G\) の正規部分群であった。従って \(G\) の \(H\) による剰余類は剰余群になり、
\(G/H=\{\:H,\:gH,\:g^2H,\:\cd\:,g^{d-1}H\:\}\)
である。ここで \(gH\) の累乗を調べると、
\((gH)^2=gHgH=ggHH=g^2H\)
\((gH)^3=gHgHgH=g^2HgH=g^2gHH=g^3H\)
のように計算でき、
\((gH)^i=g^iH\) \((1\leq i\leq d-1)\)
である。また、同じ計算によって、
\((gH)^d=g^dH\)
となるが、\(g^d\in H\) なので部分群の元の条件の定理(41C)により \(g^dH=H\) であり、つまり、
\((gH)^d=H\)
である。
以上により 剰余群 \(G/H\) は、
\(G/H=\{gH,\:(gH)^2,\:\cd\:,(gH)^{d-1},\:(gH)^{d}=H\}\)
と表され、生成元が \(gH\)、単位元が \(H\)、位数が \(d\) の巡回群である。[証明終]
部分群と正規部分群
(部分群と正規部分群:41I) |
\(G\) の正規部分群を \(H\)、部分群を \(N\) とする。このとき、
(a) \(NH\) は \(G\) の部分群である。
(b) \(G\:\sp\:N\:\sp\:H\) なら、\(H\) は \(N\) の正規部分群である。
(c) \(N\cap H\) は \(N\) の正規部分群である。
(b) \(G\:\sp\:N\:\sp\:H\) なら、\(H\) は \(N\) の正規部分群である。
(c) \(N\cap H\) は \(N\) の正規部分群である。
が成り立つ。
(a) の証明
\(G\) の正規部分群を \(H\)、 部分群を \(N\) とするとき、\(NH\) は部分群である。
\(NH\) の任意の2つの元を
\(nx\:\:(n\in N,\:x\in H),\:\:my\:\:(m\in N,\:y\in H)\)
とすると、
\(nx\in nH,\:my\in mH\)
である。\(H\) は正規部分群だから、\(mH=Hm\) であることを用いると、
\((nx)(my)\in(nH)(mH)=nHmH=nmHH=nmH\)
となる。\(n,m\in N\) なので \(nm\in N\) であり、従って \(nmH\subset NH\) である。結局、
\((nx)(my)\in NH\)
となって、\(NH\) の2つの元の演算は \(NH\) で閉じていることが分かる(=\(\:\br{①}\:\))。
また一般に、\((xy)^{-1}=y^{-1}x^{-1}\) である。なぜなら、
\(xy(y^{-1}x^{-1})=x(yy^{-1})x^{-1}=xex^{-1}=xx^{-1}=e\)
\((y^{-1}x^{-1})xy=y^{-1}(x^{-1}x)y=y^{-1}ey=y^{-1}y=e\)
が成り立つからである。
\(G\) の部分群 \(N\) と正規部分群 \(H\) において、\(n\in N,\:x\in H\) とすると、\(n^{-1}\in N,\:x^{-1}\in H\) なので、
\((nx)^{-1}=x^{-1}n^{-1}\in Hn^{-1}\)
となるが、\(H\) が正規部分群なので、\(Hn^{-1}=n^{-1}H\)である。さらに、\(n^{-1}H\subset NH\) なので、結局、
\((nx)^{-1}\subset NH\)
となり、\(NH\) の任意の元 \(nx\) について逆元 \((nx)^{-1}\) が \(NH\) に含まれる(=\(\:\br{②}\:\))。
\(\br{①}\:\:\br{②}\) が成り立つので、部分群の十分条件の定理(41B)によって \(NH\) は \(G\) の部分群である。[証明終]
(b) の証明
\(G\) の正規部分群を \(H\)、部分群を \(N\) とするとき、\(G\:\sp\:N\:\sp\:H\) なら、\(H\) は \(N\) の正規部分群である。
\(H\) は \(G\) の正規部分群だから、\(G\) の任意の元 \(x\) について
\(xH=Hx\)
が成り立つ。\(N\) は \(G\) の 部分集合だから、\(N\) の任意の元 \(y\) についても、
\(yH=Hy\)
が成り立つ。従って \(H\) は \(N\) の正規部分群である。[証明終]
(c) の証明
\(G\) の正規部分群を \(H\)、 部分群を \(N\) とするとき、\(N\cap H\) は \(N\) の正規部分群である。
\(H\) は \(G\) の正規部分群だから、\(G\) の任意の元 \(x\) について
\(xH=Hx\)
が成り立つ。この式に右から \(x^{-1}\) をかけると、
\(xHx^{-1}=H\)
となる。これは、\(H\) の任意の元 \(h\) を決めると、\(G\) の任意の元 \(x\) について、
\(xhx^{-1}\in H\)
となることを意味する。これは \(H\) が正規部分群であることの定義と等価である。以降、この形で \(N\cap H\) が正規部分群であることを証明する。
部分群 \(N\) の任意の元を \(y\)、正規部分群 \(H\) の任意の元を \(h\)、\(N\cap H\) の任意の元を \(n\) とする。\(y,\:y^{-1},\:n\) は全て \(N\) の元だから、
\(yny^{-1}\in N\)
である(=\(\:\br{①}\:\))。また \(H\) は \(G\) の正規部分群であるから、\(G\) の任意の元 \(x\) について、
\(xhx^{-1}\in H\)
が成り立つ。ここで、\(G\:\sp\:N\) なので \(x=y\) とおくことができ、また \(H\:\sp\:N\cap H\) なので \(h=n\) とおくこともできる。従って、
\(yny^{-1}\in H\)
である(=\(\:\br{②}\:\))。\(\br{①}\:\:\br{②}\) より、\(N\cap H\) の任意の元 \(n\) を決めると、\(N\) の全ての元 \(y\) について、
\(yny^{-1}\in N\cap H\)
となる。つまり \(N\cap H\) は \(N\) の正規部分群である。[証明終]
4.2 準同型写像
この節の写像の説明には「全射」「単射」「全単射」などの用語ができてます。その用語の意味は次の図の通りです。
![]() |
全射:\(G\,'\)の任意の元 \(y\) について \(f(x)=y\) となる \(x\in G\) がある。 単射:\(x\neq y\:(x,y\in G)\) なら \(f(x)\neq f(y)\)。 全単射:全射かつ単射。 |
準同型写像と同型写像
(準同型写像と同型写像:42A) |
群 \(G\) から群 \(G\,'\) への写像 \(f\) がある。\(G\) の任意の2つの元、\(x,\:y\) について、
\(f(xy)=f(x)f(y)\)
が成り立つとき、\(f\) を \(G\) から \(G\,'\) への準同型写像(homomorphism)という。右辺は群 \(G\,'\) の演算定義に従う。
また、\(f\) が全単射写像のとき、\(f\) を同型写像(isomorphism)という。群 \(G\) から \(G\,'\) への同型写像が存在するとき、\(G\) と \(G\,'\) は同型であるといい、
\(G\:\cong\:G\,'\)
で表す。
準同型写像の像と核
(準同型写像の像と核:42B) |
群 \(G\) から群 \(G\,'\) への準同型写像 \(f\) がある。\(G\) の元を \(f\) で移した元の集合を「\(f\) の像(image)」といい、\(\mr{Im}\:f\) と書く。\(\mr{Im}\:f\) を \(f(G)\) と書くこともある。
\(\mr{Im}\:f\) は \(G\,'\) の部分群である。
\(G\) の単位元を \(e\)、\(G\,'\) の単位元を \(e\,'\) とする。準同型写像 \(f\) によって \(e\,'\) に移る \(G\) の元の集合を「\(f\) の核(kernel)」といい、\(\mr{Ker}\:f\) と書く。
\(\mr{Ker}\:f\) は \(G\) の部分群である。
![]() |
[証明]
\(\mr{Im}\:f\) と \(\mr{Ker}\:f\) が群であることを証明する。
\(\mr{Im}\:f\) は群
\(\mr{Im}\:f\) の任意の2つの元を \(f(x),f(y)\:\:(x,y\in G)\) とすると、
\(f(x)f(y)=f(xy)\:\in\mr{Im}\:f\)
である(=\(\:\br{①}\:\))。
\(\mr{Im}\:f\) の任意の元 \(f(x)\) について、
\(f(e)f(x)=f(ex)=f(x)\)
\(f(x)f(e)=f(xe)=f(x)\)
なので、
\(f(e)=e\,'\)
である。\(G\) は群なので、任意の元 \(x\) について逆元 \(x^{-1}\) が存在する。
\(f(x)f(x^{-1})=f(xx^{-1})=f(e)=e\,'\)
\(f(x^{-1})f(x)=f(x^{-1}x)=f(e)=e\,'\)
であるから、
\(f(x)^{-1}=f(x^{-1})\:\in\mr{Im}\:f\)
である(=\(\:\br{②}\:\))。\(\br{①}\:\:\br{②}\) より、部分群の十分条件の定理(41B)によって \(\mr{Im}\:f\) は \(G\,'\) の部分群である。
\(\mr{Ker}\:f\) は群
\(\mr{Ker}\:f\) の任意の元を \(x,\:y\) とすると、
\(f(xy)=f(x)f(y)=e\,'e\,'=e\,'\)
なので、
\(xy\:\in\mr{Ker}\:f\)
である(\(\:\br{③}\:\))。
また \(x\) は \(G\) の元だから \(x^{-1}\) が定義されている。
\(\begin{eqnarray}
&&\:\:f(x^{-1})&=f(x^{-1})e\,'=f(x^{-1})f(x)\\
&&&=f(x^{-1}x)=f(e)\\
&&&=e\,'\\
\end{eqnarray}\)
となるので、
\(x^{-1}\:\in\mr{Ker}\:f\)
である(\(\:\br{④}\:\))。\(\br{③}\:\:\br{④}\) より、部分群の十分条件の定理(41B)によって \(\mr{Ker}\:f\) は \(G\) の部分群である。[証明終]
核が単位元なら単射
(核が単位元なら単射:42C) |
群 \(G\) から群 \(G\,'\) への準同型写像 \(f\) がある。このとき
\(\mr{Im}\:f\) | \(=\:G\,'\) | なら \(f\) は全射 | |
\(\mr{Ker}\:f\) | \(=\:\{e\}\) | なら \(f\) は単射 |
である。
[証明]
"\(f\) は全射" については、全射の定義そのものである。
\(\mr{Ker}\:f\:=\:\{e\}\) とし、\(G\) の任意の2つの元を \(x,\:y\) とする。ここで、
\(f(x)=f(y)\)
であったとする。\(\mr{Im}\:f\) は群だから \(f(y)^{-1}\in\:\mr{Im}\:f\) である。上の式に左から \(f(y)^{-1}\) をかけると、
\(f(y)^{-1}f(x)=f(y)^{-1}f(y)\)
\(f(y^{-1})f(x)=e\,'\)
\(f(y^{-1}x)\in\:\mr{Ker}\:f\)
\(y^{-1}x=e\)
\(x=y\)
となる。\(f(x)=f(y)\) であれば \(x=y\) なので、\(f\) は単射である。[証明終]
核は正規部分群
(核は正規部分群:42D) |
群 \(G\) から群 \(G\,'\) への準同型写像を \(f\) とする。このとき \(\mr{Ker}\:f\) は \(G\) の正規部分群である。
[証明]
\(\mr{Ker}\:f\) を \(H\) と記述する。\(G\) の 任意の元を \(x\) とし、\(H\) の任意の元を \(y\) とする。すると、
\(\begin{eqnarray}
&&\:\:f(xyx^{-1})&=f(x)f(y)f(x^{-1})\\
&&&=f(x)e\,'f(x^{-1})=f(x)f(x^{-1})\\
&&&=f(xx^{-1})=f(e)=e\,'\\
\end{eqnarray}\)
と計算できるから、
\(xyx^{-1}\in H\)
である。\(y\) は \(H\) の任意の元だから、
\(xHx^{-1}\subset H\)
である。\(x\) は任意にとることができるので、\(x\) を \(x^{-1}\) に置き換えると、
\(x^{-1}Hx\subset H\)
を得る。この式に左から \(x\)、右から \(x^{-1}\) をかけると、
\(H\subset xHx^{-1}\)
となる。つまり
\(H\subset xHx^{-1}\subset H\)
\(xHx^{-1}=H\)
である。さらに右から \(x\) をかけると、
\(xH=Hx\)
となり、\(x\) は任意の \(G\) の元だから、\(H\:\:(=\mr{Ker}\:f)\) は \(G\) の正規部分群である。[証明終]
4.3 同型定理
準同型定理=第1同型定理
(準同型定理:43A) |
群 \(G\) から群 \(G\,'\) への準同型写像 \(f\) がある。\(H=\mr{Ker}\:f\) とすると、\(G\) の \(H\) による剰余群は、\(G\) の \(f\) による像と同型である。つまり、
\(G/H\:\cong\:\mr{Im}\:f\)
が成り立つ。
[証明]
\(H\:=\:\mr{Ker}\:f\) は、核は正規部分群の定理(42D)により、\(G\) の正規部分群である。従って剰余群 \(G/H\) が定義できる。\(G/H\) から \(\mr{Im}\:f\) への写像 \(\sg\) を、
\(\begin{eqnarray}
&&\:\:\sg\:: &G/H &\longrightarrow&\mr{Im}\:f\\
&&&xH &\longmapsto&f(x)\\
\end{eqnarray}\)
と定義する。まず、この写像が剰余類 \(xN\) の代表元 \(x\) のとりかたに依存しないこと、つまり \(xH=yH\) なら \(f(x)=f(y)\) であることを示す。\(xH=yH\) を変形すると、
\(xH=yH\)
\(y^{-1}xH=y^{-1}yH\)
\(y^{-1}xH=H\)
ゆえに部分群の元の条件の定理(41C)から \(y^{-1}x\in H\) である。そうすると、\(H\) は \(\mr{Ker}\:f\) のことだから、\(f(y^{-1}x)=e\,'\) である。これを変形すると、
\(f(y^{-1}x)=e\,'\)
\(f(y^{-1})f(x)=e\,'\)
\(f(y)^{-1}f(x)=e\,'\)
となる。最後の変形では、準同型写像の像と核の定理(42B)の「\(\mr{Im}\:f\) は群」の証明から、\(f(y^{-1})=f(y)^{-1}\) であることを用いた。ここから、
\(f(y)^{-1}f(x)=e\,'\)
\(f(y)f(y)^{-1}f(x)=f(y)e\,'\)
\(f(x)=f(y)\)
となり、\(f(x)=f(y)\) が証明できた。
以上の変形は逆も辿れる。つまり、
\(f(x)=f(y)\)
\(f(y)f(y)^{-1}f(x)=f(y)e\,'\)
\(f(y)^{-1}f(x)=e\,'\)
\(f(y^{-1})f(x)=e\,'\)
\(f(y^{-1}x)=e\,'\)
\(f(y^{-1}x)\in H\)
\(y^{-1}xH=H\)
\(xH=yH\)
となる。これは \(f(x)=f(y)\) なら \(xH=yH\) であることを示していて、すなわち \(\sg\) は単射である。と同時に、\(\sg\) による写像の先は \(\mr{Im}\:f\) に限定しているので \(\sg\) は全射である。つまり \(\sg\) は 全単射である(=\(\:\br{①}\:\))。
さらに、
\(\begin{eqnarray}
&&\:\:\sg((xH)(yH))&=\sg(x(Hy)H)=\sg(x(yH)H)\\
&&&=\sg(xyH)=f(xy)=f(x)f(y)\\
&&&=\sg(xH)\sg(yH)\\
\end{eqnarray}\)
であり、つまり \(\sg((xH)(yH))=\sg(xH)\sg(yH)\) が成り立っている(=\(\:\br{②}\:\))。
\(\br{①}\:\:\br{②}\) により \(\sg\) は同型写像である。\(G/H\) から \(\mr{Im}\:f\) への同型写像が存在するから、
\(G/H\:\cong\:\mr{Im}\:f\)
である。[証明終]
第2同型定理
(第2同型定理:43B) |
群 \(G\) の正規部分群を \(H\)、部分群を \(N\) とすると、
\(N/(N\cap H)\:\cong\:NH/H\)
が成り立つ。
![]() |
[証明]
まず、部分群と正規部分群の定理(41I)により、\(G\) の正規部分群が \(H\)、部分群が \(N\) の場合、
\(N\cap H\) は \(N\) の正規部分群 | |
\(NH\) は \(G\) の部分群 | |
\(G\:\sp\:NH\:\sp\:H\) なので、\(H\) は \(NH\) の正規部分群 |
\(G\) の任意の元を \(x,\:y\) とし、\(G\) から \(G/H\) への写像 \(\sg\) を、
\(\begin{eqnarray}
&&\:\:\sg\:: &G &\longrightarrow&G/H\\
&&&x &\longmapsto&xH\\
\end{eqnarray}\)
と定義する。この写像は、
\(\begin{eqnarray}
&&\:\:\sg(xy)&=xyH=xyHH=xHyH=(xH)(yH)\\
&&&=\sg(x)\sg(y)\\
\end{eqnarray}\)
を満たすから準同型写像である(ちなみに \(G\) とその正規部分群 \(H\) があるとき、上記の定義による \(\sg\) を自然準同型と呼ぶ)。
\(\sg\) の定義域は \(G\) であるが、\(\sg\) の定義域を \(G\) の部分群である \(N\) に制限した写像 \(\tau\)(タウ) を考える。\(N\) の任意の元を \(z\) とすると、
\(\begin{eqnarray}
&&\:\:\tau\:: &N &\longrightarrow&G/H\\
&&&z &\longmapsto&zH\\
\end{eqnarray}\)
である。この \(\tau\) の像 \(\mr{Im}\:\tau\) を考えてみると、\(z\) が \(N\) の元のすべてを動くとき、\(\tau(z)=zH\) として出てくる \(G\) の元は \(NH\) の元である。つまり \(\tau\) は、
\(\begin{eqnarray}
&&\:\:\tau\:: &N &\longrightarrow&G/H\\
\end{eqnarray}\)
として定義したが、\(\tau(z)\) が \(G/H\) の全てを尽くすわけではなく、全射ではない。写像による移り先は、\(G\) の部分群 \(NH\) を \(H\) で分類した剰余群、\(NH/H\) である。つまり \(\tau(N)=NH/H\) であり、
\(\mr{Im}\:\tau=NH/H\)
である。
次に準同型写像の核を考える。\(G/H\) の単位元は、
\(xH\cdot H=xH\)
\(H\cdot xH=HxH=xHH=xH\)
なので、\(H\) である。
\(G\) の元 \(x\) が \(\mr{Ker}\:\sg\) の元とする。つまり、
\(x\in\mr{Ker}\:\sg\)
とする。これは \(\sg(x)\) が \(G/H\) の単位元になるということだから、
\(\sg(x)=H\)
であり、\(\sg(x)=xH\) なので、
\(xH=H\)
である。これは部分群の元の条件の定理(41C)によって、
\(x\in H\)
と同値である。従って、
\(x\in\mr{Ker}\:\sg\)
\(x\in H\)
の2つは同値であり、つまり、
\(\mr{Ker}\:\sg=H\)
である。
\(\tau\) は \(\sg\) の定義域を \(N\) に制限したものなので、\(\mr{Ker}\:\tau\) は「\(\mr{Ker}\:\sg=H\) のうちで \(N\) に含まれるもの」であり、すなわち、
\(\mr{Ker}\:\tau=(N\cap H)\)
である。
ここで、\(\tau\) の定義である、
\(\begin{eqnarray}
&&\:\:\tau\:: &N &\longrightarrow&G/H\\
\end{eqnarray}\)
に準同型定理(43A)を適用すると、
\(\begin{eqnarray}
&&\:\:N/(\mr{Ker}\:\tau) &\cong\:\mr{Im}\:\tau\\
&&\:\:N/(N\cap H) &\cong\:NH/H\\
\end{eqnarray}\)
となって、題意が成り立つ。[証明終]
第2同型定理を整数の剰余群で確認してみます。上の定理における \(G,\:H,\:N\) を、
\(G=\bs{Z}\)
\(H=10\bs{Z}\) (\(10\) の倍数)
\(N=\phantom{1}6\bs{Z}\) (\(\phantom{1}6\) の倍数)
の群とします。この群の演算は加算であり、可換群なので、\(\bs{Z}\) の部分群はすべて正規部分群です。
\(N\cap H\) は「\(10\) の倍数、かつ \(6\) の倍数」の集合なので、
\(N\cap H=30\bs{Z}\)
です。また \(NH\) は、\(10\) の倍数と\(6\) の倍数の加算の結果の集合です。つまり、
\(NH=\{\:10x+6y\:|\:x,y\in\bs{Z}\:\}\)
ですが、これが何を意味するかは不定方程式の解の存在の定理(21B)から分かります。定理を再掲すると、
2変数 \(x,\:y\) の1次不定方程式を、
\(ax+by=c\)
(\(a,\:b,\:c\) は整数。\(a\neq0,\:b\neq0\))
とし、\(a\) と \(b\) の最大公約数を \(d\) とする。このとき、
\(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。
です。\(c=kd\) なら、式を満たす \(x,\:y\) が必ず存在します。また任意の \(x,\:y\) について \(ax+by\) を計算すると、その結果の \(c\) は必ず \(c=kd\) の形になります。そうでなければ、\(c\) が最大公約数の倍数でないにも関わらず不定方程式が解をもつことになって定理に矛盾します。従って、\(ax+by=c\) の \(x,\:y\) を任意の整数とすると、\(c\) は \(a,\:b\) の "最大公約数の整数倍のすべて" になります。
\(NH=\{\:10x+6y\:|\:x,y\in\bs{Z}\:\}\)
とした場合、\(10\) と \(6\) の最大公約数は \(2\) なので、
\(NH=2\bs{Z}\)
です。この結果、
\(N/(N\cap H)\)
\(=6\bs{Z}/30\bs{Z}\)
\(=\{30\bs{Z},\:6+30\bs{Z},\:12+30\bs{Z},\:18+30\bs{Z},\:24+30\bs{Z}\}\)
\(NH/H\)
\(=2\bs{Z}/10\bs{Z}\)
\(=\{10\bs{Z},\:2+10\bs{Z},\:4+10\bs{Z},\:6+10\bs{Z},\:4+10\bs{Z}\}\)
となります。この2つの剰余群は位数 \(5\) の巡回群( \(C_5\) )で、\(\bs{Z}/5\bs{Z}\) に同型です。つまり、
\(N/(N\cap H)\) | \(\cong\:\bs{Z}/5\bs{Z}\) | |
\(NH/H\) | \(\cong\:\bs{Z}/5\bs{Z}\) |
\(N/(N\cap H)\:\cong\:NH/H\)
となって、第2同型定理が確認できました。
![]() |
第2同型定理 : \(\bs{6\bs{Z}/30\bs{Z}\:\cong\:2\bs{Z}/10\bs{Z}}\) |
この図をみると、\(NH/H=2\bs{Z}/10\bs{Z}\) と \(N/(N\cap H)=6\bs{Z}/30\bs{Z}\) が同型であることがヴィジュアルにイメージできる。両方とも位数 \(5\) の巡回群である。 |
第2同型定理を数式で書くと何だか難しそうな感じがしますが、図にするといかにも自明なことという気がします。数学におけるイメージ図の威力が実感できます。
第2同型定理は、後ほど「可解群の部分群は可解群」という定理の証明に使います。「可解群の部分群は可解群」の定理は、5次方程式に可解でないものがあることを証明する際に鍵となる定理です。その第2同型定理は準同型定理を使って証明される、という構造になっているのでした。
5.ガロア群とガロア対応 |
2章から4章までは、多項式、体、線形空間、剰余類、群、剰余群、既約剰余類群、正規部分群といった、ガロア理論の基礎となる概念の説明でした。この第5章から、理論の核心に入っていきます。
5.1 体の同型写像
同型写像の定義
(体の同型写像:51A) |
体 \(\bs{K}\) から 体 \(\bs{F}\) への写像 \(f\) が全単射であり、\(\bs{K}\) の任意の元、\(x,\:y\) に対して、
\(\begin{eqnarray}
&&\:\:f(x+y)&=f(x)+f(y)\\
&&\:\:f(xy)&=f(x)f(y)\\
\end{eqnarray}\)
が成り立つとき、\(f\) を体の同型写像という。この定義による同型写像は、加法と乗法のみならず、四則演算を保存する。
特に、\(\bs{K}\) から \(\bs{K}\) への同型写像を自己同型写像という。
\(\bs{K}\) から \(\bs{F}\) への同型写像が存在するとき、体 \(\bs{K}\) と 体 \(\bs{F}\) は同型であるといい、\(\bs{K}\:\cong\:\bs{F}\) で表す。
体 \(\bs{K}\) と \(\bs{F}\) がともに \(\bs{Q}\) を含むとき、\(a\in\bs{Q}\) に対して、
\(f(a)=a\)
である。つまり有理数は同型写像で不変である。
[証明]
上の定義による同型写像が、減法と除法を保存することを証明する。\(\bs{K}\) と \(\bs{F}\) は体だから、加法と乗法について群になっている。\(\bs{K}\) の加法の単位元を \(\kz\)、\(\bs{F}\) の加法の単位元を \(\fz\) とする。また、乗法の単位元をそれぞれ \(\ko\) と \(\fo\) とする。まず、\(f(\ko)=\fo\) で \(f(\kz)=\fz\) であることを示す。
\(f(x+y)=f(x)+f(y)\) において \(x=\kz,\:y=\kz\) とすると、
\(f(\kz+\kz)=f(\kz)+f(\kz)\)
\(f(\kz)=f(\kz)+f(\kz)\)
両辺に \(\bs{F}\) における \(f(\kz)\) の逆元 \(-f(\kz)\) を加えると、
\(f(\kz)+(-f(\kz))=f(\kz)\)
\(\fz=f(\kz)\)
となり、\(f(\kz)=\fz\) である。
\(f(xy)=f(x)f(y)\) において \(x=\ko,\:y=\ko\) とすると、
\(f(\ko\times\ko)=f(\ko)f(\ko)\)
\(f(\ko)=f(\ko)f(\ko)\)
両辺に \(\bs{F}\) における \(f(\ko)\) の逆元 \(-f(\ko)\) を加えると、
\(f(\ko)+(-f(\ko))=f(\ko)f(\ko)+(-f(\ko))\)
\(\fz=f(\ko)f(\ko)+(-f(\ko))\)
この式に現れているのは全て \(\bs{F}\) の元だから、分配則を使って、
\(f(\ko)(f(\ko)-\fo)=\fz\)
ここで \(f(\ko)=\fz\) と仮定すると、\(f(\kz)=\fz\)かつ \(f(\ko)=\fz\) となってしまい \(f\) が単射であることと矛盾する。従って \(f(\ko)\neq\fz\) である。上式の両辺を \(f(\ko)\) で割ると、
\(f(\ko)-\fo=\fz\)
\(f(\ko)=\fo\)
となる。
以上を踏まえると、同型写像が減法を保存することは次のようにしてわかる。\(\bs{K}\) は加法について群なので任意の元 \(x\in\bs{K}\) について逆元 \(-x\) がある。また \(\bs{F}\) も加法についても群だから \(f(x)\) の逆元 \(-f(x)\) がある。
\(f(-x)+f(x)=f(-x+x)=f(\kz)=\fz\)
両辺に \(-f(x)\) を足すと、
\(f(-x)+f(x)+(-f(x))=\fz+(-f(x))\)
\(f(-x)+\fz=\fz+(-f(x))\)
\(f(-x)=-f(x)\)
である。\(\bs{K}\) の任意の元を \(x,\:y\) とすると、
\(\begin{eqnarray}
&&\:\:f(x-y)&=f(x+(-y))\\
&&&=f(x)+f(-y)\\
&&&=f(x)+(-f(y))\\
&&&=f(x)-f(y)\\
\end{eqnarray}\)
となって、減法は保存されている。
除法を保存することは次のようにしてわかる。\(\bs{K}\) は乗法について群なので、任意の元 \(x\:\:(\neq\kz)\) について逆元 \(x^{-1}\) がある。\(\bs{F}\) も乗法についての群だから、\(f(x)\) の逆元である \(f(x)^{-1}\) がある。\(x\neq\kz\) なら \(f(x)\neq\fz\) なので逆元が定義できる。すると、
\(f(x^{-1})f(x)=f(x^{-1}x)=f(\ko)=\fo\)
である。この式の両辺に \(f(x)^{-1}\) をかけると、
\(f(x^{-1})f(x)f(x)^{-1}=\fo\times f(x)^{-1}\)
\(f(x^{-1})\times\fo=\fo\times f(x)^{-1}\)
\(f(x^{-1})=f(x)^{-1}\)
となる。\(\bs{K}\) の任意の元を \(x,\:y\:\:(y\neq\kz)\) とすると、
\(\begin{eqnarray}
&&\:\:f\left(\dfrac{x}{y}\right)&=f(xy^{-1})\\
&&&=f(x)f(y^{-1})\\
&&&=f(x)f(y)^{-1}\\
&&&=\dfrac{f(x)}{f(y)}\\
\end{eqnarray}\)
となり、除法が保存されていることが分かる。
有理数の同型写像を考える。\(n\) を整数とすると、
\(\begin{eqnarray}
&&\:\:f(n)&=f(\:\overbrace{1+1+\cd+1}^{1をn\:個加算}\:)\\
&&&=f(1)+f(1)+\cd+f(1)\\
&&&=nf(1)\\
&&&=n\\
\end{eqnarray}\)
なので、\(f(n)=n\) である。任意の有理数 \(a\) は、2つの整数 \(n\:(\neq0),\:m\) を用いて、
\(a=\dfrac{m}{n}\)
と表されるから、
\(\begin{eqnarray}
&&\:\:f(a)&=f\left(\dfrac{m}{n}\right)=\dfrac{f(m)}{f(n)}=\dfrac{m}{n}\\
&&&=a\\
\end{eqnarray}\)
となり、有理数は同型写像で不変である。[証明終]
同型写像と有理式の順序交換
(有理式の定義:51B) |
変数 \(x\) の多項式(係数は \(\bs{Q}\) の元)を分母・分子とする分数式を、\(\bs{Q}\) 上の有理式という。
\(\bs{Q}\) 上の多項式は、有理数と \(x\) の加・減・乗算で作られる式です。一方、\(\bs{Q}\) 上の有理式とは、有理数と \(x\) の除算を含む四則演算で作られる式です。
(同型写像と有理式の順序交換:51C) |
体 \(\bs{K}\) と 体 \(\bs{F}\) は \(\bs{Q}\) を含むものとする。\(\sg\) を \(\bs{K}\) から \(\bs{F}\) への同型写像とし、\(a\) を \(\bs{K}\) の元とする。\(f(x)\) を \(\bs{Q}\) 上の有理式とすると、
\(\sg(f(a))=f(\sg(a))\)
である。これは多変数の有理式でも成り立つ。\(a_1,a_2,\cd,a_n\) を \(\bs{K}\) の元、\(f(x_1,x_2,\cd,x_n)\) を \(\bs{Q}\) 上の有理式とすると、
\(\sg(f(a_1,a_2,\cd,a_n))=f(\sg(a_1),\sg(a_1),\cd,\sg(a_n))\)
である。
[証明]
\(a\in\bs{K},\:b_i\in\bs{Q},\:c_i\in\bs{Q}\) とし、1変数 \((=a)\) の2次多項式の分数式の場合を例に書くと、
\(\sg\left(\dfrac{b_2a^2+b_1a+b_0}{c_2a^2+c_1a+c_0}\right)\)
\(=\dfrac{\sg(b_2a^2+b_1a+b_0)}{\sg(c_2a^2+c_1a+c_0)}\)
\(=\dfrac{b_2\sg(a^2)+b_1\sg(a)+b_0}{c_2\sg(a^2)+c_1\sg(a)+c_0}\)
\(=\dfrac{b_2\sg(a)^2+b_1\sg(a)+b_0}{c_2\sg(a)^2+c_1\sg(a)+c_0}\)
であるから、題意は成り立つ。これは \(n\)次多項式の場合でも同じである。[証明終]
「同型写像と有理式は順序交換可能」は、\(\bs{Q}\) の拡大体の上の有理式でも成り立ちます。つまり、次が成り立ちます。
\(\bs{Q}\) を含む体を \(\bs{K}\) とし、\(\bs{K}\)の拡大体を \(\bs{F}\:,\bs{F}'\) とする。\(\sg\) を \(\bs{K}\) を不変にする \(\bs{F}\) から \(\bs{F}'\) への同型写像とし、\(a\) を \(\bs{F}\) の元とする。\(f(x)\) を \(\bs{K}\) 上の有理式とすると、
\(\sg(f(a))=f(\sg(a))\)
である。
同型写像は解を共役な解に移す
(同型写像での移り先:51D) |
\(\sg\) を体 \(\bs{K}\) から 体 \(\bs{F}\) への同型写像とする。\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つを \(\al\) とし、\(\al\) は \(\bs{K}\) の元とする。すると \(\sg(\al)\) も \(f(x)=0\) の解である。
[証明]
\(\al\) は \(f(x)=0\) の解なので \(f(\al)=0\) が成り立つ。すると、
\(f(\sg(\al))=\sg(f(\al))=\sg(0)=0\)
となり、\(\sg(\al)\) も \(f(x)=0\) の解である。[証明終]
同じ方程式の解同士を「共役な解」「共役である」と言います。この定理により、同型写像は解を共役な解に移すこと分かります。
同型写像は解を入れ替える
(同型写像による解の置換:51E) |
\(\sg\) を体 \(\bs{K}\) から 体 \(\bs{F}\) への同型写像とし、\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。方程式 \(f(x)=0\) の \(n\)個の解を \(\al_1,\al_2,\cd,\al_n\) とし、これらが全て \(\bs{K}\) に含まれるとする。
すると \(\sg(\al_1),\sg(\al_2),\cd,\sg(\al_n)\) は、\(\al_1,\al_2,\cd,\al_n\) を入れ替えたものである。
[証明]
\(f(x)\) は既約多項式なので、方程式 \(f(x)=0\) は \(n\)個の解をもち、それらは全て異なる(31G)。同型写像は解を共役な解に移す(51D)ので、\(\sg(\al_i)\) も \(f(x)=0\) の解である。\(\sg\) は同型写像なので全単射であり、\(i\neq j\) なら \(\sg(\al_i)\neq\sg(\al_j)\) である。従って \(\sg(\al_1),\sg(\al_2),\cd,\sg(\al_n)\) は、\(\al_1,\al_2,\cd,\al_n\) を入れ替えたものである。[証明終]
同型写像を定義してその性質を述べてきましたが、あたかも「同型写像はあるのが当然」のような話でした。しかし、同型写像があったとしたらこういう性質をもつというのが正しく、同型写像が必ずあるとは証明していません。
同型写像の存在を示すには、第1章でやったように、\(\bs{Q}(\sqrt{2})\)において
\(\sg(\sqrt{2})=-\sqrt{2}\)
という写像を定義すると、体のすべての元について \(\sg\) は同型写像の定義を満たす、というような証明が必要です。それが次です。
単拡大体の同型写像の存在
(同型写像の存在:51F) |
\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。\(\al,\:\beta\) を方程式 \(f(x)=0\) の異なる解とする。
すると \(\sg(\al)=\beta\) を満たす \(\bs{Q}(\al)\) から \(\bs{Q}(\beta)\) への唯一の同型写像 \(\sg\) が存在する。
[証明]
\(\bs{Q}(\al)\) の任意の元を \(a\)、\(\bs{Q}(\beta)\) の任意の元を \(b\) とする。単拡大体の基底の定理(33F)により、\(a,\:b\) は、
\(a=a_{n-1}\al^{n-1}+\:\cd\:+a_2\al^2+a_1\al+a_0\:\:(a_i\in\bs{Q})\)
\(b=b_{n-1}\beta^{n-1}+\:\cd\:+b_2\beta^2+b_1\beta+b_0\:\:(b_i\in\bs{Q})\)
の形に一意に表される。ここで \(\bs{Q}(\al)\) から \(\bs{Q}(\beta)\) への同型写像 \(\sg\) を、\(b=b_{n-1}\beta^{n-1}+\:\cd\:+b_2\beta^2+b_1\beta+b_0\:\:(b_i\in\bs{Q})\)
\(\begin{eqnarray}
&&\:\:\sg\:: &a_{n-1}\al^{n-1}+\:\cd\:+a_2\al^2+a_1\al+a_0\\
&&&\longmapsto\:a_{n-1}\beta^{n-1}+\:\cd\:+a_2\beta^2+a_1\beta+a_0\\
\end{eqnarray}\)
と定義する。\(a=\al\) の場合は、\(a_1=1,\:a_i=0\:\:(i=0,\:2\leq i\leq n-1)\) だから、\(\sg(\al)=\beta\) である。以下、この \(\sg\) が同型写像であることを証明する。定義により(51A)同型写像であることは加法と乗法を保存することを言えばよい。
\(\bs{Q}(\al)\) の任意の2つの元を \(s,\:t\) とし、
\(s=s_{n-1}\al^{n-1}+\:\cd\:+s_2\al^2+s_1\al+s_0\)
\(t=t_{n-1}\al^{n-1}+\:\cd\:+t_2\al^2+t_1\al+t_0\)
とする。また多項式 \(g(x)\) と \(h(x)\) を、\(t=t_{n-1}\al^{n-1}+\:\cd\:+t_2\al^2+t_1\al+t_0\)
\(g(x)=s_{n-1}x^{n-1}+\:\cd\:+s_2x^2+s_1x+s_0\)
\(h(x)=t_{n-1}x^{n-1}+\:\cd\:+t_2x^2+t_1x+t_0\)
と定義する。\(s_i,t_i\in\bs{Q}\) であり、\(s=g(\al),\:t=h(\al)\) である。また \(\sg\) の定義により \(\sg(s)=g(\beta),\:\sg(t)=h(\beta)\) である。\(h(x)=t_{n-1}x^{n-1}+\:\cd\:+t_2x^2+t_1x+t_0\)
\(p(x)=g(x)+h(x)\) とおくと、
\(p(\al)=g(\al)+h(\al)=s+t\)
である。また \(\sg\)の定義により、
\(\sg(p(\al))=p(\beta)\)
となる。従って、
\(\begin{eqnarray}
&&\:\:\sg(s+t)&=\sg(p(\al))\\
&&&=p(\beta)\\
&&&=g(\beta)+h(\beta)\\
&&&=\sg(s)+\sg(t)\\
\end{eqnarray}\)
となり、加法は保存される。
\(g(x)h(x)\) を \(f(x)\) で割ったときの商を \(q(x)\)、余りを \(r(x)\) とすると、
\(g(x)h(x)=q(x)f(x)+r(x)\)
である。この式に \(x=\al,\:x=\beta\) のそれぞれを代入すると、\(f(\al)=0,\:f(\beta)=0\) なので、
\(g(\al)h(\al)=r(\al)\)
\(g(\beta)h(\beta)=r(\beta)\)
となる。すると、
\(\begin{eqnarray}
&&\:\:\sg(st)&=\sg(g(\al)h(\al))\\
&&&=\sg(r(\al))=r(\sg(\al))\\
&&&=r(\beta)\\
\end{eqnarray}\)
\(\begin{eqnarray}
&&\:\:\sg(s)\sg(t)&=\sg(g(\al))\sg(h(\al))\\
&&&=g(\sg(\al))h(\sg(\al))\\
&&&=g(\beta)h(\beta)\\
&&&=r(\beta)\\
\end{eqnarray}\)
であり、
\(\sg(st)=\sg(s)\sg(t)\)
となって乗法も保存されている。従って \(\sg\) は同型写像である。
逆に、\(\bs{Q}(\al)\) に作用する同型写像 \(\tau\) があったとする。同型写像は \(\al\) を共役な元に移すので、その移り先の元を \(\beta\)、つまり \(\tau(\al)=\beta\) とする。\(\bs{Q}(\al)\) の任意の元 \(a\) に \(\tau\) を作用させると、
\(\begin{eqnarray}
&&\:\:\tau(a)&=\tau(a_{n-1}\al^{n-1}+\:\cd\:+a_2\al^2+a_1\al+a_0)\\
&&&=a_{n-1}\tau(\al^{n-1})+\:\cd\:+a_2\tau(\al^2)+a_1\tau(\al)+a_0\\
&&&=a_{n-1}\tau(\al)^{n-1}+\:\cd\:+a_2\tau(\al)^2+a_1\tau(\al)+a_0\\
&&&=a_{n-1}\beta^{n-1}+\:\cd\:+a_2\beta^2+a_1\beta+a_0\\
\end{eqnarray}\)
となるので、同型写像はこの式を満たさなければならない。従って、上で定義した \(\sg\) が \(\bs{Q}(\al)\) から \(\bs{Q}(\beta)\) の唯一の同型写像である。[証明終]
同型写像の存在(51F)を一般化すると、次のことが言えます。
単拡大体の同型写像は \(n\) 個
(単拡大体の同型写像:51G) |
\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。\(f(x)=0\) の全ての解を \(\al_1=\al,\:\al_2,\:\cd\:,\al_n\) とする。このとき \(\bs{Q}(\al)\) に作用する同型写像は \(n\)個あり、それらは、
\(\sg_i(\al)=\al_i\) \((1\leq i\leq n)\)
で定められ、\(\sg_i\) は \(\bs{Q}(\al)\) から \(\bs{Q}(\al_i)\) への同型写像となる。
同型写像を別の視点で考えます。\(\bs{Q}\:\subset\:\bs{F}\:\subset\:\bs{K}\) といった体の拡大列があったとき、\(\bs{F}\) の同型写像と \(\bs{K}\) の同型写像には密接な関係があります。それが次の同型写像の延長の定理です。単拡大定理(32B)により、\(\bs{F}=\bs{Q}(\al)\)、\(\bs{K}=\bs{Q}(\al,\beta)\) としてよいので、その形を使います。
同型写像の延長
(同型写像の延長:51H) |
\(\bs{Q}\) 上の \(n\)次既約多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の解の一つを \(\al\) とする。
\(\bs{\bs{Q}(\al)}\) 上の \(m\)次既約多項式を \(g(x)\) とし、方程式 \(g(x)=0\) の解の一つを \(\beta\) とする。また、\(\bs{Q}(\al)\) の同型写像の一つを \(\tau\) とする。
このとき、\(\tau\) は \(\bs{Q}(\al,\beta)\) の同型写像 \(\sg_j\) に延長できる。延長とは、\(\sg_j\) の作用を \(\bs{Q}(\al)\) に限定した写像の作用が \(\tau\) と一致することを言う。\(\tau\) を延長した同型写像 \(\sg_j\) は \(m\)個ある(\(0\leq j < m\))。
[証明]
\(\bs{Q}(\al)\) 上の \(m\)次既約多項式 \(g(x)\) を、
\(g(x)=x^m+a_1x^{m-1}+\cd+a_m\:\:(a_j\in\bs{Q}(\al))\)
とする。\(\beta\) は \(g(x)=0\) の解だから
\(g(\beta)=\beta^m+a_1\beta^{m-1}+\cd+a_m=0\)
である。また、多項式 \(\tau(g(x))\) を、
\(\tau(g(x))=x^m+\tau(a_1)x^{m-1}+\cd+\tau(a_{m-1})x+\tau(a_m)\)
と定義し、方程式
\(\tau(g(x))=0\)
の解を \(t_j\:\:(0\leq j < m)\)とする。つまり \(\tau(g(t_j))=0\) である。
\(\bs{Q}(\al,\beta)\) は \(\bs{Q}(\al)\) 上の線形空間であり、単拡大体の基底の定理(33F)により、その基底を \(\{1,\:\beta,\:\beta^2,\:\cd\:\beta^{m-1}\}\) にとれるから、\(\bs{Q}(\al,\beta)\) の任意の元 \(k\) は、
\(k=b_0+b_1\beta+b_2\beta^2\:+\cd+\:b_{n-1}\beta^{m-1}\:\:(b_j\in\bs{Q}(\al))\)
と表せる。そこで、\(\bs{Q}(\al,\beta)\) の元に作用する写像 \(\sg_j\) を
\(\sg_j(k)=\tau(b_0)+\tau(b_1)t_j+\tau(b_2)t_j^2+\cd+\tau(b_{m-1})t_j^{m-1}\)
と定義する。この定義における \(\sg_j\) は \(\bs{Q}(\al,\beta)\) の同型写像になる。同型写像になることは体の加算と乗算で示せればよい(51A)。\(\bs{Q}(\al,\beta)\) の2つの元を、
\(p=c_0+c_1\beta+c_2\beta^2\:+\cd+\:c_{m-1}\beta^{m-1}\:\:(c_j\in\:\bs{Q}(\al)\:)\)
\(q=d_0+d_1\beta+d_2\beta^2\:+\cd+\:d_{m-1}\beta^{m-1}\:\:(d_j\in\:\bs{Q}(\al)\:)\)
とし、2つの多項式を、
\(p(x)=c_0+c_1x+c_2x^2\:+\cd+\:c_{m-1}x^{m-1}\)
\(q(x)=d_0+d_1x+d_2x^2\:+\cd+\:d_{m-1}x^{m-1}\)
と定義する。加算で同型写像になるのは明白なので、乗算で同型写像になることを示す。
\(p(x)q(x)\) を \(g(x)\) で割ったときの商を \(t(x)\)、余りを \(r(x)\) とすると、
\(p(x)q(x)=t(x)g(x)+r(x)\)
と書ける。ここで \(s_j()\) は \(c_j,\:d_j\:\:(0\leq j\leq m-1)\)の有理式である。\(()\) の中を全部書くと \(s_j(c_0,c_1,\cd,c_{m-1},d_0,d_1,\cd,d_{m-1})\) という \(2m\)個の \(\bs{Q}(\al)\) の元の有理式を表わしていて、それを簡略表記している。\(r(x)\) | \(\overset{\text{ }}{=}\) | \(s_0(c_j,d_j)+s_1(c_j,d_j)x+s_2(c_j,d_j)x^2+\cd+s_{m-1}(c_j,d_j)x^{m-1}\) |
すると \(g(\beta)=0\) だから、
\(pq\) | \(\overset{\text{ }}{=}\) | \(p(\beta)q(\beta)\) | |
\(\overset{\text{ }}{=}\) | \(r(\beta)\) | ||
\(\overset{\text{ }}{=}\) | \(s_0(c_j,d_j)+\)\(s_1(c_j,d_j)\beta+\)\(s_2(c_j,d_j)\beta^2\:+\)\(\cd+\)\(s_{m-1}(c_j,d_j)\beta^{m-1}\) |
\(\sg_j(pq)\) | \(\overset{\text{ }}{=}\) | \(\tau(s_0(c_j,d_j))+\)\(\tau(s_1(c_j,d_j))t_j+\)\(\tau(s_2(c_j,d_j))t_j^2+\)\(\cd+\)\(\tau(s_{m-1}(c_j,d_j))t_j^{m-1}\) |
\(\tau\) は \(\bs{Q}(\al)\) の同型写像だから、\(\bs{Q}(\al)\) の元の有理式である \(s_j(c_j,d_j)\) に作用させると、同型写像と有理式の順序交換の定理(51C)により、
\(\tau(s_j(c_j,d_j))=s_j(\tau(c_j),\tau(d_j))\)
となる。従って、
\(\sg_j(pq)\) | \(\overset{\text{ }}{=}\) | \(s_0(\tau(c_j),\tau(d_j))+\)\(s_1(\tau(c_j),\tau(d_j))t_j\:+\)\(s_2(\tau(c_j),\tau(d_j))t_j^2+\)\(\cd+\)\(s_{m-1}(\tau(c_j),\tau(d_j))t_j^{m-1}\) |
\(p(x)\) の係数 \(c_j\) を \(\tau(c_j)\) で置き換え、\(q(x)\) の係数 \(d_j\) を \(\tau(d_j)\) で置き換えた2つの多項式を、
\(\tau(p(x))=\tau(c_0)+\tau(c_1)x+\tau(c_2)x^2+\cd+\tau(c_{m-1})x^{m-1}\)
\(\tau(q(x))=\tau(d_0)+\tau(d_1)x+\tau(d_2)x^2+\cd+\tau(d_{m-1})x^{m-1}\)
とする。
\(\tau(p(x))\tau(q(x))\)を\(\tau(g(x))\)で割ったときの商を\(\tau(t(x))\)、余りを\(\tau(r(x))\)とする。つまり、
\(\tau(p(x))\tau(q(x))=\tau(g(x))\tau(t(x))+\tau(r(x))\)
である。\(c_j\) と \(d_j\) の有理式、\(s_j(c_j,d_j)\) を使って \(\tau(r(x))\) を表すと、
\(\tau(r(x))\) | \(\overset{\text{ }}{=}\) | \(s_0(\tau(c_j),\tau(d_j))+\)\(s_1(\tau(c_j),\tau(d_j))x+\)\(s_2(\tau(c_j),\tau(d_j))x^2\:+\)\(\cd+\)\(s_{m-1}(\tau(c_j),\tau(d_j))x^{m-1}\) |
\(\sg_j(p)\) | \(\overset{\text{ }}{=}\) | \(\tau(c_0)+\)\(\tau(c_1)t_j+\)\(\tau(c_2)t_j^2+\)\(\cd+\)\(\tau(c_{m-1})t_j^{m-1}\) | |
\(\overset{\text{ }}{=}\) | \(\tau(p(t_j))\) | ||
\(\sg_j(q)\) | \(\overset{\text{ }}{=}\) | \(\tau(d_0)+\)\(\tau(d_1)t_j+\)\(\tau(d_2)t_j^2+\)\(\cd+\)\(\tau(d_{m-1})t_j^{m-1}\) | |
\(\overset{\text{ }}{=}\) | \(\tau(q(t_j))\) |
\(\sg_j(p)\sg_j(q)\)
となり、\(\sg_j\) は同型写像の定義を満たしている。\(\overset{\text{ }}{=}\) | \(\tau(p(t_j))\tau(q(t_j))\) | ||
\(\overset{\text{ }}{=}\) | \(\tau(f(t_j))\tau(t(t_j))+\tau(r(t_j))\) | ||
\(\overset{\text{ }}{=}\) | \(\tau(r(t_j))\) | ||
\(\overset{\text{ }}{=}\) | \(s_0(\tau(c_j),\tau(d_j))+\)\(s_1(\tau(c_j),\tau(d_j))t_j+\)\(s_2(\tau(c_j),\tau(d_j))t_j^2+\)\(\cd+\)\(s_{n-1}(\tau(c_j),\tau(d_j))t_j^{m-1}\) | ||
\(\overset{\text{ }}{=}\) | \(\sg_j(pq)\) |
また、\(\bs{Q}(\al,\beta)\) の任意の元 \(k\) を、
\(k=b_0+b_1\beta+b_2\beta^2\:+\cd+\:b_{n-1}\beta^{m-1}\:\:(b_j\in\bs{Q}(\al))\)
と表したとき、\(k\) が \(\bs{Q}(\al)\) の元だとすると \(k=b_0\:\:(b_0\in\bs{Q}(\al))\)、\(b_j=0\:\:(1\leq j < m)\) なので、
\(\sg_j(k)=\tau(b_0)=\tau(k)\)
となり、\(\sg_j\) の \(\bs{Q}(\al)\) の元に対する作用は \(\tau\) と一致する。従って、
\(\sg_j\)は、その作用を \(\bs{Q}(\al)\) に限定したとき \(\tau\) と一致する \(\bs{Q}(\al,\beta)\) の同型写像
であり、\(\bs{Q}(\al)\) の同型写像 \(\tau\) の延長である。\(\sg_j\) の定義式、
\(\sg_j(k)=\tau(b_0)+\tau(b_1)t_j+\tau(b_2)t_j^2+\cd+\tau(b_{m-1})t_j^{m-1}\)
における \(t_j\) は、 \(\bs{Q}(\al)\) 上の \(m\)次方程式、
\(x^m+\tau(a_1)x^{m-1}+\cd+\tau(a_m)=0\)
の解であった。従って \(t_j\) の選択肢は \(m\) 個あり、\(\bs{Q}(\al)\) の同型写像 \(\tau\) の延長は \(m\) 個ある。一方、\(\al\) は \(\bs{Q}\) 上の \(n\)次既約多項式 \(f(x)\) の解の一つだから、\(\bs{Q}(\al)\) の同型写像 \(\tau\) は \(n\)個ある。これを \(\tau_i\:\:(0\leq i < n)\) と書くと、それぞれの \(\tau_i\) に対して同型写像の拡張 \(\sg_{ij}\:\:(0\leq i < n,\:0\leq j < m)\) がある。従って \(\bs{Q}(\al,\beta)\) の 同型写像 \(\sg_{ij}\) は \(nm\)個ある。[証明終]
5.2 ガロア拡大とガロア群
ガロア拡大
(ガロア拡大:52A) |
ガロア拡大は次のように定義される。この2つの定義は同値である。
(最小分解体定義)体 \(\bs{F}\) 上の多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とするとき、\(\bs{L}/\bs{F}\) をガロア拡大という。 | |
(自己同型定義)体 \(\bs{F}\) の代数拡大体 \(\bs{K}\) があったとき、\(\bs{F}\) の元を不動にする \(\bs{K}\) の同型写像がすべて自己同型写像になるとき、\(\bs{K}/\bs{F}\) をガロア拡大という。 |
\(\bs{K}/\bs{F}\) がガロア拡大のとき、\(\bs{\bs{F}}\) を不変にする \(\bs{K}\) の自己同型写像の集合は群になる。これをガロア群といい、\(\mr{Gal}(\bs{K}/\bs{F})\) で表す。
[① \(\bs{\Rightarrow}\) ②の証明]
単拡大定理(32B)により、\(\bs{L}\) は、\(\bs{L}\) の元 \(\theta\) を用いて \(\bs{L}=\bs{F}(\theta)\) と表すことができる。\(\theta\) の \(\bs{F}\) 上の最小多項式を \(g(x)\) とし、その次数を \(m\) とする。最小多項式は既約多項式の定理(31I)により、\(g(x)\) は既約多項式である。また、既約多項式の定理3(31G)により、方程式 \(g(x)=0\) の \(m\)個の解は全て異なっている。その解の一つは \(\theta\) なので、\(m\)個の解を、
\(\theta=\theta_1,\:\theta_2,\:\cd,\:\theta_m\)
とする。\(\theta_i\:\:(2\leq i\leq m)\) が \(\bs{L}\) の元かどうかは(この段階では)分からない。
\(\bs{F}\) の元を不変にする \(\bs{L}\) 上の同型写像の一つを \(\sg\) とする。\(\sg\) は \(\bs{F}\) の元を不変にするから、\(\bs{L}=\bs{F}(\theta)\) においては \(\sg(\theta)\) を決めることによって \(\sg\) が定義される。その同型写像は、方程式の解を共役な解に移す(51D)。そこで、\(m\)個の同型写像を、
\(\sg_i(\theta)=\theta_i\)
と定義する(\(\sg_1=e\))。
一方、\(\bs{L}\) は \(\bs{F}\) 上の方程式 \(f(x)=0\) の最小分解体であった。\(f(x)=0\) の解を、
\(\al_1,\:\al_2,\:\cd,\:\al_n\)
の \(n\)個とする。そうすると、
\(\bs{L}=\bs{F}(\al_1,\:\al_2,\:\cd,\:\al_n)\)
である。\(\bs{L}\) の任意の元 は、\(\al_1,\:\al_2,\:\cd,\:\al_n\) の有理式(係数は \(\bs{F}\) の元)で表せる。\(\theta\) を有理式で表す式を、\(n\)変数の有理式 \(h(x_1,x_2,\cd,x_n)\) を使って、
\(\theta=h(\al_1,\:\al_2,\:\cd,\:\al_n)\)
と表したとする。\(h(x_i)\)は、\(n\)変数の多項式(係数は \(\bs{F}\) の元)を \(s(x_i)\) と \(t(x_i)\) として、
\(h(\al_1,\:\al_2,\:\cd,\:\al_n)=\dfrac{s(\al_1,\:\al_2,\:\cd,\:\al_n)}{t(\al_1,\:\al_2,\:\cd,\:\al_n)}\)
である。
\(\theta\) に同型写像 \(\sg_i\) を作用させる。\(\bs{F}\) 係数の有理式と \(\bs{F}\) を不変にする同型写像の演算順序は交換可能(51C)だから、
\(\begin{eqnarray}
&&\:\:\sg_i(\theta)&=\sg_i(h(\al_1,\:\al_2,\:\cd,\:\al_n))\\
&&&=h(\sg_i(\al_1),\:\sg_i(\al_2),\:\cd,\:\sg_i(\al_n))\\
\end{eqnarray}\)
となる。同型写像は方程式の解を共役な解に移す(51D)から、\(\sg_i(\al_1),\:\sg_i(\al_2),\:\cd,\:\sg_i(\al_n)\) は \(\al_1,\:\al_2,\:\cd,\:\al_n\) を入れ替えたものである(51E)。つまり \(\sg_i(\theta)\) は \(\al_1,\:\al_2,\:\cd,\:\al_n\) の有理式で表現される。従って、
\(\sg_i(\theta)\:\in\:\bs{L}\)
である。\(\sg_i(\theta)=\theta_i\) と定義したので、
\(\theta_i\:\in\:\bs{L}\)
である。つまり \(m\)個の同型写像 \(\sg_i\:\:(1\leq i\leq m)\) は全て \(\bs{L}\) の自己同型写像である。
[② \(\bs{\Rightarrow}\) ①の証明]
単拡大定理(32B)により、\(\bs{K}\) は、\(\bs{K}\) の元 \(\theta\) を用いて \(\bs{K}=\bs{F}(\theta)\) と表すことができる。\(\theta\) の \(\bs{F}\) 上の最小多項式を \(f(x)\) とし、その次数を \(m\) とする。最小多項式は既約多項式の定理(31I)により、\(f(x)\) は既約多項式である。また既約多項式の定理3(31G)により、方程式 \(f(x)=0\) の \(m\)個の解は全て異なっている。解の一つは \(\theta\) なので、\(m\)個の解を、
\(\theta=\theta_1,\:\theta_2,\:\cd,\:\theta_m\)
とする。
\(\bs{F}\) の元を不変にする \(\bs{K}\) 上の同型写像の一つを \(\sg\) とする。\(\sg\) は \(\bs{F}\) の元を不変にするから、\(\bs{L}=\bs{F}(\theta)\) においては \(\sg(\theta)\) を決めることによって \(\sg\) が定義される。その同型写像は、\(\bs{F}\) 上の方程式の解を共役な解に移す(51D)。そこで、\(m\)個の同型写像を、
\(\sg_i(\theta)=\theta_i\)
と定義する。\(\bs{F}\) の元を不変にする \(\bs{K}\) 上の同型写像は自己同型写像なので、\(\sg_i(\theta)=\theta_i\) は全て \(\bs{K}\) の元である。従って \(\bs{K}\) は \(\bs{F}\) 上の既約多項式 \(f(x)\) の解 \(\theta_i\) を用いて、
\(\begin{eqnarray}
&&\:\:\bs{K}&=\bs{F}(\theta)\\
&&&=\bs{F}(\theta_1,\:\theta_2,\:\cd,\:\theta_m)\\
\end{eqnarray}\)
と表される。\(\bs{K}\) は \(\bs{F}\) 上の既約多項式の最小分解体である。[証明終]
① の定義は、方程式の解のありようを議論するガロア理論にとっては "ノーマルな" 定義のように見えます。しかし ② のように方程式という言葉を全く使わない定義もメリットがあります。たとえば「次数が違う2つの方程式の解によるガロア拡大が同じ」ということは、いくらでもありうるからです。
また、ガロア拡大は次のような定義もできます。
(正規拡大定義)体 \(\bs{F}\) の代数拡大体 \(\bs{K}\) があったとき、\(\bs{K}\) の任意の元の \(\bs{F}\) 上の最小多項式を \(f(x)\) とする。\(f(x)=0\) のすべての解が \(\bs{K}\) の元のとき、\(\bs{K}\) を \(\bs{F}\) の正規拡大と言う。ガロア拡大とは正規拡大のことである。 |
方程式という言葉は使っていますが、拡大体から始まる定義です。言い換えると、\(\bs{K}\) がガロア拡大体のとき \(\bs{K}\) の任意の元に共役な元は \(\bs{K}\) に含まれるということです。
このように、互いに同値である多種の定義ができることがガロア理論の分かりにくいところですが、逆に「それだけ豊かな数学的内容を含んだ理論」とも言えるでしょう。
最小分解体の次数=ガロア群の位数
(次数と位数の同一性:52B) |
\(\bs{Q}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\)、ガロア群を \(G\) とするとき、\([\:\bs{L}\::\:\bs{Q}\:]=|G|\) である。
[証明]
単拡大定理(32B)により、\(\bs{L}\) は、\(\bs{L}\) の元 \(\theta\) を用いて \(\bs{L}=\bs{Q}(\theta)\) と表すことができる。\(\theta\) の \(\bs{Q}\) 上の最小多項式を \(g(x)\) とし、その次数を \(m\) とする。最小多項式は既約多項式の定理(31I)により、\(g(x)\) は既約多項式である。また、既約多項式の定理3(31G)により、方程式 \(g(x)=0\) の \(m\)個の解は全て異なっている。解の一つは \(\theta\) なので、\(m\)個の解を、
\(\theta=\theta_1,\:\theta_2,\:\cd,\:\theta_m\)
とする。ここで、\(\theta_i\:\:(2\leq i\leq m)\) が \(\bs{L}\) の元かどうかは(この段階では)分からない。
\(\bs{L}\) 上の同型写像の一つを \(\sg\) とする。\(\sg\) は \(\bs{Q}\) の元を不変にするから、\(\bs{L}=\bs{Q}(\theta)\) においては \(\sg(\theta)\) を決めることによって \(\sg\) が定義される。その同型写像は、方程式の解を共役な解に移す(51D)。そこで、\(m\)個の同型写像を、
\(\sg_i(\theta)=\theta_i\)
と定義する(\(\sg_1=e\))。単拡大体 \(\bs{Q}(\theta)\) に作用する同型写像は \(m\)個だから(51G)、これが同型写像のすべてである。
一方、\(\bs{L}\) は \(\bs{Q}\) 上の方程式 \(f(x)=0\) の最小分解体であった。\(f(x)=0\) の解を、
\(\al_1,\:\al_2,\:\cd,\:\al_n\)
の \(n\)個とする。そうすると、
\(\bs{L}=\bs{Q}(\al_1,\:\al_2,\:\cd,\:\al_n)\)
である。\(\bs{L}\) の任意の元 は、\(\al_1,\:\al_2,\:\cd,\:\al_n\) の有理式で表せる。\(\theta\) を有理式で表す式を、\(n\)変数の有理式 \(h(x_1,x_2,\cd,x_n)\) を使って、
\(\theta=h(\al_1,\:\al_2,\:\cd,\:\al_n)\)
と表したとする。\(h(x_i)\)は、\(n\)変数の多項式(係数は有理数)を \(s(x_i)\) と \(t(x_i)\) として、
\(h(\al_1,\:\al_2,\:\cd,\:\al_n)=\dfrac{s(\al_1,\:\al_2,\:\cd,\:\al_n)}{t(\al_1,\:\al_2,\:\cd,\:\al_n)}\)
である。
\(\theta\) に同型写像 \(\sg_i\) を作用させると、有理式と同型写像の演算順序は交換可能(51C)だから、
\(\begin{eqnarray}
&&\:\:\sg_i(\theta)&=\sg_i(h(\al_1,\:\al_2,\:\cd,\:\al_n))\\
&&&=h(\sg_i(\al_1),\:\sg_i(\al_2),\:\cd,\:\sg_i(\al_n))\\
\end{eqnarray}\)
となる。同型写像は方程式の解を共役な解に移すから(51D)、\(\sg_i(\al_1),\:\sg_i(\al_2),\:\cd,\:\sg_i(\al_n)\) は \(\al_1,\:\al_2,\:\cd,\:\al_n\) を入れ替えたものである(51E)。つまり \(\sg_i(\theta)\) は \(\al_1,\:\al_2,\:\cd,\:\al_n\) の有理式で表現される。従って、
\(\sg_i(\theta)\:\in\:\bs{L}\)
である。\(\sg_i(\theta)=\theta_i\) と定義したので、
\(\theta_i\:\in\:\bs{L}\)
である。つまり \(m\)個の同型写像 \(\sg_i\:\:(1\leq i\leq m)\) は全て \(\bs{L}\) の自己同型写像である。以上により、
\(\mr{Gal}(\bs{L}/\bs{Q})=\{\sg_1,\:\sg_2,\:\cd,\:\sg_m\}\)
であり、\(|G|=m\) である。
\(\theta\) の \(\bs{Q}\) 上の最小多項式(=既約多項式)の次数が \(m\) だから、単拡大体の基底の定理(33F)によって、最小分解体 \(\bs{L}=\bs{Q}(\theta)\) は \(\bs{Q}\) の \(m\)次拡大体であり、
\([\:\bs{L}\::\:\bs{Q}\:]=|G|\)
である。[証明終]
この定理では \(\bs{Q}\) としましたが、任意の代数拡大体 \(\bs{F}\) としても成り立ちます。また、最小分解体はガロア拡大体です。従って、最も一般的に言うと次のようになります。
\(\bs{F}\) を代数拡大体とし、\(\bs{F}\) のガロア拡大を \(\bs{L}\) とする。\(\bs{L}\) のガロア群の位数は \(\bs{F}\) から \(\bs{L}\) への拡大次数に等しい。つまり、
\([\:\bs{L}\::\:\bs{F}\:]=|\mr{Gal}(\bs{L}/\bs{F})|\)
である。
中間体
(中間体からのガロア拡大:52C) |
\(\bs{K}\) を \(\bs{F}\) のガロア拡大体とし、\(\bs{M}\) を \(\bs{F}\subset\bs{M}\subset\bs{K}\) である任意の体(=中間体)とするとき、\(\bs{K}\) は \(\bs{M}\) のガロア拡大体でもある。
[証明]
最小分解体定義による
\(\bs{K}\) が \(\bs{F}\) 上の方程式 \(f(x)=0\) の最小分解体であるとする。この方程式の解を \(\al_1,\:\al_2,\:\cd\:\al_n\) とすると、\(\bs{K}=\bs{F}(\al_1,\:\al_2,\:\cd\:\al_n)\) である。\(\bs{F}\subset\bs{M}\subset\bs{L}\) なので、
\(\bs{F}(\al_1,\:\cd\:\al_n)\:\subset\:\bs{M}(\al_1,\:\cd\:\al_n)\:\subset\:\bs{K}(\al_1,\:\cd\:\al_n)=\bs{K}\)
となるが、すなわち、
\(\bs{F}\:\subset\:\bs{M}(\al_1,\:\al_2,\:\cd\:\al_n)\:\subset\:\bs{K}\)
であり、\(\bs{K}=\bs{M}(\al_1,\:\al_2,\:\cd\:\al_n)\) である。\(f(x)=0\) は \(\bs{M}\) 上の方程式でもあるので、\(\bs{K}\) は \(\bs{M}\) 上の方程式の最小分解体であり、\(\bs{M}\) のガロア拡大体である。
自己同型定義による
\(\bs{L}\) の同型写像のうち、\(\bs{M}\) の元を固定する任意の同型写像を \(\sg\) とする。そうすると \(\sg\) は \(\bs{M}\) の部分集合である \(\bs{F}\) の元も固定する。\(\bs{L}\) は \(\bs{F}\) のガロア拡大体なので、\(\bs{F}\) の元を固定する \(\bs{L}\) の同型写像は自己同型写像である。従って \(\sg\) も自己同型写像であり、\(\bs{L}\) は \(\bs{M}\) のガロア拡大体である。[証明終]
\(\bs{F}\subset\bs{M}\subset\bs{K}\) という体の拡大列があったとき、\(\bs{F}\subset\bs{K}\) がガロア拡大だと上の定理(52C)によって \(\bs{M}\subset\bs{K}\) もガロア拡大です。しかし、\(\bs{F}\subset\bs{M}\) がガロア拡大になるとは限りません。\(\bs{F}\subset\bs{M}\) がガロア拡大になるためには条件が必要で、その条件が満たされば、\(\bs{F}\subset\bs{M}\subset\bs{K}\) は「ガロア拡大の連鎖」になり、そのことが方程式の可解性と結びつきます。それが次の節の大きな主題です。
5.3 ガロア対応
固定体と固定群
(固定体と固定群:53A) |
体 \(\bs{F}\) 上の方程式の最小分解体(=ガロア拡大体)を \(\bs{K}\) とし、ガロア群を \(G\) とする。\(G\) の部分群 \(H\) によって不変な \(\bs{K}\) の元の集合 \(\bs{M}\) は体になる。これを \(\bs{K}\) における \(H\) の固定体といい、\(\bs{K}(H)\) で表す(または \(\bs{K}^H\))。
また \(\bs{K}\) の中間体 \(\bs{M}\) のすべての元を不変にする \(G\) の部分集合 \(H\) は群になる。これを \(G\) における \(\bs{M}\) の固定群と呼び、\(G(\bs{M})\) で表す(または \(G^M\))。
[証明]
固定体と固定群の定義において、
\(G\) の部分群 \(H\) によって不変な \(\bs{K}\) の元の集合 \(\bs{M}\) は体になる | |
\(\bs{K}\) の中間体 \(\bs{M}\) のすべての元を不変にする \(G\) の部分集合 \(H\) は群になる |
の2点を証明する。
① の証明
\(\bs{M}\) が体であることを証明するには、四則演算で閉じていることを言えばよい(1.2 体)。\(\bs{M}\) の任意の2つの元を \(x,\:y\) とし、\(H\) の任意の元を \(\sg\) とする。\(x,\:y\) は \(\bs{K}\) の元でもあるから、
\(x+y\in\bs{K}\)
である。\(H\) の元 \(\sg\) は \(G\) の元でもあるから \(\sg(x+y)\) が定義できる。\(x,\:y\) は \(\bs{M}\) の元だから、\(H\) の元である \(\sg\) を作用させても不変であり、
\(\sg(x)=x\)
\(\sg(y)=y\)
である。すると、
\(\sg(x+y)=\sg(x)+\sg(y)=x+y\)
となって、\(x+y\) は \(\sg\) によって不変であり、
\(x+y\in\bs{M}\)
である。以上のことが加減乗除のすべてで成り立つことは明白だから、\(\bs{M}\) は四則演算で閉じていて、体である。
② の証明
\(\bs{M}\) の任意の元を \(x\)、\(H\) の2つの元を \(\sg,\:\tau\) とする。
\(\sg(x)=x\)
\(\tau(x)=x\)
である。すると、
\(\sg\tau(x)=\sg(\tau(x))=\sg(x)=x\)
となり、\(\sg\tau\in H\) となって、\(H\) の元は群演算で閉じている。
また \(H\) の元はもともと \(G\) の元なので、結合法則も成り立つ。\(G\) の単位元を \(e\) とすると、\(e(x)=x\) なので \(e\in H\) である。
さらに \(\sg\) は \(G\) の元なので、\(G\) の中に \(\sg^{-1}\) が存在する。すると、\(\sg(x)=x\) の両辺に左から \(\sg^{-1}\) をかけると、
\(\sg^{-1}\sg(x)=\sg^{-1}(x)\)
\(x=\sg^{-1}(x)\)
となり、
\(\sg^{-1}\in H\)
である。\(H\) は演算で閉じていて、結合法則が成り立ち、単位元と逆元が存在するので、群の定義(22A)を満たしている。[証明終]
以上の固定体と固定群の概念を用いると、次のガロア対応の定理が成り立ちます。以降の論証の基礎となる定理です。
ガロア対応の定理
(ガロア対応:53B) |
\(\bs{F}\) のガロア拡大体を \(\bs{K}\) とし、ガロア群を \(G\) とする。\(G\) の任意の部分群を \(H\) とし、\(H\) による \(\bs{K}\) の固定体 \(\bs{K}(H)\) を \(\bs{M}\) とする(次式)。
\(\begin{eqnarray}
&&G\:\sp\:H &\sp\:\{e\}\\
&&\bs{F}\:\subset\:\bs{K}(H)=\bs{M} &\subset\:\bs{K}\\
\end{eqnarray}\)
\(\bs{M}\)の固定群を \(G(\bs{M})\) とする(次式)。ガロア群の定義により \(G(\bs{M})=\mr{Gal}(\bs{K}/\bs{M})\) である。
\(\begin{eqnarray}
&&\bs{F}\:\subset\:\bs{M} &\subset\:\bs{K}\\
&&G\:\sp\:G(\bs{M}) &\sp\:\{e\}\\
\end{eqnarray}\)
このとき、
\(G(\bs{M})=H\)
つまり、
\(\begin{eqnarray}
&&\:\:\mr{Gal}(\bs{K}/\bs{M})&=H \\
&&\:\:\bs{K}(G(\bs{M}))&=\bs{M}\\
\end{eqnarray}\)
が成り立つ。
[証明]
\(G\) の任意の部分群である \(H\) は \(\bs{K}\) の部分集合 \(\bs{M}\) を固定する。一方、\(G(\bs{M})\) は \(\bs{M}\) を固定する \(G\) のすべての元の集合で、それが部分群になっている。従って、\(G(\bs{M})\) は \(H\) を含む。つまり
\(H\:\subset\:G(\bs{M})\)
であり、群位数は、
\(|H|\:\leq\:|G(\bs{M})|\)
である。 \((\br{A})\)
\(\bs{K}/\bs{F}\) はガロア拡大であり、\(\bs{M}\) はその中間体だから、中間体からのガロア拡大の定理(52C)によって、\(\bs{K}/\bs{M}\) はガロア拡大である。また、すべての代数拡大体は単拡大体だから(32B)、\(\bs{K}\) の元 \(\theta\) があって \(\bs{K}=\bs{F}(\theta)\) と表せる。これは、\(\bs{K}=\bs{M}(\theta)\) ということでもある。
\(H\) の \(|H|\) 個の元を \(\sg_i\:\:(1\leq i\leq|H|)\) とし、多項式
\(f(x)=\displaystyle\prod_{i=1}^{|H|}(x-\sg_i(\theta))\)
を考える。この多項式の次数は \(|H|\) である。\(\sg_i(\theta)\) は \(\theta\) の共役な元のどれかである。
\(f(x)\) を展開すると、その係数は \(\sg_i(\theta)\:\:(1\leq i\leq|H|)\) の対称式になる。また、\(\sg_i(\theta)\) に \(H\) の任意の元 \(\sg_k\) を作用させても、\(\sg_i\) は部分群だから演算で閉じており、\(\sg_i(\theta)\) を入れ替えるだけである(51E)。従って \(\sg_i(\theta)\) の対称式に \(\sg_k\) を作用させても不変である。つまり、\(H\) の任意の元は \(f(x)\) の係数を固定する。ということは、\(\bs{M}\) の定義(= \(H\) による \(\bs{K}\) の固定体が \(\bs{M}\))によって、\(f(x)\) の係数は \(\bs{M}\) の元である。
\(\sg_i\) は群だから単位元を含む。従って、
\(f(\theta)=\displaystyle\prod_{i=1}^{|H|}(\theta-\sg_i(\theta))=0\)
となり、\(\bs{\theta}\) は \(\bs{\bs{M}}\) 上の \(\bs{|H|}\) 次方程式 \(\bs{f(x)=0}\) の解の一つである。ゆえに \(\bs{M}\) から単拡大体 \(\bs{K}=\bs{M}(\theta)\) への拡大次数は、\(f(x)\) が \(\bs{M}\) 上の既約多項式なら単拡大体の基底の定理(33F)により \(|H|\) であり、一般には \(|H|\) 以下である。つまり、
\([\:\bs{K}\::\:\bs{M}\:]\leq|H|\)
である。次数と位数の同一性(52B)によると、拡大次数 \([\:\bs{K}\::\:\bs{M}\:]\) は、ガロア群 \(\mr{Gal}(\bs{K}/\bs{M})\) の位数に等しい。従って、
\(|\mr{Gal}(\bs{K}/\bs{M})|\leq|H|\)
\(|G(\bs{M})|\leq|H|\)
となる。\((\br{A})\) と \((\br{B})\) により、 \((\br{B})\)
\(|G(\bs{M})|=|H|\)
であり、\(G(\bs{M})\:\subset\:H\) と合わせると、
\(G(\bs{M})=H\)
となる。従って、
\(\begin{eqnarray}
&&\:\:\mr{Gal}(\bs{K}/\bs{M})&=H \\
&&\:\:\bs{K}(G(\bs{M}))&=\bs{M}\\
\end{eqnarray}\)
である。[証明終]
証明の中に対称式という言葉が出てきます。対称式とは、
変数の任意の入れ替えで不変な多項式
です。2変数 \(x,\:y\) だと、
\(x+y,\:xy\)(ここまでが基本対称式)、\(x^2+y^2,\:\:(x-y)^2\)
などです。3変数 \(x,\:y\:,z\) だと、
\(x+y+z,\:xy+yz+zx,\:xyz\)(基本対称式)、\(((x-y)(y-z)(z-x))^2\)
などです。
対称式でよく出てくるのは、方程式の根と係数の関係です。たとえば、\(\bs{Q}\) 上の既約な3次多項式を \(f(x)\) をとし、\(f(x)=0\) の解を \(\al,\beta,\gamma\) とします。
\(\begin{eqnarray}
&&\:\:f(x)&=x^3-ax^2+bx-c\\
&&&=(x-\al)(x-\beta)(x-\gamma)\\
\end{eqnarray}\)
と書くと、
\(a=\al+\beta+\gamma\)
\(b=\al\beta+\beta\gamma+\gamma\al\)
\(c=\al\beta\gamma\)
と、係数が解の基本対称式で表現されます。
また ガロア群 \(\mr{Gal}(\bs{Q}(\al,\beta,\gamma)/\bs{Q})\) の任意の元 を \(\sg\) とします。\(\al,\beta,\gamma\) の任意の対称式を \(S(\al,\beta,\gamma)\in\bs{Q}(\al,\beta,\gamma)\) とすると、
\(\sg(S(\al,\beta,\gamma))=S(\al,\beta,\gamma)\)
です。ガロア群の元は自己同型写像であり、方程式の解を解の一つに置き換えるので、これが成り立ちます。自己同型写像を作用させて不変なのは有理数です(51A)。従って、\(S(\al,\beta,\gamma)\) は有理数です。もちろん \(f(x)\) が \(n\)次多項式であっても成り立ちます。
\(\bs{F}\subset\bs{M}\subset\bs{K}\) という体の拡大列で \(\bs{F}\subset\bs{K}\) がガロア拡大のとき、\(\bs{M}\subset\bs{K}\) は自動的にガロア拡大ですが(52C)、ある条件があれば \(\bs{F}\subset\bs{M}\) もガロア拡大になって、\(\bs{F}\subset\bs{M}\subset\bs{K}\) が「ガロア拡大の連鎖」になります。その条件は「ガロア対応」と「正規部分群」の概念を用いて示されます。それが次の正規性定理です。次では \(\bs{Q}\) から始まる体の拡大列で記述しています。
正規性定理
(正規性定理:53C) |
\(\bs{Q}\) のガロア拡大を \(\bs{K}\) とし、\(\mr{Gal}(\bs{K}/\bs{Q})=G\) とする。\(\bs{K}\) の中間体 \(\bs{M}\) と \(G\) の部分群 \(H\) がガロア対応になっているとする。このとき
\(\bs{M}/\bs{Q}\) がガロア拡大である | |
\(H\)が\(G\)の正規部分群である |
の2つは同値である。また、これが成り立つとき、
\(\mr{Gal}(\bs{M}/\bs{Q})\:\cong\:G/H\)
という群の同型が成り立つ。
[① \(\bs{\Rightarrow}\) ②の証明]
\(G\) の任意の元を \(g\) とし、\(\bs{M}\) の任意の元を \(m\) とする。
\(\bs{M}\) が \(\bs{Q}\) のガロア拡大なので、\(m\) の共役な元は \(\bs{M}\) に含まれる。\(g\) は同型写像だから、\(\bs{K}\) の元を共役な元に移す(51D)。つまり、\(g\) を \(m\) に作用させると \(m\) と共役な元に移すことになり、 \(g(m)\in\bs{M}\) である。また \(g^{-1}\) も \(G\) の元だから \(g^{-1}(m)\in\bs{M}\) である。
\(H\) の任意の元を \(h\) とする。\(H\) は \(\bs{M}\) とガロア対応をしているから、\(h\) は \(\bs{M}\) の元を不動にする。ゆえに、
\(hg^{-1}(m)=g^{-1}(m)\)
である。従って、
\(ghg^{-1}(m)=gg^{-1}(m)=m\)
となり、\(ghg^{-1}\) は \(\bs{M}\) の元を不動にするから \(H\) の元である。そうすると、
\(gHg^{-1}\:\subset\:H\)
\(gH\:\subset\:Hg\)
が成り立つ。 \((\br{C})\)
また、\(g(m)\) も \(\bs{M}\) の元なので、
\(hg(m)=g(m)\)
である。従って、
\(g^{-1}hg(m)=g^{-1}g(m)=m\)
となり、\(g^{-1}hg\) も \(\bs{M}\) の元を不動にするから \(H\) の元である。そうすると、
\(g^{-1}Hg\:\subset\:H\)
\(Hg\:\subset\:gH\)
が成り立つ。\((\br{C})\) と \((\br{D})\) により、 \((\br{D})\)
\(gH=Hg\)
となって、左剰余類と右剰余類が一致するから、\(H\) は \(G\) の正規部分群である。
[② \(\bs{\Rightarrow}\) ①の証明]
\(\bs{M}\) の任意の元を \(m\) とする。同型写像の延長の定理(51H)により、\(\bs{M}\) の同型写像 \(s\) は \(\bs{K}\) の同型写像 \(g\) に延長できる。つまり、\(g\) を \(\bs{M}\) の元に限定して作用させたとき \(g(m)=s(m)\) となる \(g\) がある。
\(H\) の任意の元を \(h\) とすると、\(h\) は正規部分群の元なので、
\(g^{-1}hg\:\in\:H\)
である。従って、
\(g^{-1}hg(m)=m\)
\(hg(m)=g(m)\)
となり、\(g(m)\) は \(H\) の任意の元で不動である。
ガロア対応の原理により \(\bs{K}(H)=\bs{M}\) なので、
\(g(m)\:\in\:\bs{M}\)
となり、\(g(m)\) は \(H\) の固定体 \(\bs{M}\) の元である。
\(\bs{M}\)の元に \(g\) を作用させるときは \(g(m)\) は \(s(m)\) そのものなので、
\(s(m)\:\in\:\bs{M}\)
となる。
以上により、\(\bs{M}\) の同型写像による \(m\) の移り先(= \(m\) と共役な元)は \(\bs{M}\) に含まれることになり、\(\bs{M}/\bs{Q}\) はガロア拡大である。[証明終]
[\(\bs{\mr{Gal}(\bs{M}/\bs{Q})\:\cong\:G/H}\) の証明]
同型写像の延長の定理(51H)の証明で示したように、\(\bs{M}\) の同型写像 \(s\) を \(\bs{K}\) の同型写像に延長する可能性は複数ある。\(g_1\) と \(g_2\) を \(s\) の2つの延長とし、\(\bs{M}\)の元を \(m\) とする。\(g_1,\:g_2\) は、\(\bs{M}\) に限定して適用すると \(s\) に等しいから、
\(g_1(m)=s(m)\)
\(g_2(m)=s(m)\)
が成り立つ。
\(g_1^{-1}g_2\) を \(m\) に作用させると
\(\begin{eqnarray}
&&\:\:g_1^{-1}g_2(m)&=g_1^{-1}(s(m))\\
&&&=g_1^{-1}(g_1(m))=m\\
\end{eqnarray}\)
となり、\(g_1^{-1}g_2\) は \(\bs{M}\) の元を不動にする。よって、
\(g_1^{-1}g_2\in\:H\)
\(g_2\in\:g_1H\)
である。
つまり、\(g_2\) は \(H\) の剰余類の一つの集合 \(g_1H\) に入る。以上で、\(\bs{M}\) の同型写像 \(s\) は、同型写像の延長を通して 剰余類 \(G/H\) の一つを定めることが分かる。
逆に \(g_1\) と \(g_2\) が 剰余類 \(G/H\) の同じ集合に属すると、
\(g_2\in\:g_1H\)
\(g_1^{-1}g_2\in\:H\)
\(g_1^{-1}g_2(m)=m\)
\(g_2(m)=g_1(m)\)
となり、\(g_1\) と \(g_2\) は \(\bs{M}\) 上で全く同じ作用をする。従って、\(\bs{M}\) 上で \(g_1,\:g_2\) と同じ作用をする \(\mr{Gal}(\bs{M}/\bs{Q})\) の元 \(s\) を定められる。つまり、剰余類 \(G/H\) の一つの集合が \(\mr{Gal}(\bs{M}/\bs{Q})\) の元を一つ定める。
従って、
\(\mr{Gal}(\bs{M}/\bs{Q})\:\cong\:G/H\)
である。[証明終]
「5.ガロア群とガロア対応」終わり
(次回に続く)
(次回に続く)
2023-04-01 08:44
nice!(0)
No.355 - 高校数学で理解するガロア理論(2) [科学]
\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{#1}} \newcommand{\ol}[1]{\overline{#1}} \newcommand{\sb}{\subset} \newcommand{\sp}{\supset} \newcommand{\al}{\alpha} \newcommand{\sg}{\sigma}\newcommand{\cd}{\cdots}\)
「2.整数の群」「3.多項式と体」「4.一般の群」の3つの章は、第5章以下のガロア理論の核心に入るための準備です。
第2章の目的は2つあり、一つは整数を素材にして「群」と、それに関連した「剰余類」「剰余群」「既約剰余類」など、ガロア理論の理解に必要な概念を説明することです。
もう一つは、第2章の最後にある「既約剰余類群は巡回群の直積と同型である」という定理を証明することです。この定理はガロア理論の最終段階(6.可解性の必要条件)で必要なピースになります。
まず、"整数の群" に入る前に、整数論の基礎ともいえる「ユークリッドの互除法」「不定方程式」「法による演算」「中国剰余定理」から始めます。これらは後の定理の証明にしばしば使います。
2.1 整数
ユークリッドの互除法
自然数 \(a\) と \(b\) の最大公約数を \(\mr{gcd}(a,\:b)\) で表す。自然数 \(a\) を \(b\) で割った余りを \(r\) とすると、
\(\mr{gcd}(a,\:b)=\mr{gcd}(b,\:r)\)
である。
[証明]
記述を簡略化するため、最大公約数を、
\(\mr{gcd}(a,\:b)=x\)
\(\mr{gcd}(b,\:r)=y\)
で表す。\(a\) を \(b\) で割った商を \(p\)、余りを \(r\) とすると、
\(a=pb+r\) \((0\leq r < b)\)
と書ける。\(a\) と \(pb\) は \(x\) で割り切れるから、\(r\) も \(x\) で割り切れる。つまり \(x\) は \(r\) の約数である。\(x\) は \(b\) の約数でもあるから、\(x\) は \(b\) と \(r\) の公約数である。公約数は \(b\) と \(r\) の最大公約数 \(y\) 以下だから、
\(x\leq y\)
である。
一方、\(pb\) と \(r\) は \(y\) で割り切れるから、\(y\) は \(a\) の約数である。\(y\) は \(b\) の約数でもあるから、\(y\) は \(a\) と \(b\) の公約数である。公約数は \(a\) と \(b\) の最大公約数以下だから、
\(y\leq x\)
である。\(x\leq y\) かつ \(y\leq x\) なので \(x=y\)、つまり、
\(\mr{gcd}(a,\:b)=\mr{gcd}(b,\:r)\)
である。[証明終]
この原理を利用して \(\mr{gcd}(a,\:b)\) を求めることができます。もし \(a\) が \(b\) で割り切れるなら \(\mr{gcd}(a,\:b)=b\) です。そうでないなら、\(a\) を \(b\) で割った余り \(r\) を求め、
新 \(a\:\longleftarrow\:b\)
新 \(b\:\longleftarrow\:r\)
と定義し直して、\(a\) が \(b\) で割り切れるかどうかを見ます。こうして次々と \(a\) と \(b\) のペアを作っていけば(=互除法)、\(b\) は単調減少していくので、いずれ \(a\) が \(b\) で割り切れるときがきます。なかなか割り切れなくても、\(b\) が \(1\) までくると絶対に割り切れる。つまり、
\(\mr{gcd}(a,\:b)=b\)
となるのが最終段階で、そのときの \(b\) が最大公約数です。\(b\) が \(1\) までになってしまったら、最大公約数は \(\bs{1}\)、つまり \(\bs{a}\) と \(\bs{b}\) は互いに素です。
ちなみに、ユークリッドの互除法で a と b の最大公約数を求める関数 EUCLID を Python で記述すると次のようになります。
% は Python の剰余演算子で、a % b は「a を b で割った余り」の意味です(定理の記述では \(r\))。つまり、このコードは、
gcd( a, b )=gcd( b, a % b )
という互除法の原理(21A)をストレートに書いたものです(a と b の大小に関係なく動作します)。こういったアルゴリズムはプログラミング言語で記述した方がシンプルでわかりやすくなります。
互除法は多項式の演算にも適用できます。多項式は整数と同じように割り算はできませんが余り算はできるからです。多項式の性質を理解するときに互除法は必須になります。
1次不定方程式
2変数 \(x,\:y\) の1次不定方程式を、
\(ax+by=c\)
(\(a,\:b,\:c\) は整数。\(a\neq0,\:b\neq0\))
とし、\(a\) と \(b\) の最大公約数を \(d\) とする。このとき、
\(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。
このことは1次不定方程式が3変数以上であっても成り立つ。つまり
\(a_1x_1+a_2x_2+\:\cd\:+a_nx_n=c\)
(\(a_i\) は \(0\) 以外の整数)
とし、
\(d=\mr{gcd}(a_1,a_2,\:\cd\:,\:a_n)\)
とする。このとき、
\(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。
[証明]
1次不定方程式が整数解を持つとしたら、方程式の左辺は \(d\) で割り切れる、つまり \(d\) の倍数だから、右辺の \(c\) も \(d\) の倍数である。このことの対偶は「\(c\) が \(d\) の倍数でなければ方程式は整数解を持たない」なので、題意の「そうでなければ整数解を持たない」が証明されたことになる。従って以降は「\(c=kd\) (\(k\) は整数)と表せるなら方程式は整数解を持つ」ことを証明する。まず、変数が2つの場合である。
係数の \(a\) と \(b\) に互除法(21A)を適用し、それと同時に \(x,\:y\) の変数を変換して方程式を変形していく。まず、\(a\) を \(b\) で割った商を \(p\)、余りを \(r\) とする。
\(a=pb+r\)
である。互除法の次のステップの係数と変数を次のように決める。
\(\:\:\:\:\br{①}\left\{
\begin{array}{l}
\begin{eqnarray}
&&a_1=b&\\
&&b_1=r&\\
\end{eqnarray}
\end{array}\right.\)
\(\:\:\:\:\br{②}\left\{
\begin{array}{l}
\begin{eqnarray}
&&x_1=px+y&\\
&&y_1=x&\\
\end{eqnarray}
\end{array}\right.\)
\(\br{②}\) を \(x,\:y\) について解くと、
\(\:\:\:\:\br{③}\left\{
\begin{array}{l}
\begin{eqnarray}
&&x=y_1&\\
&&y=x_1-py_1&\\
\end{eqnarray}
\end{array}\right.\)
である。このよう定義すると、\(\br{①}\)、\(\br{②}\) を使って、
\(\begin{eqnarray}
&&\:\:a_1x_1+b_1y_1&=b(px+y)+rx\\
&&&=pbx+by+rx\\
&&&=(pb+r)x+by\\
&&&=ax+by\\
\end{eqnarray}\)
と計算できるので、不定方程式は、
\(a_1x_1+b_1y_1=c\)
となり、係数の値がより小さい方程式に変形できる。互除法の原理(21A)により、\(a_1\) と \(b_1\) の最大公約数は \(d\) のままである。この方程式の \(x_1,\:y_1\) が求まれば、\(\br{③}\) を使って \(x,\:y\) が求まる。
以上の式の変形は、\(1\leq i\) として、\(a_i\) を \(b_i\) で割った商と余りを、
\(a_i=p_ib_i+r_i\)
のように求め、互除法の次のステップを、
\(a_{i+1}=b_i\)
\(b_{i+1}=r_i\)
\(x_{i+1}=p_ix_i+y_i\)
\(y_{i+1}=x_i\)
とすることで続けていける。このように、係数に互除法の適用を繰り返し、同時に変数を変換していく。そして互除法の最終段階で、
\(a_nx_n+b_ny_n=c\)
となったとする。この段階では \(a_n\) は \(b_n\) で割り切れ、そのときの \(b_n\) は最大公約数 \(d\) である。つまり。
\(a_nx_n+dy_n=c\)
である。もし \(c\) が \(d\) の倍数であれば、つまり \(c=kd\) (\(k\) は整数)なら、
\(x_n=0\)
\(y_n=k\)
という整数解を必ずもつ。従って、変数の変換過程を逆にたどって \(x,\:y\) が求まる。以上で2変数の場合に題意が正しいことが証明でき、同時に1次不定方程式の解を求めるアルゴリズムも明らかになった。
ちなみに、一次不定方程式の解の一つを求めるアルゴリズムを Python の関数で記述すると、次のようにシンプルです。
数学的帰納法を使って、3変数以上の場合を証明する。\(n=2\) の場合に成り立つことを示したので、\(n=k\) の場合に成り立つと仮定する。つまり、
と仮定する。\(n=k+1\) の場合の不定方程式を、
\(a_1x_1+a_2x_2+\:\cd\:+a_kx_k+a_{k+1}x_{k+1}=c_{k+1}\)
\(\begin{eqnarray}
&&\:\: d_k&=\mr{gcd}(a_1,a_2,\:\cd\:,\:a_k)\\
&&\:\: d_{k+1}&=\mr{gcd}(a_1,a_2,\:\cd\:,\:a_k,\:a_{k+1})\\
\end{eqnarray}\)
とし、この方程式が整数解をもつ条件を調べる。方程式を移項すると、
\(a_1x_1+a_2x_2+\:\cd\:+a_kx_k=c_{k+1}-a_{k+1}x_{k+1}\)
となるが、この不定方程式が整数解をもつのは、数学的帰納法の仮定によって、
左辺\(=d_k\) の整数倍
のときである。つまり、
\(c_{k+1}-a_{k+1}x_{k+1}=d_k\cdot y\)
という、2つの変数 \(x_{k+1},\:y\) の不定方程式が整数解をもつときである。式を移項すると、
\(a_{k+1}x_{k+1}+d_k\cdot y=c_{k+1}\)
であるが、これは証明済みの \(n=2\) のときの定理によって、
\(c_{k+1}=m\cdot\mr{gcd}(d_k,\:a_{k+1})\) (\(m\) は整数)
の場合に整数解をもつ。ここで、
\(\mr{gcd}(d_k,\:a_{k+1})=d_{k+1}\)
なので、
\(c_{k+1}=m\cdot d_{k+1}\) (\(m\) は整数)
の場合にのみ、\(n=k+1\) の不定方程式は整数解をもつことになる。
つまり、\(n=k\) のときに題意が成り立つと仮定すると、\(n=k+1\) のときにも成り立つ。\(n=2\) のときには成り立つから、\(n\geq3\) でも成り立つ。[証明終]
重要なのは、係数が互いに素な場合です。不定方程式の解の存在(21B)から、次の定理がすぐに出てきます。
\(0\) でない整数 \(a\) と \(b\) が互いに素とすると、1次不定方程式、
\(ax+by=1\)
は整数解をもつ。また、\(n\) を任意の整数とすると、
\(ax+by=n\)
は整数解をもつ。あるいは、任意の整数 \(n\) は、
\(n=ax+by\) \((x,\:y\) は整数)
の形で表現できる。
これは3変数以上であっても成り立つ。たとえば3変数の場合は、\(0\) でない整数 \(a,\:b,\:c\) の最大公約数が \(1\)、つまり、
\(\mr{gcd}(a,b,c)=1\)
であるとき、\(n\) を任意の整数として、1次不定方程式、
\(ax+by+cz=n\)
は整数解を持つ。
互除法と同じように、不定方程式の解の存在定理 (21B)と(21C)も、多項式の性質を理解する上で重要です。
法による演算
\(a,\:b\) を整数、\(n\) を自然数とする。\(a\) を \(n\) で割った余りと、\(b\) を \(n\) で割った余りが等しいとき、
\(a\equiv b\:\:(\mr{mod}\:n)\)
と書き、\(a\) と \(b\) は「法 \(n\) で合同」という。あるいは「\(\mr{mod}\:n\) で合同」、「\(\mr{mod}\:n\) で(見て)等しい」とも記述する。
法による演算の規則は、さまざまありますが、主なものは次の通りです。このような演算を以降の説明で適時使います。
\(a,\:b,\:c,\:d\) を整数、\(n,r\) を自然数とし、
\(a\equiv b\:\:(\mr{mod}\:n)\)
\(c\equiv d\:\:(\mr{mod}\:n)\)
とする。このとき、
である。
中国剰余定理
\(n_1\) と \(n_2\) を互いに素な自然数とする。\(a_1\) と \(a_2\) を、\(0\leq a_1 < n_1,\:0\leq a_2 < n_2\) を満たす整数とする。このとき、
\(x\equiv a_1\:\:(\mr{mod}\:n_1)\)
\(x\equiv a_2\:\:(\mr{mod}\:n_2)\)
の連立方程式を満たす整数 \(x\) が存在する。この \(x\) は \(\mr{mod}\:n_1n_2\) でみて唯一である。つまり、\(0\leq x < n_1n_2\) の範囲に解が唯一存在する。
[証明]
もし \(x\) と \(y\:\:(y\leq x)\) が連立方程式を満たすとすると、
\(x\equiv a_1\:\:(\mr{mod}\:n_1)\)
\(y\equiv a_1\:\:(\mr{mod}\:n_1)\)
なので、
\(x-y\equiv0\:\:(\mr{mod}\:n_1)\)
であり、\(x-y\) は \(n_1\) で割り切れる。同様にして \(x-y\) は \(n_2\) でも割り切れる。\(n_1\) と \(n_2\) は互いに素なので、\(x-y\) は \(n_1n_2\) で割り切れる。従って \(x-y\) は \(n_1n_2\) の倍数であり、
である。従って連立方程式に解があるとしたら \(\mr{mod}\:n_1n_2\) でみて唯一である。つまり \(0\leq x < n_1n_2\) の範囲で唯一に決まる。
\(n_1,\:n_2\) は互いに素なので、不定方程式の解の存在定理(21C)により、
\(n_1m_1+n_2m_2=1\)
を満たす \(m_1,\:m_2\) が存在する。ここで、
\(x=a_2n_1m_1+a_1n_2m_2\)
とおくと、
\(\begin{eqnarray}
&&\:\:x&=a_2n_1m_1+a_1n_2m_2\\
&&&=a_2n_1m_1+a_1(1-n_1m_1)\\
&&&=a_1+n_1m_1(a_2-a_1)\\
&&&\equiv a_1\:\:(\mr{mod}\:n_1)\\
\end{eqnarray}\)
であり、
\(\begin{eqnarray}
&&\:\:x&=a_2n_1m_1+a_1n_2m_2\\
&&&=a_2(1-n_2m_2)+a_1n_2m_2\\
&&&=a_2+n_2m_2(a_1-a_2)\\
&&&\equiv a_2\:\:(\mr{mod}\:n_2)\\
\end{eqnarray}\)
なので、\(x\) は連立方程式の解である。この解は、上での証明のとおり \(\mr{mod}\:n_1n_2\) でみて唯一である。[証明終]
中国剰余定理は3数以上に拡張できて、次が成り立ちます。
\(n_1,\:n_2,\:\cd\:,\:n_k\) を、どの2つをとっても互いに素な自然数とする。\(a_i\) を \(0\leq a_i < n_i\:\:(1\leq i\leq k)\) を満たす整数とする。このとき、
\(x\equiv a_1\:\:(\mr{mod}\:n_1)\)
\(x\equiv a_2\:\:(\mr{mod}\:n_2)\)
\(\vdots\)
\(x\equiv a_k\:\:(\mr{mod}\:n_k)\)
の連立合同方程式を満たす整数 \(x\) が存在する。この \(x\) は \(\mr{mod}\:n_1n_2\cd n_k\) でみて唯一である。つまり、\(0\leq x < n_1n_2\cd n_k\) の範囲では唯一の解が存在する。
[証明]
自然数 \(N\) を
\(N=n_1n_2\cd n_k\)
と定義する。
\(\mr{gcd}\left(\dfrac{N}{n_i},n_i\right)=1\:\:\:(1\leq i\leq k)\)
なので、不定方程式の解の存在の定理(21C)により、
\(\dfrac{N}{n_i}s_i+n_it_i=1\:\:\:(1\leq i\leq k)\)
を満たす整数解、\(s_i,\:t_i\:\:(1\leq i\leq k)\) が存在する。
\(x=\displaystyle\sum_{i=1}^{k}a_i\dfrac{N}{n_i}s_i\)
と定義すると、\(j\neq i\) である \(j\) について、
\(\dfrac{N}{n_j}\equiv0\:\:(\mr{mod}\:n_i)\)
だから、\(\mr{mod}\:n_i\) でみると、\(x\) を定義する総和記号のなかは \(i\) の項だけが残る。つまり、
\(\begin{eqnarray}
&&\:\:x&\equiv a_i\dfrac{N}{n_i}s_i\:\:(\mr{mod}\:n_i)\\
&&&=a_i(1-n_it_i)\\
&&&\equiv a_i\:\:(\mr{mod}\:n_i)\\
\end{eqnarray}\)
となって、\(x\) は連立合同方程式の解である。
連立合同方程式に2つの解、\(x,\:y\) があったとすると、
\(\begin{eqnarray}
&&\:\:x-y&\equiv a_i-a_i &(\mr{mod}\:n_i)\\
&&&=0 &(\mr{mod}\:n_i)\\
\end{eqnarray}\)
となり、\(x-y\) は \(n_i\) の倍数である。これは \(1\leq i\leq k\) のすべての \(i\) で成り立ち、また \(n_i\:\:(1\leq i\leq k)\) は、どの2つをとっても互いに素である(=共通な因数が全くない)から、\(x-y\) は \(N\) の倍数である。従って、
\(x\equiv y\:\:(\mr{mod}\:N)\)
であり、\(x\) は \(\mr{mod}\:n_1n_2\cd n_k\) でみて唯一である。[証明終]
2.2 群
これ以降、整数を素材に「群」と、それに関連した概念の説明をします。まず、群の定義からです。
群の定義
集合 \(G\) が次の ① ~ ④ を満たすとき、\(G\) は群(group)であると言う。
整数 \(\bs{Z}\)
整数の集合を \(\bs{Z}\) と書きます。\(\bs{Z}\) は「加法(足し算)を演算とする群」になります。単位元は \(0\) で、元 \(x\) の逆元は \(-x\) です。この群の元の数は無限なので「無限群」です。
整数の加法は、\(x+y=y+x\) と演算の順序を入れ替えることができます。このような群が可換群です。アーベル群とも言います。
なお、有理数は \(\bs{Q}\)、実数は \(\bs{R}\)、複素数は \(\bs{C}\) で表しますが、\(\bs{Q}\)、\(\bs{R}\)、\(\bs{C}\) は、\(\bs{Z}\) を同じように加法に関して群です(=加法群)。と同時に \(\bs{Q}\)、\(\bs{R}\)、\(\bs{C}\) から加法の単位元 \(0\) を除くと、乗法に関しても群になります。その単位元は \(1\) です。
部分群 \(n\bs{Z}\)
群 \(G\) の部分集合 \(H\) が、\(G\) と同じ演算で群としての定義を満たすとき、\(H\) を部分群(subgroup)と言います。
\(G\) の単位元 \(e\) だけから成る部分集合 \(\{\:e\:\}\) は群としての定義を満たし、部分群です。また \(G\) そのものも "\(G\)の部分集合" であり、部分群です。これらを \(G\) の自明な部分群と言います。
\(\bs{Z}\) の元の一つを \(n\) とし(\(n\neq0\))、\(n\) の倍数の集合を \(n\bs{Z}\) と表記します。\(n\bs{Z}\) は加法を演算として群の定義を満たすので、\(\bs{Z}\) の部分群です。\(n\bs{Z}\) も無限群かつ可換群です。たとえば \(n=6\) とすると、
\(6\bs{Z}=\{\cd,\:-6,\:0,\:6,\:12,\:18,\:\cd\}\)
です。
剰余類と剰余群
部分群を用いて、元の数が有限個である有限群を作ることができます。一般に、群 \(G\) の部分群を \(H\) とするとき(演算を "\(\cdot\)" とします)、\(G\) の任意の元 \(g\) を取り出して、
\(g\cdot H\)
とした集合を剰余類(coset / residue class)と言います。これは「\(g\) と、集合 \(H\) のすべての元を演算した結果の集合」の意味です。
\(\bs{Z}\) と その部分群 \(6\bs{Z}\) を例にとると、\(\bs{Z}\) の任意の元を \(i\) として、
\(i+6\bs{Z}\)
が剰余類です。具体的にその集合を書くと、
\(\vdots\)
\(0+6\bs{Z}=\{\cd,\:-6,\:\:0,\:\phantom{1}6,\:12,\:18,\:\cd\}\)
\(1+6\bs{Z}=\{\cd,\:-5,\:\:1,\:\phantom{1}7,\:13,\:19,\:\cd\}\)
\(2+6\bs{Z}=\{\cd,\:-4,\:\:2,\:\phantom{1}8,\:14,\:20,\:\cd\}\)
\(3+6\bs{Z}=\{\cd,\:-3,\:\:3,\:\phantom{1}9,\:15,\:21,\:\cd\}\)
\(4+6\bs{Z}=\{\cd,\:-2,\:\:4,\:10,\:16,\:22,\:\cd\}\)
\(5+6\bs{Z}=\{\cd,\:-1,\:\:5,\:11,\:17,\:23,\:\cd\}\)
\(6+6\bs{Z}=\{\cd,\:\phantom{-}0,\:\:6,\:12,\:18,\:24,\:\cd\}\)
\(7+6\bs{Z}=\{\cd,\:\phantom{-}1,\:\:7,\:13,\:19,\:25,\:\cd\}\)
\(\vdots\)
などです。以降、剰余類 \(i+6\bs{Z}\) を \(\ol{\,i\,}\) と記述します。つまり、
\(\ol{\,i\,}=i+6\bs{Z}\)
です。上の表示を見ると分かるように、たとえば \(\ol{\,1\,}\) と \(\ol{\,7\,}\) は集合として同じものです。さらに、
\(\cd=\ol{-11}=\ol{-5}=\ol{\,1\,}=\ol{\,7\,}=\ol{13}=\cd\)
であり、これらは同じ集合です。これらの集合の中から一つの元を選んで「代表元」と呼ぶことにします。以降、分かりやすいように \(1\) を代表元とします。その他の剰余類についても同じようにすると、部分群 \(6\bs{Z}\) による剰余類は、
\(\ol{\,0\,},\:\ol{\,1\,},\:\ol{\,2\,},\:\ol{\,3\,},\:\ol{\,4\,},\:\ol{\,5\,}\)
の6つで表されることになります。これらの剰余類には重複がありません。また、全部の和集合をとると \(\bs{Z}\) になります。記号で書くと、\(\phi\) を空集合として、
\(\ol{\,i\,}\:\cap\:\ol{\,j\,}\:=\:\phi\:\:(0\leq i,\:j\leq6,\:i\neq j)\)
\(\bs{Z}=\ol{\,0\,}\:\cup\:\ol{\,1\,}\:\cup\:\ol{\,2\,}\:\cup\:\ol{\,3\,}\:\cup\:\ol{\,4\,}\:\cup\:\ol{\,5\,}\)
です。別の見方をすると、\(i,\:j\) を任意の整数するとき、
と言えます。平たく言うと、\(n\)(上の例では \(6\))で割った余りが同じ整数を集めたものが剰余類です。"剰余" という用語はそこからきています。
剰余類のうち、\(\ol{\,0\,}\) は \(\bs{Z}\) の部分群ですが、\(\ol{\,i\,}\:(i\neq0)\) の集合は \(\bs{Z}\) の部分群ではありません。集合の元と元のたし算が集合を "はみ出す" からです。しかし、剰余類同士の演算(=集合と集合の演算)を定義することにより、剰余類を元とする群を構成できます。それが次です。
剰余類に加算を定義できます。つまり、\(\ol{\,i\,}+\ol{\,j\,}\) を、
\(\ol{\,i\,}+\ol{\,j\,}=\ol{(\:i+j\:)}\) (右辺の \(+\) は整数の加算)
と定義すると、この演算の定義で剰余類は群になり、
\(\bs{Z}/n\bs{Z}\)
と表します。この群の元は集合(=剰余類)です。この群を剰余群(あるいは商群。quotient group)と言います。元の数は有限なので有限群です。また演算が整数の加算なので可換であり、「有限可換群」です。
一般に、有限群 \(G\) の元の数を群の位数(order)と呼び、
\(|G|\) あるいは \(\#G\)
で表します。剰余群では、
です。
生成元と巡回群
剰余群 \(\bs{Z}/n\bs{Z}\) は、元 \(\ol{\,1\,}\) だけをもとに群演算を繰り返すことによって、すべての元を作り出すことができます。\(\bs{Z}/6\bs{Z}\) を例にとると、
\(\ol{\,2\,}=\ol{\,1\,}+\ol{\,1\,}\)
\(\ol{\,3\,}=\ol{\,1\,}+\ol{\,1\,}+\ol{\,1\,}\)
などであり
\(\ol{\,0\,}=\ol{\,1\,}+\ol{\,1\,}+\ol{\,1\,}+\ol{\,1\,}+\ol{\,1\,}+\ol{\,1\,}\)
です。群にこのような元がある場合、それを生成元(generator)と呼びます。\(\bs{Z}/6\bs{Z}\) の場合は \(\ol{\,1\,}\) のほかに \(\ol{\,5\,}\) も生成元です。\(\ol{\,i\,}\) を \(k\) 個加算することを、\(k\cdot\ol{\,i\,}\) と書くことにします。
\(k\cdot\ol{\,i\,}=\overbrace{\ol{\,i\,}+\ol{\,i\,}+\cd+\ol{\,i\,}}^{k\:個加算}\)
です。\(\ol{\,5\,}\) については、
\(1\cdot\ol{\,5\,}=\ol{\,5\,},\:\:2\cdot\ol{\,5\,}=\ol{\,4\,},\:\:3\cdot\ol{\,5\,}=\ol{\,3\,}\)
\(4\cdot\ol{\,5\,}=\ol{\,2\,},\:\:5\cdot\ol{\,5\,}=\ol{\,1\,},\:\:6\cdot\ol{\,5\,}=\ol{\,0\,}\)
のように、\(\ol{\,5\,}\) を起点として全部の元が生成され、\(\ol{\,5\,}\) が生成元であることがわかります。
剰余群 \(\bs{Z}/n\bs{Z}\) においては、\(1\leq g < n\) である整数 \(g\) が \(n\) と互いに素であるとき、\(\ol{\,g\,}\) は生成元になります。その理由ですが、
\(i\cdot\ol{\,g\,}=j\cdot\ol{\,g\,}\)
だとすると、これは、法 \(n\) における整数の合同式で、
\(ig\equiv jg\:\:(\mr{mod}\:n)\)
を意味します。つまり、
\((j-i)g\equiv0\:\:(\mr{mod}\:n)\)
ですが、\(g\) が \(n\) と互いに素なため、\((j-i)\) は \(n\) で割り切れなければなりません。しかし \(1\leq(j-i)\leq(n-1)\) なので、矛盾します。従って、\(n\) 個の剰余類の列 \((\br{A})\) は、全て違ったものです。剰余群 \(\bs{Z}/n\bs{Z}\) の群位数は \(n\) なので、\((\br{A})\) は \(\bs{Z}/n\bs{Z}\) の全ての元であり、従って \(\ol{\,g\,}\) は生成元です。
\(n\) が素数 \(p\) の場合は、\(p\) 未満の自然数はすべて \(p\) と互いに素なので、単位元 \(\ol{\,0\,}\) を除く \(\bs{Z}/p\bs{Z}\) の元が生成元になります。
\(k\) 個の \(\ol{\,i\,}\) の群演算をして初めて、結果が単位元 \(\ol{\,0\,}\) になるときの \(k\) を、\(\ol{\,i\,}\) の位数(order)といいます。群の位数と紛らわしいですが、これは群の「元の位数」です。\(\bs{Z}/6\bs{Z}\) の場合、「元 \(\rightarrow\) 位数」の対応は、
\(\ol{\,0\,}\:\rightarrow\:1,\:\:\ol{\,1\,}\:\rightarrow\:6,\:\:\ol{\,2\,}\:\rightarrow\:3\)
\(\ol{\,3\,}\:\rightarrow\:2,\:\:\ol{\,4\,}\:\rightarrow\:3,\:\:\ol{\,5\,}\:\rightarrow\:6\)
です。位数という用語を使うと、生成元とは「位数が群位数に等しい元」のことです。
群 \(G\) が一つの生成元から生成されるとき、\(G\) を巡回群(cyclic group)と言います。\(\bs{Z}/10\bs{Z}\) の例をとると、\(10\) と互いに素な数を考えて、生成元は \(\ol{\,1\,},\:\ol{\,3\,},\:\ol{\,7\,},\:\ol{\,9\,}\) の4つです。従って、たとえば \(\ol{\,7\,}\) 同士の加算を繰り返すと、
というように、\(\bs{Z}/10\bs{Z}\) の全ての元が現れたあとに再び \(\ol{\,7\,}\) に戻って "巡回" します。"巡回" 群と呼ばれるゆえんです。
群の直積
\(G,\:H\) を群とします。\(G\) の任意の元 \(g\) と \(H\) の任意の元 \(h\) のペア \((g,\:h)\) 作り、このペアを元とする集合を考えます。以降、群の演算を表す "\(\cdot\)" を省略します。
集合の任意2つの元を、
\(a=(g_a,\:h_a)\)
\(b=(g_b,\:h_b)\)
とし、\(a\) と \(b\) の演算を、
\(ab=(g_ag_b,\:h_ah_b)\)
で定義すると、この集合は群となります。この群を \(G\) と \(H\) の直積といい、
\(G\times H\)
で表します。有限群の場合、群の位数は、
\(|G\times H|=|G|\cdot|H|\) (\(\cdot\) は整数のかけ算)
です。以上は2つの群の直積ですが、同様に3つ以上の群の直積も定義できます。
群の同型
\(G\) と \(H\) を群とします。\(G\) から \(H\) への1対1の写像 \(f\) で、\(G\) の任意の2つの元 \(x,\:y\) について、
\(f(xy)=f(x)f(y)\)
が成り立つ写像があるとき、\(G\) と \(H\) は「同型である」といい、
\(G\cong H\)
と表します。同型であるということは、2つの群の元が1対1対応するのみならず、元の演算前、演算後も1対1対応していることを意味します。従って同型である群は「同じもの」と見なせます。
\(\bs{Z}/15\bs{Z}\) で群の同型の例を示します。ここでは、整数 \(i\) を 整数 \(a\) で割った余りを \(i_a\) と書きます。\(\bs{Z}/15\bs{Z}\) の任意の元 \(i\:\:(0\leq i\leq14)\) について、写像 \(f\) を、
\(f\::\:i\:\longmapsto\:(i_3,\:i_5)\)
で定めると、\(f\) は \(\bs{Z}/15\bs{Z}\) から \((\bs{Z}/3\bs{Z})\times(\bs{Z}/5\bs{Z})\) への同型写像になります。
そのことを確かめると、まず \(i\) を決めれば \(i_3,\:i_5\) は一意に決まります。また\(i_3,\:i_5\) を決めると、\(3\) と \(5\) は互いに素なので、中国剰余定理(21F)により、\(0\leq i\leq14\) の範囲で \(i\) が一意に決まります。つまり \(f\) は1対1写像(数学用語で "全単射")です。また、2つの元 \(i,\:j\) について
\(\begin{eqnarray}
&&\:\:f(i+j)&=(\:(i+j)_3,\:(i+j)_5\:)\\
&&&=(i_3+j_3,\:i_5+j_5)\\
&&\:\:f(i)+f(j)&=(i_3,\:i_5)+(j_3,\:j_5)\\
&&&=(i_3+j_3,\:i_5+j_5)\\
&&\:\:f(i+j)&=f(i)+f(j)\\
\end{eqnarray}\)
が成り立つので、\(f\) は同型写像の要件を満たします。従って、
\(\bs{Z}/15\bs{Z}\cong(\bs{Z}/3\bs{Z})\times(\bs{Z}/5\bs{Z})\)
です。一般に、\(a\) と \(b\) を互いに素な自然数とすると、
\(\bs{Z}/(ab)\bs{Z}\cong(\bs{Z}/a\bs{Z})\times(\bs{Z}/b\bs{Z})\)
です。これは2つの数だけでなく、\(n\) が \(k\)個の数 \(a_1,\:a_2,\:\cd\:a_k\) の積で表され、かつ、\(a_1,\:a_2,\:\cd\:a_k\) のどの2つをとっても互いに素なときには、中国剰余定理・多連立(21G)によって、
\(\bs{Z}/n\bs{Z}\cong(\bs{Z}/a_1\bs{Z})\times(\bs{Z}/a_2\bs{Z})\times\cd\times(\bs{Z}/a_k\bs{Z})\)
が成り立ちます。一般に 自然数 \(n\) は \(p_i\) を素数として、
\(n=p_1^{n_1}p_2^{n_2}\cd p_k^{n_k}\)
と素因数分解され、\(p_i^{n_i}\:\:(1\leq i\leq k)\) はどの2つをとっても互いに素なので、
\(\bs{Z}/n\bs{Z}\cong(\bs{Z}/p_1^{n_1}\bs{Z})\times(\bs{Z}/p_2^{n_2}\bs{Z})\times\cd\times(\bs{Z}/p_k^{n_k}\bs{Z})\)
成り立ちます。
2.3 既約剰余類群
2.2 節の剰余群は、整数の加算を演算の定義とする群でした。これに対して、整数の乗算を演算の定義とする群が構成できます。それが既約剰余類群です。
剰余群 \(\bs{Z}/n\bs{Z}\) から、代表元が \(n\) と互いに素なものだけを選び出したものを既約剰余類という。
「既約剰余類」は、乗算に関して群になる。これを「既約剰余類群」といい、\((\bs{Z}/n\bs{Z})^{*}\) で表す。
定義により、\((\bs{Z}/n\bs{Z})^{*}\) の群位数は \(\varphi(n)\) である。\(\varphi\) はオイラー関数で、\(\varphi(n)\) は \(n\) 以下で \(n\) と互いに素な自然数の数を表す。\(n\) が素数 \(p\) の場合の群位数は \(\varphi(p)=p-1\) である。
[証明]
「既約剰余類」は、乗算に関して群になることを証明する。まず例をあげると、\((\bs{Z}/10\bs{Z})^{*}\) の元は \(10\) と互いに素な代表元をもつ \(1,\:3,\:7,\:9\) である。この元の乗算による演算表を作ると、
となって、演算は閉じていて、単元 \(1\) があり、逆元があることがわかる( \(3^{-1}=7,\:7^{-1}=3,\:9^{-1}=9\) である\()\)。つまり群として成り立っている。
一般に、\(a,\:b\) が \(n\) と素だとすると、\(ab\) も \(n\) と素なので、\((\bs{Z}/n\bs{Z})^{*}\) は乗算で閉じている。また、不定方程式の解の存在定理(21C)により、
\(ax+ny=1\)
を満たす \(x,\:y\) が存在する。この式の両辺を \(\mr{mod}\:n\) でみると、
\(ax\equiv1\:\:(\mr{mod}\:n)\)
となる。この方程式の解の一つ(=特殊解)を \(x_0\) とし、\(k\) を整数として、\(x=x_0+kn\) とおくと\(,\)
\(\begin{eqnarray}
&&\:\:ax&=a(x_0+kn)\\
&&&=ax_0+akn\\
&&&\equiv1\:\:(\mr{mod}\:n)\\
\end{eqnarray}\)
なので、\(x\) も解である。従って解を \(1\leq x < n\) の範囲で選ぶことができる。つまり、\((\bs{Z}/n\bs{Z})^{*}\) の元 \(a\) に対して逆元が定義できることになり、\((\bs{Z}/n\bs{Z})^{*}\) は群である。[証明終]
2.4 有限体 \(\bs{F}_p\)
\(\bs{Z}/p\bs{Z}\) は体
剰余群 \(\bs{Z}/n\bs{Z}\) において \(n\) が素数 \(p\) である \(\bs{Z}/p\bs{Z}\) を考えます。\(p\) 未満の自然数は \(p\) と互いに素なので、既約剰余類群 \((\bs{Z}/p\bs{Z})^{*}\) は、\(\bs{Z}/p\bs{Z}\) から 加法の単位元 \(0\) を除いたものになります。つまり \(\bs{Z}/p\bs{Z}\) は加法について群であり、\(\bs{Z}/p\bs{Z}\:-\:\{\:0\:\}\) が乗法について群になっている。このような集合を体(field)と言います。
体とは加減乗除ができて、加法と乗法を結びつける分配則、
\(a(b+c)=ab+ac\)
が成り立つ集合です。\(\bs{Z}/p\bs{Z}\) は整数の演算をもとに定義されているので分配則が成り立ちます。
\(\bs{\bs{Z}/p\bs{Z}}\) を体としてみるとき、\(\bs{\bs{F}_p}\) と表記します。有理数 \(\bs{Q}\)、実数 \(\bs{R}\)、複素数 \(\bs{C}\) は体ですが、これらは無限集合です。一方、\(\bs{F}_p\) は有限集合なので有限体です。
有限体 \(\bs{F}_p\) における定数、変数、多項式、方程式の計算は、有理数/実数/複素数と同じようにできます。以下、今後の証明に使うので、\(\bs{F}_p\) 上の多項式と方程式を説明します。つまり、係数が \(\bs{F}_p\) の数である多項式や方程式です。
有限体の多項式と方程式
\(\bs{F}_p\) 上の多項式は、
\(f(x)=a_nx^n+a_{n-1}x^{n-1}+\:\cd\:+a_1x+a_0\:\:\:(a_i\in\bs{F}_p)\)
です。見た目は整数係数の多項式ですが、係数は \(\bs{F}_p\) の元です。\(\bs{F}_p\) は体なので、\(\bs{F}_p\) 上の多項式は加減算\(\cdot\)乗算\(\cdot\)余りをともなう除算(=剰余算、余り算)が、\(\bs{Q}\) 上の多項式と同じようにできます。従ってこれらの演算にもとづいた概念、定理は、\(\bs{Q}\) 上の多項式の場合と同じです。つまり、
などです(なお、多項式\(\cdot\)方程式についてのこれらの概念や定理は「3.1 多項式」で説明します)。
たとえば、\(\bs{F}_5\) における多項式、\(x^2+1\) は、
\(x^2+1=(x-2)(x-3)\) [\(\bs{F}_5\)]
と、2つの1次多項式に因数分解できます。
\(\begin{eqnarray}
&&\:\:(x-2)(x-3)&=x^2-5x+6\\
&&&=x^2+1\\
\end{eqnarray}\)
が成り立つからです。従って、方程式、
\(x^2+1=0\) [\(\bs{F}_5\)]
の解は、\(x=2,\:3\) です。
一方、\(\bs{F}_7\) において \(x^2+1\) はこれ以上因数分解できない多項式です。なぜなら、
\(f(x)=x^2+1\) [\(\bs{F}_7\)]
とおくと、
\(f(k)\neq0\:\:(0\leq k\leq6)\) [\(\bs{F}_7\)]
だからです。もちろん剰余算(余り算)はできて、\(x^2+1\) を \(x-2\) で割ると、
\(x^2+1=(x-2)(x+2)+5\) [\(\bs{F}_7\)]
と計算できます。これは \(f(2)=5\)、つまり \(f(x)\) を \(x-2\) で割った余りは \(5\)、を意味します。
以上を踏まえて、\(\bs{F}_p\) 上の多項式\(\cdot\)方程式に関する次の定理を証明します(次節の定理の証明に使います)。方程式の "解" は "\(\bs{F}_p\) における解" の意味です。
\(\bs{F}_p\) 上の1次方程式、
\(ax+b=c\)
は1個の解をもつ。
[証明]
両辺に \(b\) の加法の逆元 \(-b\) を加えると、
\(ax=c+(-b)\)
となり、この両辺に 乗法の逆元 \(a^{-1}\) を掛けると、
\(x=a^{-1}(c+(-b))\)
となり、唯一の解が求まる。[証明終]
\(\bs{F}_p\) 上の多項式を \(f(x)\) とする。
\(f(a)=0\) なら、\(f(x)\) は \(x-a\) で割り切れる。
[証明]
\(f(x)\) を \(x-a\) で割った商を \(g(x)\)、余りを \(b\) とする。
\(f(x)=(x-a)g(x)+b\)
であるが、\(f(a)=0\) なので \(b=0\) である。従って、
\(f(x)=(x-a)g(x)\)
と表され、\(f(x)\) は \(x-a\) で割り切れる。[証明終]
\(\bs{F}_p\) 上の \(n\)次多項式を \(f_n(x)\) とする。方程式、
\(f_n(x)=0\)
の解は、高々 \(n\) 個である。
[証明]
\(n\) に関する数学的帰納法を使う。\(\bs{F}_p\) 上 の1次方程式の解は1個だから(24A)、題意は成り立つ。\(n\) 以下で題意が成り立つと仮定する。
\(\bs{F}_p\) 上の \(n+1\) 次方程式 \(f_{n+1}(x)=0\) の解がなければ、\(n+1\) でも題意は成り立っている。もし1個の解 \(a\) があるとすると\(f_{n+1}(a)=0\) なので、\(f_{n+1}(x)\) は \(x-a\) で割り切れる(24B)。つまり、
\(f_{n+1}(x)=(x-a)g(x)\)
となるが、\(g(x)\) は \(n\)次多項式だから、方程式、
\(g(x)=0\)
の解は高々 \(n\) 個である。従って、\(f_{n+1}(x)=0\) の解は高々 \(n+1\) 個である。ゆえに帰納法により題意は正しい。[証明終]
2.5 既約剰余類群は巡回群
2.5 節の目的は、2章の最終目的である、
既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) は巡回群の直積に同型である
という定理を証明することです。証明には少々長いステップが必要ですが、この定理はガロア理論の最終段階で必要になります。まず、群の「元の位数」の性質から始めます。
位数
\((\bs{Z}/n\bs{Z})^{*}\) の元を \(a\) とする。以下が成り立つ。
[補題1]
\(a^x=1\) となる \(x\:\:(1\leq x)\) が必ず存在する。\(x\) のうち最小のものを \(d\) とすると、\(d\) を \(a\) の位数(order)と呼ぶ。
[補題2]
\(a,\:a^2,\:a^3,\:\cd\:,\:a^d=1\) は 全て異なる。ないしは、
\(a^0=1,\:a,\:a^2,\:\cd\:,a^{d-1}\) は 全て異なる。
[補題3]
\(n=p\)(素数)とする。\(d\) 乗すると \(1\) になる \((\bs{Z}/p\bs{Z})^{*}\) の元は、\(a,\:a^2,\:a^3,\:\cd\:,\:a^d\) がそのすべてである。
[補題4]
\(a^x=1\) となる \(x\) は \(d\) の倍数である。
[補題5]
\(a\) の位数を \(d\) とすると、\(d\) は 群位数 の約数である。
[証明]
[補題1]
\((\bs{Z}/n\bs{Z})^{*}\) は有限群だから、\(a^j=a^i\:\:(i < j)\) となる \(i,\:j\) は必ず存在する。\(a^{-i}\) を両辺に掛けると \(a^{j-i}=1\) となり\(a^x=1\) となる \(x\) が必ず存在する。従って \(a\) の位数が定義できる。
[補題2]
\(a^j=a^i\:\:(1\leq i < j\leq d)\) となる \(i,\:j\) があったとすると、両辺に \(a^{-1}\) を掛けて \(a^{j-i}=1\) となるが、\(j-i < d\) だから、\(a^x=1\) となる最小の \(x\) が \(d\) ということと矛盾する。従って、\(a,\:a^2,\:a^3,\:\cd\:,\:a^d=1\) は 全て異なる。
[補題3]
\(a^i\:\:(1\leq i\leq d)\) を \(d\) 乗すると、
\((a^i)^d=(a^d)^i=1\)
であり、これら \(d\) 個の元はすべて \(d\) 乗すると \(1\) になる。
一方、\(d\) 乗すると \(1\) になる 元は 有限体 \(\bs{F}_p\) 上の \(d\) 次方程式 \(x^d-1=0\) の解であるが、有限体上の方程式3の定理(24C)により、\(d\) 次方程式の解の数は高々 \(d\) 個である。従って、\(a^i\:\:(1\leq i\leq d)\) の \(d\) 個の元は、\(d\) 乗すると \(1\) になる 元のすべてである。
[補題4]
\(x\) を \(d\) で割った商を \(q\:\:(1\leq q)\)、余りを \(r\:\:(0\leq r < d)\)とすると、
\(\begin{eqnarray}
&&\:\:a^{qd+r}&=1\\
&&\:\:(a^d)^q\cdot a^r&=1\\
&&\:\:a^r=1&\\
\end{eqnarray}\)
となるが、もし \(r\neq0\) なら、\(d\) より小さい数 \(r\) で \(a^r=1\) となり、これは \(a\) の位数が \(d\) であることと矛盾する。従って \(r=0\) であり、\(x\) は \(d\) の倍数である。
[補題5]
\((\bs{Z}/n\bs{Z})^{*}\) を \(G\) と書く。集合 \(A\) を、
\(A=\{a,\:a^2,\:\cd\:,\:a^d=1\}\)
とする。もし \(|G|=d\) なら、題意は満たされている。
\(d < |G|\) の場合、\(A\) に含まれない \(G\) の元の一つを \(b_1\) とし、
\(A_1=\{b_1a,\:b_1a^2,\:\cd\:,\:b_1a^d\}\)
とする。この \(A_1\) に \(A\) と共通な元はない。なぜならもし、
\(a^i=b_1a^j\:\:(1\leq i,j\leq d)\)
だとすると、両辺に \(a^{-j}\) をかけて、
\(a^{i-j}=b_1\)
となるが、左辺は \(A\) の元であり、右辺の \(b_1\) が \(A\) の元となって矛盾するからである。もし \(A\) と \(A_1\) で \(G\) の元を尽くしているなら、\(|G|=2d\) であり、題意は満たされている。
そうでない場合、\(A\) と \(A_1\) に含まれない \(G\) の元の一つを \(b_2\) とし、
\(A_2=\{b_2a,\:b_2a^2,\:\cd\:,\:b_2a^d\}\)
とする。上の論理と同じで \(A_2\) と \(A\) に共通な元はない。のみならず、\(A_2\) と \(A_1\) に共通な元もない。なぜなら、もし、
\(b_2a^i=b_1a^j\:\:(1\leq i,j\leq d)\)
だとすると、両辺に \(a^{-i}\) をかけて、
\(b_2=b_1a^{j-i}\)
となるが、\(a^{j-i}\) は \(A\) の元だから、\(b_1a^{j-i}\) は \(A_1\) の元であり、\(b_2\) が \(A_1\) の元ということになって矛盾するからである。もし \(A,\:A_1,\:A_2\) で \(G\) の元を尽くしているなら、\(|G|=3d\) であり、題意は満たされている。
そうでない場合、この操作を続けていくと、\(G\) は有限群だから、ちょうど \(G\) の元が尽くされたところで、操作は止まる。最後に作った部分集合が \(A_n\) だったとすると \(|G|=(1+n)d\) であり、\(a\) の位数 \(d\) は群位数の約数である。
\((\bs{Z}/n\bs{Z})^{*}\) の群位数は \(\varphi(n)\) なので(23A)、位数の定理(25A)の[補題5]から、次のフェルマの小定理とオイラーの定理が成り立つことがわかります。
自然数 \(n\) と素な自然数 \(a\) について、
\(a^{\varphi(n)}=1\:\:(\mr{mod}\:n)\)
が成り立つ(オイラーの定理)。\(\varphi\) はオイラー関数で、\(\varphi(n)\) は \(n\) 以下で \(n\) と互いに素な自然数の数を表す。
\(n=p\)(素数)の場合は、\(p\) と素な数 \(a\) について、
\(a^{p-1}=1\:\:(\mr{mod}\:p)\)
となる(フェルマの小定理)。
生成元の存在1
\((\bs{Z}/p\bs{Z})^{*}\) には生成元が存在し、従って巡回群であることを証明します。まず、特定の位数 \(d\) をもつ元の数に関する定理からです。
\(p\) を素数とする。\((\bs{Z}/p\bs{Z})^{*}\) において、群位数 \((p-1)\) の約数 \(d\) のすべてについて、位数 \(d\) の元が \(\varphi(d)\) 個存在する。
[証明]
[補題1]により、\((\bs{Z}/p\bs{Z})^{*}\) のすべての元に位数が定義できる。その位数は[補題5]により、群位数 \((p-1)\) の約数である。
\((p-1)\) の任意の約数を \(d\) とし、位数 \(d\) の元 \(a\) があったとする。[補題3]により、\(d\)乗すると \(1\) になる \((\bs{Z}/p\bs{Z})^{*}\) の元は、
\(a,\:a^2,\:a^3,\:\cd\:,\:a^d(=1)\)
の「\(a\) 系列」がそのすべてである。\((\bs{Z}/p\bs{Z})^{*}\) の位数 \(d\) の元は、\(d\)乗すると \(1\) になるから、\(a\) 以外の位数 \(d\) の元も「\(a\) 系列」の中に含まれている。
ここで、\(\mr{gcd}(j,d)\neq1\) である \(j\:\:(1 < j\leq d)\) をとると、\(a^j\) の位数は \(d\) より小さくなる。なぜなら、\(\mr{gcd}(j,d)=c\:( > 1)\) とすると、2つの数 \(s,\:t\) を選んで、
\(j=c\cdot s\:\:(s < j)\)
\(d=c\cdot t\:\:(t < d)\)
と表されるが、そうすると、
\((a^j)t=a^{cst}=(a^d)^s=1\)
で、\(a^j\) の位数は \(t\) 以下だが、\(t < d\) なので \(a^j\) の位数は \(d\) より小さくなるからである。
一方、\(\mr{gcd}(j,d)\neq1\) である(=\(d\) と素な)\(j\:\:(1\leq j < d)\) をとると、\(a^j\) の位数は \(d\) になる。その理由は以下である。
\((a^j)^x\:\:(1\leq x\leq d)\) が \(x\) の値によってどう変わるかを調べると、まず、\(x=d\) のときは、
\((a^j)^x=(a^j)^d=(a^d)^j=1\)
である。
次に \(1\leq x < d\) のときは \(jx\) は \(d\) の倍数でない。なぜなら、\(j\) は \(d\) と素なため、もし \(jx\) が \(d\) の倍数だとすると、\(x\) が \(d\) の倍数ということになり、\(1\leq x < d\) に反するからである。従って、ある数 \(s,\:t\) を選んで、
\(jx=t\cdot d+s\:\:(0 < s < d)\)
と表せる。そうすると、
\((a^j)^x=a^{td+s}=(a^d)^t\cdot a^s=a^s\)
となるが、\(a\) の位数は \(d\) だから、\(d\) 未満の数 \(s\) で \(a^s\) が \(1\) になることはない。従って \(a^s\neq1\) であり、
\((a^j)^x\neq1\:\:(1\leq x < d)\)
である。
以上により
が分かったので、 \(a^j\) の位数は \(d\) である。\(j\) は \(\mr{gcd}(j,d)\neq1\) だったから、\(j\) のとりうる値は \(\varphi(d)\) 個ある。\((\bs{Z}/p\bs{Z})^{*}\) の位数 \(d\) の元は「\(a\) 系列」に含まれるから、\((\bs{Z}/p\bs{Z})^{*}\) に位数 \(\bs{d}\) の元があるとしたら、その数は \(\varphi(d)\) 個である。
まとめると、\((p-1)\) の任意の約数を \(d\) とし、\((\bs{Z}/p\bs{Z})^{*}\) の位数 \(d\) の元の数を \(\#\mr{ord}(d)\) と表記すると、
\(\displaystyle\sum_{d|(p-1)}^{}\#\mr{ord}(d)=p-1\)
が成り立つ。ここで \(d|(p-1)\) は、\((p-1)\) のすべての約数 \(d\) についての和をとる意味である。
次に、オイラー関数についてオイラー関数の総和の定理が成り立つことを証明する。
(オイラー関数の総和)
\(n\) を任意の自然数とするとき、
\(\displaystyle\sum_{d|n}^{}\varphi(d)=n\)
が成り立つ。\(d|n\) は、\(n\) のすべての約数 \(d\) についての和をとる。
[証明]
まず、次の2点に注意する。2つの自然数 \(a\) と \(b\) の最大公約数を \(\mr{gcd}(a,b)\) とすると、
\(\dfrac{a}{\mr{gcd}(a,b)}\) と \(\dfrac{b}{\mr{gcd}(a,b)}\) は互いに素
である。これは最大公約数の定義そのものである。
次に、\(n\) の約数の一つを \(a\) とし、\(n=a\cdot b\) と表すと、\(b\) もまた \(n\) の約数の一つである。\(n\) に \(r\) 個の約数、\(a_i\:\:(1\leq i\leq r)\) があるとき、
\(b_i=\dfrac{n}{a_i}\:\:(1\leq i\leq r)\)
と定義すると、\(b_i\:\:(1\leq i\leq r)\) もまた \(n\) の \(r\) 個の約数である。つまり、\(b_i\) は \(a_i\) を並び替えたものである。
以上の2点を前提に、まず \(n=12\) の場合で考察する。いま、\(1\) から \(12\) までの \(12\) 個の整数を「\(12\) との最大公約数で分類する」ことを考える。\(12\) の約数 \(d\) は、\(1,\:2,\:3,\:4,\:6,\:12\) の6つである。\(12\) との最大公約数が \(d\) である集合を \(S_d\) とすると、
となる。各集合に含まれる整数の個数を \(\#S_d\) として順に見ていくと、まず、オイラー関数の定義より、
\(\#S_1=\varphi(12)\)
である。
次に、\(12\) との最大公約数が \(2\) の集合、\(S_2=\{\:2,\:10\:\}\) を考える。\(\{\:2,\:10\:\}\) を \(2\) で割り算した \(\{\:1,\:5\:\}\) のそれぞれは、最大公約数の定義により、\(12\) を \(2\) で割り算した \(6\) と互いに素である。従って、
\(\#S_2=\varphi(6)\)
である。同様に他の集合についても、
となる。\(S_d\) は \(12\) 個の整数を分類したものだったので、そこに含まれる整数の個数の総和は \(12\) である。これにより、
となる。総和の記号で書くと、
\(\displaystyle\sum_{d|12}^{}\varphi(d)=12\)
である。
以上の考察は \(n=12\) の場合であるが、\(12\) に特別な意味はない。従って一般の \(n\) の場合も同様となる。
\(n\) が \(r\) 個の約数をもつとし、それらを \(a_i\:\:(1\leq i\leq r)\) とする。集合 \(S\) を \(1\) から \(n\) の \(n\) 個の整数の集合とし、その部分集合 \(S_i\) を、
\(S_i\):\(n\) との最大公約数が \(a_i\) である \(S\) の元の集合
とする。このとき、\(S_i\) の任意の元を \(x\) とすると、
\(\dfrac{x}{a_i}\) と \(\dfrac{n}{a_i}\) は互いに素
である。そもそも、そうなる \(x\) を集めたのが \(S_i\) であった。このことから、
\(S_i\) の元の個数は \(\dfrac{n}{a_i}\) と素である \(S\) の元の個数
ということになる。\(S_i\) の元の個数を \(\#S_i\) と書くと、
\(\#S_i=\varphi\left(\dfrac{n}{a_i}\right)\)
である。ここで \(b_i\) を、
\(b_i=\dfrac{n}{a_i}\:\:(1\leq i\leq r)\)
と定義すると、
\(\#S_i=\varphi(b_i)\)
となるが、この \(b_i\:\:(1\leq i\leq r)\) は \(n\) の約数のすべてであり、\(a_i\) を並び替えたものである。式の両辺の \((1\leq i\leq r)\) の総和をとると、\(\#S_i\) の総和は \(S\) の元の数なので、
左辺\(=\displaystyle\sum_{i=1}^{r}\#S_i=n\)
である。一方、右辺の総和は、
\(\begin{eqnarray}
&&\:\:右辺&=\displaystyle\sum_{i=1}^{r}\varphi(b_i)=\displaystyle\sum_{i=1}^{r}\varphi(a_i)\\
&&&=\displaystyle\sum_{d|n}^{}\varphi(d)\\
\end{eqnarray}\)
となって、
\(\displaystyle\sum_{d|n}^{}\varphi(d)=n\)
が成り立つ。
\((p-1)\) の約数に戻ると、オイラー関数の総和の定理より、
\(\displaystyle\sum_{d|(p-1)}^{}\varphi(d)=p-1\)
である。一方、位数 \(d\) の元の総和は、
\(\displaystyle\sum_{d|(p-1)}^{}\#\mr{ord}(d)=p-1\)
であった。この2点から、
\(\#\mr{ord}(d)=\varphi(d)\)
が結論づけられる。\(\#\mr{ord}(d)=0\) となる \((p-1)\) の約数 \(d\) は無い。もしあるとすると矛盾が生じる。
従って \((\bs{Z}/p\bs{Z})^{*}\) においては、群位数 \((p-1)\) の約数 \(d\) のすべてについて、位数 \(d\) の元が \(\varphi(d)\) 個存在する。[証明終]
この位数 \(\bs{d}\) の元の数の定理(25C)により、次の生成元の存在1が成り立つことが分かります。
\(p\) を素数とするとき、\((\bs{Z}/p\bs{Z})^{*}\) には生成元が存在する。生成元とは、その位数が \((\bs{Z}/p\bs{Z})^{*}\) の群位数、\(p-1\) の元である。
ちなみに、\(100\)以下の素数 \(p\)(\(2\) を除く \(24\)個)について、原始根の数 = \(\varphi(p-1)\) と最小の原始根をパソコンで計算すると、次のようになります。
2.整数の群 |
「2.整数の群」「3.多項式と体」「4.一般の群」の3つの章は、第5章以下のガロア理論の核心に入るための準備です。
第2章の目的は2つあり、一つは整数を素材にして「群」と、それに関連した「剰余類」「剰余群」「既約剰余類」など、ガロア理論の理解に必要な概念を説明することです。
もう一つは、第2章の最後にある「既約剰余類群は巡回群の直積と同型である」という定理を証明することです。この定理はガロア理論の最終段階(6.可解性の必要条件)で必要なピースになります。
まず、"整数の群" に入る前に、整数論の基礎ともいえる「ユークリッドの互除法」「不定方程式」「法による演算」「中国剰余定理」から始めます。これらは後の定理の証明にしばしば使います。
2.1 整数
ユークリッドの互除法
(互除法の原理:21A) |
自然数 \(a\) と \(b\) の最大公約数を \(\mr{gcd}(a,\:b)\) で表す。自然数 \(a\) を \(b\) で割った余りを \(r\) とすると、
\(\mr{gcd}(a,\:b)=\mr{gcd}(b,\:r)\)
である。
[証明]
記述を簡略化するため、最大公約数を、
\(\mr{gcd}(a,\:b)=x\)
\(\mr{gcd}(b,\:r)=y\)
で表す。\(a\) を \(b\) で割った商を \(p\)、余りを \(r\) とすると、
\(a=pb+r\) \((0\leq r < b)\)
と書ける。\(a\) と \(pb\) は \(x\) で割り切れるから、\(r\) も \(x\) で割り切れる。つまり \(x\) は \(r\) の約数である。\(x\) は \(b\) の約数でもあるから、\(x\) は \(b\) と \(r\) の公約数である。公約数は \(b\) と \(r\) の最大公約数 \(y\) 以下だから、
\(x\leq y\)
である。
一方、\(pb\) と \(r\) は \(y\) で割り切れるから、\(y\) は \(a\) の約数である。\(y\) は \(b\) の約数でもあるから、\(y\) は \(a\) と \(b\) の公約数である。公約数は \(a\) と \(b\) の最大公約数以下だから、
\(y\leq x\)
である。\(x\leq y\) かつ \(y\leq x\) なので \(x=y\)、つまり、
\(\mr{gcd}(a,\:b)=\mr{gcd}(b,\:r)\)
である。[証明終]
この原理を利用して \(\mr{gcd}(a,\:b)\) を求めることができます。もし \(a\) が \(b\) で割り切れるなら \(\mr{gcd}(a,\:b)=b\) です。そうでないなら、\(a\) を \(b\) で割った余り \(r\) を求め、
新 \(a\:\longleftarrow\:b\)
新 \(b\:\longleftarrow\:r\)
と定義し直して、\(a\) が \(b\) で割り切れるかどうかを見ます。こうして次々と \(a\) と \(b\) のペアを作っていけば(=互除法)、\(b\) は単調減少していくので、いずれ \(a\) が \(b\) で割り切れるときがきます。なかなか割り切れなくても、\(b\) が \(1\) までくると絶対に割り切れる。つまり、
\(\mr{gcd}(a,\:b)=b\)
となるのが最終段階で、そのときの \(b\) が最大公約数です。\(b\) が \(1\) までになってしまったら、最大公約数は \(\bs{1}\)、つまり \(\bs{a}\) と \(\bs{b}\) は互いに素です。
ちなみに、ユークリッドの互除法で a と b の最大公約数を求める関数 EUCLID を Python で記述すると次のようになります。
def EUCLID(a, b): if a % b == 0: return b else: return EUCLID(b, a % b) |
% は Python の剰余演算子で、a % b は「a を b で割った余り」の意味です(定理の記述では \(r\))。つまり、このコードは、
gcd( a, b )=gcd( b, a % b )
という互除法の原理(21A)をストレートに書いたものです(a と b の大小に関係なく動作します)。こういったアルゴリズムはプログラミング言語で記述した方がシンプルでわかりやすくなります。
互除法は多項式の演算にも適用できます。多項式は整数と同じように割り算はできませんが余り算はできるからです。多項式の性質を理解するときに互除法は必須になります。
1次不定方程式
(不定方程式の解の存在:21B) |
2変数 \(x,\:y\) の1次不定方程式を、
\(ax+by=c\)
(\(a,\:b,\:c\) は整数。\(a\neq0,\:b\neq0\))
とし、\(a\) と \(b\) の最大公約数を \(d\) とする。このとき、
\(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。
このことは1次不定方程式が3変数以上であっても成り立つ。つまり
\(a_1x_1+a_2x_2+\:\cd\:+a_nx_n=c\)
(\(a_i\) は \(0\) 以外の整数)
とし、
\(d=\mr{gcd}(a_1,a_2,\:\cd\:,\:a_n)\)
とする。このとき、
\(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。
[証明]
1次不定方程式が整数解を持つとしたら、方程式の左辺は \(d\) で割り切れる、つまり \(d\) の倍数だから、右辺の \(c\) も \(d\) の倍数である。このことの対偶は「\(c\) が \(d\) の倍数でなければ方程式は整数解を持たない」なので、題意の「そうでなければ整数解を持たない」が証明されたことになる。従って以降は「\(c=kd\) (\(k\) は整数)と表せるなら方程式は整数解を持つ」ことを証明する。まず、変数が2つの場合である。
係数の \(a\) と \(b\) に互除法(21A)を適用し、それと同時に \(x,\:y\) の変数を変換して方程式を変形していく。まず、\(a\) を \(b\) で割った商を \(p\)、余りを \(r\) とする。
\(a=pb+r\)
である。互除法の次のステップの係数と変数を次のように決める。
\(\:\:\:\:\br{①}\left\{
\begin{array}{l}
\begin{eqnarray}
&&a_1=b&\\
&&b_1=r&\\
\end{eqnarray}
\end{array}\right.\)
\(\:\:\:\:\br{②}\left\{
\begin{array}{l}
\begin{eqnarray}
&&x_1=px+y&\\
&&y_1=x&\\
\end{eqnarray}
\end{array}\right.\)
\(\br{②}\) を \(x,\:y\) について解くと、
\(\:\:\:\:\br{③}\left\{
\begin{array}{l}
\begin{eqnarray}
&&x=y_1&\\
&&y=x_1-py_1&\\
\end{eqnarray}
\end{array}\right.\)
である。このよう定義すると、\(\br{①}\)、\(\br{②}\) を使って、
\(\begin{eqnarray}
&&\:\:a_1x_1+b_1y_1&=b(px+y)+rx\\
&&&=pbx+by+rx\\
&&&=(pb+r)x+by\\
&&&=ax+by\\
\end{eqnarray}\)
と計算できるので、不定方程式は、
\(a_1x_1+b_1y_1=c\)
となり、係数の値がより小さい方程式に変形できる。互除法の原理(21A)により、\(a_1\) と \(b_1\) の最大公約数は \(d\) のままである。この方程式の \(x_1,\:y_1\) が求まれば、\(\br{③}\) を使って \(x,\:y\) が求まる。
以上の式の変形は、\(1\leq i\) として、\(a_i\) を \(b_i\) で割った商と余りを、
\(a_i=p_ib_i+r_i\)
のように求め、互除法の次のステップを、
\(a_{i+1}=b_i\)
\(b_{i+1}=r_i\)
\(x_{i+1}=p_ix_i+y_i\)
\(y_{i+1}=x_i\)
とすることで続けていける。このように、係数に互除法の適用を繰り返し、同時に変数を変換していく。そして互除法の最終段階で、
\(a_nx_n+b_ny_n=c\)
となったとする。この段階では \(a_n\) は \(b_n\) で割り切れ、そのときの \(b_n\) は最大公約数 \(d\) である。つまり。
\(a_nx_n+dy_n=c\)
である。もし \(c\) が \(d\) の倍数であれば、つまり \(c=kd\) (\(k\) は整数)なら、
\(x_n=0\)
\(y_n=k\)
という整数解を必ずもつ。従って、変数の変換過程を逆にたどって \(x,\:y\) が求まる。以上で2変数の場合に題意が正しいことが証明でき、同時に1次不定方程式の解を求めるアルゴリズムも明らかになった。
ちなみに、一次不定方程式の解の一つを求めるアルゴリズムを Python の関数で記述すると、次のようにシンプルです。
def LinearDiophantineEq(a, b, c): def extendedEUCLID(a, b): # gcd(a,b) と ax+by=gcd(a,b) の解を求める r = a % b # % は剰余演算 if r == 0: return {"x": 0, "y": 1, "gcd": b} else: x, y, gcd = extendedEUCLID(b, r).values() p = a // b # // は切捨て除算 return {"x": y, "y": x - p * y, "gcd": gcd} x, y, gcd = extendedEUCLID(a, b).values() k = c // gcd if( k != c / gcd ): return None # 解なし else: return [x * k, y * k] # 解のペアを返す |
数学的帰納法を使って、3変数以上の場合を証明する。\(n=2\) の場合に成り立つことを示したので、\(n=k\) の場合に成り立つと仮定する。つまり、
\(k\) 変数の不定方程式を、 \(a_1x_1+a_2x_2+\:\cd\:+a_kx_k=c_k\) (\(a_i\) は \(0\) 以外の整数) \(d_k=\mr{gcd}(a_1,a_2,\:\cd\:,\:a_k)\) とするとき、 \(c_k=md_k\) (\(m\) は整数) なら整数解がある。 |
と仮定する。\(n=k+1\) の場合の不定方程式を、
\(a_1x_1+a_2x_2+\:\cd\:+a_kx_k+a_{k+1}x_{k+1}=c_{k+1}\)
\(\begin{eqnarray}
&&\:\: d_k&=\mr{gcd}(a_1,a_2,\:\cd\:,\:a_k)\\
&&\:\: d_{k+1}&=\mr{gcd}(a_1,a_2,\:\cd\:,\:a_k,\:a_{k+1})\\
\end{eqnarray}\)
とし、この方程式が整数解をもつ条件を調べる。方程式を移項すると、
\(a_1x_1+a_2x_2+\:\cd\:+a_kx_k=c_{k+1}-a_{k+1}x_{k+1}\)
となるが、この不定方程式が整数解をもつのは、数学的帰納法の仮定によって、
左辺\(=d_k\) の整数倍
のときである。つまり、
\(c_{k+1}-a_{k+1}x_{k+1}=d_k\cdot y\)
という、2つの変数 \(x_{k+1},\:y\) の不定方程式が整数解をもつときである。式を移項すると、
\(a_{k+1}x_{k+1}+d_k\cdot y=c_{k+1}\)
であるが、これは証明済みの \(n=2\) のときの定理によって、
\(c_{k+1}=m\cdot\mr{gcd}(d_k,\:a_{k+1})\) (\(m\) は整数)
の場合に整数解をもつ。ここで、
\(\mr{gcd}(d_k,\:a_{k+1})=d_{k+1}\)
なので、
\(c_{k+1}=m\cdot d_{k+1}\) (\(m\) は整数)
の場合にのみ、\(n=k+1\) の不定方程式は整数解をもつことになる。
つまり、\(n=k\) のときに題意が成り立つと仮定すると、\(n=k+1\) のときにも成り立つ。\(n=2\) のときには成り立つから、\(n\geq3\) でも成り立つ。[証明終]
重要なのは、係数が互いに素な場合です。不定方程式の解の存在(21B)から、次の定理がすぐに出てきます。
(不定方程式の解の存在:21C) |
\(0\) でない整数 \(a\) と \(b\) が互いに素とすると、1次不定方程式、
\(ax+by=1\)
は整数解をもつ。また、\(n\) を任意の整数とすると、
\(ax+by=n\)
は整数解をもつ。あるいは、任意の整数 \(n\) は、
\(n=ax+by\) \((x,\:y\) は整数)
の形で表現できる。
これは3変数以上であっても成り立つ。たとえば3変数の場合は、\(0\) でない整数 \(a,\:b,\:c\) の最大公約数が \(1\)、つまり、
\(\mr{gcd}(a,b,c)=1\)
であるとき、\(n\) を任意の整数として、1次不定方程式、
\(ax+by+cz=n\)
は整数解を持つ。
互除法と同じように、不定方程式の解の存在定理 (21B)と(21C)も、多項式の性質を理解する上で重要です。
法による演算
(法による演算の定義:21D) |
\(a,\:b\) を整数、\(n\) を自然数とする。\(a\) を \(n\) で割った余りと、\(b\) を \(n\) で割った余りが等しいとき、
\(a\equiv b\:\:(\mr{mod}\:n)\)
と書き、\(a\) と \(b\) は「法 \(n\) で合同」という。あるいは「\(\mr{mod}\:n\) で合同」、「\(\mr{mod}\:n\) で(見て)等しい」とも記述する。
法による演算の規則は、さまざまありますが、主なものは次の通りです。このような演算を以降の説明で適時使います。
(法による演算規則:21E) |
\(a,\:b,\:c,\:d\) を整数、\(n,r\) を自然数とし、
\(a\equiv b\:\:(\mr{mod}\:n)\)
\(c\equiv d\:\:(\mr{mod}\:n)\)
とする。このとき、
\((1)\:a+c\) | \(\equiv b+d\) | \((\mr{mod}\:n)\) | |
\((2)\:a-c\) | \(\equiv b-d\) | \((\mr{mod}\:n)\) | |
\((3)\:ac\) | \(\equiv bd\) | \((\mr{mod}\:n)\) | |
\((4)\:a^r\) | \(\equiv b^r\) | \((\mr{mod}\:n)\) |
中国剰余定理
(中国剰余定理:21F) |
\(n_1\) と \(n_2\) を互いに素な自然数とする。\(a_1\) と \(a_2\) を、\(0\leq a_1 < n_1,\:0\leq a_2 < n_2\) を満たす整数とする。このとき、
\(x\equiv a_1\:\:(\mr{mod}\:n_1)\)
\(x\equiv a_2\:\:(\mr{mod}\:n_2)\)
の連立方程式を満たす整数 \(x\) が存在する。この \(x\) は \(\mr{mod}\:n_1n_2\) でみて唯一である。つまり、\(0\leq x < n_1n_2\) の範囲に解が唯一存在する。
[証明]
もし \(x\) と \(y\:\:(y\leq x)\) が連立方程式を満たすとすると、
\(x\equiv a_1\:\:(\mr{mod}\:n_1)\)
\(y\equiv a_1\:\:(\mr{mod}\:n_1)\)
なので、
\(x-y\equiv0\:\:(\mr{mod}\:n_1)\)
であり、\(x-y\) は \(n_1\) で割り切れる。同様にして \(x-y\) は \(n_2\) でも割り切れる。\(n_1\) と \(n_2\) は互いに素なので、\(x-y\) は \(n_1n_2\) で割り切れる。従って \(x-y\) は \(n_1n_2\) の倍数であり、
\(x-y\equiv0\) | \((\mr{mod}\:n_1n_2)\) | |
\(x\equiv y\) | \((\mr{mod}\:n_1n_2)\) |
\(n_1,\:n_2\) は互いに素なので、不定方程式の解の存在定理(21C)により、
\(n_1m_1+n_2m_2=1\)
を満たす \(m_1,\:m_2\) が存在する。ここで、
\(x=a_2n_1m_1+a_1n_2m_2\)
とおくと、
\(\begin{eqnarray}
&&\:\:x&=a_2n_1m_1+a_1n_2m_2\\
&&&=a_2n_1m_1+a_1(1-n_1m_1)\\
&&&=a_1+n_1m_1(a_2-a_1)\\
&&&\equiv a_1\:\:(\mr{mod}\:n_1)\\
\end{eqnarray}\)
であり、
\(\begin{eqnarray}
&&\:\:x&=a_2n_1m_1+a_1n_2m_2\\
&&&=a_2(1-n_2m_2)+a_1n_2m_2\\
&&&=a_2+n_2m_2(a_1-a_2)\\
&&&\equiv a_2\:\:(\mr{mod}\:n_2)\\
\end{eqnarray}\)
なので、\(x\) は連立方程式の解である。この解は、上での証明のとおり \(\mr{mod}\:n_1n_2\) でみて唯一である。[証明終]
中国剰余定理は3数以上に拡張できて、次が成り立ちます。
(中国剰余定理・多連立:21G) |
\(n_1,\:n_2,\:\cd\:,\:n_k\) を、どの2つをとっても互いに素な自然数とする。\(a_i\) を \(0\leq a_i < n_i\:\:(1\leq i\leq k)\) を満たす整数とする。このとき、
\(x\equiv a_1\:\:(\mr{mod}\:n_1)\)
\(x\equiv a_2\:\:(\mr{mod}\:n_2)\)
\(\vdots\)
\(x\equiv a_k\:\:(\mr{mod}\:n_k)\)
の連立合同方程式を満たす整数 \(x\) が存在する。この \(x\) は \(\mr{mod}\:n_1n_2\cd n_k\) でみて唯一である。つまり、\(0\leq x < n_1n_2\cd n_k\) の範囲では唯一の解が存在する。
[証明]
自然数 \(N\) を
\(N=n_1n_2\cd n_k\)
と定義する。
\(\mr{gcd}\left(\dfrac{N}{n_i},n_i\right)=1\:\:\:(1\leq i\leq k)\)
なので、不定方程式の解の存在の定理(21C)により、
\(\dfrac{N}{n_i}s_i+n_it_i=1\:\:\:(1\leq i\leq k)\)
を満たす整数解、\(s_i,\:t_i\:\:(1\leq i\leq k)\) が存在する。
\(x=\displaystyle\sum_{i=1}^{k}a_i\dfrac{N}{n_i}s_i\)
と定義すると、\(j\neq i\) である \(j\) について、
\(\dfrac{N}{n_j}\equiv0\:\:(\mr{mod}\:n_i)\)
だから、\(\mr{mod}\:n_i\) でみると、\(x\) を定義する総和記号のなかは \(i\) の項だけが残る。つまり、
\(\begin{eqnarray}
&&\:\:x&\equiv a_i\dfrac{N}{n_i}s_i\:\:(\mr{mod}\:n_i)\\
&&&=a_i(1-n_it_i)\\
&&&\equiv a_i\:\:(\mr{mod}\:n_i)\\
\end{eqnarray}\)
となって、\(x\) は連立合同方程式の解である。
連立合同方程式に2つの解、\(x,\:y\) があったとすると、
\(\begin{eqnarray}
&&\:\:x-y&\equiv a_i-a_i &(\mr{mod}\:n_i)\\
&&&=0 &(\mr{mod}\:n_i)\\
\end{eqnarray}\)
となり、\(x-y\) は \(n_i\) の倍数である。これは \(1\leq i\leq k\) のすべての \(i\) で成り立ち、また \(n_i\:\:(1\leq i\leq k)\) は、どの2つをとっても互いに素である(=共通な因数が全くない)から、\(x-y\) は \(N\) の倍数である。従って、
\(x\equiv y\:\:(\mr{mod}\:N)\)
であり、\(x\) は \(\mr{mod}\:n_1n_2\cd n_k\) でみて唯一である。[証明終]
2.2 群
これ以降、整数を素材に「群」と、それに関連した概念の説明をします。まず、群の定義からです。
群の定義
(群の定義:22A) |
集合 \(G\) が次の ① ~ ④ を満たすとき、\(G\) は群(group)であると言う。
\(G\) の任意の元 \(x,\:y\) に対して演算(\(\cdot\)で表す)が定義されていて、\(x\cdot y\in G\) である。 | |
演算について結合法則が成り立つ。つまり、 \((x\cdot y)\cdot z=x\cdot(y\cdot z)\) | |
\(G\) の任意の元 \(x\) に対して \(x\cdot e=e\cdot x=x\) を満たす元 \(e\) が存在する。\(e\) を単位元という。 | |
\(G\) の任意の元 \(x\) に対して \(x\cdot y=y\cdot x=e\) となる元 \(y\) が存在する。\(y\) を \(x\) の逆元といい、\(x^{-1}\) と表す。 |
整数 \(\bs{Z}\)
整数の集合を \(\bs{Z}\) と書きます。\(\bs{Z}\) は「加法(足し算)を演算とする群」になります。単位元は \(0\) で、元 \(x\) の逆元は \(-x\) です。この群の元の数は無限なので「無限群」です。
整数の加法は、\(x+y=y+x\) と演算の順序を入れ替えることができます。このような群が可換群です。アーベル群とも言います。
なお、有理数は \(\bs{Q}\)、実数は \(\bs{R}\)、複素数は \(\bs{C}\) で表しますが、\(\bs{Q}\)、\(\bs{R}\)、\(\bs{C}\) は、\(\bs{Z}\) を同じように加法に関して群です(=加法群)。と同時に \(\bs{Q}\)、\(\bs{R}\)、\(\bs{C}\) から加法の単位元 \(0\) を除くと、乗法に関しても群になります。その単位元は \(1\) です。
部分群 \(n\bs{Z}\)
群 \(G\) の部分集合 \(H\) が、\(G\) と同じ演算で群としての定義を満たすとき、\(H\) を部分群(subgroup)と言います。
\(G\) の単位元 \(e\) だけから成る部分集合 \(\{\:e\:\}\) は群としての定義を満たし、部分群です。また \(G\) そのものも "\(G\)の部分集合" であり、部分群です。これらを \(G\) の自明な部分群と言います。
\(\bs{Z}\) の元の一つを \(n\) とし(\(n\neq0\))、\(n\) の倍数の集合を \(n\bs{Z}\) と表記します。\(n\bs{Z}\) は加法を演算として群の定義を満たすので、\(\bs{Z}\) の部分群です。\(n\bs{Z}\) も無限群かつ可換群です。たとえば \(n=6\) とすると、
\(6\bs{Z}=\{\cd,\:-6,\:0,\:6,\:12,\:18,\:\cd\}\)
です。
剰余類と剰余群
部分群を用いて、元の数が有限個である有限群を作ることができます。一般に、群 \(G\) の部分群を \(H\) とするとき(演算を "\(\cdot\)" とします)、\(G\) の任意の元 \(g\) を取り出して、
\(g\cdot H\)
とした集合を剰余類(coset / residue class)と言います。これは「\(g\) と、集合 \(H\) のすべての元を演算した結果の集合」の意味です。
\(\bs{Z}\) と その部分群 \(6\bs{Z}\) を例にとると、\(\bs{Z}\) の任意の元を \(i\) として、
\(i+6\bs{Z}\)
が剰余類です。具体的にその集合を書くと、
\(\vdots\)
\(0+6\bs{Z}=\{\cd,\:-6,\:\:0,\:\phantom{1}6,\:12,\:18,\:\cd\}\)
\(1+6\bs{Z}=\{\cd,\:-5,\:\:1,\:\phantom{1}7,\:13,\:19,\:\cd\}\)
\(2+6\bs{Z}=\{\cd,\:-4,\:\:2,\:\phantom{1}8,\:14,\:20,\:\cd\}\)
\(3+6\bs{Z}=\{\cd,\:-3,\:\:3,\:\phantom{1}9,\:15,\:21,\:\cd\}\)
\(4+6\bs{Z}=\{\cd,\:-2,\:\:4,\:10,\:16,\:22,\:\cd\}\)
\(5+6\bs{Z}=\{\cd,\:-1,\:\:5,\:11,\:17,\:23,\:\cd\}\)
\(6+6\bs{Z}=\{\cd,\:\phantom{-}0,\:\:6,\:12,\:18,\:24,\:\cd\}\)
\(7+6\bs{Z}=\{\cd,\:\phantom{-}1,\:\:7,\:13,\:19,\:25,\:\cd\}\)
\(\vdots\)
などです。以降、剰余類 \(i+6\bs{Z}\) を \(\ol{\,i\,}\) と記述します。つまり、
\(\ol{\,i\,}=i+6\bs{Z}\)
です。上の表示を見ると分かるように、たとえば \(\ol{\,1\,}\) と \(\ol{\,7\,}\) は集合として同じものです。さらに、
\(\cd=\ol{-11}=\ol{-5}=\ol{\,1\,}=\ol{\,7\,}=\ol{13}=\cd\)
であり、これらは同じ集合です。これらの集合の中から一つの元を選んで「代表元」と呼ぶことにします。以降、分かりやすいように \(1\) を代表元とします。その他の剰余類についても同じようにすると、部分群 \(6\bs{Z}\) による剰余類は、
\(\ol{\,0\,},\:\ol{\,1\,},\:\ol{\,2\,},\:\ol{\,3\,},\:\ol{\,4\,},\:\ol{\,5\,}\)
の6つで表されることになります。これらの剰余類には重複がありません。また、全部の和集合をとると \(\bs{Z}\) になります。記号で書くと、\(\phi\) を空集合として、
\(\ol{\,i\,}\:\cap\:\ol{\,j\,}\:=\:\phi\:\:(0\leq i,\:j\leq6,\:i\neq j)\)
\(\bs{Z}=\ol{\,0\,}\:\cup\:\ol{\,1\,}\:\cup\:\ol{\,2\,}\:\cup\:\ol{\,3\,}\:\cup\:\ol{\,4\,}\:\cup\:\ol{\,5\,}\)
です。別の見方をすると、\(i,\:j\) を任意の整数するとき、
\(\ol{\,i\,}\) と \(\ol{\,j\,}\) の元は「全く同じ」か「全く重複しない」のどちらかである | |
\(\bs{Z}\) は剰余類で分類される |
と言えます。平たく言うと、\(n\)(上の例では \(6\))で割った余りが同じ整数を集めたものが剰余類です。"剰余" という用語はそこからきています。
![]() |
剰余類と剰余群 |
整数 \(\bs{Z}\) の部分集合 \(6\bs{Z}\)(\(6\)の倍数の集合)から、\(\ol{\,i\,}=i+6\bs{Z}\) \((0\leq i\leq5)\) の定義で6つの「剰余類」が作れる。これらに重複はなく、\(\bs{Z}\) はこの6つで "分類" される。 整数 \(i,\:j,\:k\) に \(i+j=k\) の関係があるとき、\(\ol{\,i\,}+\ol{\,j\,}=\ol{\,k\,}\) で剰余類の加算を定義すると、この定義で剰余類は群となる。この群を「剰余群」と呼び \(\bs{Z}/6\bs{Z}\) で表わす(単位元は \(\ol{\,0\,}\))。この群では \(\ol{\,3\,}+\ol{\,5\,}=\ol{\,2\,}\) などの演算になるが、これは整数の合同式 \(3+5\equiv2\) \((\mr{mod}\:6)\) と同一視できる。 |
剰余類のうち、\(\ol{\,0\,}\) は \(\bs{Z}\) の部分群ですが、\(\ol{\,i\,}\:(i\neq0)\) の集合は \(\bs{Z}\) の部分群ではありません。集合の元と元のたし算が集合を "はみ出す" からです。しかし、剰余類同士の演算(=集合と集合の演算)を定義することにより、剰余類を元とする群を構成できます。それが次です。
剰余類に加算を定義できます。つまり、\(\ol{\,i\,}+\ol{\,j\,}\) を、
\(\ol{\,i\,}+\ol{\,j\,}=\ol{(\:i+j\:)}\) (右辺の \(+\) は整数の加算)
と定義すると、この演算の定義で剰余類は群になり、
\(\bs{Z}/n\bs{Z}\)
と表します。この群の元は集合(=剰余類)です。この群を剰余群(あるいは商群。quotient group)と言います。元の数は有限なので有限群です。また演算が整数の加算なので可換であり、「有限可換群」です。
\(\bs{Z}/n\bs{Z}\) という記法では、\(\bs{Z}\) も \(n\bs{Z}\) も群(この場合は加法群)です。一般に「群\(/\)部分群」と書けば、剰余群(商群)の意味です。これに対して「拡大体\(/\)体」は "体の拡大" を意味します。 \(\bs{Q}(\al)/\bs{Q}\) などです。
一般に、有限群 \(G\) の元の数を群の位数(order)と呼び、
\(|G|\) あるいは \(\#G\)
で表します。剰余群では、
\(|(\bs{Z}/n\bs{Z})|\) | \(=n\) | |
\(\#(\bs{Z}/n\bs{Z})\) | \(=n\) |
生成元と巡回群
剰余群 \(\bs{Z}/n\bs{Z}\) は、元 \(\ol{\,1\,}\) だけをもとに群演算を繰り返すことによって、すべての元を作り出すことができます。\(\bs{Z}/6\bs{Z}\) を例にとると、
\(\ol{\,2\,}=\ol{\,1\,}+\ol{\,1\,}\)
\(\ol{\,3\,}=\ol{\,1\,}+\ol{\,1\,}+\ol{\,1\,}\)
などであり
\(\ol{\,0\,}=\ol{\,1\,}+\ol{\,1\,}+\ol{\,1\,}+\ol{\,1\,}+\ol{\,1\,}+\ol{\,1\,}\)
です。群にこのような元がある場合、それを生成元(generator)と呼びます。\(\bs{Z}/6\bs{Z}\) の場合は \(\ol{\,1\,}\) のほかに \(\ol{\,5\,}\) も生成元です。\(\ol{\,i\,}\) を \(k\) 個加算することを、\(k\cdot\ol{\,i\,}\) と書くことにします。
\(k\cdot\ol{\,i\,}=\overbrace{\ol{\,i\,}+\ol{\,i\,}+\cd+\ol{\,i\,}}^{k\:個加算}\)
です。\(\ol{\,5\,}\) については、
\(1\cdot\ol{\,5\,}=\ol{\,5\,},\:\:2\cdot\ol{\,5\,}=\ol{\,4\,},\:\:3\cdot\ol{\,5\,}=\ol{\,3\,}\)
\(4\cdot\ol{\,5\,}=\ol{\,2\,},\:\:5\cdot\ol{\,5\,}=\ol{\,1\,},\:\:6\cdot\ol{\,5\,}=\ol{\,0\,}\)
のように、\(\ol{\,5\,}\) を起点として全部の元が生成され、\(\ol{\,5\,}\) が生成元であることがわかります。
剰余群 \(\bs{Z}/n\bs{Z}\) においては、\(1\leq g < n\) である整数 \(g\) が \(n\) と互いに素であるとき、\(\ol{\,g\,}\) は生成元になります。その理由ですが、
\(\ol{\,g\,},\:\:2\cdot\ol{\,g\,},\:\:3\cdot\ol{\,g\,},\:\cd\:,\:n\cdot\ol{\,g\,}\)
という \(n\) 個の剰余類の列を考えると、これらは全て違ったものだからです。なぜなら、もし \(1\leq i < j\leq n\) である \(i,\:j\) について、 \((\br{A})\)
\(i\cdot\ol{\,g\,}=j\cdot\ol{\,g\,}\)
だとすると、これは、法 \(n\) における整数の合同式で、
\(ig\equiv jg\:\:(\mr{mod}\:n)\)
を意味します。つまり、
\((j-i)g\equiv0\:\:(\mr{mod}\:n)\)
ですが、\(g\) が \(n\) と互いに素なため、\((j-i)\) は \(n\) で割り切れなければなりません。しかし \(1\leq(j-i)\leq(n-1)\) なので、矛盾します。従って、\(n\) 個の剰余類の列 \((\br{A})\) は、全て違ったものです。剰余群 \(\bs{Z}/n\bs{Z}\) の群位数は \(n\) なので、\((\br{A})\) は \(\bs{Z}/n\bs{Z}\) の全ての元であり、従って \(\ol{\,g\,}\) は生成元です。
\(n\) が素数 \(p\) の場合は、\(p\) 未満の自然数はすべて \(p\) と互いに素なので、単位元 \(\ol{\,0\,}\) を除く \(\bs{Z}/p\bs{Z}\) の元が生成元になります。
\(k\) 個の \(\ol{\,i\,}\) の群演算をして初めて、結果が単位元 \(\ol{\,0\,}\) になるときの \(k\) を、\(\ol{\,i\,}\) の位数(order)といいます。群の位数と紛らわしいですが、これは群の「元の位数」です。\(\bs{Z}/6\bs{Z}\) の場合、「元 \(\rightarrow\) 位数」の対応は、
\(\ol{\,0\,}\:\rightarrow\:1,\:\:\ol{\,1\,}\:\rightarrow\:6,\:\:\ol{\,2\,}\:\rightarrow\:3\)
\(\ol{\,3\,}\:\rightarrow\:2,\:\:\ol{\,4\,}\:\rightarrow\:3,\:\:\ol{\,5\,}\:\rightarrow\:6\)
です。位数という用語を使うと、生成元とは「位数が群位数に等しい元」のことです。
群 \(G\) が一つの生成元から生成されるとき、\(G\) を巡回群(cyclic group)と言います。\(\bs{Z}/10\bs{Z}\) の例をとると、\(10\) と互いに素な数を考えて、生成元は \(\ol{\,1\,},\:\ol{\,3\,},\:\ol{\,7\,},\:\ol{\,9\,}\) の4つです。従って、たとえば \(\ol{\,7\,}\) 同士の加算を繰り返すと、
\(\ol{\,7\,}\:\rightarrow\)\( \:\ol{\,4\,}\:\rightarrow\)\( \:\ol{\,1\,}\:\rightarrow\)\( \:\ol{\,8\,}\:\rightarrow\)\( \:\ol{\,5\,}\:\rightarrow\)\( \:\ol{\,2\,}\:\rightarrow\)\( \:\ol{\,9\,}\:\rightarrow\)\( \:\ol{\,6\,}\:\rightarrow\)\( \:\ol{\,4\,}\:\rightarrow\)\( \:\ol{\,0\,}\:\rightarrow\)\( \:\ol{\,7\,}\:\rightarrow\)\( \:\ol{\,4\,}\:\rightarrow\)\( \:\ol{\,1\,}\:\rightarrow\)\( \:\ol{\,8\,}\:\rightarrow\)\( \:\cd\) |
群の直積
\(G,\:H\) を群とします。\(G\) の任意の元 \(g\) と \(H\) の任意の元 \(h\) のペア \((g,\:h)\) 作り、このペアを元とする集合を考えます。以降、群の演算を表す "\(\cdot\)" を省略します。
集合の任意2つの元を、
\(a=(g_a,\:h_a)\)
\(b=(g_b,\:h_b)\)
とし、\(a\) と \(b\) の演算を、
\(ab=(g_ag_b,\:h_ah_b)\)
\(g_ag_b\) | は \(G\) での群演算 | |
\(h_ah_b\) | は \(H\) での群演算 |
\(G\times H\)
で表します。有限群の場合、群の位数は、
\(|G\times H|=|G|\cdot|H|\) (\(\cdot\) は整数のかけ算)
です。以上は2つの群の直積ですが、同様に3つ以上の群の直積も定義できます。
群の同型
\(G\) と \(H\) を群とします。\(G\) から \(H\) への1対1の写像 \(f\) で、\(G\) の任意の2つの元 \(x,\:y\) について、
\(f(xy)=f(x)f(y)\)
\(xy\) は群 \(G\) の演算、\(f(x)f(y)\) は群 \(H\) の演算) |
\(G\cong H\)
と表します。同型であるということは、2つの群の元が1対1対応するのみならず、元の演算前、演算後も1対1対応していることを意味します。従って同型である群は「同じもの」と見なせます。
以降、剰余類を表す \(\bs{\ol{\,i\,}}\) のバーを省略して \(\bs{i}\) と書きます。従って \(i\) は整数か剰余類のどちらかを示しますが、2つは同一視できます。 |
\(\bs{Z}/15\bs{Z}\) で群の同型の例を示します。ここでは、整数 \(i\) を 整数 \(a\) で割った余りを \(i_a\) と書きます。\(\bs{Z}/15\bs{Z}\) の任意の元 \(i\:\:(0\leq i\leq14)\) について、写像 \(f\) を、
\(f\::\:i\:\longmapsto\:(i_3,\:i_5)\)
で定めると、\(f\) は \(\bs{Z}/15\bs{Z}\) から \((\bs{Z}/3\bs{Z})\times(\bs{Z}/5\bs{Z})\) への同型写像になります。
そのことを確かめると、まず \(i\) を決めれば \(i_3,\:i_5\) は一意に決まります。また\(i_3,\:i_5\) を決めると、\(3\) と \(5\) は互いに素なので、中国剰余定理(21F)により、\(0\leq i\leq14\) の範囲で \(i\) が一意に決まります。つまり \(f\) は1対1写像(数学用語で "全単射")です。また、2つの元 \(i,\:j\) について
\(\begin{eqnarray}
&&\:\:f(i+j)&=(\:(i+j)_3,\:(i+j)_5\:)\\
&&&=(i_3+j_3,\:i_5+j_5)\\
&&\:\:f(i)+f(j)&=(i_3,\:i_5)+(j_3,\:j_5)\\
&&&=(i_3+j_3,\:i_5+j_5)\\
&&\:\:f(i+j)&=f(i)+f(j)\\
\end{eqnarray}\)
が成り立つので、\(f\) は同型写像の要件を満たします。従って、
\(\bs{Z}/15\bs{Z}\cong(\bs{Z}/3\bs{Z})\times(\bs{Z}/5\bs{Z})\)
です。一般に、\(a\) と \(b\) を互いに素な自然数とすると、
\(\bs{Z}/(ab)\bs{Z}\cong(\bs{Z}/a\bs{Z})\times(\bs{Z}/b\bs{Z})\)
です。これは2つの数だけでなく、\(n\) が \(k\)個の数 \(a_1,\:a_2,\:\cd\:a_k\) の積で表され、かつ、\(a_1,\:a_2,\:\cd\:a_k\) のどの2つをとっても互いに素なときには、中国剰余定理・多連立(21G)によって、
\(\bs{Z}/n\bs{Z}\cong(\bs{Z}/a_1\bs{Z})\times(\bs{Z}/a_2\bs{Z})\times\cd\times(\bs{Z}/a_k\bs{Z})\)
が成り立ちます。一般に 自然数 \(n\) は \(p_i\) を素数として、
\(n=p_1^{n_1}p_2^{n_2}\cd p_k^{n_k}\)
と素因数分解され、\(p_i^{n_i}\:\:(1\leq i\leq k)\) はどの2つをとっても互いに素なので、
\(\bs{Z}/n\bs{Z}\cong(\bs{Z}/p_1^{n_1}\bs{Z})\times(\bs{Z}/p_2^{n_2}\bs{Z})\times\cd\times(\bs{Z}/p_k^{n_k}\bs{Z})\)
成り立ちます。
2.3 既約剰余類群
2.2 節の剰余群は、整数の加算を演算の定義とする群でした。これに対して、整数の乗算を演算の定義とする群が構成できます。それが既約剰余類群です。
(既約剰余類群:23A) |
剰余群 \(\bs{Z}/n\bs{Z}\) から、代表元が \(n\) と互いに素なものだけを選び出したものを既約剰余類という。
「既約剰余類」は、乗算に関して群になる。これを「既約剰余類群」といい、\((\bs{Z}/n\bs{Z})^{*}\) で表す。
定義により、\((\bs{Z}/n\bs{Z})^{*}\) の群位数は \(\varphi(n)\) である。\(\varphi\) はオイラー関数で、\(\varphi(n)\) は \(n\) 以下で \(n\) と互いに素な自然数の数を表す。\(n\) が素数 \(p\) の場合の群位数は \(\varphi(p)=p-1\) である。
[証明]
「既約剰余類」は、乗算に関して群になることを証明する。まず例をあげると、\((\bs{Z}/10\bs{Z})^{*}\) の元は \(10\) と互いに素な代表元をもつ \(1,\:3,\:7,\:9\) である。この元の乗算による演算表を作ると、
\(\begin{array}{r|rrrr}
&1&3&7&9\\ \hline
1&1&3&7&9\\
3&3&9&1&7\\
7&7&1&9&3\\
9&9&7&3&1\\
\end{array}\)
となって、演算は閉じていて、単元 \(1\) があり、逆元があることがわかる( \(3^{-1}=7,\:7^{-1}=3,\:9^{-1}=9\) である\()\)。つまり群として成り立っている。
一般に、\(a,\:b\) が \(n\) と素だとすると、\(ab\) も \(n\) と素なので、\((\bs{Z}/n\bs{Z})^{*}\) は乗算で閉じている。また、不定方程式の解の存在定理(21C)により、
\(ax+ny=1\)
を満たす \(x,\:y\) が存在する。この式の両辺を \(\mr{mod}\:n\) でみると、
\(ax\equiv1\:\:(\mr{mod}\:n)\)
となる。この方程式の解の一つ(=特殊解)を \(x_0\) とし、\(k\) を整数として、\(x=x_0+kn\) とおくと\(,\)
\(\begin{eqnarray}
&&\:\:ax&=a(x_0+kn)\\
&&&=ax_0+akn\\
&&&\equiv1\:\:(\mr{mod}\:n)\\
\end{eqnarray}\)
なので、\(x\) も解である。従って解を \(1\leq x < n\) の範囲で選ぶことができる。つまり、\((\bs{Z}/n\bs{Z})^{*}\) の元 \(a\) に対して逆元が定義できることになり、\((\bs{Z}/n\bs{Z})^{*}\) は群である。[証明終]
2.4 有限体 \(\bs{F}_p\)
\(\bs{Z}/p\bs{Z}\) は体
剰余群 \(\bs{Z}/n\bs{Z}\) において \(n\) が素数 \(p\) である \(\bs{Z}/p\bs{Z}\) を考えます。\(p\) 未満の自然数は \(p\) と互いに素なので、既約剰余類群 \((\bs{Z}/p\bs{Z})^{*}\) は、\(\bs{Z}/p\bs{Z}\) から 加法の単位元 \(0\) を除いたものになります。つまり \(\bs{Z}/p\bs{Z}\) は加法について群であり、\(\bs{Z}/p\bs{Z}\:-\:\{\:0\:\}\) が乗法について群になっている。このような集合を体(field)と言います。
体とは加減乗除ができて、加法と乗法を結びつける分配則、
\(a(b+c)=ab+ac\)
が成り立つ集合です。\(\bs{Z}/p\bs{Z}\) は整数の演算をもとに定義されているので分配則が成り立ちます。
\(\bs{\bs{Z}/p\bs{Z}}\) を体としてみるとき、\(\bs{\bs{F}_p}\) と表記します。有理数 \(\bs{Q}\)、実数 \(\bs{R}\)、複素数 \(\bs{C}\) は体ですが、これらは無限集合です。一方、\(\bs{F}_p\) は有限集合なので有限体です。
有限体 \(\bs{F}_p\) における定数、変数、多項式、方程式の計算は、有理数/実数/複素数と同じようにできます。以下、今後の証明に使うので、\(\bs{F}_p\) 上の多項式と方程式を説明します。つまり、係数が \(\bs{F}_p\) の数である多項式や方程式です。
有限体の多項式と方程式
\(\bs{F}_p\) 上の多項式は、
\(f(x)=a_nx^n+a_{n-1}x^{n-1}+\:\cd\:+a_1x+a_0\:\:\:(a_i\in\bs{F}_p)\)
です。見た目は整数係数の多項式ですが、係数は \(\bs{F}_p\) の元です。\(\bs{F}_p\) は体なので、\(\bs{F}_p\) 上の多項式は加減算\(\cdot\)乗算\(\cdot\)余りをともなう除算(=剰余算、余り算)が、\(\bs{Q}\) 上の多項式と同じようにできます。従ってこれらの演算にもとづいた概念、定理は、\(\bs{Q}\) 上の多項式の場合と同じです。つまり、
因数分解 | |
割り切れる、割り切れないの概念 | |
最大公約数(共通に割り切る最大次数の多項式) | |
互除法による最大公約数の計算 | |
互いに素の概念(最大公約数が定数) | |
多項式の不定方程式(31A) | |
既約多項式(31B) | |
既約多項式と素数の類似性(31D) |
などです(なお、多項式\(\cdot\)方程式についてのこれらの概念や定理は「3.1 多項式」で説明します)。
たとえば、\(\bs{F}_5\) における多項式、\(x^2+1\) は、
\(x^2+1=(x-2)(x-3)\) [\(\bs{F}_5\)]
と、2つの1次多項式に因数分解できます。
\(\begin{eqnarray}
&&\:\:(x-2)(x-3)&=x^2-5x+6\\
&&&=x^2+1\\
\end{eqnarray}\)
が成り立つからです。従って、方程式、
\(x^2+1=0\) [\(\bs{F}_5\)]
の解は、\(x=2,\:3\) です。
一方、\(\bs{F}_7\) において \(x^2+1\) はこれ以上因数分解できない多項式です。なぜなら、
\(f(x)=x^2+1\) [\(\bs{F}_7\)]
とおくと、
\(f(k)\neq0\:\:(0\leq k\leq6)\) [\(\bs{F}_7\)]
だからです。もちろん剰余算(余り算)はできて、\(x^2+1\) を \(x-2\) で割ると、
\(x^2+1=(x-2)(x+2)+5\) [\(\bs{F}_7\)]
と計算できます。これは \(f(2)=5\)、つまり \(f(x)\) を \(x-2\) で割った余りは \(5\)、を意味します。
以上を踏まえて、\(\bs{F}_p\) 上の多項式\(\cdot\)方程式に関する次の定理を証明します(次節の定理の証明に使います)。方程式の "解" は "\(\bs{F}_p\) における解" の意味です。
(有限体上の方程式1:24A) |
\(\bs{F}_p\) 上の1次方程式、
\(ax+b=c\)
は1個の解をもつ。
[証明]
両辺に \(b\) の加法の逆元 \(-b\) を加えると、
\(ax=c+(-b)\)
となり、この両辺に 乗法の逆元 \(a^{-1}\) を掛けると、
\(x=a^{-1}(c+(-b))\)
となり、唯一の解が求まる。[証明終]
(有限体上の方程式2:24B) |
\(\bs{F}_p\) 上の多項式を \(f(x)\) とする。
\(f(a)=0\) なら、\(f(x)\) は \(x-a\) で割り切れる。
[証明]
\(f(x)\) を \(x-a\) で割った商を \(g(x)\)、余りを \(b\) とする。
\(f(x)=(x-a)g(x)+b\)
であるが、\(f(a)=0\) なので \(b=0\) である。従って、
\(f(x)=(x-a)g(x)\)
と表され、\(f(x)\) は \(x-a\) で割り切れる。[証明終]
(有限体上の方程式3:24C) |
\(\bs{F}_p\) 上の \(n\)次多項式を \(f_n(x)\) とする。方程式、
\(f_n(x)=0\)
の解は、高々 \(n\) 個である。
[証明]
\(n\) に関する数学的帰納法を使う。\(\bs{F}_p\) 上 の1次方程式の解は1個だから(24A)、題意は成り立つ。\(n\) 以下で題意が成り立つと仮定する。
\(\bs{F}_p\) 上の \(n+1\) 次方程式 \(f_{n+1}(x)=0\) の解がなければ、\(n+1\) でも題意は成り立っている。もし1個の解 \(a\) があるとすると\(f_{n+1}(a)=0\) なので、\(f_{n+1}(x)\) は \(x-a\) で割り切れる(24B)。つまり、
\(f_{n+1}(x)=(x-a)g(x)\)
となるが、\(g(x)\) は \(n\)次多項式だから、方程式、
\(g(x)=0\)
の解は高々 \(n\) 個である。従って、\(f_{n+1}(x)=0\) の解は高々 \(n+1\) 個である。ゆえに帰納法により題意は正しい。[証明終]
2.5 既約剰余類群は巡回群
2.5 節の目的は、2章の最終目的である、
既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) は巡回群の直積に同型である
という定理を証明することです。証明には少々長いステップが必要ですが、この定理はガロア理論の最終段階で必要になります。まず、群の「元の位数」の性質から始めます。
位数
(位数の定理:25A) |
\((\bs{Z}/n\bs{Z})^{*}\) の元を \(a\) とする。以下が成り立つ。
[補題1]
\(a^x=1\) となる \(x\:\:(1\leq x)\) が必ず存在する。\(x\) のうち最小のものを \(d\) とすると、\(d\) を \(a\) の位数(order)と呼ぶ。
[補題2]
\(a,\:a^2,\:a^3,\:\cd\:,\:a^d=1\) は 全て異なる。ないしは、
\(a^0=1,\:a,\:a^2,\:\cd\:,a^{d-1}\) は 全て異なる。
[補題3]
\(n=p\)(素数)とする。\(d\) 乗すると \(1\) になる \((\bs{Z}/p\bs{Z})^{*}\) の元は、\(a,\:a^2,\:a^3,\:\cd\:,\:a^d\) がそのすべてである。
[補題4]
\(a^x=1\) となる \(x\) は \(d\) の倍数である。
[補題5]
\(a\) の位数を \(d\) とすると、\(d\) は 群位数 の約数である。
[証明]
[補題1]
\((\bs{Z}/n\bs{Z})^{*}\) は有限群だから、\(a^j=a^i\:\:(i < j)\) となる \(i,\:j\) は必ず存在する。\(a^{-i}\) を両辺に掛けると \(a^{j-i}=1\) となり\(a^x=1\) となる \(x\) が必ず存在する。従って \(a\) の位数が定義できる。
[補題2]
\(a^j=a^i\:\:(1\leq i < j\leq d)\) となる \(i,\:j\) があったとすると、両辺に \(a^{-1}\) を掛けて \(a^{j-i}=1\) となるが、\(j-i < d\) だから、\(a^x=1\) となる最小の \(x\) が \(d\) ということと矛盾する。従って、\(a,\:a^2,\:a^3,\:\cd\:,\:a^d=1\) は 全て異なる。
[補題3]
\(a^i\:\:(1\leq i\leq d)\) を \(d\) 乗すると、
\((a^i)^d=(a^d)^i=1\)
であり、これら \(d\) 個の元はすべて \(d\) 乗すると \(1\) になる。
一方、\(d\) 乗すると \(1\) になる 元は 有限体 \(\bs{F}_p\) 上の \(d\) 次方程式 \(x^d-1=0\) の解であるが、有限体上の方程式3の定理(24C)により、\(d\) 次方程式の解の数は高々 \(d\) 個である。従って、\(a^i\:\:(1\leq i\leq d)\) の \(d\) 個の元は、\(d\) 乗すると \(1\) になる 元のすべてである。
[補題4]
\(x\) を \(d\) で割った商を \(q\:\:(1\leq q)\)、余りを \(r\:\:(0\leq r < d)\)とすると、
\(\begin{eqnarray}
&&\:\:a^{qd+r}&=1\\
&&\:\:(a^d)^q\cdot a^r&=1\\
&&\:\:a^r=1&\\
\end{eqnarray}\)
となるが、もし \(r\neq0\) なら、\(d\) より小さい数 \(r\) で \(a^r=1\) となり、これは \(a\) の位数が \(d\) であることと矛盾する。従って \(r=0\) であり、\(x\) は \(d\) の倍数である。
[補題5]
\((\bs{Z}/n\bs{Z})^{*}\) を \(G\) と書く。集合 \(A\) を、
\(A=\{a,\:a^2,\:\cd\:,\:a^d=1\}\)
とする。もし \(|G|=d\) なら、題意は満たされている。
\(d < |G|\) の場合、\(A\) に含まれない \(G\) の元の一つを \(b_1\) とし、
\(A_1=\{b_1a,\:b_1a^2,\:\cd\:,\:b_1a^d\}\)
とする。この \(A_1\) に \(A\) と共通な元はない。なぜならもし、
\(a^i=b_1a^j\:\:(1\leq i,j\leq d)\)
だとすると、両辺に \(a^{-j}\) をかけて、
\(a^{i-j}=b_1\)
となるが、左辺は \(A\) の元であり、右辺の \(b_1\) が \(A\) の元となって矛盾するからである。もし \(A\) と \(A_1\) で \(G\) の元を尽くしているなら、\(|G|=2d\) であり、題意は満たされている。
そうでない場合、\(A\) と \(A_1\) に含まれない \(G\) の元の一つを \(b_2\) とし、
\(A_2=\{b_2a,\:b_2a^2,\:\cd\:,\:b_2a^d\}\)
とする。上の論理と同じで \(A_2\) と \(A\) に共通な元はない。のみならず、\(A_2\) と \(A_1\) に共通な元もない。なぜなら、もし、
\(b_2a^i=b_1a^j\:\:(1\leq i,j\leq d)\)
だとすると、両辺に \(a^{-i}\) をかけて、
\(b_2=b_1a^{j-i}\)
となるが、\(a^{j-i}\) は \(A\) の元だから、\(b_1a^{j-i}\) は \(A_1\) の元であり、\(b_2\) が \(A_1\) の元ということになって矛盾するからである。もし \(A,\:A_1,\:A_2\) で \(G\) の元を尽くしているなら、\(|G|=3d\) であり、題意は満たされている。
そうでない場合、この操作を続けていくと、\(G\) は有限群だから、ちょうど \(G\) の元が尽くされたところで、操作は止まる。最後に作った部分集合が \(A_n\) だったとすると \(|G|=(1+n)d\) であり、\(a\) の位数 \(d\) は群位数の約数である。
\((\bs{Z}/n\bs{Z})^{*}\) の群位数は \(\varphi(n)\) なので(23A)、位数の定理(25A)の[補題5]から、次のフェルマの小定理とオイラーの定理が成り立つことがわかります。
(オイラーの定理:25B) |
自然数 \(n\) と素な自然数 \(a\) について、
\(a^{\varphi(n)}=1\:\:(\mr{mod}\:n)\)
が成り立つ(オイラーの定理)。\(\varphi\) はオイラー関数で、\(\varphi(n)\) は \(n\) 以下で \(n\) と互いに素な自然数の数を表す。
\(n=p\)(素数)の場合は、\(p\) と素な数 \(a\) について、
\(a^{p-1}=1\:\:(\mr{mod}\:p)\)
となる(フェルマの小定理)。
生成元の存在1
\((\bs{Z}/p\bs{Z})^{*}\) には生成元が存在し、従って巡回群であることを証明します。まず、特定の位数 \(d\) をもつ元の数に関する定理からです。
(位数 \(d\) の元の数:25C) |
\(p\) を素数とする。\((\bs{Z}/p\bs{Z})^{*}\) において、群位数 \((p-1)\) の約数 \(d\) のすべてについて、位数 \(d\) の元が \(\varphi(d)\) 個存在する。
[証明]
[補題1]により、\((\bs{Z}/p\bs{Z})^{*}\) のすべての元に位数が定義できる。その位数は[補題5]により、群位数 \((p-1)\) の約数である。
\((p-1)\) の任意の約数を \(d\) とし、位数 \(d\) の元 \(a\) があったとする。[補題3]により、\(d\)乗すると \(1\) になる \((\bs{Z}/p\bs{Z})^{*}\) の元は、
\(a,\:a^2,\:a^3,\:\cd\:,\:a^d(=1)\)
の「\(a\) 系列」がそのすべてである。\((\bs{Z}/p\bs{Z})^{*}\) の位数 \(d\) の元は、\(d\)乗すると \(1\) になるから、\(a\) 以外の位数 \(d\) の元も「\(a\) 系列」の中に含まれている。
ここで、\(\mr{gcd}(j,d)\neq1\) である \(j\:\:(1 < j\leq d)\) をとると、\(a^j\) の位数は \(d\) より小さくなる。なぜなら、\(\mr{gcd}(j,d)=c\:( > 1)\) とすると、2つの数 \(s,\:t\) を選んで、
\(j=c\cdot s\:\:(s < j)\)
\(d=c\cdot t\:\:(t < d)\)
と表されるが、そうすると、
\((a^j)t=a^{cst}=(a^d)^s=1\)
で、\(a^j\) の位数は \(t\) 以下だが、\(t < d\) なので \(a^j\) の位数は \(d\) より小さくなるからである。
一方、\(\mr{gcd}(j,d)\neq1\) である(=\(d\) と素な)\(j\:\:(1\leq j < d)\) をとると、\(a^j\) の位数は \(d\) になる。その理由は以下である。
\((a^j)^x\:\:(1\leq x\leq d)\) が \(x\) の値によってどう変わるかを調べると、まず、\(x=d\) のときは、
\((a^j)^x=(a^j)^d=(a^d)^j=1\)
である。
次に \(1\leq x < d\) のときは \(jx\) は \(d\) の倍数でない。なぜなら、\(j\) は \(d\) と素なため、もし \(jx\) が \(d\) の倍数だとすると、\(x\) が \(d\) の倍数ということになり、\(1\leq x < d\) に反するからである。従って、ある数 \(s,\:t\) を選んで、
\(jx=t\cdot d+s\:\:(0 < s < d)\)
と表せる。そうすると、
\((a^j)^x=a^{td+s}=(a^d)^t\cdot a^s=a^s\)
となるが、\(a\) の位数は \(d\) だから、\(d\) 未満の数 \(s\) で \(a^s\) が \(1\) になることはない。従って \(a^s\neq1\) であり、
\((a^j)^x\neq1\:\:(1\leq x < d)\)
である。
以上により
\((a^j)^x\neq1\) | \((1\leq x < d)\) | |
\((a^j)^x=1\) | \((x=d)\) |
まとめると、\((p-1)\) の任意の約数を \(d\) とし、\((\bs{Z}/p\bs{Z})^{*}\) の位数 \(d\) の元の数を \(\#\mr{ord}(d)\) と表記すると、
\(\#\mr{ord}(d)=\left\{
\begin{array}{l}
\begin{eqnarray}
&&\varphi(d)&\\
&&0&\\
\end{eqnarray}
\end{array}\right.\)
のどちらかである。また、\((\bs{Z}/p\bs{Z})^{*}\) のすべての元には位数が定義でき、\((\bs{Z}/p\bs{Z})^{*}\) の \((p-1)\) 個の元は位数で分類できるから、\(\displaystyle\sum_{d|(p-1)}^{}\#\mr{ord}(d)=p-1\)
が成り立つ。ここで \(d|(p-1)\) は、\((p-1)\) のすべての約数 \(d\) についての和をとる意味である。
次に、オイラー関数についてオイラー関数の総和の定理が成り立つことを証明する。
(オイラー関数の総和)
\(n\) を任意の自然数とするとき、
\(\displaystyle\sum_{d|n}^{}\varphi(d)=n\)
が成り立つ。\(d|n\) は、\(n\) のすべての約数 \(d\) についての和をとる。
[証明]
まず、次の2点に注意する。2つの自然数 \(a\) と \(b\) の最大公約数を \(\mr{gcd}(a,b)\) とすると、
\(\dfrac{a}{\mr{gcd}(a,b)}\) と \(\dfrac{b}{\mr{gcd}(a,b)}\) は互いに素
である。これは最大公約数の定義そのものである。
次に、\(n\) の約数の一つを \(a\) とし、\(n=a\cdot b\) と表すと、\(b\) もまた \(n\) の約数の一つである。\(n\) に \(r\) 個の約数、\(a_i\:\:(1\leq i\leq r)\) があるとき、
\(b_i=\dfrac{n}{a_i}\:\:(1\leq i\leq r)\)
と定義すると、\(b_i\:\:(1\leq i\leq r)\) もまた \(n\) の \(r\) 個の約数である。つまり、\(b_i\) は \(a_i\) を並び替えたものである。
以上の2点を前提に、まず \(n=12\) の場合で考察する。いま、\(1\) から \(12\) までの \(12\) 個の整数を「\(12\) との最大公約数で分類する」ことを考える。\(12\) の約数 \(d\) は、\(1,\:2,\:3,\:4,\:6,\:12\) の6つである。\(12\) との最大公約数が \(d\) である集合を \(S_d\) とすると、
\(S_1\) | \(=\{\:1,\:5\:,7\:,11\:\}\) | |
\(S_2\) | \(=\{\:2,\:10\:\}\) | |
\(S_3\) | \(=\{\:3,\:9\:\}\) | |
\(S_4\) | \(=\{\:4,\:8\:\}\) | |
\(S_6\) | \(=\{\:6\:\}\) | |
\(S_{12}\) | \(=\{\:12\:\}\) |
となる。各集合に含まれる整数の個数を \(\#S_d\) として順に見ていくと、まず、オイラー関数の定義より、
\(\#S_1=\varphi(12)\)
である。
次に、\(12\) との最大公約数が \(2\) の集合、\(S_2=\{\:2,\:10\:\}\) を考える。\(\{\:2,\:10\:\}\) を \(2\) で割り算した \(\{\:1,\:5\:\}\) のそれぞれは、最大公約数の定義により、\(12\) を \(2\) で割り算した \(6\) と互いに素である。従って、
\(\#S_2=\varphi(6)\)
である。同様に他の集合についても、
\(\#S_2\) | \(=\varphi(4)\) | |
\(\#S_4\) | \(=\varphi(3)\) | |
\(\#S_6\) | \(=\varphi(2)\) | |
\(\#S_{12}\) | \(=\varphi(1)\) |
\(\varphi(12)+\varphi(6)+\varphi(4)+\varphi(3)+\varphi(2)+\varphi(1)=12\) |
\(\displaystyle\sum_{d|12}^{}\varphi(d)=12\)
である。
以上の考察は \(n=12\) の場合であるが、\(12\) に特別な意味はない。従って一般の \(n\) の場合も同様となる。
\(n\) が \(r\) 個の約数をもつとし、それらを \(a_i\:\:(1\leq i\leq r)\) とする。集合 \(S\) を \(1\) から \(n\) の \(n\) 個の整数の集合とし、その部分集合 \(S_i\) を、
\(S_i\):\(n\) との最大公約数が \(a_i\) である \(S\) の元の集合
とする。このとき、\(S_i\) の任意の元を \(x\) とすると、
\(\dfrac{x}{a_i}\) と \(\dfrac{n}{a_i}\) は互いに素
である。そもそも、そうなる \(x\) を集めたのが \(S_i\) であった。このことから、
\(S_i\) の元の個数は \(\dfrac{n}{a_i}\) と素である \(S\) の元の個数
ということになる。\(S_i\) の元の個数を \(\#S_i\) と書くと、
\(\#S_i=\varphi\left(\dfrac{n}{a_i}\right)\)
である。ここで \(b_i\) を、
\(b_i=\dfrac{n}{a_i}\:\:(1\leq i\leq r)\)
と定義すると、
\(\#S_i=\varphi(b_i)\)
となるが、この \(b_i\:\:(1\leq i\leq r)\) は \(n\) の約数のすべてであり、\(a_i\) を並び替えたものである。式の両辺の \((1\leq i\leq r)\) の総和をとると、\(\#S_i\) の総和は \(S\) の元の数なので、
左辺\(=\displaystyle\sum_{i=1}^{r}\#S_i=n\)
である。一方、右辺の総和は、
\(\begin{eqnarray}
&&\:\:右辺&=\displaystyle\sum_{i=1}^{r}\varphi(b_i)=\displaystyle\sum_{i=1}^{r}\varphi(a_i)\\
&&&=\displaystyle\sum_{d|n}^{}\varphi(d)\\
\end{eqnarray}\)
となって、
\(\displaystyle\sum_{d|n}^{}\varphi(d)=n\)
が成り立つ。
\((p-1)\) の約数に戻ると、オイラー関数の総和の定理より、
\(\displaystyle\sum_{d|(p-1)}^{}\varphi(d)=p-1\)
である。一方、位数 \(d\) の元の総和は、
\(\displaystyle\sum_{d|(p-1)}^{}\#\mr{ord}(d)=p-1\)
であった。この2点から、
\(\#\mr{ord}(d)=\varphi(d)\)
が結論づけられる。\(\#\mr{ord}(d)=0\) となる \((p-1)\) の約数 \(d\) は無い。もしあるとすると矛盾が生じる。
従って \((\bs{Z}/p\bs{Z})^{*}\) においては、群位数 \((p-1)\) の約数 \(d\) のすべてについて、位数 \(d\) の元が \(\varphi(d)\) 個存在する。[証明終]
この位数 \(\bs{d}\) の元の数の定理(25C)により、次の生成元の存在1が成り立つことが分かります。
(生成元の存在1:25D) |
\(p\) を素数とするとき、\((\bs{Z}/p\bs{Z})^{*}\) には生成元が存在する。生成元とは、その位数が \((\bs{Z}/p\bs{Z})^{*}\) の群位数、\(p-1\) の元である。
なお、素数 \(p\) に対して、
\(a^x\equiv1\:\:(\mr{mod}\:p)\)
となる \(x\) の最小値が \(p-1\) であるような \(a\) を、\(p\) の原始根(primitive root)という。既約剰余類群 \((\bs{Z}/p\bs{Z})^{*}\) の生成元=原始根である。
\(a^x\equiv1\:\:(\mr{mod}\:p)\)
となる \(x\) の最小値が \(p-1\) であるような \(a\) を、\(p\) の原始根(primitive root)という。既約剰余類群 \((\bs{Z}/p\bs{Z})^{*}\) の生成元=原始根である。
ちなみに、\(100\)以下の素数 \(p\)(\(2\) を除く \(24\)個)について、原始根の数 = \(\varphi(p-1)\) と最小の原始根をパソコンで計算すると、次のようになります。
|
|