SSブログ

No.360 - ヒトの進化と苦味 [科学]

今まで、ヒトと苦味の関係について2つの記事を書きました。

 No.177「自己と非自己の科学:苦味受容体」
 No.178「野菜は毒だから体によい」

の2つです。No.177「自己と非自己の科学:苦味受容体」を要約すると次の通りです。

◆ 苦味は本来、危険のサインである。

◆ 舌で苦味を感じるセンサー、苦味受容体は、鼻などの呼吸器系にもあり、細菌などの進入物から体を防御している。その働きは3つある。
・ 細胞にシグナルを送り、繊毛を動かして進入物を押し出す
・ 細胞に指示して殺菌作用のある一酸化窒素を放出させる
・ 細胞に指示してディフェンシンという抗菌作用のあるタンパク質を放出させる

◆ さらに、苦味受容体は呼吸器系だけでなく体のあちこちにあり(たとえば小腸)、免疫機能を果たしている。

五味と総称される、甘味・酸味・塩味・苦味・うま味のうち、苦味を除く4つは、その味を引き起こす物質が決まっています。

甘味 :糖
酸味 :酸=水素イオン
塩味 :塩=ナトリウムイオン
うま味 :アミノ酸

です。この4味を感じる味覚受容体はそれぞれ1種類です。しかし苦味を引き起こす物質は多様で、それに対応して苦味受容体も複数種類あります。そしてヒトは、本来危険のサインである苦味を楽しむ文化を作ってきました。
・ お茶を飲む文化
・ コーヒーを飲む文化
などは世界中に広まっています。ビールもそうでしょう。ホップを使ってわざわざ苦くしている。赤ワインの味は複雑ですが、味の魅力を作るポイントの一つが苦味(=ブドウの皮由来のタンニン)であることは間違いないでしょう。

ではなぜ、本来危険のサインである苦味を楽しむ文化が広まったのでしょうか。その理由の一端が分かるのが、No.178「野菜は毒だから体によい」です。要約すると、

◆ 植物は、動物や昆虫に食べられまいとして、毒素を生成するものが多い。

◆ 植物の毒素のあるものは、微量であればヒトの体によい影響を及ぼす。代表的なものは、
・ スルフォラファン(ブロッコリー)
・ クルクミン(ターメリック)
・ カフェイン(コーヒーや茶)
・ カテキン(茶)
・ カプサイシン(唐辛子)
などである(ターメリックはカレーによく使う香辛料)。

◆ これらは微量なら体の細胞に適度なストレスを与え、細胞はそのストレスから回復しようとする(たとえば抗酸化物質の算出)。その回復機能の活性化が体に良い影響を与える。

上にある植物の毒素は、苦味と重ならないものもありますが(カプサイシン)、重なる部分も多い。つまり、植物由来の微量毒素を摂取することと、苦いものを食べる・飲むことは密接に関係していると考えられます。

ヒトの体は(小さな)ストレスや(小さな)ダメージから回復する機能を備えています。使わない機能は衰えるのが原則です。それが必要ないと体が判断するからです。ヒトは苦いものを食べる・飲むことで、体のストレス回復機能を常時活性化させておき、それが健康維持に役立つ ・・・・・・。そういう風に考えられます。



先日の日本経済新聞に、苦味とヒトの進化をまとめた記事が掲載されました(2023年4月30日 日経 STYLE)。ヒトにとっての苦味の意味が理解できる良い記事だと思ったので、紹介します。


苦味、命の恵み


日本経済新聞の記事は、

 苦味、命の恵み

と題するもので、このタイトルのもとに、次の文が続きます。


春の味覚を象徴する山菜にゴーヤー、ビール、コーヒー ───。幼少の頃に顔をしかめた大人の味は、元は毒を検知し体内に取りこまないための機能だった。「苦味」を、私たちはいつから楽しめるようになったのだろう。近年の研究では、苦味を感じる感覚が、進化の歴史にも深く関わっていたことが明らかになっている。

日本経済新聞(日経 STYLE)
2023年4月30日 

記事は2つの部分に分かれています。

・ 郷土に根ざす文化の味わい
・ ヒトへの進化支える不思議

です。「郷土に根ざす文化の味わい」では、日本の郷土料理を支える苦味、特に山菜料理とその歴史の紹介でした。

苦み 山菜.jpg
埼玉県入間市の郷土料理店「ともん」で供される山菜。日本経済新聞より。

以下は、第2部である「ヒトへの進化支える不思議」を紹介します。


ヒトへの進化支える不思議



私たちは、なぜ苦いものをおいしいと感じるのだろう。苦味は本来、毒を口にしたときに叶き出すための機能だ。本能的に苦い食べ物を嫌う子供は、食体験を積む中である種の苦みをおいしいと学習する。苦味という感覚の仕組みを探ると、ほかの味覚とは異なる不思議が見えてくる

日本経済新聞(日経 STYLE)
2023年4月30日 

苦味が本来危険のサインだとすると、子供が苦い食べ物を嫌うのはヒトに備わった正常な反応でしょう。しかし「食体験を積む中である種の苦みをおいしいと学習する」のはなぜでしょうか。これは少々不思議です。なぜ味覚が変化するのか。

たとえば、甘味を考えてみると、子供が甘いものが大好きなのは人類共通だと思います。しかし大人になると甘いものを嫌う人がでてきます(大人になっても甘いもの大好きという人もいるが)。これはなぜかというと「甘いものは体によくない」「糖質のとりすぎは健康を損ねる」という "知識" を獲得するためと考えられます。

塩味もそうです。塩は料理には欠かせないし、適度な塩分は体の維持に必須です。しかし年配になると塩味が強すぎるものを嫌う人が出てくる。これは、高血圧症などの生活習慣病のリスクを避けるという "知識" からくるのだと思います。その他、酢を使った料理や飲料を好むように変わったとしたら、それも健康に良いという知識によるのでしょう。

しかし苦味は違います。「苦味が健康に良い」という "知識" が広まっているとは思えません。それでもなおかつ大人になると苦味を好むのは、もちろん、コーヒーや緑茶やビールを飲むという文化・習慣が根付いていて、それに馴染むわけです。ではなぜそういう文化・習慣が根付いたかと言うと、体が苦いものを欲するようになるからではないでしょうか。

苦味は本来、危険のサインだけれど、長い進化や文化的伝統のなかで "安全な苦味" と分かっているものについては、その苦味にメリットがあることを自然と体得するのだと思います。

日経新聞の引用を続けます。


人間は口の中にある「味覚受容体」の働きによって味を感じている。たとえば甘味とうま味の受容体は各1種類で、糖は甘味、アミノ酸はうま味という具合に、物質と味覚がほぼ1対1で対応している。これに対し苦味の受容体は26種類もある。「苦い」と感じる山菜、コーヒー、ホップ、かんきつ類などの苦味物質は、それぞれ異なるのだ。


苦味の受容体は26種類、と書かれています。苦味物質がは多様であり、それに対応して苦味受容体の種類も多い。その多様性はヒトが進化の過程で獲得してきたものです。


多くの苦味受容体を持つに至ったのは、進化の過程に深く関係がある。苦味受容体は、ヒトの祖先である霊長類が「主食を昆虫から植物の葉へと変えていく過程で増えていった」と北海道大学大学院 地球環境科学研究院 助教の早川卓志さん(博士)は解説する。早川さんはゲノム解析を通じて野生動物の行動や進化を研究する。

霊長類の祖先にあたる哺乳類は昆虫を主食としていたが、体が大きくなるにつれて虫だけでは栄養が不足し、葉に含まれるたんぱく質を摂取するようになる。植物はもともと毘虫に食べられないよう多様な毒を蓄えており、ヒ卜の祖先は「それを避けるように『苦味感覚』というセンサーを発達させ、受容体の数も増やした」(早川さん)。従って、植物を食べない哺乳類では苦味感覚の出番はあまりなく、受容体の数も少ない傾向にある。肉食のネコは霊長類の約3分の1、イルカ・クジラに至ってはゼロだ。


NHK BS プレミアム ヒューマニエンス「"毒と薬" その攻防が進化を生む」(2023年1月31日 22:00~23:00)に早川さんが出演されて、苦味受容体の解説をされていました。それによると、霊長類の苦味受容体の種類は、

小型霊長類
マーモセット :20
リスザル :22
メガネザル :16
大型霊長類
ゴリラ :25
チンパンジー :28
ヒト :26

だそうです。この違いは何かというと、小型霊長類は主として昆虫食であるのに対し、大型霊長類は大きな体を維持するために苦味物質が含まれる植物の葉を食べるようになったからです。

ちなみに、ヒトとチンパンジーは約700万年前に共通の祖先から別れたのですが、その共通祖先の苦味受容体の種類数は28と推定されるそうです。つまりヒトは2種類失った。これはなぜなのでしょうか。


矛盾するようだが「ヒトは必ずしも苦みに敏感な動物ではない」と話すのは味覚の仕組みを研究する東京大学大学院 農学生命科学研究科 准教授の三坂巧さん(博士)。葉食に移行した霊長類は「苦味を鈍らせ、葉に含まれるグルタミン酸をおいしいと感じるようになった。ヒトに至っては苦いお茶にうま味を感じるまでに」なったという。厳格に苦い=食べないを実践する生物は食べられる物の選択肢が狭く、生存競争には不利に働く。チンバンジーが28の苦味受容体を持つのに対し、ヒトはそこから2つ失って26に落ち着いた。


受容体の数を減らすことで、食べられる食物の選択肢を増やしたとの話ですが、それ以外に、肉食を始めたこと(約250~200万年前)や、加熱調理(約100万年前かそれ以前)によって、苦味を忌避する必要性が薄れたことも影響しているのでしょう。NHK の「ヒューマニエンス」でもそういう話がありました。

また、ヒトの苦味感覚には個人差があり、また苦味を受容するスタイルも多様です。


ヒトの苦味感覚には個人差もある。ブロッコリーの苦みを強く感じる人と、感じない人がおり、この違いは先天的に遺伝子の型で決まる。苦みを感じて避ける人ばかりの集団では、ブロッコリーを食べる習慣は生まれないだろう。味覚の多様性が、得られる食材の選択肢を広げてきたと考えられる。

ヒトは苦味感覚の発達とあわせて一部は退化方向に適応させ、安全な食べ物か否かを集団内で学習しながら苦い食材も食べてきた。さらにコーヒーを砂糖やミルクでマスキングしたり、山菜をあく抜きしたり、野菜を品種改良したり。飽くなき食への関心から工夫を重ね「『山菜は春の風物詩』といったイメージも含め、様々な情報が複合して、苦みがおいしいという感覚が形成」(三坂さん)されるに至った。


スタバのドリップコーヒーは苦くて飲めないという人がいます。私は平気ですが、飲めないという意見も理解できる。しかしそれほど "苦い" ものであっても、人々は砂糖を入れたり、ミルク、生クリームなどを入れたりして "苦味をマスキング" し、"何とかして" 飲もうとしてきた。これは、体が苦味を欲している、と考えるのが妥当だと思います。

さらに日経新聞には「料理にあえて苦味を加える」という、興味深い話があります。


苦みを加えることで味わいが増すと考えるのは、ミシュランーつ星のフレンチ「SiO(シオ)」シェフの烏羽周作さんだ。「1皿に入るうまみの総量には限界がある。うまみを重ねるだけでは平たんで重くなってしまうが、そこに苦みを加えるとうまみの容量が増え、料理の立体感を生む」と話す。系列店の北青山「Hotel's」ではコース料理のメイン「薪火焼きステーキ」に「苦味調味料」を添えて提供する。ハーブソルトに、ビールの苦みや香りの元になるホップの成分を配合したものだ。

この調味料は、キリンホールディングスでホップを使った新規事業を担当する金子裕司さんが開発した。「苦味はうま味、油脂の味わいを高めるので、肉料理や揚げ物に使ってもらいたい」と語る。「今はおいしい苦みといえば山菜、コーヒー、チョコレートといつた食材にとどまっている。家庭でも苦味の上手な使い方が広まれば、食がより豊かになるはず」


苦み ステーキ.jpg
東京・北青山の「Hotel's」では、メインのステーキにホップの苦味が特徴のハーブソルトを添えて提供される。

辛味調味料である辛子からし山葵わさびを添える料理はいろいろあります。であれば、「ハーブソルトに、ビールの苦みや香りの元になるホップの成分を配合した」苦味調味料を添える料理があってもよいはずです。

考えてみると、焼いたり、あぶったり、げめをつけたりする料理がいろいろあります。これは、過度にならない苦味を足すことで食材の味をより引き立たせる意味も大きいのでしょう。さらに「稚鮎の天ぷら」のような料理を考えてみると、おいしさのポイントが鮎の内臓(ワタ)の苦味でであることは確かです。

ホップを使ったような "苦味調味料" は今で無かったかもしれないが、実質的に同じ効果を得る料理はたくさんあるはずです。


さらなる未知の領域を想像させるのが「苦味には味を感じる以外の働きがあること」(キリンの金子さん)。実は苦味受容体は舌や口の中以外にも広く存在している。食べ物が直接接するはずのない鼻の苦味受容体は細菌の排除に役立っていることが知られる。苦味受容体の遺伝子は脂肪細胞などにも存在し、ホップの苦味成分には体脂肪を減らす機能も報告されている。

子供のころには嫌いだった苦い食材を年を重ねるごとに好むようになるのも「一般的には食べ慣れるからと考えられていますが、健康維持のために中高年になると、苦味物質を体が欲するようになるとしたらとても興味深いですよね」と金子さん。


冒頭に書いたように「苦味受容体は舌や口の中以外にも広く存在し、食べ物が直接接するはずのない鼻の苦味受容体は細菌の排除に役立っている」のは事実なので、「健康維持のために中高年になると、苦味物質を体が欲するようになる」というのが、サイエンスとしては正しいと思います。


苦味には科学的に未解明の謎が多い。UCC上珈琲はコーヒーの苦味成分として乳酸など3つの新たな物質を特定し、2021年に論文として発表した。苦味成分としてはカフェインが思い浮かぶがノンカフェインもコ-ヒー独特の苦みがある。コーヒーの味に関わる物質は1千を超えるとみられ、同研究に携わった製品開発部の成田優作さんは「コーヒーの苦味について、まだ全貌がつかめない」と話す。

「良薬口に苦し」。苦味の世界をのぞいた後では、この言葉もより深い意味をもって響かないだろうか。(佐藤洋輔)


以上のような話を読むと、野菜を品種改良して適度な苦味まで無くすとか、あるいは減少させるのは、ヒトと苦味の長い付き合いの本筋から全くはずれた行為と言えるでしょう。

要するに我々は、苦味とうまく付き合えばよいということです。




nice!(0) 

No.359 - 高校数学で理解するガロア理論(6) [科学]

\(\newcommand{\bs}[1]{\boldsymbol{#1}}
\newcommand{\mr}[1]{\mathrm{#1}}
\newcommand{\br}[1]{\textbf{#1}}
\newcommand{\ol}[1]{\overline{#1}}\)
 
7.可解性の十分条件(続き) 
 


7.8 可解な5次方程式


大多数の5次方程式のガロア群は、対称群 \(S_5\) か 交代群 \(A_5\) であり、従って可解ではありません(65G)。しかし特別な形の5次方程式は可解です。

x^5-2=0.jpg
\(x^5-2=0\) の根
その可解な5次方程式として \(x^5-2=0\) を取り上げ、ガロア群を分析します。この方程式の根がべき根で表現できることはあたりまえだし、こんな "単純な" 方程式のガロア群を分析することに意味があるのかどうか、疑ってしまいます。

しかし、\(x^5-2=0\) のガロア群は可解な5次方程式のガロア群としては最も複雑なのです。方程式の "見た目の" 単純・複雑さと、ガロア群の単純・複雑さはリンクしません。以下で \(x^5-2\) のガロア群を計算します。

\(x^5-2\) のガロア群
\(1\) の原始\(5\)乗根の一つを \(\zeta\) とします。\(x^5-1=0\) は、
 \((x-1)(x^4+x^3+x^2+x+1)=0\)
と因数分解できるので、\(\zeta\) は、
 \(x^4+x^3+x^2+x+1=0\)
の根です。7.1節で計算したように、たとえば、
 \(\zeta=\dfrac{1}{4}(-1+\sqrt{5}+i\sqrt{10+2\sqrt{5}})\)
です。また、
 \(\alpha=\sqrt[5]{2}\)
とします。そうすると、\(x^5-2=0\) の解は、
 \(\alpha,\:\:\alpha\zeta ,\:\:\alpha\zeta ^2,\:\:\alpha\zeta ^3,\:\:\alpha\zeta ^4\)
の5つです。\(f(x)=x^5-2\) の最小分解体 \(\bs{L}\) は、
\(\begin{eqnarray}
&&\:\:\bs{L}&=\bs{Q}(\alpha,\:\alpha\zeta ,\:\alpha\zeta ^2,\:\alpha\zeta ^3,\:\alpha\zeta ^4)\\
&&&=\bs{Q}(\zeta,\alpha)\\
\end{eqnarray}\)
です。この \(\bs{L}=\bs{Q}(\zeta,\alpha)\) は、\(\bs{F}=\bs{Q}(\zeta)\) として、
 \(\bs{Q}\:\subset\:\bs{F}\:\subset\:\bs{L}\)
という、体の拡大で作られたものと見なせます。つまり \(\bs{L}=\bs{F}(\alpha)\) です。

\(\zeta\) の \(\bs{Q}\) 上最小多項式は、\(x^4+x^3+x^2+x+1\) という4次多項式なので、拡大次数は、
 \([\:\bs{F}:\:\bs{Q}\:]=4\)
です。\(\bs{Q}(\zeta)\) は単拡大体であり、単拡大体の同型写像の定理(51G)によって、\(\zeta\) に作用する \(\bs{Q}\) 上の同型写像はちょうど \(4\)個あります。

\(\bs{L}=\bs{Q}(\zeta,\alpha)\) は \(\bs{F}=\bs{Q}(\zeta)\) 上の5次既約多項式 \(x^5-2\) の解 \(\alpha\) を \(\bs{F}\) に添加した単拡大体です。従って、
 \([\:\bs{L}\::\:\bs{F}\:]=5\)
です。\(\bs{L}=\bs{F}(\alpha)\) も単拡大体であり、\(\alpha\) に作用する \(\bs{\bs{F}}\) 上の同型写像は \(5\)個です。

拡大次数の連鎖律33H)により、
 \([\:\bs{L}\::\:\bs{Q}\:]=[\:\bs{L}\::\:\bs{F}\:]\cdot[\:\bs{F}\::\:\bs{Q}\:]=20\)
がわかります。従って \(\mr{Gal}(\bs{L}/\bs{Q})\) の位数は \(20\) です。\(\bs{L}=\bs{Q}(\zeta,\alpha)\) の自己同型写像を\(20\)個見つければ、それが \(\mr{Gal}(\bs{Q}(\zeta,\alpha)/\bs{Q})\) です。

 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) 

自己同型写像は、方程式の解を共役な解に移します。\(\zeta\) は \(1\) の原始\(5\)乗根であり、4次方程式 \(x^4+x^3+x^2+x+1=0\) の解なので、
 \(\zeta,\:\:\zeta^2,\:\:\zeta^3,\:\:\zeta^4\)
が互いに共役です。そこで、自己同型写像 \(\tau_i\:(i=1,2,3,4)\) を、\(\zeta\) を \(\zeta^i\) に置き換える写像、つまり、
 \(\tau_i\::\:\zeta\:\longrightarrow\:\zeta^i\)
と定義します。これを、
 \(\tau_i(\zeta)=\zeta^i\:\:(i=1,2,3,4)\)
と表記します。\(\tau_i\:(i=1,2,3,4)\) の集合を、
 \(G_{\large t}=\{\tau_1,\:\tau_2,\:\tau_3,\:\tau_4\}\)
とすると、\(G_{\large t}\) は \(\bs{Q}(\zeta)\) の4つの自己同型写像の集合なので、
 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})=G_{\large t}\)
です。恒等写像を \(e\) とすると、
 \(\tau_1=e\)
ですが、
 \(\tau_2(\zeta)=\zeta^2\)
\(\begin{eqnarray}
&&\:\:\tau_2^{\:2}(\zeta)&=\tau_2(\tau_2(\zeta))=\tau_2(\zeta^2)\\
&&&=\zeta^4=\tau_4(\zeta)\\
&&\:\:\tau_2^{\:3}(\zeta)&=\tau_2(\tau_2^2(\zeta))=\tau_2(\zeta^4)\\
&&&=\zeta^8=\zeta^3=\tau_3(\zeta)\\
&&\:\:\tau_2^{\:4}(\zeta)&=\zeta^{16}=\tau_1(\zeta)\\
\end{eqnarray}\)
と計算できるで、
 \(\tau_1^{\:2}=\tau_4,\:\tau_1^{\:3}=\tau_3,\:\tau_1^{\:4}=e\)
となります。従って、\(\tau_2\) を \(\tau\) と書くと、
 \(G_{\large t}=\{e,\:\tau,\:\tau^2,\:\tau^3\}\)
であり、\(G_{\large t}\) は \(\tau\)(= \(\tau_2\)) を生成元とする位数 \(4\) の巡回群で、規約剰余類群 \((\bs{Z}/5\bs{Z})^{*}\) と同型です。これは一般に \(1\) の原始\(n\)乗根を \(\zeta\) としたときに、
 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/n\bs{Z})^{*}\)
という 6.3節の \(\bs{\bs{Q}(\zeta)}\)のガロア群の定理(63E)からもわかります。

\((\bs{Z}/5\bs{Z})^{*}\) の生成元は \(2,\:3\) です。従って、\(G_{\large t}\) の生成元は \(\tau_2,\:\tau_3\) です。\(\tau_4\) については、
 \(\tau_4(\zeta)=\zeta^4\)
\(\begin{eqnarray}
&&\:\:\tau_4^{\:2}(\zeta)&=\tau_4(\tau_4(\zeta))=\tau_4(\zeta^4)\\
&&&=\zeta^{16}=\zeta\\
\end{eqnarray}\)
なので、\(\tau_4^{\:2}=\tau_1=e\) であり、生成元ではありません。

 \(\mr{Gal}(\bs{F}(\alpha)/\bs{F})\) 

\(\bs{L}=\bs{Q}(\zeta,\alpha)=\bs{F}(\alpha)\) は \(\bs{F}=\bs{Q}(\zeta)\) 上の規約方程式 \(x^5-2=0\) の解の一つである \(\alpha\) を \(\bs{F}\) に添加したべき根拡大体です。\(\bs{F}\) には \(1\)の原始5乗根 \(\zeta\) が含まれるので、\(\bs{F}(\alpha)/\bs{F}\) はガロア拡大、かつ巡回拡大です。\(\alpha\) と共役な方程式の根は、
 \(\alpha,\:\:\alpha\zeta ,\:\:\alpha\zeta ^2,\:\:\alpha\zeta ^3,\:\:\alpha\zeta ^4\)
です。そこで \(\alpha\) に作用する自己同型写像 \(\sigma_j\:(j=0,1,2,3,4)\) を、
 \(\sigma_j:\:\alpha\:\longrightarrow\:\alpha\zeta ^j\)
と定義します。これを
 \(\sigma_j(\alpha)=\alpha\zeta ^j\)
と書きます。\(\sigma_j\) の集合を、
 \(G_{\large s}=\{\sigma_0,\:\sigma_1,\:\sigma_2,\:\sigma_3,\:\sigma_4\}\)
とすると、\(\mr{Gal}(\bs{F}(\alpha)/\bs{F})=G_{\large s}\) です。また、
 \(\sigma_0=e\)
 \(\sigma_1(\alpha)=\alpha\zeta \)
 \(\sigma_2(\alpha)=\alpha\zeta ^2=\sigma_1^{\:2}(\alpha)\)
 \(\sigma_3(\alpha)=\alpha\zeta ^3=\sigma_1^{\:3}(\alpha)\)
 \(\sigma_4(\alpha)=\alpha\zeta ^4=\sigma_1^{\:4}(\alpha)\)
です。\(\sigma_1=\sigma\) と書くと、
 \(G_{\large s}=\{e,\:\sigma,\:\sigma^2,\:\sigma^3,\:\sigma^4\}\)
となって、\(G_{\large t}\) は \(\sigma\) を生成元とする位数 \(5\) の巡回群であり、剰余群 \(\bs{Z}/5\bs{Z}\) と同型です。なお \(5\) は素数なので、\(\sigma_1\) だけでなく、\(\sigma_2,\:\sigma_3,\:\sigma_4\) も生成元です。

 \(\mr{Gal}(\bs{Q}(\zeta,\alpha)/\bs{Q})\) 

\(\sigma_j\) を使って、\(\bs{F}=\bs{Q}(\zeta)\) の自己同型写像 \(\tau_i\) を \(\bs{L}=\bs{Q}(\zeta,\alpha)\) の自己同型写像に延長します。同型写像の延長定理51H)により、\(\bs{Q}(\zeta,\alpha)\) の自己同型写像で、その作用を \(\bs{Q}(\zeta)\) に限定すると \(\tau_i\) に一致するものが必ず存在します。

\(\tau_i\) と \(\sigma_j\) の合成写像を \(\sigma_{ij}\) とし、
 \(\sigma_{ij}=\sigma_j\cdot\tau _i\:(i=1,2,3,4)\:\:(j=0,1,2,3,4)\)
と定義します。\(\tau_i\) が先に作用します。すると、
 \(\sigma_{10}=\sigma_0\cdot\tau _1=e\cdot e=e\)
 \(\sigma_{ij}(\zeta)=\tau_i(\zeta)=\zeta^i\)
 \(\sigma_{ij}(\alpha)=\sigma_j(\alpha)=\alpha\zeta ^j\)
となります。また、
\(\begin{eqnarray}
&&\:\:\sigma_{ij}(\alpha\zeta )&=\sigma_j\tau_i(\alpha\zeta )\\
&&&=\sigma_j(\alpha\zeta ^i)\\
&&&=\alpha\zeta ^j\zeta^i\\
&&&=\alpha\zeta ^{i+j}\\
\end{eqnarray}\)
です。このように定義した \(\sigma_{ij}\) 同士の演算(=写像の合成)は \(\sigma_{ij}\) で閉じています。\(\tau_i\) も \(\sigma_j\) も5次方程式の解を共役な解に移す写像なので、その合成写像もまた、解を共役な解に移す写像ですが(=閉じている)、次のように計算で確認することができます。

\(\tau_i\:(i=1,2,3,4)\) は \(\tau(\)=\(\tau_2)\) を生成元とする巡回群で、\(\sigma_j\:(j=0,1,2,3,4)\) は \(\sigma(=\sigma_1)\) を生成元とする巡回群です。ここで、
 \(\tau\sigma =\sigma^2\tau\)
が成り立ちます。なぜなら、
\(\begin{eqnarray}
&&\:\:\tau\sigma (\alpha\zeta )&=\tau_2\sigma_1(\alpha\zeta )\\
&&&=\tau_2(\alpha\zeta \cdot\zeta )=\tau_2(\alpha\zeta ^2)\\
&&&=\alpha\zeta ^4\\
&&\:\:\sigma^2\tau(\alpha\zeta )&=\sigma_1^{\:2}\tau_2(\alpha\zeta )\\
&&&=\sigma_1^{\:2}(\alpha\zeta ^2)\\
&&&=\sigma_1(\alpha\zeta \cdot\zeta ^2)\\
&&&=\alpha\zeta \cdot\zeta \cdot\zeta ^2\\
&&&=\alpha\zeta ^4\\
\end{eqnarray}\)
と計算できるので、
 \(\tau\sigma (\alpha\zeta )=\sigma^2\tau(\alpha\zeta )\)
が成り立つからです。\(\sigma\) と \(\tau\) は可換ではありませんが(\(\tau\sigma \neq\sigma \tau\))、\(\tau\sigma =\sigma^2\tau\) という、いわば "弱可換性" があります("弱可換性" はここだけの言葉)。

なお、一般化すると、
  \(\tau^i\sigma^j=\sigma^k\tau^i\:\:(k=2^{i}j)\)
と計算できます。

\(\sigma_{ij}\) の 2つの元 \(\sigma_{ab},\:\sigma_{cd}\) の合成写像は、
 \(\sigma_{cd}\sigma_{ab}=\sigma_d\tau_c\sigma_b\tau_a=\sigma_d(\tau_c\sigma_b)\tau_a\)
ですが、\(\tau_c\sigma_b\) の部分は、
 \(\tau_c\sigma_b=\tau\cdots \tau\sigma \cdots\sigma \)
の形をしています。この部分に弱可換性 \(\tau\sigma =\sigma^2\tau\) の関係を繰り返し使って、
 \(\tau_c\sigma_b=\sigma\cdots \sigma\tau \cdots\tau \)
の形に変形できます。ということは、
 \(\sigma_{cd}\sigma_{ab}=\sigma\cdots \sigma\tau \cdots\tau \)
にまで変形できます。\(\sigma^5=e,\:\tau^4=e\) なので、これは、
 \(\sigma_{cd}\sigma_{ab}=\sigma_j\tau_i\)
となる \(i,\:j\) が一意に決まることを示していて、合成写像は \(\sigma_{ij}\) で閉じていることがわかります。

2つの写像、\(\sigma_{ab}\) と \(\sigma_{cd}\) の合成写像を具体的に計算してみると、
\(\begin{eqnarray}
&&\:\:\sigma_{cd}\sigma_{ab}(\alpha\zeta )&=\sigma_{cd}(\alpha\zeta ^{a+b})\\
&&&=\sigma_d\tau_c(\alpha\zeta ^{a+b})\\
&&&=\sigma_d\alpha\zeta ^{c(a+b)}\\
&&&=\alpha\zeta ^{ac+bc+d}\\
\end{eqnarray}\)
  \((1\leq a,c\leq4,\:\:0\leq b,d\leq4)\)
となります。四則演算はすべて有限体 \(\bs{F}_5\) で(= \(\mr{mod}\:5\) で)行います。
 \(\sigma_{(ac)(bc+d)}(\alpha\zeta )=\alpha\zeta ^{ac+bc+d}\)
なので、
 \(\sigma_{cd}\sigma_{ab}=\sigma_{(ac)(bc+d)}\)
です。記述を見やすくするため、

\(\sigma_{ij}=[i,\:j]\)

と書きます。この記法を使うと、
 \([c,\:d][a,\:b]=[ac,\:bc+d]\)
となります。また、
 \([a,\:b][a^{-1},\:-a^{-1}b]\)
  \(=[aa^{-1},\:-aa^{-1}b+b]\)
  \(=[1,\:0]=e\)
 \([a^{-1},\:-a^{-1}b][a,\:b]\)
  \(=[a^{-1}a,\:a^{-1}b-a^{-1}b]\)
  \(=[1,\:0]=e\)
なので、\([a,\:b]\) の逆元は、
 \([a,\:b]^{-1}=[a^{-1},\:-a^{-1}b]\)
です。\(a^{-1}\) も \(\bs{F}_5\)(ないしは\((\bs{Z}/5\bs{Z})^{*}\))での逆元で、\(1^{-1}=1\)、\(2^{-1}=3\)、\(3^{-1}=2\)、\(4^{-1}=4\) です。

以上で、演算で閉じていて、単位元と逆元の存在がいえるので、
 \(\sigma_{ij}\:\:(i=1,2,3,4)\:\:(j=0,1,2,3,4)\)
は群を構成することがわかります。



\(\sigma_{ij}\) を共役な解の巡回置換で表現します。\(x^5-2=0\) の5つの解を \(1,\:2\:,3,\:4,\:5\) で表します。つまり、
 \(1:\alpha,\:2:\alpha\zeta ,\:3:\alpha\zeta ^2,\:4:\alpha\zeta ^3,\:5:\alpha\zeta ^4\)
です。
 \(\tau_i(\zeta)=\zeta^i\)
ですが、\(\zeta^5=1\) に注意して、\(\tau_i\) を巡回置換で表現すると、
 \(\tau_1=\:e\)
 \(\tau_2=(2,\:3,\:5,\:4)=\tau\)
 \(\tau_3=(2,\:4,\:5,\:3)=\tau^3\)
 \(\tau_4=(2,\:5)(3,\:4)=\tau^2\)
となります。同様にして、
 \(\sigma_j(\alpha)=\alpha\zeta ^j\)
なので、
 \(\sigma_0=\:e\)
 \(\sigma_1=(1,\:2,\:3,\:4,\:5)=\sigma\)
 \(\sigma_2=(1,\:3,\:5,\:2,\:4)=\sigma^2\)
 \(\sigma_3=(1,\:4,\:2,\:5,\:3)=\sigma^3\)
 \(\sigma_4=(1,\:5,\:4,\:3,\:2)=\sigma^4\)
です。これらをもとに \(\sigma_{ij}\) を計算すると、次のようになります。

 \(\sigma_{10}=\sigma_0\tau_1=\:e\)
 \(\sigma_{20}=\sigma_0\tau_2=(2,\:3,\:5,\:4)\)
 \(\sigma_{30}=\sigma_0\tau_3=(2,\:4,\:5,\:3)\)
 \(\sigma_{40}=\sigma_0\tau_4=(2,\:5)(3,\:4)\)

 \(\sigma_{11}=\sigma_1\tau_1=(1,\:2,\:3,\:4,\:5)\)
 \(\sigma_{21}=\sigma_1\tau_2=(1,\:2,\:4,\:3)\)
 \(\sigma_{31}=\sigma_1\tau_3=(1,\:2,\:5,\:4)\)
 \(\sigma_{41}=\sigma_1\tau_4=(1,\:2)(3,\:5)\)

 \(\sigma_{12}=\sigma_2\tau_1=(1,\:3,\:5,\:2,\:4)\)
 \(\sigma_{22}=\sigma_2\tau_2=(1,\:3,\:2,\:5)\)
 \(\sigma_{32}=\sigma_2\tau_3=(1,\:3,\:4,\:2)\)
 \(\sigma_{42}=\sigma_2\tau_4=(1,\:3)(4,\:5)\)

 \(\sigma_{13}=\sigma_3\tau_1=(1,\:4,\:2,\:5,\:3)\)
 \(\sigma_{23}=\sigma_3\tau_2=(1,\:4,\:5,\:2)\)
 \(\sigma_{33}=\sigma_3\tau_3=(1,\:4,\:3,\:5)\)
 \(\sigma_{43}=\sigma_3\tau_4=(1,\:4)(2,\:3)\)

 \(\sigma_{14}=\sigma_4\tau_1=(1,\:5,\:4,\:3,\:2)\)
 \(\sigma_{24}=\sigma_4\tau_2=(1,\:5,\:3,\:4)\)
 \(\sigma_{34}=\sigma_4\tau_3=(1,\:5,\:2,\:3)\)
 \(\sigma_{44}=\sigma_4\tau_4=(1,\:5)(2,\:4)\)

この巡回置換表示にもとづいて
 \([c,\:d][a,\:b]=[ac,\:bc+d]\)
を検証してみます。たとえば、
\(\begin{eqnarray}
&&\:\:\sigma_{23}\sigma_{42}&=[2,\:3][4,\:2]\\
&&&=[8,\:7]=[3,\:2]\\
&&&=\sigma_{32}\\
\end{eqnarray}\)
となるはずですが、

\(\begin{eqnarray}
&&\:\:\sigma_{42}&=(1,\:3)(4,\:5)\\
&&&=\left(\begin{array}{c}1&2&3&4&5\\3&2&1&5&4\end{array}\right)\\
&&\:\:\sigma_{23}&=(1,\:4,\:5,\:2)\\
&&&=\left(\begin{array}{c}3&2&1&5&4\\3&1&4&2&5\end{array}\right)\\
\end{eqnarray}\)

\(\begin{eqnarray}
&&\:\:\sigma_{23}\sigma_{42}&=\left(\begin{array}{c}1&2&3&4&5\\3&1&4&2&5\end{array}\right)\\
&&&=(1\:3\:4\:2)=\sigma_{32}\\
\end{eqnarray}\)

となって、確かに成り立っています。また逆元の式、
 \([a,\:b]^{-1}=[a^{-1},\:-a^{-1}b]\)
ですが、

\(\begin{eqnarray}
&&\:\:\sigma_{23}^{\:\:-1}&=[2,\:3]^{-1}\\
&&&=[3,\:-3\cdot3]=[3,\:-9]\\
&&&=[3,\:1]=\sigma_{31}\\
&&&=(1,\:2,\:5,\:4)\\
&&\:\:\sigma_{23}^{\:\:-1}&=(1,\:4,\:5,\:2)^{-1}\\
&&&=(2,\:5,\:4,\:1)\\
&&&=(1,\:2,\:5,\:4)\\
\end{eqnarray}\)

となり、成り立っています。\(\bs{F}_5\) での演算では \(2^{-1}=3\) です。



以上により、
\(\begin{eqnarray}
&&\:\:G=\{\sigma_{ij}\:| &i=1,2,3,4\\
&&&j=0,1,2,3,4\}\\
\end{eqnarray}\)
とおくと、
 \(G=\mr{Gal}(\bs{Q}(\zeta,\alpha)/\bs{Q})\)
であることがわかりました。ここで、
 \(G_{\large s}=\{e,\:\sigma,\:\sigma^2,\:\sigma^3,\:\sigma^4\}\)
は \(G\) の正規部分群になります。なぜなら、\(G_{\large s}=\mr{Gal}(\bs{Q}(\zeta,\alpha)/\bs{Q}(\zeta))\) なので、\(G_{\large s}\) の固定体は \(\bs{Q}(\zeta)\) です。一方、\(\bs{Q}(\zeta)/\bs{Q}\) はガロア拡大なので、正規性定理53C)によって \(G_{\large s}\) は \(G\) の正規部分群になるからです。

\(G_{\large s}\) が \(G\) の正規部分群であることは、計算でも確かめられます。"弱可換性" である、
 \(\tau\sigma =\sigma^2\tau\)
の関係を使うと、
\(\begin{eqnarray}
&&\:\:\tau G_{\large s}&=\{\tau,\:\sigma^2\tau,\:\sigma^4\tau,\:\sigma^6\tau,\:\sigma^8\tau\}\\
&&&=\{\tau,\:\sigma^2\tau,\:\sigma^4\tau,\:\sigma\tau ,\:\sigma^3\tau\}\\
&&&=\{e,\:\sigma^2,\:\sigma^4,\:\sigma,\:\sigma^3\}\cdot\tau \\
&&&=G_{\large s}\tau\\
\end{eqnarray}\)
が成り立ち、これを繰り返すと、
 \(\tau^iG_{\large s}=G_{\large s}\tau^i\)
が成り立ちます。\(G\) の任意の元を \(\sigma^j\tau^i\) とすると、
\(\begin{eqnarray}
&&\:\:(\sigma^j\tau^i)G_{\large s}&=\sigma^jG_{\large s}\tau^i\\
&&&=G_{\large s}(\sigma^j\tau^i)\\
\end{eqnarray}\)
となって(\(\sigma^j\) と \(G_{\large s}\) は可換です)、\(G_{\large s}\) が正規部分群の定義を満たします。

また、\(G\) の任意の元 \(x\) を \(x=\sigma^j\tau^i\) とし、剰余群 \(G/G_{\large s}\) の任意の元 を \(xG_{\large s}\) とすると、
\(\begin{eqnarray}
&&\:\:xG_{\large s}&=(\sigma^j\tau^i)G_{\large s}=\sigma^jG_{\large s}\tau^i\\
&&&=G_{\large s}\tau^i\\
\end{eqnarray}\)
となりますが、\(G_{\large s}\tau^i=\tau^iG_{\large s}\) が成り立つので、
\(\begin{eqnarray}
&&\:\:(xG_{\large s})^4&=(G_{\large s}\tau^i)^4\\
&&&=(G_{\large s})^4(\tau^i)^4\\
&&&=G_{\large s}\\
\end{eqnarray}\)
となり、剰余群 \(G/G_{\large s}\) は位数 \(4\) の巡回群です。



もともと \(G_{\large s}=\mr{Gal}(\bs{Q}(\zeta,\alpha)/\bs{Q}(\zeta))\) であり、\(\bs{Q}(\zeta)\) の固定体は \(G_{\large s}\) でした。従って、

 \(\bs{Q}\:\subset\:\bs{Q}(\zeta)\) \(\subset\:\bs{Q}(\zeta,\alpha)\)
 \(G\:\supset\:G_{\large s}\) \(\supset\:\{e\}\)

のガロア対応が得られました。\(G_{\large s}\) は \(G\) の正規部分群で \(G/G_{\large s}\) は巡回群、また \(G_{\large s}\) も巡回群です。従って \(G\) は可解群です。なお、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})=G_{\large t}\) です。以上をまとめると、

\(\mr{Gal}(\bs{Q}(\zeta,\alpha)/\bs{Q}))\)
 \(=G\)
 \(=\{\:\sigma_{ij}\:\}=\{\:\sigma_j\tau_i\:\}\)
   \((i=1,2,3,4)\:\:(j=0,1,2,3,4)\)
 \(\sigma=(1,\:2,\:3,\:4,\:5)\)
  \(\sigma_0=e\)
  \(\sigma_1=\sigma\)
  \(\sigma_2=\sigma^2\)
  \(\sigma_3=\sigma^3\)
  \(\sigma_4=\sigma^4\)
 \(\tau=(2,\:3,\:5,\:4)\)
  \(\tau_1=e\)
  \(\tau_2=\tau\)
  \(\tau_3=\tau^3\)
  \(\tau_4=\tau^2\)
\(\begin{eqnarray}
&&G_{\large s}&=\{e,\:\sigma,\:\sigma^2,\:\sigma^3,\:\sigma^4\}\\
&&&=\mr{Gal}(\bs{Q}(\zeta,\alpha)/\bs{Q}(\zeta)))\\
&&G_{\large t}&=\{e,\:\tau,\:\tau^2,\:\tau^3\}\\
&&&=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q}))\\
\end{eqnarray}\)

となります。

フロベニウス群 F20.jpg
\(\bs{x^5-2=0}\) のガロア群(\(F_{20}\))

ガロア群 \(F_{20}\) の \(20\)個の元を、4つの5角形の頂点に配置した図。\((1,2,3,4,5)\) などはガロア群を構成する巡回置換を表す。また \(23451\) などは、その巡回置換によって \(12345\) を置換した結果を表す(白ヌキ数字は置換で不動の点)。この群の生成元は、色を付けた \((1,2,3,4,5)\) と \((2,3,5,4)\) である。

位数 \(20\) の元、\(G=\mr{Gal}(\bs{Q}(\zeta,\alpha)/\bs{Q})\) は、(位数 \(20\)の)フロベニウス群という名前がついていて、\(F_{20}\) と表記します。フロベニウス群は、高々1点を固定する置換と恒等置換から成る群です。\(G\) は、固定する点がない \(\sigma=(1,\:2,\:3,\:4,\:5)\) と、1点だけを固定する \(\tau=(2,\:3,\:5,\:4)\) の2つを生成元とする群なので、フロベニウス群です。この \(F_{20}\) の内部構造を調べます。

\(\tau_i\) には \(\{\tau_1=e,\:\tau_2,\:\tau_3,\:\tau_4\}\) の生成元とはならない \(\tau_4\) があります。\(\sigma_i,\:\tau_j\) このような性格をもつのは \(\tau_4\) だけです。その \(\tau_4\) は、
 \(\tau_4=(2,\:5)(3,\:4)\)
 \(\tau_4^{\:2}=e\)
でした。つまり \(\{e,\:\tau_4\}\) は位数2の巡回群です。

ということは、\(\sigma_1=\sigma\) と \(t_4\) を生成元として、新たな群を定義できることになります。その群の元を \(\pi_{ij}\) とし、
 \(\pi_{ij}=\sigma^j\tau_4^i\:\:(i=0,1,\:\:j=0,\:1,\:2,\:3,\:4)\)
\(\begin{eqnarray}
&&\:\: \pi_{0j}&=\sigma_j\\
&&\:\: \pi_{1j}&=\sigma_j\cdot\tau _4\\
&&&=\sigma_j\cdot(2,\:5)(3,\:4)\\
\end{eqnarray}\)
と定義すると、位数 \(10\) の群になります。具体的に計算してみると、
 \(\pi_{00}=e\)
 \(\pi_{01}=(1,\:2,\:3,\:4,\:5)\)
 \(\pi_{02}=(1,\:3,\:5,\:2,\:4)\)
 \(\pi_{03}=(1,\:4,\:2,\:5,\:3)\)
 \(\pi_{04}=(1,\:5,\:4,\:3,\:2)\)
 \(\pi_{10}=(2,\:5)(3,\:4)\)
 \(\pi_{11}=(1,\:2)(3,\:5)\)
 \(\pi_{12}=(1,\:3)(4,\:5)\)
 \(\pi_{13}=(1,\:4)(2,\:3)\)
 \(\pi_{24}=(1,\:5)(2,\:4)\)
となります。

この群は5次の2面体群であり、\(D_{10}\) で表します(\(D_5\) と書く流儀もある。幾何学の文脈では \(D_5\))。一般に 2面体群 \(D_{2n}\)(または \(D_n\))とは、裏表のある正\(n\)角形を元の形に一致するように移動する(=対称移動をする)ことを表す群です。正5角形の頂点に1から5の名前を一周する順につけると、たとえば \((1,\:2,\:3,\:4,\:5)\) は \(72^\circ\)の回転であり、\((2,\:5)(3,\:4)\) は頂点1を通る対称軸で折り返す対称移動です。3次の2面体群を1.3節で図示しました。

\(D_{10}\) は \(F_{20}\) の部分群で、位数は \(10\) です。位数が \(20\) の半分なので、半分の部分群は正規部分群の定理(65F)により、\(D_{10}\) は \(F_{20}\) の正規部分群であり、剰余群 \(F_{20}/D_{10}\) は位数が \(2\) なので巡回群です。



さらに \(D_{10}\) の部分群として \(\sigma_i\:(i=0,1,2,3,4)\) があり、位数 \(5\) の巡回群です。位数 \(5\) の巡回群は \(C_5\) と表記されます。\(C_5\) の位数もまた \(D_{10}\) の半分なので、\(C_5\) は \(D_{10}\) の正規部分群であり、剰余群 \(D_{10}/C_5\) は巡回群です。結局、\(F_{20}\) には、

 \(F_{20}\) \(\supset\:C_5\:\supset\:\{\:e\:\}\)
 \(D_{10}\) \(\supset\:C_5\:\supset\:\{\:e\:\}\)
 \(C_5\) \(\supset\:\{\:e\:\}\)

という部分群の列が存在することになり、これらすべてが可解列です。実は、可解な5次方程式のガロア群は、\(F_{20}\)、\(D_{10}\)、\(C_5\) の3つしかないことが知られています。以上のように \(x^5-2=0\) のガロア群は、可解なガロア群の全部を含んでいるのでした。

\(x^5+11x-44\)
x^5+11x-44=0.jpg
\(x^5+11x-44=0\) の根
一般的に、ある5次方程式が与えられたとき、そのガロア群を決定するには複雑な計算が必要です。また可解な5次方程式の解を、四則演算とべき根で表現するためのアルゴリズムも複雑です。これらは「可解性の必要十分条件を示す」というガロア理論の範囲を超えるので、この記事では省略します。可解な5次方程式の例をあげておきます。

 \(x^5+11x-44=0\)

のガロア群は \(D_{10}\) であることが知られています。この方程式は実数解が1つで、虚数解が4つです。実数解を \(\alpha\) とし、Wolfram Alpha で \(\alpha\) の近似値と厳密値を求めてみると次のようになります。この厳密値は本当かと心配になりますが、検算してみると正しいことが分かります。

\(\begin{eqnarray}
&&\:\:\alpha&=1.8777502748964972576\cdots\\
&&&=\dfrac{\sqrt[5]{11}}{(\sqrt[5]{5})^4}(\alpha_1+\alpha_2-\alpha_3+\alpha_4)\\
\end{eqnarray}\)

  \(\alpha_1=\sqrt[5]{\phantom{-}75+50\sqrt{5}-12\sqrt{5-\sqrt{5}}-59\sqrt{5+\sqrt{5}}}\)
  \(\alpha_2=\sqrt[5]{\phantom{-}75-50\sqrt{5}+59\sqrt{5-\sqrt{5}}-12\sqrt{5+\sqrt{5}}}\)
  \(\alpha_3=\sqrt[5]{-75+50\sqrt{5}+59\sqrt{5-\sqrt{5}}-12\sqrt{5+\sqrt{5}}}\)
  \(\alpha_4=\sqrt[5]{\phantom{-}75+50\sqrt{5}+12\sqrt{5-\sqrt{5}}+59\sqrt{5+\sqrt{5}}}\)

 
8.結論 
 

第5章から第7章まで、かなり長い証明のステップでしたが、可解性の必要条件(64B)、

\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つ がべき根で表されているとする。\(f(x)\) の最小分解体を \(\bs{L}\) とするとき、\(\mr{Gal}(\bs{L}/\bs{Q})\) は可解群である。

と、可解性の十分条件(75A)、

体 \(\bs{F}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{K}\) とする。\(\mr{Gal}(\bs{K}/\bs{F})=G\) とし、\(G\) は可解群とする。このとき \(f(x)=0\) の解は四則演算とべき根で表現できる。

および、具体的な5次方程式のガロア群の検討と合わせて、次が結論づけられました。

\(\bs{Q}\) 上の多項式 \(f(x)\) の最小分解体を \(\bs{L}\) とする。方程式 \(f(x)=0\) の解が四則演算とべき根で表現できるための必要十分条件は、ガロア群
\(\mr{Gal}(\bs{L}/\bs{Q})\) が可解群であることである。

5次方程式のガロア群には、可解群でないものと可解群の両方がある。従って、任意の5次方程式の解を四則演算とべき根で統一的に表現する解の公式はない。

高校数学で理解するガロア理論:終

 
定義\(\cdot\)定理一覧 
 


2.整数の群


2.1 整数
互除法の原理21A
自然数 \(a\) と \(b\) の最大公約数を \(\mr{gcd}(a,\:b)\) で表す。自然数 \(a\) を \(b\) で割った余りを \(r\) とすると、

 \(\mr{gcd}(a,\:b)=\mr{gcd}(b,\:r)\)

である。

不定方程式の解の存在21B
2変数 \(x,\:y\) の1次不定方程式を、
 \(ax+by=c\)
  (\(a,\:b,\:c\) は整数。\(a\neq0,\:b\neq0\))
とし、\(a\) と \(b\) の最大公約数を \(d\) とする。このとき、
 \(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。



このことは1次不定方程式が3変数以上であっても成り立つ。つまり
 \(a_1x_1+a_2x_2+\:\cdots\:+a_nx_n=c\)
  (\(a_i\) は \(0\) 以外の整数)
とし、
 \(d=\mr{gcd}(a_1,a_2,\:\cdots\:,\:a_n)\)
とする。このとき、
 \(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。

不定方程式の解の存在21C
\(0\) でない整数 \(a\) と \(b\) が互いに素とすると、1次不定方程式、
 \(ax+by=1\)
は整数解をもつ。また、\(n\) を任意の整数とすると、
 \(ax+by=n\)
は整数解をもつ。あるいは、任意の整数 \(n\) は、
 \(n=ax+by\) \((x,\:y\) は整数)
の形で表現できる。



これは3変数以上であっても成り立つ。たとえば3変数の場合は、\(0\) でない整数 \(a,\:b,\:c\) が互いに素、つまり、
 \(\mr{gcd}(a,b,c)=1\)
であるとき、\(n\) を任意の整数として、1次不定方程式、
 \(ax+by+cz=n\)
は整数解を持つ。

法による演算の定義21D
\(a,\:b\) を整数、\(n\) を自然数とする。\(a\) を \(n\) で割った余りと、\(b\) を \(n\) で割った余りが等しいとき、
 \(a\equiv b\:\:(\mr{mod}\:n)\)
と書き、\(a\) と \(b\) は「法 \(n\) で合同」という。あるいは「\(\mr{mod}\:n\) で合同」、「\(\mr{mod}\:n\) で(見て)等しい」とも記述する。

法による演算規則21E
\(a,\:b,\:c,\:d\) を整数、\(n,r\) を自然数とし、
 \(a\equiv b\:\:(\mr{mod}\:n)\)
 \(c\equiv d\:\:(\mr{mod}\:n)\)
とする。このとき、
\((1)\:a+c\)\(\equiv b+d\) \((\mr{mod}\:n)\)
\((2)\:a-c\)\(\equiv b-d\) \((\mr{mod}\:n)\)
\((3)\:ac\)\(\equiv bd\) \((\mr{mod}\:n)\)
\((4)\:a^r\)\(\equiv b^r\) \((\mr{mod}\:n)\)
である。

中国剰余定理21F
\(n_1\) と \(n_2\) を互いに素な自然数とする。\(a_1\) と \(a_2\) を、\(0\leq a_1 < n_1,\:0\leq a_2 < n_2\) を満たす整数とする。このとき、
 \(x\equiv a_1\:\:(\mr{mod}\:n_1)\)
 \(x\equiv a_2\:\:(\mr{mod}\:n_2)\)
の連立方程式を満たす整数 \(x\) が存在する。この \(x\) は \(\mr{mod}\:n_1n_2\) でみて唯一である。つまり、\(0\leq x < n_1n_2\) の範囲に解が唯一存在する。

中国剰余定理・多連立21G
\(n_1,\:n_2,\:\cdots\:,\:n_k\) を、どの2つをとっても互いに素な自然数とする。\(a_i\) を \(0\leq a_i < n_i\:\:(1\leq i\leq k)\) を満たす整数とする。このとき、

 \(x\equiv a_1\:\:(\mr{mod}\:n_1)\)
 \(x\equiv a_2\:\:(\mr{mod}\:n_2)\)
  \(\vdots\)
 \(x\equiv a_k\:\:(\mr{mod}\:n_k)\)

の連立合同方程式を満たす整数 \(x\) が存在する。この \(x\) は \(\mr{mod}\:n_1n_2\cdots n_k\) でみて唯一である。つまり、\(0\leq x < n_1n_2\cdots n_k\) の範囲では唯一の解が存在する。

2.2 群
群の定義22A
集合 \(G\) が次の ① ~ ④ を満たすとき、\(G\) は(group)であると言う。

① \(G\) の任意の元 \(x,\:y\) に対して演算(\(\cdot\)で表す)が定義されていて、\(x\cdot y\in G\) である。

② 演算について結合法則が成り立つ。つまり、
 \((x\cdot y)\cdot z=x\cdot(y\cdot z)\)

③ \(G\) の任意の元 \(x\) に対して
 \(x\cdot e=e\cdot x=x\)
を満たす元 \(e\) が存在する。\(e\) を単位元という。

④ \(G\) の任意の元 \(x\) に対して
 \(x\cdot y=y\cdot x=e\)
となる元 \(y\) が存在する。\(y\) を \(x\) の逆元といい、\(x^{-1}\) と表す。

2.3 既約剰余類群
既約剰余類群23A
剰余群 \(\bs{Z}/n\bs{Z}\) から、代表元が \(n\) と互いに素なものだけを選び出したものを既約剰余類という。

「既約剰余類」は、乗算に関して群になる。これを「既約剰余類群」といい、\((\bs{Z}/n\bs{Z})^{*}\) で表す。

定義により、\((\bs{Z}/n\bs{Z})^{*}\) の群位数は \(\varphi(n)\) である。\(\varphi\) はオイラー関数で、\(\varphi(n)\) は \(n\) 以下で \(n\) と互いに素な自然数の数を表す。\(n\) が素数 \(p\) の場合の群位数は \(\varphi(p)=p-1\) である。

2.4 有限体 \(\bs{\bs{F}_p}\)
有限体上の方程式124A
\(\bs{F}_p\) 上の1次方程式、
 \(ax+b=c\)
は1個の解をもつ。

有限体上の方程式224B
\(\bs{F}_p\) 上の多項式を \(f(x)\) とする。
\(f(a)=0\) なら、\(f(x)\) は \(x-a\) で割り切れる。

有限体上の方程式324C
\(\bs{F}_p\) 上の \(n\)次多項式を \(f_n(x)\) とする。方程式、
 \(f_n(x)=0\)
の解は、高々 \(n\) 個である。

2.5 既約剰余類群は巡回群

既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) は巡回群の直積に同型である

位数の定理25A
\((\bs{Z}/n\bs{Z})^{*}\) の元を \(a\) とする。以下が成り立つ。

[補題1]
\(a^x=1\) となる \(x\:\:(1\leq x)\) が必ず存在する。\(x\) のうち最小のものを \(d\) とすると、\(d\) を \(a\) の位数(order)と呼ぶ。

[補題2]
\(a,\:a^2,\:a^3,\:\cdots\:,\:a^d=1\) は 全て異なる。ないしは、
\(a^0=1,\:a,\:a^2,\:\cdots\:,a^{d-1}\) は 全て異なる。

[補題3]
\(n=p\)(素数)とする。\(d\) 乗すると \(1\) になる \((\bs{Z}/p\bs{Z})^{*}\) の元は、\(a,\:a^2,\:a^3,\:\cdots\:,\:a^d\) がそのすべてである。

[補題4]
\(a^x=1\) となる \(x\) は \(d\) の倍数である。

[補題5]
\(a\) の位数を \(d\) とすると、\(d\) は 群位数 の約数である。

オイラーの定理25B
自然数 \(n\) と素な自然数 \(a\) について、
 \(a^{\varphi(n)}=1\:\:(\mr{mod}\:n)\)
が成り立つ(オイラーの定理)。\(\varphi\) はオイラー関数で、\(\varphi(n)\) は \(n\) 以下で \(n\) と互いに素な自然数の数を表す。

\(n=p\)(素数)の場合は、\(p\) と素な数 \(a\) について、
 \(a^{p-1}=1\:\:(\mr{mod}\:p)\)
となる(フェルマの小定理)。

位数 \(d\) の元の数25C
\(p\) を素数とする。\((\bs{Z}/p\bs{Z})^{*}\) において、群位数 \((p-1)\) の約数 \(d\) のすべてについて、位数 \(d\) の元が \(\varphi(d)\) 個存在する。

生成元の存在125D
\(p\) を素数とするとき、\((\bs{Z}/p\bs{Z})^{*}\) には生成元が存在する。生成元とは、その位数が \((\bs{Z}/p\bs{Z})^{*}\) の群位数、\(p-1\) の元である。

なお、素数 \(p\) に対して、
 \(a^x\equiv1\:\:(\mr{mod}\:p)\)
となる \(x\) の最小値が \(p-1\) であるような \(a\) を、\(p\) の「原始根」という。既約剰余類群 \((\bs{Z}/p\bs{Z})^{*}\) の生成元=原始根である。

[補題6]

\(p\) を奇素数とし、\(k\) を \(p\) と素な数とする(\(\mr{gcd}(k,p)=1\))。また、整数 \(m\) を \(m\geq1\) とする。

このとき、
 \((1+kp^m)^p=1+k'p^{m+1}\)
と表すことができて、\(k'\) は \(p\) と素である。

生成元の存在225E
\(p\) を \(p\neq2\) の素数(=奇素数)とする。また、\(g\) を \((\bs{Z}/p\bs{Z})^{*}\) の生成元とする。

このとき \(g\) または \(g+p\) は \((\bs{Z}/p^n\bs{Z})^{*}\) の生成元である。つまり、\((\bs{Z}/p^n\bs{Z})^{*}\) には生成元が存在する。

生成元の存在2(その1)

\(p\) を奇素数とし、\(g\) を \((\bs{Z}/p\bs{Z})^{*}\) の生成元とする。また、\(g\) は、
 \(g^{p-1}=1+kp\)
 \(\mr{gcd}(k,p)=1\)
と表されているとする。

この条件で、\(g\) は \((\bs{Z}/p^n\bs{Z})^{*}\) の生成元でもある。

生成元の存在2(その2)

\(p\) を奇素数とし、\(g\) を \((\bs{Z}/p\bs{Z})^{*}\) の生成元とする。また、\(g\) は、
 \(g^{p-1}=1+kp^m\:\:(m\geq2)\)
 \(\mr{gcd}(k,p)=1\)
と表されているとする。

この条件では、\(g+p\) が \((\bs{Z}/p^n\bs{Z})^{*}\) の生成元である。

2のべき乗の既約剰余類群25F
2のべき乗の既約剰余類群は、

 \((\bs{Z}/2^n\bs{Z})^{*}\cong(\bs{Z}/2\bs{Z})\times(\bs{Z}/2^{n-2}\bs{Z})\)

である。つまり2つの巡回群の直積に同型である。

[補題7]

\(n\geq2\) のとき、\(5\) の \(\mr{mod}\:2^n\) での位数は \(2^{n-2}\) である。

既約剰余類群の構造25G
既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) は巡回群の直積に同型である。


3.多項式と体


3.1 多項式
多項式の不定方程式31A
\(a(x)\) と \(b(x)\) が互いに素な多項式のとき、
 \(a(x)f(x)+b(x)g(x)=1\)
を満たす多項式 \(f(x)\)、\(g(x)\)で、
 \(\mr{deg}\:g(x)\: < \:\mr{deg}\:a(x)\)
のものが存在する。

また、\(a(x)\) と \(b(x)\) が互いに素な多項式で、\(h(x)\) が任意の多項式のとき、
 \(a(x)f(x)+b(x)g(x)=h(x)\)
を満たす多項式 \(f(x)\)、\(g(x)\) で、
 \(\mr{deg}\:g(x)\: < \:\mr{deg}\:a(x)\)
のものが存在する。

既約多項式の定義31B
有理数 \(\bs{Q}\) を係数とする多項式で、\(\bs{Q}\) の範囲ではそれ以上因数分解できない多項式を \(\bs{Q}\) 上で既約な多項式という。

整数係数多項式の既約性31C
整数係数の多項式 \(f(x)\) が \(\bs{Q}\) 上で(=有理数係数の多項式で)因数分解できれば、整数係数でも因数分解できる。

既約多項式の定理131D
\(p(x)\) を \(\bs{Q}\) 上の既約多項式、\(f(x)\) を \(\bs{Q}\) 上の多項式とする。

方程式 \(p(x)=0\) と \(f(x)=0\) が(複素数の範囲で)共通の解を1つでも持てば、\(f(x)\) は \(p(x)\) で割り切れる。

既約多項式の定理231E
\(p(x)\) を \(\bs{Q}\) 上の既約多項式、\(f(x)\) を \(\bs{Q}\) 上の多項式とする。

\(f(x)\) の次数が1次以上で \(p(x)\) の次数未満のとき、方程式 \(p(x)=0\) と \(f(x)=0\) は(複素数の範囲で)共通の解を持たない。

既約多項式の定理331F
\(p(x)\) を \(\bs{Q}\) 上の既約多項式とすると、方程式 \(p(x)=0\) は(複素数の範囲で)重解を持たない。

既約多項式の定理431G

\(p(x)\) を既約多項式とし、\(f(x),\:g(x)\) を多項式とする。\(f(x)g(x)\) が \(p(x)\) で割り切れるなら、\(f(x),\:g(x)\) の少なくとも1つは \(p(x)\) で割り切れる。



\(p(x)\) を既約多項式とし、\(g(x)\) を多項式とする。\((g(x))^2\) が \(p(x)\) で割り切れるなら、\(g(x)\) は \(p(x)\) で割り切れる。また、\((g(x))^k\:\:(2\leq k)\) が \(p(x)\) で割り切れるなら、\(g(x)\) は \(p(x)\) で割り切れる。


最小多項式の定義31H
\(\alpha\) を 方程式の解とする。\(\alpha\) を解としてもつ、体 \(\bs{Q}\) 上の方程式のうち、次数が最小の多項式を、\(\alpha\) の \(\bs{Q}\) 上の最小多項式と言う。

最小多項式は既約多項式31I
\(\bs{Q}\) 上の方程式、\(f(x)=0\) が \(\alpha\) を解としてもつとき、

① \(f(x)\) が 体 \(\bs{Q}\) 上の既約多項式である
② \(f(x)\) が \(\alpha\) の \(\bs{Q}\) 上の最小多項式である

の2つは同値である。

3.2 体
最小分解体の定義32A
体 \(\bs{Q}\) 上の多項式 \(f(x)\) を、
 \(f(x)=(x-\alpha_1)(x-\alpha_2)\cdots(x-\alpha_n)\)
と、1次多項式で因数分解したとき、
 \(\bs{Q}(\alpha_1,\:\alpha_2,\:\cdots\:,\:\alpha_n)\)
を \(f(x)\) の最小分解体と言う。\(f(x)\) は既約多項式でなくてもよい

単拡大定理32B
\(\bs{Q}\) 上の方程式の解をいくつか添加した代数拡大体 \(\bs{K}\) は単拡大である。つまり \(\bs{K}\) の元 \(\theta\) があって、\(\bs{K}=\bs{Q}(\theta)\) となる。この \(\theta\) を原始元という。

単拡大の体32C
ある代数的数 \(\alpha\) の \(\bs{Q}\) 上の最小多項式が \(n\)次多項式 \(f(x)\) であるとする。このとき 体 \(\bs{K}\) を、

\(\bs{K}\)\(\overset{\text{ }}{=}\)\(\{a_{n-1}\alpha^{n-1}+\)\(\:\cdots\:+\)\(a_2\alpha^2+\)\(a_1\alpha+\)\(a_0\:|\:a_i\in\bs{Q}\:\}\)
  \((0\leq i\leq n-1)\)

と定義すると、\(\bs{K}\) は体になり、\(\bs{K}=\bs{Q}(\alpha)\) である。その元の表し方は一意である。

3.3 線形空間
線形空間の定義33A
集合 \(V\) と 体 \(\bs{K}\) が次を満たすとき、\(V\) を \(\bs{\bs{K}}\) 上の線形空間(=ベクトル空間。linear space / vector space)と言う。

加算の定義

\(V\) の任意の元 \(u,\:v\) に対して \((u+v)\in V\) が定義されていて、この加算(\(+)\) の定義に関して \(V\) は可換群である。すなわち、

\((1)\) 単位元の存在
\(u+x=x\) となる \(x\) が存在する。これを \(0\) と書く。
\((2)\) 逆元の存在
\(u+x=0\) となる \(x\) が存在する。これを \(-u\) と書く。
\((3)\) 結合則が成り立つ
任意の元 \(u,\:v\:,w\) について、\((u+v)+w=u+(v+w)\)
\((4)\) 交換則が成り立つ
\(u+v=v+u\)

スカラー倍の定義

\(V\) の任意の元 \(u\) と \(\bs{K}\) の任意の元 \(k\) に対して、スカラー倍 \(ku\in V\) が定義されていて、加算との間に次の性質がある。\(u,\:v\) を \(V\) の元、\(k,\:m\) を \(\bs{K}\) の元とし、\(\bs{K}\) の乗法の単位元を \(1\) とする。

\((1)\:\:k(mu)=(km)u\)
\((2)\:\:(k+m)u=ku+mu\)
\((3)\:\:k(u+v)=ku+kv\)
\((4)\:\:1v=v\)

1次独立と1次従属33B
1次独立

線形空間 \(V\) の元の組、\(\{v_1,v_2,\cdots,v_n\}\) に対して、
 \(a_1v_1+a_2v_2+\)..\(+a_nv_n=0\)
を満たす \(\bs{K}\) の元 \(a_1,a_2,\cdots,a_n\) が、\(a_1=a_2=\cdots=a_n=0\) しかないとき、\(\{v_1,v_2,\cdots,v_n\}\) は1次独立であるという。

1次従属

1次独立でないときが1次従属である。つまり、線形空間 \(V\) の元の組、\(\{v_1,v_2,\cdots,v_n\}\) に対して、
 \(a_1v_1+a_2v_2+\)..\(+a_nv_n=0\)
を満たす、少なくとも一つは \(0\) でない \(\bs{K}\) の元 \(a_1,a_2,\cdots,a_n\) があるとき、\(\{v_1,v_2,\cdots,v_n\}\) は1次従属であるという。

基底の定義33C
線形空間 \(V\) の元の組、\(\{v_1,v_2,\cdots,v_n\}\) に対して、次の2つが満たされるとき、\(\{v_1,v_2,\cdots,v_n\}\) を基底という。

・ \({v_1,v_2,\cdots,v_n}\) は1次独立である。
・ \(V\) の任意の元 \(v\) は、\(\bs{K}\) の元 \(a_1,a_2,\cdots,a_n\) を選んで、
\(v=a_1v_1+a_2v_2+\)..\(+a_nv_n\)
と表せる。

基底から1つの元を除外したものは基底ではなくなる。また基底に1つの元を加えたものも基底ではない。

基底の数の不変性33D
\(\{u_1,u_2,\cdots,u_m\}\) と \(\{v_1,v_2,\cdots,v_n\}\) がともに線形空間 \(V\) の基底であるとき、\(m=n\) である。

次元の不変性33E
線形空間の基底に含まれる元の数が有限個のとき、その個数を線形空間の次元と言う。次元は基底の取り方によらない。

単拡大体の基底33F
\(\bs{Q}\) 上の \(n\)次既約多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の解の一つを \(\alpha\) とする。単拡大体である \(\bs{Q}(\alpha)\) は \(\bs{Q}\) 上の \(n\)次元線形空間であり、\(\{1,\:\alpha,\:\alpha^2,\:\cdots\:,\alpha^{n-1}\}\) は \(\bs{Q}(\alpha)\) の基底である。

拡大次数の定義33G
代数拡大体 \(\bs{F},\:\bs{K}\) が \(\bs{F}\:\subset\:\bs{K}\) であるとき、\(\bs{K}\) は \(\bs{F}\) 上の線形空間である。\(\bs{K}\) の次元を、\(\bs{K}\)の(\(\bs{F}\)からの)拡大次数といい、
 \([\:\bs{K}\::\:\bs{F}\:]\)
で表す。

拡大次数の連鎖律33H
代数拡大体 \(\bs{F},\:\bs{M},\:\bs{K}\) が \(\bs{F}\:\subset\:\bs{M}\:\subset\:\bs{K}\) であるとき、
 \([\:\bs{K}\::\:\bs{F}\:]=[\:\bs{K}\::\:\bs{M}\:][\:\bs{M}\::\:\bs{F}\:]\)
が成り立つ。

体の一致33I
体 \(\bs{K}_0\) と 体 \(\bs{K}\) があり、\(\bs{K}_0\:\subset\:\bs{K}\) を満たしている。\(\bs{K}_0\) と \(\bs{K}\) が有限次元であり、その次元が同じであれば、\(\bs{K}_0=\bs{K}\) である。


4.一般の群


4.1 部分群\(\bs{\cdot}\)正規部分群、剰余類\(\bs{\cdot}\)剰余群
部分集合の演算41A
群 \(G\) の2つの部分集合を \(H,\:N\) とする。\(H\) と \(N\) の演算結果である \(G\) の部分集合、\(HN\) を次の式で定義する。

 \(HN\:=\:\{\:hn\:|\:h\in H,\:n\in N,\:hn\) は群の演算定義による \(\}\)

群 \(G\) の元の演算では結合則が成り立つから、部分集合の演算でも結合則が成り立つ。つまり \(H_1,\:H_2,\:H_3\) をを3つの部分群とすると、
 
 \((H_1H_2)H_3=H_1(H_2H_3)\)

である。部分集合の元は \(1\)つでもよいから、\(x\) が \(G\) の元で \(x\) だけの部分集合を \(\{x\}\) とすると、
 \(H_1(\{x\}H_2)=(H_1\{x\})H_2\)
である。これを、
 \(H_1(xH_2)=(H_1x)H_2\)
と記述する。

部分群の十分条件41B
群 \(G\) の部分集合を \(N\) とし、\(N\) の任意の2つの元を \(x,\:y\) とする。

 \(xy\in N,\:x^{-1}\in N\)

なら、\(N\) は \(G\) の部分群である。

部分群の元の条件41C
群 \(G\) の部分群を \(N\) とし、\(G\) の 元を \(x\) とすると、次の2つは同値である。

 ① \(xN\:=\:N\)
 ② \(x\:\in\:N\)

部分群の共通部分は部分群41D
\(G\) の部分群を \(H,\:N\) とすると、\(H\cap N\) は部分群である。

剰余類の定義41E
有限群 \(G\) の位数を \(n\) とし( \(|G|=n\) )、\(H\) を \(G\) の部分群とする。\(H\) に左から \(G\) のすべての元、\(g_1,\:g_2,\:\cdots\:,\:g_n\) かけて、集合、
 \(g_1H,\:g_2H,\:\cdots\:,g_nH\)
を作る。

\(g_1H,\:g_2H,\:\cdots\:,g_nH\) から、同じになる集合を集めたものを剰余類と呼ぶ。その同じになる集合から代表的なものを一つ取り出し、
 \(xH\:\:(x\in G)\)
の形で剰余類を表す。\(g_1H,\:g_2H,\:\cdots\:,g_nH\) から剰余類が \(d\) 個できたとし、それらを、
 \(x_1H,\:x_2H,\:\cdots\:,x_dH\)
とすると、
 \(i\neq j\) のとき \(x_iH\:\cap\:x_jH=\phi\)
 \(G=x_1H\:\cup\:x_2H\:\cup\:\cdots\:\cup\:x_dH\)
である。剰余類は、群 \(G\) の元を部分群 \(H\) によって分類したものといえる。

\(x_1H,\:x_2H,\:\cdots\:,x_dH\) を「左剰余類」という。同じことが \(G\) の元を右からかけたときにも成り立ち、\(Hx_1',\:Hx_2',\:\cdots\:,Hx_d'\) を「右剰余類」という。

群 \(G\) の 部分群 \(H\) による剰余類の個数 \(d\) について、\(d\cdot|H|=|G|\) が成り立つ。この \(d\) を「\(G\) の \(H\) による指数」といい、\([\:G\::\:H\:]\) で表す。つまり、
 \(|G|=[\:G\::\:H\:]\cdot|H|\)
である(ラグランジュの定理)。

群 \(G\) の元 \(g\) の位数(\(g^x=e\) となる最小の \(x\))を \(n\) とすると、\(n\) は群位数 \(|G|\) の約数である。

群位数が素数の群は巡回群である。

正規部分群の定義41F
有限群 \(G\) の部分群を \(H\) とする。\(G\) の全ての元 \(g\) について、

 \(gH=Hg\)

が成り立つとき、\(H\) を \(G\) の正規部分群(normal subgroup)という。正規部分群では左剰余類と右剰余類が一致する。

定義により、\(G\) および \(\{e\}\) は \(G\) の正規部分群である。また \(G\) が可換群であると、その部分群は正規部分群である。巡回群は可換群だから、巡回群の部分群は正規部分群である。

剰余群の定義41G
有限群 \(G\) の正規部分群を \(H\) とする。\(G\) の \(H\) による剰余類

 \(x_1H,\:x_2H,\:\cdots\:,x_dH\:\:(\:x_i\in G,\:d=[\:G\::\:H\:]\:)\)

部分集合の演算の定義(41A)で群になる。この群を \(G\) の \(H\) による剰余群(quotient group)といい、\(G/H\) で表す。剰余群は商群とも言う。

巡回群の剰余群は巡回群41H
巡回群の部分群による剰余群は巡回群である。

部分群と正規部分群41I
\(G\) の正規部分群を \(H\)、部分群を \(N\) とする。このとき、

(a) \(NH\) は \(G\) の部分群である。
(b) \(G\:\supset\:N\:\supset\:H\) なら、\(H\) は \(N\) の正規部分群である。
(c) \(N\cap H\) は \(N\) の正規部分群である。

が成り立つ。

4.2 準同型写像
準同型写像と同型写像42A
群 \(G\) から群 \(G'\) への写像 \(f\) がある。\(G\) の任意の2つの元、\(x,\:y\) について、

 \(f(xy)=f(x)f(y)\)

が成り立つとき、\(f\) を \(G\) から \(G'\) への準同型写像(homomorphism)という。右辺は群 \(G'\) の演算定義に従う。

また、\(f\) が全単射写像のとき、\(f\) を同型写像(isomorphism)という。群 \(G\) から \(G'\) への同型写像が存在するとき、\(G\) と \(G'\) は同型であるといい、
 \(G\:\cong\:G'\)
で表す。

準同型写像の像と核42B
群 \(G\) から群 \(G'\) への準同型写像 \(f\) がある。\(G\) の元を \(f\) で移した元の集合を「\(f\) の像(image)」といい、\(\mr{Im}\:f\) と書く。\(\mr{Im}\:f\) を \(f(G)\) と書くこともある。

\(\mr{Im}\:f\) は \(G'\) の部分群である。

\(G\) の単位元を \(e\)、\(G'\) の単位元を \(e'\) とする。準同型写像 \(f\) によって \(e'\) に移る \(G\) の元の集合を「\(f\) の核(kernel)」といい、\(\mr{Ker}\:f\) と書く。

\(\mr{Ker}\:f\) は \(G\) の部分群である。

核が単位元なら単射42C
群 \(G\) から群 \(G'\) への準同型写像 \(f\) がある。このとき

 \(\mr{Im}\:f\) \(=\:G'\) なら \(f\) は全射
 \(\mr{Ker}\:f\) \(=\:\{e\}\) なら \(f\) は単射

である。

核は正規部分群42D
群 \(G\) から群 \(G'\) への準同型写像を \(f\) とする。このとき \(\mr{Ker}\:f\) は \(G\) の正規部分群である。

4.3 同型定理
準同型定理43A
群 \(G\) から群 \(G'\) への準同型写像 \(f\) がある。\(H=\mr{Ker}\:f\) とすると、\(G\) の \(H\) による剰余群は、\(G\) の \(f\) による像と同型である。つまり、

 \(G/H\:\cong\:\mr{Im}\:f\)

が成り立つ。

第2同型定理43B
群 \(G\) の正規部分群を \(H\)、部分群を \(N\) とすると、

 \(N/(N\cap H)\:\cong\:NH/H\)

が成り立つ。


5.ガロア群とガロア対応


5.1 体の同型写像
体の同型写像51A
体 \(\bs{K}\) から 体 \(\bs{F}\) への写像 \(f\) が全単射であり、\(\bs{K}\) の任意の元、\(x,\:y\) に対して、
\(\begin{eqnarray}
&&\:\:f(x+y)&=f(x)+f(y)\\
&&\:\:f(xy)&=f(x)f(y)\\
\end{eqnarray}\)
が成り立つとき、\(f\) を体の同型写像という。この定義による同型写像は、加法と乗法のみならず、四則演算を保存する。

特に、\(\bs{K}\) から \(\bs{K}\) への同型写像を自己同型写像という。

\(\bs{K}\) から \(\bs{F}\) への同型写像が存在するとき、体 \(\bs{K}\) と 体 \(\bs{F}\) は同型であるといい、\(\bs{K}\:\cong\:\bs{F}\) で表す。

体 \(\bs{K}\) と \(\bs{F}\) がともに \(\bs{Q}\) を含むとき、\(a\in\bs{Q}\) に対して、
 \(f(a)=a\)
である。つまり有理数は同型写像で不変である。

有理式の定義51B
変数 \(x\) の多項式(係数は \(\bs{Q}\) の元)を分母・分子とする分数式を、\(\bs{Q}\) 上の有理式という。

同型写像と有理式の順序交換51C
体 \(\bs{K}\) と 体 \(\bs{F}\) は \(\bs{Q}\) を含むものとする。\(\sigma\) を \(\bs{K}\) から \(\bs{F}\) への同型写像とし、\(a\) を \(\bs{K}\) の元とする。\(f(x)\) を \(\bs{Q}\) 上の有理式とすると、

 \(\sigma(f(a))=f(\sigma(a))\)

である。これは多変数の有理式でも成り立つ。\(a_1,a_2,\cdots,a_n\) を \(\bs{K}\) の元、\(f(x_1,x_2,\cdots,x_n)\) を \(\bs{Q}\) 上の有理式とすると、

 \(\sigma(f(a_1,a_2,\cdots,a_n))=f(\sigma(a_1),\sigma(a_1),\cdots,\sigma(a_n))\)

である。

\(\bs{Q}\) を含む体を \(\bs{K}\) とし、\(\bs{K}\)の拡大体を \(\bs{F}\:,\bs{F}'\) とする。\(\sigma\) を \(\bs{K}\) を不変にする \(\bs{F}\) から \(\bs{F}'\) への同型写像とし、\(a\) を \(\bs{F}\) の元とする。\(f(x)\) を \(\bs{K}\) 上の有理式とすると、
 \(\sigma(f(a))=f(\sigma(a))\)
である。

同型写像での移り先51D
\(\sigma\) を体 \(\bs{K}\) から 体 \(\bs{F}\) への同型写像とする。\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つを\(\alpha\)とし、\(\alpha\)は \(\bs{K}\) の元とする。すると \(\sigma(\alpha)\) も \(f(x)=0\) の解である。

同型写像による解の置換51E
\(\sigma\) を体 \(\bs{K}\) から 体 \(\bs{F}\) への同型写像とし、\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。方程式 \(f(x)=0\) の \(n\)個の解を \(\alpha_1,\alpha_2,\cdots,\alpha_n\) とし、これらが全て \(\bs{K}\) に含まれるとする。

すると \(\sigma(\alpha_1),\sigma(\alpha_2),\cdots,\sigma(\alpha_n)\) は、\(\alpha_1,\alpha_2,\cdots,\alpha_n\) を入れ替えたものである。

同型写像の存在51F
\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。\(\alpha,\:\beta\) を方程式 \(f(x)=0\) の異なる解とする。

すると \(\sigma(\alpha)=\beta\) を満たす \(\bs{Q}(\alpha)\) から \(\bs{Q}(\beta)\) への唯一の同型写像 \(\sigma\) が存在する。

単拡大体の同型写像51G
\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。\(f(x)=0\) の全ての解を \(\alpha_1=\alpha,\:\alpha_2,\:\cdots\:,\alpha_n\) とする。このとき \(\bs{Q}(\alpha)\) に作用する同型写像は \(n\)個あり、それらは、
 \(\sigma_i(\alpha)=\alpha_i\) \((1\leq i\leq n)\)
で定められ、\(\sigma_i\) は \(\bs{Q}(\alpha)\) から \(\bs{Q}(\alpha_i)\) への同型写像となる。

同型写像の延長51H
\(\bs{Q}\) 上の \(n\)次既約多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の解の一つを \(\alpha\) とする。

\(\bs{\bs{Q}(\alpha)}\) 上の \(m\)次既約多項式を \(g(x)\) とし、方程式 \(g(x)=0\) の解の一つを \(\beta\) とする。また、\(\bs{Q}(\alpha)\) の同型写像の一つを \(\tau\) とする。

このとき、\(\tau\) は \(\bs{Q}(\alpha,\beta)\) の同型写像 \(\sigma_j\) に延長できる。延長とは、\(\sigma_j\) の作用を \(\bs{Q}(\alpha)\) に限定した写像の作用が \(\tau\) と一致することを言う。\(\tau\) を延長した同型写像 \(\sigma_j\) は \(m\)個ある(\(0\leq j < m\))。

5.2 ガロア拡大とガロア群
ガロア拡大52A
ガロア拡大は次のように定義される。この2つの定義は同値である。

① (最小分解体定義)体 \(\bs{F}\) 上の多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とするとき、\(\bs{L}/\bs{F}\) をガロア拡大という。

② (自己同型定義)体 \(\bs{F}\) の代数拡大体 \(\bs{K}\) があったとき、\(\bs{F}\) の元を不動にする \(\bs{K}\) の同型写像がすべて自己同型写像になるとき、\(\bs{K}/\bs{F}\) をガロア拡大という。

\(\bs{K}/\bs{F}\) がガロア拡大のとき、\(\bs{\bs{F}}\) を不変にする \(\bs{K}\) の自己同型写像の集合は群になる。これをガロア群といい、\(\mr{Gal}(\bs{K}/\bs{F})\) で表す。

次数と位数の同一性52B
\(\bs{Q}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\)、ガロア群を \(G\) とするとき、\([\:\bs{L}\::\:\bs{Q}\:]=|G|\) である。

\(\bs{F}\) を代数拡大体とし、\(\bs{F}\) のガロア拡大を \(\bs{L}\) とする。\(\bs{L}\) のガロア群の位数は \(\bs{F}\) から \(\bs{L}\) への拡大次数に等しい。つまり、
 \([\:\bs{L}\::\:\bs{F}\:]=|\mr{Gal}(\bs{L}/\bs{F})|\)
である。

中間体からのガロア拡大52C
\(\bs{K}\) を \(\bs{F}\) のガロア拡大体とし、\(\bs{M}\) を \(\bs{F}\subset\bs{M}\subset\bs{K}\) である任意の体(=中間体)とするとき、\(\bs{K}\) は \(\bs{M}\) のガロア拡大体でもある。

5.3 ガロア対応
固定体と固定群53A
体 \(\bs{F}\) 上の方程式の最小分解体(=ガロア拡大体)を \(\bs{K}\) とし、ガロア群を \(G\) とする。\(G\) の部分群 \(H\) によって不変な \(\bs{K}\) の元の集合 \(\bs{M}\) は体になる。これを \(\bs{K}\) における \(H\) の固定体といい、\(\bs{K}(H)\) で表す(または \(\bs{K}^H\))。

また \(\bs{K}\) の中間体 \(\bs{M}\) のすべての元を不変にする \(G\) の部分集合 \(H\) は群になる。これを \(G\) における \(\bs{M}\) の固定群と呼び、\(G(\bs{M})\) で表す(または \(G^M\))。

ガロア対応53B
\(\bs{F}\) のガロア拡大体を \(\bs{K}\) とし、ガロア群を \(G\) とする。\(G\) の任意の部分群を \(H\) とし、\(H\) による \(\bs{K}\) の固定体 \(\bs{K}(H)\) を \(\bs{M}\) とする(次式)。

\(\begin{eqnarray}
&&G\:\supset\:H &\supset\:\{e\}\\
&&\bs{F}\:\subset\:\bs{K}(H)=\bs{M} &\subset\:\bs{K}\\
\end{eqnarray}\)

\(\bs{M}\)の固定群を \(G(\bs{M})\) とする(次式)。ガロア群の定義により \(G(\bs{M})=\mr{Gal}(\bs{K}/\bs{M})\) である。

\(\begin{eqnarray}
&&\bs{F}\:\subset\:\bs{M} &\subset\:\bs{K}\\
&&G\:\supset\:G(\bs{M}) &\supset\:\{e\}\\
\end{eqnarray}\)

このとき、
 \(G(\bs{M})=H\)
つまり、
\(\begin{eqnarray}
&&\:\:\mr{Gal}(\bs{K}/\bs{M})&=H \\
&&\:\:\bs{K}(G(\bs{M}))&=\bs{M}\\
\end{eqnarray}\)
が成り立つ。

正規性定理53C
\(\bs{Q}\) のガロア拡大を \(\bs{K}\) とし、\(\mr{Gal}(\bs{K}/\bs{Q})=G\) とする。\(\bs{K}\) の中間体 \(\bs{M}\) と \(G\) の部分群 \(H\) がガロア対応になっているとする。このとき

① \(\bs{M}/\bs{Q}\) がガロア拡大である
② \(H\)が\(G\)の正規部分群である

の2つは同値である。また、これが成り立つとき、
 \(\mr{Gal}(\bs{M}/\bs{Q})\:\cong\:G/H\)
という群の同型が成り立つ。


6.可解性の必要条件


6.1 可解群
可解群の定義61A
群 \(G\) から 単位元 \(e\) に至る部分群の列、

\(G=H_0\:\supset H_1\supset\cdots \supset H_i\supset H_{i+1}\supset\cdots \supset H_k=\{\:e\:\}\)

があって、\(H_{i+1}\) は \(H_i\) の正規部分群であり、剰余群 \(H_i/H_{i+1}\) が巡回群であるとき、\(G\) を可解群(solvable group)と言う。

\(H_{i+1}\) が \(H_i\) の正規部分群であるとき、\(H_i\) を正規列と言う。また、\(H_i/H_{i+1}\) が巡回群のとき、\(H_i\) を可解列という。

巡回群は可解群61B
巡回群は可解群である。また、巡回群の直積も可解群である。

可解群の部分群は可解群61C
可解群の部分群は可解群である。

可解群の像は可解群61D
可解群の準同型写像による像は可解群である。

このことより、
 可解群の剰余群は可解群
であることが分かる。なぜなら、群 \(G\) の部分群を \(N\) とすると、\(G\) から \(G/N\) への自然準同型、つまり \(x\in G\) として、
 \(x\:\longmapsto\:xN\)
の準同型写像を定義できるからである。

6.2 巡回拡大
巡回拡大の定義62A
\(\bs{Q}\) のガロア拡大を \(\bs{K}\) とする。\(\mr{Gal}(\bs{K}/\bs{Q})\) が巡回群のとき、\(\bs{K}/\bs{Q}\) を巡回拡大と言う。

累巡回拡大の定義62B
\(\bs{Q}\) の拡大体を \(\bs{K}\) とする。

\(\bs{Q}=\bs{K}_0\subset\bs{K}_1\subset\cdots \subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cdots \subset\bs{K}_k=\bs{K}\)

となる拡大列があって(\(k > 1\))、\(\bs{K}_{i+1}/\bs{K}_i\:(0\leq i < k)\) が巡回拡大のとき、\(\bs{K}/\bs{Q}\) は累巡回拡大であると言う。ただし、\(\bs{\bs{K}/\bs{Q}}\) が累巡回拡大だとしても、\(\bs{\bs{K}/\bs{Q}}\) がガロア拡大であるとは限らない

累巡回拡大ガロア群の可解性62C
\(\bs{Q}\) のガロア拡大を \(\bs{K}\)、そのガロア群を \(G\) とする。このとき、

① \(G\) が可解群である
② \(\bs{K}/\bs{Q}\) が累巡回拡大である

の2つは同値である。

6.3 原始\(\bs{n}\)乗根を含む体とべき根拡大

1の原始\(n\)乗根を \(\zeta\) とする。このとき
 ・\(\bs{Q}(\zeta)/\bs{Q}\) はガロア拡大
 ・\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\:\cong\:(\bs{Z}/n\bs{Z})^{*}\)
が成り立つ。


原始n乗根の数63A
\(x^n-1=0\) の \(n\)個の解のうち、\(n\)乗して初めて \(1\) になる解を \(1\)の原始\(n\)乗根という。

原始\(n\)乗根は \(\varphi(n)\) 個ある。\(\varphi(n)\) はオイラー関数で、\(n\) と互いに素である \(n\) 以下の自然数の数を表す。

原始n乗根の累乗63B
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、
 \(\zeta^m\:\:(1\leq m\leq n)\)
は、\(1\) の\(n\)乗根の全体を表す。また、
 \(\zeta^m\:\:(\mr{gcd}(m,n)=1)\)
は、\(1\) の原始\(n\)乗根の全体を表す。

原始n乗根の最小多項式63C
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とする。\(\zeta\) の最小多項式を \(f(x)\) とし、\(k\) を \(n\) とは素な数とする。

このとき \(f(\zeta^k)=0\) である。

円分多項式63D
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とし、\(\zeta\) の最小多項式を \(f(x)\) とすると、\(f(x)\) は円分多項式である。円分多項式とは、方程式 \(f(x)=0\) が \(\varphi(n)\) 個の解をもち、それらすべてが 原始\(n\)乗根 である多項式である。

従って、原始\(n\)乗根は互いに共役である。最小多項式は既約多項式なので、円分多項式は既約多項式である。

\(\bs{Q}\) に \(\zeta\) を添加した単拡大体 \(\bs{Q}(\zeta)\) は \(f(x)\) の最小分解体であり、\(\bs{Q}(\zeta)/\bs{Q}\) はガロア拡大である。

Q(ζ)のガロア群63E
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、

 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/n\bs{Z})^{*}\)

である。つまり \(1\) の原始\(n\)乗根の一つを \(\bs{Q}\) に添加した拡大体のガロア群は、既約剰余類群に同型である。

Q(ζ)のガロア群は巡回群63F
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は巡回群の直積と同型である。

従って、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は可解群であり(61B)、累巡回拡大である(62C)。

べき根拡大の定義63G
\(\bs{K}\) 上の方程式 \(x^n-a=0\:(a\in\bs{K}\)、\(a\neq1)\) の解の一つで、\(\bs{K}\) に含まれないものを \(\sqrt[n]{a}\) とするとき、\(\bs{K}(\sqrt[n]{a})\) を \(\bs{K}\) のべき根拡大と呼ぶ。

また、\(\bs{K}\) からのべき根拡大を繰り返して拡大体 \(\bs{F}\) ができるとき、\(\bs{F}/\bs{K}\) を累べき根拡大と言う。

原始n乗根を含むべき根拡大63H
\(1\) の原始\(n\)乗根を \(\zeta\) とし、\(\bs{K}\) に \(\zeta\) が含まれるとする。\(\bs{K}\) 上の方程式 \(x^n-a=0\:(a\in\bs{K}\)、\(a\neq1)\) の解の一つで、\(\bs{K}\) に含まれないものを \(\sqrt[n]{a}\) とし、\(\bs{L}=\bs{K}(\sqrt[n]{a})\) とすると、
\(\bs{L}/\bs{K}\) は巡回拡大である
\(\mr{Gal}(\bs{L}/\bs{K})\) の位数は \(n\) の約数である
が成り立つ。

6.4 可解性の必要条件
ガロア閉包の存在64A
\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つである \(\alpha\) がべき根で表されているとする。このとき「\(\bs{Q}\) のガロア拡大 \(\bs{E}\) で、\(\alpha\) を含み、\(\bs{E}/\bs{Q}\) が累巡回拡大」であるような 代数拡大体 \(\bs{E}\) が存在する。

可解性の必要条件64B
\(\bs{Q}\) 上の \(n\)次既約方程式 \(f(x)=0\) の解の一つ がべき根で表されているとする。\(f(x)\) の最小分解体を \(\bs{L}\) とするとき、\(\mr{Gal}(\bs{L}/\bs{Q})\) は可解群である。

6.5 5次方程式の解の公式はない
置換は巡回置換の積65A
すべての置換は共通文字を含まない巡回置換の積で表せる。

置換は互換の積65B
すべての置換は互換の積で表せる。

置換の偶奇性65C
一つの置換を互換の積で表したとき、その互換の数は奇数か偶数かのどちらかに決まる。

交代群は正規部分群65D
\(S_n\) の元は同数の偶置換と奇置換から成る。従って、
 \([\:S_n\::\:A_n\:]=2\)
である。

\(A_n\) は \(S_n\) の正規部分群であり、\(S_n/A_n\) は巡回群である。

交代群は3文字巡回置換の積65E
交代群 \(A_n\) の任意の元は、3文字の巡回置換の積で表せる。

半分の部分群は正規部分群65F
群 \(G\) の部分群を \(N\) とする。
 \(|G|=2|N|\)
のとき(つまり 群の指数 \([G:N]=2\) のとき)、\(N\) は \(G\) の正規部分群である。

対称群の可解性65G
5次以上の対称群、\(S_n\:\:(n\geq5)\) は可解群ではない。

5次方程式の解の公式はない65H
\(\bs{Q}\) の代数拡大体を \(\bs{K}\) とする。\(\bs{K}\) の任意の元である\(k\)5つの変数 \(b_1,b_2,b_3,b_4,b_5\) を根とする多項式を、
\(\begin{eqnarray}
&&\:\:f(x)&=(x-b_1)(x-b_2)(x-b_3)(x-b_4)(x-b_5)\:\:(b_i\in\bs{K})\\
&&&=x^5-a_4x^4+a_3x^3-a_2x^2+a_1x-a_0\\
\end{eqnarray}\)
とし、\(\bs{Q}\) に \(a_0,a_1,a_2,a_3,a_4,\)を添加した代数拡大体を \(\bs{F}\) とする。つまり、
 \(\bs{F}=\bs{Q}(a_0,\:a_1,\:a_2,\:a_3,\:a_4)\)
である。

このとき、\(\bs{K}\) の \(\bs{F}\) 上の ガロア群 \(G\) は5次対称群 \(S_5\) である。\(S_5\) は可解群ではないので(65G)、従って \(b_i\) を \(a_i\) のべき根で表すことはできない。

6.6 可解ではない5次方程式
コーシーの定理66A
群 \(G\) の位数 \(|G|\) が素数 \(p\) を約数にもつとき、\(g^p=e\:\:(g\neq e)\) となる \(G\) の元 \(g\) が存在する。つまり、\(G\) は位数 \(p\) の巡回群を部分群としてもつ。

実数解が3つの5次方程式66B
\(f(x)\) を規約な5次多項式とする。方程式 \(f(x)=0\) が複素数解を2つ、実数解を3つもつなら、方程式は可解ではない。


7.可解性の十分条件


7.1 1の原始\(\bs{n}\)乗根
原始n乗根はべき根で表現可能71A
\(1\) の 原始\(n\)乗根はべき根で表現できる。

7.2 べき根拡大の十分条件のため補題
べき根拡大の十分条件のため補題172A
\(\bs{L}\) を \(\bs{K}\) のガロア拡大とし、\(\mr{Gal}(\bs{L}/\bs{K})\) を \(\sigma\) で生成される位数 \(n\) の巡回群とする。式 \(g(x)\) を、

\(g(x)\)\(\overset{\text{ }}{=}\)\(x+a_1\sigma(x)+a_2\sigma^2(x)+\:\cdots\:+a_{n-1}\sigma^{n-1}(x)=0\)
\((a_i\in\bs{L},\:1\leq i\leq n-1)\)

と定義する。このとき、\(\bs{L}\) の全ての元 \(x\) について、\(g(x)=0\) となるような \(\bs{L}\) の元、\(a_1,\:a_2,\:\cdots\:,a_{n-1}\) は存在しない。

べき根拡大の十分条件のため補題272B
\(\zeta\) を \(1\) の原始\(n\)乗根とし、\(\zeta\)を含む代数体を \(\bs{K}\) とする。\(\bs{K}\) のガロア拡大体を \(\bs{L}\) とし、\(\mr{Gal}(\bs{L}/\bs{K})\) は \(\sigma\) で生成される位数 \(n\) の巡回群とする(= \(\bs{L}/\bs{K}\) が巡回拡大)。また \(f(x)\) を \(\bs{K}\) 上の \(n\)次既約多項式とし、\(\bs{L}\) が方程式 \(f(x)=0\) の解 \(\theta\) を用いて、\(\bs{L}=\bs{K}(\theta)\) と表されているものとする。このとき、

 \(g(x)=x+\zeta^{n-1}\sigma(x)+\zeta^{n-2}\sigma^2(x)+\cdots+\zeta\sigma ^{n-1}(x)\)

とおくと、\(g(\theta),\:g(\theta^2),\:\cdots\:,g(\theta^{n-1})\) のうち少なくとも一つは \(0\) ではない。

7.3 べき根拡大の十分条件
べき根拡大の十分条件73A
1の原始\(n\)乗根を \(\zeta\) とし、代数体 \(\bs{\bs{K}}\) には \(\bs{\zeta}\) が含まれるとする。\(\bs{L}/\bs{K}\) をガロア拡大とし、\(\mr{Gal}(\bs{L}/\bs{K})\) が巡回群とする(= \(\bs{L}/\bs{K}\) が巡回拡大)。拡大次数は \([\bs{L}:\bs{K}]=n\) とする。

このとき、\(\bs{L}\) は \(\bs{K}\) のべき根拡大である。

7.4 べき根拡大と巡回拡大の同値性
べき根拡大と巡回拡大は同値74A
\(1\) の原始\(n\)乗根を \(\zeta\) とし、代数体 \(\bs{\bs{K}}\) には \(\bs{\zeta}\) が含まれるとする。また、\(\bs{K}\) の\(n\)次拡大体を \(\bs{L}\) とする( \([\:\bs{L}\::\:\bs{K}\:]=n\) )。

このとき、
\(\bs{L}/\bs{K}\) は巡回拡大である
\(\bs{L}/\bs{K}\) はべき根拡大である。
の2つは同値である。

7.5 可解性の十分条件
可解性の十分条件75A
体 \(\bs{K}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とする。\(\mr{Gal}(\bs{L}/\bs{K})=G\) とし、\(G\) は可解群とする。

このとき \(f(x)=0\) の解は四則演算とべき根で表現できる。

7.6 位数2の巡回拡大は平方根拡大:正5角形が作図できる理由

\(p\) を素数とし、原始\(p\)乗根を \(\zeta\) とすると、
 \(|\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})|=|(\bs{Z}/p\bs{Z})^{*}|=p-1\)
なので、
 \(p-1=2^k\:\:(1\leq k)\)
の条件があると、\(\bs{Q}\) から \(\bs{Q}(\zeta)\) に至る「平方根拡大」の列が存在し、\(\zeta\) は四則演算と平方根 \(\sqrt{\phantom{a}}\) だけで表現できる。従って 正 \(p\)角形は定規とコンパスで作図可能である

定義・定理一覧:終



nice!(0) 

No.358 - 高校数学で理解するガロア理論(5) [科学]

\(\newcommand{\bs}[1]{\boldsymbol{#1}}
\newcommand{\mr}[1]{\mathrm{#1}}
\newcommand{\br}[1]{\textbf{#1}}
\newcommand{\ol}[1]{\overline{#1}}\)
 
7.可解性の十分条件 
 

第6章では、方程式が可解であれば(=解が四則演算とべき根で表現できれば)ガロア群が可解群であることをみました。第7章ではその逆、つまり、ガロア群が可解群であれば方程式が可解であることを証明します。


7.1 1の原始\(n\)乗根


可解性の十分条件を証明するために、まず、\(1\) の原始\(n\)乗根がべき根で表せることを証明します。このことを前提にした証明を最後で行うからです。念のために「1.1 方程式とその可解性」でのべき根の定義を振り返ると、
 \(\sqrt[n]{\:a\:}\)
という表記は、
・ \(a\) が正の実数のとき、\(n\)乗して \(a\) になる正の実数を表わす
・ \(a\) が負の実数や複素数の場合は、\(n\)乗して \(a\) になる数のどれかを表わす
のでした。方程式 \(x^n-1=0\) の解を \(\sqrt[n]{\:1\:}\) と書くと、それは \(1\) のことです。従って、

\(1\) 以外の「\(n\)乗して \(1\) になる数」がべき根で表現できる

ことを証明しておく必要があります。それが以下です。


原始n乗根はべき根で表現可能:71A)

\(1\) の 原始\(n\)乗根はべき根で表現できる。


[証明]

\(n\) についての数学的帰納法で証明する。\(n=2,\:3\) のときにべき根で表現できるのは根の公式で明らかである。また、原始4乗根は \(\pm i\) なので、\(n\leq4\) のとき題意は成り立つ。そこで、\(n\) 未満のときにべき根で表現できると仮定し、\(n\) のときにもべき根で表現できることを証明する。

\(n\) が合成数のときと素数のときに分ける。まず \(n\) が合成数なら、
 \(n=s\cdot t\)
と表現できる。
 \(1\) の原始\(s\)乗根を \(\zeta\)
 \(1\) の原始\(t\)乗根を \(\eta\)
とすると、\(X=x^{s}\) として
\(\begin{eqnarray}
&&\:\:x^n-1&=x^{st}-1=X^{t}-1\\
&&&=\displaystyle\prod_{k=0}^{t-1}(X-\eta^k)\\
&&&=\displaystyle\prod_{k=0}^{t-1}(x^{s}-\eta^k)\\
\end{eqnarray}\)
と因数分解できる。従って、方程式 \(x^n-1=0\) の解は、
 \(x^{s}=\eta^k\) \((0\leq k\leq t-1)\)
の解である。これを解くと、
 \(x=\sqrt[s]{\eta^k}\cdot\zeta ^j\:\:(0\leq j\leq s-1,\:0\leq k\leq t-1)\)
である(\(k=0\) のときは根号の規則に従って \(\sqrt[s]{1}=1\))。帰納法の仮定により、\(\zeta,\:\eta\) はべき根で表現できるから、上式により \(1\) の \(n\) 乗根はべき根で表現できる。従って原始\(n\)乗根もべき根で表現できる。



以降は \(n\) が素数の場合を証明する。\(n\) を \(p\)(= 素数)と表記する。以下では数式を見やすくするため \(p=5\) の場合を例示するが、証明の過程は一般性を失わない論理で進める。

位数 \(p-1\) の2つの巡回群、\((\bs{Z}/p\bs{Z})^{*}\) と \(\bs{Z}/(p-1)\bs{Z}\) の性質を利用する。\(p=5\) の場合は、位数 \(4\) の既約剰余類群 \((\bs{Z}/5\bs{Z})^{*}\) と、剰余群 \(\bs{Z}/4\bs{Z}\) である。

\(p\) が素数のとき、既約剰余類群 \((\bs{Z}/p\bs{Z})^{*}\) は生成元をもつ(25D)。\((\bs{Z}/5\bs{Z})^{*}\) の生成元の一つは \(2\) である(もう一つは \(3\))。生成元を \(2\) とすると、
\(\begin{eqnarray}
&&\:\:(\bs{Z}/5\bs{Z})^{*}&=\{2,\:2^2,\:2^3,\:2^4\}\\
&&&=\{2,\:4,\:3,\:1\}\\
\end{eqnarray}\)
の巡回群となる。演算は乗算である。一方、\(\bs{Z}/4\bs{Z}\) は、演算が加算、生成元が \(1\)(または \(3\))の巡回群で、
\(\begin{eqnarray}
&&\:\:\bs{Z}/4\bs{Z}&=\{1,\:1+1,\:1+1+1,\:1+1+1+1\}\\
&&&=\{1,\:2,\:3,\:0\}\\
\end{eqnarray}\)
である。ここで、2つの変数 \(x,\:y\) をもつ関数を、

 \(f(x,y)=y^2x+y^4x^2+y^3x^3+y\)

とおく。この関数は、4つある項の \(x,\:y\) の指数について、
 \(y\) の指数は \([\:2,\:4,\:3,\:1\:]\) : \((\bs{Z}/5\bs{Z})^{*}\) の巡回パターン
 \(x\) の指数は \([\:1,\:2,\:3,\:0\:]\) : \(\bs{Z}/4\bs{Z}\) の巡回パターン
となるようにしてある。

次に、2つの数 \(a,\:b\) を、
\(\begin{eqnarray}
&&\:\:a^5&=1\:(a\neq1)\\
&&\:\:b^4&=1\\
\end{eqnarray}\)
であるような数とする。\(a\) は \(1\) の原始5乗根でもよいし、その任意の累乗でもよい。とにかく \(a^5=1\:(a\neq1)\) を満たす数である。このとき、
 \(a^5-1=0\)
 \((a-1)(a^4+a^3+a^2+a+1)=0\)
なので、
 \(a^4+a^3+a^2+a+1=0\) ないしは
 \(a^4+a^3+a^2+a=-1\)
が成り立つ。\(b\) も \(1\) の原始4乗根か、その任意の累乗であるが、\(b=1\) であってもよい。

そうすると \(f(b,a)\) は、
 \(f(b,a)=a^2b+a^4b^2+a^3b^3+a\)
   \(a\) の指数は \([\:2,\:4,\:3,\:1\:]\)
   \(b\) の指数は \([\:1,\:2,\:3,\:0\:]\)
である。

次に \(f(b,a^2)\) を計算すると、
\(\begin{eqnarray}
&&\:\:f(b,a^2)&=a^4b+a^8b^2+a^6b^3+a^2\\
&&&=a^4+a^3b+a^1b^2+a^2b^3\\
\end{eqnarray}\)
   \(a\) の指数は \([\:4,\:3,\:1,\:2\:]\)
   \(b\) の指数は \([\:1,\:2,\:3,\:0\:]\)
となる。

\(f(b,a^2)\) を \(f(b,a)\) と比べると、\(a\) の指数が \(1\) ステップだけ巡回している。ということは、\(b\) の指数も \([\:2,\:3,\:0,\:1\:]\) と \(1\) ステップだけ巡回させれば、\(a\) の指数と \(b\) の指数が同期することになり、\(f(b,a^2)\) の式は \(f(b,a)\) と同じものになる。同期させるには \(f(b,a^2)\) に \(b\) を掛ければよい。従って、
 \(bf(b,a^2)=f(b,a)\)
である。

この仕組みは、\(a\) の指数が「\(2\) の掛算の巡回群」であるため、
 \(a^k\:\rightarrow\:a^{2k}=(a^k)^2\)
で巡回し、\(b\) の指数は「\(1\) の足し算の巡回群」であるため、
 \(b^k\:\rightarrow\:b^{k+1}=b\cdot b^k\)
で巡回することを利用したものである。

全く同様にして、
\(\begin{eqnarray}
&&\:\:b^2f(b,a^4)&=f(b,a)\\
&&\:\:b^3f(b,a^8)&=b^3f(b,a^3)\\
&&&=f(b,a)\\
\end{eqnarray}\)
となる。まとめると、
\(\begin{eqnarray}
&&\:\:bf(b,a^2)&=f(b,a)\\
&&\:\:b^2f(b,a^4)&=f(b,a)\\
&&\:\:b^3f(b,a^3)&=f(b,a)\\
\end{eqnarray}\)
である。\(b^4=1\) だから、各両辺を \(4\)乗すると、
\(\begin{eqnarray}
&&\:\:f(b,a^2)^4&=f(b,a)^4\\
&&\:\:f(b,a^4)^4&=f(b,a)^4\\
&&\:\:f(b,a^3)^4&=f(b,a)^4\\
\end{eqnarray}\)
の式を得る。



次に \(f(b,a)^4\) を展開する。

 \(f(b,a)^4=(a^2b+a^4b^2+a^3b^3+a)^4\)
 \((\br{A})\)

であるが、このまま展開したのでは \(p=5\) のときに固有のものになり、一般性を失う。そこで、上式を展開して整理した形を、

 \(f(b,a)^4=h_1(b)a^2+h_2(b)a^4+h_3(b)a^3+h_0(b)a\)
 \((\br{B})\)

とする。\(a^2,\:a^4,\:a^3,\:a\) の係数となっている \(h_i(b)\:(i=1,2,3,0)\) は \(b\) の多項式である。この展開形の決め方は次のように行う。

① \((\br{A})\) 式の次数は最大 \(a^{16}\) であるが、\(a^5=1\) の関係を利用して最大次数が \(a^4\) になるように「次数下げ」を行う。

② そうすると、\(a\) を含まない \(b\) だけの項が出てくる。そこで、
 \(1=-(a^4+a^3+a^2+a)\)
の関係を利用し、\(b\) だけの項に \(-(a^4+a^3+a^2+a)\) を掛けて「次数上げ」を行う。

③ 以上の結果を、\(a^2,\:a^4,\:a^3,\:a\) ごとに整理したものを \((\br{B})\) とする。

\((\br{B})\) 式においては、
 \(a\) の指数 \(:\:[\:2,\:4,\:3,\:1\:]\)
 \(h_i(b)\) の添字 \(:\:[\:1,\:2,\:3,\:0\:]\)
であることに注意する。

次に \(f(b,a^2)^4\) を計算する。これは \((\br{B})\) 式において \(a\) を \(a^2\) に置き換えればよいから、
\(\begin{eqnarray}
&&\:\:f(b,a^2)^4&=h_1(b)a^4+h_2(b)a^8+h_3(b)a^6+h_0(b)a^2\\
&&&=h_1(b)a^4+h_2(b)a^3+h_3(b)a+h_0(b)a^2\\
\end{eqnarray}\)
   \(a\) の指数 \(:\:[\:4,\:3,\:1,\:2\:]\)
   \(h_i(b)\) の添字 \(:\:[\:1,\:2,\:3,\:0\:]\)
となるが、これは \(f(b,a)^4\) において、
   \(a\) の指数 \(:\:[\:2,\:4,\:3,\:1\:]\)
   \(h_i(b)\) の添字 \(:\:[\:0,\:1,\:2,\:3\:]\)
としたものと同じである。つまり、
 \(f(b,a^2)^4=h_0(b)a^2+h_1(b)a^4+h_2(b)a^3+h_3(b)a\)
である。同様に、
 \(f(b,a^4)^4=h_3(b)a^2+h_0(b)a^4+h_1(b)a^3+h_2(b)a\)
   \(h_i(b)\) の添字 \(:\:[\:3,\:0,\:1,\:2\:]\)
 \(f(b,a^3)^4=h_2(b)a^2+h_3(b)a^4+h_0(b)a^3+h_1(b)a\)
   \(h_i(b)\) の添字 \(:\:[\:2,\:3,\:0,\:1\:]\)
である。

従って、\(f(b,a^i)^4\:\:(i=1,2,4,3)\) において、\(a^j\:(j=2,4,3,1)\) の係数は \(h_k(b)\:(k=1,2,3,0)\) の全てを巡回する。つまり、\(f(b,a^i)^4\:\:(i=1,2,4,3)\) の全部を足すと、\(a^j\:(j=2,4,3,1)\) の係数は全て同じになる。その計算をすると、

 \(\displaystyle\sum_{i=1}^{4}f(b,a^i)^4\)
\(\begin{eqnarray}
&&\:\: =&(h_1(b)+h_2(b)+h_3(b)+h_0(b))\\
&&&\cdot(a^2+a^4+a^3+a)\\
\end{eqnarray}\)

となる。上式の左辺については、
\(\begin{eqnarray}
&&\:\:f(b,a^2)^4&=f(b,a)^4\\
&&\:\:f(b,a^4)^4&=f(b,a)^4\\
&&\:\:f(b,a^3)^4&=f(b,a)^4\\
\end{eqnarray}\)
だったので、左辺は \(4f(b,a)^4\) に等しい。また \(a^5-1=0\) なので \(a^2+a^4+a^3+a=-1\) である。従って、

 \(4f(b,a)^4=-(h_1(b)+h_2(b)+h_3(b)+h_0(b))\)

である。ここで、
 \(g(b)=-\dfrac{1}{4}\:(h_1(b)+h_2(b)+h_3(b)+h_0(b))\)
と定義すると、

 \(f(b,a)^4\)\(=g(b)\)
 \(f(b,a)\)\(=\sqrt[4]{g(b)}\) 
\((\br{C})\)

を得る。\((\br{C})\) 式における \(\sqrt[4]{g(b)}\) とは「\(4\)乗すると \(g(b)\) になる数」という意味である。従って、実際には \(4\)次方程式の \(4\)つの解のどれかを表している。

なお、\(g(b)\) を具体的に計算すると、計算過程は省くが、
 \(g(b)=-16b^3+14b^2+4b-1\)
 \((\br{D})\)
となる。この表現は \(p=5\) のときのもので、一般論につながるものではない。



今までの計算をまとめると、

\(\begin{eqnarray}
&&\:\:a^5=1\:(a\neq1)&\\
&&\:\:b^4=1&\\
\end{eqnarray}\)

\(\begin{eqnarray}
&&\:\:f(b,a)&=a^2b+a^4b^2+a^3b^3+a\\
&&\:\:f(b,a)^4&=h_1(b)a^2+h_2(b)a^4+h_3(b)a^3+h_0(b)a\\
&&\:\:g(b)&=-\dfrac{1}{4}(h_1(b)+h_2(b)+h_3(b)+h_0(b))\\
&&\:\:f(b,a)&=\sqrt[4]{g(b)}\\
\end{eqnarray}\)

である。この過程で、\(a,\:b\) については \(a^5=1\:(a\neq1),\:b^4=1\) という条件しか使っていない。従って、この条件が満たせれば \(a,\:b\) は任意である。そこで \(1\) の原始5乗根を \(\zeta\) とし、\(1\) の原始4乗根を \(\omega\) として、
 \(a=\zeta\)
 \(b=\omega^j\:\:(j=1,2,3,4)\)
とおく。\(b\) は \(1\) にもなりうる(\(\omega^4=1\))。なお、\(\omega\) は普通 \(1\) の原始3乗根の記号であるが、ここでは原始4乗根として使う。

すると、

 \(f(\omega^j,\zeta)=\sqrt[4]{g(\omega^j)}\:\:(j=1,2,3,4)\)
 \((\br{E})\)

という、4つの式が得られる。これは、
 \(\zeta^2,\:\:\zeta^4,\:\:\zeta^3,\:\:\zeta\)
を4つの未知数とする連立1次方程式である。帰納法の仮定により \(\omega\) はべき根で表されているから、方程式を解いて \(\zeta\) が \(\omega\) のべき根(と四則演算)で表されば、証明が完成することになる。



\((\br{E})\) の連立方程式を具体的に書くと、

 \(\zeta^2+\omega^j\zeta^4+(\omega^j)^2\zeta^3+(\omega^j)^3\zeta=\sqrt[4]{g(\omega^j)}\)
   \((j=1,2,3,4)\)

であり、全てを陽に書くと、

\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&\zeta^2+\omega\:\:\zeta^4+(\omega\:\:)^2\zeta^3+(\omega\:\:)^3\zeta&=\sqrt[4]{g(\omega)}& \br{①}&\\
&&\zeta^2+\omega^2\zeta^4+(\omega^2)^2\zeta^3+(\omega^2)^3\zeta&=\sqrt[4]{g(\omega^2)}& \br{②}&\\
&&\zeta^2+\omega^3\zeta^4+(\omega^3)^2\zeta^3+(\omega^3)^3\zeta&=\sqrt[4]{g(\omega^3)}& \br{③}&\\
&&\zeta^2+\omega^4\zeta^4+(\omega^4)^2\zeta^3+(\omega^4)^3\zeta&=\sqrt[4]{g(\omega^4)}& \br{④}&\\
\end{eqnarray}
\end{array}\right.\)

となる。この連立方程式を解くため、\(\zeta\) の項だけを残し、他の未知数である \(\zeta^2,\:\zeta^4,\:\zeta^3\) の項を消去することを考える。そのために、

 \(A\::\:\br{①}\times\omega \:+\:\br{②}\times\omega ^2\:+\:\br{③}\times\omega ^3\:+\:\br{④}\times\omega ^4\)

とおくと、

 \(A\) の左辺 \(=\)
  \(\omega\:\:\zeta^2+(\omega\:\:)^2\zeta^4+(\omega\:\:)^3\zeta^3+(\omega\:\:)^4\zeta+\)
  \(\omega^2\zeta^2+(\omega^2)^2\zeta^4+(\omega^2)^3\zeta^3+(\omega^2)^4\zeta+\)
  \(\omega^3\zeta^2+(\omega^3)^2\zeta^4+(\omega^3)^3\zeta^3+(\omega^3)^4\zeta+\)
  \(\omega^4\zeta^2+(\omega^4)^2\zeta^4+(\omega^4)^3\zeta^3+(\omega^4)^4\zeta\)

となる。\(\zeta\) の4つの項は、係数が \((\omega^j)^4=(\omega^4)^j=1\) であり、
 \(\zeta\) の項の合計 \(=\:4\zeta\)
である。

\(\zeta^2,\:\zeta^4,\:\zeta^3\) の項の係数は、
 \(\omega^j+\omega^{2j}+\omega^{3j}+\omega^{4j}\:\:(j=1,2,3)\)
である。\(\omega^4=1\) なので、
 \(\omega^j+\omega^{2j}+\omega^{3j}+1\:\:(j=1,2,3)\)
の形をしている。\(\omega\) は \(1\) の原始4乗根であり、\(x^4-1=0\) の根である。\(x^4-1\) は、
 \(x^4-1=(x-1)(x^3+x^2+x+1)\)
と因数分解されるから、\(\omega,\:\omega^2,\:\omega^3\) は方程式
 \(x^3+x^2+x+1=0\)
の3つの根である。つまり、
 \(x^3+x^2+x+1=(x-\omega)(x-\omega^2)(x-\omega^3)\)
と因数分解される。この式に \(x=\omega^j\:(j=1,2,3)\) を代入すると、
 \((\omega^j)^3+(\omega^j)^2+\omega^j+1\)
\(\begin{eqnarray}
&&\:\: &=\omega^{3j}+\omega^{2j}+\omega^j+1\\
&&&=(\omega^j-\omega)(\omega^j-\omega^2)(\omega^j-\omega^3)\\
&&&=0\:\:(j=1,2,3)\\
\end{eqnarray}\)
となる。つまり、\(\zeta^2,\:\zeta^4,\:\zeta^3\) の項の係数、\(\omega^j+\omega^{2j}+\omega^{3j}+1\) は全て \(0\) ということである。以上をまとめると、\(A\) の左辺は \(\zeta\) の項だけが残り、

 \(A\) の左辺 \(=\:4\zeta\)

である。一方、\(A\) 式の右辺は、
 \(A\) の右辺 \(=\:\displaystyle\sum_{j=1}^{4}\omega^j\sqrt[4]{g(\omega^j)}\)
である。従って、
 \(4\zeta=\displaystyle\sum_{j=1}^{4}\omega^j\sqrt[4]{g(\omega^j)}\)
 \(\zeta=\dfrac{1}{4}\displaystyle\sum_{j=1}^{4}\omega^j\sqrt[4]{g(\omega^j)}\)
 \((\br{F})\)
となり、\(\zeta\) が \(\omega\) の多項式のべき根として求まった。

\((\br{F})\) 式における \(\sqrt[4]{g(\omega^j)}\) とは「\(4\)乗すると \(g(\omega^j)\) になる数」という意味であり、\(4\)次方程式の\(4\)つの解のどれかである。従って、実際に \(\omega\) に数を入れて(この場合は \(1\) の原始4乗根だから \(i\) か \(-i\))計算するときには、\(\zeta^5=1\) になるように \((\br{F})\) 式の \(4\)つの項のそれぞれについて、\(4\)つの解のどれかを選択する必要がある。しかしそうであっても、\(\zeta\) が \(\omega\) の多項式のべき根と四則演算で表現できるということは変わらない。

これまでの論理展開では、\(p=5\) であることの特殊性は何も使っていない。唯一、使ったのは、\(p\) が素数であり、そのときに \((\bs{Z}/p\bs{Z})^{*}\) に生成元がある(25D)ということである。

従って、\(\zeta\) が \(1\) の原始\(p\)乗根であり、\(\omega\) が \(1\) の原始\((p-1)\)乗根であっても \((\br{F})\) 式は、\(4\) を \((p-1)\) に置き換えれば成り立つ。

帰納法の仮定により、\(1\) の原始\((p-1)\)乗根 \(\omega\) はべき根で表される。従って \((\br{F})\) 式から、\(1\) の原始\(p\)乗根 である \(\zeta\) もべき根で表される。[証明終]



ためしに \((\br{F})\) 式を使って、\(1\) の原始5乗根、\(\zeta\) を計算してみます。\(\omega\) は \(1\) の原始4乗根(の一つ)なので \(\omega=i\)(虚数単位)とすると、\((\br{D})\) 式も含めて、
\(\begin{eqnarray}
&&\:\:g(b)&=-16b^3+14b^2+4b-1 (\br{D})\\
&&\:\:b&=\omega^j\:\:(j=1,2,3,4)\\
&&&=\:\{\:i,\:-1,\:-i,\:1\:\}\\
&&\:\:g(\omega)&=-15+20i\\
&&\:\:g(\omega^2)&=25\\
&&\:\:g(\omega^3)&=-15-20i\\
&&\:\:g(\omega^4)&=1\\
\end{eqnarray}\)
となり、これらを \((\br{F})\) 式に代入すると、

 \(\zeta=\dfrac{1}{4}(\sqrt[4]{1}-\sqrt[4]{25}+i(\sqrt[4]{-15+20i}-\sqrt[4]{-15-20i}))\)

となります。\(\sqrt[4]{\cdots}\) は「\(4\)乗して \(\cdots\) になる数」の意味です。この式を、
 \(4\zeta=r+is\)
\(\begin{eqnarray}
&&\:\: r&=\sqrt[4]{1}-\sqrt[4]{25}\\
&&\:\: s&=\sqrt[4]{-15+20i}-\sqrt[4]{15-20i}\\
\end{eqnarray}\)
と表すことにします。そして \(\sqrt[4]{\cdots}\) を \(\sqrt{\cdots}\) に変換するために2乗すると、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&r^2=\pm6\pm2\sqrt{5}&\\
&&s^2=\pm10\pm2\sqrt{5}&\\
\end{eqnarray}
\end{array}\right.\)
と計算できます。但し \(r^2+s^2=4\) の条件があるので、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&r^2=6\pm2\sqrt{5}&\\
&&s^2=10\pm2\sqrt{5}&\\
\end{eqnarray}
\end{array}\right.\)
となります(複合異順)。ここから \(r,\:s\) を求めると、\(r\) の方は2重根号をはずすことができて、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&r=\pm(1+\sqrt{5}),\:\:s=\pm\sqrt{10-2\sqrt{5}}&\\
&&r=\pm(1-\sqrt{5}),\:\:s=\pm\sqrt{10+2\sqrt{5}}&\\
\end{eqnarray}
\end{array}\right.\)
の合計8つの解が求まります。このうちの4つは方程式 \(x^5-1=0\) の解 \((=\zeta)\) で、残りの4つは方程式 \(x^5+1=0\) の解 \((=-\zeta)\) です。\(\zeta\) を表記すると、

\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&\zeta=\dfrac{1}{4}\left(-1+\sqrt{5}\pm i\sqrt{10+2\sqrt{5}}\right)&\\
&&\zeta=\dfrac{1}{4}\left(-1-\sqrt{5}\pm i\sqrt{10-2\sqrt{5}}\right)&\\
\end{eqnarray}
\end{array}\right.\)

の4つとなり、\(1\) の原始5乗根が求まりました。一般的な原始5乗根の計算方法とは違いますが、\((\br{F})\) 式によっても原始5乗根が求まることが確認できました。


7.2 べき根拡大の十分条件のため補題


ここでは「7.3 べき根拡大の十分条件」を証明するための補題を2つ証明します。以下に出てくる多項式 \(g(x)\) は、方程式を解くために考えられた「ラグランジュの分解式」と呼ばれるものです。分解式はレゾルベント(resolvent)とも言います。

補題(1)
べき根拡大の十分条件のため補題1:72A)

\(\bs{L}\) を \(\bs{K}\) のガロア拡大とし、\(\mr{Gal}(\bs{L}/\bs{K})\) を \(\sigma\) で生成される位数 \(n\) の巡回群とする。式 \(g(x)\) を、

\(g(x)\)\(\overset{\text{ }}{=}\)\(x+a_1\sigma(x)+a_2\sigma^2(x)+\:\cdots\:+a_{n-1}\sigma^{n-1}(x)=0\)
\((a_i\in\bs{L},\:1\leq i\leq n-1)\)

と定義する。このとき、\(\bs{L}\) の全ての元 \(x\) について、\(g(x)=0\) となるような \(\bs{L}\) の元、\(a_1,\:a_2,\:\cdots\:,a_{n-1}\) は存在しない。


[証明]

\(\bs{L}\) が \(\bs{L}=\bs{K}(\theta)\) と表されているとし、\(\theta\) の \(\bs{K}\) 上の最小多項式を \(f(x)\) とする。最小多項式は既約多項式の定理(31I)により \(f(x)\) は既約多項式である。そうすると、\(\theta,\:\sigma^i(\theta)\:(1\leq i\leq n-1)\) の \(n\)個は \(f(x)=0\) の解であり、既約多項式の定理331F)によって \(n\)個の解は全て異なる。つまり、
 \(\theta-\sigma^i(\theta)\neq0\:(1\leq i\leq n-1)\)
である。このことを踏まえて背理法で証明する。\(\bs{L}\) の任意の元 \(x\) について、

\(g(x)=x+a_1\sigma(x)+a_2\sigma^2(x)+\:\cdots\:+a_{n-1}\sigma^{n-1}(x)=0\)
 \((\br{A})\)

となるような \(\bs{L}\) の元 \(a_1,\:a_2,\:\cdots\:,a_{n-1}\) が存在したとする。この \(g(x)=0\) の式から \(\sigma^{n-1}(x)\) の項を消去することを考える。そのためにまず \(g(\theta x)\) を計算すると、

\(g(\theta x)\)\(\overset{\text{ }}{=}\)\(\theta x+\)\(a_1\sigma(\theta x)+\)\(a_2\sigma^2(\theta x)+\)\(\:\cdots\:+\)\(a_{n-1}\sigma^{n-1}(\theta x)\)
\(\overset{\text{ }}{=}\)\(\theta x+\)\(a_1\sigma(\theta)\sigma(x)+\)\(a_2\sigma^2(\theta)\sigma^2(x)+\)\(\:\cdots\:+\)\(a_{n-1}\sigma^{n-1}(\theta)\sigma^{n-1}(x)\)
\(\overset{\text{ }}{=}\)\(0\)

となる。この式から \(\sigma^{n-1}(x)\) の項を消去するには、この式の \(\sigma^{n-1}(x)\)の係数が \(a_{n-1}\sigma^{n-1}(\theta)\) であり、また \(g(x)\) の \(\sigma^{n-1}(x)\) の項の係数が \(a_{n-1}\) なので、
 \(\sigma^{n-1}(\theta)g(x)=0\)
の式を作って両辺から引けばよい。その計算をすると、

\(g(\theta x)-\sigma^{n-1}(\theta)g(x)\)
 \(\overset{\text{ }}{=}\)\((\theta-\sigma^{n-1}(\theta))x+\)\((\sigma(\theta)-\sigma^{n-1}(\theta))a_1\sigma(x)+\)\((\sigma^2(\theta)-\sigma^{n-1}(\theta))a_2\sigma(x)^2+\)\(\:\cdots\:+\)\((\sigma^{n-2}(\theta)-\sigma^{n-1}(\theta))a_{n-2}\sigma(x)^{n-2}\)
\(\overset{\text{ }}{=}\)\(0\)

となる。ここで、\(x\) の係数である \((\theta-\sigma^{n-1}(\theta))\) は、証明の最初に書いたように \(0\) ではない。そこで、全体を \((\theta-\sigma^{n-1}(\theta))\) で割ると、

\(x+b_1\sigma(x)+b_2\sigma(x)^2+\:\cdots\:+b_{n-2}\sigma(x)^{n-2}=0\)
 \((\br{B})\)

の形になる。ここで \(b_i\) は、
 \(b_i=\dfrac{\sigma^i(\theta)-\sigma^{n-1}(\theta)}{\theta-\sigma^{n-1}(\theta)}a_i\)
である。\((\br{B})\) 式は、基本的に \((\br{A})\) 式と同じで、\((\br{A})\) 式から \(\sigma(x)^{n-1}\) の項を消去した形であり、\(x\) の最大次数の項は \(\sigma(x)^{n-2}\) になっている。以上の、\((\br{A})\) から \((\br{B})\) への変換は繰り返し行えるから、\(n-2\) 回の変換を繰り返すと、

 \(x+c_1\sigma(x)=0\)

の形が得られる。この式にもう一度、\(n-1\) 回目の変換をすると、

\(\theta x+c_1\sigma(\theta x)-\sigma(\theta)(x+c_1\sigma(x))=0\) 
\(\theta x+c_1\sigma(\theta)\sigma(x)-\sigma(\theta)x+c_1\sigma(\theta)\sigma(x)=0\) 
\(\theta x-\sigma(\theta)x=0\) 
\((\theta-\sigma(\theta))x=0\) 
\(x=0\)

となる。\(x\) は \(\bs{L}\) の任意の元だったから、\(\bs{L}\) のすべての元は \(0\) となってしまい、矛盾が生じた。従って背理法の仮定は誤りであり、\(\bs{L}\) の全ての元 \(x\) について、
\(x+a_1\sigma(x)+a_2\sigma^2(x)+\:\cdots\:+a_{n-1}\sigma^{n-1}(x)=0\)
となるような \(\bs{L}\) の元、\(a_1,\:a_2,\:\cdots\:,a_{n-1}\) は存在しない。[証明終]

補題(2)
べき根拡大の十分条件のため補題2:72B)

\(\zeta\) を \(1\) の原始\(n\)乗根とし、\(\zeta\)を含む代数体を \(\bs{K}\) とする。\(\bs{K}\) のガロア拡大体を \(\bs{L}\) とし、\(\mr{Gal}(\bs{L}/\bs{K})\) は \(\sigma\) で生成される位数 \(n\) の巡回群とする(= \(\bs{L}/\bs{K}\) が巡回拡大)。また \(f(x)\) を \(\bs{K}\) 上の \(n\)次既約多項式とし、\(\bs{L}\) が方程式 \(f(x)=0\) の解 \(\theta\) を用いて、\(\bs{L}=\bs{K}(\theta)\) と表されているものとする。このとき、

 \(g(x)=x+\zeta^{n-1}\sigma(x)+\zeta^{n-2}\sigma^2(x)+\cdots+\zeta\sigma ^{n-1}(x)\)

とおくと、\(g(\theta),\:g(\theta^2),\:\cdots\:,g(\theta^{n-1})\) のうち少なくとも一つは \(0\) ではない。


[証明]

\(g(x)\) の形は、べき根拡大の十分条件のため補題172A)で、
 \(a_i=\zeta^{n-i}\:(1\leq i\leq n-1)\)
と置いたものである。\(\zeta\) は \(\bs{K}\) の元 = \(\bs{L}\) の元だから、補題(1)により \(\bs{L}\) の任意の元 \(x\) について \(g(x)=0\) となることはない。

この \(g(x)\) は次のような性質をもっている。まず \(\bs{K}\) の任意の元を \(a\) とすると、\(\mr{Gal}(\bs{L}/\bs{K})\) の 元 \(\sigma\) は \(a\) を不動にするから、
 \(\sigma^i(a)=a\)
である。従って、\(g(a)\) を計算すると、
 \(g(a)=ag(1)\)
となる。また、\(\bs{K}\) の任意の元を \(a\)、\(\bs{L}\) の任意の元を \(x\) とすると、
 \(\sigma^i(ax)=\sigma^i(a)\sigma^i(x)=a\sigma^i(x)\)
なので、
 \(g(ax)=ag(x)\)
である。さらに \(\bs{L}\) の任意の2つの元を \(x,\:y\) とすると、
 \(\sigma^i(x+y)=\sigma^i(x)+\sigma^i(y)\)
なので、
 \(g(x+y)=g(x)+g(y)\)
である。

\(\bs{L}\) は、\(\bs{K}\) 上の既約多項式 \(f(x)\) を用いた方程式 \(f(x)=0\) の解 \(\theta\) の単拡大体 \(\bs{K}(\theta)\) だから、単拡大の体の定理(32C)により、\(\bs{L}\) の任意の元 \(x\) は、

 \(x=b_0+b_1\theta+b_2\theta^2+\cdots+b_{n-1}\theta^{n-1}\:(b^i\in\bs{K})\)

と表せる。\(g(x)\) の式にこの \(x\) を代入すると、
\(\begin{eqnarray}
&&\:\:g(x)&=g(b_0+b_1\theta+b_2\theta^2+\cdots+b_{n-1}\theta^{n-1})\\
&&&=g(b_0)+g(b_1\theta)+g(b_2\theta^2)+\cdots+g(b_{n-1}\theta^{n-1})\\
&&&=b_0g(1)+b_1g(\theta)+b_2g(\theta^2)+\cdots+b_{n-1}g(\theta^{n-1})\\
\end{eqnarray}\)

となる。ここで、
 \(g(1)=1+\zeta^{n-1}+\zeta^{n-2}+\cdots+\zeta\)
だが、\(g(1)(1-\zeta)=\zeta^n-1=0\) なので \(g(1)=0\) である。従って、\(g(\theta),\:g(\theta^2),\:\cdots\:,g(\theta^{n-1})\) の全てが \(0\) だと、\(\bs{L}\) の全ての元 \(x\) について \(g(x)=0\) となり、矛盾が生じる。ゆえに、\(g(\theta),\:g(\theta^2),\:\cdots\:,g(\theta^{n-1})\) のうち、少なくとも一つは \(0\) ではない。[証明終]


7.3 べき根拡大の十分条件


補題(1)と補題(2)を使って、体の拡大がべき根拡大になるための十分条件を証明します。


べき根拡大の十分条件:73A)

1の原始\(n\)乗根を \(\zeta\) とし、代数体 \(\bs{\bs{K}}\) には \(\bs{\zeta}\) が含まれるとする。\(\bs{L}/\bs{K}\) をガロア拡大とし、\(\mr{Gal}(\bs{L}/\bs{K})\) が巡回群とする(= \(\bs{L}/\bs{K}\) が巡回拡大)。拡大次数は \([\bs{L}:\bs{K}]=n\) とする。

このとき、\(\bs{L}\) は \(\bs{K}\) のべき根拡大である。


[証明]

\(\mr{Gal}(\bs{L}/\bs{K})\) は位数 \(n\) の巡回群なので、生成元を \(\sigma\) とし、

 \(\mr{Gal}(\bs{L}/\bs{K})=\{e,\:\sigma,\:\sigma^2,\:\cdots\:,\sigma^{n-1}\}\)

とする。\(\bs{L}\) の 元 \(c\) に対して、

 \(\alpha=c+\zeta^{n-1}\sigma(c)+\zeta^{n-2}\sigma^2(c)+\:\cdots+\zeta\sigma ^{n-1}(c)\)

と定める。このとき \(\alpha\neq 0\) となるように \(c\) を選べる。なぜなら、もし \(\alpha\neq 0\) となる \(c\) が選べないとすると、\(\bs{L}\) の全ての元 \(x\) について、

 \(x+\zeta^{n-1}\sigma(x)+\zeta^{n-2}\sigma^2(x)+\:\cdots\:+\zeta\sigma ^{n-1}(x)=0\)

となるはずだが、これはべき根拡大の十分条件のため補題172A)、つまり、

 \(\bs{L}\) の全ての元 \(x\) について、
  \(x+a_1\sigma(x)+a_2\sigma^2(x)+\:\cdots\:+a_{n-1}\sigma^{n-1}(x)=0\)
 となるような \(\bs{L}\) の元、\(a_1,\:a_2,\:\cdots\:,a_{n-1}\) は存在しない

において、\(a_1=\zeta^{n-1},\:a_2=\zeta^{n-2},\:\cdots\:,a_{n-1}=\zeta\) と置いたことに相当し、そのような \(a_i\:(1\leq i\leq n-1)\) は存在しないとする補題1の結論に反するからである。またべき根拡大の十分条件のため補題272B)では、\(c\) の選び方の例が示されている。そこで、\(\alpha\neq 0\) となるように \(c\) を選んだとする。

\(\sigma\)は \(\bs{K}\) の元である \(\zeta\) を不変にするので、
 \(\sigma(\zeta^{n-i}\sigma^i(c))=\zeta^{n-i}\sigma^{i+1}(c)\)
である。これを用いて \(\sigma(\alpha)\) を計算すると、

\(\sigma(\alpha)\)
 \(=\sigma(c)+\zeta^{n-1}\sigma^2(c)+\zeta^{n-2}\sigma^3(c)+\:\cdots+\zeta\sigma ^n(c)\)
 \(=\zeta^n\sigma(c)+\zeta^{n-1}\sigma^2(c)+\zeta^{n-2}\sigma^3(c)+\:\cdots+\zeta c\)
 \(=\zeta(\zeta^{n-1}\sigma(c)+\zeta^{n-1}\sigma(c)+\zeta^{n-2}\sigma^2(c)+\:\cdots+c)\)
 \(=\zeta\alpha \)
となる。計算では、\(\zeta^n=1\) であることと、\(\sigma^n=e\) なので \(\sigma^n(c)=c\) となることを用いた。

ここで、\(\alpha=\zeta\alpha \) となるのは、\(\alpha=0\) のときだけであるが、\(\alpha\neq 0\) なので \(\alpha\neq \zeta\alpha \) である。つまり \(\alpha\) は \(\sigma\) を作用させると不変ではない。従って \(\alpha\) は、\(\bs{K}\)の元ではない \(\bs{L}\) の元である。さらに \(\sigma^i(\alpha)\) を求めていくと、

\(\begin{eqnarray}
&&\:\:\sigma^2(\alpha)&=\sigma(\sigma(\alpha))=\sigma(\zeta\alpha )=\zeta\sigma (\alpha)=\zeta\zeta \alpha\\
&&&=\zeta^2\alpha\\
&&\:\:\sigma^3(\alpha)&=\sigma(\sigma^2(\alpha))=\sigma(\zeta^2\alpha)=\zeta^2\sigma(\alpha)=\zeta^2\zeta\alpha \\
&&&=\zeta^3\alpha\\
\end{eqnarray}\)

というように計算でき、
 \(\sigma^i(\alpha)=\zeta^i\alpha\)
である。これを使うと、
\(\begin{eqnarray}
&&\:\:\sigma(\alpha^n)&=\sigma(\alpha)^n=(\zeta\alpha )^n=\zeta^n\alpha^n\\
&&&=\alpha^n\\
\end{eqnarray}\)
であり、\(\alpha^n\) は \(\sigma\) を作用させても不変である。従って \(\alpha^n\) は \(\bs{K}\) の元である。そこで \(\alpha^n=a\:\:(a\in\bs{K})\) とおく。

方程式 \(x^n-a=0\) の解は、\(\alpha,\:\zeta\alpha ,\:\zeta^2\alpha,\:\cdots,\:\zeta^{n-1}\alpha\) であり、\(x^n-a=0\) の \(\bs{K}\) 上の最小分解体は、\(\bs{K}\) には \(\zeta\) が含まれているから、

 \(\bs{K}(\alpha,\:\zeta\alpha ,\:\zeta^2\alpha,\:\cdots,\:\zeta^{n-1}\alpha)=\bs{K}(\alpha,\zeta)=\bs{K}(\alpha)\)

である。この式から、\(\bs{K}\) の同型写像による \(\alpha\) の移り先は全て \(\bs{K}(\alpha)\) に含まれることが分かる。従って \(\sigma^i\:\:(1\leq i\leq n-1)\) はすべて \(\bs{K}(\alpha)\) の自己同型写像である。また、同型写像での移り先の定理(51D)により、同型写像は \(\alpha\) を共役な元に移すが、\(\alpha\) と共役な元は \(n-1\) 個しかない。従って \(\sigma^i\) 以外に同型写像はない。つまり、

 \(\mr{Gal}(\bs{K}(\alpha)/\bs{K})=\{e,\:\sigma,\:\sigma^2,\:\cdots\:,\:\sigma^{n-1}\}\)

であり、これは \(\mr{Gal}(\bs{L}/\bs{K})\) と同じである。次数と位数の同一性の定理(52B)により、ガロア群に含まれる自己同型写像の数は体の拡大次数に等しいから、

 \([\:\bs{K}(\alpha)\::\:\bs{K}\:]=[\:\bs{L}\::\:\bs{K}\:]\)

である。もともと \(\alpha\) は \(\bs{L}\) の元だったので、\(\bs{K}(\alpha)\) の元は全て \(\bs{L}\) の元である。つまり、
 \(\bs{K}(\alpha)\:\subset\:\bs{L}\)
であるが、\(\bs{K}(\alpha)\) と \(\bs{L}\) の線形空間の次元が等しいので、体の一致の定理(33I)により2つは一致し、
 \(\bs{K}(\alpha)=\bs{L}\)
である。以上により、\(\bs{L}\) は \(\bs{K}\) の上の方程式 \(x^n-a=0\:(a\in\bs{K})\) の解の一つ \(\alpha\) を用いて \(\bs{L}=\bs{K}(\alpha)\) と表されるから、\(\bs{L}\) は \(\bs{K}\) の べき根拡大である。[証明終]



証明の過程で出てきた、

\(\alpha=c+\zeta^{n-1}\sigma(c)+\zeta^{n-2}\sigma^2(c)+\:\cdots+\zeta\sigma ^{n-1}(c)\)

の式は、方程式を解くために考えられた「ラグランジュの分解式」と呼ばれるものです。分解式はレゾルベント(resolvent)とも言い、数学史においてはガロア理論より前に考えられたものです。この証明を振り返ってまとめてみると、

 ・\(\bs{L}\) は \(\bs{K}\) の代数拡大体であり、拡大次元は \(n\) である。
 ・\(\bs{K}\) には \(1\) の原始\(n\)乗根が含まれている。
 ・\(\bs{L}/\bs{K}\) はガロア拡大である。
 ・\(\mr{Gal}(\bs{L}/\bs{K})\) は巡回群である(=\(\bs{L}/\bs{K}\) は巡回拡大)

という条件のもとで、レゾルベントをうまく定義することで、

 ・ある \(\bs{L}\) の元 \(\alpha\) が存在し、\(\alpha^n\) は \(\bs{K}\) の元である。
 ・すなわち、\(x^n-a=0\:\:(a\in\bs{K})\) の解が \(\alpha\:(\in\bs{L})\) である。
 ・\(\bs{L}=\bs{K}(\alpha)\) であり、従って \(\bs{L}/\bs{K}\) はべき根拡大である。

が成り立つという論理展開でした。つまりポイントは \(\bs{\alpha^n\in\bs{K}}\) のところであり、そういう \(\bs{\alpha\in \bs{L}}\) が存在することが証明の核心です。

しかし、その鍵である \(\alpha\) を具体的に見つけようとすると、\(\alpha\) の式に現れる \(c\) を決めなければなりません。その \(c\) の値ですが、\(\bs{L}\) が方程式 \(f(x)=0\) の解 \(\theta\) を用いて \(\bs{L}=\bs{K}(\theta)\) と表されているとき(= \(\theta\) が原始元のとき)、\(c=\theta\) にできることがべき根拡大の十分条件のため補題272B)に示されています。しかし、方程式の形から原始元が分かるわけではありません。

べき根拡大の十分条件73A)は、その十分条件があればべき根拡大体の中に方程式の解が含まれる(= 方程式の解が四則演算とべき根で記述できる)ことだけを言っています。つまり四則演算とべき根で記述できる解の存在証明であり、そこが注意点です。


7.4 べき根拡大と巡回拡大の同値性


6.3節の "べき根拡大は巡回拡大である"(63H)と、7.3節の "巡回拡大はべき根拡大である"(73A)を合わせると、次にまとめることができます。


べき根拡大と巡回拡大は同値:74A)

\(1\) の原始\(n\)乗根を \(\zeta\) とし、代数体 \(\bs{\bs{K}}\) には \(\bs{\zeta}\) が含まれるとする。また、\(\bs{K}\) の\(n\)次拡大体を \(\bs{L}\) とする( \([\:\bs{L}\::\:\bs{K}\:]=n\) )。

このとき、
\(\bs{L}/\bs{K}\) は巡回拡大である
\(\bs{L}/\bs{K}\) はべき根拡大である。
の2つは同値である。


\(\bs{1}\) の原始\(\bs{n}\)乗根が代数体に含まれるという条件をつけるのが巧妙なアイデアで、この条件によって可解性の必要十分条件が導けます。


7.5 可解性の十分条件


以上の準備をもとに、可解性の必要条件64B)の逆である、可解性の十分条件の証明を行います。

代数拡大体 \(\bs{K}\) 上の多項式 \(f(x)\) の最小分解体を \(\bs{L}\) とし、拡大次数を \([\:\bs{L}\::\:\bs{K}\:]=n\) とします。そして、ガロア群 \(\mr{Gal}(\bs{L}/\bs{K})\) が可解群であるとき、もし \(\bs{K}\) に \(1\) の原始\(n\)乗根が含まれるなら、べき根拡大と巡回拡大は同値の定理(74A)により、\(\bs{K}\) の巡回拡大とべき根拡大は同じことです。従って、

 可解群 \(\rightarrow\) 累巡回拡大 \(\rightarrow\) 累べき根拡大 \(\rightarrow\) 可解

というルートで、方程式 \(f(x)=0\) の可解性が証明できます。しかし、\(\bs{K}\) に \(1\) の原始\(n\)乗根が含まれるとは限りません。\(\bs{K}\) が有理数体 \(\bs{Q}\) だとすると、そこに(原始2乗根以外の)原始\(n\)乗根はありません。しかし、このようなケースでも方程式の可解性が証明できます。それが以下です。


可解性の十分条件:75A)

体 \(\bs{K}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とする。\(\mr{Gal}(\bs{L}/\bs{K})=G\) とし、\(G\) は可解群とする。

このとき \(f(x)=0\) の解は四則演算とべき根で表現できる。


[証明]

\([\:\bs{L}\::\:\bs{K}\:]=n\:\:(|G|=n)\) とし、\(\zeta\) を \(1\) の原始\(n\)乗根とする。\(\bs{K}\) に \(\zeta\) を添加した拡大体 \(\bs{K}(\zeta)\)と、\(\bs{L}\) に \(\zeta\) を添加した拡大体 \(\bs{L}(\zeta)\) を考える。

\(\bs{L}(\zeta)\) は \(\bs{K}\) 上の方程式 \(f(x)(x^n-1)=0\) の最小分解体だから、\(\bs{L}(\zeta)/\bs{K}\) はガロア拡大である。

また \(\bs{K}(\zeta)\) は、\(\bs{K}\)のガロア拡大体 \(\bs{L}(\zeta)\) の中間体なので、中間体からのガロア拡大の定理(52C)によって、\(\bs{L}(\zeta)/\bs{K}(\zeta)\) もガロア拡大である。そこで、
 \(\mr{Gal}(\bs{L}(\zeta)/\bs{K}(\zeta))=G'\)
とおく。

可解性の十分条件.jpg
ポイントは、\(G'\) が \(G\) の部分群(\(G\) そのものも含む)と同型であることの証明である。これが成り立てば、① \(G\) は可解群なのでその部分群は可解群、② 可解群と同型な \(G'\) は可解群、③ \(G'\) が可解群なので \(\bs{L}(\zeta)/\bs{K}(\zeta)\) は累巡回拡大、④ \(\bs{K}(\zeta)\) は原始\(n\)乗根を含むので、累巡回拡大である \(\bs{L}(\zeta)/\bs{K}(\zeta)\) は累べき根拡大、が言える。

\(G\) の元を \(g\)、\(G\) の単位元を \(e\) とする。\(G'\)の元を \(g'\)、\(G'\) の単位元を \(e'\) とする。また、\(G'\) の元 \(g'\) を \(\bs{L}\) の元に限定して作用させるときの同型写像を \(\sigma(g')\) とする。

\(g'\)は \(\bs{L}(\zeta)\) の自己同型写像だから、\(\bs{L}(\zeta)\) の元を共役な元に移す。従って 作用範囲を \(\bs{L}\) に限定した \(\sigma(g')\) も \(\bs{L}\) の元を共役な元に移す。\(\bs{L}\) はガロア拡大体だから、\(\bs{L}\)の元の共役な元は \(\bs{L}\) に含まれる。従って \(\sigma(g')\) は \(\bs{L}\) の自己同型写像である。

また \(g'\) は \(\mr{Gal}(\bs{L}(\zeta)/\bs{K}(\zeta))\) の元だから、\(\bs{K}(\zeta)\) の元を固定する。従って、\(\bs{K}(\zeta)\) の部分集合である \(\bs{K}\) の元も固定する。ゆえに、\(g'\) の作用範囲を \(\bs{L}\) に限定した \(\sigma(g')\) も、\(\bs{L}\) の部分集合である \(\bs{K}\) の元を固定する。

以上により \(\sigma(g')\) は、\(\bs{K}\)の元を固定する \(\bs{L}\) の自己同型写像だから、\(\mr{Gal}(\bs{L}/\bs{K})\) の元、つまり \(G\) の元である。

\(\sigma\) を \(G'\) から \(G\) への写像と見なして考える。\(G'\) の元 を \(g'\) とし、\(x\) を \(\bs{L}\) の元とすると、\(g'(x)=\sigma(g')(x)\) である。つまり、作用する対象が \(\bs{L}\) の元なら、2つの写像、\(g'\) と \(\sigma(g')\) は同じ効果を生む。

\(G'\)の任意の2つの元を \(g_1',\:g_2'\) とすると、\(g_1'g_2'\) も \(G'\) の元だから、
 \(g_1'g_2'(x)=\sigma(g_1'g_2')(x)\)
 \((\br{A})\)
である。左辺の \(g_2'(x)\) は \(\sigma(g_2')(x)\) と同じなので、
 \(g_1'g_2'(x)=g_1'(\sigma(g_2')(x))\)
であるが、\(\sigma(g_2')(x)\) もまた \(\bs{L}\) の元だから、
 \(g_1'g_2'x=\sigma(g_1')\sigma(g_2')(x)\)
 \((\br{B})\)
である。\((\br{A})\) と \((\br{B})\) より、
 \(\sigma(g_1'g_2')=\sigma(g_1')\sigma(g_2')\)
となって、\(\sigma\) は準同型写像42A)である。

\(\sigma(g')\) が \(G\) の元であり \(\sigma\) が準同型写像なので、準同型写像の像と核の定理(42B)により、\(\sigma\) による \(G'\) の 像 \(\sigma(G')\) は \(G\) の部分群である。もちろん、\(G\) の部分群には \(G\) の自明な部分群である \(G\) 自身も含まれる。



いま、ある \(G'\) の元 \(h\) があって、\(\sigma(h)=e\)(\(e\) は \(G\) の単位元)とする。つまり、\(h\) を \(\bs{L}\) に限定して適用すると、\(\bs{L}\) の元すべてを固定するものとする。

\(G'\) は \(\mr{Gal}(\bs{L}(\zeta)/\bs{K}(\zeta))\) であり、そのすべての元は \(\bs{K}(\zeta)\) の元を固定する。従って、\(G'\) の元 \(h\) は \(\zeta\) も固定する。ということは、\(h\) は「\(\bs{L}\) の元すべてを固定し、かつ \(\zeta\) を固定する」から、\(\bs{L}(\zeta)\) の元すべてを固定する。つまり \(h\) は \(G'\) の単位元であり、\(h=e'\) である。

ゆえに、準同型写像の像と核42B)における核の定義によって、
 \(\mr{Ker}\:\sigma=e'\)
であり、核が単位元なら単射の定理(42C)によって、\(\sigma\) は単射である。このことから、準同型定理43A)により、
 \(G'/\mr{Ker}\:\sigma\:\cong\:\sigma(G')\)
すなわち、
 \(G'\:\cong\:\sigma(G')\)
である。つまり \(\bs{G'}\)\(\bs{G}\) の部分群 \(\bs{\sigma(G')}\) と同型である。



\(G\) は可解群なので、可解群の部分群は可解群の定理(61C)によって、\(G\) の部分群である \(\sigma(G')\) も可解群であり、さらにそれと同型である \(G'\) も可解群である。\(G'\) が可解群なので、可解群の定義により \(G'\) から \(e'\) に至る部分群の列、
\(G'=H_0\supset H_1\supset\cdots \supset H_i\supset H_{i+1}\supset\cdots \supset H_k=\{e'\}\)
があって、\(H_{i+1}\) は \(H_i\) の正規部分群であり、\(H_i/H_{i+1}\) は巡回群である。

\(|G'|=m\) とおくと、\(G'\) は \(G\) の部分群である \(\sigma(G')\) と同型なので、ラグランジュの定理41E)によって、\(m\) は \(|G|=n\) の約数である。

ガロア対応53B)による \(H_i\) の固定体を \(\bs{K}_i\) とすると、
\(\bs{K}(\zeta)=\bs{K}_0\subset\bs{K}_1\subset\cdots \subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cdots \subset\bs{K}_k=\bs{L}(\zeta)\)
という固定体の系列が定義できる。\(H_i/H_{i+1}\) は巡回群なので、\(\bs{K}_{i+1}/\bs{K}_i\) は巡回拡大である。

\(\bs{L}(\zeta)/\bs{K}(\zeta)\) の拡大次数は、
 \([\:\bs{L}(\zeta)\::\:\bs{K}(\zeta)\:]=|G'|=m\)
であり、\(n\) の約数である。

固定体の系列における一つの拡大 \(\bs{K}_{i+1}/\bs{K}_i\)を考える。その拡大次数 \([\:\bs{K}_{i+1}\::\:\bs{K}_i\:]=m_i\) は、拡大次数の連鎖律33H)によって \([\:\bs{L}(\zeta)\::\:\bs{K}(\zeta)\:]=m\) の約数であり、従って \(n\) の約数である。

\(\bs{K}_i\) は \(1\) の原始\(n\)乗根 \(\zeta\) を含むから、\(\zeta^{n/m_i}\) も含んでいる。\(\zeta^{n/m_i}\) は \(1\) の原始\(m_i\)乗根である。つまり、\(\bs{K}_i\) は \(1\) の原始\(m_i\)乗根(\(m_i=[\:\bs{K}_{i+1}\::\:\bs{K}_i\:]\))を含む。従って、べき根拡大の十分条件の定理(73A)により、巡回拡大である \(\bs{K}_{i+1}/\bs{K}_i\) はべき根拡大である。

以上のことは \((0\leq i < k)\) のすべてで成り立つから、\(\bs{K}_i\) の系列は累べき根拡大である。



\(f(x)=0\) の解は \(\bs{L}\) に含まれるが、\(\bs{L}\:\subset\:\bs{L}(\zeta)\) だから \(f(x)=0\) の解は \(\bs{L}(\zeta)\) に含まれる。その \(\bs{L}(\zeta)\) は \(\bs{K}(\zeta)\) の累べき根拡大であり、また \(1\) の原始\(n\)乗根である \(\zeta\) は \(\bs{Q}\:(\in\bs{K})\) の元の四則演算とべき根で表現できるから(71A)、\(\bs{L}(\zeta)\) の元はすべて \(\bs{K}\) の元の四則演算とべき根で表現できる。従って \(f(x)=0\) の解も \(\bs{K}\) の元の四則演算とべき根で表現できる。[証明終]



この定理では「体 \(\bs{K}\) 上の方程式 \(f(x)=0\)」としましたが、もちろん、体 \(\bs{K}\) が 有理数体 \(\bs{Q}\) であっても同じです。以降、\(\bs{K}\) を \(\bs{Q}\) と書きます。

証明のポイントは、\(G=\mr{Gal}(\bs{L}/\bs{Q})\) とし、\(G'=\mr{Gal}(\bs{L}(\zeta)/\bs{Q}(\zeta))\) とするとき、\(G'\) が \(G\) の部分群と同型であることです。たとえば、\(f(x)\) が既約な3次多項式だと、\(G\cong S_3\) か \(G\cong C_3\) であり、基本的に \(G'\cong G\) です。しかし、そうならない場合もあります。たとえば \(f(x)=x^3-2\) では \(G\cong S_3\) ですが、
 \(\bs{Q}\:\subset\:\bs{Q}(\omega)\:\subset\:\bs{Q}(\omega,\sqrt[3]{2})=\bs{L}\)
  (\(\omega\) は \(1\) の原始3乗根)
という体の拡大列でわかるように、\(\bs{L}(\omega)=\bs{L}\) です。つまり、\(\bs{L}(\omega)/\bs{Q}(\omega)\) の拡大次数は \(3\) であり、\(\bs{L}/\bs{Q}\) の拡大次数の \(6\) とは違います。しかしそうであっても \(G'=\mr{Gal}(\bs{L}(\omega)/\bs{Q}(\omega))\cong C_3\) であり、\(G'\) は \(G\cong S_3\) の部分群と同型です。

\(G'\) は \(G\) の部分群と同型なので、\(G\) が可解群なら \(G'\) も可解群であり(61C)、\(\bs{L}(\omega)/\bs{Q}(\omega)\) は累巡回拡大であり(62C)、従って、累べき根拡大です(73A)。

さらに、\(1\) の原始\(n\)乗根が \(\bs{Q}\) の元の四則演算とべき根で表現できる(71A)ことも証明のポイントになっています。

この可解性の十分条件の定理(75A)によって、有理数係数の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) として、\(\mr{Gal}(\bs{L}/\bs{Q})\) が可解群のとき、\(f(x)=0\) の解は四則演算とべき根で表現可能なことが証明できました。

ここがゴールで「ガロア理論=可解性の必要十分条件」が完結しました。


7.6 位数2の巡回拡大は平方根拡大:正5角形が作図できる理由


可解性の必要十分条件の証明は前節で尽きていますが、これ以降は可解な方程式の代表的なものを取り上げ、ガロア群の分析をします。

\(x^5-1=0\)
まず \(x^5-1=0\) の解を分析します。
 \(x^5-1=(x-1)(x^4+x^3+x^2+x+1)\)
なので、\(1\) 以外の解を \(\zeta\) とすると、\(\zeta\) は4次方程式、
 \(x^4+x^3+x^2+x+1=0\)
の解です。「7.1 1 の原始n乗根」で書いたように、この方程式の解は、
 \(\zeta=\dfrac{1}{4}\left(-1+\sqrt{5}\pm\sqrt{-10-2\sqrt{5}}\right)\)
 \(\zeta=\dfrac{1}{4}\left(-1-\sqrt{5}\pm\sqrt{-10+2\sqrt{5}}\right)\)
の4つであり、これが \(1\) の原始5乗根です。以下の論旨を明瞭にするために、虚数単位 \(i\) を使わずに、\(\sqrt{\phantom{a}}\) の中を負の数にして記述しました。

この原始5乗根は、4次方程式の解であるにもかかわらず、四則演算と平方根 \(\sqrt{\phantom{a}}\) のみを使って表現されています。なぜそうなるのか、それをガロア理論にのっとって説明します。実は、\(p\) を素数としたとき、

原始\(\bs{p}\)乗根が四則演算と平方根 \(\bs{\sqrt{\phantom{a}}}\) のみで表現できれば、正 \(\bs{p}\)角形は定規とコンパスで作図可能である

ことが知られています。定規というのは「目盛りのない、与えられた2点を通る直線を引くことだけができる道具」であり、コンパスというのは「角度目盛りのない、与えられた2点のうちの1点を中心として別の点を通る円\(\cdot\)円弧を描くことだけができる道具」です。長さや角度を測ることはできません。作図可能の原理は次の項で説明します



\(f(x)=x^4+x^3+x^2+x+1\) とし、\(f(x)=0\) の解の一つを \(\zeta\) とすると、\(f(x)\) の最小分解体は \(\bs{Q}(\zeta)\) です。そのガロア群を、
 \(G=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\)
と書くと、\(\zeta\) の最小多項式は \(f(x)\) なので(63C)、\(|G|=4\) です。また、\(\bs{\bs{Q}(\zeta)}\) のガロア群の定理(63E)により、\(G\) は既約剰余類群と同型で、
 \(G\cong(\bs{Z}/5\bs{Z})^{*}\)
です。
 \((\bs{Z}/5\bs{Z})^{*}=\{1,\:2,\:3,\:4\}\)
ですが、この群の生成元は \(2\) か \(3\) です。以下、生成元を \(2\) として話を進めると、
\(\begin{eqnarray}
&&\:\:(\bs{Z}/5\bs{Z})^{*}&=\{2,\:2^2,\:2^3,\:2^4\}\\
&&&=\{2,\:4,\:3,\:1\}\\
\end{eqnarray}\)
と表現できます。一方、\(f(x)=0\) の4つの解は、
  \(\zeta,\:\:\zeta^2,\:\:\zeta^3,\:\:\zeta^4\)
です。そこで、
 \(\sigma(\zeta)=\zeta^2\)
で定義される自己同型写像を考えると、ガロア群は、
 \(G=\{\sigma,\:\sigma^2,\:\sigma^3,\:\sigma^4=e\}\)
となり、位数 \(4\) の巡回群、かつ可解群です。また、体の拡大次数は、
 \([\:\bs{Q}(\zeta):\bs{Q}\:]=4\)
です。

ガロア群 \(G\) には部分群が含まれています。つまり、
 \(H=\{\sigma^2,\:e\}\)
  \(\sigma^2(\zeta)=\zeta^4\)
と定義すると、\((\sigma^2)^2=e\) なので \(H\) は部分群(\(\sigma H=H\sigma\) なので正規部分群)であり、位数 \(2\) の巡回群です。また、剰余群は、
 \(G/H\cong\{e,\:\sigma\}\)
です。従って、

 \(G\:\supset\:H\:\:\supset\:\{\:e\:\}\)
   \(G/H\)\(\cong\{e,\:\sigma\}\):位数 \(2\)
   \(H/\{\:e\:\}\)\(\cong H\):位数 \(2\)

は可解列です。ガロア対応の定理(53B)により、この可解列に対応する拡大体の列があって、

 \(G\supset H\supset\{\:e\:\}\)
 \(\bs{Q}\subset\bs{F}\subset\bs{Q}(\zeta)\)

となります。\(\bs{F}\) は \(H\) の固定体であり、\(\bs{Q}(\zeta)\) の中間体です。すると、正規性定理(53C)により、
 \(\mr{Gal}(\bs{F}/\bs{Q})\cong G/H\)
なので、\(\mr{Gal}(\bs{F}/\bs{Q})\) は位数 \(2\) の巡回群です。またガロア群の定義により、
 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{F})\cong H\)
であり、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{F})\) も位数 \(2\) の巡回群です。従って、次数と位数の同一性の定理(52B)より拡大次数は、
 \([\:\bs{F}\)\(:\bs{Q}\:]=2\)
 \([\:\bs{Q}(\zeta)\)\(:\bs{F}\:]=2\)
であり、2つの拡大は巡回拡大です。原始2乗根(\(=-1\))は \(\bs{Q}\) に含まれるので、巡回拡大はべき根拡大です(73A)。拡大次数 \(2\) のべき根拡大を(一般的な数学用語ではありませんが)「平方根拡大」と呼ぶことにすると、

\(\bs{\bs{Q}(\zeta)}\)\(\bs{\bs{Q}}\) からの平方根拡大を2回繰り返したものである

と結論づけられます。原始5乗根が四則演算と平方根 \(\sqrt{\phantom{a}}\) のみを使って表現できる理由がここにあります。



ここまでは、中間体 \(\bs{F}\) がどういう拡大体かに触れていませんが、\(\bs{F}\) を具体的に表現することもできます。\(\bs{F}\) は \(H=\{e,\:\sigma^2\}\) の固定体なので、\(\bs{F}=\bs{Q}(\theta)\) として、
 \(\sigma^2(\theta)=\theta\)
となる \(\theta\) を探します。\(\theta\) の選び方には自由度があり、たとえば \(\theta=\zeta^4+\zeta\) としてもよいのですが、ここでは、
 \(\theta=(\zeta^2-\zeta^3)(\zeta^4-\zeta)\)
とします。このように選ぶと、\(\sigma^2(\zeta)=\zeta^4\) なので、
\(\begin{eqnarray}
&&\:\:\sigma^2(\theta)&=(\zeta^8-\zeta^{12})(\zeta^{16}-\zeta^4)\\
&&&=(\zeta^3-\zeta^2)(\zeta-\zeta^4)=\theta\\
\end{eqnarray}\)
となって、\(\theta\) は \(\sigma^2\) で不変です。と同時に、\(\sigma(\zeta)=\zeta^2\) なので、
\(\begin{eqnarray}
&&\:\:\sigma(\theta)&=(\zeta^4-\zeta^6)(\zeta^8-\zeta^2)\\
&&&=(\zeta^4-\zeta)(\zeta^3-\zeta^2)=-\theta\\
\end{eqnarray}\)
となります。ということは、
 \(\sigma(\theta^2)=(\sigma(\theta))^2=(-\theta)^2=\theta^2\)
であり、\(\theta^2\) は \(\sigma\) で不変、つまり \(G\) のすべての元で不変となり、\(\theta^2\) は有理数です。そこで、
 \(\zeta^5=1\)
 \(\zeta^4+\zeta^3+\zeta^2+\zeta+1=0\)
の関係を使って \(\theta^2\) を計算すると、
\(\begin{eqnarray}
&&\:\:\theta^2&=(\zeta^2-\zeta^3)^2(\zeta^4-\zeta)^2\\
&&&=(\zeta^4-2+\zeta)(\zeta^3-2+\zeta^2)\\
&&&=-\zeta^4-\zeta^3-\zeta^2-\zeta+4\\
&&&=5\\
\end{eqnarray}\)
となり、確かに\(\theta^2\) は有理数であることが分かります。つまり、
 \(\theta=\sqrt{5}\)
です。従ってガロア対応は、

 \(G\supset H\)\(\supset\{\:e\:\}\)
 \(\bs{Q}\subset\bs{Q}(\sqrt{5})\)\(\subset\:\bs{Q}(\zeta)\)

となります。原始5乗根に \(\sqrt{-10+2\sqrt{5}}\) のような項が現れるのは、中間体が \(\bs{Q}(\sqrt{5})\) であるという、体の拡大構造からくるのでした。



ここまでの論証を振り返ってみると、

\(p\) を素数とし、原始\(p\)乗根を \(\zeta\) とすると、
 \(|\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})|=|(\bs{Z}/p\bs{Z})^{*}|=p-1\)
なので、
 \(p-1=2^k\:\:(1\leq k)\)
の条件があると、\(\bs{Q}\) から \(\bs{Q}(\zeta)\) に至る「平方根拡大」の列が存在し、\(\zeta\) は四則演算と平方根 \(\sqrt{\phantom{a}}\) だけで表現できる。従って 正 \(p\)角形は定規とコンパスで作図可能である

ことが分かります。この条件は \(p=3,\:5\) で成立しますが、その次に成立するのは \(p=17\) です。

\(x^{17}-1=0\)
\(1\) の原始\(17\)乗根を \(\zeta\) とします。\(p=17\) の最小原始根は \(3\) で(25D)、\((\bs{Z}/17\bs{Z})^{*}\) の位数は \(16\) です。\((\bs{Z}/17\bs{Z})^{*}\) において \(3\) の累乗は、
 \(\phantom{1}3,\:\phantom{1}9,\:10,\:13,\:\phantom{1}5,\:15,\:11,\:16,\)
 \(14,\:\phantom{1}8,\:\phantom{1}7,\:\phantom{1}4,\:12,\:\phantom{1}2,\:\phantom{1}6,\:\phantom{1}1\)
と、すべての元を巡回します。従って、
 \(\sigma(\zeta)=\zeta^3\)
という自己同型写像 \(\sigma\) を定義すると、
 \(G=\{\sigma,\sigma^2,\sigma^3,\cdots,\sigma^{15},\sigma^{16}=e\}\)
が \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) です。

\(x^5-1=0\) のときと同様の考察をすると、\(G\) には3つの部分群があります。

 \(H_1=\{\sigma^2,\sigma^4,\sigma^6,\sigma^8,\sigma^{10},\sigma^{12},\sigma^{14},e\}\)
   \(\sigma^2(\zeta)=\zeta^9\)
 \(H_2=\{\sigma^4,\sigma^8,\sigma^{12},e\}\)
   \(\sigma^4(\zeta)=\zeta^{13}\:\:(\phantom{1}9^2\equiv13\:\:(\mr{mod}\:17))\)
 \(H_3=\{\sigma^8,e\}\)
   \(\sigma^8(\zeta)=\zeta^{16}\:\:(13^2\equiv16\:\:(\mr{mod}\:17))\)

の3つで、

 \(G\supset H_1\supset H_2\supset H_3\supset\{\:e\:\}\)
   \(G\)\(/H_1\)\(\cong\{\sigma^{\phantom{2}},\:e\}\)
   \(H_1\)\(/H_2\)\(\cong\{\sigma^2,\:e\}\)
   \(H_2\)\(/H_3\)\(\cong\{\sigma^4,\:e\}\)
   \(H_3\)\(/\{\:e\:\}\)\(\cong\{\sigma^8,\:e\}\)

は可解列です。ガロア対応の定理(53B)により、\(H_1,\:H_2,\:H_3\) にはそれぞれに対応した固定体 \(\bs{F}_1,\:\bs{F}_2,\:\bs{F}_3\) があって、

 \(G\supset H_1\supset H_2\supset H_3\supset\{\:e\:\}\)
 \(\bs{Q}\subset\bs{F}_1\subset\bs{F}_2\subset\bs{F}_3\subset\bs{Q}(\zeta)\)

のガロア対応になります。\(\bs{Q}\) から \(\bs{Q}(\zeta)\) までの4つの拡大次数は、剰余群の位数に等しいのですべて \(2\) です。つまり、\(\bs{\bs{Q}(\zeta)}\)\(\bs{\bs{Q}}\) からの「平方根拡大」を4回繰り返したものであり、原始\(17\)乗根は四則演算と平方根 \(\sqrt{\phantom{a}}\) のみを使って表現できます。従って正\(17\)角形は定規とコンパスで作図可能です。

これは、ドイツの大数学者\(\cdot\)ガウス(\(1777-1855\))が\(19\)才のときに発見した定理として有名です。

作図可能の原理
ここで改めて、平面上の図形が定規とコンパスで「作図可能」という意味を明確にします。ここで "定規" は「目盛りのない、与えられた2点を通る線を引くことだけができる道具」であり、"コンパス" は「角度目盛りのない、与えられた2点のうちの1点を中心として別の点を通る円\(\cdot\)円弧を描くことだけができる道具」でした。

平面上の図形は点と線でできています。線は2点を与えると描けるので、「作図可能」の意味は「平面上で作図可能な点とは何か」を定義することに帰着します。

平面を複素平面(\(=\bs{C}\))として考えます。以降、
 \(a,\:b\) \(\in\:\bs{R}\)
 \(\alpha,\:\beta\) \(\in\:\bs{C}\)
の記号を使います。

\(1,\:0\) は作図可能である。また複素平面の実軸と虚軸は作図できる。

作図1.jpg

任意の線分を単位長さとし、端点を \(1,\:0\) とします。2点を結ぶ直線が実軸で、\(0\) を通り実軸と垂直な直線を作図するとそれが虚軸です。

\(\alpha=a+b\:i\) とすると、\(a,\:b\) が作図可能なら \(\alpha\) も作図可能である。また、\(\alpha\) が作図可能なら \(a,\:b\) も作図可能である。

作図2.jpg

\(a\) が作図可能なら、\(-a\) も作図可能である。従って \(\alpha\) が作図可能なら \(-\alpha\) も作図可能である。

また \(a,\:b\) が作図可能なら \(a+b\) も作図可能である。従って、\(\alpha,\:\beta\) が作図可能なら \(\alpha+\beta\) も作図可能である。

作図3.jpg

\(a,\:b\) が作図可能なら \(ab\)も作図可能である。従って \(\alpha,\:\beta\) が作図可能なら \(\alpha\beta \) も作図可能である。

作図4.jpg

\(a\:\:(a\neq0)\) が作図可能なら \(a^{-1}\) も作図可能である。従って \(\alpha\:\:(\alpha\neq 0)\) が作図可能なら \(\alpha^{-1}\) も作図可能である。

作図5.jpg

作図可能な \(\alpha\) を \(\alpha=a+b\:i\) とすると、
 \(\alpha^{-1}=\dfrac{a}{a^2+b^2}-\dfrac{b}{a^2+b^2}\:i\)
です。\(a,\:b\) が作図可能なので、その四則演算の結果は作図可能です。従って \(\alpha^{-1}\) も作図可能です。

有理数 \(\bs{Q}\) は作図可能である。

実数のなかで作図可能な点は四則演算で閉じています。かつ、\(0,\:1\) は作図可能です。従って有理数は作図可能です。

\(a\) が正の実数のとき、\(\sqrt{a}\) は作図可能である。

作図6.jpg

\(a\) と \(-1\) を結ぶ線分を直径とする円を描き、虚軸との交点を \(x\cdot i\:(x\):実数) とすると、
 \(1:x=x:a\)
なので、\(x=\pm\sqrt{a}\) です。従って \(\sqrt{a}\) は作図可能です。

\(\alpha\) を作図可能な複素数とするとき、\(\sqrt\alpha\) は作図可能である。

作図7.jpg

極形式を使って、
 \(\alpha=r(\mr{cos}\theta+i\cdot\mr{sin}\theta)\)
とすると、\(r\) は作図可能であり、つまり \(\sqrt{r}\) も作図可能です。また、角 \(\theta\) を2等分する線も、定規とコンパスで作図可能です。従って \(\sqrt\alpha\) は作図可能です。

\(\alpha,\:\beta\) が作図可能な複素数とするとき、2次方程式 \(x^2+\alpha x+\beta=0\) の解は作図可能である。

ある複素数 \(\alpha\) は、作図可能な複素数を係数とする2次方程式、あるいは1次方程式の解となるときのみ、作図可能である。

2次方程式 \(x^2+\alpha x+\beta=0\) の解は、根の公式により、係数 \(\alpha,\:\beta\) の四則演算と平方根で表わされます。従って作図可能です。

定規とコンパスで作図可能な点は、作図可能な円や直線の交点として求まる点です。2次元 \(xy\) 平面( \(\bs{R}^2\) )で考えると、直線と直線の交点は1次方程式の解です。また円と直線の交点は2次方程式の解です。円と円の交点がどうかですが、\(a,\:b,\:c,\:d\) を実数として、2つの円の方程式を、
 \(x^2+y^2=a^2\)
 \((\br{A})\)
 \((x-b)^2+(y-c)^2=d^2\)
 \((\br{B})\)
とします。\((\br{A}),\:(\br{B})\) の両辺を引き算して整理すると、
 \(2bx+2cy-(b^2+c^2+a^2-d^2)=0\)
 \((\br{C})\)
という直線の方程式になります。2つの円の交点は \((\br{A}),\:(\br{C})\) の連立方程式の解であり、2次方程式の解です。つまり、作図可能な実数は、作図可能な実数を係数とする2次方程式(あるいは1次方程式)の解となる実数です。

実数(\(a,\:b\))が作図可能と、複素数(\(a+bi\))が複素平面上で作図可能は同値です。従って、ある複素数 \(\alpha\) は、作図可能な複素数を係数とする2次方程式、あるいは1次方程式の解となるときのみ、作図可能です。

\(\bs{Q}\) の代数拡大体 \(\bs{K}\) があり、

 \(\bs{Q}=\bs{K}_0\subset\bs{K}_1\subset\cdots \subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cdots \subset\bs{K}_n=\bs{K}\)
 \([\:\bs{K}_{i+1}:\bs{K}_i\:]=2\:\:(0\leq i < n)\)

を満たす \(\bs{Q}\) から \(\bs{K}\) の拡大列が存在するとき、\(\bs{K}\) の元
 \(\alpha\in \bs{K}\)
は作図可能である。

\([\:\bs{K}_{i+1}:\bs{K}_i\:]=2\) であれば、\(\bs{K}_{i+1}/\bs{K}_i\) は次数2のべき根拡大であり、
 \(x^2-a=0\:\:(a\in\bs{K}_i)\)
の解、\(\sqrt{a}\) を用いて、
 \(\bs{K}_{i+1}=\bs{K}_i(\sqrt{a})\)
と表されます。従って、\(\bs{K}_i\) の元が作図可能なら、\(\bs{K}_{i+1}\) の元は「作図可能な点の四則演算と平方根の組み合わせ」で表現できるので、作図可能です。体の拡大列の出発点である \(\bs{Q}\) の元は作図可能なので、到達点である \(\bs{K}\) の元も作図可能になります。

\(1\) の原始\(p\)乗根(\(p\):素数)を \(\zeta\) とすると、\(G=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) の位数は \(p-1\) であり、それが2の累乗であれば、\(G\) の可解列にガロア対応する体の拡大系列、

 \(\bs{Q}=\bs{K}_0\subset\bs{K}_1\subset\cdots \subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cdots \subset\bs{K}_n=\bs{Q}(\zeta)\)
 \([\:\bs{K}_{i+1}:\bs{K}_i\:]=2\:\:(0\leq i < n)\)

が存在します(前項での証明)。従って複素数平面上の点 \(\zeta\) は作図可能であり、正 \(p\)角形は作図可能です。条件に合致する素数は \(p=3\)、\(5\)、\(17\)、\(257\)、\(65537\) であることが知られています。


7.7 巡回拡大はべき根拡大:3次方程式が解ける理由


この節では可解な方程式がなぜ解けるのかを、3次方程式を例にとってガロア理論で説明します。また3次方程式の根の公式をガロア理論に沿った形て導出します。「7.5 可解性の十分条件」で証明したことは、


体 \(\bs{K}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とする。\(\mr{Gal}(\bs{L}/\bs{K})=G\) とし、\(G\) は可解群とする。このとき \(f(x)=0\) の解は四則演算とべき根で表現できる。


でした。この証明の核となっているのは「7.3 べき根拡大の十分条件」であり、それは、


1の原始\(n\)乗根を \(\zeta\) とし、代数体 \(\bs{\bs{K}}\) には \(\bs{\zeta}\) が含まれるとする。\(\bs{L}/\bs{K}\) をガロア拡大とし、\(\mr{Gal}(\bs{L}/\bs{K})\) が巡回群とする(= \(\bs{L}/\bs{K}\) が巡回拡大)。拡大次数は \([\bs{L}:\bs{K}]=n\) とする。このとき、\(\bs{L}\) は \(\bs{K}\) のべき根拡大である。


でした。このことを証明した論理展開は、次のようでした。


次の条件があるとする。
\(\bs{L}\) は \(\bs{K}\) の代数拡大体であり、拡大次元は \(n\) である。
\(\bs{K}\) には \(1\) の原始\(n\)乗根が含まれる。
\(\bs{L}/\bs{K}\) はガロア拡大である。
\(\mr{Gal}(\bs{L}/\bs{K})\) は巡回群である(=\(\bs{L}/\bs{K}\) は巡回拡大)

このとき、レゾルベント(分解式)を定義することで、
\(\alpha^n\) が \(\bs{K}\) の元であるような \(\bs{L}\) の元 \(\alpha\) が存在する。すなわち、\(x^n-a=0\:\:(a\in\bs{K})\) の解が \(\alpha\in \bs{L}\)
このとき \(\bs{L}=\bs{K}(\alpha)\) になり、従って \(\bs{L}/\bs{K}\) はべき根拡大
となる。


つまり、レゾルベントを使って、巡回拡大=べき根拡大(但し、体に \(1\) の原始\(n\)乗根が含まれることが条件)を証明したわけです。この証明プロセスを、具体的な3次方程式で順にたどります。まず、3次方程式のガロア群を再度整理します。

3次方程式のガロア群
3次方程式のガロア群は「1.3 ガロア群」で計算しましたが、改めて書きます。3次方程式のガロア群は、3次方程式の3つの解、\(\alpha,\:\beta,\gamma\) を入れ替える(置換する)群であり、一般的には、

 \(G=\{e,\:\sigma,\:\sigma^2,\:\tau,\:\sigma\tau ,\:\sigma^2\tau\}\)

です。3つの解をそれぞれ \(1,\:2,\:3\) の文字で表し、巡回置換の記法(6.5節)で書くと、
 \(\sigma\) \(=(1,\:2,\:3)\)
 \(\sigma^2\) \(=(1,\:3,\:2)\)
 \(\tau\) \(=(2,\:3)\)
 \(\sigma\tau \) \(=(1,\:2)\)
 \(\sigma^2\tau\) \(=(1,\:3)\)
で(\(\sigma,\:\tau\) の演算は右から行う)、これは3次の対称群(\(S_3\)。6.5節)です。この群はもちろん可換群ではなく \(\tau\sigma \neq\sigma \tau\) ですが、\(\tau\sigma \) を計算すると、
 \(\tau\sigma =(1,\:3)\)
であり、
 \(\tau\sigma =\sigma^2\tau\)
との関係が成り立っています。これを "弱可換性" と呼ぶことにします(ここだけの用語です)。ここで、

 \(H=\{e,\:\sigma,\:\sigma^2\}\)

という \(G\) の部分群を考えると、\(H\) は巡回群であると同時に \(G\) の正規部分群です。"弱可換性" を使って検証してみると、
\(\begin{eqnarray}
&&\:\:\tau H&=\{\tau,\:\tau\sigma ,\:\tau\sigma ^2\}\\
&&&=\{\tau,\:\sigma^2\tau,\:\sigma^2\tau\sigma \}\\
&&&=\{\tau,\:\sigma^2\tau,\:\sigma^4\tau\}\\
&&&=\{\tau,\:\sigma^2\tau,\:\sigma\tau \}\\
&&&=\{\tau,\:\sigma\tau ,\:\sigma^2\tau\}\\
&&&=H\tau\\
\end{eqnarray}\)
となります。つまり、
 \(\tau H=H\tau\)
です。さらに、この式に左から \(\sigma\) をかけると、
 \(\sigma\tau H=\sigma H\tau\)
ですが、\(H\) のすべての元は \(\sigma\) で表現できるので、\(\sigma H=H\sigma\) です。従って、
 \(\sigma\tau H=H\sigma\tau \)
であり、同様にして、
 \(\sigma^2\tau H=H\sigma^2\tau\)
も分かります。つまり、任意の \(\bs{G}\) の元 \(\bs{x\in G}\) について、\(\bs{xH=Hx}\) が成り立つので \(H\) は \(G\) の正規部分群です。

\(G\) の \(H\) による剰余群は、
 \(G/H=\{H,\tau H\}\)
であり、単位元は \(H\) で、
 \((\tau H)^2=\tau H\tau H=\tau\tau HH=H\)
となる、位数\(2\) の巡回群です(\(G/H\cong C_2)\)。この結果、

 \(G\:\supset\:H\:\supset\:\{\:e\:\}\)

は可解列になり、\(G\) は可解群で、従って3次方程式は可解です(=四則演算とべき根で解が表現可能)。この節ではそれを具体例で確認していきます。



一方、「3.3 線形空間」の「代数拡大体の構造」で書いたように、3次方程式のガロア群が \(S_3\) ではなく、位数 \(3\) の巡回群( \(C_3\) )になる場合があります。それを再度整理します。

\(x^3+ax^2+bx+c=0\) の3次方程式は、\(x=X-\dfrac{a}{3}\) とおくと、
 \(X^3+\left(b-\dfrac{a^2}{3}\right)X+\left(\dfrac{2}{27}a^3-\dfrac{1}{3}ab+c\right)=0\)
となって、2乗の項が消えます。従って以降、3次方程式を、
 \(x^3+px+q=0\)
の形で扱います。
 \(f(x)=x^3+px+q\)
とおき、\(f(x)\) は既約多項式とします。3次方程式の根を \(\alpha,\:\beta,\:\gamma\) とすると、
 \(x^3+px+q=(x-\alpha)(x-\beta)(x-\gamma)\)
であり、根と係数の関係から、
 \(\alpha+\beta+\gamma=0\)
 \(\alpha\beta +\beta\gamma +\gamma\alpha =p\)
 \(\alpha\beta \gamma=-q\)
です。3次方程式のガロア群が \(S_3\) か \(C_3\) かを決めるポイントとなるのは、

 \(\theta=(\alpha-\beta)(\beta-\gamma)(\gamma-\alpha)\)

で定義される、根の差積と呼ばれる値です。差積は普通、\(\Delta\)(ギリシャ文字・デルタの大文字)で表しますが、後の説明の都合で \(\theta\) と書きます。差積は、任意の2つの根の互換で \(-\theta\) となるので、3つの根を \(\alpha,\:\beta,\:\gamma\) に割り当てる方法によって、\(\theta\) は2つの値をとり得ます。差積の2乗が判別式であり、

 \(D=(\alpha-\beta)^2(\beta-\gamma)^2(\gamma-\alpha)^2\)

です。つまり \(\theta=\sqrt{D}\) と書けますが、\(\sqrt{D}\) は「2乗して \(D\) となる2つの数のどちらか」の意味です。\(D\) は \(\alpha,\:\beta,\:\gamma\) の任意の置換で不変な対称式なので、3次方程式の係数である \(p,\:q\) で表すことができる有理数です。

その \(D\) を方程式の係数で表すために、\(f(x)\) を微分します。
 \(f(x)=(x-\alpha)(x-\beta)(x-\gamma)\)
なので、
\(\begin{eqnarray}
&&\:\:f'(x)=&(x-\alpha)(x-\beta)+(x-\beta)(x-\gamma)+\\
&&&(x-\gamma)(x-\alpha)\\
\end{eqnarray}\)
であり、
 \(f'(\alpha)=(\alpha-\beta)(\alpha-\gamma)\)
 \(f'(\beta)=(\beta-\gamma)(\beta-\alpha)\)
 \(f'(\gamma)=(\gamma-\alpha)(\gamma-\beta)\)
となります。従って、
 \(D=-f'(\alpha)f'(\beta)f'(\gamma)\)
です。一方、
 \(f'(x)=3x^2+p\)
なので、
 \(D=-(3\alpha^2+p)(3\beta^2+p)(3\gamma^2+p)\)
となります。ここからの計算を進めるために、次の2つの対称式を、根と係数の関係を使って \(p\) で表しておきます。
 ・\(\alpha^2+\beta^2+\gamma^2\)
   \(=(\alpha+\beta+\gamma)^2-2(\alpha\beta +\beta\gamma +\gamma\alpha )\)
   \(=-2p\)
 ・\(\alpha^2\beta^2+\beta^2\gamma^2+\gamma^2\alpha^2\)
   \(=(\alpha\beta +\beta\gamma +\gamma\alpha )^2-2\alpha\beta \gamma(\alpha+\beta+\gamma)\)
   \(=p^2\)
これを用いると、
\(\begin{eqnarray}
&&\:\:D&=&-(3\alpha^2+p)(3\beta^2+p)(3\gamma^2+p)\\
&&&=&-27(\alpha\beta \gamma)^2-9(\alpha^2\beta^2+\beta^2\gamma^2+\gamma^2\alpha^2)p\\
&&&&-3(\alpha^2+\beta^2+\gamma^2)p^2-p^3\\
&&&=&-27q^2-9\cdot p^2\cdot p-3\cdot(-2p)\cdot p^2-p^3\\
&&&=&-4p^3-27q^2\\
\end{eqnarray}\)
と計算できます。つまり、

 \(D=-4p^3-27q^2\)

です。ここでもし、\(D\) がある有理数 \(a\) の2乗(\(D=a^2\))なら、

 \(\theta=\sqrt{D}=\pm a\)

となり、\(\theta\) は有理数です。\(\theta\) が有理数(\(\theta=\pm a\))の場合、
 \(f'(\alpha)=(\alpha-\beta)(\alpha-\gamma)\)
 \(f'(\alpha)=3\alpha^2+p\)
の関係があるので、
\(\begin{eqnarray}
&&\:\:\theta&=(\alpha-\beta)(\beta-\gamma)(\gamma-\alpha)\\
&&&=-f'(\alpha)(\beta-\gamma)\\
&&&=-(3\alpha^2+p)(\beta-\gamma)\\
\end{eqnarray}\)
ですが、\(\theta=\pm a\) なので、
 \(\beta-\gamma=\pm\dfrac{a}{3\alpha^2+p}\)
です。この式と、根と係数の関係である、
 \(\beta+\gamma=-\alpha\)
を使うと、\(\bs{\beta}\)\(\bs{\gamma}\)\(\bs{\alpha}\) の有理式(=分母・分子が \(\bs{\alpha}\) の多項式)で表現できることになります。計算すると(\(\pm\)は省略して)、
 \(\beta=\dfrac{2p\alpha+3q-a}{2(3\alpha^2+p)}\)
 \(\gamma=\dfrac{2p\alpha+3q+a}{2(3\alpha^2+p)}\)
です(\(\beta\) と \(\gamma\) は逆でもよい)。\(\beta,\:\gamma\) が \(\alpha\) の有理式で表現できるので、
 \(\bs{Q}(\alpha,\beta,\gamma)\subset\bs{Q}(\alpha)\)
であり、もちろん \(\bs{Q}(\alpha,\beta,\gamma)\supset\bs{Q}(\alpha)\) なので。

 \(\bs{Q}(\alpha,\beta,\gamma)=\bs{Q}(\alpha)\)

です。\(\bs{Q}(\alpha)\) のところは \(\bs{Q}(\beta)\) や \(\bs{Q}(\gamma)\) とすることができます。

つまり、\(\bs{Q}\) 上の既約多項式 \(f(x)=x^3+px+q\) の最小分解体 \(\bs{L}=\bs{Q}(\alpha,\beta,\gamma)\) は、方程式の解の一つである \(\alpha\) の(または \(\beta,\:\gamma\) の)単拡大体であり、単拡大体の基底の定理(33F)により \(\bs{L}\) の次元は \(3\) です。すると次数と位数の同一性52B)により、\(G=\mr{Gal}(\bs{L}/\bs{Q})\) の群位数は \(3\) です。従って、ラグランジュの定理41E)により群位数が素数の群は巡回群なので、\(G\) は群位数 \(3\) の巡回群( \(C_3\) )です。



以上をまとめると、3次方程式の最小分解体のガロア群は、次のようになります。

前提として、

 ・\(f(x)=x^3+px+q\:\:(p,\:q\in\bs{Q})\)
  ( \(f(x)\) は既約多項式 )
 ・\(f(x)=0\) の解を \(\alpha,\:\beta,\:\gamma\)
 ・\(\theta=(\alpha-\beta)(\beta-\gamma)(\gamma-\alpha)\)
 ・\(f(x)\) の最小分解体を \(\bs{L}=\bs{Q}(\alpha,\beta,\gamma)\)
 ・\(G=\mr{Gal}(\bs{L}/\bs{Q})\)

とする。この前提のもとで、

\(\bs{\theta}\):有理数のとき
 \(G\cong C_3\)
  \(G=\{\:e,\:\sigma,\:\sigma^2\:\}\)
    \(\sigma=(1,\:2,\:3)\)
  \(G\) は巡回群なので可解群

\(\bs{\theta}\):有理数でないとき
 \(G\cong S_3\)
  \(G=\{e,\:\sigma,\:\sigma^2,\:\tau,\:\sigma\tau ,\:\sigma^2\tau\}\)
    \(\sigma=(1,\:2,\:3)\:\:\tau=(2,\:3)\)
  \(H=\{e,\:\sigma,\:\sigma^2\}\) は \(G\) の正規部分群
  \(G\:\supset\:H\:\:\supset\:\{\:e\:\}\) は可解列
    \(G/H\)\(=\{H,\:\tau H\}\)\(\cong C_2\)
    \(H/{e}\)\(=H\)\(\cong C_3\)
  \(G\) は可解群

なお、\((1,\:2,\:3)\:\:(2,\:3)\) の巡回置換は \((1,\:3,\:2)\:\:(1,\:2)\:\:(1,\:3)\) などとしても同じです。

\(C_3\::\:x^3-3x+1\)
まずガロア群が \(C_3\) の方程式 \(x^3-3x+1\) を取り上げ、巡回拡大がべき根拡大になる原理を確認します。この原理はガロア群が \(S_3\) のときにもそのまま応用できます。

\(x^3-3x+1=0\) の場合、\(p=-3,\:q=1\) なので、
\(\begin{eqnarray}
&&\:\:D&=-4p^3-27q^2=81=9^2\\
&&\:\:\theta&=\pm9\\
\end{eqnarray}\)
となります。3つの解を \(\alpha,\:\beta,\:\gamma\) とすると、
 \(\bs{L}=\bs{Q}(\alpha,\beta,\gamma)=\bs{Q}(\alpha)=\bs{Q}(\beta)=\bs{Q}(\gamma)\)
で、\(\bs{L}\) の次元は \(3\) で、\(G=\mr{Gal}(\bs{L}/\bs{Q})\cong C_3\) です。

以下「7.3 べき根拡大の十分条件」の証明の論理に沿います。7.3 の証明では、体に \(1\) の原始\(n\)乗根が含まれているのが条件でした。そこで \(1\) の原始3乗根 を \(\omega\) とし、

 \(\bs{Q}(\omega)\:\subset\:\bs{Q}(\omega,\:\alpha)=\bs{L}(\omega)\)

という体の拡大を考えます。\(\omega\) は \(x^2+x+1=0\) の2つある根のどちらかで、
 \(\omega=\dfrac{1}{2}(-1\pm\sqrt{3}i)\)
です。7.3 ではラグランジュのレゾルベントを \(\alpha\) と書きましたが、方程式の根の表記との重複を避けるため、ここでは \(S\) とします。そうするとレゾルベントは、

 \(S=c+\omega^2\sigma(c)+\omega\sigma ^2(c)\)
 \((\br{A})\)

です。\(\bs{Q}(\omega,\:\alpha)\) は \(\bs{Q}(\omega)\) に \(\alpha\) を添加した単拡大体なので、べき根拡大の十分条件のため補題272B)に従って、\(c=\alpha\) と定めます。そうすると、
 \(S=\alpha+\omega^2\sigma(\alpha)+\omega\sigma ^2(\alpha)\)
となり、\(\alpha,\:\beta,\:\gamma\) で表すと、\((\br{A})\) 式は、

 \(S=\alpha+\omega^2\beta+\omega\gamma \)
 \((\br{B})\)

です。この \(S\) は \(\bs{Q}(\omega,\alpha,\beta,\gamma)\) の元ですが、
 \(\bs{Q}(\omega,\alpha,\beta,\gamma)=\bs{Q}(\omega,\alpha)\)
なので、\(S\) は \(\bs{Q}(\omega,\alpha)\) の元であり、ということは、
 \(\bs{Q}(\omega,\:S)\subset\bs{Q}(\omega,\alpha)\)
です。方程式の3つの解を \(\alpha,\:\beta,\:\gamma\) に割り当てる方法の数(\(=3!\) )により、\(S\) は6通りの可能性があります。

7.3 での証明のポイントは、\(\bs{S^3}\)\(\bs{\bs{Q}(\omega)}\) の元である、というところでした。それを計算で確かめるため、もうひとつのレゾルベントを導入します。ガロア群 \(G=\{e,\sigma,\sigma^2\}\) は、\(\sigma\) が生成元であると同時に、\(\sigma^2\) も生成元です。レゾルベントの定義における \(\sigma\) は \(G\) の生成元であることが条件でした(73A)。そこで \((\br{A})\) 式の \(\sigma\) を \(\sigma^2\) で置き換えた式を \(T\) とすると、
\(\begin{eqnarray}
&&\:\:T&=c+\omega^2\sigma^2(c)+\omega\sigma ^4(c)\\
&&&=c+\omega^2\sigma^2(c)+\omega\sigma (c)\\
\end{eqnarray}\)
となります。この式で \(c=\alpha\) とおくと

 \(T=\alpha+\omega\beta +\omega^2\gamma\)

です。\(S\) には6通りの可能性がありますが、\(S\) をそのうちの一つに決めると \(T\) は一意に決まります。ここで、
 \(\alpha+\omega^2\beta\)\(+\omega\gamma \)\(=S\)
 \(\alpha+\omega\beta \)\(+\omega^2\gamma\)\(=T\)
 \(\alpha+\beta\)\(+\gamma\)\(=0\) (根と係数の関係)
は \(\alpha,\:\beta,\:\gamma\) を未知数とする連立1次方程式なので、\(\alpha,\:\beta,\:\gamma\) を \(S\) と \(T\) の式で表せます。連立方程式を解くと、

 \(\alpha=\dfrac{1}{3}(S+T)\)
 \(\beta=\dfrac{1}{3}(\omega S+\omega^2T)\)
 \((\br{C})\)
 \(\gamma=\dfrac{1}{3}(\omega^2S+\omega T)\)

です。さらに、\(S\) と \(T\) には特別の関係があります。
 \(ST=(\alpha+\omega^2\beta+\omega\gamma )(\alpha+\omega\beta +\omega^2\gamma)\)
という式を考えると、
\(\begin{eqnarray}
&&\:\:ST&=&\alpha^2+\beta^2+\gamma^2+\\
&&&&(\omega^2+\omega)\alpha\beta +(\omega^4+\omega^2)\beta\gamma +(\omega^2+\omega)\gamma\alpha \\
&&&=&(\alpha+\beta+\gamma)^2-2(\alpha\beta +\beta\gamma +\gamma\alpha )+\\
&&&&(-\alpha\beta -\beta\gamma -\gamma\alpha )\\
&&&=&-3(\alpha\beta +\beta\gamma +\gamma\alpha )\\
&&&=&-3p\\
\end{eqnarray}\)
となり、つまり、

 \(ST=-3p\)
 \((\br{D})\)

という関係です。上の式の変形では、根と係数の関係と \(\omega^2+\omega+1=0\)、および \(\omega^3=1\) を使いました。

次に、\(S^3\) を求めるために \(S^3+T^3\) を計算してみると、
\(\begin{eqnarray}
&&\:\:S^3+T^3&=(S+T)(S^2-ST+T^2)\\
&&&=(S+T)(S+\omega T)(S+\omega^2T)\\
\end{eqnarray}\)
です。ここで \((\br{C})\) 式を変形すると、
 \(3\alpha\)\(=S+T\)
 \(3\omega^2\beta\)\(=S+\omega T\)
 \(3\omega\gamma \)\(=S+\omega^2T\)
が得られるので、
\(\begin{eqnarray}
&&\:\:S^3+T^3&=3\alpha\cdot 3\omega^2\beta\cdot 3\omega\gamma \\
&&&=27\alpha\beta \gamma=-27q\\
\end{eqnarray}\)
となります。まとめると、
 \(S^3+T^3=-27q\)
 \(ST=-3p\)
であり、
 \(S^3-\dfrac{27p^3}{S^3}+27q=0\)
です。つまり、

 \((S^3)^2+27qS^3-27p^3=0\)
 \((\br{E})\)

という \(S^3\) についての2次方程式を解くことで \(S^3\) が求まり、そこから \(S\) が求まります。\(S\) の値の可能性は6通りです。また \(T^3\) についても、

 \((T^3)^2+27qT^3-27p^3=0\)
 \((\br{E}')\)

が成り立ちます。2次方程式、

 \(X^2+27qX-27p^3=0\)
 \((\br{F})\)

の2つの解が \(S^3\) と \(T^3\) です。



ここまでの計算は \(x^3+px+q=0\) の形の既約方程式なら成り立ちます。ここで \(x^3-3x+1=0\) に即した、\(p=-3,\:q=1\) を \((\br{E})\) 式に入れると、

 \((S^3)^2+27S^3+27^2=0\)

\(\begin{eqnarray}
&&\:\:S^3&=\dfrac{1}{2}\left(-27\pm\sqrt{27^2-4\cdot27^2}\right)\\
&&&=27\dfrac{-1\pm i\sqrt{3}}{2}\\
&&&=27\omega\\
\end{eqnarray}\)

となります。最後の式の \(\omega\) は、2つある \(1\) の原始3乗根のどちらか、という意味にとらえます。\(S^3=27\omega\) なら \(T^3=27\omega^2\) で、その逆でもよいわけです。

\((\br{C})\) 式と \((\br{D})\) 式により、\(\alpha\) は \(S\) と \(\omega\) の四則演算で表現できます。つまり、
 \(\bs{Q}(\omega,\alpha)\subset\bs{Q}(\omega,\:S)\)
です。従って、さきほどの \(\bs{Q}(\omega,\:S)\subset\bs{Q}(\omega,\:\alpha)\) と合わせると、
 \(\bs{Q}(\omega,\:S)=\bs{Q}(\omega,\:\alpha)\)
です。以上をまとめると、レゾルベント \(S\) について、
\(\begin{eqnarray}
&&\:\:S^3&\in\bs{Q}(\omega)\\
&&\:\:S&\in\bs{Q}(\omega,\:S)=\bs{Q}(\omega,\:\alpha)\\
\end{eqnarray}\)
です。つまり、

\(\bs{Q}(\omega)\) 上の方程式、
  \(x^3-a=0\:\:(\:a=27\omega\in \bs{Q}(\omega)\:)\)
の解の一つ、\(\sqrt[3]{a}\) を \(\bs{Q}(\omega)\) に添加したのが \(\bs{Q}(\omega,\:\alpha)\)

であり、\(\bs{\bs{Q}(\omega,\:\alpha)}\)\(\bs{\bs{Q}(\omega)}\) のべき根拡大体であることがわかりました。\(\bs{Q}(\omega,\:\alpha)\) は \(x^3-a=0\) の解、\(\sqrt[3]{a},\:\sqrt[3]{a}\:\omega,\:\sqrt[3]{a}\:\omega^2\) の全部を含むので、\(\bs{Q}(\omega)\) のガロア拡大体です。結論として、

方程式 \(x^3-3x+1=0\) の解は、
有理数
\(\omega\)(\(1\) の原始3乗根)
\(\sqrt[3]{a}\:\:(\:a\in\bs{Q}(\omega)\:)\)
の四則演算で表現できる

ことになります。\(x^3-3x+1=0\) の場合、\(a=27\omega\) です。



巡回拡大がべき根拡大になることの証明のフォローはここまでですが、\(x^3-3x+1=0\) の解を具体的に求めることもできます。\(S^3=27\omega\) から、\(S=3\cdot\sqrt[3]{\omega}\) であり、また \(ST=9\) なので、
\(\begin{eqnarray}
&&\:\:\alpha&=\dfrac{1}{3}(S+T)=\dfrac{1}{3}\left(S+\dfrac{9}{S}\right)\\
&&&=\sqrt[3]{\omega}+\dfrac{1}{\sqrt[3]{\omega}}=\sqrt[3]{\omega}+\sqrt[3]{\omega^2}\\
&&&=\sqrt[3]{-\dfrac{1}{2}+\dfrac{\sqrt{3}}{2}i}+\sqrt[3]{-\dfrac{1}{2}-\dfrac{\sqrt{3}}{2}i}\\
\end{eqnarray}\)

が解の一つです。「1.3 ガロア群」の「ガロア群の例」に書いたように、

 \(\alpha=1.53208888623796\:\cdots\)

であり、正真正銘の正の実数ですが、\(\bs{\alpha}\) をべき根で表わそうとすると虚数単位が登場します。その理由がガロア理論から分かるのでした。

\(S_3\::\:x^3+px+q\)
方程式 \(x^3+px+q=0\) の係数を変数のままで扱い、ガロア群が \(S_3\) の方程式の一般論として話を進めます。3つの根を \(\alpha,\:\beta,\:\gamma\) とし(置換での表示では、それぞれ \(1,\:2,\:3\))、差積 \(\theta\) を、

\(\begin{eqnarray}
&&\:\:\theta&=(\alpha-\beta)(\beta-\gamma)(\gamma-\alpha)\\
&&&=\sqrt{D}\\
&&\:\:D&=-4p^3-27q^2\\
\end{eqnarray}\)

と定義すると、\(\bs{\theta}\) が有理数でないとき

\(G\cong S_3\)
 \(G=\{e,\:\sigma,\:\sigma^2,\:\tau,\:\sigma\tau ,\:\sigma^2\tau\}\)
   \(\sigma=(1,\:2,\:3)\:\:\tau=(2,\:3)\)
 \(H=\{e,\:\sigma,\:\sigma^2\}\) は \(G\) の正規部分群
 \(G\:\supset\:H\:\:\supset\:\{\:e\:\}\) は可解列
   \(G/H=\{H,\:\tau H\}\cong C_2\)
   \(H/{\:e\:}=H\cong C_3\)
 \(G\) は可解群

となります(前述)。\(G\cong S_3\) は巡回群ではありません。しかし可解群なので "巡回群の入れ子構造" になっていて(=可解列が存在する)、「巡回拡大はべき根拡大」の定理(73A)を2段階に使うことで、方程式の解が四則演算とべき根で表現できることを証明できます。

まず、上記の可解列とガロア対応53B)になっている「体の拡大列」は何かです。具体的には \(H\) の固定体は何かですが、それは \(\bs{Q}(\theta)\) です。実際、
 \(\sigma(\theta)=\theta,\:\:\sigma^2(\theta)=\theta\)
なので、\(H\) のすべての元は \(\bs{Q}(\theta)\) の元を固定します。また、
 \(\tau(\theta)=-\theta\)
なので、\(\tau\)(および \(\sigma\tau ,\:\sigma^2\tau\))は \(\bs{Q}(\theta)\) の元 を固定しません。従って、\(H\) の固定体は \(\bs{Q}(\theta)\) です。つまり、\(\bs{L}=\bs{Q}(\alpha,\beta,\gamma)\) と書くと、

 \(G\:\supset\:H\:\)\(\:\supset\:\{\:e\:\}\)
 \(\bs{Q}\:\subset\:\bs{Q}(\theta)\:\)\(\:\subset\:\bs{L}\)

というガロア対応になっています。

次に体の拡大次元を検証します。まず、\(|G|=6\) なので、次数と位数の同一性52B)により、\(\bs{L}/\bs{Q}\) の拡大次数は、
 \([\:\bs{L}:\bs{Q}\:]=6\)
です。\(\bs{Q}(\theta)\) は \(\bs{Q}\) 上の既約な2次方程式、
 \(x^2-D=0\)
の解である \(\theta\) で \(\bs{Q}\) を単拡大した体なので、単拡大体の基底の定理(33F)により、
 \([\:\bs{Q}(\theta):\bs{Q}\:]=2\)
です。そうすると、拡大次数の連鎖律33H)により、
 \([\:\bs{L}:\bs{Q}\:]=[\:\bs{L}:\bs{Q}(\theta)\:]\cdot[\:\bs{Q}(\theta):\bs{Q}\:]\)
 \([\:\bs{L}:\bs{Q}(\theta)\:]=3\)
となるはずです。\([\:\bs{L}:\bs{Q}(\theta)\:]=3\) であることを、具体的な体の拡大の様子を検証することで確かめます。2つのことを証明します。

\(\bs{L}=\bs{Q}(\alpha,\beta,\gamma)\) とするとき、\(\bs{Q}(\theta,\alpha)=\bs{L}\) である。

[証明]

\(\theta=(\alpha-\beta)(\beta-\gamma)(\gamma-\alpha)\) だから、\(\theta\) は \(\alpha,\:\beta,\:\gamma\) で表現されている。従って
 \(\bs{Q}(\theta,\alpha)\:\subset\:\bs{Q}(\alpha,\beta,\gamma)\)
である。この逆である、
 \(\bs{Q}(\alpha,\beta,\gamma)\:\subset\:\bs{Q}(\theta,\alpha)\)
であることを証明する。そのためには \(\beta,\:\gamma\) が「有理数と \(\theta,\:\alpha\) の四則演算」で表現できることを示せばよい。根と係数の関係により、
 \(\beta+\gamma=-\alpha\)
 \((\br{G})\)
 \(\beta\gamma =-\dfrac{q}{\alpha}\)
である。これを利用して \(\theta\) の定義式を変形すると、
\(\begin{eqnarray}
&&\:\:\theta=&(\alpha-\beta)(\beta-\gamma)(\gamma-\alpha)\\
&&&=(\beta-\gamma)(-\alpha^2+(\beta+\gamma)\alpha-\beta\gamma )\\
&&&=(\beta-\gamma)\left(-\alpha^2-\alpha^2+\dfrac{q}{\alpha}\right)\\
&&&=(\beta-\gamma)\dfrac{-2\alpha^3+q}{\alpha}\\
\end{eqnarray}\)
となり、
 \(\beta-\gamma=\dfrac{\alpha\theta }{q-2\alpha^3}\)
 \((\br{H})\)
である。\((\br{G})\) 式と \((\br{H})\) 式は \(\beta\) と \(\gamma\) についての連立1次方程式なので解が求まり、\(\beta\) と \(\gamma\) は \(\alpha,\:\theta,\:q\) の四則演算で表現できる。従って、
 \(\bs{Q}(\alpha,\beta,\gamma)\:\subset\:\bs{Q}(\theta,\alpha)\)
であり、\(\bs{Q}(\theta,\alpha)\:\subset\:\bs{Q}(\alpha,\beta,\gamma)\) と合わせて、
 \(\bs{Q}(\theta,\alpha)=\bs{Q}(\alpha,\beta,\gamma)\)
である。[証明終]

\(x^3+px+q\) は \(\bs{\bs{Q}(\theta)}\) 上の既約多項式である。

[証明]

\(\bs{Q}\) 上の既約な3次方程式 \(x^3+px+q=0\) の解 \(\alpha\) による \(\bs{Q}\) の単拡大体 \(\bs{Q}(\alpha)\) を考えると、単拡大体の基底の定理(33F)により、
 \([\:\bs{Q}(\alpha):\bs{Q}\:]=3\)
である。従って \(\alpha\notin \bs{Q}(\theta)\) である。なぜなら、もし \(\alpha\in \bs{Q}(\theta)\) なら \(\bs{Q}(\theta)\) の次元は \(3\) 以上になるが、\([\:\bs{Q}(\theta):\bs{Q}\:]=2\) なので矛盾が生じるからである。同様に、\(\beta,\:\gamma\notin \bs{Q}(\theta)\) である。\(x^3+px+q\) は、
 \(x^3+px+q=(x-\alpha)(x-\beta)(x-\gamma)\)
と表されるから、\(x^3+px+q\) は \(\bs{Q}(\theta)\) 上では因数分解できない。つまり \(x^3+px+q\) は \(\bs{Q}(\theta)\) 上の既約多項式である。[証明終]



以上により、

\(\bs{L}=\bs{Q}(\alpha,\beta,\gamma)\) は、\(\bs{\bs{Q}(\theta)}\) 上の既約な3次方程式 \(x^3+px+q=0\) の解の一つである \(\alpha\) を \(\bs{Q}(\theta)\) に添加した単拡大体、\(\bs{L}=\bs{Q}(\theta,\alpha)\) であり、その拡大次数は \([\:\bs{L}:\bs{Q}(\theta)\:]=\:3\) である

ことが検証できました。これを踏まえて、3次方程式が解ける理由をガロア理論で説明します。ガロア対応である、

 \(G\:\supset\:H\:\)\(\:\supset\:\{\:e\:\}\)
 \(\bs{Q}\:\subset\:\bs{Q}(\theta)\:\)\(\:\subset\:\bs{L}\)

を2つの部分に分けます。

 \(\bs{Q}\:\subset\:\bs{Q}(\theta)\) 

\(\mr{Gal}(\bs{Q}(\theta)/\bs{Q})\cong G/H\cong C_2\) であり、\(\bs{Q}(\theta)/\bs{Q}\) は巡回拡大で、拡大次数は \(2\) です。\(1\) の原始2乗根は \(-1\) であり、\(\bs{Q}\) に含まれています。従って \(\bs{Q}(\theta)/\bs{Q}\) はべき根拡大です。具体的には、
 \(x^2-D=0\:\:(D\in\bs{Q})\)
  \(D=-4p^3-27q^2\)
の解が \(\theta\) であり、
 \(\theta=\sqrt{D}=\sqrt{-4p^3-27q^2}\)
です。これはレゾルベントを持ち出すまでもなく分かります。

 \(\bs{Q}(\theta)\:\subset\:\bs{L}\) 

\(\mr{Gal}(\bs{L}/\bs{Q}(\theta))=H\cong C_3\) であり、\(\bs{L}/\bs{Q}(\theta)\) は巡回拡大で、拡大次数は \(3\) です。また \(\bs{L}\) は \(\bs{Q}(\theta)\) 上の既約な3次方程式 \(x^3+px+q=0\) の解の一つである \(\alpha\) を \(\bs{Q}(\theta)\) に添加した単拡大体で、\(\bs{L}=\bs{Q}(\theta,\alpha)\) でした。

\(\bs{Q}(\theta)\) には(一般には)\(1\) の原始3乗根が含まれていません。そこで、\(\bs{L}/\bs{Q}(\theta)\) の体の拡大の代わりに、\(\bs{L}(\omega)/\bs{Q}(\omega,\theta)\) という拡大を考えます。
 \(\bs{L}(\omega)=\bs{Q}(\omega,\theta,\alpha)\)
 \([\:\bs{Q}(\omega,\theta,\alpha):\bs{Q}(\omega,\theta)\:]=3\)
 \((\br{I})\)
です。

方程式によっては \(\theta\in \bs{Q}(\omega)\) の場合があります。たとえば、\(p=0\) だと、
\(\theta=\sqrt{-27q^2}=3\sqrt{3}i\cdot q\)
ですが、\(\omega=\dfrac{1}{2}(-1\pm\sqrt{3}i)\) なので、\(\theta\in \bs{Q}(\omega)\) です。この場合は、
\(\bs{Q}(\omega,\theta)=\bs{Q}(\omega)=\bs{Q}(\theta)\)
ですが、\((\br{I})\) 式は成り立ちます。

レゾルベント \(S,\:T\) を導入して \(S^3\) と \(T^3\) を求めます。計算は、方程式 \(x^3-3x+1=0\) のときと全く同じです。つまり、

 \(S=\alpha+\omega^2\beta+\omega\gamma \)
 \((\br{B})\)
 \(T=\alpha+\omega\beta +\omega^2\gamma\)
 \(ST=-3p\)
 \((\br{D})\)
 \(S^3+T^3=-27q\)

 \(\alpha=\dfrac{1}{3}(S+T)\)
 \(\beta=\dfrac{1}{3}(\omega S+\omega^2T)\)
 \((\br{C})\)
 \(\gamma=\dfrac{1}{3}(\omega^2S+\omega T)\)

 \(X^2+27qX-27p^3=0\)
 \((\br{F})\)
 の2つの解が \(S^3\) と \(T^3\)

です。方程式 \(x^3-3x+1=0\) の場合、\(\bs{L}(\omega)\) は \(\bs{Q}(\omega)\) からの巡回拡大でしたが、\(x^3-3p+1q=0\) では \(\bs{Q}(\omega,\theta)\) からの巡回拡大であり、ガロア群が位数 \(3\) の巡回群であるという点では全く同じなのです。

\((\br{F})\) 式から \(X\) を求めると、
\(\begin{eqnarray}
&&\:\:X&=\dfrac{1}{2}\left(-27q\pm\sqrt{27^2q^2+27\cdot4p^3}\right)\\
&&&=\dfrac{1}{2}\left(-27q\pm\sqrt{-27\theta^2}\right)\\
&&&=\dfrac{1}{2}(-27q\pm3\sqrt{3}i\cdot\theta )\\
\end{eqnarray}\)
となるので、
 \(S^3=\dfrac{1}{2}(-27q+3\sqrt{3}i\cdot\theta )\)
 \(T^3=\dfrac{1}{2}(-27q-3\sqrt{3}i\cdot\theta )\)
となります。\(S^3\) と \(T^3\) は逆でもかまいません。\(\omega\) は \(1\) の原始3乗根で、
 \(\omega=\dfrac{1}{2}(-1\pm\sqrt{3}i)\)
のどちらかです。従って、
 \(\sqrt{3}i\in\bs{Q}(\omega,\theta)\)
です。つまり、
 \(S^3,\:\:T^3\in\bs{Q}(\omega,\theta)\)
であることがわかりました。従って、\(S,\:T\) は \(\bs{Q}(\omega,\theta)\) 上の3次方程式、\(x^3-a=0\:\:(a\in\bs{Q}(\omega,\theta))\) の解ということになり、\(\bs{Q}(\omega,\theta,\:S)/\bs{Q}(\omega,\theta)\) の体の拡大を考えると、
 \([\:\bs{Q}(\omega,\theta,\:S):\bs{Q}(\omega,\theta)\:]=3\)
 \((\br{J})\)
です。\(\bs{Q}(\omega,\theta,\:S)\) は \(\bs{Q}(\omega,\theta,\:T)\) としても同じことです。ここで、

 \(\bs{Q}(\omega,\theta,\:S)=\bs{Q}(\omega,\theta,\:\alpha)\)

であることが次のようにして分かります。つまり、\(\bs{Q}(\omega,\theta)\) 上の既約な3次方程式 \(x^3+px+q=0\) の解が \(\alpha,\:\beta,\:\gamma\) であり、\((\br{B})\) 式により \(S\) は \(\alpha,\:\beta,\:\gamma,\:\omega\) の四則演算で表されているので、
 \(S\in\bs{Q}(\omega,\theta,\alpha,\beta,\gamma)\)
であり、また、
 \(\bs{Q}(\omega,\theta,\alpha,\beta,\gamma)=\bs{Q}(\omega,\theta,\alpha)\)
だったので、
 \(S\in\bs{Q}(\omega,\theta,\alpha)\)
です。このことから、
 \(\bs{Q}(\omega,\theta,\:S)\subset\bs{Q}(\omega,\theta,\:\alpha)\)
 \((\br{K})\)
です。\((\br{I})\) 式と \((\br{J})\) 式により、\(\bs{Q}(\omega,\theta,\:S)\) と \(\bs{Q}(\omega,\theta,\:\alpha)\) の次元は等しく、かつ \((\br{K})\) 式の関係があるので、体の一致の定理(33I)により2つの体は一致し、
 \(\bs{Q}(\omega,\theta,\:S)=\bs{Q}(\omega,\theta,\:\alpha)\)
です。



この説明は「7.3 べき根拡大の十分条件」の証明に従いましたが、3次方程式の場合は、\((\br{C})\) 式と \((\br{D})\) 式により、\(\alpha,\:\beta,\:\gamma\) が \(S\) と \(\omega\) の四則演算で表現できます。従って、
 \(\bs{Q}(\omega,\theta,\alpha,\beta,\gamma)\subset\bs{Q}(\omega,\theta,S)\)
 \(\bs{Q}(\omega,\theta,\alpha)\subset\bs{Q}(\omega,\theta,S)\)
であり、
 \(\bs{Q}(\omega,\theta,S)\subset\bs{Q}(\omega,\theta,\alpha)\)
と合わせて
 \(\bs{Q}(\omega,\theta,\:S)=\bs{Q}(\omega,\theta,\:\alpha)\)
である、とするのが簡便な説明になります。



以上をまとめると、

\(\bs{Q}(\omega,\theta)\) 上の3次方程式、\(x^3-a=0\:\:(a\in\bs{Q}(\omega,\theta))\) の解の一つ、\(S\) を \(\bs{Q}(\omega,\theta)\) に添加したべき根拡大体が \(\bs{Q}(\omega,\theta,\alpha)=\bs{L}(\omega)\) である

となり、体に \(\bs{\omega}\) が含まれる前提で、巡回拡大はべき根拡大であることが検証できました。ここから、\(\bs{L}(\omega)\) を \(\bs{Q}\) の拡大体として、方程式の係数 \(p,\:q\) を使って、できるだけ簡潔な形で表してみます。
\(\begin{eqnarray}
&&\:\:\theta&=\sqrt{-4p^3-27q^2}\\
&&&=6\cdot\sqrt{3}i\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}\\
\end{eqnarray}\)
ですが、\(\sqrt{3}i\in\bs{Q}(\omega)\) なので、
 \(\bs{Q}(\omega,\theta)=\bs{Q}\left(\omega,\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}\right)\)
と表せます。また、
\(\begin{eqnarray}
&&\:\:X^3&=\dfrac{1}{2}\left(-27q+\sqrt{27^2q^2+27\cdot4p^3}\right)\\
&&&=\dfrac{1}{2}\left(-27q+27\cdot2\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}\right)\\
&&&=27\left(-\dfrac{q}{2}+\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}\right)\\
\end{eqnarray}\)
なので、

 \(S=3\cdot\sqrt[3]{-\dfrac{q}{2}+\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\)
 \(T=3\cdot\sqrt[3]{-\dfrac{q}{2}-\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\)

が \(S,\:T\) です。\(\sqrt[3]{\phantom{I}\cdots\phantom{I}}\) は3乗して \(\cdots\) になる数の意味です。従って、\(S\) の選び方は3通りですが、\(S\) を一つに決めると、
 \(ST=-3p\)
が成り立つように \(T\) を選ぶ必要があります。以上の \(S\) を用いて \(\bs{L}(\omega)\) を表すと、

 \(\bs{L}(\omega)\)
  \(=\bs{Q}(\omega,\theta,\alpha,\beta,\gamma)=\bs{Q}(\omega,\theta,\alpha)=\bs{Q}(\omega,\theta,S)\)
  \(=\bs{Q}\left(\omega,\:\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}},\:\sqrt[3]{-\dfrac{q}{2}+\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\right)\)

となります。この式が意味するところは、

\(\dfrac{q^2}{4}+\dfrac{p^3}{27}\) が有理数なので、\(\bs{L}(\omega)\) は \(\bs{Q}(\omega)\) からのべき根拡大を、\(\sqrt{\phantom{A}}\) と \(\sqrt[3]{\phantom{A}}\) の2回繰り返したものである

ということです。べき根拡大の出発点は 有理数に \(\omega\) を添加した体です。「7.1 1の原始n乗根」で証明したように、原始\(n\)乗根はべき根で表現可能であり(71A)、もちろん \(\omega\) もそうです。これが3次方程式が解ける原理(一般化するとガロア群が可解群である方程式が解ける原理)です。補足すると、\(p=0\) のときは、
 \(\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}=\pm\dfrac{q}{2}\in\bs{Q}\)
なので、べき根拡大は \(\sqrt[3]{\phantom{A}}\) の1回だけになります。



さらに、ここまでの計算で3次方程式の解も求まりました。解は、

\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&\alpha=\dfrac{1}{3}(S+T)&\\
&&\beta=\dfrac{1}{3}(\omega S+\omega^2T)&\\
&&\gamma=\dfrac{1}{3}(\omega^2S+\omega T)&\\
\end{eqnarray}
\end{array}\right.\)

であり、記号を、
 \(S=3s\)
 \(T=3t\)
に置き換えると、

3次方程式の解の公式

\(x^3+px+q=0\) の3つの解を \(\alpha,\:\beta,\:\gamma\) とする。

\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&\alpha=s+t&\\
&&\beta=\omega s+\omega^2t&\\
&&\gamma=\omega^2s+\omega t&\\
\end{eqnarray}
\end{array}\right.\)

  \(s=\sqrt[3]{-\dfrac{q}{2}+\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\)
  \(t=\sqrt[3]{-\dfrac{q}{2}-\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\)
  \(st=-\dfrac{p}{3}\)

が、3次方程式の解の公式です。



3次方程式の解による体の拡大を振り返ってみます。\(\bs{Q}\) 上の既約な方程式 \(x^3+px+q=0\) の根を \(\alpha,\:\beta,\:\gamma\) とし、\(\bs{Q}\) の最小分解体 を \(\bs{L}=\bs{Q}(\alpha,\beta,\gamma)\)、ガロア群を \(G=\mr{Gal}(\bs{L}/\bs{Q})\) とすると、
 \(\bs{Q}\:\subset\:\bs{Q}(\theta)\:\:\)\(\:\subset\:\bs{L}\)
 \(G\:\supset\:H\:\:\:\)\(\:\supset\:\{\:e\:\}\)
のガロア対応が成り立ちます。\(\bs{L}/\bs{Q}\) の拡大次数は \(6\)(\(|G|=6\))です。この、
 \(\bs{Q}\:\subset\:\bs{Q}(\theta)\:\subset\:\bs{L}\)
という体の拡大列で、\(\bs{Q}\:\subset\:\bs{Q}(\theta)\) のところはべき根拡大ですが、\(\bs{Q}(\theta)\:\subset\:\bs{L}\) は、\(\omega\in \bs{Q}(\theta)\) の場合を除き、べき根拡大ではありません。しかし、

 \(\bs{Q}(\omega)\:\subset\:\bs{Q}(\omega,\theta)\:\subset\:\bs{L}(\omega)\)

なら、必ず、すべてがべき根拡大になります。従って、3次方程式の解は \(\bs{Q}(\omega)\) の元である「有理数と \(\omega\)」の四則演算・べき根で記述できます。

\(\omega\) は \(x^2+x+1=0\) の解なので、\([\:\bs{Q}(\omega):\bs{Q}\:]=2\) です。従って、拡大次数の連鎖律33H)により、\(\omega\notin \bs{Q}(\theta)\) の条件で、
 \([\:\bs{L}(\omega):\bs{Q}\:]=12\)
です。これは、\(\bs{Q}\) 上の多項式 \((x^3+px+q)(x^2+x+1)\) の最小分解体が \(\bs{L}(\omega)\) なので、\(\bs{Q}\) からの拡大次数は \(12\) であるとも言えます。3次方程式の「解」は、あくまで \(\bs{Q}\) の \(6\)次拡大体 \(\bs{L}=\bs{Q}(\alpha,\beta,\gamma)\) の中にありますが、「べき根で表された解」は \(\bs{Q}\) の \(12\)次拡大体 \(\bs{L}(\omega)\) の中にあるのです。

一見、矛盾しているようですが、そうではありません。ある代数拡大体 \(\bs{K}\) があったとして、\(a\) を \(\bs{K}\) の元とし、\(1\) の原始3乗根の一つを \(\omega\) とします。3次方程式、
 \(x^3-a=0\:\:(a\in\bs{K})\)
は3つの解をもちます。そのうちのどれか一つを \(\sqrt[3]{a}\) と定義すると、3つの解(べき根)は、

 \(\sqrt[3]{a},\:\:\sqrt[3]{a}\:\omega,\:\:\sqrt[3]{a}\:\omega^2\)

です。\(\sqrt[3]{a}\) では \(\omega\) が不要なように見えますが、それは表面上のことで、3つの解は、

 \(\sqrt[3]{a}\:\omega,\:\:\sqrt[3]{a}\:\omega^2,\:\:\sqrt[3]{a}\:\omega^3\)

であるというのが正しい認識です。つまり \(\bs{\omega}\) は3つのべき根の関係性を規定していて、\(\sqrt[3]{a}\cdot\omega ^i\:\:(i=1,2,3)\) という "ペアの形" によって3つの区別が可能になり、数式としての整合性が保てます。\(\sqrt[3]{\phantom{A}}\) という "曖昧さ" がある記号を用いる限り、\(\omega\) という、曖昧さを解消する "助手" が必然的に登場するのです。

「7.7 巡回拡大はべき根拡大」終わり 
「7.可解性の十分条件」は次回に続く


nice!(0) 

No.357 - 高校数学で理解するガロア理論(4) [科学]

\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{#1}} \newcommand{\ol}[1]{\overline{#1}} \newcommand{\sb}{\subset} \newcommand{\sp}{\supset} \newcommand{\al}{\alpha} \newcommand{\sg}{\sigma}\)
 
6.可解性の必要条件 
 


6.1 可解群


正規部分群の概念、および剰余群と巡回群を使って「可解群」を定義します。可解群は純粋に群の性質として定義できますが、方程式の可解性と結びつきます。


可解群の定義:61A)

群 \(G\) から 単位元 \(e\) に至る部分群の列、

\(G=H_0\:\sp H_1\sp\cdots\sp H_i\sp H_{i+1}\sp\cdots\sp H_k=\{\:e\:\}\)

があって、\(H_{i+1}\) は \(H_i\) の正規部分群であり、剰余群 \(H_i/H_{i+1}\) が巡回群であるとき、\(G\) を可解群(solvable group)と言う。

\(H_{i+1}\) が \(H_i\) の正規部分群であるとき、\(H_i\) を正規列と言う。加えて、\(H_i/H_{i+1}\) が巡回群のとき、\(H_i\) を可解列という。



巡回群は可解群:61B)

巡回群は可解群である。また、巡回群の直積も可解群である。


[証明]

群 \(G\) を巡回群とし、\(G\) から 単位元 \(e\) に至る部分群の列として、
 \(G=H_0\:\sp\:H_1=\{\:e\:\}\)
をとる。\(H_1=\{\:e\:\}\) は \(H_0=G\) の正規部分群である。また、
 \(H_0/H_1\:\cong\:H_0\:(=G)\)
であり、\(G\) は巡回群だから、\(H_0/H_1\) は巡回群である。従って \(G\) は可解群である。

3つの巡回群の直積 \(G\) で考える。\(G\) を、
\(\begin{eqnarray}
&&\:\:G&=\bs{Z}/k\bs{Z}\times\bs{Z}/m\bs{Z}\times\bs{Z}/n\bs{Z}\\
&&&=\{(a,b,c)\:|\:a\in\bs{Z}/k\bs{Z},\:b\in\bs{Z}/m\bs{Z},\:c\in\bs{Z}/n\bs{Z}\}\\
\end{eqnarray}\)
とする。このとき、
\(\begin{eqnarray}
&&\:\:&H_1&=\{(a,b,0)\:|\:a\in\bs{Z}/k\bs{Z},\:b\in\bs{Z}/m\bs{Z}\}\\
&&&H_2&=\{(a,0,0)\:|\:a\in\bs{Z}/k\bs{Z}\}\\
&&&\{e\}&=\{(0,0,0)\}\\
\end{eqnarray}\)
とおくと、
 \(G\:\sp\:H_1\:\sp\:H_2\:\sp\:\{e\}\)
となる。巡回群は可換群であり、巡回群の直積 \(G\) も可換群である。従って、\(G\) の部分群である \(H_1,\:H_2\) も可換群であり、すなわち \(G\) の正規部分群である(41F)。

\(G\) の任意の2つの元を
 \(g=(g_a,\:g_b,\:g_c)\)
 \(h=(h_a,\:h_b,\:h_c)\)
とする。剰余類 \(g+H_1\) と \(h+H_1\) を考える。\((g_a,0,0)+H_1=H_1\)、\((0,g_b,0)+H_1=H_1\) だから、\((g_a,g_b,0)+H_1=H_1\) である。また同様に\((h_a,h_b,0)+H_1=H_1\) である。従って、\(g_c=h_c\) なら、\(g_a\)、\(g_b\)、\(h_a\)、\(h_b\) の値に関わらず \(g+H_1=h+H_1\) である。このことから剰余類の代表元として、\((0,0,0)\)、\((0,0,1)\)、\(\cdots\)、\((0,0,n-1)\) の \(n\)個をとることができる。つまり、
\(\begin{eqnarray}
&&\:\:G/H_1=\{&(0,0,0)+H_1,\\
&&&(0,0,1)+H_1,\\
&&&(0,0,2)+H_1,\\
&&& \vdots\\
&&&(0,0,n-1)+H_1\}\\
\end{eqnarray}\)
である。これは \((0,0,1)+H_1\) を生成元とする位数 \(n\) の巡回群である。まったく同様の議論により、
\(\begin{eqnarray}
&&\:\:H_1/H_2=\{&(0,0,0)+H_2,\\
&&&(0,1,0)+H_2,\\
&&&(0,2,0)+H_2,\\
&&& \vdots\\
&&&(0,m-1,0)+H_2\}\\
\end{eqnarray}\)
であり、\(H_1/H_2\) は \((0,1,0)+H_2\) を生成元とする位数 \(m\) の巡回群である。以上により、
 \(G=H_0\:\sp\:H_1\:\sp\:H_2\:\sp\:H_3=\{e\}\)
は、正規列であり、\(H_i/H_{i+1}\) が巡回群なので、\(G\) は可解群である。この議論は \(G\) が\(4\)個以上の巡回群の直積の場合でも全く同様に成り立つ。つまり、巡回群の直積は可解群である。[証明終]


可解群の部分群は可解群:61C)

可解群の部分群は可解群である。


[証明]

可解群を \(G\) とすると、可解群の定義により、

 \(G=H_0\sp H_1\sp H_2\sp\cdots H_{n-1}\sp H_n=\{e\}\)

という列で、\(H_{i+1}\) が \(H_i\) の正規部分群であり、\(H_i/H_{i+1}\) が巡回群のものが存在する。

ここで、\(G\) の任意の部分群を \(N\) としたとき、

 \(N=N\cap H_0\sp N\cap H_1\sp N\cap H_2\sp\cdots N\cap H_{n-1}\sp N\cap H_n=\{e\}\)

という集合の列を考える。部分群の共通部分は部分群の定理(41D)により、\(N\cap H_i\:(0\leq i\leq n)\) は \(G\) の部分群の列である。と同時に、これが可解列であることを以下で証明する。

列の \(N\cap H_{i-1}\sp N\cap H_i\) の部分を取り出して考える。\(H_i\) は \(H_{i-1}\) の正規部分群なので、\(H_{i-1}\) の任意の元 \(x\) について \(xH_i=H_ix\) が成り立つ。

\(N\cap H_{i-1}\) の任意の元を \(y\) とすると、\(y\in N\) かつ \(y\in H_{i-1}\) であるが、\(y\in N\) なので \(yN=Ny=N\) である。また \(y\in H_{i-1}\) なので、正規部分群の定義により、\(yH_i=H_iy\) が成り立つ。ゆえに、
 \(y(N\cap H_i)=yN\cap yH_i=Ny\cap H_iy=(N\cap H_i)y\)
となり、定義によって \(\bs{N\cap H_i}\)\(\bs{N\cap H_{i-1}}\) の正規部分群である。

次に第2同型定理43B)によると、\(N\) が \(G\) の部分群、\(H\) が \(G\) の正規部分群のとき、
 \(N/(N\cap H)\:\cong\:NH/H\)
が成り立つ。\(N\) を \(N\cap H_{i-1}\) とし、\(H\) を \(H_i\) として定理を適用すると、

 \(N\cap H_{i-1}/((N\cap H_{i-1})\cap H_i)\:\cong\:(N\cap H_{i-1})H_i/H_i\)
 \((\br{A})\)

となる。ここで、\(H_i\:\sb\:H_{i-1}\) なので、\((N\cap H_{i-1})\cap H_i=N\cap H_i\) である。従って、
 \((\br{A})\) 式の左辺 \(=\:(N\cap H_{i-1})/(N\cap H_i)\)
 \((\br{A}')\)
となる。また、
 \((N\cap H_{i-1})\:\sb\:H_{i-1}\)
 \((\br{B})\)
は常に成り立つ。さらに、\(H_i\:\sb\:H_{i-1}\) だから、この式に左から \(H_{i-1}\) をかけて、
 \(H_{i-1}H_i\:\sb\:H_{i-1}H_{i-1}\)
 \(H_{i-1}H_i\:\sb\:H_{i-1}\)
 \((\br{C})\)
が成り立つ。\((\br{B})\) 式に右から \(H_i\) をかけると、
 \((N\cap H_{i-1})H_i\:\sb\:H_{i-1}H_i\)
となるが、これと \((\br{C})\) 式を合わせると、
 \((N\cap H_{i-1})H_i\:\sb\:H_{i-1}\)
となる。従って、\((N\cap H_{i-1})H_i\) と \(H_{i-1}\) の \(H_i\) による剰余類を考えると、
 \((N\cap H_{i-1})H_i/H_i\:\sb\:H_{i-1}/H_i\)
の関係にある。これで、
 \((\br{A})\) 式の右辺 \(=\:H_{i-1}/H_i\) の部分群
 \((\br{A}'')\)
であることが分かった。

以上の \((\br{A})\:\:(\br{A}')\:\:(\br{A}'')\) をあわせると、

 \((N\cap H_{i-1})/(N\cap H_i)\:\cong\:H_{i-1}/H_i\) の部分群

である。\(G\) は可解群なので \(H_{i-1}/H_i\) は巡回群である。巡回群の部分群は巡回群なので、それと同型である \(\bs{(N\cap H_{i-1})/(N\cap H_i)}\) は巡回群である。まとめると、

 \(N\cap H_i\) は \(N\cap H_{i-1}\) の正規部分群
 \((N\cap H_{i-1})/(N\cap H_i)\) は巡回群

となる。このことは \(1\leq i\leq n\) のすべてで成り立つから、\(N\cap H_0\:=\:N\cap G\:=\:N\) は可解群である。つまり、可解群 \(G\) の任意の部分群 \(N\) は可解群である。[証明終]


可解群の像は可解群:61D)

可解群の準同型写像による像は可解群である。

このことより、
 可解群の剰余群は可解群
であることが分かる。なぜなら、群 \(G\) の部分群を \(N\) とすると、\(G\) から \(G/N\) への自然準同型、つまり \(x\in G\) として、
 \(x\:\longmapsto\:xN\)
の準同型写像を定義できるからである。


[証明]

可解群を \(G\) とすると、可解群の定義により、
 \(G=H_0\sp H_1\sp\:H_2\sp\cdots H_{n-1}\sp H_n=\{e\}\)
という列で、\(H_i\) が \(H_{i-1}\) の正規部分群であり、剰余群 \(H_{i-1}/H_i\) が巡回群の列(=可解列)が存在する。群 \(G\) に作用する準同型写像を \(\sg\) とすると、上記の可解列の \(\sg\) による像、
 \(\sg(G)=\sg(H_0)\sp\sg(H_1)\sp\sg(H_2)\sp\cdots\sg(H_{n-1})\sp\sg(H_n)\)
 \((\br{D})\)
が正規列になっていることを以下に示す。

\(\sg\) による像の列から \(\sg(H_{i-1})\sp\sg(H_i)\) を取り出して考える。\(\sg\) を \(H_{i-1}\) から \(\sg(H_{i-1})\) への写像と考えると、\(\sg(H_{i-1})\) は \(\sg\) による \(H_{i-1}\) の像なので、\(\sg\) は全射である。従って、\(H_{i-1}\) の元 \(h\) を選ぶことによって \(\sg(h)\) で \(\sg(H_{i-1})\) の全ての元を表すことができる。

\(\sg(H_{i-1})\) の任意の元を \(\sg(h)\) とおくと、
\(\begin{eqnarray}
&&\:\:\sg(h)\sg(H_i)&=\sg(hH_i)=\sg(H_ih)\\
&&&=\sg(H_i)\sg(h)\\
\end{eqnarray}\)
であるから、\(\sg(H_i)\) は \(\sg(H_{i-1})\) の正規部分群である。つまり \((\br{D})\) は正規列である。従って、\(\sg(H_{i-1})\) の \(\sg(H_i)\) による剰余類は群であり、剰余群 \(\sg(H_{i-1})/\sg(H_i)\) になる。

次に、剰余群 \(\sg(H_{i-1})/\sg(H_i)\) が巡回群であることを示す。\(H_{i-1}\) の任意の元を \(x\) とし、剰余群 \(H_{i-1}/H_i\) の元を \(xH_i\) で表す。\(H_{i-1}/H_i\) から \(\sg(H_{i-1})/\sg(H_i)\) への写像 \(f\) を、
 \(f\::\:xH_i\:\longmapsto\:\sg(x)\sg(H_i)\)
と定める。もし、剰余群 \(H_{i-1}/H_i\) の元が \(xH_i\) と \(yH_i\:(x,y\in H_{i-1})\) という異なる表現を持っているとすると、
 \(xH_i=yH_i\)
 \(\sg(xH_i)=\sg(yH_i)\)
 \(\sg(x)\sg(H_i)=\sg(y)\sg(H_i)\)
であるが、\(f\) の定義によって、
 \(f(xH_i)=\sg(x)\sg(H_i)\)
 \(f(yH_i)=\sg(y)\sg(H_i)\)
であり、異なる表現の \(f\) による写像先は一致する。従って \(f\) は2つの剰余群の間の写像として矛盾なく定義されている。また \(f\) は、
\(\begin{eqnarray}
&&f(xH_iyH_i)&=f(xyH_iH_i)=f(xyH_i)\\
&&&=\sg(xy)\sg(H_i)=\sg(x)\sg(y)\sg(H_i)\\
&&&=\sg(x)\sg(y)\sg(H_iH_i)=\sg(x)\sg(yH_iH_i)\\
&&&=\sg(x)\sg(H_iyH_i)=\sg(x)\sg(H_i)\sg(yH_i)\\
&&&=\sg(xH_i)\sg(yH_i)=\sg(x)\sg(H_i)\sg(y)\sg(H_i)\\
&&&=f(xH_i)f(yH_i)\\
\end{eqnarray}\)
を満たすが、この式は \(xH_i\) と \(yH_i\) が剰余群 \(H_{i-1}/H_i\) の異なる元を表現していても成り立つ。従って \(f\) は準同型写像である(=\(\:\br{①}\:\))。また、\(f\) は \(H_{i-1}/H_i\) から \(\sg(H_{i-1})/\sg(H_i)\) への写像で、
 \(f\::\:xH_i\:\longmapsto\:\sg(x)\sg(H_i)\)
と定義されたが、\(\sg(xH_i)=\sg(x)\sg(H_i)\) だから \(f\)は全射であり、
 \(\mr{Im}\:f\:=\:\sg(H_{i-1})/\sg(H_i)\)
である(=\(\:\br{②}\:\))。\(\br{①}\) と \(\br{②}\)、および準同型定理43A)により、
 \((H_{i-1}/H_i)/\mr{Ker}\:f\:=\:\sg(H_{i-1})/\sg(H_i)\)
である。\(H_{i-1}/H_i\) は巡回群なので、巡回群の剰余群は巡回群の定理(41H)により、\((H_{i-1}/H_i)/\mr{Ker}\:f\) は巡回群である。従って、それと同型である \(\sg(H_{i-1})/\sg(H_i)\) も巡回群である。

結局、\((\br{D})\) は正規列であると同時に \(\sg(H_{i-1})/\sg(H_i)\) が巡回群なので、\(\sg(G)\) は可解群である。[証明終]


6.2 巡回拡大


巡回拡大
巡回拡大の定義:62A)

\(\bs{Q}\) のガロア拡大を \(\bs{K}\) とする。\(\mr{Gal}(\bs{K}/\bs{Q})\) が巡回群のとき、\(\bs{K}/\bs{Q}\) を巡回拡大と言う。


累巡回拡大
累巡回拡大の定義:62B)

\(\bs{Q}\) の拡大体を \(\bs{K}\) とする。

\(\bs{Q}=\bs{K}_0\sb\bs{K}_1\sb\cdots\sb\bs{K}_i\sb\bs{K}_{i+1}\sb\cdots\sb\bs{K}_k=\bs{K}\)

となる拡大列があって(\(k > 1\))、\(\bs{K}_{i+1}/\bs{K}_i\:(0\leq i < k)\) が巡回拡大のとき、\(\bs{K}/\bs{Q}\) は累巡回拡大であると言う。ただし、\(\bs{\bs{K}/\bs{Q}}\) が累巡回拡大だとしても、\(\bs{\bs{K}/\bs{Q}}\) がガロア拡大であるとは限らない


\(\bs{K}/\bs{Q}\) が累巡回拡大だとしてもガロア拡大であるとは限りません。たとえばシンプルな例で考えてみると、
 \(\al=\sqrt{\sqrt{2}+1}\)
という代数的数があったとします。この式から \(\sqrt{\phantom{A}}\) を消去すると \(\al^4-2\al^2-1=0\) なので、\(\al\) の最小多項式 \(f(x)\) は、
 \(f(x)=x^4-2x^2-1\)
です。\(f(x)\) は、
 \(f(x)=(x^2-(\sqrt{2}+1))(x^2+(\sqrt{2}-1))\)
と変形できるので、方程式 \(f(x)=0\) の解は
 \(x=\pm\sqrt{\sqrt{2}+1},\:\:\pm i\sqrt{\sqrt{2}-1}\)
です。従って \(f(x)\) の最小分解体 \(\bs{L}\) は、
 \(\bs{L}=\bs{Q}(\sqrt{\sqrt{2}+1},\:i\sqrt{\sqrt{2}-1})\)
であり、また、
 \(\sqrt{\sqrt{2}+1}\cdot\sqrt{\sqrt{2}-1}=1\)
の関係があるので、
 \(\bs{L}=\bs{Q}(i,\:\al)\)
と表現できます。\(\bs{L}/\bs{Q}\) はガロア拡大です。

一方、
 \(\bs{K}=\bs{Q}(\al)\)
と定義すると、\(\bs{K}\) は \(f(x)=0\) の一つの解 \(\al\) だけによる単拡大体なので、\(\bs{K}/\bs{Q}\) はガロア拡大ではありません( \(\bs{Q}(\al)\neq\bs{Q}(i,\:\al)\) )。ここで、

 \(\bs{Q}\:\sb\:\bs{Q}(\sqrt{2})\:\sb\:\bs{Q}(\al)=\bs{K}\)

という体の拡大列を考えます。\(\bs{Q}\) 上の方程式 \(x^2-2=0\) の解は \(\pm\sqrt{2}\) なので、\(\bs{Q}(\sqrt{2})/\bs{Q}\) はガロア拡大です。また、ガロア群は、

 \(\mr{Gal}(\bs{Q}(\sqrt{2})/\bs{Q})=\{e,\:\sg\}\)
  \(\sg(\sqrt{2})=-\sqrt{2}\)
  \(\sg^2=e\)

なので巡回群であり、\(\bs{Q}(\sqrt{2})/\bs{Q}\) は巡回拡大です。

同様に、\(\bs{Q}(\sqrt{2})\) 上の方程式 \(x^2-(\sqrt{2}+1)=0\) の解は \(\pm\al\) で、\(\bs{Q}(\sqrt{2},\al)\) は \(\bs{Q}(\sqrt{2})\) の巡回拡大です。\(\sqrt{2}=\al^2-1\) なので、\(\bs{Q}(\sqrt{2},\al)=\bs{Q}(\al)\) であり、\(\bs{Q}(\al)/\bs{Q}(\sqrt{2})\) が巡回拡大となります。

結局、\(\bs{K}/\bs{Q}\) は \(\bs{Q}(\sqrt{2})/\bs{Q},\:\:\bs{Q}(\al)/\bs{Q}(\sqrt{2})\) という2つの巡回拡大の列で表されるので、定義(62B)により累巡回拡大です。しかしそうであっても、\(\bs{K}/\bs{Q}\) は ガロア拡大ではないのです。

これがもし \(\al=\sqrt{2}+\sqrt{3}\) だとすると、\(2\) も \(3\) も \(\bs{Q}\) の元なので、
 \(\bs{Q}\:\sb\:\bs{Q}(\sqrt{2})\:\sb\:\bs{Q}(\sqrt{2},\sqrt{3})=\bs{K}\)
の拡大列は累巡回拡大であり、かつ \(\bs{K}/\bs{Q}\) がガロア拡大です。



このように、\(\bs{K}/\bs{Q}\) が累巡回拡大だとしてもガロア拡大であるとは限らないのですが、もし \(\bs{K}/\bs{Q}\) が累巡回拡大でかつガロア拡大だとすると、\(\mr{Gal}(\bs{K}/\bs{Q})\) は可解群になります。それが、累巡回拡大と可解群を結びつける次の定理です。

累巡回拡大ガロア群の可解性
累巡回拡大ガロア群の可解性:62C)

\(\bs{Q}\) のガロア拡大を \(\bs{K}\)、そのガロア群を \(G\) とする。このとき、

① \(G\) が可解群である
② \(\bs{K}/\bs{Q}\) が累巡回拡大である

の2つは同値である。


[① \(\bs{\Rightarrow}\) ②の証明]

\(G\) が可解群であることを示す部分群の列と、それとガロア対応をする体の拡大列を、

\(G=H_0\sp H_1\sp H_2\sp\cdots\sp H_i\sp H_{i+1}\sp\cdots\sp H_k=\{e\}\)
\(\bs{Q}=\bs{F}_0\sb\bs{F}_1\sb\bs{F}_2\sb\cdots\sb\bs{F}_i\sb\bs{F}_{i+1}\sb\cdots\sb\bs{F}_k=\bs{K}\)

とする。\(G\) が可解群なので、\(H_{i+1}\) は \(H_i\) の正規部分群であり、\(H_{i+1}/H_i\:(0\leq i\leq k-1)\) は巡回群である。以降、\(H_i,\:H_{i+1}\) を取り出して考える。
 \(H_i\:\sp\:H_{i+1}\:\sp\:\{e\}\)
 \(\bs{F}_i\:\sb\:\bs{F}_{i+1}\:\sb\:\bs{K}\)
\(\bs{K}/\bs{Q}\) がガロア拡大なので、\(\bs{K}/\bs{F}_i\) もガロア拡大である。\(\bs{F}_i\) の固定群は \(H_i\) なので \(\mr{Gal}(\bs{K}/\bs{F}_i)=H_i\) である。同様に、\(\bs{K}/\bs{F}_{i+1}\) もガロア拡大であり、\(\mr{Gal}(\bs{K}/\bs{F}_{i+1})=H_{i+1}\) である。

ここで、\(H_{i+1}\) は \(H_i\) の正規部分群なので、正規性定理53C)により \(\bs{F}_{i+1}/\bs{F}_i\) はガロア拡大であり、そのガロア群は、
 \(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\cong H_i/H_{i+1}\)
となる。\(H_i/H_{i+1}\) は巡回群なので、それと同型の \(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\) も巡回群になる。従って、\(\bs{F}_{i+1}/\bs{F}_i\) は、「ガロア拡大で、かつ \(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\) が巡回群」なので、巡回拡大である。

以上が \(\bs{F}_i\:(0\leq i\leq k-1)\) で成り立つから、\(\bs{K}/\bs{Q}\) は累巡回拡大である。

[② \(\bs{\Rightarrow}\) ①の証明]

\(\bs{K}\) が \(\bs{Q}\) の累巡回拡大であることを示す体の拡大列と、それとガロア対応する \(G\) の部分群の列を、

\(\bs{Q}=\bs{F}_0\sb\bs{F}_1\sb\bs{F}_2\sb\cdots\sb\bs{F}_i\sb\bs{F}_{i+1}\sb\cdots\sb\bs{F}_k=\bs{K}\)
\(G=H_0\sp H_1\sp H_2\sp\cdots\sp H_i\sp H_{i+1}\sp\cdots\sp H_k=\{e\}\)

とする。\(\bs{F}_i\)と \(\bs{F}_{i+1}\) を取り出して考える。
 \(\bs{F}_i\:\sb\:\bs{F}_{i+1}\:\sb\:\bs{K}\)
 \(H_i\:\sp\:H_{i+1}\:\sp\:\{e\}\)
\(\bs{K}/\bs{Q}\) がガロア拡大なので、\(\bs{K}/\bs{F}_i\) も \(\bs{K}/\bs{F}_{i+1}\) もガロア拡大である。また \(\bs{F}_{i+1}/\bs{F}_i\) は巡回拡大なので、すなわちガロア拡大である。従って正規性定理53C)により、\(H_{i+1}\) は \(H_i\) の正規部分群であり、
 \(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\cong H_i/H_{i+1}\)
となる。\(\bs{F}_{i+1}/\bs{F}_i\) は巡回拡大なので \(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\) は巡回群であり、それと同型である \(H_i/H_{i+1}\) も巡回群である。まとめると「\(H_{i+1}\) は \(H_i\) の正規部分群であり、かつ \(H_i/H_{i+1}\) は巡回群」である。

このことは \(H_i\:(0\leq i\leq k-1)\) で成り立つから、定義によって \(G\) は可解群である。[証明終]


6.3 原始\(n\)乗根を含む体とべき根拡大


この節の目的は「1の原始\(\bs{n}\)乗根を含む体のべき根拡大」の性質を解明することです。そのためにまず、1の原始\(n\)乗根を \(\zeta\) を含む体 \(\bs{Q}(\zeta)\)に関する次の定理を数ステップに分けて証明します。

1の原始\(n\)乗根を \(\zeta\) とする。このとき
 ・\(\bs{Q}(\zeta)/\bs{Q}\) はガロア拡大
 ・\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\:\cong\:(\bs{Z}/n\bs{Z})^{*}\)
が成り立つ。

\(1\) の原始\(n\)乗根
原始n乗根の数:63A)

\(x^n-1=0\) の \(n\)個の解のうち、\(n\)乗して初めて \(1\) になる解を \(1\)の原始\(n\)乗根という。

原始\(n\)乗根は \(\varphi(n)\) 個ある。\(\varphi(n)\) はオイラー関数で、\(n\) と互いに素である \(n\) 以下の自然数の数を表す。


[証明]

まず、
 \(\omega=\mr{cos}\dfrac{2\pi}{n}+i\:\mr{sin}\dfrac{2\pi}{n}\)
とおくと、明らかに \(\omega\) は原始\(n\)乗根である。さらに、
 \(\omega^k=\mr{cos}\dfrac{2\pi k}{n}+i\:\mr{sin}\dfrac{2\pi k}{n}\:(1\leq k\leq n)\)
で \(1\) の\(n\)乗根の全体を表現できる。ここで \(\omega^k\) が原始\(n\)乗根になる条件を考える。いま、
 \((\omega^k)^x=1\:(1\leq x\leq n)\)
 \((\br{A})\)
とすると、この式を満たす \(x\) の最小値が \(n\) であれば、\(\omega^k\) は原始\(n\)乗根である。これを満たす \(x\) は、\(j\) を任意の整数として、
 \(\dfrac{2\pi k}{n}x=2\pi j\)
のときである。つまり、
 \(\dfrac{k}{n}x=j\)
のときである。いま、\(k\) と \(n\) の最大公約数を \(d\) とすると( \(\mr{gcd}(k,n)=d\:)\)、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&k=sd&\\
&&n=td&\\
\end{eqnarray}
\end{array}\right.\)
と表せて、このとき \(s\) と \(t\) は互いに素である。これを使うと、
 \(\dfrac{s}{t}x=j\)
のときに \(x\) は \((\br{A})\) 式を満たすことになる。\(s\) と \(t\) は互いに素であり、\(j\) は任意の整数だったから、\(x\) は \(t\) の倍数でなければならない。つまり、\(x\) は \(t=\dfrac{n}{d}\) の倍数である。ということは、\(x\) の最小値は \(\dfrac{n}{d}\) である。そして、\(\dfrac{n}{d}\) が \(n\) に等しいのは \(d=1\) の場合に限る。つまり \(\mr{gcd}(k,n)=1\) なら、\((\br{A})\) 式を満たす最小の \(x\) は \(n\) ということになる。従って、そのときに限り \(\omega^k\) は原始\(n\)乗根である。

\(\mr{gcd}(k,n)=1\) となる \(k\) は \(\varphi(n)\) 個あり、\(1\) の原始\(n\)乗根は \(\varphi(n)\) 個ある。[証明終]


原始n乗根の累乗:63B)

\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、
 \(\zeta^m\:\:(1\leq m\leq n)\)
は、\(1\) の\(n\)乗根の全体を表す。また、
 \(\zeta^m\:\:(\mr{gcd}(m,n)=1)\)
は、\(1\) の原始\(n\)乗根の全体を表す。


[証明]

\(\zeta^m\:(1\leq m\leq n)\) の \(n\) 個の値は全部異なっている。なぜなら、もし、 \(\zeta^j=\zeta^i\:(1\leq i < j\leq n)\)
だとすると、
 \(\zeta^{j-i}=1\:(1\leq i < j\leq n)\)
となり、\(j-i < n\) だから、\(\zeta\) が原始\(n\)乗根という前提に反するからである。\(\zeta^m\:(1\leq m\leq n)\) は全部異なっているので、これら \(n\) 個の値は \(1\) の\(n\)乗根全体を表す。

\(\zeta\) は、\(\mr{gcd}(k,n)=1\) である \(k\) を用いて、
 \(\zeta=\omega^k\)
  \(\omega=\mr{cos}\dfrac{2\pi}{n}+i\:\mr{sin}\dfrac{2\pi}{n}\)
と表せる(63A)。すると
 \(\zeta^m=(\omega^k)^m=\omega^{km}\)
である。\(\mr{gcd}(k,n)=1\) なので \(\mr{gcd}(m,n)=1\) なら \(\mr{gcd}(km,n)=1\) である。逆に、\(\mr{gcd}(km,n)=1\) が成り立つのは \(\mr{gcd}(m,n)=1\) のときに限る。従って、
 \(\zeta^m\:(=\omega^{km})\)
は \(\mr{gcd}(m,n)=1\) のとき(かつ、そのときに限って)\(1\) の原始\(n\)乗根である。[証明終]


原始n乗根の最小多項式:63C)

\(1\) の原始\(n\)乗根の一つを \(\zeta\) とする。\(\zeta\) の最小多項式を \(f(x)\) とし、\(k\) を \(n\) とは素な数とする。

このとき \(f(\zeta^k)=0\) である。


[証明]

証明を2つのステップで行う

第1ステップ
\(p\) を \(\bs{n}\) と素な素数とし、\(k=p\) のとき題意が成り立つことを証明する。
第2ステップ
\(k\) を \(\bs{n}\) と素な数とし、第1ステップを使って題意が成り立つことを証明する。

第1ステップ(\(p\) は \(\bs{n}\) と素な素数

本論に入る前に、2つことを確認する。まず、\(p\) を素数とし \(a\) を \(p\) とは素な整数とするとき、\(a\neq0\) ならフェルマの小定理25B)により、
 \(a^{p-1}\equiv1\:(\mr{mod}\:p)\)
が成り立つ。この両辺に \(a\) をかけると、
 \(a^p\equiv a\:(\mr{mod}\:p)\)
 \((\br{A})\)
となるが、この形の式にすると \(a=0,\:p\) でも成り立つ。つまり \(a\) が任意の整数のとき \((\br{A})\) 式が成り立つ。

次に、有限体 \(\bs{F}_p\) 上の多項式(係数が \(\bs{F}_p\) の元である多項式。「2.4 有限体」参照)についての定理である。\(p\) を素数とし \(x,\:y\) を変数とするとき、
 \((x+y)^p=x^p+y^p\:\:\:[\bs{F}_p]\)
が成り立つ。その理由であるが、等式の左辺を整数係数として2項展開すると、
\(\begin{eqnarray}
&&\:\:(x+y)^p=&x^p+{}_{p}\mr{C}_{1}x^{p-1}y+\:\cdots\:+{}_{p}\mr{C}_{p-1}xy^{p-1}+y^p\\
\end{eqnarray}\)
となる。この展開における \(x^p\) と \(y^p\) 以外の項の係数は、
 \({}_{p}\mr{C}_{k}=\dfrac{p!}{k!\cdot(p-k)!}\:\:(1\leq k\leq p-1)\)
であるが、\(p\) が素数なので、分母の素因数に \(p\) はなく、分子の素因数にある \(p\) は分母で割り切れない。従って、
 \({}_{p}\mr{C}_{k}\equiv0\:\:(\mr{mod}\:p)\:\:(1\leq k\leq p-1)\)
となり、\(\bs{F}_p\) 上の多項式としては、
 \((x+y)^p=x^p+y^p\:\:\:[\bs{F}_p]\)
が成り立つ。

さらに、3変数、\(x,\:y,\:z\) では、
\(\begin{eqnarray}
&&\:\:(x+y+z)^p&=(x+y)^p+z^p\\
&&&=x^p+y^p+z^p\:\:\:[\bs{F}_p]\\
\end{eqnarray}\)
となり、これを繰り返すと \(n\) 変数に拡張できるのは明らかだから、\(x_1,\:\cdots\:,\:x_n\) を変数として、
 \((x_1+x_2+\:\cdots\:+x_n)^p=\)
      \(x_1^p+x_2^p+\:\cdots\:+x_n^p\:\:\:[\bs{F}_p]\)
 \((\br{B})\)
が成り立つ。

以上の \((\br{A})\) 式と \((\br{B})\) 式を前提として以下の本論を進める。

\(\zeta\) の最小多項式 \(f(x)\) は、最小多項式は既約多項式31I)によって \(\bs{Q}\) 上の既約多項式である。\(\zeta\) は \(x^n-1=0\) と \(f(x)=0\) の共通の解だから、既約多項式の定理131D)により、\(x^n-1\) は \(f(x)\) で割り切れる。そこで、商の多項式を \(g(x)\) として、

 \(x^n-1=f(x)g(x)\)
 \((\br{C})\)

とおく。この式の左辺の \(x^n-1\) は整数係数の多項式である。つまり上の式は、整数係数の多項式が \(\bs{Q}\) 上で(有理数係数の多項式として)因数分解できることになり、整数係数多項式の既約性の定理(31C)によって、\(x^n-1\) は整数係数の多項式で因数分解できる。従って、\(f(x)\) と \(g(x)\) は整数係数としてよい。ということは、\(f(x)\) と \(g(x)\) を有限体 \(\bs{F}_p\) 上の多項式と見なすこともできる。以降の証明にはこのことを使う。

\(p\) は \(n\) と互いに素だから \(\zeta^p\) も \(1\) の原始\(n\)乗根である(63B)。従って \((\br{C})\) 式に \(x=\zeta^p\) を代入すると、左辺は \(0\) だから、
 \(f(\zeta^p)g(\zeta^p)=0\)
となり、\(f(\zeta^p)=0\) もしくは \(g(\zeta^p)=0\) である。

ここから、\(f(\zeta^p)=0\) であることを言うために背理法を使う。以下に \(f(\zeta^p)\neq0\) と仮定すると矛盾が生じることを証明する。

この背理法の仮定のもとでは \(g(\zeta^p)=0\) だから、\(\zeta\) は方程式 \(g(x^p)=0\) の解である。ということは、\(f(x)\) と \(g(x^p)\) は \(\zeta\) という共通の解をもつことになり、かつ \(f(x)\) は既約多項式であるから、既約多項式の定理131D)によって、\(g(x^p)\) は \(f(x)\) で割り切れる。その商を \(h(x)\) とすると、
 \(g(x^p)=f(x)h(x)\)
 \((\br{D})\)
と表せる。\(h(x)\) も整数係数の多項式である。

\(g(x)\) を、
 \(g(x)=a_mx^m+a_{m-1}x^{m-1}+\:\cdots\:+\:a_1x+a_0\)
とし、これを \(\bs{F}_p\) 上の多項式とみなして \(g(x^p)\) を計算する。\((\br{A})\) 式を使って係数を \(\mr{mod}\:p\) でみると、
 \(g(x^p)\)\(\overset{\text{ }}{=}\)\(a_m(x^p)^m+a_{m-1}(x^p)^{m-1}+\:\cdots\:+a_1(x^p)+a_0\)
\(\overset{\text{ }}{=}\)\(a_m^p(x^p)^m+a_{m-1}^p(x^p)^{m-1}+\:\cdots\:+a_1^p(x^p)+a_0^p\)
\(\overset{\text{ }}{=}\)\((a_mx^m)^p+(a_{m-1}x^{m-1})^p+\:\cdots\:+(a_1x)^p+a_0^p\:\:\:[\bs{F}_p]\)
と変形できる。2行目への変形で \((\br{A})\) 式を用いた。

この最後の式は、\((\br{B})\) 式の右辺の \(x_1\) を \(a_mx^m\)、\(x_2\) を \(a_{m-1}x^{m-1}\)、\(\cdots\:x_n\) を \(a_0\) と置き換えた形をしている。従って \((\br{B})\) 式を使うと、
 \(g(x^p)\)\(\overset{\text{ }}{=}\)\((a_mx^m+a_{m-1}x^{m-1}+\:\cdots\:+a_1x+a_0)^p\)
\(\overset{\text{ }}{=}\)\((g(x))^p\:\:\:[\bs{F}_p]\)
となる。つまり \(g(x)\) を \(\bs{F}_p\) 上の多項式と見なすと、
 \(g(x^p)=(g(x))^p\:\:\:[\bs{F}_p]\)
 \((\br{E})\)
となる。同時に、\((\br{D})\) 式の \(f(x),\:h(x)\) も \(\bs{F}_p\) 上の多項式と見なして \((\br{E})\) 式 を \((\br{D})\) 式に代入すると、
 \((g(x))^p=f(x)h(x)\:\:\:[\bs{F}_p]\)
 \((\br{F})\)
が得られる。

ここで \(\bs{F}_p\) 上の多項式 \(f(x)\) を割り切る既約多項式を \(q(x)\) とする。もし \(f(x)\) が \(\bs{F}_p\) 上でも既約多項式であれば \(q(x)=f(x)\) である。\(q(x)\) は \((\br{F})\) 式の右辺を割り切るから、左辺の \((g(x))^p\) も割り切る。ということは、既約多項式の定理431G)によって、\(q(x)\) は \(g(x)\) を割り切る。

ここで \((\br{C})\) 式に戻って考えると、\((\br{C})\) 式は、
 \(x^n-1=f(x)g(x)\)
 \((\br{C})\)
であった。この式を \(\bs{F}_p\) 上の多項式とみなすと、\(f(x)\) と \(g(x)\) は共に \(q(x)\) という因数をもつから、\((\br{C})\) 式の右辺は \(q(x)^2\) という因数をもつ。従って \((\br{C})\) 式は、
 \(x^n-1=q(x)^2\cdot r(x)\:\:\:[\bs{F}_p]\)
 \((\br{G})\)
と書ける。\(r(x)\) は \(f(x)g(x)\) を \(q(x)^2\) で割ったときの商である。

ここで \((\br{G})\) 式の両辺の導多項式(多項式の形式的微分)を求める。\(\bs{F}_p\) では距離が定義されていないので極限による微分の定義はできないが、多項式の形式的微分はできる。すると、
 \(nx^{n-1}\)\(=2q(x)q'(x)r(x)+q(x)^2\cdot r'(x)\)
\(=q(x)\cdot(2q'(x)r(x)+q(x)r'(x))\:\:\:[\bs{F}_p]\) 
\((\br{H})\)
となる。

\((\br{G})\) 式と \((\br{H})\) 式により、\(\bs{F}_p\) 上の多項式として、
 \(x^n-1\) と \(nx^{n-1}\) は共通の因数をもつ
ことになる。ここで矛盾が生じる。

なぜなら、\(n\) と \(p\) は互いに素だから、\(\bs{F}_p\) における \(n\) の逆数 \(n^{-1}\) がある。これを用いて \(x^n-1\) と \(nx^{n-1}\) に多項式の互除法を適用すると、互除法の第1段階は、
 \(x^n-1=n^{-1}x(nx^{n-1})-1\:\:\:[\bs{F}_p]\)
となって、\(x^n-1\) と \(nx^{n-1}\) の最大公約数は \(-1\:(=p-1)\) という定数である。つまり、\(\bs{F}_p\) 上の多項式として、
 \(x^n-1\) と \(nx^{n-1}\) は互いに素
である。これは明らかに矛盾している。従って、そもそもの仮定である \(f(\zeta^p)\neq0\) は間違っている。つまり \(f(\zeta^p)=0\) である。

第2ステップ(\(k\) は \(\bs{n}\) と素な数

\(k\) を \(n\) とは素な(しかし素数ではない)数とし、\(k\) の素因数分解を、
 \(k=p_1p_2\cdots p_m\)
とする。この形での素因数分解は、素因数が重複することもありうる。\(k\) は \(n\) と素だから、\(p_1,\:p_2,\:\cdots\:,p_m\) のすべての素数は \(n\) と素である。

\(1\) の原始\(n\)乗根の一つを \(\zeta\) とし、第1ステップの \(p=p_1\) とする。\(p_1\) は \(n\) と素だから、原始\(\bs{n}\)乗根の累乗の定理(63B)により、\(\zeta^{p_1}\) も \(1\) の原始\(n\)乗根である。また、第1ステップの証明により、\(f(\zeta^{p_1})=0\) である。

次に、その \(\zeta^{p_1}\) を原始\(n\)乗根としてとりあげ、\(p=p_2\) とする。\(p_2\) は \(n\) と素だから、\((\zeta^{p_1})^{p_2}=\zeta^{p_1p_2}\) もまた原始\(n\)乗根になる(63B)。従って、第1ステップでの証明を適用して \(f(\zeta^{p_1p_2})=0\) である。

このプロセスは次々と続けることができる。結局 \(\zeta^{p_1p_2\:\cdots\:p_m}=\zeta^k\) は \(1\) の原始\(n\)乗根であると同時に、\(f(\zeta^k)=0\) を満たす。\(k\) につけた条件は「\(n\) と互いに素」だけである。

原始\(\bs{n}\)乗根の累乗の定理(63B)により、\(k\) が \(n\) と素という条件で、\(\zeta^k\) は原始\(n\)乗根のすべてを表す。従って、\(f(x)=0\) は原始\(n\)乗根のすべてを解とする方程式である。[証明終]



この原始\(\bs{n}\)乗根の最小多項式の定理(63C)より、次の定理がすぐに導けます。


円分多項式:63D)

\(1\) の原始\(n\)乗根の一つを \(\zeta\) とし、\(\zeta\) の最小多項式を \(f(x)\) とすると、\(f(x)\) は円分多項式である。円分多項式とは、方程式 \(f(x)=0\) が \(\varphi(n)\) 個の解をもち、それらすべてが原始\(n\)乗根である多項式である。

従って、原始\(\bs{n}\)乗根は互いに共役である。最小多項式は既約多項式なので、円分多項式は既約多項式である。

\(\bs{Q}\) に \(\zeta\) を添加した単拡大体 \(\bs{Q}(\zeta)\) は円分多項式の最小分解体であり、\(\bs{\bs{Q}(\zeta)/\bs{Q}}\) はガロア拡大である。


\(\bs{Q}(\zeta)\)のガロア群
Q(ζ)のガロア群:63E)

\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、

 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/n\bs{Z})^{*}\)

である。つまり \(1\) の原始\(n\)乗根の一つを \(\bs{Q}\) に添加した拡大体のガロア群は、既約剰余類群に同型である。


[証明]

\(1\) の原始\(n\)乗根の一つを \(\zeta\) とし、最小多項式を \(f(x)\) とすると、円分多項式の定理(63D)により、\(f(x)=0\) の解は \(\varphi(n)=m\) 個の原始\(n\)乗根である。

原始\(n\)乗根を
 \(\zeta^{k_i}\:(\:1\leq i\leq m,\:1\leq k_i\leq n\) かつ \(\mr{gcd}(k_i,n)=1\:)\)
と表すと、それらは互いに共役である。また、\(f(x)\) の最小分解体は、
 \(\bs{Q}(\zeta^{k_1},\zeta^{k_2},\cdots,\zeta^{k_m})=\bs{Q}(\zeta)\)
である。

\(\zeta\) に作用する同型写像 \(\sg\) を考えると、\(\sg\) は \(\zeta\) を共役な元に移すから、
 \(\sg_{k_i}(\zeta)=\zeta^{k_i}\)
で \(m\) 個の同型写像が定義できる。この \(\sg\) による移り先はすべて \(\bs{Q}(\zeta)\) の元だから、\(\sg\) は \(\bs{Q}(\zeta)\) の自己同型写像である。また、\(\sg_{k_i}\) と \(\sg_{k_j}\) の積は、
\(\begin{eqnarray}
&&\:\:\sg_{k_i}(\sg_{k_j})&=\sg_{k_i}(\zeta^{k_j})\\
&&&=(\zeta^{k_j})^{k_i}\\
&&&=\zeta^{k_ik_j}\\
\end{eqnarray}\)
と計算できる。そこで \(\sg\) の演算規則を、
 \(\sg_{k_i}\sg_{k_j}=\sg_{k_ik_j}\)
と定める。

ここで \(k_ik_j\) は、\(1\leq k_i,\:k_j\leq n\) かつ \(\mr{gcd}(k_i,n)=1\) かつ \(\mr{gcd}(k_j,n)=1\) だから、既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) の元であり、乗算で閉じている。すなわち \(\sg_{k_ik_j}\) は \(\sg\) のどれかである。つまり、自己同型写像である \(\sg\) は上の演算規則で群になり、ガロア群 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) である。

\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) から \((\bs{Z}/n\bs{Z})^{*}\) への写像 \(f\) を、
 \(f\::\) \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) \(\longrightarrow\) \((\bs{Z}/n\bs{Z})^{*}\)
\(\sg_{k_i}\)\(\longmapsto\) \(k_i\)
で定めると、
 \(f(\sg_{k_i}\sg_{k_j})\)\(=f(\sg_{k_ik_j})\)
\(=k_ik_j\)
 \(f(\sg_{k_i})f(\sg_{k_j})\)\(=k_ik_j\)
が成り立つから、\(f\) は群の同型写像になる。従って、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) と \((\bs{Z}/n\bs{Z})^{*}\) は同型である。[証明終]



既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) は巡回群の直積と同型です(25G)。従って次の定理が得られます。


Q(ζ)のガロア群は巡回群:63F)

\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は巡回群の直積と同型である。

従って、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は可解群であり(61B)、累巡回拡大である(62C)。


累巡回拡大は、可解性の必要条件を証明する重要ポイントです。そこで次に、\(\bs{Q}(\zeta)/\bs{Q}\) が累巡回拡大になる様子を、ガロア群の計算で示します。

円分拡大は累巡回拡大
\(1\) の原始\(n\)乗根 \(\zeta\) を \(\bs{Q}\) に添加する拡大、\(\bs{Q}(\zeta)/\bs{Q}\) を円分拡大と言います。\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は巡回群の直積と同型で、従って 円分拡大 \(\bs{Q}(\zeta)/\bs{Q}\) は累巡回拡大です。

\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) が巡回群の直積と同型になる理由は、既約剰余類群と同型であること、つまり、
 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/n\bs{Z})^{*}\)
でした(63E)。その \((\bs{Z}/n\bs{Z})^{*}\) について振り返ってみると、次の通りです。\(\varphi\) はオイラー関数です。

 \(\bs{n}\) が奇素数 \(\bs{p}\) のべき乗のとき(\(n=p^k,\:1\leq k\)) (25E
  \((\bs{Z}/p^k\bs{Z})^{*}\) は生成元をもつ巡回群
  群位数:\(\varphi(p^k)=p^{k-1}(p-1)\)

 \(\bs{n}\) が2のべき乗のとき(\(n=2^k,\:2\leq k\)) (25F
  \((\bs{Z}/2^k\bs{Z})^{*}\cong(\bs{Z}/2\bs{Z})\times(\bs{Z}/2^{k-2}\bs{Z})\)
  群位数:\(\varphi(2^k)=2^{k-1}\)

 \(\bs{n=p^a\cdot q^b\cdot r^c}\)のとき(\(p,\:q,\:r\) は素数) (25G
  \((\bs{Z}/n\bs{Z})^{*}\cong(\bs{Z}/p^a\bs{Z})^{*}\times(\bs{Z}/q^b\bs{Z})^{*}\times(\bs{Z}/r^c\bs{Z})^{*}\)
  群位数:\(\varphi(n)=\varphi(p^a)\varphi(q^b)\varphi(r^c)\)

もちろん最後の式は、素因数が4個以上でも同様に成り立ちます。以下、それぞれの例をあげます。

 \(\zeta\) が 原始\(25\)乗根のとき 

\(\zeta\) が 原始\(25\)乗根の(一つ)のとき、原始\(25\)乗根の全体は \(\zeta^k\:\:(\mr{gcd}(k,25)=1)\) で表され(63B)、その数は \(25\) と互いに素な自然数の数、\(\varphi(25)=20\) です。\(\bs{Q}(\zeta)\) のガロア群は、
 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/5^2\bs{Z})^{*}\)
でした(63E)。\((\bs{Z}/5\bs{Z})^{*}\) の最小の生成元は \(2\) ですが(25D)、ほどんどの場合、\((\bs{Z}/p\bs{Z})^{*}\) の生成元は同時に \((\bs{Z}/p^2\bs{Z})^{*}\) の生成元です(25E)。実際、\(2\) は \((\bs{Z}/25\bs{Z})^{*}\) の生成元であることが確認できます。

そこで、\(\bs{Q}(\zeta)\) の自己同型写像 \(\sg\) を、
 \(\sg(\zeta)=\zeta^2\)
と定義すると、\(\sg^k(\zeta)\:\:(1\leq k\leq20)\) は、

 \(\zeta^2,\:\zeta^4,\:\zeta^8,\:\zeta^{16},\:\zeta^7,\:\zeta^{14},\:\zeta^3,\:\zeta^6,\:\zeta^{12},\:\zeta^{24},\)
 \(\zeta^{23},\:\zeta^{21},\:\zeta^{17},\:\zeta^9,\:\zeta^{18},\:\zeta^{11},\:\zeta^{22},\:\zeta^{19},\:\zeta^{13},\:\zeta\)

となって、原始\(25\)乗根の全部を尽くします。つまり、
 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})=\{e,\:\sg,\:\sg^2,\:\cdots,\:\sg^{19}\}\)
  \(\sg(\zeta)=\zeta^2\)
であり、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は位数 \(20\) の巡回群で、
 \(\bs{Q}\:\sb\:\bs{Q}(\zeta)\)
は巡回拡大です。

 \(\zeta\) が 原始\(16\)乗根のとき 

原始\(16\)乗根は、自然数 \(k\) を \(16\) 以下の奇数として \(\zeta^k\) で表され、次の8個です。
 \(\zeta,\:\zeta^3,\:\zeta^5,\:\zeta^7,\:\zeta^9,\:\zeta^{11},\:\zeta^{13},\:\zeta^{15}\)
ここで、\(n\) が2のべき乗のときの同型は、
 \((\bs{Z}/16\bs{Z})^{*}\cong(\bs{Z}/2\bs{Z})\times(\bs{Z}/4\bs{Z})\)
でした(25F)。つまり、\((\bs{Z}/16\bs{Z})^{*}\) は巡回群ではありませんが、位数 \(2\) の巡回群と位数 \(4\) の巡回群の直積に同型です。このことの証明(25F)を振り返ってみると、\(\mr{mod}\:16\) でみて \(5^k\:\:(0\leq k\leq3)\) は、
 \(1,\:5,\:9,\:13\)
であり、\((\bs{Z}/16\bs{Z})^{*}\) の元のうちの「4で割って1余る数」が全部現れるのでした。そこで、\(\bs{Q}(\zeta)\) の自己同型写像 \(\sg\) を、
 \(\sg(\zeta)=\zeta^5\)
と定義すると、\(\sg^k(\zeta)\:\:(0\leq k\leq3)\) は、
 \(\zeta,\:\zeta^5,\:\zeta^9,\:\zeta^{13}\)
で、原始\(16\)乗根の半数を表現します。
 \(G=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\)
 \(H=\{e,\:\sg,\:\sg^2,\:\sg^3\}\)
と書くと、\(H\) は \(G\) の部分群で、\(H\) の位数 \(4\) は \(G\) の位数 \(8\) の半分です。

\(H\) の固定体を \(\bs{K}\) とします。
 \(\sg(\zeta^4)=\sg(\zeta)^4=(\zeta^5)^4=\zeta^{20}\)
ですが、\(\zeta^{16}=1\) なので、
 \(\sg(\zeta^4)=\zeta^4\)
です。\(\zeta^4\) は \(\sg\) で不変であり、従って \(\zeta^4\) は \(H\) のすべての元で不変です。\(\zeta^4\) は4乗して初めて \(1\) になる数で、\(1\) の原始4乗根、つまり \(i\)(または \(-i\)。\(i\) は虚数単位)です。つまり \(i\) は固定体 \(\bs{K}\) の元であり、
 \(\bs{Q}(i)\:\sb\:\bs{K}\)
です。\(\bs{K}\) が \(H\) の固定体なので、ガロア対応は、
 \(G\:\sp\:H\:\sp\:\{\:e\:\}\)
 \(\bs{Q}\:\sb\:\bs{K}\:\sb\:\bs{Q}(\zeta)\)
です。ガロア対応の定理(53B)により、
 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{K})=H\)
であり、次数と位数の同一性52B)により、体の拡大次数はガロア群の位数と等しいので、
 \([\:\bs{Q}(\zeta):\bs{K}\:]=|H|=4\)
です。また、
 \([\:\bs{Q}(\zeta):\bs{Q}\:]=\varphi(16)=8\)
なので、拡大次数の連鎖律33H)により、
 \([\:\bs{K}:\bs{Q}\:]=2\)
です。一方、\(i\) は既約な2次方程式 \(x^2+1=0\) の根なので、\([\:\bs{Q}(i):\bs{Q}\:]=2\) です。つまり \(\bs{K}\) と \(\bs{Q}(i)\) は次元(\(=\:2\))が一致し、かつ \(\bs{Q}(i)\:\sb\:\bs{K}\) なので、体の一致の定理(33I)によって、
 \(\bs{K}=\bs{Q}(i)\)
です。まとめると、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q}(i))\) は位数 \(4\) の巡回群であり、\(\bs{Q}(\zeta)/\bs{Q}(i)\) は巡回拡大です。

また、
 \(\tau(i)=-i\)
と定義すると、\(\tau\) は \(\bs{Q}(i)\) の自己同型写像です。従って、
 \(\mr{Gal}(\bs{Q}(i)/\bs{Q})=\{e,\:\tau\}\)
であり、\(\mr{Gal}(\bs{Q}(i)/\bs{Q})\) は位数 \(2\) の巡回群で、\(\bs{Q}(i)/\bs{Q}\) は巡回拡大です。

以上で、
 \(\bs{Q}\:\sb\:\bs{Q}(i)\:\sb\:\bs{Q}(\zeta)\)
は2つの巡回拡大を連鎖させた累巡回拡大です。

 \(\zeta\) が 原始\(360\)乗根のとき 

\(n\) が複数の素因数をもつ一般的な場合を確認します。分かりやすいように \(n=360\) とします。\(360=2^3\cdot3^2\cdot5\) なので、既約剰余類群の構造の定理(25G)によって、
 \((\bs{Z}/360\bs{Z})^{*}\cong(\bs{Z}/8\bs{Z})^{*}\times(\bs{Z}/9\bs{Z})^{*}\times(\bs{Z}/5\bs{Z})^{*}\)
です。右辺の群位数はそれぞれ、
 \(|(\bs{Z}/8\bs{Z})^{*}|=\varphi(8)=4\)
 \(|(\bs{Z}/9\bs{Z})^{*}|=\varphi(9)=6\)
 \(|(\bs{Z}/5\bs{Z})^{*}|=\varphi(5)=4\)
なので、
 \(|(\bs{Z}/360\bs{Z})^{*}|=4\cdot6\cdot4=96=\varphi(360)\)
です。ここで、
 \(1\) の原始\(8\)乗根 \(:\:\zeta^{45}\)
 \(1\) の原始\(9\)乗根 \(:\:\zeta^{40}\)
 \(1\) の原始\(5\)乗根 \(:\:\zeta^{72}\)
ですが、これらを用いると、
 \(\bs{Q}(\zeta)=\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
が成り立ちます。その理由ですが、
 \(\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\sb\bs{Q}(\zeta)\)
であるのは当然として、その逆である、
 \(\bs{Q}(\zeta)\sb\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
も成り立つからです。なぜなら、
 \(45x+40y+72z=1\)
の1次不定方程式を考えると、\(\mr{gcd}(45,40,72)=1\) なので必ず整数解があります(21C)。具体的には、
 \(x=5,\:\:y=7,\:\:z=-7\)
が解(の一つ)です。従って、
 \(\zeta=(\zeta^{45})^5\cdot(\zeta^{40})^7\cdot(\zeta^{72})^{-7}\)
であり、\(\zeta\) が \(\zeta^{45},\:\zeta^{40},\:\zeta^{72}\) の四則演算で表現できるので、
 \(\bs{Q}(\zeta)\sb\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
です。この結果、
 \(\bs{Q}(\zeta)=\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
となります。

以上を踏まえると、\(\bs{Q}\) から \(\bs{Q}(\zeta)\) への体の拡大は、
\(\begin{eqnarray}
&&\:\:\bs{Q}&\sb\bs{Q}(\zeta^{45})\\
&&&\sb\bs{Q}(\zeta^{45},\zeta^{40})\\
&&&\sb\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})=\bs{Q}(\zeta)\\
\end{eqnarray}\)
と、\(\bs{Q}\) からの単拡大を3回繰り返したものと言えます。以降で、それぞれの単拡大が巡回拡大になることを確認します。

 \(\bs{Q}\:\sb\:\bs{Q}(\zeta^{45})\) 

\(\zeta^{45}\) は原始\(8\)乗根なので、上で検討した原始\(16\)乗根の結果がそのまま使えます。つまり、
 \(\bs{Q}\sb\bs{Q}(i)\sb\bs{Q}(\zeta^{45})\)
と表され、
 \([\:\bs{Q}(i):\bs{Q}\:]=2\)
 \([\:\bs{Q}(\zeta^{45}):\bs{Q}(i)\:]=2\)
 \([\:\bs{Q}(\zeta^{45}):\bs{Q}\:]=4\)
であり、\(\mr{Gal}(\bs{Q}(i)/\bs{Q}),\:\mr{Gal}(\bs{Q}(\zeta^{45})/\bs{Q}(i))\) は位数2の巡回群です。原始8乗根は簡単に計算できて、たとえばその一つは、
\(\begin{eqnarray}
&&\:\:\zeta^{45}&=\mr{cos}\dfrac{\pi}{4}+i\:\mr{sin}\dfrac{\pi}{4}\\
&&&=\dfrac{1}{2}(\sqrt{2}+\sqrt{2}\:i)\\
\end{eqnarray}\)
なので、
 \(\bs{Q}\sb\bs{Q}(i)\sb\bs{Q}(i,\sqrt{2})=\bs{Q}(\zeta^{45})\)
と表現することができます。この結果を使って、2つのガロア群 \(G_1\) と\(G_2\) の元を表現すると、
 \(G_1=\mr{Gal}(\bs{Q}(i)/\bs{Q})=\{e,\:\sg_1\}\)
  \(\sg_1(i)=-i\)
 \(G_2=\mr{Gal}(\bs{Q}(\zeta^{45})/\bs{Q}(i))=\{e,\:\sg_2\}\)
  \(\sg_2(\sqrt{2})=-\sqrt{2}\)
となります。

 \(\bs{Q}(\zeta^{45})\sb\bs{Q}(\zeta^{45},\zeta^{40})\) 

\(\zeta^{40}\) は原始\(9\)乗根です。原始\(9\)乗根の一つを \(\al\) と書くと、原始\(9\)乗根の全体は \(1\)~\(8\) の数で \(9\) と素なものを選んで、
 \(\al,\:\al^2,\:\al^4,\:\al^5,\:\al^7,\:\al^8\)
の6つになり、これらが共役な元です。\((\bs{Z}/9\bs{Z})^{*}\) の元は、
 \((\bs{Z}/9\bs{Z})^{*}=\{1,\:2,\:4,\:5,\:7,\:8\}\)
ですが、生成元は \(2\) か \(5\) です。生成元として \(2\) を採用すると、\(2^k\:(\mr{mod}\:9)\:(1\leq k\leq6)\) は、
 \(2,\:4,\:8,\:7,\:5,\:1\)
と、\((\bs{Z}/9\bs{Z})^{*}\) の元を巡回します。
 \(G_3=\mr{Gal}(\bs{Q}(\zeta^{45},\zeta^{40})/\bs{Q}(\zeta^{45}))\)
と書くことにし、ガロア群 \(G_3\) の元 \(\sg\) を、
 \(\sg(\al)=\al^2\)
と定義すると、
 \(G_3=\{e,\:\sg,\:\sg^2,\:\sg^3,\:\sg^4,\:\sg^5\}\)
となります。\(\al\) を \(\zeta\) で表すと、
 \(\sg(\zeta^{40})=\zeta^{80}\)
 \((\br{A})\)
です。

ただし、ガロア群の定義によって \(\sg\) は \(\zeta^{45}\) を不動にします。従って、
 \(\sg(\zeta^{45})=\zeta^{45}\)
 \((\br{B})\)
を満たさなければなりません。ここで、\(\sg\) が \(\zeta\) に作用したとき、
 \(\sg(\zeta)=\zeta^x\)
 \((\br{C})\)
であると仮定します。すると \((\br{A})\) 式と \((\br{C})\) 式から、
 \(40x\equiv80\:\:(\mr{mod}\:360)\)
 \(x\equiv2\:\:(\mr{mod}\:9)\)
 \((\br{D})\)
です。また、\((\br{B})\) 式と \((\br{C})\) 式から、
 \(45x\equiv45\:\:(\mr{mod}\:360)\)
 \(x\equiv1\:\:(\mr{mod}\:8)\)
 \((\br{E})\)
です。\(9\) と \(8\) は互いに素です。そうすると中国剰余定理21F)によって、\((\br{D})\) 式と \((\br{E})\) 式の連立合同方程式は \(0\leq x < 9\cdot8\) の範囲に唯一の解があります。それを求めると、
 \(x=65\)
です。当然ですが、\(65\)の累乗を \((\mr{mod}\:9)\) で計算してみると、
 \(65^{\phantom{1}}\equiv2\:\:(\mr{mod}\:9)\)
 \(65^2\equiv4\:\:(\mr{mod}\:9)\)
 \(65^3\equiv8\:\:(\mr{mod}\:9)\)
 \(65^4\equiv7\:\:(\mr{mod}\:9)\)
 \(65^5\equiv5\:\:(\mr{mod}\:9)\)
 \(65^6\equiv1\:\:(\mr{mod}\:9)\)
となって、\(2\) の累乗 \((\mr{mod}\:9)\) と一致します。\(\mr{mod}\:360\) に戻すと、
 \(40\cdot65^{\phantom{1}}\equiv40\cdot2\:\:(\mr{mod}\:360)\)
 \(40\cdot65^2\equiv40\cdot4\:\:(\mr{mod}\:360)\)
 \(40\cdot65^3\equiv40\cdot8\:\:(\mr{mod}\:360)\)
 \(40\cdot65^4\equiv40\cdot7\:\:(\mr{mod}\:360)\)
 \(40\cdot65^5\equiv40\cdot5\:\:(\mr{mod}\:360)\)
 \(40\cdot65^6\equiv40\phantom{\cdot5\:\:(}(\mr{mod}\:360)\)
です。この結果、

 \(\sg_3(\zeta)=\zeta^{65}\)

と定義すると、\(\sg_3\) は \(\al=\zeta^{40}\) を、
 \(\sg_3^{\:\phantom{1}}(\al)=\al^2,\:\:\sg_3^{\:2}(\al)=\al^4,\:\:\sg_3^{\:3}(\al)=\al^8\)
 \(\sg_3^{\:4}(\al)=\al^7,\:\:\sg_3^{\:5}(\al)=\al^5,\:\:\sg_3^{\:6}(\al)=\al\)
と巡回させます \((\zeta^{360}=1)\)。また、
 \(65\cdot45=2925\equiv45\:\:(\mr{mod}\:360)\)
なので、
 \(\sg_3(\zeta^{45})=\zeta^{45}\)
です。結局、

\(\begin{eqnarray}
&&\:\:G_3&=\mr{Gal}(\bs{Q}(\zeta^{45},\zeta^{40})/\bs{Q}(\zeta^{45}))\\
&&&=\{e,\:\sg_3,\:\sg_3^{\:2},\:\sg_3^{\:3},\:\sg_3^{\:4},\:\sg_3^{\:5}\}\\
\end{eqnarray}\)
  \(\sg_3(\zeta)=\zeta^{65}\)

がガロア群です。

 \(\bs{Q}(\zeta^{45},\zeta^{40})\sb\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\) 

\(\zeta^{72}\) は原始\(5\)乗根で、\((\bs{Z}/5\bs{Z})^{*}\) の生成元は \(2\) か \(3\) です。生成元として \(2\) を採用すると、ガロア群の元 \(\sg\) は、先ほどと同じように考えて、
 \(\sg(\zeta^{72})=\zeta^{144}\)
 \((\br{A}')\)
です。また \(\sg\) は \(\zeta^{45}\) と \(\zeta^{40}\) を固定するので、
 \(\sg(\zeta^{45})=\zeta^{45},\:\:\:\sg(\zeta^{40})=\zeta^{40}\)
 \((\br{B}')\)
です。\(\sg\) が \(\zeta\) に作用したときに、
 \(\sg(\zeta)=\zeta^x\)
 \((\br{C})\)
だとすると、\((\br{A}')\:\:(\br{B}')\) と \((\br{C})\) により、
 \(72x\equiv144\) \((\mr{mod}\:360)\)
 \(45x\equiv45\) \((\mr{mod}\:360)\)
 \(40x\equiv40\) \((\mr{mod}\:360)\)
ですが、これを簡単にして、
 \(x\equiv2\) \((\mr{mod}\:5)\)
 \(x\equiv1\) \((\mr{mod}\:8)\)
 \(x\equiv1\) \((\mr{mod}\:9)\)
が得られます。この連立合同方程式も中国剰余定理\(\bs{\cdot}\)多連立21G)によって、\(0\leq x < 9\cdot8\cdot5=360\) の範囲に唯一の解があります。それを求めると、
 \(x=217\)
です。従って、

 \(\sg_4(\zeta)=\zeta^{217}\)

と定義すると、
 \(G_4=\{e,\:\sg_4,\:\sg_4^{\:2},\:\sg_4^{\:3}\}\)
  \(\sg_4(\zeta)=\zeta^{217}\)
がガロア群になります。\(217^4\equiv1\:\:(\mr{mod}\:360)\) です。なお、
 \(\bs{Q}(\zeta^{45},\zeta^{40})=\bs{Q}(\zeta^5)\)
と簡略化できます。なぜなら、\(40\) と \(45\) の最大公約数は \(5\) なので、
 \(45x+40y=5\)
の1次不定方程式には整数解があり(21B)、具体的には、
 \(x=1,\:\:y=-1\)
が解(の一つ)で、
 \(\zeta^5=\zeta^{45}\cdot(\zeta^{40})^{-1}\)
と表せるからです。また、
 \(\bs{Q}(\zeta)=\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
だったので、
\(\begin{eqnarray}
&&\:\:G_4&=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q}(\zeta^5))\\
&&&=\{e,\:\sg_4,\:\sg_4^{\:2},\:\sg_4^{\:3}\}\\
\end{eqnarray}\)
  \(\sg_4(\zeta)=\zeta^{217}\)
と表記できます。\(G_4\) は位数 \(4\) の巡回群であり、\(\bs{Q}(\zeta)/\bs{Q}(\zeta^5)\) は巡回拡大です。さらに、
\(\begin{eqnarray}
&&\:\:\sg_4(\zeta^5)&=\zeta^{5\cdot217}=\zeta^{1085}\\
&&&=\zeta^{3\cdot360+5}=\zeta^5\\
\end{eqnarray}\)
なので、\(\sg_4\) が \(\zeta^5\) を固定することが確認できました。



以上の考察をまとめると、\(\zeta\) が \(1\) の原始\(360\)乗根のとき、

 \(\bs{Q}\sb\bs{Q}(i)\sb\bs{Q}(\zeta^{45})\sb\bs{Q}(\zeta^5)\sb\bs{Q}(\zeta)\)

という、4段階の巡回拡大が得られました。それそれの拡大のガロア群を \(G_1,\:G_2,\:G_3,\:G_4\) とすると、

 \(G_1=\{e,\:\sg_1\}\)
  \(\sg_1(i)=-i\)
 \(G_2=\{e,\:\sg_2\}\)
  \(\sg_2(\sqrt{2})=-\sqrt{2}\)
 \(G_3=\{e,\:\sg_3,\:\sg_3^{\:2},\:\sg_3^{\:3},\:\sg_3^{\:4},\:\sg_3^{\:5}\}\)
  \(\sg_3(\zeta)=\zeta^{65}\)
 \(G_4=\{e,\:\sg_4,\:\sg_4^{\:2},\:\sg_4^{\:3}\}\)
  \(\sg_4(\zeta)=\zeta^{217}\)

であり、これらすべてが巡回群です。また、体の拡大次数はガロア群の位数と一致し、順に \(2,\:2,\:6,\:4\) です。以上のことは、\(\zeta\) を \(1\) の\(360\)乗根とするとき、
 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/360\bs{Z})^{*}\)
 \((\bs{Z}/360\bs{Z})^{*}\cong(\bs{Z}/8\bs{Z})^{*}\times(\bs{Z}/9\bs{Z})^{*}\times(\bs{Z}/5\bs{Z})^{*}\)
であることの必然的な結果です。

\(\bs{Q}(\zeta)/\bs{Q}\) は累巡回拡大であることが、ガロア群の計算を通して確認できました。

べき根拡大
べき根拡大の定義:63G)

\(\bs{K}\) 上の方程式 \(x^n-a=0\:(a\in\bs{K}\)、\(a\neq1)\) の解の一つで、\(\bs{K}\) に含まれないものを \(\sqrt[n]{a}\) とするとき、\(\bs{K}(\sqrt[n]{a})\) を \(\bs{K}\) のべき根拡大と呼ぶ。

また、\(\bs{K}\) からのべき根拡大を繰り返して拡大体 \(\bs{F}\) ができるとき、\(\bs{F}/\bs{K}\) を累べき根拡大と言う。


\(x^n-a\) は既約多項式とは限らないので、\(\bs{K}(\sqrt[n]{a})/\bs{K}\) の拡大次数は \(n\) とは限りません。

また一般に、べき根拡大はガロア拡大ではありません。しかし \(\bs{K}\) に特別の条件(= \(\bs{K}\) に \(1\) の原始\(n\)乗根 \(\zeta\) が含まれる)があるときは、べき根拡大がガロア拡大、かつ巡回拡大になります。この「原始\(\bs{n}\)乗根を含む体からのべき根拡大」を考えるのが、ガロア理論の巧妙なアイデアです。

\(1\) の原始\(n\)乗根を含むべき根拡大
原始n乗根を含むべき根拡大:63H)

\(1\) の原始\(n\)乗根を \(\zeta\) とし、\(\bs{K}\) に \(\zeta\) が含まれるとする。\(\bs{K}\) 上の方程式 \(x^n-a=0\:(a\in\bs{K}\)、\(a\neq1)\) の解の一つで、\(\bs{K}\) に含まれないものを \(\sqrt[n]{a}\) とし、\(\bs{L}=\bs{K}(\sqrt[n]{a})\) とすると、
\(\bs{L}/\bs{K}\) は巡回拡大である
\(\mr{Gal}(\bs{L}/\bs{K})\) の位数は \(n\) の約数である
が成り立つ。


[証明]

\(\bs{K}(\sqrt[n]{a})\) 上の同型写像を \(\tau\) とする。\(x^n-a=0\) の解は、
 \(\sqrt[n]{a},\:\sqrt[n]{a}\:\zeta,\:\sqrt[n]{a}\:\zeta^2,\:\cdots\:,\:\sqrt[n]{a}\:\zeta^{n-1}\)
であり、\(\tau\) を \(\sqrt[n]{a}\) に作用させたときの移り先は、このうちのどれかである。もともと \(\bs{K}\) には \(1\) の原始\(n\)乗根 \(\zeta\) が 含まれているから、これらの移り先はすべて \(\bs{K}(\sqrt[n]{a})\) の元である。従って \(\tau\) は自己同型写像であり、\(\bs{K}(\sqrt[n]{a})/\bs{K}\) はガロア拡大である。

次にガロア群 \(\mr{Gal}(\bs{K}(\sqrt[n]{a})/\bs{K})\) の元と、\(\bs{K}(\sqrt[n]{a})/\bs{K}\) の拡大次数を求める。\(\sqrt[n]{a}\) の \(\bs{K}\) 上の最小多項式を \(f(x)\) とする。最小多項式は既約多項式31I)により \(f(x)\) は既約多項式であり、\(f(x)=0\) と \(x^n-a=0\) は共通の解 \(\sqrt[n]{a}\) を持つから、\(x^n-a=0\) は \(f(x)\) で割り切れる。従って \(f(x)=0\) の解は、\(x^n-a=0\) の解、\(\sqrt[n]{a},\:\sqrt[n]{a}\:\zeta,\:\sqrt[n]{a}\:\zeta^2,\:\cdots\:,\:\sqrt[n]{a}\:\zeta^{n-1}\) の全部、またはその一部である。\(f(x)=0\) の解で、\(\sqrt[n]{a}\:\zeta^{t}\) の\(t\) が最小となる 正の数を \(d\:(1\leq d\leq n-1)\) とする。そして \(\bs{K}\) の元を固定する \(\bs{K}(\sqrt[n]{a})\) の同型写像、\(\sg\) を、
 \(\sg(\sqrt[n]{a})=\sqrt[n]{a}\:\zeta^{d}\)
と定義する。これは自己同型写像になるから、\(\mr{Gal}(\bs{K}(\sqrt[n]{a})/\bs{K})\) の元である。\(\sg\) は \(\bs{K}\) の元を固定するから \(\sg(\zeta)=\zeta\) である。これを用いて \(\sg^i(\sqrt[n]{a})\) を求めると、
\(\begin{eqnarray}
&&\:\:\sg^2(\sqrt[n]{a})&=\sg(\sg(\sqrt[n]{a}))=\sg(\sqrt[n]{a}\:\zeta^{d})=\sg(\sqrt[n]{a})\zeta^{d}\\
&&&=\sqrt[n]{a}\:\zeta^{d}\zeta^{d}=\sqrt[n]{a}\:\zeta^{2d}\\
&&\:\:\sg^3(\sqrt[n]{a})&=\sg(\sg^2(\sqrt[n]{a}))=\sg(\sqrt[n]{a}\:\zeta^{2d})=\sg(\sqrt[n]{a})\zeta^{2d}\\
&&&=\sqrt[n]{a}\:\zeta^{d}\zeta^{2}d=\sqrt[n]{a}\:\zeta^{3d}\\
\end{eqnarray}\)
となり、一般的には、
 \(\sg^i(\sqrt[n]{a})=\sqrt[n]{a}\:\zeta^{id}\:(1\leq i)\)
となる。\(i=n\) とおくと、
 \(\sg^n(\sqrt[n]{a})=\sqrt[n]{a}\:\zeta^{nd}=\sqrt[n]{a}\)
となるから、\(\sg^n=e\) である。

\(n\) を \(d\) で割ったときの商を \(s\)、余りを \(r\) とする。
 \(n=sd+r\:(1 < s\leq n,\:0\leq r < d)\)
である。ここで \(\sg^i(\sqrt[n]{a})\) の \(i\) を \(n-s\) とおくと、
\(\begin{eqnarray}
&&\:\:\sg^{n-s}(\sqrt[n]{a})&=\sqrt[n]{a}\:\zeta^{nd-sd}\\
&&&=\sqrt[n]{a}\:\zeta^{n(d-1)+n-sd}\\
\end{eqnarray}\)
となる。\(\zeta^n=e\) なので、\(\zeta^{n(d-1)}=e\) であることを用いると、
\(\begin{eqnarray}
&&\:\:\sg^{n-s}(\sqrt[n]{a})&=\sqrt[n]{a}\:\zeta^{n-sd}\\
&&&=\sqrt[n]{a}\:\zeta^{r}\\
\end{eqnarray}\)
と計算できる。\(\sg^{s}\) はガロア群の元なので、\(\sg^{n-s}=\sg^{-s}\) もガロア群の元である。従って \(\sg^{n-s}(\sqrt[n]{a})\) は \(f(x)=0\) の解である。

ここでもし \(r\) がゼロでないとすると、\(1\) 以上、\(d\) 未満の数である \(r\) があって、\(\sqrt[n]{a}\:\zeta^{r}\) が \(f(x)=0\) の解となってしまう。しかしこれは、\(f(x)=0\) の解である \(\sqrt[n]{a}\:\zeta^{t}\) の \(t\) の最小値が \(d\) との仮定に反する。従って \(r=0\) である。

\(n=sd\) なので、
 \(\sqrt[n]{a},\:\sqrt[n]{a}\:\zeta,\:\sqrt[n]{a}\:\zeta^2,\:\cdots\:,\:\sqrt[n]{a}\:\zeta^{n-1}\)
の中に \(f(x)=0\) の解は \(s\) 個あり、
 \(\sqrt[n]{a},\:\sqrt[n]{a}\:\zeta^{d},\:\:\sqrt[n]{a}\:\zeta^{2d},\:\cdots\:,\:\sqrt[n]{a}\:\zeta^{(s-1)d}\)
である。\(\mr{Gal}(\bs{K}(\sqrt[n]{a})/\bs{K})\) は位数 \(s\) の巡回群であり、位数は \(n\) の約数である。\(n\) が素数 \(p\) であれば、\(\mr{Gal}(\bs{K}(\sqrt[p]{a})/\bs{K})\) は \(p\)次の巡回群である。[証明終]



この定理から分かることは、あらかじめ必要な原始\(n\)乗根を "仕込んで" おけば、べき根拡大列は巡回拡大列になるということです。たとえば、
 \(\bs{Q}\:\sb\:\bs{K}\:\sb\:\bs{L}\)
というべき根拡大の列があり、\(\bs{K}/\bs{Q}\) の拡大次数を \(n_1\)、\(\bs{L}/\bs{K}\) の拡大次数を \(n_2\) とします。また \(n_1,\:n_2\) の最小公倍数を \(n\) とし、\(1\) の原始\(n\)乗根を \(\zeta\) とします。
 \(\bs{Q}\:\sb\:\bs{Q}(\zeta)\:\sb\:\bs{K}\:\sb\:\bs{L}\)
の拡大列を考えると、\(\bs{Q}(\zeta)\) には、
 \(1\) の原始\(n_1\)乗根 : \(\zeta^{\frac{n}{n_1}}\)
 \(1\) の原始\(n_2\)乗根 : \(\zeta^{\frac{n}{n_2}}\)
が含まれているので、
 \(\bs{Q}(\zeta)/\bs{Q}\):累巡回拡大(63F
 \(\bs{K}/\bs{Q}(\zeta),\:\bs{L}/\bs{K}\):巡回拡大(63H
となり、合わせると
 \(\bs{L}/\bs{Q}\):累巡回拡大
になります。ここまでくると、可解性の必要条件の証明まであと一歩です。


6.4 可解性の必要条件


可解性の必要条件を証明する最終段階にきました。\(\bs{Q}\) 上の既約な方程式の解の一つを \(\al\) とし、\(\bs{K}=\bs{Q}(\al)\) の拡大体を考えます。\(\al\) が四則演算とべき根で表現できるということは、\(\bs{K}/\bs{Q}\) が累べき根拡大(63G)であるということです。ここが出発点です。そして証明の方針として、

① \(\bs{K}/\bs{Q}\) が累べき根拡大
② \(\bs{K}/\bs{Q}\) が累巡回拡大
③ ガロア拡大
④ ガロア群が可解群

の4つが密接に関係していることを示します。

まず、原始\(\bs{n}\)乗根を含むべき根拡大の定理(63H)により、累べき根拡大の拡大のステップに必要な原始\(n\)乗根の全種類をあらかじめ \(\bs{Q}\) に含めておけば、① 累べき根拡大は ② 累巡回拡大と同じことなります。

さらに、累巡回拡大ガロア群の可解性62C)の定理により、もし \(\bs{K}/\bs{Q}\) が ③ ガロア拡大であれば、累巡回拡大 \(\bs{K}/\bs{Q}\) のガロア群 \(\mr{Gal}(\bs{K}/\bs{Q})\) は ④ 可解群です。

しかし、累巡回拡大の定義62B)のところで書いたように、\(\bs{K}/\bs{Q}\) が累巡回拡大であってもガロア拡大であるとは限りません。そこで、
 \(\bs{Q}\:\sb\:\bs{K}\:\sb\:\bs{E}\)
となるような \(\bs{E}\) で、\(\bs{E}/\bs{Q}\) が累巡回拡大、かつガロア拡大である \(\bs{E}\) が必ず存在することを証明できれば、① \(\rightarrow\) ② \(\rightarrow\) ③ \(\rightarrow\) ④ が一気通貫でつながることになります。このような \(\bs{E}\)(そこには \(\al\) が含まれる)の存在を、累巡回拡大の定義62B)の説明で書いたシンプルな例で考察します。



代数的数 \(\al\) を、
 \(\al=\sqrt{\sqrt{2}+1}\)
とします。この \(\al\) は \(\bs{Q}\) 上の既約な方程式、
 \(f(x)=x^4-2x^2-1=0\)
の解の一つです。この \(f(x)\) は \(\al\) の最小多項式です。ちなみに \(f(x)\) は、
 \(f(x)=(x^2-(\sqrt{2}+1))(x^2+(\sqrt{2}-1))\)
と変形できるので、方程式 \(f(x)=0\) の解は
 \(x=\pm\sqrt{\sqrt{2}+1},\:\:\:\pm i\sqrt{\sqrt{2}-1}\)
の4つです。

\(\al\) を含む \(\bs{Q}\) の拡大体 \(\bs{Q}(\al)\) を考えます。\(\bs{Q}\:\sb\:\bs{Q}(\al)\) ですが、べき根拡大だけで表現すると、

 \(\bs{Q}\:\sb\:\bs{Q}(\sqrt{2})\:\:\sb\:\bs{Q}(\sqrt{\sqrt{2}+1})\)

の累べき根拡大になります。つまり、\(\bs{Q}\) 上の方程式、
 \(x^2-2=0\)
の解の一つ \(\sqrt{2}\) を \(\bs{Q}\) に添加してべき根拡大をし、\(\bs{Q}(\sqrt{2})\) 上の方程式、
 \(x^2-(\sqrt{2}+1)=0\)
の解の一つ \(\sqrt{\sqrt{2}+1}\) を \(\bs{Q}(\sqrt{2})\) に添加したのが \(\bs{Q}(\sqrt{\sqrt{2}+1})\) です。2つのべき根拡大の拡大次数は2です。\(1\) の原始2乗根は \(-1\) なので、始めから \(\bs{Q}\) に含まれています。従って、
 \(\bs{Q}\:\sb\:\bs{Q}(\sqrt{2})\) は
  ・べき根拡大
  ・巡回拡大
    \(\mr{Gal}(\bs{Q}(\sqrt{2})=\{\sg_1,\:\sg_2\}\)
     \(\sg_1=e\)
     \(\sg_2(\sqrt{2})=-\sqrt{2}\)
  ・\(\bs{Q}(\sqrt{2})\) は \(\bs{Q}\) 上の多項式 \(x^2-2\) の最小分解体
となります。まったく同様に、
 \(\bs{Q}(\sqrt{2})\:\sb\:\bs{Q}(\sqrt{\sqrt{2}+1})\) は
  ・べき根拡大
  ・巡回拡大
です。しかし、\(\bs{Q}(\sqrt{\sqrt{2}+1})/\bs{Q}\) がガロア拡大ではありません。というのも、\(\bs{Q}(\sqrt{\sqrt{2}+1})\) は \(\bs{Q}\) 上ではなく \(\bs{Q}(\sqrt{2})\) 上の方程式、
 \(x^2-(\sqrt{2}+1)=0\)
の解の一つ \(\sqrt{\sqrt{2}+1}\) を \(\bs{Q}(\sqrt{2})\) に添加したものだからです。

そこで、\(\bs{Q}(\sqrt{2})\) 上の2つの方程式、
 ・\(x^2-\sg_1(\sqrt{2}+1)=0\)
 ・\(x^2-\sg_2(\sqrt{2}+1)=0\)
の解を順に \(\bs{Q}(\sqrt{2})\) に追加することにします。つまり、
 ・\(\sqrt{\phantom{-}\sqrt{2}+1}\)
 ・\(\sqrt{-\sqrt{2}+1}\)
の2つを \(\bs{Q}(\sqrt{2})\) に追加します。ガロア群は必ず単位元 \(e\) を含むので、\(\sg_1(\sqrt{2}+1)\) と \(\sg_2(\sqrt{2}+1)\) のどちらかは \(\al=\sqrt{\sqrt{2}+1}\) になります。この追加は2つともべき根拡大であり、巡回拡大です。こうして出来上がった拡大体を \(\bs{E}\) とすると、
 \(\bs{E}=\bs{Q}(\sqrt{\sqrt{2}+1},\sqrt{-\sqrt{2}+1})\)
です。以上のことを別の観点で言うと、多項式 \(g(x)\) を、
 \(g(x)=(x^2-\sg_1(\sqrt{2}+1))(x^2-\sg_2(\sqrt{2}+1))\)
と定義するとき、
 \(g(x)=0\) の解を \(\bs{Q}(\sqrt{2})\) に追加したのが \(\bs{E}\)
ということになります。\(g(x)\) を計算すると、
\(\begin{eqnarray}
&&\:\:g(x)&=(x^2-\sg_1(\sqrt{2}+1))(x^2-\sg_2(\sqrt{2}+1))\\
&&&=(x^2-(\sqrt{2}+1))(x^2+(\sqrt{2}-1))\\
&&&=x^4-2x^2-1\\
\end{eqnarray}\)
となり、\(g(x)\) は \(\bs{Q}\) 上の多項式です。なぜそうなるかと言うと、\(g(x)\) の係数は \(\sg_1(\sqrt{2}+1)\) と \(\sg_2(\sqrt{2}+1)\) の対称式で表されるからで、従ってガロア群の元 \(\sg_1,\:\sg_2\) を作用させても不変であり、つまり係数が有理数だからです。ここから得られる結論は、
 \(\bs{E}\) は \(\bs{Q}\) 上の多項式 \(g(x)\) の最小分解体である
ということです。このことは、\(\al=\sqrt{\sqrt{2}+1}\) の最小多項式が \(x^4-2x^2-1=g(x)\) であったことからも確認できます。従ってガロア拡大の定義(52A)により、
 \(\bs{E}/\bs{Q}\) はガロア拡大
です。まとめると、
 \(\bs{Q}\:\sb\:\bs{Q}(\al)\:\sb\:\bs{E}\)
  \(\bs{E}/\bs{Q}\) は累巡回拡大、かつガロア拡大
である \(\bs{E}\) の存在が証明できました。



以上は "2段階の2次拡大" という非常にシンプルな例ですが、このことを一般的に(多段階の \(n\)次拡大で)述べると次のようになります。

ガロア閉包
ガロア閉包の存在:64A)

\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つである \(\al\) がべき根で表されているとする。このとき「\(\bs{Q}\) のガロア拡大 \(\bs{E}\) で、\(\al\) を含み、\(\bs{E}/\bs{Q}\) が累巡回拡大」であるような 代数拡大体 \(\bs{E}\) が存在する。


[証明]

\(\bs{Q}\)上の方程式 \(f(x)=0\) の解の一つ \(\al\) がべき根で表されているとき、

\(\bs{Q}=\bs{K}_0\sb\bs{K}_1\sb\cdots\sb\bs{K}_i\sb\bs{K}_{i+1}\sb\cdots\sb\bs{K}_k=\bs{K}\)

・ \(\bs{K}_{i+1}=\bs{K}_i(\al_{i+1})\)
・ \(\al_{i+1}\) は \(x^{n_i}-a_i=0\:(a_i\in\bs{K}_i)\) の根の一つ
・ \([\bs{K}_{i+1}:\bs{K}_i]=n_i\)
・ \(\al_k=\al\:\in\:\bs{K}_k=\bs{K}\)

となる、べき根拡大列 \(\bs{K}_i\) が存在する(= \(\bs{K}/\bs{Q}\) が累べき根拡大)。このべき根拡大列を修正して、

\(\bs{Q}\sb\bs{F}_0\sb\bs{F}_1\sb\cdots\sb\bs{F}_i\sb\bs{F}_{i+1}\sb\cdots\sb\bs{F}_k=\bs{E}\)

・ \(\bs{K}_i\:\sb\:\bs{F}_i\)
・ \(\bs{F}_{i+1}/\bs{F}_i\) は累巡回拡大
・ \(\bs{E}/\bs{Q}\) はガロア拡大
・ \(\al_k=\al\:\in\:\bs{K}_k\:\sb\:\bs{F}_k=\bs{E}\)

とできることを以下に示す。まず、\(n_i\:(0\leq i < k)\) の最小公倍数を \(n\) とし、\(1\) の原始\(n\)乗根を \(\zeta\) とする。そして、
 \(\bs{F}_0=\bs{Q}(\zeta)\)
とおくと、\(\bs{K}_0(=\bs{Q})\:\sb\:\bs{F}_0\) であり、\(\bs{F}_0\) は \(1\) の原始\(n_i\)乗根 \((0\leq i < k)\) を全て含むことになる。

\(\bs{F}_0\) は \(\bs{Q}(\zeta)\) だから、\(\mr{Gal}(\bs{F}_0/\bs{Q})=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は巡回群の直積に同型であり(63F)、従って可解群である(61B)。つまり、\(\bs{F}_0/\bs{Q}\) は累巡回拡大である(62C)。

次に、
 \(\bs{F}_1=\bs{F}_0(\al_1)\)
とおく。\(\al_1\) は \(\bs{K}_0=\bs{Q}\) 上の方程式 \(x^{n_0}-a_0=0\:(a_0\in\bs{K}_0\:\sb\:\bs{F}_0)\) の根の一つで、\(\al_1=\sqrt[n_0]{a_0}\) であるから、\(\bs{F}_1\) は \(\bs{F}_0\) のべき根拡大になる。

すると、\(\bs{F}_0\)は \(1\) の原始\(n_0\)乗根を含むから、原始\(\bs{n}\)乗根を含むべき根拡大の定理(63H)により、\(\bs{F}_1/\bs{F}_0\) は巡回拡大である。この拡大次数は \([\bs{F}_1:\bs{F}_0]=[\bs{K}_1:\bs{K}_0(=\bs{Q})]=n_0\) である。

また \(\bs{F}_1\)は、\(\bs{Q}\) 上の方程式 \(x^{n_0}-a_0=0\) の解 \(\al_1\eta^j\)(\(\eta\) は \(1\) の原始\(n_0\)乗根。\(0\leq j < n_0\))をすべて含むから、\(\bs{F}_1/\bs{Q}\) はガロア拡大である。



次に \(\bs{K}_2\) を修正した \(\bs{F}_2\) を考える。\(\mr{Gal}(\bs{F}_1/\bs{Q})\) の元を \(\sg_j\:(1\leq j\leq m,\:\sg_1=e)\) の \(m\)個とする。

\(\al_2\) は \(x^{n_1}-a_1=0\:\:(a_1\in\bs{K}_1\:\sb\:\bs{F}_1)\) の根の一つであった。そこで、
 \(\sg_j(a_1)\) \((1\leq j\leq m)\)
という \(m\)個の元をもとに、
 \(x^{n_1}-\sg_j(a_1)=0\:(a_1\in\bs{K}_1\:\sb\:\bs{F}_1,\:\:1\leq j\leq m)\)
という \(m\)個の方程式群を考える。\(\sg_j\) の中には単位元 \(e\) が含まれるため、\(x^{n_1}-a_1=0\) も方程式群の中の一つである。

この \(m\)個の方程式の \(m\)個の解、
 \(\sqrt[n_1]{\sg_j(a_1)}\) \((1\leq j\leq m)\)
を \(\bs{F}_1\) に順々に添加していき、最終的にできた体を \(\bs{F}_2\) とする。\(\bs{F}_1\) は \(1\) の原始 \(n_1\)乗根を含むから、\(\sqrt[n_1]{\sg_j(a_1)}\) \((1\leq j\leq m)\) の添加はすべて巡回拡大である(63H)。つまり、\(\bs{F}_2\) は \(\bs{F}_1\) の累巡回拡大である。\(\sg_j\) の中には単位元があるから、\(\bs{F}_2\) には \(\al_2=\sqrt[n_1]{a_1}\) を含む。

ここで多項式 \(g(x)\) を、
 \(g(x)=\displaystyle\prod_{j=1}^{m}(x^{n_1}-\sg_j(a_1))\)
と定義する。\(\bs{F}_1\) は \(1\) の原始 \(n_1\)乗根を含むから、\(\bs{F}_2\) は \(g(x)=0\) のすべての解を \(\bs{F}_1\) に添加した拡大体である。

多項式 \(g(x)\) の係数は、根と係数の関係から \(\sg_j(a_1)\:\:(1\leq j\leq m)\) の対称式であり、係数に任意の \(\sg_j\:(=\mr{Gal}(\bs{F}_1/\bs{Q})\) の元\()\) を作用させても不変である。つまり係数は有理数であり、\(g(x)\) は \(\bs{Q}\) 上の多項式である。結局、\(\bs{F}_2\) は \(\bs{Q}\) 上の多項式 \(g(x)\) の最小分解体であり、\(\bs{F}_2/\bs{Q}\) はガロア拡大である(52A)。

まとめると、
・ \(a_1\:\in\:\bs{K}_1\:\sb\:\bs{F}_1\)
・ \(\bs{F}_1\) には \(1\) の原始\(n_1\)乗根が含まれる
・ \(\al_2\) は \(x^{n_1}-a_1=0\) の根の一つ
・ \(\mr{Gal}(\bs{F}_1/\bs{Q})\) の元が \(\sg_j\:(1\leq j\leq m,\:\:\:\sg_1=e)\)
で、かつ、
  \(g(x)=\displaystyle\prod_{j=1}^{m}(x^{n_1}-\sg_j(a_1))\)
の条件で、\(g(x)=0\) のすべての解を \(\bs{F}_1\) に添加した拡大体を \(\bs{F}_2\) とすると、
・ \(\bs{F}_2/\bs{F}_1\) 累巡回拡大
・ \(\bs{F}_2/\bs{Q}\) はガロア拡大
・ \(\al_2\:\in\:\bs{K}_2\:\sb\:\bs{F}_2\)
となる。



この \(\bs{K}_i\) を \(\bs{F}_i\) に修正する操作は、\(\bs{K}_k\) を修正して \(\bs{F}_k\) にするまで続けることができる。従って、
\(\bs{Q}\sb\bs{F}_0\sb\bs{F}_1\sb\cdots\sb\bs{F}_i\sb\bs{F}_{i+1}\sb\cdots\sb\bs{F}_k=\bs{E}\)
の拡大列が存在し、
・ \(\bs{K}\:\sb\:\bs{F}_i\)
・ \(\bs{F}_{i+1}/\bs{F}_i\) は累巡回拡大
・ \(\bs{F}_k/\bs{Q}\) はガロア拡大
・ \(\al_k=\al\:\in\:\bs{F}_k(=\bs{E})\)
とすることができる。[証明終]

ガロア閉包.jpg

\(1\) の原始\(n\)乗根を含む \(\bs{Q}(\zeta)\) からのべき根拡大を考えることによって、体の拡大が巡回拡大(=ガロア群が巡回群であるガロア拡大)になり(63H)、その繰り返しは累巡回拡大になります。しかし累巡回拡大が "全体としてガロア拡大になる" とは限りません(62B)。

そこで、ひと工夫して、\(\bs{\bs{F}_i}\) が常に \(\bs{\bs{Q}}\) 上の方程式 \(\bs{g(x)}\) の最小分解体で、かつ \(\bs{\al_i}\) を含むようにすると、\(\bs{F}_i/\bs{Q}\) が常にガロア拡大になっているので、\(\bs{E}/\bs{Q}\) もガロア拡大になります。しかも最終到達点である \(\bs{F}_k=\bs{E}\) の中には、元々の方程式の解である \(\al\) がある。このような \(\bs{E}\) の存在が重要です。この \(\bs{Q}(\zeta)\:\rightarrow\:\bs{E}\) の拡大を考えることで、単なるべき根拡大列だった \(\bs{Q}\:\rightarrow\:\bs{K}\) をガロア理論の俎上に乗せることができます。

一方、\(\bs{\bs{Q}(\zeta)/\bs{Q}}\) が累巡回拡大になるのは、全く別のロジックによります。つまり、\(\bs{Q}(\zeta)/\bs{Q}\) がガロア拡大で(63D)かつ、ガロア群が巡回群の直積に同型(63F)であり、従ってガロア群が可解群(61B)だからです。そうすると累巡回拡大ガロア群の可解性62C)によって \(\bs{Q}(\zeta)/\bs{Q}\) は累巡回拡大です。

以上の2つの合わせ技で、\(\bs{Q}\) から \(\bs{E}\) に至る累巡回拡大の列ができ、しかも \(\bs{E}/\bs{Q}\) がガロア拡大になっていて、次の可解性の必要条件の証明につながります。

可解性の必要条件
可解性の必要条件:64B)

\(\bs{Q}\) 上の \(n\)次既約方程式 \(f(x)=0\) の解の一つ がべき根で表されているとする。\(f(x)\) の最小分解体を \(\bs{L}\) とするとき、\(\mr{Gal}(\bs{L}/\bs{Q})\) は可解群である。


[証明]

ガロア閉包の存在定理(64A)により、\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つがべき根で表されているとすると、
\(\bs{Q}=\bs{K}_0\sb\bs{K}_1\sb\cdots\sb\bs{K}_i\sb\bs{K}_{i+1}\sb\cdots\sb\bs{K}_k=\bs{E}\)
という拡大列で、
・ \(\bs{E}/\bs{Q}\) は累巡回拡大
・ \(\bs{E}/\bs{Q}\) はガロア拡大
・ \(\al\:\in\:\bs{E}\)
となるものが存在する。\(\bs{E}/\bs{Q}\) がガロア拡大なので、\(\mr{Gal}(\bs{E}/\bs{Q})\) による \(\al\) の移り先(\(f(x)=0\) の解)は \(\bs{E}\) に含まれる。最小分解体 \(\bs{L}\) は \(f(x)=0\) の \(n\)個の解を含む最小の体である。ゆえに \(\bs{E}\) は最小分解体 \(\bs{L}\) を含んでいる。

また、\(\bs{E}/\bs{Q}\) がガロア拡大ということは、中間体からのガロア拡大の定理(52C)により、\(\bs{E}/\bs{L}\) もガロア拡大である。従って、
 \(\mr{Gal}(\bs{E}/\bs{Q})=G\)
 \(\mr{Gal}(\bs{E}/\bs{L})=H\)
と書くと、
 \(G\) \(\sp\) \(H\) \(\sp\) \(\{\:e\:\}\)
 \(\bs{Q}\) \(\sb\) \(\bs{L}\) \(\sb\) \(\bs{E}\)
ガロア対応53B)が成り立つ。

\(\bs{L}\) は \(\bs{Q}\) 上の既約多項式 \(f(x)\) の最小分解体だから、\(\bs{L}/\bs{Q}\) はガロア拡大である(52A)。ゆえに正規性定理53C)により、\(H\) は \(G\) の正規部分群であり、
 \(\mr{Gal}(\bs{L}/\bs{Q})\:\cong\:G/H\)
が成り立つ。

\(\bs{E}/\bs{Q}\) はガロア拡大かつ累巡回拡大だから、累巡回拡大ガロア群の可解性62C)の定理によって \(G\) は可解群である。\(G\) が可解群なので、その剰余群である \(G/H\) も可解群である(61D)。従って、\(G/H\) と同型である \(\mr{Gal}(\bs{L}/\bs{Q})\) も可解群である。[証明終]



この定理の対偶をとると、

\(\bs{Q}\) 上の既約方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とするとき、\(\mr{Gal}(\bs{L}/\bs{Q})\) が可解群でなければ、\(f(x)=0\) の解のすべてはべき根で表されない(=非可解)

となります。これを用いて、非可解な5次方程式があることを証明できます。


6.5 5次方程式の解の公式はない


5次方程式には解の公式はないことをガロア理論で証明します。そのためにまず、対称群、交代群、置換の説明をします。

対称群 \(S_n\)
集合 \(\Omega_n=\{1,\:2,\:\cdots\:n\}\) から \(\Omega_n\) への全単射写像(1対1写像)の全体を \(S_n\) と書き、\(n\)次の対称群(symmetric group)と言います。\(1,\:2,\:\cdots\) は整数ではなく、集合の元を表す文字です。一般に集合 \(X\) から \(X\) への全単射写像を置換(permutation)と呼ぶので、\(S_n\) の元は \(n\) 個の文字の置換です。

\(S_n\) の元の一つを \(\sg\) とします。\(1\leq k\leq n\) とし、\(\sg\)による \(k\) の移り先を \(\sg(k)\) とすると、\(\sg\) は全単射写像なので、\(k\neq k'\) なら\(\sg(k)\neq\sg(k')\) です。従って、\((\sg(1),\sg(2),\cdots,\sg(n))\) は、\((1,2,\cdots n)\) の一つの順列になります。逆に、\((1,2,\cdots n)\) の順列の一つを \((i_1,i_2,\cdots i_n)\) とすると、\(\sg(k)=i_k\) で \(\Omega_n\) から \(\Omega_n\) への全単射写像が得られます。つまり \(S_n\) は \((1,2,\cdots n)\) のすべての順列と同一視できます。

\(S_n\) の元の2つを \(\sg\)、\(\tau\) とし、\(\sg\) と \(\tau\) の合成写像 \(\sg\tau\) を、
 \(\sg\tau(k)=\sg(\tau(k))\:\:(1\leq k\leq n)\)
で定義すると、\(\sg\tau\) も全単射写像なので \(S_n\) の元であり、\(S_n\) は群になります。単位元 \(e\) は \(e(k)=k\:(1\leq k\leq n)\) である恒等写像です。また、\(\sg\) は全単射写像なので逆写像 \(\sg^{-1}\) があり、群の定義を満たしています。

\(S_n\) は \((1,2,\cdots n)\) のすべての順列と同一視できるので、その位数は
 \(|S_n|=n\:!\)
です。\(S_n\) の元 \(\sg\) を、
 \(\sg=\left(\begin{array}{c}1&2&\cdots&n\\\sg(1)&\sg(2)&\cdots&\sg(n)\end{array}\right)\)
と表します。この表記では縦の列が合っていればよく、並び順に意味はありません。これを使うと \(\sg\) の逆元は、
 \(\sg^{-1}=\left(\begin{array}{c}\sg(1)&\sg(2)&\cdots&\sg(n)\\1&2&\cdots&n\end{array}\right)\)
です。

\(S_3\) の元を \(\sg_1,\sg_2,\:\cdots\:\sg_6\) とし、具体的に書いてみると、
 \(\sg_1=\left(\begin{array}{c}1&2&3\\1&2&3\end{array}\right)\) \(\sg_2=\left(\begin{array}{c}1&2&3\\2&3&1\end{array}\right)\)
 \(\sg_3=\left(\begin{array}{c}1&2&3\\3&1&2\end{array}\right)\) \(\sg_4=\left(\begin{array}{c}1&2&3\\1&3&2\end{array}\right)\)
 \(\sg_5=\left(\begin{array}{c}1&2&3\\3&2&1\end{array}\right)\) \(\sg_6=\left(\begin{array}{c}1&2&3\\2&1&3\end{array}\right)\)
となります。\(\sg_1\) は恒等置換 \(e\) です。なお \(S_3\) は、1.3節に出てきた3次の2面体群と同じものです。

 巡回置換 

\(S_n\) に現れる \(n\)文字からその一部を取り出します。例えば3つ取り出して、\(i,\:j,\:k\) とします。そして、
 \(i\rightarrow j,\:\:j\rightarrow k,\:\:k\rightarrow i\)
と文字を循環させ、その他の文字は不動にする置換 \(\sg\) を考えます。これが巡回置換(cyclic permutation)です。
 \(\sg=\left(\begin{array}{c}\cdots&i&\cdots&j&\cdots&k&\cdots\\\cdots&j&\cdots&k&\cdots&i&\cdots\end{array}\right)\)
と表せて、\(\cdots\) の部分は不動です。これを簡略化して、
 \(\sg=(i,\:j,\:k)\)
と表記します。\(\sg\) の逆元は、
 \(\sg^{-1}\)\(=(i,\:j,\:k)^{-1}\)
\(=\left(\begin{array}{c}\cdots&i&\cdots&j&\cdots&k&\cdots\\\cdots&j&\cdots&k&\cdots&i&\cdots\end{array}\right)^{-1}\)
\(=\left(\begin{array}{c}\cdots&j&\cdots&k&\cdots&i&\cdots\\\cdots&i&\cdots&j&\cdots&k&\cdots\end{array}\right)\)
\(=\left(\begin{array}{c}\cdots&i&\cdots&j&\cdots&k&\cdots\\\cdots&k&\cdots&i&\cdots&j&\cdots\end{array}\right)\)
\(=(k,\:j,\:i)\)
です。一般に \(m\)文字の巡回置換 \((1\leq m\leq n)\) は、
 \(\sg=(i_1,\:i_2,\:\cdots\:,i_m)\)
です。長さ \(m\) の巡回置換、とも言います。逆元は文字の順序を逆順にした、
 \(\sg^{-1}=(i_m,\:i_{m-1},\:\cdots\:,i_1)\)
です。\(m\)文字の巡回置換を群としてとらえたとき、 \(C_m\) で表します。\(C_m\) は位数 \(m\) の巡回群で、可換群です。

特に、2文字の巡回置換を互換(transposition)と言います。巡回置換と互換について、次の定理が成り立ちます。


置換は巡回置換の積:65A)

すべての置換は共通文字を含まない巡回置換の積で表せる。


[証明]

\(n\)次対称群 \(S_n\) の任意の元を \(\sg\) とすると、\(\sg\) は \(n\)文字の任意の置換である。\(n\)文字の中から \(\sg(a)\neq a\) である文字 \(a\) を選ぶ。そして \(\sg(a),\:\sg^2(a),\:\sg^3(a),\:\cdots\) という、\(\sg\) による \(a\) の写像を繰り返す列を考える。\(\sg\)による \(a\) の移り先は最大 \(n\)個なので、列の中には、
 \(\sg^j(a)=\sg^i(a)\:\:(i < j)\)
となる \(i,\:j\) が必ず出てくる。つまり、
 \(\sg^{j-i}(a)=a\)
となる \(i,\:j\) が存在する。\(k_a\) を \(\sg^{k_a}(a)=a\) となる最小の数とすると、
 \(\sg(a),\:\sg^2(a),\:\cdots\:,\sg^{k_a}(a)=a,\:\sg(a),\:\cdots\)
 \((\br{A})\)
となり、\(k_a+1\)番目で \(\sg(a)\) に戻って以降は巡回する。\(\sg_1\) を、
 \(\sg_1=(\sg(a),\:\sg^2(a),\:\cdots\:,\sg^{k_a}(a))\)
の巡回置換と定義する。

もし仮に列 \((\br{A})\) が、\(\sg\) で変化する文字全部を尽くしているなら、題意は正しい。そうでないとき、列 \((\br{A})\) に現れない文字で \(\sg(b)\neq b\) である \(b\) を選ぶ。上と同様にして、
 \(\sg(b),\:\sg^2(b),\:\cdots\:,\sg^{k_b}(b)=b\)
 \((\br{B})\)
の列が作れる。\((\br{B})\) 列に \((\br{A})\) 列と同じ文字は現れない。なぜなら、もし列 \((\br{B})\) の \(\sg^i(b)\) が \((\br{A})\) 列に現れるとすると、\(\sg^i(b)\) に \(\sg\) による置換を繰り返すといずれは \(b\) になるから、\(b\) が \((\br{A})\) 列に現れることになってしまい、「列 \((\br{A})\) に現れない文字 \(b\)」ではなくなるからである。従って、
 \(\sg_2=(\sg(b),\:\sg^2(b),\:\cdots\:,\sg^{k_b}(b)=b)\)
という、2つ目の巡回置換が定義できる。列 \((\br{A})\) と \((\br{B})\) が \(\sg\) で変化する文字全部を尽くすなら、\(\sg=\sg_2\sg_1\) である。\(\sg_1\) と \(\sg_2\) に共通の文字は現れないので、\(\sg=\sg_1\sg_2\) と書いてもよい。

以上の操作は、\(\sg\) で変化する文字全部を尽くすまで繰り返すことができる。その繰り返し回数を \(m\) とすると、
 \(\sg=\sg_1\sg_2\:\cdots\:\sg_m\)
であり、任意の置換 \(\sg\) は巡回置換の積で表せることになる。なお、恒等置換 \(e\) は、
 \(e=(i,\:j)^2\)
 \(e=(i,\:j,\:k)^3\)
などであり、巡回置換の積で表せることに変わりはない。[証明終]



置換を巡回置換の積で表すと、例えば、
 \(\sg\)\(=\left(\begin{array}{c}1&2&3&4&5&6\\1&4&5&6&3&2\end{array}\right)\)
\(=(2,\:4,\:6)(3,\:5)\)
となります。


置換は互換の積:65B)

すべての置換は互換の積で表せる。


[証明]

巡回置換 \((1,\:2,\:3)\) は
 \((1,\:2,\:3)=(1,\:3)(1,\:2)\)
と表せる(積は右から読む)。また、巡回置換 \((1,\:2,\:3\). \(4)\) は、
 \((1,\:2,\:3,\:4)=(1,\:4)(1,\:3)(1,\:2)\)
である。一般に、
 \((i_1,\:i_2,\:\cdots\:,i_m)=(i_1,\:i_m)\:\cdots\:(i_1,\:i_2)\)
である。このように巡回置換は互換の積で表せる。すべての置換は巡回置換の積で表せる(65A)ので、題意は正しい。[証明終]

交代群 \(A_n\)
一つの置換を互換の積で表す方法が一意に決まるわけではありません。たとえば、
 \((1,\:2,\:3)\)\(=(1,\:3)(1,\:2)\)
\(=(1,\:3)(2,\:3)(1,\:2)(1,\:3)\)
です(積は右から読む)。ただし、積に現れる互換の数が偶数か奇数かは一意に決まります。


置換の偶奇性:65C)

一つの置換を互換の積で表したとき、その互換の数は奇数か偶数かのどちらかに決まる。


[証明]

\(n\)変数の多項式 \(f(x_1,x_2,\cdots,x_n)\) を、
 \(f(x_1,x_2,\cdots,x_n)=\displaystyle\prod_{1\leq i < j\leq n}^{}(x_i-x_j)\)
と定義する(差積と呼ばれる)。\(S_n\) の一つの元を \(\sg\) とし、\(\sg\) を \(f(x_1,x_2,\cdots,x_n)\) に作用させることを、
 \(\sg\cdot f(x_1,x_2,\cdots,x_n)=f(x_{\sg(1)},x_{\sg(2)},\cdots,x_{\sg(n)})\)
と定義する。\(\sg\) が互換、つまり \(\sg=(i,\:j)\) であれば、
 \((i,\:j)\cdot f(x_1,x_2,\cdots,x_n)=-f(x_1,x_2,\cdots,x_n)\)
となる。これはすべての互換で成り立つ。

\(\sg\) が \(k\)個の互換の積で表されていると、
 \(\sg\cdot f(x_1,x_2,\cdots,x_n)=(-1)^kf(x_1,x_2,\cdots,x_n)\)
である。もし、\(m\neq k\) として \(\sg\) が \(m\)個の互換の積で表せたとしたら、
 \(\sg\cdot f(x_1,x_2,\cdots,x_n)=(-1)^mf(x_1,x_2,\cdots,x_n)\)
である。従って、
 \((-1)^k=(-1)^m\)
であり、\(k\) と \(m\) の偶奇は等しい。[証明終]



置換の偶奇性65C)により、置換は2つのタイプに分けることができます。偶数個の互換の積で表す置換を偶置換(even permutaion)、奇数個の互換の積で表す置換を奇置換(odd permutaion)と言います。

偶置換の積は偶置換です。従って、\(S_n\) の偶置換の元を集めた集合は群になります。これを \(n\)次交代群(alternating group)といい、\(A_n\) で表します。


交代群は正規部分群:65D)

\(S_n\) の元は同数の偶置換と奇置換から成る。従って、
 \([\:S_n\::\:A_n\:]=2\)
である。

\(A_n\) は \(S_n\) の正規部分群であり、\(S_n/A_n\) は巡回群である。


[証明]

\(B_n\) を \(S_n\) に含まれる奇置換の集合とする。\(S_n\) の任意の互換を \(\sg\) とすると、集合 \(\sg A_n\) のすべての元は奇置換だから、
 \(\sg A_n\sb B_n\)
が成り立つ。それとは逆に、集合 \(\sg B_n\) のすべての元は偶置換だから、
 \(\sg B_n\sb A_n\)
も成り立つ。この式に左から \(\sg\) を作用させると、
 \(\sg^2B_n\sb\sg A_n\)
 \(B_n\sb\sg A_n\)
となる。\(\sg A_n\sb B_n\) かつ \(B_n\sb\sg A_n\) なので、
 \(B_n=\sg A_n\)
となり、\(B_n\) と \(A_n\) の元の数は等しい。\(S_n=A_n\cup B_n\) なので、
 \([\:S_n\::\:A_n\:]=2\)
である。

\(S_n\) の部分群 \(A_n\) の元の数は \(S_n\) の元の数の半分なので、\(S_n\) は \(A_n\) の2つの左剰余類(または右剰余類)の和集合である。従って、\(B_n\) の 任意の元を \(b\) とすると、
 (\(A_n\) の左剰余類) \(S_n=A_n\cup bA_n\:\:(A_n\cap bA_n=\phi)\)
 (\(A_n\) の右剰余類) \(S_n=A_n\cup A_nb\:\:(A_n\cap A_nb=\phi)\)
となり、\(bA_n=A_nb\) である。また \(A_n\) の元 \(a\) については、\(A_n\) が群なので \(aA_n=A_n,\:A_na=A_n\) である。従って \(S_n\) の任意の元 \(\sg\) について \(\sg A_n=A_n\sg\) が成り立ち、\(A_n\) は \(S_n\) の正規部分群である。

\(A_n\) が正規部分群なので、\(S_n/A_n\) は剰余群である。\(S_n\) の任意の元を \(\sg\) とし、\(S_n/A_n\) の元を \(\sg A_n\) とすると、
 \((\sg A_n)^2=\sg A_n\sg A_n=\sg\sg A_nA_n=\sg^2A_n\)
となるが、\(\sg A_n=B_n\) であり \(\sg B_n=A_n\) だから、\(\sg^2A_n=A_n\) である。つまり、
 \((\sg A_n)^2=A_n\)
を満たす。\(A_n\) は 剰余群 \(S_n/A_n\) の単位元だから、\(S_n/A_n\) は巡回群でである。[証明終]


交代群は3文字巡回置換の積:65E)

交代群 \(A_n\) の任意の元は、3文字の巡回置換の積で表せる。


[証明]

\(A_n\) の任意の元は偶数個の互換の積で表せる。この互換の積を2つずつ右から(ないしは左から)取り出すことを考える。2つの互換の積には4つの文字があるが、それには次の2つパターンがある。
 異なる4文字
  \((i,\:j)(k,\:m)\)
 異なる3文字
  \((i,\:j)(i,\:k)\)
異なる3文字のうち、\((i,\:j)(j,\:k)\) のパターンは、\(i\) を \(j\) と読み替え、\(j\) を \(i\) と読み替えると \((j,\:i)(i,\:k)\) となり、\((i,\:j)(i,\:k)\) と同じである。また、\((i,\:j)(k,\:i)\) や \((i,\:j)(k,\:j)\) も \((i,\:j)(i,\:k)\) と同じである。

異なる2文字から成る \((i,\:j)(i,\:j)\) は恒等互換なので無視してよい。

2つの互換の積の2パターンは、いずれも3文字の巡回置換の積で表せる。つまり、
 \(\left(\begin{array}{c}i&j&k&m\\k&i&j&m\end{array}\right)=(i,\:k,\:j)\)
 \(\left(\begin{array}{c}k&i&j&m\\j&i&m&k\end{array}\right)=(j,\:m,\:k)\)
 \(\left(\begin{array}{c}i&j&k&m\\j&i&m&k\end{array}\right)=(i,\:j)(k,\:m)\)
なので、
 \((i,\:j)(k,\:m)=(j,\:m,\:k)(i,\:k,\:j)\)
である。また、巡回置換を互換の積で表す標準的な方法(65B)から、
 \((i,\:j)(i,\:k)=(i,\:k,\:j)\)
である。

\(A_n\) は「2つの互換の積」の積、で表現でき、「2つの互換の積」は「3文字の巡回置換の積」で表せるので、題意は正しい。[証明終]



なお、上の交代群は正規部分群65D)の証明では、「交代群 \(A_n\) の元の数が、対称群 \(S_n\) の元の数の半分である」ことしか使っていません。従って次の定理が成り立ちます。


半分の部分群は正規部分群:65F)

群 \(G\) の部分群を \(N\) とする。
 \(|G|=2|N|\)
のとき(つまり 群の指数 \([G:N]=2\) のとき)、\(N\) は \(G\) の正規部分群である。


対称群の可解性
対称群の可解性:65G)

5次以上の対称群、\(S_n\:\:(n\geq5)\) は可解群ではない。


[証明]

\(S_n\) の交代群を \(A_n\) とする。\(A_n\) は \(S_n\) の部分群なので、もし \(A_n\) が可解群でなければ、可解群の部分群は可解群の定理(61C)の対偶により、\(S_n\) は可解群ではない。以下、\(A_n\) が可解群でないことを背理法で証明する。

\(A_n\) が可解群と仮定して矛盾を導く。\(A_n\) が可解群とすると、定義により \(A_n\) には正規部分群 \(N\:(N\neq A_n)\) があり、\(A_n/N\) が巡回群である。

\(A_n\) の任意の2つの元を \(x,\:y\) とし、剰余類 \(xN\) と \(yN\) を考える。\(A_n/N\) は巡回群なので可換群であり、\(xNyN=yNxN\) である。\(N\) は正規部分群なので、\(Ny=yN\)、\(Nx=xN\) であり、これを用いて \(xNyN=yNxN\) を変形していくと、
 \(xNyN=yNxN\)
 \(xyNN=yxNN\)
 \(xyN=yxN\)
となる。この式に左から \(x^{-1}y^{-1}\) をかけると、
 \(x^{-1}y^{-1}xyN=x^{-1}y^{-1}yxN\)
 \(x^{-1}y^{-1}xyN=N\)
となる。部分群の元の条件の定理(41C)より、\(aN=N\) と \(a\in N\) は同値である。従って、
 \(x^{-1}y^{-1}xy\in N\)
である。

一般に \(x^{-1}y^{-1}xy\) を \(x\) と \(y\) の交換子と呼ぶ。上の式の変形プロセスから言えることは、\(A_n\) の任意の2つの元(\(N\) の元である必要はない)の交換子は \(N\) の元になるということである。

\(S_n\:\:(n\geq5)\) の任意の3文字巡回置換を \((i,\:j,\:k)\) とする。
 \((i,\:j,\:k)=(i,\:k)(i,\:j)\)
なので、\((i,\:j,\:k)\) は偶置換であり、
 \((i,\:j,\:k)\in A_n\)
である。ここで、\(\bs{i,\:j,\:k}\) とは違う2つの文字 \(\bs{l,\:m}\) を選ぶ。\(\bs{n\geq5}\) ならこれは常に可能である。そして、
 \(x=(i,\:m,\:j)\)
 \(y=(i,\:l,\:k)\)
とし、\(x,\:y\) の交換子を作ってみる。計算すると以下のようになる。

 \(x^{-1}y^{-1}xy\)
  \(=(i,\:m,\:j)^{-1}(i,\:l,\:k)^{-1}(i,\:m,\:j)(i,\:l,\:k)\)
  \(=(j,\:m,\:i)(k,\:l,\:i)(i,\:m,\:j)(i,\:l,\:k)\)

 \((i,\:l,\:k)\)\(=\left(\begin{array}{c}i&j&k&l&m\\l&j&i&k&m\end{array}\right)\)
 \((i,\:m,\:j)\)\(=\left(\begin{array}{c}l&j&i&k&m\\l&i&m&k&j\end{array}\right)\)
 \((k,\:l,\:i)\)\(=\left(\begin{array}{c}l&i&m&k&j\\i&k&m&l&j\end{array}\right)\)
 \((j,\:m,\:i)\)\(=\left(\begin{array}{c}i&k&m&l&j\\j&k&i&l&m\end{array}\right)\)

 \(x^{-1}y^{-1}xy\)
  \(=(j,\:m,\:i)(k,\:l,\:i)(i,\:m,\:j)(i,\:l,\:k)\)
  \(=\left(\begin{array}{c}i&j&k&l&m\\j&k&i&l&m\end{array}\right)\)
  \(=(i,\:j,\:k)\)

\(x^{-1}y^{-1}xy\in N\) なので、
 \((i,\:j,\:k)\in N\)
である。つまり任意の3文字巡回置換は \(N\) に含まれる。

\(A_n\) のすべての元は3文字巡回置換の積で表される(65E)から、\(A_n\) は \(N\) の元の積で表せることになる。つまり、
 \(A_n\sb N\)
だが、もともと \(N\) は \(A_n\) の部分集合だから、
 \(A_n=N\)
である。これは \(N\neq A_n\) という仮定と矛盾する。従って、\(A_n\) の正規部分群 \(N\:(N\neq A_n)\) で、\(A_n/N\) が巡回群であるようなものはなく、\(A_n\) は可解群ではない。

\(S_n\:\:(n\geq5)\) は可解群ではない部分群 \(A_n\) をもつから、可解群の部分群は可解群の定理(61C)の対偶によって、\(S_n\) は可解群ではない。[証明終]



\(S_5\)(位数 \(120\)) や、その部分群 \(A_5\)(位数 \(60\))は可解群ではありません。しかし、「\(S_5\) のすべての部分群が可解群ではない」というわけではありません。\(S_5\) の部分群では、\(F_{20}\)(位数 \(20\))、\(D_{10}\)(位数 \(10\))、\(C_5\)(位数 \(5\))が可解群であることが知られています。これについては第7章で述べます。

一般5次方程式
5次方程式には代数的に解けるものと解けないものがあります。従って、全ての5次方程式に適用可能な根の公式はありません。5次方程式に根の公式がないことはガロア以前に証明されていたのですが、なぜ根の公式がないのか、その理由を明らかにしたのがガロア理論です。

係数が変数の方程式を「一般方程式」と言います。根の公式があるということは一般方程式が解けることを意味します。以下は、一般5次方程式が代数的に解けないことの証明ですが、この証明では係数が変数ではなく、解を変数としています。


5次方程式の解の公式はない:65H)

\(\bs{Q}\) の代数拡大体を \(\bs{K}\) とする。\(\bs{K}\) の任意の元である\(k\)5つの変数 \(b_1,b_2,b_3,b_4,b_5\) を根とする多項式を、
\(\begin{eqnarray}
&&\:\:f(x)&=(x-b_1)(x-b_2)(x-b_3)(x-b_4)(x-b_5)\:\:(b_i\in\bs{K})\\
&&&=x^5-a_4x^4+a_3x^3-a_2x^2+a_1x-a_0\\
\end{eqnarray}\)
とし、\(\bs{Q}\) に \(a_0,a_1,a_2,a_3,a_4,\)を添加した代数拡大体を \(\bs{F}\) とする。つまり、
 \(\bs{F}=\bs{Q}(a_0,\:a_1,\:a_2,\:a_3,\:a_4)\)
である。

このとき、\(\bs{K}\) の \(\bs{F}\) 上の ガロア群 \(G\) は5次対称群 \(S_5\) である。\(S_5\) は可解群ではないので(65G)、従って \(b_i\) を \(a_i\) のべき根で表すことはできない。


[証明]

代数拡大体 \(\bs{F}\) の作り方から、\(\bs{K}\) は \(\bs{F}\) 上の多項式 \(f(x)\) の最小分解体である。従って \(\bs{K}/\bs{F}\) はガロア拡大である。\(G=\mr{Gal}(\bs{K}/\bs{F})\) とおくと、\(G\) は \(\bs{F}\) の元を固定する自己同型写像が作る群である。

対称群 \(S_5\) の元の一つを \(s\) とし、
 \(s=\left(\begin{array}{c}1&2&3&4&5\\s(1)&s(2)&s(3)&s(4)&s(5)\end{array}\right)\)
とする。このとき、
 \(\sg(b_i)=b_{s(i)}\:\:(i=1,2,3,4,5)\)
で、\(b_i\) に作用する写像 \(\sg\) を定義する。そうすると \(\sg\) は \(f(x)=0\) の解 \(b_i\) を共約な解に移す写像だから、自己同型写像である。また、
\(\begin{eqnarray}
&&\:\:f(x)&=(x-b_1)(x-b_2)(x-b_3)(x-b_4)(x-b_5)\:\:(b_i\in\bs{K})\\
&&&=x^5-a_4x^4+a_3x^3-a_2x^2+a_1x-a_0\\
\end{eqnarray}\)
の根と係数の関係から、
 \(a_4\)\(\overset{\text{ }}{=}\)\(b_1+b_2+b_3+b_4+b_5\)
\(a_3\)\(\overset{\text{ }}{=}\)\(b_1b_2+b_1b_3+b_1b_4+b_1b_5+b_2b_3+b_2b_4+b_2b_5+b_3b_4+b_3b_5+b_4b_5\)
\(a_2\)\(\overset{\text{ }}{=}\)\(b_1b_2b_3+\)\(b_1b_2b_4+\)\(b_1b_2b_5+\)\(b_1b_3b_4+\)\(b_1b_3b_5+\)\(b_1b_4b_5+\)\(b_2b_3b_4+\)\(b_2b_3b_5+\)\(b_2b_4b_5+\)\(b_3b_4b_5\)
\(a_1\)\(\overset{\text{ }}{=}\)\(b_1b_2b_3b_4+b_1b_2b_3b_5+b_1b_2b_4b_5+b_1b_3b_4b_5+b_2b_3b_4b_5\)
\(a_0\)\(\overset{\text{ }}{=}\)\(b_1b_2b_3b_4b_5\)
である。つまり \(a_i\:(0\leq i\leq4)\) は \(b_i\:(1\leq i\leq5)\) の対称式で表される。

従って、\(\sg(a_0)=a_0\)、\(\sg(a_1)=a_1\)、\(\sg(a_2)=a_2\)、\(\sg(a_3)=a_3\)、\(\sg(a_4)=a_4\) である。つまり \(\sg\) は \(\bs{F}=\bs{Q}(a_0,\:a_1,\:a_2,\:a_3,\:a_4)\) の元を固定する。従って \(\sg\) は \(\bs{F}\) の元を固定する \(\bs{K}\) の自己同型写像であり、\(G\) の元である。以上のことは \(S_5\) の任意の元 \(s\) について言える。つまり、\(s\in G\) である。

これを踏まえて、\(\bs{F}\) 上の \(\bs{K}\) の拡大次数 \([\:\bs{K}\::\:\bs{F}\:]\) を考えると、\([\:\bs{K}\::\:\bs{F}\:]\) は \(\mr{Gal}(\bs{K}/\bs{F})\)の位数に等しいから、
 \([\:\bs{K}\::\:\bs{F}\:]=|G|\geq|S_5|=5!=120\)
である。

次に、
 \(\bs{F}\sb\)\( \bs{F}(b_1)\sb\)\( \bs{F}(b_1,b_2)\sb\)\( \cdots\sb\)\( \bs{F}(b_1,b_2,b_3,b_4,b_5)=\bs{K}\)
という体の拡大列を考える。最初の拡大 \(\bs{F}\sb\bs{F}(b_1)\) をみると、\(b_1\) は \(\bs{F}\) 上の 5次方程式 \(f(x)=0\) の根だから、
 \([\:\bs{F}(b_1)\::\:\bs{F}\:]\leq\mr{deg}\:f(x)\:=5\)
である。等号は \(f(x)\) が既約多項式のときである。さらに、\(b_2\) は
4次方程式 \(f(x)/(x-b_1)\) の根だから、
 \([\:\bs{F}(b_1,b_2)\::\:\bs{F}(b_1)\:]\leq4\)
である。以上を順に続けると、体の拡大次数の連鎖律33H)により、
 \([\:\bs{K}\::\:\bs{F}\:]\)
  \(=\)\([\:\bs{F}(b_1,b_2,b_3,b_4,b_5)\::\:\bs{F}\:]\)
\(=\)\([\:\bs{F}(b_1,b_2,b_3,b_4,b_5)\::\:\bs{F}(b_1,b_2,b_3,b_4)\:]\cdot\)
 \([\:\bs{F}(b_1,b_2,b_3,b_4)\::\:\bs{F}(b_1,b_2,b_3)\:]\cdot\)
 \([\:\bs{F}(b_1,b_2,b_3)\::\:\bs{F}(b_1,b_2)\:]\cdot\)
 \([\:\bs{F}(b_1,b_2)\::\:\bs{F}(b_1)\:]\cdot\)
 \([\:\bs{F}(b_1)\::\:\bs{F}\:]\)
\(\leq\)\(5\cdot4\cdot3\cdot2\cdot1=5!=120\)

である。従って、\([\:\bs{K}\::\:\bs{F}\:]\geq5!\) と合わせると \([\:\bs{K}\::\:\bs{F}\:]=5!\) であり、
 \(|G|=|S_5|\)
となって、
 \(G\cong S_5\)
である。つまり、一般5次方程式のガロア群は \(S_5\) と同型であることが証明できた。\(S_5\) は可解群ではないので(65G)、それと同型である \(G\) も可解群ではない。従って \(b_i\) を \(a_i\) のべき根で表すことはできず、一般5次方程式に解の公式はない。[証明終]


6.6 可解ではない5次方程式


5次方程式の全てに適用できる解の公式がないことは、ガロア以前に証明されていました(アーベル・ルフィニの定理)。しかしガロア理論によって、解の公式がないことの「原理」が明確になりました。つまり係数が変数である一般5次方程式は、解が四則演算とべき根で表現できる(=可解である)ための必要条件を満たさないから公式は作れないのです(65H)。

ということは、この「原理」を用いて、可解ではない、係数が数値の方程式を具体的に構成できることになります。それを以下で行います。そのためにまず、コーシーの定理を証明します。なお、コーシー(19世紀フランスの数学者)の名がついた定理はいくつかありますが、これは「群論のコーシーの定理」です。

コーシーの定理
コーシーの定理:66A)

群 \(G\) の位数 \(|G|\) が素数 \(p\) を約数にもつとき、\(g^p=e\:\:(g\neq e)\) となる \(G\) の元 \(g\) が存在する。つまり、\(G\) は位数 \(p\) の巡回群を部分群としてもつ。


[証明]

本論に入る前に、証明に使う定義を行う。\(X\) を、元の数が \(N\) の集合とし、そこから重複を許して \(n\)個の元を取り出して1列に並べた順列を考える。このような順列の集合を \(P\) とする。つまり、
 \(P=\{\:(x_1,x_2,\cdots,x_n)\:|\:x_i\in X\:\}\)
である。\((x_1,x_2,\cdots,x_n)\) は並べる順序に意味がある。

\(P\) から自分自身 \(P\) への写像 \(\sg\) を、
 \(\sg\::\:(x_1,x_2,\cdots,x_n)\longmapsto(x_n,x_1,x_2,\cdots,x_{n-1})\)
と定義する。最後尾の元を先頭に持ってくる "循環写像" である(ここだけの用語)。そうすると、集合 \(P\) の任意の元、\(\bs{a}\) について、
 \(\sg^n(\bs{a})=\bs{a}\)
となり、\(\sg^n=e\) (\(e\::\) 恒等写像)である。

次に、集合 \(P\) のある元を \(\bs{a}\) としたとき、
 \(\sg^d(\bs{a})=\bs{a}\)
となる最小の \(d\:\:(1\leq d\leq n)\) を、"\(\bs{a}\) の循環位数" と定義する(ここだけの用語)。そうすると、循環位数 \(\bs{d}\)\(\bs{n}\) の約数になる。なぜなら、もし
 \(n=kd+r\:\:(1\leq r < d)\)
だとすると、
\(\begin{eqnarray}
&&\:\:\sg^n(\bs{a})&=\sg^{kd+r}(\bs{a})\\
&&&=\sg^r((\sg^d)^k(\bs{a}))\\
&&&=\sg^r(\bs{a})\\
&&\:\:\sg^r(\bs{a})&=\bs{a}\\
\end{eqnarray}\)
となって、\(d\) が \(\sg^d(\bs{a})=\bs{a}\) となる最小の数ではなくなるからである。以上を踏まえて本論に入る。



積が単位元になるような \(G\) の \(p\)個(\(p\):素数)の元の組の集合、
 \(S\:=\:\{\:(x_1,x_2,\cdots,x_p)\:\:|\:\:x_i\in G,\:x_1x_2\cdots x_p=e\:\}\)
を考える。まず、\(S\) の元の数 \(|S|\) を求める。\(S\) の始めから \(p-1\) 個までの \(x_i\:(1\leq i\leq p-1)\) は、全く任意に選ぶことができる。なぜなら、そうしておいて
 \(x_p=(x_1x_2\cdots x_{p-1})^{-1}\)
とすれば、
 \(x_1x_2\cdots x_{p-1}x_p\)
  \(=x_1x_2\cdots x_{p-1}(x_1x_2\cdots x_{p-1})^{-1}\)
  \(=e\)
となり、\(S\) の元になるからである。\(x_i\:(1\leq i\leq p-1)\) の選び方はそのすべてについて \(|G|\) 通りあるから、
 \(|S|=|G|^{p-1}\)
である。

次に、\(S\) の任意の元を \(\bs{a}\) とすると、\(\sg(\bs{a})\) もまた \(S\) の元になる。なぜなら、
 \(\bs{a}=(x_1,x_2,\cdots,x_p)\:\:\:(x_i\in G)\)
とおくと、
 \(x_1x_2\cdots x_{p-1}x_p=e\)
だが、この式に左から \(x_p\) をかけ、右から \(x_p^{-1}\) をかけると、
 \(x_px_1x_2\cdots x_{p-1}x_px_p^{-1}=x_pex_p^{-1}\)
 \(x_px_1x_2\cdots x_{p-1}=e\)
となり、これは \(\sg(\bs{a})\in S\) を意味しているからである。

\(S\) のすべての元に循環位数を割り振ると、\(\bs{p}\) が素数なので、循環位数は \(\bs{1}\)\(\bs{p}\) のどちらかである。循環位数が \(1\) である \(S\) の元とは、
 \((\overbrace{x,\:x,\:\cdots\:,\:x}^{p\:個})\:\:(x\in G)\)
のように、\(G\) の同じ元を \(p\) 個並べたものである。また、循環位数が \(p\) の元とは、\(p\)個の \(G\) の元に1つでも違うものがあるような \(S\) の元である。

そこで、循環位数 \(p\) の \(S\) の元に着目する。その一つを \(\bs{a}_1\) とすると、
 \(S_1=\{\bs{a}_1,\:\sg(\bs{a}_1),\:\sg^2(\bs{a}_1),\:\cdots\:,\sg^{p-1}(\bs{a}_1)\}\)
は、すべて相異なる \(p\) 個 の \(S\) の元である。さらに、\(S_1\) に含まれない循環位数 \(p\) の元を \(\bs{a}_2\) とすると、
 \(S_2=\{\bs{a}_2,\:\sg(\bs{a}_2),\:\sg^2(\bs{a}_2),\:\cdots\:,\sg^{p-1}(\bs{a}_2)\}\)
も、すべて相異なる \(p\) 個 の \(S\) の元であり、しかも \(S_1\) とは重複しない。この操作は順々に繰り返せるから、いずれ循環位数 \(p\) の元は \(S_1,\:S_2,\:\cdots\) でカバーできることとなる。循環位数 \(p\) の \(S\) の元の全部が、
 \(S_1\:\cup\:S_2\:\cup\:\cdots\:\cup\:S_q\)
と表現できたとしたら、その元の数は \(pq\) である。

循環位数 \(1\) の \(S\) の元の数は、\(S\) の元の数から循環位数 \(p\) の元の数を引いたものである。
 \(|S|=|G|^{p-1}\)
だったから、\(p\) が \(|G|\) の約数である、つまり \(|G|\) が \(p\) の倍数であることに注意すると、
 循環位数 \(1\) の元の数
  \(=|G|^{p-1}-pq\equiv0\:\:(\mr{mod}\:p)\)
となる。この、循環位数 \(1\) の元の数は \(0\) ではない。なぜなら、
 \((\overbrace{e,\:e,\:\cdots\:,\:e}^{p\:個})\)
は 循環位数が \(1\) の元だからである。つまり、循環位数 \(1\) の元の数は \(p\) 以上の \(p\) の倍数である。従って、\(S\) には \((e,\:e,\:\cdots\:,\:e)\) 以外に、
 \((\overbrace{g,\:g,\:\cdots\:,\:g}^{p\:個})\:\:\:\:(g\neq e,\:g\in G)\)
が必ず存在する。従って、
 \(g^p=e\:\:(g\neq e)\)
である \(g\) が存在する。この式が成立するということは、\(g\) の位数は \(p\) の約数であるが、\(p\) が素数なので、\(g\) の位数は \(p\) である。従って、
 \(\{\:g,\:g^2,\:\cdots\:,g^{p-1},\:g^p=e\:\}\)
は位数 \(p\) の巡回群である。[証明終]

可解ではない5次方程式
実数解が3つの5次方程式:66B)

\(f(x)\) を規約な5次多項式とする。方程式 \(f(x)=0\) が複素数解を2つ、実数解を3つもつなら、方程式は可解ではない。


[証明]

\(f(x)=0\) の複素数解を \(\al_1,\:\al_2\)、実数解を \(\al_3,\:\al_4,\:\al_5\) とする。また、それらを \(\bs{Q}\) に付加した体を \(\bs{L}=\bs{Q}(\al_1,\al_2,\al_3,\al_4,\al_5)\) とする。また、ガロア群 \(\mr{Gal}(\bs{L}/\bs{Q})\) を \(G\) と書く。

一般に、複素数 \(z=r+is\) が有理数係数の方程式の解なら、その共役複素数 \(\ol{\,z\,}=r-is\) も解である。その理由は以下である。

まず、\(z_1\) と \(z_2\) を2つの複素数とすると、
 \(\ol{z_1+z_2}=\ol{z_1}+\ol{z_2}\)
が成り立つ。また、
 \(z_1=r+is\)
 \(z_2=u+iv\)
とすると、
\(\begin{eqnarray}
&&\:\:z_1z_2&=ru-sv+i(su+rv)\\
&&\:\:\ol{z_1}\cdot\ol{z_2}&=(r-is)(u-iv)\\
&&&=ru-sv-i(su+rv)\\
\end{eqnarray}\)
なので、
 \(\ol{z_1z_2}=\ol{z_1}\cdot\ol{z_2}\)
である。有理数係数の方程式を、3次方程式の例で、
 \(x^3+ax^2+bx+c=0\)
とし、\(z\) をこの方程式の解だとすると、
 \(z^3+az^2+bz+c=0\)
 \(\ol{z^3+az^2+bz+c}=\ol{\,0\,}\)
 \(\ol{z^3}+\ol{az^2}+\ol{bz}+\ol{\,c\,}=0\)
 \(\ol{\,z\,}^3+\ol{\,a\,}\ol{\,z\,}^2+\ol{\,b\,}\ol{\,z\,}+c=0\)
 \(\ol{\,z\,}^3+a\ol{\,z\,}^2+b\ol{\,z\,}+c=0\)
となって、\(\ol{\,z\,}\) も方程式の解である。もちろんこれは \(n\)次方程式でも成り立つ。

そこで、\(f(x)=0\) の複素数解 \(\al_1,\:\al_2\) を、
 \(\al_1=a+ib\)
 \(\al_2=a-ib\)
とする。ここで、複素数 \(r+is\) に作用する \(\bs{L}\) の写像を \(\tau\) を、
 \(\tau(r+is)=r-is\)
と定める。そうすると、
 \(\tau(\al_1)=\al_2,\:\tau(\al_2)=\al_1,\)
 \(\tau(\al_3)=\al_3,\:\tau(\al_4)=\al_4,\:\tau(\al_5)=\al_5\)
となり、\(\tau\)は \(f(x)=0\) の2つの解を入れ替えるから \(\bs{L}\) の自己同型写像になり(51E)、\(G\) の元である。\(\al_1\) を \(1\)、\(\al_2\) を \(2\) と書き、巡回置換の記法を使うと、
 \(\tau=(1,\:2)\)
である。

一方、\(f(x)\) は規約多項式なので単拡大体の基底の定理(33F)により、\(\bs{Q}(\al_1)\) の次元は \(5\)、つまり \([\bs{Q}(\al_1)\::\:\bs{Q}]=5\) である。そうすると、拡大次数の連鎖律33H)により、
 \([\:\bs{L}\::\:\bs{Q}\:]=[\:\bs{L}\::\:\bs{Q}(\al_1)\:][\bs{Q}(\al_1)\::\:\bs{Q}]\)
が成り立つので、\([\:\bs{L}\::\:\bs{Q}\:]\) は \(5\) の倍数である。\(|G|=[\:\bs{L}\::\:\bs{Q}\:]\) なので、ガロア群 \(G\) の位数は \(5\) を約数にもつ。

そうするとコーシーの定理66A)より、\(G\) の部分群には位数 \(5\) の巡回群がある。それを、
 \(H=\{\:\sg,\:\sg^2,\:\sg^3,\:\sg^4,\:\sg^5=e\:\}\)
とする。5つの解の置換の中で、位数 \(5\) の巡回群を生成する \(\sg\) は、巡回置換の記法で書くと、
 \(\sg_1=(1,\:2\:,3,\:4,\:5)\)
 \(\sg_2=(1,\:3\:,5,\:2,\:4)\)
 \(\sg_3=(1,\:4\:,2,\:5,\:3)\)
 \(\sg_4=(1,\:5\:,4,\:3,\:2)\)
の4つである。これらには、
 \(\sg_1^{\:2}=\sg_2\)
 \(\sg_1^{\:3}=\sg_3\)
 \(\sg_1^{\:4}=\sg_4\)
の関係がある。そこで、\(G\) の中にある位数 \(5\) の巡回群は、
 \(\sg=(1,\:2\:,3,\:4,\:5)\)
だとして一般性を失わない。そうすると、\(G\) の中には、
 \(\tau=(1,\:2)\)
 \(\sg=(1,\:2\:,3,\:4,\:5)\)
の2つの元があることになる。実は、

\(\tau,\:\sg\) から出発して、この2つの元とその逆元の演算を繰り返すことによって、5次対称群 \(\bs{S_5}\) の元が全部作り出せる

のである。それを証明する。

\(G\) は群なので \(\sg^{-1}\) も \(G\) に含まれる(\(\sg\) は位数 \(5\) の巡回群の元なので \(\sg^{-1}=\sg^4\))。まず、\(\sg\tau\sg^{-1}\) を計算してみると、
 \(\sg\tau\sg^{-1}=(1,2,3,4,5)(1,2)(5,4,3,2,1)\)
 \((5,4,3,2,1)\)\(=\left(\begin{array}{c}1&2&3&4&5\\5&1&2&3&4\end{array}\right)\)
 \((1\:2)\)\(=\left(\begin{array}{c}5&1&2&3&4\\5&2&1&3&4\end{array}\right)\)
 \((1,2,3,4,5)\)\(=\left(\begin{array}{c}5&2&1&3&4\\1&3&2&4&5\end{array}\right)\)
なので、
\(\begin{eqnarray}
&&\:\:\sg\tau\sg^{-1}&=\left(\begin{array}{c}1&2&3&4&5\\1&3&2&4&5\end{array}\right)\\
&&&=(2,\:3)\\
\end{eqnarray}\)
となる。同様にして、
 \((5,4,3,2,1)\)\(=\left(\begin{array}{c}1&2&3&4&5\\5&1&2&3&4\end{array}\right)\)
 \((2,\:3)\)\(=\left(\begin{array}{c}5&1&2&3&4\\5&1&3&2&4\end{array}\right)\)
 \((1,2,3,4,5)\)\(=\left(\begin{array}{c}5&1&3&2&4\\1&2&4&3&5\end{array}\right)\)
なので、
\(\begin{eqnarray}
&&\:\:\sg^2\tau\sg^{-2}&=\sg(\sg\tau\sg^{-1})\sg^{-1}\\
&&&=\sg\cdot(2,3)\cdot\sg^{-1}\\
&&&=\left(\begin{array}{c}1&2&3&4&5\\1&2&4&3&5\end{array}\right)\\
&&&=(3,\:4)\\
\end{eqnarray}\)
である。以下、
 \((5,4,3,2,1)\)\(=\left(\begin{array}{c}1&2&3&4&5\\5&1&2&3&4\end{array}\right)\)
 \((3,\:4)\)\(=\left(\begin{array}{c}5&1&2&3&4\\5&1&2&4&3\end{array}\right)\)
 \((1,2,3,4,5)\)\(=\left(\begin{array}{c}5&1&2&4&3\\1&2&3&5&4\end{array}\right)\)
 \(\rightarrow\:\sg^3\tau\sg^{-3}\)\(=\left(\begin{array}{c}1&2&3&4&5\\1&2&3&5&4\end{array}\right)\)
\(=(4,\:5)\)

 \((5,4,3,2,1)\)\(=\left(\begin{array}{c}1&2&3&4&5\\5&1&2&3&4\end{array}\right)\)
 \((4,\:5)\)\(=\left(\begin{array}{c}5&1&2&3&4\\4&1&2&3&5\end{array}\right)\)
 \((1,2,3,4,5)\)\(=\left(\begin{array}{c}4&1&2&3&5\\5&2&3&4&1\end{array}\right)\)
 \(\rightarrow\:\sg^4\tau\sg^{-4}\)\(=\left(\begin{array}{c}1&2&3&4&5\\5&2&3&4&1\end{array}\right)\)
\(=(1,\:5)\)
となる。つまり、
 \((1,\:2)\)、\((2,\:3)\)、\((3,\:4)\)、\((1,\:5)\)
は \(G\) の元である。

一般に、
 \((i,\:j)=(1,\:i)(1,\:j)(1,\:i)\)
である。なぜなら、
\(\begin{eqnarray}
&&\:\:(1,\:i)(1,\:j)(1,\:i)\cdot1&=(1,\:i)(1,\:j)\cdot i\\
&&&=(1,\:i)\cdot i=1\\
&&\:\:(1,\:i)(1,\:j)(1,\:i)\cdot i&=(1,\:i)(1,\:j)\cdot1\\
&&&=(1,\:i)\cdot j=j\\
&&\:\:(1,\:i)(1,\:j)(1,\:i)\cdot j&=(1,\:i)(1,\:j)\cdot j\\
&&&=(1,\:i)\cdot1=i\\
\end{eqnarray}\)
が成り立つからである。従って、
 \((2,\:3)=(1,\:2)(1,\:3)(1,\:2)\)
である。この両辺に左と右から \((1,\:2)\) をかけると、
 \((1,\:2)(2,\:3)(1,\:2)=(1,\:3)\)
となり、\((2,\:3),\:(1,\:2)\) が \(G\) の元なので \((1,\:3)\) も \(G\) の元である。同様に、
 \((3,\:4)=(1,\:3)(1,\:4)(1,\:3)\)
であるが、\((3,\:4),\:(1,\:3)\) が \(G\) の元なので、\((1,\:4)\) も \(G\) の元である。結局、
 \((1,\:2)\)、\((1,\:3)\)、\((1,\:4)\)、\((1,\:5)\)
が \(G\) の元であることが分かった。

\(S_5\) は5文字の置換をすべて集めた集合である。すべての置換は互換の積で表せて(65B)、かつ任意の互換 \((i,\:j)\) は、
 \((i,\:j)=(1,\:i)(1,\:j)(1,\:i)\)
と表せるから、5文字の置換はすべて、
 \((1,\:2)\)、\((1,\:3)\)、\((1,\:4)\)、\((1,\:5)\)
という4つの互換の積で表現できる。つまり、\(S_5\) はこの4つの互換で生成できる。以上をまとめると、

 \((1,\:2)\)、\((1,\:2\:,3,\:4,\:5)\)
  \(\Downarrow\)
 \((1,\:2)\)、\((2,\:3)\)、\((3,\:4)\)、\((1,\:5)\)
  \(\Downarrow\)
 \((1,\:2)\)、\((1,\:3)\)、\((1,\:4)\)、\((1,\:5)\)
  \(\Downarrow\)
 \(S_5\) のすべての元

という、"\(S_5\)を生成する連鎖" の存在が証明できた。従って \(G\cong S_5\) である。\(S_5\) は可解群ではない(65G)。従って、複素数解を2つ、実数解を3つもつ規約な5次方程式は可解ではない。[証明終]



この、実数解が3つの5次方程式の定理(66B)から、可解ではない5次方程式の実例を簡単に構成できます。たとえば、
 \(f(x)=x^5-5x+a\)
とおき、\(f(x)=0\) の方程式を考えます。
 \(f'(x)=5x^4-5\)
なので、\(f'(x)=0\) の実数解は \(1,\:-1\) の2つです。
 \(f(\phantom{-}1)=a-4\)
 \(f(-1)=a+4\)
なので、
 \(a-4 < 0 < a+4\)
なら、\(f(x)=0\) には3つの実数解があります。この条件は、
 \(-4 < a < 4\)
ですが、\(a=0\) のときは \(f(x)\) は規約多項式ではありません。また \(a=3,\:-3\) のときも、
 \(x^5-5x+3=(x^2+x-1)(x^3-x^2+2x-3)\)
 \(x^5-5x-3=(x^2-x-1)(x^3+x^2+2x+3)\)
と因数分解できるので、規約多項式ではありません。従って、
 \(x^5-5x+2=0\)
 \(x^5-5x+1=0\)
 \(x^5-5x-1=0\)
 \(x^5-5x-2=0\)
が可解ではない5次方程式の例であり、これらの方程式の解を四則演算とべき根で表すのは不可能です。

x^5-5x+1=0.jpg
\(\bs{y=x^5-5x+1}\) のグラフ

方程式 \(x^5-5x+1=0\) の3つの実数解を小さい方から \(\al,\beta,\gamma\) とし、数式処理ソフトそので近似解を求めると、
 \(\al\fallingdotseq-1.5416516841045247594\)
 \(\beta\fallingdotseq\phantom{-}0.2000641026299753912\)
 \(\gamma\fallingdotseq\phantom{-}1.4405003973415600893\)
である。近似解の精度を上げるのはいくらでも可能であり、方程式の形もシンプルだが、これらの解を四則演算とべき根で表すことはできない。グラフと近似解は WolframAlpha による。

「6.可解性の必要条件」終わり 
次回に続く


nice!(0) 

No.356 - 高校数学で理解するガロア理論(3) [科学]

\(\newcommand{\bs}[1]{\boldsymbol{#1}}
\newcommand{\mr}[1]{\mathrm{#1}}
\newcommand{\br}[1]{\textbf{#1}}
\newcommand{\ol}[1]{\overline{#1}}\)
 
3.多項式と体(続き) 
 


3.3 線形空間


ガロア理とし論の一つの柱は、代数拡大体を線形空間(ベクトル空間)としてとらえることで、線形空間の「次元」や「基底」を使って理論が組み立てられています。線形空間には精緻な理論体系がありますが、ここではガロア理論に必要な事項の説明をします。

線形空間の定義
線形空間の定義:33A)

集合 \(V\) と 体 \(\bs{K}\) が次を満たすとき、\(V\) を \(\bs{\bs{K}}\) 上の線形空間(=ベクトル空間。linear space / vector space)と言う。

加算の定義

\(V\) の任意の元 \(\br{u},\:\br{v}\) に対して \((\br{u}+\br{v})\in V\) が定義されていて、この加算(\(+)\) の定義に関して \(V\) は可換群である。すなわち、

\((1)\) 単位元の存在
\(\br{u}+\br{x}=\br{x}\) となる \(\br{x}\) が存在する。これを \(0\) と書く。
\((2)\) 逆元の存在
\(\br{u}+\br{x}=0\) となる \(\br{x}\) が存在する。これを \(-\br{u}\) と書く。
\((3)\) 結合則が成り立つ
任意の元 \(\br{u},\:\br{v}\:,\br{w}\) について、\((\br{u}+\br{v})+\br{w}=\br{u}+(\br{v}+\br{w})\)
\((4)\) 交換則が成り立つ
\(\br{u}+\br{v}=\br{v}+\br{u}\)

スカラー倍の定義

\(V\) の任意の元 \(\br{u}\) と \(\bs{K}\) の任意の元 \(k\) に対して、スカラー倍 \(k\br{u}\in V\) が定義されていて、加算との間に次の性質がある。\(\br{u},\:\br{v}\) を \(V\) の元、\(k,\:m\) を \(\bs{K}\) の元とし、\(\bs{K}\) の乗法の単位元を \(1\) とする。

\((1)\:\:k(m\br{u})=(km)\br{u}\)
\((2)\:\:(k+m)\br{u}=k\br{u}+m\br{u}\)
\((3)\:\:k(\br{u}+\br{v})=k\br{u}+k\br{v}\)
\((4)\:\:1\br{v}=\br{v}\)


高校数学に出てくる "2次元ベクトル" とは、上記の定義の \(\bs{K}\) を \(\bs{R}\)(実数の体)とし、\(V\) を2つの実数のペアの集合 \(\{\:(x,y)\:|\:x,y\in\bs{R}\:\}\) とするベクトル空間(の要素)のことです。

上の定義の \(0\) は線形空間 \(V\) の元です。以下、\(V\) の単位元 \(0\)(= \(0\) ベクトル)と、体 \(\bs{K}\) の加法の単位元 \(0\) が混在しますが、文脈や式から明らかなので、同じ \(0\) で記述します。

1次独立と1次従属
1次独立と1次従属:33B)

1次独立

線形空間 \(V\) の元の組、\(\{\br{v}_1,\br{v}_2,\cdots,\br{v}_n\}\) に対して、
 \(a_1\br{v}_1+a_2\br{v}_2+\)..\(+a_n\br{v}_n=0\)
を満たす \(\bs{K}\) の元 \(a_1,a_2,\cdots,a_n\) が、\(a_1=a_2=\cdots=a_n=0\) しかないとき、\(\{\br{v}_1,\br{v}_2,\cdots,\br{v}_n\}\) は1次独立であるという。

1次従属

1次独立でないときが1次従属である。つまり、線形空間 \(V\) の元の組、\(\{\br{v}_1,\br{v}_2,\cdots,\br{v}_n\}\) に対して、
 \(a_1\br{v}_1+a_2\br{v}_2+\)..\(+a_n\br{v}_n=0\)
を満たす、少なくとも一つは \(0\) でない \(\bs{K}\) の元 \(a_1,a_2,\cdots,a_n\) があるとき、\(\{\br{v}_1,\br{v}_2,\cdots,\br{v}_n\}\) は1次従属であるという。


基底
基底の定義:33C)

線形空間 \(V\) の元の組、\(\{\br{v}_1,\br{v}_2,\cdots,\br{v}_n\}\) に対して、次の2つが満たされるとき、\(\{\br{v}_1,\br{v}_2,\cdots,\br{v}_n\}\) を基底という。

・ \({\br{v}_1,\br{v}_2,\cdots,\br{v}_n}\) は1次独立である。
・ \(V\) の任意の元 \(\br{v}\) は、\(\bs{K}\) の元 \(a_1,a_2,\cdots,a_n\) を選んで、
\(\br{v}=a_1\br{v}_1+a_2\br{v}_2+\)..\(+a_n\br{v}_n\)
と表せる。

基底から1つの元を除外したものは基底ではなくなる。また基底に1つの元を加えたものも基底ではない。


\(\{\br{v}_1,\br{v}_2,\cdots,\br{v}_n\}\) が基底だと、\(\{\br{v}_1,\br{v}_2,\cdots,\br{v}_{n-1}\}\) は基底ではありません。なぜなら、もし \(\{\br{v}_1,\br{v}_2,\cdots,\br{v}_{n-1}\}\) が基底だとすると、
 \(\br{v}_n=a_1\br{v}_1+a_2\br{v}_2+\)..\(+a_{n-1}\br{v}_{n-1}\)
と表せますが、これは、
 \(a_1\br{v}_1+a_2\br{v}_2+\)..\(+a_{n-1}\br{v}_{n-1}-\br{v}_n=0\)
ということであり、\(\{\br{v}_1,\br{v}_2,\cdots,\br{v}_n\}\) が1次従属となってしまって、基底の要件を満たさなくなるからです。基底に、別の1つの元を加えるケースも同じことです。


基底の数の不変性:33D)

\(\{\br{u}_1,\br{u}_2,\cdots,\br{u}_m\}\) と \(\{\br{v}_1,\br{v}_2,\cdots,\br{v}_n\}\) がともに線形空間 \(V\) の基底であるとき、\(m=n\) である。


[証明]

この定理の証明のために、まず次の補題を証明する。

[補題]

線形空間 \(V\) の任意の \(n\) 個の元を \(\{\br{u}_1,\br{u}_2,\cdots,\br{u}_n\}\) とする(基底でなくてもよい)。線形空間 \(V\) の \(n+1\) 個の元 \(\{\br{w}_1,\br{w}_2,\cdots,\br{w}_n,\br{w}_{n+1}\}\) がすべて \(\{\br{u}_1,\br{u}_2,\cdots,\br{u}_n\}\) の1次結合で表されるなら、\(\{\br{w}_1,\br{w}_2,\cdots,\br{w}_n,\br{w}_{n+1}\}\) は1次従属である。


数学的帰納法を使う。まず、\(n=1\) のとき、この定理は成り立つ。つまり、
 \(\br{w}_1=k_1\br{u}_1\)
 \(\br{w}_2=k_2\br{u}_1\)
と表されるなら、
 \(k_2\br{w}_1-k_1\br{w}_2=0\)
であり、\(\br{w}_1\) と \(\br{w}_2\) は1次従属である。そこで、\(n\) が \(k\:\:(\geq1)\) のときに成り立つとし、\(n=k+1\) でも成り立つことを証明する。

以降、表記を見やすくするため、\(k=3\) の場合で記述する。ただし、一般性を失うことがないように記述する。\(\br{w}_1,\br{w}_2,\br{w}_3,\br{w}_4\) が、
 \(\br{w}_1=a_{11}\br{u}_1+a_{12}\br{u}_2+a_{13}\br{u}_3\)
 \(\br{w}_2=a_{21}\br{u}_1+a_{22}\br{u}_2+a_{23}\br{u}_3\)
 \(\br{w}_3=a_{31}\br{u}_1+a_{32}\br{u}_2+a_{33}\br{u}_3\)
 \(\br{w}_4=a_{41}\br{u}_1+a_{42}\br{u}_2+a_{43}\br{u}_3\)
と表せたとする。ここで \(\br{w}_4\) の係数に注目する。もし、
 \(a_{41}=a_{42}=a_{43}=0\)
であれば、\(\br{w}_1,\br{w}_2,\br{w}_3,\br{w}_4\) は1次従属である。なぜなら、
 \(b_1\br{w}_1+b_2\br{w}_2+b_3\br{w}_3+b_4\br{w}_4=0\)
の式を満たす \(b_1,b_2,b_3,b_4\) は、
 \(b_1=b_2=b_3=0\)
 \(b_4\neq0\)
として実現でき、\(\br{w}_1,\br{w}_2,\br{w}_3,\br{w}_4\) は1次従属の定義を満たすからである。そこで、\(a_{41},a_{42},a_{43}\) のうち \(0\) でないものが少なくとも一つあるとする。それを \(a_{43}\) とし、
 \(a_{43}\neq0\)
とする。この仮定で一般性を失うことはない。ここで、
 \(\br{x}_i=\br{w}_i-\dfrac{a_{i3}}{a_{43}}\br{w}_4\:\:(i=1,2,3)\)
とおいて \(\br{u}_3\) の項を消去する。計算すると、
\(\begin{eqnarray}
&&\:\:\br{x}_1=&\left(a_{11}-\dfrac{a_{13}a_{41}}{a_{43}}\right)\br{u}_1+\left(a_{12}-\dfrac{a_{13}a_{42}}{a_{43}}\right)\br{u}_2\\
&&\:\:\br{x}_2=&\left(a_{21}-\dfrac{a_{23}a_{41}}{a_{43}}\right)\br{u}_1+\left(a_{22}-\dfrac{a_{23}a_{42}}{a_{43}}\right)\br{u}_2\\
&&\:\:\br{x}_3=&\left(a_{31}-\dfrac{a_{33}a_{41}}{a_{43}}\right)\br{u}_1+\left(a_{32}-\dfrac{a_{33}a_{42}}{a_{43}}\right)\br{u}_2\\
\end{eqnarray}\)
となる。そうすると、\(\br{x}_1,\:\br{x}_2,\:\br{x}_3\) は「線形空間 \(V\) の2つの元 \(\br{u}_1,\br{u}_2\) の1次結合で表された3つの元」である。従って、帰納法の仮定により、\(\br{x}_1,\:\br{x}_2,\:\br{x}_3\) は1次従属である。1次従属だから、
 \(b_1\br{x}_1+b_2\br{x}_2+b_3\br{x}_3=0\)
 \((\br{A})\)
となる少なくとも一つは \(0\) ではない \(b_1,\:b_2,\:b_3\) がある。
 \(\br{x}_1=\br{w}_1-\dfrac{a_{13}}{a_{43}}\br{w}_4\)
 \(\br{x}_2=\br{w}_2-\dfrac{a_{23}}{a_{43}}\br{w}_4\)
 \(\br{x}_3=\br{w}_3-\dfrac{a_{33}}{a_{43}}\br{w}_4\)
だったから、これを \((\br{A})\) 式に代入すると、
 \(b_1\br{w}_1+b_2\br{w}_2+b_3\br{w}_3-\)
  \(\dfrac{1}{a_{43}}(b_1a_{13}+b_2a_{23}+b_3a_{33})\br{w}_4=0\)
となる。この式における \(\br{w}_1,\:\br{w}_2,\:\br{w}_3,\:\br{w}_4\) の係数の少なくとも一つは \(0\) ではない。従って、\(a_{41},a_{42},a_{43}\) のうち \(0\) でないものが少なくとも一つある場合にも \(\br{w}_1,\:\br{w}_2,\:\br{w}_3,\:\br{w}_4\) は1次従属である。

以上で、線形空間 \(V\) の \(k=3\) 個の元(\(\br{u}_1,\br{u}_2,\br{u}_3\))の1次結合で、\(k+1=4\) 個の元(\(\br{w}_1,\br{w}_2,\br{w}_3,\br{w}_4\))のすべてが表されば、その4個の元は1次従属であることが証明できた。\(k=3\) としたのは表記を見やすくするためであり、\(k=3\) であることの特殊性は使っていない。つまり、\(k\geq1\) のすべてで成り立つ。従って数学的帰納法により補題が正しいことが証明できた。[補題の証明終]



以上を踏まえて、\(A=\{\br{u}_1,\br{u}_2,\cdots,\br{u}_m\}\) と \(B=\{\br{v}_1,\br{v}_2,\cdots,\br{v}_n\}\) がともに線形空間 \(V\) の基底であるとき、\(m=n\) となることを証明する。

もし仮に \(m < n\) だとすると、\(B\) の中から \((m+1)\) 個の元を選べる。それを \(B\:'=\{\br{v}_1,\br{v}_2,\cdots,\br{v}_{m+1}\}\) とすると、\(A\) は 線形空間 \(V\) の基底だから、\(B\:'\) の元は \(A\) の元の1次結合で表現できる。つまり \(B\:'\) の \((m+1)\)個の元のすべては \(m\)個の元の1次結合で表されるから、[補題]によって \(B\:'\) は1次従属である。\(B\) は \(B\:'\) と同じものか、または \(B\:'\) に数個の元を付け加えたものだから、\(B\:'\) が1次従属なら \(B\) も1次従属である。しかし、\(B\) は線形空間 \(V\) の基底だから1次独立であり、矛盾が生じる。従って、\(m\geq n\) である。

もし仮に \(m > n\) だとしても、全く同様の考察により矛盾が生じる。従って、\(m\leq n\) である。この結果、\(m=n\) であることが証明できた。[証明終]



この基底の数の不変性の定理(33D)により、線形空間には次のように「次元」が定義できることになります。

次元
次元の不変性:33E)

線形空間の基底に含まれる元の数が有限個のとき、その個数を線形空間の次元と言う。次元は基底の取り方によらない。


線形空間の次元や基底と、代数拡大体を結びつけるのが次の定理です。

単拡大体の基底
単拡大体の基底:33F)

\(\bs{Q}\) 上の \(n\)次既約多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の解の一つを \(\alpha\) とする。単拡大体である \(\bs{Q}(\alpha)\) は \(\bs{Q}\) 上の \(n\)次元線形空間であり、\(\{1,\:\alpha,\:\alpha^2,\:\cdots\:,\alpha^{n-1}\}\) は \(\bs{Q}(\alpha)\) の基底である。


[証明]

\(\bs{Q}(\alpha)\) の基底であるための条件は、

① \(\{1,\:\alpha,\:\alpha^2,\:\cdots\:,\alpha^{n-1}\}\) が1次独立である
② \(\bs{Q}(\alpha)\) の任意の元が \(\{1,\:\alpha,\:\alpha^2,\:\cdots\:,\alpha^{n-1}\}\) の1次結合で表される

の2つである。② は単拡大の体の定理(32C)で証明されているので、① を証明する。多項式 \(g(x)\) を、

 \(g(x)=a_0+a_1x+a_2x^2+\cdots+a_{n-1}x^{n-1}\)

とおく。\(\{1,\:\alpha,\:\alpha^2,\:\cdots\:,\alpha^{n-1}\}\) が1次独立であることを言うには、
 \(g(\alpha)=0\) であれば \(a_i\:\:(0\leq i\leq n-1)\) は全て \(0\)
を言えばよい。以降、背理法を使って証明する。\(g(\alpha)=0\) で、\(a_i\:\:(0\leq i\leq n-1)\) のうち、少なくとも1つはゼロでないと仮定する。

\(g(x)\) が定数(つまり \(a_0\) の項のみ)のときは、\(g(\alpha)=0\) なら \(a_0=0\) なので、「少なくとも1つはゼロでない」に反する。そこで \(g(x)\) は1次以上の多項式であるとする。

そうすると、2つの方程式 \(f(x)=0\) と \(g(x)=0\) は共通の解 \(\alpha\) をもつことになる。しかし、\(f(x)\) は \(n\)次の既約多項式であり、\(g(x)\) は1次以上で \(n\)次未満の多項式である。既約多項式の定理231E)により、このような2つの方程式は共通の解を持たない。ゆえに矛盾が生じる。従って、\(g(\alpha)=0\) のとき \(a_i\:\:(0\leq i\leq n-1)\) は全て \(0\) であり、① が証明された。

基底の数が線形空間の次元であり、\(\bs{Q}(\alpha)\) は \(\bs{Q}\) 上の \(n\)次元線形空間である。[証明終]

拡大次数とその連鎖律
方程式の解になる数が代数的数で、\(\bs{Q}\) に代数的数を添加した体が代数拡大体です。「3.2 体」の「単拡大の体」でとりあげた \(\bs{Q}(\alpha)\) は代数拡大体であり、次元は \(n\) でした(32C)。この次元を「体の拡大」の視点で考えてみます。

「体 \(\bs{K}\) 上の線形空間 \(V\)」の定義において、\(\bs{K}=\bs{Q}\) とし \(V=\bs{Q}\) とすると、「有理数体 \(\bs{Q}\) は、\(\bs{Q}\) 上の線形空間」であると言えます。\(\bs{Q}\) では加算もスカラー倍(=乗算)も定義されていて、可換だからです。線形空間の定義にある各種の演算は、体の演算の一部です。

線形空間 \(\bs{Q}\) の基底は、\(0\) ではない \(\bs{Q}\) の元 \(v\) です。\(0\) を含む \(\bs{Q}\) の任意の元を \(a\) とすると、
 \(av=0\:\:\:(v\neq0)\)
が成り立つのは \(a=0\) しかないので \(v\) は1次独立であり、また \(av\) で全ての \(\bs{Q}\) の元が表されるからです。一方、\(0\) は、
 \(a\cdot0=0\)
が \(0\) ではない \(a\) について成り立つので1次従属です。以上から、線形空間 \(\bs{Q}\) の基底として \(1\) を選ぶことにします。次元は \(1\) です。

\(\bs{Q}\) に \(\sqrt{2}\) を添加した \(\bs{Q}(\sqrt{2})\) は \(\bs{Q}\) の代数拡大体で、\(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\) です。\(\bs{Q}(\sqrt{2})\) は \(\bs{\bs{Q}}\) 上の線形空間です。\(\bs{Q}(\sqrt{2})\) の基底としては、まず \(1\) を選ぶことができます。\(1\) を \(\bs{Q}\) の元でスカラー倍すると、\(\bs{Q}(\sqrt{2})\) の部分集合である \(\bs{Q}\) の元の全てが表せます。

\(\bs{Q}(\sqrt{2})\) の元の全てを表現するためには、さらに基底に \(\sqrt{2}\) を追加します。\(\sqrt{2}\) は \(\bs{Q}\) の元の1次結合では表せないので、\(1\) と \(\sqrt{2}\) は 1次独立です。\(1,\:\sqrt{2}\) が \(\bs{Q}(\sqrt{2})\) の基底で、次元は \(2\) です。

さらに \(\bs{Q}(\sqrt{2})\) に \(\sqrt{3}\) を添加した代数拡大体 \(\bs{Q}(\sqrt{2},\sqrt{3})\) を考えてみると、\(\bs{Q}(\sqrt{2},\sqrt{3})\) は \(\bs{\bs{Q}(\sqrt{2})}\) 上の線形空間であり、基底は \(1,\:\sqrt{3}\) です。\(1\) と \(\sqrt{3}\) は 1次独立であり、\(\bs{\bs{Q}(\sqrt{2},\sqrt{3})}\) の全ての元は、\(\bs{\bs{Q}(\sqrt{2})}\) の元を係数とする \(\bs{1}\)\(\bs{\sqrt{3}}\) の1次結合で表現できるからです。\(\bs{\bs{Q}(\sqrt{2})}\) 上の線形空間 \(\bs{\bs{Q}(\sqrt{2},\sqrt{3})}\) の次元は \(\bs{2}\) です。

ここで \(\bs{Q}(\sqrt{2},\sqrt{3})\) を \(\bs{\bs{Q}}\) 上の線形空間と考えると、その基底はまず、\(1,\:\sqrt{2},\:\sqrt{3}\) ですが、これだけでは不足で、\(\sqrt{6}\) を加える必要があります。\(\sqrt{6}\) は体としての演算(乗算)でできる数ですが、\(1,\:\sqrt{2},\:\sqrt{3}\) の1次結合では表現できないからです。\(\bs{Q}\) 上の線形空間 \(\bs{Q}(\sqrt{2},\sqrt{3})\) の基底は \(1,\:\sqrt{2},\:\sqrt{3},\:\sqrt{6}\) であり、次元は \(4\) です。

ここまでの基底の表現はあくまで一例ですが、どういう基底を選ぼうと基底の数=次元は不変量であるというのが「次元の不変性」でした。以上の考察を踏まえて、拡大次数を定義し、拡大次数の連鎖律を証明します。


拡大次数の定義:33G)

代数拡大体 \(\bs{F},\:\bs{K}\) が \(\bs{F}\:\subset\:\bs{K}\) であるとき、\(\bs{K}\) は \(\bs{F}\) 上の線形空間である。\(\bs{K}\) の次元を、\(\bs{K}\)の(\(\bs{F}\)からの)拡大次数といい、
 \([\:\bs{K}\::\:\bs{F}\:]\)
で表す。



拡大次数の連鎖律:33H)

代数拡大体 \(\bs{F},\:\bs{M},\:\bs{K}\) が \(\bs{F}\:\subset\:\bs{M}\:\subset\:\bs{K}\) であるとき、
 \([\:\bs{K}\::\:\bs{F}\:]=[\:\bs{K}\::\:\bs{M}\:][\:\bs{M}\::\:\bs{F}\:]\)
が成り立つ。


[証明]

\([\:\bs{M}\::\:\bs{F}\:]=m\)、\([\:\bs{K}\::\:\bs{M}\:]=n\) とする。以下、表記を見やすくするため、\(m=3,\:n=2\) の場合で記述する。もちろん一般性を失わないように記述する。

\(\bs{F}\) 上の線形空間 \(\bs{M}\) の基底を
 \(u_1,\:u_2,\:u_3\)
とすると、\(\bs{M}\) の任意の元 \(b\) は、
 \(b=a_1u_1+a_2u_2+a_3u_3\:\:(a_i\in\bs{F},\:u_i\in\bs{M},\:1\leq i\leq m)\)
と表せる。

\(\bs{M}\) 上の線形空間 \(\bs{K}\) の基底を
 \(v_1,\:v_2\)
とすると、\(\bs{K}\) の任意の元 \(x\) は、
 \(x=b_1v_1+b_2v_2\:\:(b_j\in\bs{M},\:v_j\in\bs{K},\:1\leq j\leq n)\)
と表せる。\(b_1,\:b_2\) を \(\bs{M}\) の基底 \(u_1,u_2,u_3\) で表すと、
 \(b_1=a_{11}u_1+a_{21}u_2+a_{31}u_3\)
 \(b_2=a_{12}u_1+a_{22}u_2+a_{32}u_3\)
  \((\:a_{ij}\in\bs{F}\:)\)
となるが、これを用いて \(x\) を表すと、
\(\begin{eqnarray}
&&\:\:x=&a_{11}u_1v_1+a_{21}u_2v_1+a_{31}u_3v_1+\\
&&&a_{12}u_1v_2+a_{22}u_2v_2+a_{32}u_3v_2\\
\end{eqnarray}\)
となる。つまり、\(\bs{K}\) の任意の元は \(\bs{F}\) の元を係数とする、\(u_1v_1\)、\(u_2v_1\)、\(u_3v_1\)、\(u_1v_2\)、\(u_2v_2\)、\(u_3v_2\) の1次結合で表現できる。

ここで \(x=0\) とすると、
 \((a_{11}u_1+a_{21}u_2+a_{31}u_3)v_1+\)
 \((a_{12}u_1+a_{22}u_2+a_{32}u_3)v_2=0\)
であるが、\(v_1,v_2\) は \(\bs{K}\) の基底なので1次独立であり、従って、
 \(a_{11}u_1+a_{21}u_2+a_{31}u_3=0\)
 \(a_{12}u_1+a_{22}u_2+a_{32}u_3=0\)
である。すると、\(u_1,u_2,u_3\) は \(\bs{M}\) の基底なので1次独立であり、
 \(a_{11}=a_{21}=a_{31}=a_{12}=a_{22}=a_{32}=0\)
である。従って、\(u_iv_j\:\:(1\leq i\leq m,\:1\leq j\leq n)\) は1次独立である。

\(u_iv_j\:\:(1\leq i\leq m,\:1\leq j\leq n)\) の \(mn\) 個の元は、
① 1次独立
②  \(\bs{F}\) の元を係数とする1次結合で \(\bs{K}\) の元のすべてを表せる
から、\(\bs{F}\) 上の線形空間 \(\bs{K}\) の基底であり、\(\bs{K}\) の次元は \(mn\) である。以上により、
 \([\:\bs{K}\::\:\bs{F}\:]=[\:\bs{K}\::\:\bs{M}\:][\:\bs{M}\::\:\bs{F}\:]\)
である。[証明終]

体の一致
2つの代数拡大体 \(\bs{F}\) と \(\bs{K}\) の次元が一致するとします。たとえば \(\bs{Q}(\sqrt{2})\) と \(\bs{Q}(\sqrt{3})\) の次元はいずれも \(2\) です。もちろん \(\bs{Q}(\sqrt{2})\) と \(\bs{Q}(\sqrt{3})\) は体として別物です。

それでは、\(\bs{F}\subset\bs{K}\) という関係があり、かつ \(\bs{F}\) と \(\bs{K}\) の次元が一致するとき、\(\bs{F}\) と \(\bs{K}\) は体として一致すると言えるのでしょうか。

これはイエスで、それを次に証明します。この定理は、ガロア理論の証明の過程において、2つの体が実は同じものであることを言うときに使われる論法です。証明の都合上、\(\bs{F}\) ではなく \(\bs{K}_0\) と書きます。


体の一致:33I)

体 \(\bs{K}_0\) と 体 \(\bs{K}\) があり、\(\bs{K}_0\:\subset\:\bs{K}\) を満たしている。\(\bs{K}_0\) と \(\bs{K}\) が有限次元であり、その次元が同じであれば、\(\bs{K}_0=\bs{K}\) である。


[証明]

体 \(\bs{K}_0\) と \(\bs{K}\) を、\(\bs{Q}\) 上の線形空間と見なし、その次元を \(n\) とする。\(\bs{K}_0\) の基底を \(\{a_1,\:a_2,\:\cdots\:,a_n\}\) とする。\(\bs{K}_0\) が \(\bs{K}\) の真部分集合である、つまり \(\bs{K}_0\:\subsetneq\:\bs{K}\) と仮定して、背理法で証明する。

\(\bs{K}_0\:\subsetneq\:\bs{K}\) だと、\(a_{n+1}\notin\bs{K}_0,\:a_{n+1}\in\bs{K}\) である元 \(a_{n+1}\) が存在する。この \(a_{n+1}\) は \(\{a_1,\:a_2,\:\cdots\:,a_n\}\) の1次結合では表せない。なぜなら、もし表せたとしたら、\(\bs{K}_0\) の全ての元は基底である \(\{a_1,\:a_2,\:\cdots\:,a_n\}\) の1次結合で表されるので \(a_{n+1}\in\bs{K}_0\) になってしまうからである。

そこで、\(\{a_1,\:a_2,\:\cdots\:,a_n,\:a_{n+1}\}\) を考えると、この元の並びは1次独立である。なぜなら、もし1次従属だとすると、
 \(a_1x_1+a_2x_2+\cdots+a_nx_n+a_{n+1}x_{n+1}=0\)
となる \(x_i\in\bs{Q}\:\:(1\leq i\leq n+1)\) があって、そのうち少なくとも一つは \(0\) ではない。もし \(x_{n+1}\neq0\) だとすると、\(a_{n+1}\) が \(\{a_1,\:a_2,\:\cdots\:,a_n\}\) の1次結合で表されることになり、\(a_{n+1}\in\bs{K}_0\) となって矛盾が生じる。また \(x_{n+1}=0\) だとすると、
 \(a_1x_1+a_2x_2+\cdots+a_nx_n=0\)
であるが、この場合は \(x_i\:\:(1\leq i\leq n)\) の中に少なくとも一つは \(0\) でないものがあることになり、\(\{a_1,\:a_2,\:\cdots\:,a_n\}\) が基底である(=1次独立である)ことに矛盾する。従って \(\{a_1,\:a_2,\:\cdots\:,a_n,\:a_{n+1}\}\) は1次独立である。

\(\{a_1,\:a_2,\:\cdots\:,a_n,\:a_{n+1}\}\) の1次結合で表される全ての元の集合を \(\bs{K}_1\) とする。\(\{a_1,\:a_2,\:\cdots\:,a_n,\:a_{n+1}\}\) はすべて \(\bs{K}\) の元であるから、\(\bs{K}_1\:\subset\:\bs{K}\) である。また \(\bs{K}_1\) の任意の元は1次独立である \(\{a_1,\:a_2,\:\cdots\:,a_n,\:a_{n+1}\}\) の1次結合で表されるから、\(\{a_1,\:a_2,\:\cdots\:,a_n,\:a_{n+1}\}\) は \(\bs{K}_1\) の基底であり、すなわち \(\bs{K}_1\) の次元は \(n+1\) である。\(\bs{K}_1=\bs{K}\) なら \(\bs{K}\) の次元が \(n+1\) になって矛盾するから、\(\bs{K}_1\neq\bs{K}\) つまり \(\bs{K}_1\:\subsetneq\:\bs{K}\) である。

以上の論理を繰り返すと \(\bs{K}_2\:\subsetneq\:\bs{K}\) である \(n+2\) 次元の \(\bs{K}_2\) の存在を示せるが、この操作は無限に繰り返えせるから、\(\bs{K}\) は無限個の基底をもつ無限次元の体となる。これは \(\bs{K}\) の次元が有限次元の \(n\) であることに矛盾する。従って背理法の仮定は誤りであり、\(\bs{K}_0\:=\:\bs{K}\) である。[証明終]

代数拡大体の構造
多項式と代数拡大体の相互関係をまとめると次のようになります。


① 体 \(\bs{Q}\) 上の\(\bs{n}\)次多項式 \(f(x)\) が(複素数の範囲で)
 \(f(x)=(x-\alpha_1)(x-\alpha_2)\cdots(x-\alpha_n)\)
と因数分解できるとき、
 \(\bs{Q}(\alpha_1,\:\:\alpha_2,\:\:\cdots\:\:,\:\:\alpha_n)\)
を \(f(x)\) の最小分解体と言う。つまり、\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解のすべてを \(\bs{Q}\) に添加した体が最小分解体である。

② すべての代数拡大体は単拡大体である(32B)。従って最小分解体も単拡大体である。つまり原始元 \(\theta\) があって、\(\bs{Q}(\theta)\) と表せる。

③ \(\theta\) の最小多項式を \(\bs{m}\)多項式の \(g(x)\) とすると、\(g(x)\) は既約多項式である(31I)。

④ 方程式 \(g(x)=0\) の解の一つが \(\theta\) であるから、
 \(1,\:\:\theta,\:\:\theta^2,\:\:\cdots,\:\:\theta^{m-1}\)
の \(m\)個の元は \(\bs{Q}(\theta)\) の基底である(33F)。つまり \(\bs{Q}(\theta)\) は \(m\)次元である。従って、\(\bs{Q}(\alpha_1,\:\alpha_2,\:\cdots\:,\:\alpha_n)\) も \(m\)次元である。


以下、例をいくつかあげます。

 \(x^4-5x^2+6\) 

\(f(x)\) を4次多項式、
 \(f(x)=x^4-5x^2+6\)
とします。\(f(x)\) は、
 \(f(x)=(x^2-2)(x^2-3)\)
と因数分解できるので既約多項式ではありません。また、
 \(f(x)=(x-\sqrt{2})(x+\sqrt{2})(x-\sqrt{3})(x+\sqrt{3})\)
なので、\(f(x)\) の最小分解体は、
 \(\bs{Q}(\sqrt{2},\sqrt{3})\)
です。\(\bs{Q}(\sqrt{2},\:\sqrt{3})\) は、\(\bs{Q}\) 上の方程式 \(x^2-2=0\) の解 \(\sqrt{2}\) による拡大体を \(\bs{Q}(\sqrt{2})\) とし、\(\bs{Q}(\sqrt{2})\) 上の方程式 \(x^2-3=0\) の解 \(\sqrt{3}\) による拡大体が \(\bs{Q}(\sqrt{2},\:\sqrt{3})\) であると見なせます。つまり、
 \(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\:\subset\:\bs{Q}(\sqrt{2},\sqrt{3})\)
です。拡大次数は
 \([\:\bs{Q}(\sqrt{2}):\bs{Q}\:]=2\)
 \([\:\bs{Q}(\sqrt{2},\sqrt{3}):\bs{Q}(\sqrt{2})\:]=2\)
 \([\:\bs{Q}(\sqrt{2},\sqrt{3}):\bs{Q}\:]=4\)
です。\(\bs{Q}\) 上の線形空間 \(\bs{Q}(\sqrt{2},\sqrt{3})\) の基底は、
\(\begin{eqnarray}
&&\:\:B_1&=(\:1,\:\sqrt{2},\:1\cdot\sqrt{3},\:\sqrt{2}\cdot\sqrt{3}\:)\\
&&&=(\:1,\:\sqrt{2},\:\sqrt{3},\:\sqrt{6}\:)\\
\end{eqnarray}\)
とすることができます。

一方、
 \(\theta=\sqrt{2}+\sqrt{3}\)
とおくと、
 \(\bs{Q}(\theta)=\bs{Q}(\sqrt{2},\sqrt{3})\)
となります。なぜなら、
 \(\sqrt{2}=\dfrac{1}{2}(\theta-\dfrac{1}{\theta})\)
 \(\sqrt{3}=\dfrac{1}{2}(\theta+\dfrac{1}{\theta})\)
であり、\(\sqrt{2}\) と \(\sqrt{3}\) が \(\theta\) と有理数の加減乗除で表現できるからです。\(\bs{Q}(\sqrt{2},\sqrt{3})\) は \(\bs{Q}(\sqrt{2}+\sqrt{3})\) という単拡大体です。

\(\theta=\sqrt{2}+\sqrt{3}\) から根号を消去すると、
 \(\theta^4-10\theta^2+1=0\)
となるので、\(\theta\)の最小多項式は、
 \(g(x)=x^4-10x^2+1\)
であり、この \(g(x)\) は既約多項式です。\(y=x^2-5\) とおくと、
\(\begin{eqnarray}
&&\:\:g(x)&=y^2-24\\
&&&=(y-2\sqrt{6})(y+2\sqrt{6})\\
\end{eqnarray}\)
なので、
\(\begin{eqnarray}
&&\:\:g(x)&=&(x^2-5-2\sqrt{6})(x^2-5+2\sqrt{6})\\
&&&=&(x-\sqrt{2}-\sqrt{3})(x+\sqrt{2}-\sqrt{3})\cdot\\
&&&& (x-\sqrt{2}+\sqrt{3})(x+\sqrt{2}+\sqrt{3})\\
\end{eqnarray}\)
となり、\(g(x)=0\) の解は、\(\sqrt{2}+\sqrt{3}\)、\(-\sqrt{2}+\sqrt{3}\)、\(\sqrt{2}-\sqrt{3}\)、\(-\sqrt{2}-\sqrt{3}\) の4つです。その \(g(x)=0\) の解の一つが \(\theta=\sqrt{2}+\sqrt{3}\) なので、単拡大体の基底の定理(33F)を適用して、\(\bs{Q}(\theta)\) の基底を、
 \(B_2=(\:1,\:\:\theta,\:\:\theta^2,\:\:\theta^3\:)\)
の4個に選ぶことができます。拡大次数は \([\:\bs{Q}(\theta):\bs{Q}\:]=4\) です。

\(B_1\) と \(B_2\) は、同じ体である \(\bs{Q}(\theta)=\bs{Q}(\sqrt{2},\sqrt{3})\) の基底なので、相互に1次結合で表現できます。\(B_2\) の1次結合で \(B_1\) を表現すると、
 \(\sqrt{2}=\dfrac{1}{2}(\phantom{-}\theta^3-9\theta)\)
 \(\sqrt{3}=\dfrac{1}{2}(-\theta^3+11\theta)\)
 \(\sqrt{6}=\dfrac{1}{2}(\phantom{-}\theta^2-5)\)
となります。

 \(x^3-2\) 

\(f(x)\) を3次多項式、
 \(f(x)=x^3-2\)
とします。これは既約多項式です。

\(x^3-1=0\) 解で \(1\) でないもの一つを \(\omega\) とします(= \(1\) の原始\(3\)乗根)。
 \(x^3-1=(x-1)(x^2+x+1)\)
なので \(\omega\) は、
 \(\omega^2+\omega+1=0\)
を満たします。この2次方程式の解は2つありますが、
 \(\omega=\dfrac{-1+\sqrt{3}\:i}{2}\)
とします。方程式 \(x^3-2=0\) の解は、
 \(\sqrt[3]{2},\:\:\sqrt[3]{2}\omega,\:\:\sqrt[3]{2}\omega^2\)
の3つです、従って、\(f(x)\) の最小分解体は、
 \(\bs{Q}(\sqrt[3]{2},\:\sqrt[3]{2}\omega,\:\sqrt[3]{2}\omega^2)=\bs{Q}(\sqrt[3]{2},\:\omega)\)
です。これは、
 \(\bs{Q}\:\subset\:\bs{Q}(\sqrt[3]{2})\:\subset\:\bs{Q}(\sqrt[3]{2},\:\omega)\)
という構造をしています。基底は、単拡大体の基底の定理(33F)を順次適用して、
 \(\bs{Q}(\sqrt[3]{2})\) の基底(\(\bs{Q}\) 上の線形空間)
  \(1,\:\sqrt[3]{2},\:(\sqrt[3]{2})^2\)
 \(\bs{Q}(\sqrt[3]{2},\:\omega)\) の基底(\(\bs{Q}(\sqrt[3]{2})\) 上の線形空間\()\)
  \(1,\:\omega\)
です。これらを総合すると、
 \(\bs{Q}(\sqrt[3]{2},\:\omega)\) の基底(\(\bs{Q}\) 上の線形空間\()\)
  \(1,\) \(\sqrt[3]{2},\) \((\sqrt[3]{2})^2,\)
  \(\omega,\) \(\sqrt[3]{2}\omega,\) \((\sqrt[3]{2})^2\omega\)
です。拡大次数は
 \([\:\bs{Q}(\sqrt[3]{2}):\bs{Q}\:]=3\)
 \([\:\bs{Q}(\sqrt[3]{2},\:\omega):\bs{Q}(\sqrt[3]{2})\:]=2\)
 \([\:\bs{Q}(\sqrt[3]{2},\:\omega):\bs{Q}\:]=6\)
となります。

\(\bs{Q}(\sqrt[3]{2},\:\omega)\) の原始元 \(\theta\) を、
 \(\theta=\sqrt[3]{2}+\omega\)
と選ぶことができます。なぜなら、計算は省きますが、
 \(\sqrt[3]{2}\)\(=\dfrac{1}{9}(\)\(2\theta^5+3\theta^4+6\theta^3-6\theta^2+9\theta\)\(+18)\)
 \(\omega\)\(=\dfrac{1}{9}(-\)\(2\theta^5-3\theta^4-6\theta^3+6\theta^2\)\(-18)\)
と表せるので、\(\bs{Q}\) に \(\sqrt[3]{2},\:\omega\) を添加した拡大体は \(\theta\) を添加した拡大体と同じものでからです。さらに、
 \(\theta=\sqrt[3]{2}+\dfrac{-1+\sqrt{3}\:i}{2}\)
の式を2乗や3乗して \(i\) と根号を消去すると、計算過程は省きますが、
 \(\theta^6+3\theta^5+6\theta^4+3\theta^3+9\theta+9=0\)
となります。従って、\(\theta\) の最小多項式を \(g(x)\) とすると、
 \(g(x)=x^6+3x^5+6x^4+3x^3+9x+9\)
という6次多項式です。\(\bs{Q}(\sqrt[3]{2},\:\omega)\) は 6次方程式 \(g(x)=0\) の根の一つである \(\theta\) を使って、
 \(\bs{Q}(\sqrt[3]{2},\:\omega)=\bs{Q}(\theta)\)
という単拡大体(次元は \(6\))と表現できます。

 \(x^3-3x+1\) 

1.3 ガロア群」の「ガロア群の例」で書いたように、\(x^3-3x+1=0\) の解を \(\alpha,\:\beta,\:\gamma\) とすると、
 \(\beta=\alpha^2-2\)
 \(\gamma=\beta^2-2\)
 \(\alpha=\gamma^2-2\)
の関係があり、\(\alpha,\:\beta,\:\gamma\) のどれか一つの加減乗除で他の2つが表現できます。これにより、\(f(x)=x^3-3x+1\) の最小分解体は、
 \(\bs{Q}(\alpha,\beta,\gamma)=\bs{Q}(\alpha)=\bs{Q}(\beta)=\bs{Q}(\gamma)\)
です。基底は、たとえば \(1,\:\alpha,\:\alpha^2\) であり、
 \([\:\bs{Q}(\alpha,\beta,\gamma):\bs{Q}\:]=3\)
です。\(\alpha\) の最小多項式は、3次多項式である \(f(x)=x^3-3x+1\) です。



ちなみに、3次多項式の最小分解体の次元が \(3\) になる条件を書いておきます。まず、2次方程式の例ですが、
 \(x^2+ax+b=0\)
の方程式の解を \(\alpha,\:\beta\) とすると、
 \(x^2+ax+b=(x-\alpha)(x-\beta)\)
です。そうすると、根と係数の関係から、
 \(a=-(\alpha+\beta)\)
 \(b=\alpha\beta\)
です。ここで、判別式 \(\bs{D}\) を、
 \(D=(\alpha-\beta)^2\)
と定義すると、
\(\begin{eqnarray}
&&\:\:D=&\alpha^2-2\alpha\beta+\beta^2\\
&&&=(\alpha+\beta)^2-4\alpha\beta\\
&&&=a^2-4b\\
\end{eqnarray}\)
となります。この判別式を使って解の状況がわかります。つまり、
\(\cdot D\:\geq\:0\) なら2つの実数解(重根は2と数える)
\(\cdot D\:\geq\:0\) で \(\sqrt{D}\) が有理数なら、2つの有理数解
をもちます。

以上を3次方程式に拡張できます。2乗の項がない既約な3次方程式を、
 \(x^3+ax+b=0\)
とし、3つの根を \(\alpha,\:\beta,\:\gamma\) とすると、
 \(x^3+ax+b=(x-\alpha)(x-\beta)(x-\gamma)\)
 \((\br{A})\)
  \(\alpha+\beta+\gamma=0\)
 \((\br{B})\)
  \(\alpha\beta+\beta\gamma+\gamma\alpha=a\)
  \(\alpha\beta\gamma=-b\)
となります。3次方程式の判別式 \(D\) は、
 \(D=(\alpha-\beta)^2(\beta-\gamma)^2(\gamma-\alpha)^2\)
で定義されます。計算すると、
 \(D=-4a^3-27b^2\)
となります。

ここで、\(D\) が、ある有理数 \(q\) の2乗の場合を考えます。つまり、
 \(D=q^2\)
です。そうすると、
 \(q=(\alpha-\beta)(\beta-\gamma)(\gamma-\alpha)\)
 \((\br{C})\)
です(\(-q\) でも成り立ちますが割愛します)。

\((\br{A})\) 式の両辺を \(x\) で微分して \(x=\alpha\) を代入すると、
 \(3\alpha^2+a=(\alpha-\beta)(\alpha-\gamma)\)
 \((\br{D})\)
が得られます。\((\br{C})\) 式と \((\br{D})\) 式の両辺同士を割り算すると、
 \(\dfrac{q}{3\alpha^2+a}=-(\beta-\gamma)\)
 \((\br{E})\)
となります。そうすると、\((\br{B})\) 式と \((\br{E})\) 式を用いて、\(\beta\) と \(\gamma\) を \(\alpha\) の式として表現できます。その結果は、
 \(\beta=\dfrac{2a\alpha+3b-q}{2(3\alpha^2+a)}\)
 \(\gamma=\dfrac{2a\alpha+3b+q}{2(3\alpha^2+a)}\)
です。式の形はともかく、要するに、
 \(\beta\) と \(\gamma\) が \(\alpha\) の加減乗除で表現できる
わけです。このことは、
 \(\bs{Q}(\alpha,\beta,\gamma)=\bs{Q}(\alpha)\)
であることを意味します。\(\bs{Q}(\alpha,\beta,\gamma)\) は、既約な3次方程式の根の一つである \(\alpha\) の単拡大体なので、その次元は \(3\) です。

まとめると、判別式 \(D\) が有理数の2乗であるとき、既約 \(3\)次多項式の最小分解体の次元が \(3\) になります。\(x^3-3x+1\) の場合、\(a=-3,\:b=1\) なので、
 \(D=-4a^3-27b^2=81=9^2\)
となり、次元が \(3\) です。



既約多項式ではない3次多項式の拡大次数はもっと小さくなります。たとえば \((x-1)(x^2+2)\) の最小分解体は \(\bs{Q}(\sqrt{2}\:i)\) であり、拡大次数は \(2\) です。また \((x-2)^3\) の最小分解体は \(\bs{Q}\) そのもので、拡大次数は \(1\) です。

まとめると、3次多項式 \(f(x)\) の最小分解体の拡大次数は、\(f(x)=0\) の解を \(\alpha,\:\beta,\:\gamma\) とすると、
 \([\:\bs{Q}(\alpha,\beta,\gamma):\bs{Q}\:]\:=\:6,\:3,\:2,\:1\)
の4種あることになります(この4種しかないことの理由は後の章にあります)。

 
4.一般の群 
 

ガロア理論の核心(第5章以降)に入る前の最後として、群についての各種の定義や定理を説明します。これらはいずれも第5章以降で必要になります。


4.1 部分群\(\cdot\)正規部分群、剰余類\(\cdot\)剰余群


部分集合の演算
以降の証明では集合の演算が多々出てきます。その定義は次の通りでです。これはあくまで群の "部分集合" に関するもので、それが部分群かどうかは別問題です。


部分集合の演算:41A)

群 \(G\) の2つの部分集合を \(H,\:N\) とする。\(H\) と \(N\) の演算結果である \(G\) の部分集合、\(HN\) を次の式で定義する。

 \(HN\:=\:\{\:hn\:|\:h\in H,\:n\in N,\:hn\) は群の演算定義による \(\}\)

群 \(G\) の元の演算では結合則が成り立つから、部分集合の演算でも結合則が成り立つ。つまり \(H_1,\:H_2,\:H_3\) をを3つの部分群とすると、
 
 \((H_1H_2)H_3=H_1(H_2H_3)\)

である。部分集合の元は \(1\)つでもよいから、\(x\) が \(G\) の元で \(x\) だけの部分集合を \(\{x\}\) とすると、
 \(H_1(\{x\}H_2)=(H_1\{x\})H_2\)
である。これを、
 \(H_1(xH_2)=(H_1x)H_2\)
と記述する。


部分群の定理
部分群に関する定理をいくつかあげます。これらはいずれも後の定理の証明の過程で使います。

 部分群の十分条件 

部分群の十分条件:41B)

群 \(G\) の部分集合を \(N\) とし、\(N\) の任意の2つの元を \(x,\:y\) とする。

 \(xy\in N,\:x^{-1}\in N\)

なら、\(N\) は \(G\) の部分群である。


[証明]

\(N\) の元 \(x,\:y\) は \(G\) の元でもあるので、\(xy,\:x^{-1},\:y^{-1}\) は \(G\) の演算として定義されている。

\(y=x^{-1}\) とおくと \(xy=xx^{-1}=e\in N\) なので、\(N\) は単位元を含む。つまり、\(N\) は演算で閉じていて、単位元が存在し、逆元が \(N\) の元である。また結合則は \(G\) の元として成り立っている。従って \(N\) は \(G\) の部分群である。[証明終]

 部分群の元の条件 

部分群の元の条件:41C)

群 \(G\) の部分群を \(N\) とし、\(G\) の 元を \(x\) とすると、次の2つは同値である。

 ① \(xN\:=\:N\)
 ② \(x\:\in\:N\)


[証明]

[① \(\bs{\Rightarrow}\) ②]
\(N\) には \(G\) の単位元 \(e\) が含まれるから、\(xe\) は \(xN\) に含まれる。
 \(x=xe\in xN=N\) \(\Rightarrow\) \(x\in N\)
である。

[② \(\bs{\Rightarrow}\) ①]
\(x\in N\) とし、\(N\) の任意の元を \(a\) とすると、\(N\) は群だから \(xa\in\:N\) である。\(N\) の異なる2つの元を \(a,\:b\:\:(a\neq b)\) とすると、\(xa\neq xb\) である。なぜなら、もし \(xa=xb\) だとすると、\(x\) の逆元 \(x^{-1}\) を左からかけて \(a=b\) となり、矛盾するからである。以上により、\(xH\) は \(H\) の全ての元を含むから \(xH=H\) である。[証明終]

 部分群の共通部分 

部分群の共通部分は部分群:41D)

\(G\) の部分群を \(H,\:N\) とすると、\(H\cap N\) は部分群である。


[証明]

\(G\) の部分群を \(H,\:N\) とし、\(H\cap N\) の任意の2つの元を \(x,\:y\) とすると、\(x,\:y\in H,\:\:x,\:y\in N\) なので、
 \(xy\in H,\:x^{-1}\in H\)
 \(xy\in N,\:x^{-1}\in N\)
であり、
 \(xy\in H\cap N,\:x^{-1}\in H\cap N\)
となって、部分群の十分条件の定理(41B)により \(H\cap N\) は部分群である。[証明終]

剰余類
剰余類の定義:41E)

有限群 \(G\) の位数を \(n\) とし( \(|G|=n\) )、\(H\) を \(G\) の部分群とする。\(H\) に左から \(G\) のすべての元、\(g_1,\:g_2,\:\cdots\:,\:g_n\) かけて、集合、
 \(g_1H,\:g_2H,\:\cdots\:,g_nH\)
を作る。

\(g_1H,\:g_2H,\:\cdots\:,g_nH\) から、同じになる集合を集めたものを剰余類と呼ぶ。その同じになる集合から代表的なものを一つ取り出し、
 \(xH\:\:(x\in G)\)
の形で剰余類を表す。\(g_1H,\:g_2H,\:\cdots\:,g_nH\) から剰余類が \(d\) 個できたとし、それらを、
 \(x_1H,\:x_2H,\:\cdots\:,x_dH\)
とすると、
 \(i\neq j\) のとき \(x_iH\:\cap\:x_jH=\phi\)
 \(G=x_1H\:\cup\:x_2H\:\cup\:\cdots\:\cup\:x_dH\)
である。剰余類は、群 \(G\) の元を部分群 \(H\) によって分類したものといえる。

\(x_1H,\:x_2H,\:\cdots\:,x_dH\) を「左剰余類」という。同じことが \(G\) の元を右からかけたときにも成り立ち、\(Hx_1',\:Hx_2',\:\cdots\:,Hx_d'\) を「右剰余類」という。

群 \(G\) の 部分群 \(H\) による剰余類の個数 \(d\) について、\(d\cdot|H|=|G|\) が成り立つ。この \(d\) を「\(G\) の \(H\) による指数」といい、\([\:G\::\:H\:]\) で表す。つまり、
 \(|G|=[\:G\::\:H\:]\cdot|H|\)
である(ラグランジュの定理)。


[証明]

\(|G|=[\:G\::\:H\:]\cdot|H|\) であることを証明する。2つの剰余類 \(x_1H\) と \(x_2H\) が共通の元をもつとする。その共通な元が、\(x_1H\) では \(x_1h_i\)、\(x_2H\) では \(x_2h_j\) と表されているものとする。
 \(x_1h_i=x_2h_j\)
左から \(x_2^{-1}\)、右から \(h_i^{-1}\) をかけると、
 \(x_2^{-1}x_1h_ih_i^{-1}=x_2^{-1}x_2h_jh_i^{-1}\)
 \(x_2^{-1}x_1=h_jh_i^{-1}\)
\(h_jh_i^{-1}\in H\) だから、
 \(x_2^{-1}x_1\in H\)
を得る。部分群の元の条件の定理(41C)により、\(xH=H\) と \(x\in H\) は同値だから、
 \(x_2^{-1}x_1H=H\)
となる。左から \(x_2\) をかけると、
 \(x_1H=x_2H\)
を得る。これは、「2つの剰余類 \(x_1H\) と \(x_2H\) が共通の元をもつとすると、2つの剰余類は一致する」ことを示している。従って、

2つの剰余類 \(x_1H\) と \(x_2H\) は、\(x_1H=x_2H\) か \(x_1H\cap x_2H=\phi\) のどちらか

である。\(H\) は 単位元 \(e\) を含むから、
 \(g_1H\:\cup\:g_2H\:\cup\:\cdots\:\cup\:g_nH\)
という和集合を作ると、そこには \(G\) のすべての元が含まれる。従って、
 \(G=g_1H\:\cup\:g_2H\:\cup\:\cdots\:\cup\:g_nH\)
である。剰余類 \(x_1H,\:x_2H,\:\cdots\:x_dH\) は、\(g_1H,\:g_2H,\:\cdots\:,g_nH\) を整理・分類したものだから、
 \(G=x_1H\:\cup\:x_2H\:\cup\:\cdots\:\cup\:x_dH\)
である。この式の右辺の剰余類は共通の元がなく、それぞれの剰余類の元の数はすべて \(|H|\) だから、
 \(|G|=d\cdot|H|\)
である。従ってラグランジュの定理
 \(|G|=[\:G\::\:H\:]\cdot|H|\)
が成り立つ。[証明終]



ラグランジュの定理から、

群 \(G\) の元 \(g\) の位数(\(g^x=e\) となる最小の \(x\))を \(n\) とすると、\(n\) は群位数 \(|G|\) の約数である。

ことがわかります。なぜなら、

 \(H=\{e,\:g,\:g^2,\:\cdots\:,\:g^{n-1}\}\)

とおくと、\(H\) は \(G\) の部分群(巡回群)になり、ラグランジュの定理によって \(|H|=n\) が \(|G|\) の約数になるからです。また、

群位数が素数の群は巡回群である。

こともわかります。なぜなら、群 \(G\) の位数を \(p\)(素数)とすると、単位元ではない \(G\) の任意の元 \(g\:(\neq e)\) の位数は \(p\) であり、つまり \(G\) は \(g\) を生成元とする位数 \(p\) の巡回群(\(C_p\))だからです。

正規部分群
正規部分群の定義:41F)

有限群 \(G\) の部分群を \(H\) とする。\(G\) の全ての元 \(g\) について、

 \(gH=Hg\)

が成り立つとき、\(H\) を \(G\) の正規部分群(normal subgroup)という。正規部分群では左剰余類と右剰余類が一致する。

定義により、\(G\) および \(\{e\}\) は \(G\) の正規部分群である。また \(G\) が可換群であると、その部分群は正規部分群である。巡回群は可換群だから、巡回群の部分群は正規部分群である。


正規部分群 \(H\) の定義は、\(G\) の任意の元 \(g\) に対して、
 \(gHg^{-1}=H\)
となる \(H\)、としても同じです。また 任意の \(h\in H\) について、
 \(ghg^{-1}\in H\)
となる \(H\)、としても同じです。

剰余群
剰余群の定義:41G)

有限群 \(G\) の正規部分群を \(H\) とする。\(G\) の \(H\) による剰余類

 \(x_1H,\:x_2H,\:\cdots\:,x_dH\:\:(\:x_i\in G,\:d=[\:G\::\:H\:]\:)\)

部分集合の演算の定義(41A)で群になる。この群を \(G\) の \(H\) による剰余群(quotient group)といい、\(G/H\) で表す。剰余群は商群とも言う。


[証明]

\(H\) が正規部分群のとき、剰余類が群になることを証明する。\(x_iH\) は \(G\) の剰余類なので、

 \(G=x_1H\cup x_2H\cup\cdots\cup x_dH\)
   \((i\neq j\:のとき\:x_iH\cap x_jH=\phi)\)

と表されている。2つの剰余類、\(x_iH,\:x_jH\) の演算を行うと、
\(\begin{eqnarray}
&&\:\:(x_iH)(x_jH)&=x_iHx_jH=x_i(Hx_j)H\\
&&&=x_i(x_jH)H=x_ix_jHH\\
&&&=x_ix_j(HH)=x_ix_jH\\
\end{eqnarray}\)
つまり、
\(\begin{eqnarray}
&&\:\:(x_iH)(x_jH)&=x_ix_jH\\
\end{eqnarray}\)
となる。\(H\) は正規部分群なので \(Hx_j=x_jH\) であることと、\(H\) は部分群なので \(HH=H\) であることを用いた。

\(x_ix_j\) は \(G\) の元だから、\(x_ix_jH\) は \(G\) の剰余類のうちの一つである。従って \((x_iH)(x_jH)\) の演算は \(G\) の剰余類の中で閉じている。また、
 \((x_iH\cdot x_jH)\cdot x_kH=x_ix_jH\cdot x_kH=x_ix_jx_kH\)
 \(x_iH\cdot(x_jH\cdot x_kH)=x_iH\cdot x_jx_kH=x_ix_jx_kH\)
 \((x_iH\cdot x_jH)\cdot x_kH=x_iH\cdot(x_jH\cdot x_kH)\)
であるから、結合法則が成り立っている。さらに、
 \(H\cdot xh=eH\cdot xH=(ex)H=xH\)
 \(xH\cdot H=xH\cdot eH=(xe)H=xH\)
なので、剰余類 \(H\) が単位元になる。また、
 \(xH\cdot x^{-1}H=(xx^{-1})H=eH=H\)
 \(x^{-1}H\cdot xH=(x^{-1}x)H=eH=H\)
であり、\(xH\) に対する逆元は \(x^{-1}H\) である。従って剰余類 \(G/H\) は群である。[証明終]


巡回群の剰余群は巡回群:41H)

巡回群の部分群による剰余群は巡回群である。


[証明]

群 \(G\) を、位数 \(n\)、生成元 \(g\) の巡回群とし、その元を、

 \(G\:=\:\{g,\:g^2,\:g^3,\:\cdots,\:g^n=e\:\}\)

とする。\(G\) の部分群を \(H\) とし、\(H\) の元のうち \(g\) の指数が一番小さいものを \(g^{d}\:\:(1\leq d\leq n)\) とする。\(d=1\) なら \(H=G\) であり、また \(d=n\) なら \(H=\{\:e\:\}\) である。

\(n\) を \(d\) で割った商を \(q\)、余りを \(r\) とする。つまり、
 \(n=qd+r\:\:(1\leq q\leq n,\:0\leq r < d)\)
とする。\(g^d\) は \(H\) の元だから その \(q\) 乗も \(H\) の元であり、
 \((g^d)^q=g^{dq}\in H\)
である。また \(g^{dq}\) の逆元も \(H\) に含まれるから
 \((g^{dq})^{-1}\in H\)
である。仮にもし \(1\leq r < d\) なら
 \(g^{dq}g^{r}=g^{qd+r}=g^n=e\)
となるので、この式に左から \((g^{dq})^{-1}\) をかけると、
 \(g^r=(g^{dq})^{-1}\in H\)
となり、\(d\) 未満の数 \(r\) が指数の \(g^r\) が \(H\) の元ということになるが、これは \(d\) が最小の指数であるという仮定に反する。従って \(r=0\) であり、\(qd=n\) である。つまり \(d\) と \(q\) は \(n\) の約数である。そうすると \(g^d\) を \(q\) 乗すると \(g^{dq}=g^n=e\) となるので、\(H\) は \(g^d\) を生成元とする位数 \(q\) の巡回群、
 \(H=\{\:g^{d},\:g^{2d},\:\cdots,\:g^{qd}=g^n=e\:\}\)
 \((\br{A})\)
である。また、\(G\) は巡回群、つまり可換群だから、その部分群である \(H\) は \(G\) の正規部分群である。



次に、剰余類 \(g^kH\:\:(1\leq k\leq n)\) を考える。\(k\) を \(d\) で割った商を \(m\)、余りを \(i\) とする。\(qd=n\) なので、
 \(k=md+i\) \((0\leq m\leq q,\:0\leq i < d)\)
である。以下、\(m,\:i\) の値によって3つに分ける。

\(k=i\:\:(m=0,\:1\leq i < d)\) のときは、\(H\) が単位元を含んでいるので、
 \(g^k=g^i\in g^iH\)
である。

\(m\neq0,\:1\leq i < d\) のときは、
 \(g^k=g^{md+i}=g^ig^{md}\)
となるが、\((\br{A})\) 式により、
 \(g^{md}\in H\:\:(1\leq m\leq q)\)
なので、
 \(g^ig^{md}\in g^iH\)
 \(g^k\in g^iH\:\:(1\leq i < d)\)
となる。

また、\(m\neq0,\:i=0\) のときは、
 \(g^k=g^{md}\in H\)
である。

結局、\(G\) の元 \(g^k\) は、\(\{\:H,\:g^iH\:\:(1\leq i < d)\:\}\) のどれかに含まれる。ここで、形式上 \(g^0H\:=\:H\) と定義すると、\(H,\:g^iH\) は、
 \(g^iH\:=\:\{\:g^{i+md}\:|\:0\leq i < d,\:\:0\leq m\leq q\:\}\)
と表記できる。\(0\leq i,j < d,\:0\leq m_i,m_j\leq q\) で、\(i\neq j\) なら、
 \(i+m_id\neq j+m_jd\)
なので、\(g^iH\) と \(g^jH\) に共通の元はなく、
 \(g^iH\:\cap\:g^jH=\phi\:\:(i\neq j)\)
である。

以上より、巡回群 \(G\) は剰余類によって、
 \(G=H\:\cup\:gH\:\cup\:g^2H\:\cup\:\cdots\:\cup\:g^{d-1}\)
 \(g^iH\:\cap\:g^jH=\phi\) \((i\neq j)\)
と分解できる。

\(H\) は \(G\) の正規部分群であった。従って \(G\) の \(H\) による剰余類は剰余群になり、
 \(G/H=\{\:H,\:gH,\:g^2H,\:\cdots\:,g^{d-1}H\:\}\)
である。ここで \(gH\) の累乗を調べると、
 \((gH)^2=gHgH=ggHH=g^2H\)
 \((gH)^3=gHgHgH=g^2HgH=g^2gHH=g^3H\)
のように計算でき、
 \((gH)^i=g^iH\) \((1\leq i\leq d-1)\)
である。また、同じ計算によって、
 \((gH)^d=g^dH\)
となるが、\(g^d\in H\) なので部分群の元の条件の定理(41C)により \(g^dH=H\) であり、つまり、
 \((gH)^d=H\)
である。

以上により 剰余群 \(G/H\) は、
 \(G/H=\{gH,\:(gH)^2,\:\cdots\:,(gH)^{d-1},\:(gH)^{d}=H\}\)
と表され、生成元が \(gH\)、単位元が \(H\)、位数が \(d\) の巡回群である。[証明終]

部分群と正規部分群
部分群と正規部分群:41I)

\(G\) の正規部分群を \(H\)、部分群を \(N\) とする。このとき、

(a) \(NH\) は \(G\) の部分群である。
(b) \(G\:\supset\:N\:\supset\:H\) なら、\(H\) は \(N\) の正規部分群である。
(c) \(N\cap H\) は \(N\) の正規部分群である。

が成り立つ。


[(a) の証明]
\(G\) の正規部分群を \(H\)、 部分群を \(N\) とするとき、\(NH\) は部分群である。

\(NH\) の任意の2つの元を
 \(nx\:\:(n\in N,\:x\in H),\:\:my\:\:(m\in N,\:y\in H)\)
とすると、
 \(nx\in nH,\:my\in mH\)
である。\(H\) は正規部分群だから、\(mH=Hm\) であることを用いると、
 \((nx)(my)\in(nH)(mH)=nHmH=nmHH=nmH\)
となる。\(n,m\in N\) なので \(nm\in N\)。ここから \(nmH\subset NH\) である。結局、
 \((nx)(my)\in NH\)
となって、\(NH\) の2つの元の演算は \(NH\) で閉じていることが分かる(=\(\:\br{①}\:\))。

また一般に、\((xy)^{-1}=y^{-1}x^{-1}\) である。なぜなら、
 \(xy(y^{-1}x^{-1})=x(yy^{-1})x^{-1}=xex^{-1}=xx^{-1}=e\)
 \((y^{-1}x^{-1})xy=y^{-1}(x^{-1}x)y=y^{-1}ey=y^{-1}y=e\)
が成り立つからである。

\(G\) の部分群 \(N\) と正規部分群 \(H\) において、\(n\in N,\:x\in H\) とすると、\(n^{-1}\in N,\:x^{-1}\in H\) なので、
 \((nx)^{-1}=x^{-1}n^{-1}\in Hn^{-1}\)
となるが、\(H\) が正規部分群なので、\(Hn^{-1}=n^{-1}H\)である。さらに、\(n^{-1}H\subset NH\) なので、結局、
 \((nx)^{-1}\subset NH\)
となり、\(NH\) の任意の元 \(nx\) について逆元 \((nx)^{-1}\) が \(NH\) に含まれる(=\(\:\br{②}\:\))。

\(\br{①}\:\:\br{②}\) が成り立つので、部分群の十分条件の定理(41B)によって \(NH\) は \(G\) の部分群である。[証明終]

[(b) の証明]
\(G\) の正規部分群を \(H\)、部分群を \(N\) とするとき、\(G\:\supset\:N\:\supset\:H\) なら、\(H\) は \(N\) の正規部分群である。

\(H\) は \(G\) の正規部分群だから、\(G\) の任意の元 \(x\) について
 \(xH=Hx\)
が成り立つ。\(N\) は \(G\) の 部分集合だから、\(N\) の任意の元 \(y\) についても、
 \(yH=Hy\)
が成り立つ。従って \(H\) は \(N\) の正規部分群である。[証明終]

[(c) の証明]
\(G\) の正規部分群を \(H\)、 部分群を \(N\) とするとき、\(N\cap H\) は \(N\) の正規部分群である。

\(H\) は \(G\) の正規部分群だから、\(G\) の任意の元 \(x\) について
 \(xH=Hx\)
が成り立つ。この式に右から \(x^{-1}\) をかけると、
 \(xHx^{-1}=H\)
となる。これは、\(H\) の任意の元 \(h\) を決めると、\(G\) の任意の元 \(x\) について、
 \(xhx^{-1}\in H\)
となることを意味する。これは \(H\) が正規部分群であることの定義と等価である。以降、この形で \(N\cap H\) が正規部分群であることを証明する。

部分群 \(N\) の任意の元を \(y\)、正規部分群 \(H\) の任意の元を \(h\)、\(N\cap H\) の任意の元を \(n\) とする。\(y,\:y^{-1},\:n\) は全て \(N\) の元だから、
 \(yny^{-1}\in N\)
である(=\(\:\br{①}\:\))。また \(H\) は \(G\) の正規部分群であるから、\(G\) の任意の元 \(x\) について、
 \(xhx^{-1}\in H\)
が成り立つ。ここで、\(G\:\supset\:N\) なので \(x=y\) とおくことができ、また \(H\:\supset\:N\cap H\) なので \(h=n\) とおくこともできる。従って、
 \(yny^{-1}\in H\)
である(=\(\:\br{②}\:\))。\(\br{①}\:\:\br{②}\) より、\(N\cap H\) の任意の元 \(n\) を決めると、\(N\) の全ての元 \(y\) について、
 \(yny^{-1}\in N\cap H\)
となる。つまり \(N\cap H\) は \(N\) の正規部分群である。[証明終]


4.2 準同型写像


この節の写像の説明には「全射」「単射」「全単射」などの用語ができてます。その用語の意味は次の図の通りです。

写像.jpg
全射:\(G'\)の任意の元 \(y\) について \(f(x)=y\) となる \(x\in G\) がある。 単射:\(x\neq y\:(x,y\in G)\) なら \(f(x)\neq f(y)\)。 全単射:全射かつ単射。

準同型写像と同型写像
準同型写像と同型写像:42A)

群 \(G\) から群 \(G'\) への写像 \(f\) がある。\(G\) の任意の2つの元、\(x,\:y\) について、

 \(f(xy)=f(x)f(y)\)

が成り立つとき、\(f\) を \(G\) から \(G'\) への準同型写像(homomorphism)という。右辺は群 \(G'\) の演算定義に従う。

また、\(f\) が全単射写像のとき、\(f\) を同型写像(isomorphism)という。群 \(G\) から \(G'\) への同型写像が存在するとき、\(G\) と \(G'\) は同型であるといい、
 \(G\:\cong\:G'\)
で表す。


準同型写像の像と核
準同型写像の像と核:42B)

群 \(G\) から群 \(G'\) への準同型写像 \(f\) がある。\(G\) の元を \(f\) で移した元の集合を「\(f\) の像(image)」といい、\(\mr{Im}\:f\) と書く。\(\mr{Im}\:f\) を \(f(G)\) と書くこともある。

\(\mr{Im}\:f\) は \(G'\) の部分群である。

\(G\) の単位元を \(e\)、\(G'\) の単位元を \(e'\) とする。準同型写像 \(f\) によって \(e'\) に移る \(G\) の元の集合を「\(f\) の核(kernel)」といい、\(\mr{Ker}\:f\) と書く。

\(\mr{Ker}\:f\) は \(G\) の部分群である。


準同型写像.jpg

[証明]

\(\mr{Im}\:f\) と \(\mr{Ker}\:f\) が群であることを証明する。

\(\bs{\mr{Im}\:f}\) は群]

\(\mr{Im}\:f\) の任意の2つの元を \(f(x),f(y)\:\:(x,y\in G)\) とすると、
 \(f(x)f(y)=f(xy)\:\in\mr{Im}\:f\)
である(=\(\:\br{①}\:\))。

\(\mr{Im}\:f\) の任意の元 \(f(x)\) について、
 \(f(e)f(x)=f(ex)=f(x)\)
 \(f(x)f(e)=f(xe)=f(x)\)
なので、
 \(f(e)=e'\)
である。\(G\) は群なので、任意の元 \(x\) について逆元 \(x^{-1}\) が存在する。
 \(f(x)f(x^{-1})=f(xx^{-1})=f(e)=e'\)
 \(f(x^{-1})f(x)=f(x^{-1}x)=f(e)=e'\)
であるから、
 \(f(x)^{-1}=f(x^{-1})\:\in\mr{Im}\:f\)
である(=\(\:\br{②}\:\))。\(\br{①}\:\:\br{②}\) より、部分群の十分条件の定理(41B)によって \(\mr{Im}\:f\) は \(G'\) の部分群である。

\(\bs{\mr{Ker}\:f}\) は群]

\(\mr{Ker}\:f\) の任意の元を \(x,\:y\) とすると、
 \(f(xy)=f(x)f(y)=e'e'=e'\)
なので、
 \(xy\:\in\mr{Ker}\:f\)
である(\(\:\br{③}\:\))。

また \(x\) は \(G\) の元だから \(x^{-1}\) が定義されている。
\(\begin{eqnarray}
&&\:\:f(x^{-1})&=f(x^{-1})e'=f(x^{-1})f(x)\\
&&&=f(x^{-1}x)=f(e)\\
&&&=e'\\
\end{eqnarray}\)
となるので、
 \(x^{-1}\:\in\mr{Ker}\:f\)
である(\(\:\br{④}\:\))。\(\br{③}\:\:\br{④}\) より、部分群の十分条件の定理(41B)によって \(\mr{Ker}\:f\) は \(G\) の部分群である。[証明終]

核が単位元なら単射
核が単位元なら単射:42C)

群 \(G\) から群 \(G'\) への準同型写像 \(f\) がある。このとき

 \(\mr{Im}\:f\) \(=\:G'\) なら \(f\) は全射
 \(\mr{Ker}\:f\) \(=\:\{e\}\) なら \(f\) は単射

である。


[証明]

"\(f\) は全射" については、全射の定義そのものである。

\(\mr{Ker}\:f\:=\:\{e\}\) とし、\(G\) の任意の2つの元を \(x,\:y\) とする。ここで、
 \(f(x)=f(y)\)
であったとする。\(\mr{Im}\:f\) は群だから \(f(y)^{-1}\in\:\mr{Im}\:f\) である。上の式に左から \(f(y)^{-1}\) をかけると、
 \(f(y)^{-1}f(x)=f(y)^{-1}f(y)\)
 \(f(y^{-1})f(x)=e'\)
 \(f(y^{-1}x)\in\:\mr{Ker}\:f\)
 \(y^{-1}x=e\)
 \(x=y\)
となる。\(f(x)=f(y)\) であれば \(x=y\) なので、\(f\) は単射である。[証明終]

核は正規部分群
核は正規部分群:42D)

群 \(G\) から群 \(G'\) への準同型写像を \(f\) とする。このとき \(\mr{Ker}\:f\) は \(G\) の正規部分群である。


[証明]

\(\mr{Ker}\:f\) を \(H\) と記述する。\(G\) の 任意の元を \(x\) とし、\(H\) の任意の元を \(y\) とする。すると、
\(\begin{eqnarray}
&&\:\:f(xyx^{-1})&=f(x)f(y)f(x^{-1})\\
&&&=f(x)e'f(x^{-1})=f(x)f(x^{-1})\\
&&&=f(xx^{-1})=f(e)=e'\\
\end{eqnarray}\)
と計算できるから、
 \(xyx^{-1}\in H\)
である。\(y\) は \(H\) の任意の元だから、
 \(xHx^{-1}\subset H\)
である。\(x\) は任意にとることができるので、\(x\) を \(x^{-1}\) に置き換えると、
 \(x^{-1}Hx\subset H\)
を得る。この式に左から \(x\)、右から \(x^{-1}\) をかけると、
 \(H\subset xHx^{-1}\)
となる。つまり
 \(H\subset xHx^{-1}\subset H\)
 \(xHx^{-1}=H\)
である。さらに右から \(x\) をかけると、
 \(xH=Hx\)
となり、\(x\) は任意の \(G\) の元だから、\(H\:\:(=\mr{Ker}\:f)\) は \(G\) の正規部分群である。[証明終]


4.3 同型定理


準同型定理=第1同型定理
準同型定理:43A)

群 \(G\) から群 \(G'\) への準同型写像 \(f\) がある。\(H=\mr{Ker}\:f\) とすると、\(G\) の \(H\) による剰余群は、\(G\) の \(f\) による像と同型である。つまり、

 \(G/H\:\cong\:\mr{Im}\:f\)

が成り立つ。


[証明]

\(H\:=\:\mr{Ker}\:f\) は、核は正規部分群の定理(42D)により、\(G\) の正規部分群である。従って剰余群 \(G/H\) が定義できる。\(G/H\) から \(\mr{Im}\:f\) への写像 \(\sigma\) を、

\(\begin{eqnarray}
&&\:\:\sigma\:: &G/H &\longrightarrow&\mr{Im}\:f\\
&&&xH &\longmapsto&f(x)\\
\end{eqnarray}\)

と定義する。まず、この写像が剰余類 \(xN\) の代表元 \(x\) のとりかたに依存しないこと、つまり \(xH=yH\) なら \(f(x)=f(y)\) であることを示す。\(xH=yH\) を変形すると、
 \(xH=yH\)
 \(y^{-1}xH=y^{-1}yH\)
 \(y^{-1}xH=H\)
ゆえに部分群の元の条件の定理(41C)から \(y^{-1}x\in H\) である。そうすると、\(H\) は \(\mr{Ker}\:f\) のことだから、\(f(y^{-1}x)=e'\) である。これを変形すると、
 \(f(y^{-1}x)=e'\)
 \(f(y^{-1})f(x)=e'\)
 \(f(y)^{-1}f(x)=e'\)
となる。最後の変形では、準同型写像の像と核の定理(42B)の「\(\mr{Im}\:f\) は群」の証明から、\(f(y^{-1})=f(y)^{-1}\) であることを用いた。ここから、
 \(f(y)^{-1}f(x)=e'\)
 \(f(y)f(y)^{-1}f(x)=f(y)e'\)
 \(f(x)=f(y)\)
となり、\(f(x)=f(y)\) が証明できた。

以上の変形は逆も辿れる。つまり、
 \(f(x)=f(y)\)
 \(f(y)f(y)^{-1}f(x)=f(y)e'\)
 \(f(y)^{-1}f(x)=e'\)
 \(f(y^{-1})f(x)=e'\)
 \(f(y^{-1}x)=e'\)
 \(f(y^{-1}x)\in H\)
 \(y^{-1}xH=H\)
 \(xH=yH\)
となる。これは \(f(x)=f(y)\) なら \(xH=yH\) であることを示していて、すなわち \(\sigma\) は単射である。と同時に、\(\sigma\) による写像の先は \(\mr{Im}\:f\) に限定しているので \(\sigma\) は全射である。つまり \(\sigma\) は 全単射である(=\(\:\br{①}\:\))。

さらに、
\(\begin{eqnarray}
&&\:\:\sigma((xH)(yH))&=\sigma(x(Hy)H)=\sigma(x(yH)H)\\
&&&=\sigma(xyH)=f(xy)=f(x)f(y)\\
&&&=\sigma(xH)\sigma(yH)\\
\end{eqnarray}\)
であり、つまり \(\sigma((xH)(yH))=\sigma(xH)\sigma(yH)\) が成り立っている(=\(\:\br{②}\:\))。

\(\br{①}\:\:\br{②}\) により \(\sigma\) は同型写像である。\(G/H\) から \(\mr{Im}\:f\) への同型写像が存在するから、
 \(G/H\:\cong\:\mr{Im}\:f\)
である。[証明終]

第2同型定理
第2同型定理:43B)

群 \(G\) の正規部分群を \(H\)、部分群を \(N\) とすると、

 \(N/(N\cap H)\:\cong\:NH/H\)

が成り立つ。


第2同型定理.jpg

[証明]

まず、部分群と正規部分群の定理(41I)により、\(G\) の正規部分群が \(H\)、部分群が \(N\) の場合、
・ \(N\cap H\) は \(N\) の正規部分群
・ \(NH\) は \(G\) の部分群
・ \(G\:\supset\:NH\:\supset\:H\) なので、\(H\) は \(NH\) の正規部分群
である。従って剰余群の定義(41G)により、\(N/(N\cap H)\) および \(NH/H\) は剰余群となる。

\(G\) の任意の元を \(x,\:y\) とし、\(G\) から \(G/H\) への写像 \(\sigma\) を、
\(\begin{eqnarray}
&&\:\:\sigma\:: &G &\longrightarrow&G/H\\
&&&x &\longmapsto&xH\\
\end{eqnarray}\)
と定義する。この写像は、
\(\begin{eqnarray}
&&\:\:\sigma(xy)&=xyH=xyHH=xHyH=(xH)(yH)\\
&&&=\sigma(x)\sigma(y)\\
\end{eqnarray}\)
を満たすから準同型写像である(ちなみに \(G\) とその正規部分群 \(H\) があるとき、上記の定義による \(\sigma\) を自然準同型と呼ぶ)。

\(\sigma\) の定義域は \(G\) であるが、\(\sigma\) の定義域を \(G\) の部分群である \(N\) に制限した写像 \(\tau\)(タウ) を考える。\(N\) の任意の元を \(z\) とすると、
\(\begin{eqnarray}
&&\:\:\tau\:: &N &\longrightarrow&G/H\\
&&&z &\longmapsto&zH\\
\end{eqnarray}\)
である。この \(\tau\) の像 \(\mr{Im}\:\tau\) を考えてみると、\(z\) が \(N\) の元のすべてを動くとき、\(\tau(z)=zH\) として出てくる \(G\) の元は \(NH\) の元である。つまり \(\tau\) は、
\(\begin{eqnarray}
&&\:\:\tau\:: &N &\longrightarrow&G/H\\
\end{eqnarray}\)
として定義したが、\(\tau(z)\) が \(G/H\) の全てを尽くすわけではなく、全射ではない。写像による移り先は、\(G\) の部分群 \(NH\) を \(H\) で分類した剰余群、\(NH/H\) である。つまり \(\tau(N)=NH/H\) であり、
 \(\mr{Im}\:\tau=NH/H\)
である。

次に準同型写像の核を考える。\(G/H\) の単位元は、
 \(xH\cdot H=xH\)
 \(H\cdot xH=HxH=xHH=xH\)
なので、\(H\) である。

\(G\) の元 \(x\) が \(\mr{Ker}\:\sigma\) の元とする。つまり、
 \(x\in\mr{Ker}\:\sigma\)
とする。これは \(\sigma(x)\) が \(G/H\) の単位元になるということだから、
 \(\sigma(x)=H\)
であり、\(\sigma(x)=xH\) なので、
 \(xH=H\)
である。これは部分群の元の条件の定理(41C)によって、
 \(x\in H\)
と同値である。従って、
 \(x\in\mr{Ker}\:\sigma\)
 \(x\in H\)
の2つは同値であり、つまり、
 \(\mr{Ker}\:\sigma=H\)
である。

\(\tau\) は \(\sigma\) の定義域を \(N\) に制限したものなので、\(\mr{Ker}\:\tau\) は「\(\mr{Ker}\:\sigma=H\) のうちで \(N\) に含まれるもの」であり、すなわち、
 \(\mr{Ker}\:\tau=(N\cap H)\)
である。

ここで、\(\tau\) の定義である、
\(\begin{eqnarray}
&&\:\:\tau\:: &N &\longrightarrow&G/H\\
\end{eqnarray}\)
準同型定理43A)を適用すると、
\(\begin{eqnarray}
&&\:\:N/(\mr{Ker}\:\tau) &\cong\:\mr{Im}\:\tau\\
&&\:\:N/(N\cap H) &\cong\:NH/H\\
\end{eqnarray}\)
となって、題意が成り立つ。[証明終]



第2同型定理を整数の剰余群で確認してみます。上の定理における \(G,\:H,\:N\) を、
 \(G=\bs{Z}\)
 \(H=10\bs{Z}\) (\(10\) の倍数)
 \(N=\phantom{1}6\bs{Z}\) (\(\phantom{1}6\) の倍数)
の群とします。この群の演算は加算であり、可換群なので、\(\bs{Z}\) の部分群はすべて正規部分群です。

\(N\cap H\) は「\(10\) の倍数、かつ \(6\) の倍数」の集合なので、
 \(N\cap H=30\bs{Z}\)
です。また \(NH\) は、\(10\) の倍数と\(6\) の倍数の加算の結果の集合です。つまり、
 \(NH=\{\:10x+6y\:|\:x,y\in\bs{Z}\:\}\)
ですが、これが何を意味するかは不定方程式の解の存在の定理(21B)から分かります。定理を再掲すると、

2変数 \(x,\:y\) の1次不定方程式を、
 \(ax+by=c\)
  (\(a,\:b,\:c\) は整数。\(a\neq0,\:b\neq0\))
とし、\(a\) と \(b\) の最大公約数を \(d\) とする。このとき、
 \(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。

です。\(c=kd\) なら、式を満たす \(x,\:y\) が必ず存在します。また任意の \(x,\:y\) について \(ax+by\) を計算すると、その結果の \(c\) は必ず \(c=kd\) の形になります。そうでなければ、\(c\) が最大公約数の倍数でないにも関わらず不定方程式が解をもつことになって定理に矛盾します。従って、\(ax+by=c\) の \(x,\:y\) を任意の整数とすると、\(c\) は \(a,\:b\) の "最大公約数の整数倍のすべて" になります。
 \(NH=\{\:10x+6y\:|\:x,y\in\bs{Z}\:\}\)
とした場合、\(10\) と \(6\) の最大公約数は \(2\) なので、
 \(NH=2\bs{Z}\)
です。この結果、
 \(N/(N\cap H)\)
  \(=6\bs{Z}/30\bs{Z}\)
  \(=\{30\bs{Z},\:6+30\bs{Z},\:12+30\bs{Z},\:18+30\bs{Z},\:24+30\bs{Z}\}\)
 \(NH/H\)
  \(=2\bs{Z}/10\bs{Z}\)
  \(=\{10\bs{Z},\:2+10\bs{Z},\:4+10\bs{Z},\:6+10\bs{Z},\:4+10\bs{Z}\}\)
となります。この2つの剰余群は位数 \(5\) の巡回群( \(C_5\) )で、\(\bs{Z}/5\bs{Z}\) に同型です。つまり、
 \(N/(N\cap H)\) \(\cong\:\bs{Z}/5\bs{Z}\)
 \(NH/H\) \(\cong\:\bs{Z}/5\bs{Z}\)
であり、
 \(N/(N\cap H)\:\cong\:NH/H\)
となって、第2同型定理が確認できました。

第2同型定理(整数).jpg
第2同型定理 : \(\bs{6\bs{Z}/30\bs{Z}\:\cong\:2\bs{Z}/10\bs{Z}}\)

この図をみると、\(NH/H=2\bs{Z}/10\bs{Z}\) と \(N/(N\cap H)=6\bs{Z}/30\bs{Z}\) が同型であることがヴィジュアルにイメージできる。両方とも位数 \(5\) の巡回群である。

第2同型定理は、後ほど「可解群の部分群は可解群」という定理の証明に使います。「可解群の部分群は可解群」の定理は、5次方程式に可解でないものがあることを証明する際に鍵となる定理です。その第2同型定理は準同型定理を使って証明される、という構造になっているのでした。

 
5.ガロア群とガロア対応 
 

2章から4章までは、多項式、体、線形空間、剰余類、群、剰余群、既約剰余類群、正規部分群といった、ガロア理論の基礎となる概念の説明でした。この第5章から、理論の核心に入っていきます。


5.1 体の同型写像


同型写像の定義
体の同型写像:51A)

体 \(\bs{K}\) から 体 \(\bs{F}\) への写像 \(f\) が全単射であり、\(\bs{K}\) の任意の元、\(x,\:y\) に対して、
\(\begin{eqnarray}
&&\:\:f(x+y)&=f(x)+f(y)\\
&&\:\:f(xy)&=f(x)f(y)\\
\end{eqnarray}\)
が成り立つとき、\(f\) を体の同型写像という。この定義による同型写像は、加法と乗法のみならず、四則演算を保存する。

特に、\(\bs{K}\) から \(\bs{K}\) への同型写像を自己同型写像という。

\(\bs{K}\) から \(\bs{F}\) への同型写像が存在するとき、体 \(\bs{K}\) と 体 \(\bs{F}\) は同型であるといい、\(\bs{K}\:\cong\:\bs{F}\) で表す。

体 \(\bs{K}\) と \(\bs{F}\) がともに \(\bs{Q}\) を含むとき、\(a\in\bs{Q}\) に対して、
 \(f(a)=a\)
である。つまり有理数は同型写像で不変である。


[証明]

上の定義による同型写像が、減法と除法を保存することを証明する。\(\bs{K}\) と \(\bs{F}\) は体だから、加法と乗法について群になっている。\(\bs{K}\) の加法の単位元を \(0^K\)、\(\bs{F}\) の加法の単位元を \(0^F\) とする。また、乗法の単位元をそれぞれ \(1^K\) と \(1^F\) とする。まず、\(f(1^K)=1^F\) で \(f(0^K)=0^F\) であることを示す。

\(f(x+y)=f(x)+f(y)\) において \(x=0^K,\:y=0^K\) とすると、
 \(f(0^K+0^K)=f(0^K)+f(0^K)\)
 \(f(0^K)=f(0^K)+f(0^K)\)
両辺に \(\bs{F}\) における \(f(0^K)\) の逆元 \(-f(0^K)\) を加えると、
 \(f(0^K)+(-f(0^K))=f(0^K)\)
 \(0^F=f(0^K)\)
となり、\(f(0^K)=0^F\) である。

\(f(xy)=f(x)f(y)\) において \(x=1^K,\:y=1^K\) とすると、
 \(f(1^K\times1^K)=f(1^K)f(1^K)\)
 \(f(1^K)=f(1^K)f(1^K)\)
両辺に \(\bs{F}\) における \(f(1^K)\) の逆元 \(-f(1^K)\) を加えると、
 \(f(1^K)+(-f(1^K))=f(1^K)f(1^K)+(-f(1^K))\)
 \(0^F=f(1^K)f(1^K)+(-f(1^K))\)
この式に現れているのは全て \(\bs{F}\) の元だから、分配則を使って、
 \(f(1^K)(f(1^K)-1^F)=0^F\)
ここで \(f(1^K)=0^F\) と仮定すると、\(f(0^K)=0^F\)かつ \(f(1^K)=0^F\) となってしまい \(f\) が単射であることと矛盾する。従って \(f(1^K)\neq0^F\) である。上式の両辺を \(f(1^K)\) で割ると、
 \(f(1^K)-1^F=0^F\)
 \(f(1^K)=1^F\)
となる。

以上を踏まえると、同型写像が減法を保存することは次のようにしてわかる。\(\bs{K}\) は加法について群なので任意の元 \(x\in\bs{K}\) について逆元 \(-x\) がある。また \(\bs{F}\) も加法についても群だから \(f(x)\) の逆元 \(-f(x)\) がある。
 \(f(-x)+f(x)=f(-x+x)=f(0^K)=0^F\)
両辺に \(-f(x)\) を足すと、
 \(f(-x)+f(x)+(-f(x))=0^F+(-f(x))\)
 \(f(-x)+0^F=0^F+(-f(x))\)
 \(f(-x)=-f(x)\)
である。\(\bs{K}\) の任意の元を \(x,\:y\) とすると、
\(\begin{eqnarray}
&&\:\:f(x-y)&=f(x+(-y))\\
&&&=f(x)+f(-y)\\
&&&=f(x)+(-f(y))\\
&&&=f(x)-f(y)\\
\end{eqnarray}\)
となって、減法は保存されている。

除法を保存することは次のようにしてわかる。\(\bs{K}\) は乗法について群なので、任意の元 \(x\:\:(\neq0^K)\) について逆元 \(x^{-1}\) がある。\(\bs{F}\) も乗法についての群だから、\(f(x)\) の逆元である \(f(x)^{-1}\) がある。\(x\neq0^K\) なら \(f(x)\neq0^F\) なので逆元が定義できる。すると、
 \(f(x^{-1})f(x)=f(x^{-1}x)=f(1^K)=1^F\)
である。この式の両辺に \(f(x)^{-1}\) をかけると、
 \(f(x^{-1})f(x)f(x)^{-1}=1^F\times f(x)^{-1}\)
 \(f(x^{-1})\times1^F=1^F\times f(x)^{-1}\)
 \(f(x^{-1})=f(x)^{-1}\)
となる。\(\bs{K}\) の任意の元を \(x,\:y\:\:(y\neq0^K)\) とすると、
\(\begin{eqnarray}
&&\:\:f\left(\dfrac{x}{y}\right)&=f(xy^{-1})\\
&&&=f(x)f(y^{-1})\\
&&&=f(x)f(y)^{-1}\\
&&&=\dfrac{f(x)}{f(y)}\\
\end{eqnarray}\)
となり、除法が保存されていることが分かる。

有理数の同型写像を考える。\(n\) を整数とすると、
\(\begin{eqnarray}
&&\:\:f(n)&=f(\:\overbrace{1+1+\cdots+1}^{1をn\:個加算}\:)\\
&&&=f(1)+f(1)+\cdots+f(1)\\
&&&=nf(1)\\
&&&=n\\
\end{eqnarray}\)
なので、\(f(n)=n\) である。任意の有理数 \(a\) は、2つの整数 \(n\:(\neq0),\:m\) を用いて、
 \(a=\dfrac{m}{n}\)
と表されるから、
\(\begin{eqnarray}
&&\:\:f(a)&=f\left(\dfrac{m}{n}\right)=\dfrac{f(m)}{f(n)}=\dfrac{m}{n}\\
&&&=a\\
\end{eqnarray}\)
となり、有理数は同型写像で不変である。[証明終]

同型写像と有理式の順序交換
有理式の定義:51B)

変数 \(x\) の多項式(係数は \(\bs{Q}\) の元)を分母・分子とする分数式を、\(\bs{Q}\) 上の有理式という。


\(\bs{Q}\) 上の多項式は、有理数と \(x\) の加・減・乗算で作られる式です。一方、\(\bs{Q}\) 上の有理式とは、有理数と \(x\) の除算を含む四則演算で作られる式です。


同型写像と有理式の順序交換:51C)

体 \(\bs{K}\) と 体 \(\bs{F}\) は \(\bs{Q}\) を含むものとする。\(\sigma\) を \(\bs{K}\) から \(\bs{F}\) への同型写像とし、\(a\) を \(\bs{K}\) の元とする。\(f(x)\) を \(\bs{Q}\) 上の有理式とすると、

 \(\sigma(f(a))=f(\sigma(a))\)

である。これは多変数の有理式でも成り立つ。\(a_1,a_2,\cdots,a_n\) を \(\bs{K}\) の元、\(f(x_1,x_2,\cdots,x_n)\) を \(\bs{Q}\) 上の有理式とすると、

 \(\sigma(f(a_1,a_2,\cdots,a_n))=f(\sigma(a_1),\sigma(a_1),\cdots,\sigma(a_n))\)

である。


[証明]

\(a\in\bs{K},\:b_i\in\bs{Q},\:c_i\in\bs{Q}\) とし、1変数 \((=a)\) の2次多項式の分数式の場合を例に書くと、

\(\sigma\left(\dfrac{b_2a^2+b_1a+b_0}{c_2a^2+c_1a+c_0}\right)\)
  \(=\dfrac{\sigma(b_2a^2+b_1a+b_0)}{\sigma(c_2a^2+c_1a+c_0)}\)
  \(=\dfrac{b_2\sigma(a^2)+b_1\sigma(a)+b_0}{c_2\sigma(a^2)+c_1\sigma(a)+c_0}\)
  \(=\dfrac{b_2\sigma(a)^2+b_1\sigma(a)+b_0}{c_2\sigma(a)^2+c_1\sigma(a)+c_0}\)

であるから、題意は成り立つ。これは \(n\)次多項式の場合でも同じである。[証明終]



「同型写像と有理式は順序交換可能」は、\(\bs{Q}\) の拡大体の上の有理式でも成り立ちます。つまり、次が成り立ちます。


\(\bs{Q}\) を含む体を \(\bs{K}\) とし、\(\bs{K}\)の拡大体を \(\bs{F}\:,\bs{F}'\) とする。\(\sigma\) を \(\bs{K}\) を不変にする \(\bs{F}\) から \(\bs{F}'\) への同型写像とし、\(a\) を \(\bs{F}\) の元とする。\(f(x)\) を \(\bs{K}\) 上の有理式とすると、
 \(\sigma(f(a))=f(\sigma(a))\)
である。


同型写像は解を共役な解に移す
同型写像での移り先:51D)

\(\sigma\) を体 \(\bs{K}\) から 体 \(\bs{F}\) への同型写像とする。\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つを \(\alpha\) とし、\(\alpha\) は \(\bs{K}\) の元とする。すると \(\sigma(\alpha)\) も \(f(x)=0\) の解である。


[証明]

\(\alpha\) は \(f(x)=0\) の解なので \(f(\alpha)=0\) が成り立つ。すると、
 \(f(\sigma(\alpha))=\sigma(f(\alpha))=\sigma(0)=0\)
となり、\(\sigma(\alpha)\) も \(f(x)=0\) の解である。[証明終]



同じ方程式の解同士を「共役な解」と言います。この定理により、同型写像は解を共役な解に移すこと分かります。

同型写像は解を入れ替える
同型写像による解の置換:51E)

\(\sigma\) を体 \(\bs{K}\) から 体 \(\bs{F}\) への同型写像とし、\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。方程式 \(f(x)=0\) の \(n\)個の解を \(\alpha_1,\alpha_2,\cdots,\alpha_n\) とし、これらが全て \(\bs{K}\) に含まれるとする。

すると \(\sigma(\alpha_1),\sigma(\alpha_2),\cdots,\sigma(\alpha_n)\) は、\(\alpha_1,\alpha_2,\cdots,\alpha_n\) を入れ替えたものである。


[証明]

\(f(x)\) は既約多項式なので、方程式 \(f(x)=0\) は \(n\)個の解をもち、それらは全て異なる(31F)。同型写像は解を共役な解に移す(51D)ので、\(\sigma(\alpha_i)\) も \(f(x)=0\) の解である。\(\sigma\) は同型写像なので全単射であり、\(i\neq j\) なら \(\sigma(\alpha_i)\neq\sigma(\alpha_j)\) である。従って \(\sigma(\alpha_1),\sigma(\alpha_2),\cdots,\sigma(\alpha_n)\) は、\(\alpha_1,\alpha_2,\cdots,\alpha_n\) を入れ替えたものである。[証明終]



同型写像を定義してその性質を述べてきましたが、あたかも「同型写像はあるのが当然」のような話でした。しかし、同型写像があったとしたらこういう性質をもつというのが正しく、同型写像が必ずあるとは証明していません。

同型写像の存在を示すには、第1章でやったように、\(\bs{Q}(\sqrt{2})\)において
 \(\sigma(\sqrt{2})=-\sqrt{2}\)
という写像を定義すると、体のすべての元について \(\sigma\) は同型写像の定義を満たす、というような証明が必要です。それが次です。

単拡大体の同型写像の存在
同型写像の存在:51F)

\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。\(\alpha,\:\beta\) を方程式 \(f(x)=0\) の異なる解とする。

すると \(\sigma(\alpha)=\beta\) を満たす \(\bs{Q}(\alpha)\) から \(\bs{Q}(\beta)\) への唯一の同型写像 \(\sigma\) が存在する。


[証明]

\(\bs{Q}(\alpha)\) の任意の元を \(a\)、\(\bs{Q}(\beta)\) の任意の元を \(b\) とする。単拡大体の基底の定理(33F)により、\(a,\:b\) は、
\(a=a_{n-1}\alpha^{n-1}+\:\cdots\:+a_2\alpha^2+a_1\alpha+a_0\:\:(a_i\in\bs{Q})\)
\(b=b_{n-1}\beta^{n-1}+\:\cdots\:+b_2\beta^2+b_1\beta+b_0\:\:(b_i\in\bs{Q})\)
の形に一意に表される。ここで \(\bs{Q}(\alpha)\) から \(\bs{Q}(\beta)\) への同型写像 \(\sigma\) を、
\(\begin{eqnarray}
&&\:\:\sigma\:: &a_{n-1}\alpha^{n-1}+\:\cdots\:+a_2\alpha^2+a_1\alpha+a_0\\
&&&\longmapsto\:a_{n-1}\beta^{n-1}+\:\cdots\:+a_2\beta^2+a_1\beta+a_0\\
\end{eqnarray}\)
と定義する。\(a=\alpha\) の場合は、\(a_1=1,\:a_i=0\:\:(i=0,\:2\leq i\leq n-1)\) だから、\(\sigma(\alpha)=\beta\) である。以下、この \(\sigma\) が同型写像であることを証明する。定義により(51A)同型写像であることは加法と乗法を保存することを言えばよい。

\(\bs{Q}(\alpha)\) の任意の2つの元を \(s,\:t\) とし、
\(s=s_{n-1}\alpha^{n-1}+\:\cdots\:+s_2\alpha^2+s_1\alpha+s_0\)
\(t=t_{n-1}\alpha^{n-1}+\:\cdots\:+t_2\alpha^2+t_1\alpha+t_0\)
とする。また多項式 \(g(x)\) と \(h(x)\) を、
\(g(x)=s_{n-1}x^{n-1}+\:\cdots\:+s_2x^2+s_1x+s_0\)
\(h(x)=t_{n-1}x^{n-1}+\:\cdots\:+t_2x^2+t_1x+t_0\)
と定義する。\(s_i,t_i\in\bs{Q}\) であり、\(s=g(\alpha),\:t=h(\alpha)\) である。また \(\sigma\) の定義により \(\sigma(s)=g(\beta),\:\sigma(t)=h(\beta)\) である。

\(p(x)=g(x)+h(x)\) とおくと、
 \(p(\alpha)=g(\alpha)+h(\alpha)=s+t\)
である。また \(\sigma\)の定義により、
 \(\sigma(p(\alpha))=p(\beta)\)
となる。従って、
\(\begin{eqnarray}
&&\:\:\sigma(s+t)&=\sigma(p(\alpha))\\
&&&=p(\beta)\\
&&&=g(\beta)+h(\beta)\\
&&&=\sigma(s)+\sigma(t)\\
\end{eqnarray}\)
となり、加法は保存される。

\(g(x)h(x)\) を \(f(x)\) で割ったときの商を \(q(x)\)、余りを \(r(x)\) とすると、
 \(g(x)h(x)=q(x)f(x)+r(x)\)
である。この式に \(x=\alpha,\:x=\beta\) のそれぞれを代入すると、\(f(\alpha)=0,\:f(\beta)=0\) なので、
 \(g(\alpha)h(\alpha)=r(\alpha)\)
 \(g(\beta)h(\beta)=r(\beta)\)
となる。すると、
\(\begin{eqnarray}
&&\:\:\sigma(st)&=\sigma(g(\alpha)h(\alpha))\\
&&&=\sigma(r(\alpha))=r(\sigma(\alpha))\\
&&&=r(\beta)\\
\end{eqnarray}\)

\(\begin{eqnarray}
&&\:\:\sigma(s)\sigma(t)&=\sigma(g(\alpha))\sigma(h(\alpha))\\
&&&=g(\sigma(\alpha))h(\sigma(\alpha))\\
&&&=g(\beta)h(\beta)\\
&&&=r(\beta)\\
\end{eqnarray}\)
であり、
 \(\sigma(st)=\sigma(s)\sigma(t)\)
となって乗法も保存されている。従って \(\sigma\) は同型写像である。

逆に、\(\bs{Q}(\alpha)\) に作用する同型写像 \(\tau\) があったとする。同型写像は \(\alpha\) を共役な元に移すので、その移り先の元を \(\beta\)、つまり \(\tau(\alpha)=\beta\) とする。\(\bs{Q}(\alpha)\) の任意の元 \(a\) に \(\tau\) を作用させると、
\(\begin{eqnarray}
&&\:\:\tau(a)&=\tau(a_{n-1}\alpha^{n-1}+\:\cdots\:+a_2\alpha^2+a_1\alpha+a_0)\\
&&&=a_{n-1}\tau(\alpha^{n-1})+\:\cdots\:+a_2\tau(\alpha^2)+a_1\tau(\alpha)+a_0\\
&&&=a_{n-1}\tau(\alpha)^{n-1}+\:\cdots\:+a_2\tau(\alpha)^2+a_1\tau(\alpha)+a_0\\
&&&=a_{n-1}\beta^{n-1}+\:\cdots\:+a_2\beta^2+a_1\beta+a_0\\
\end{eqnarray}\)
となるので、同型写像はこの式を満たさなければならない。従って、上で定義した \(\sigma\) が \(\bs{Q}(\alpha)\) から \(\bs{Q}(\beta)\) の唯一の同型写像である。[証明終]



同型写像の存在51F)を一般化すると、次のことが言えます。

単拡大体の同型写像は \(n\) 個
単拡大体の同型写像:51G)

\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。\(f(x)=0\) の全ての解を \(\alpha_1=\alpha,\:\alpha_2,\:\cdots\:,\alpha_n\) とする。このとき \(\bs{Q}(\alpha)\) に作用する同型写像は \(n\)個あり、それらは、
 \(\sigma_i(\alpha)=\alpha_i\) \((1\leq i\leq n)\)
で定められ、\(\sigma_i\) は \(\bs{Q}(\alpha)\) から \(\bs{Q}(\alpha_i)\) への同型写像となる。




同型写像を別の視点で考えます。\(\bs{Q}\:\subset\:\bs{F}\:\subset\:\bs{K}\) といった体の拡大列があったとき、\(\bs{F}\) の同型写像と \(\bs{K}\) の同型写像には密接な関係があります。それが次の同型写像の延長の定理です。単拡大定理32B)により、\(\bs{F}=\bs{Q}(\alpha)\)、\(\bs{K}=\bs{Q}(\alpha,\beta)\) としてよいので、その形を使います。

同型写像の延長
同型写像の延長:51H)

\(\bs{Q}\) 上の \(n\)次既約多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の解の一つを \(\alpha\) とする。

\(\bs{\bs{Q}(\alpha)}\) 上の \(m\)次既約多項式を \(g(x)\) とし、方程式 \(g(x)=0\) の解の一つを \(\beta\) とする。また、\(\bs{Q}(\alpha)\) の同型写像の一つを \(\tau\) とする。

このとき、\(\tau\) は \(\bs{Q}(\alpha,\beta)\) の同型写像 \(\sigma_j\) に延長できる。延長とは、\(\sigma_j\) の作用を \(\bs{Q}(\alpha)\) に限定した写像の作用が \(\tau\) と一致することを言う。\(\tau\) を延長した同型写像 \(\sigma_j\) は \(m\)個ある(\(0\leq j < m\))。


[証明]

\(\bs{Q}(\alpha)\) 上の \(m\)次既約多項式 \(g(x)\) を、
 \(g(x)=x^m+a_1x^{m-1}+\cdots+a_m\:\:(a_j\in\bs{Q}(\alpha))\)
とする。\(\beta\) は \(g(x)=0\) の解だから
 \(g(\beta)=\beta^m+a_1\beta^{m-1}+\cdots+a_m=0\)
である。また、多項式 \(\tau(g(x))\) を、
 \(\tau(g(x))=x^m+\tau(a_1)x^{m-1}+\cdots+\tau(a_{m-1})x+\tau(a_m)\)
と定義し、方程式
 \(\tau(g(x))=0\)
の解を \(t_j\:\:(0\leq j < m)\)とする。つまり \(\tau(g(t_j))=0\) である。

\(\bs{Q}(\alpha,\beta)\) は \(\bs{Q}(\alpha)\) 上の線形空間であり、単拡大体の基底の定理(33F)により、その基底を \(\{1,\:\beta,\:\beta^2,\:\cdots\:\beta^{m-1}\}\) にとれるから、\(\bs{Q}(\alpha,\beta)\) の任意の元 \(k\) は、

\(k=b_0+b_1\beta+b_2\beta^2\:+\cdots+\:b_{n-1}\beta^{m-1}\:\:(b_j\in\bs{Q}(\alpha))\)

と表せる。そこで、\(\bs{Q}(\alpha,\beta)\) の元に作用する写像 \(\sigma_j\) を

\(\sigma_j(k)=\tau(b_0)+\tau(b_1)t_j+\tau(b_2)t_j^2+\cdots+\tau(b_{m-1})t_j^{m-1}\)

と定義する。この定義における \(\sigma_j\) は \(\bs{Q}(\alpha,\beta)\) の同型写像になる。同型写像になることは体の加算と乗算で示せればよい(51A)。\(\bs{Q}(\alpha,\beta)\) の2つの元を、
 \(p=c_0+c_1\beta+c_2\beta^2\:+\cdots+\:c_{m-1}\beta^{m-1}\:\:(c_j\in\:\bs{Q}(\alpha)\:)\)
 \(q=d_0+d_1\beta+d_2\beta^2\:+\cdots+\:d_{m-1}\beta^{m-1}\:\:(d_j\in\:\bs{Q}(\alpha)\:)\)
とし、2つの多項式を、
 \(p(x)=c_0+c_1x+c_2x^2\:+\cdots+\:c_{m-1}x^{m-1}\)
 \(q(x)=d_0+d_1x+d_2x^2\:+\cdots+\:d_{m-1}x^{m-1}\)
と定義する。加算で同型写像になるのは明白なので、乗算で同型写像になることを示す。

\(p(x)q(x)\) を \(g(x)\) で割ったときの商を \(t(x)\)、余りを \(r(x)\) とすると、
\(p(x)q(x)=t(x)g(x)+r(x)\)
\(r(x)\)\(\overset{\text{ }}{=}\)\(s_0(c_j,d_j)+s_1(c_j,d_j)x+s_2(c_j,d_j)x^2+\cdots+s_{m-1}(c_j,d_j)x^{m-1}\)
と書ける。ここで \(s_j()\) は \(c_j,\:d_j\:\:(0\leq j\leq m-1)\)の有理式である。\(()\) の中を全部書くと \(s_j(c_0,c_1,\cdots,c_{m-1},d_0,d_1,\cdots,d_{m-1})\) という \(2m\)個の \(\bs{Q}(\alpha)\) の元の有理式を表わしていて、それを簡略表記している。

すると \(g(\beta)=0\) だから、
\(pq\)\(\overset{\text{ }}{=}\)\(p(\beta)q(\beta)\)
\(\overset{\text{ }}{=}\)\(r(\beta)\)
\(\overset{\text{ }}{=}\)\(s_0(c_j,d_j)+\)\(s_1(c_j,d_j)\beta+\)\(s_2(c_j,d_j)\beta^2\:+\)\(\cdots+\)\(s_{m-1}(c_j,d_j)\beta^{m-1}\)
である。そうすると、\(\sigma_j(pq)\) は \(\sigma_j\) の定義により、
\(\sigma_j(pq)\)\(\overset{\text{ }}{=}\)\(\tau(s_0(c_j,d_j))+\)\(\tau(s_1(c_j,d_j))t_j+\)\(\tau(s_2(c_j,d_j))t_j^2+\)\(\cdots+\)\(\tau(s_{m-1}(c_j,d_j))t_j^{m-1}\)
となる。

\(\tau\) は \(\bs{Q}(\alpha)\) の同型写像だから、\(\bs{Q}(\alpha)\) の元の有理式である \(s_j(c_j,d_j)\) に作用させると、同型写像と有理式の順序交換の定理(51C)により、
 \(\tau(s_j(c_j,d_j))=s_j(\tau(c_j),\tau(d_j))\)
となる。従って、
\(\sigma_j(pq)\)\(\overset{\text{ }}{=}\)\(s_0(\tau(c_j),\tau(d_j))+\)\(s_1(\tau(c_j),\tau(d_j))t_j\:+\)\(s_2(\tau(c_j),\tau(d_j))t_j^2+\)\(\cdots+\)\(s_{m-1}(\tau(c_j),\tau(d_j))t_j^{m-1}\)
である。

\(p(x)\) の係数 \(c_j\) を \(\tau(c_j)\) で置き換え、\(q(x)\) の係数 \(d_j\) を \(\tau(d_j)\) で置き換えた2つの多項式を、
 \(\tau(p(x))=\tau(c_0)+\tau(c_1)x+\tau(c_2)x^2+\cdots+\tau(c_{m-1})x^{m-1}\)
 \(\tau(q(x))=\tau(d_0)+\tau(d_1)x+\tau(d_2)x^2+\cdots+\tau(d_{m-1})x^{m-1}\)
とする。

\(\tau(p(x))\tau(q(x))\)を\(\tau(g(x))\)で割ったときの商を\(\tau(t(x))\)、余りを\(\tau(r(x))\)とする。つまり、
 \(\tau(p(x))\tau(q(x))=\tau(g(x))\tau(t(x))+\tau(r(x))\)
である。\(c_j\) と \(d_j\) の有理式、\(s_j(c_j,d_j)\) を使って \(\tau(r(x))\) を表すと、
\(\tau(r(x))\)\(\overset{\text{ }}{=}\)\(s_0(\tau(c_j),\tau(d_j))+\)\(s_1(\tau(c_j),\tau(d_j))x+\)\(s_2(\tau(c_j),\tau(d_j))x^2\:+\)\(\cdots+\)\(s_{m-1}(\tau(c_j),\tau(d_j))x^{m-1}\)
となる。\(\sigma_j\) の定義により、
\(\sigma_j(p)\)\(\overset{\text{ }}{=}\)\(\tau(c_0)+\)\(\tau(c_1)t_j+\)\(\tau(c_2)t_j^2+\)\(\cdots+\)\(\tau(c_{m-1})t_j^{m-1}\)
\(\overset{\text{ }}{=}\)\(\tau(p(t_j))\)
\(\sigma_j(q)\)\(\overset{\text{ }}{=}\)\(\tau(d_0)+\)\(\tau(d_1)t_j+\)\(\tau(d_2)t_j^2+\)\(\cdots+\)\(\tau(d_{m-1})t_j^{m-1}\)
\(\overset{\text{ }}{=}\)\(\tau(q(t_j))\)
である。従って、
\(\sigma_j(p)\sigma_j(q)\)
 \(\overset{\text{ }}{=}\)\(\tau(p(t_j))\tau(q(t_j))\)
\(\overset{\text{ }}{=}\)\(\tau(f(t_j))\tau(t(t_j))+\tau(r(t_j))\)
\(\overset{\text{ }}{=}\)\(\tau(r(t_j))\)
\(\overset{\text{ }}{=}\)\(s_0(\tau(c_j),\tau(d_j))+\)\(s_1(\tau(c_j),\tau(d_j))t_j+\)\(s_2(\tau(c_j),\tau(d_j))t_j^2+\)\(\cdots+\)\(s_{n-1}(\tau(c_j),\tau(d_j))t_j^{m-1}\)
\(\overset{\text{ }}{=}\)\(\sigma_j(pq)\)
となり、\(\sigma_j\) は同型写像の定義を満たしている。

また、\(\bs{Q}(\alpha,\beta)\) の任意の元 \(k\) を、
 \(k=b_0+b_1\beta+b_2\beta^2\:+\cdots+\:b_{n-1}\beta^{m-1}\:\:(b_j\in\bs{Q}(\alpha))\)
と表したとき、\(k\) が \(\bs{Q}(\alpha)\) の元だとすると \(k=b_0\:\:(b_0\in\bs{Q}(\alpha))\)、\(b_j=0\:\:(1\leq j < m)\) なので、
 \(\sigma_j(k)=\tau(b_0)=\tau(k)\)
となり、\(\sigma_j\) の \(\bs{Q}(\alpha)\) の元に対する作用は \(\tau\) と一致する。従って、
\(\sigma_j\)は、その作用を \(\bs{Q}(\alpha)\) に限定したとき \(\tau\) と一致する \(\bs{Q}(\alpha,\beta)\) の同型写像
であり、\(\bs{Q}(\alpha)\) の同型写像 \(\tau\) の延長である。

\(\sigma_j\) の定義式、
\(\sigma_j(k)=\tau(b_0)+\tau(b_1)t_j+\tau(b_2)t_j^2+\cdots+\tau(b_{m-1})t_j^{m-1}\)
における \(t_j\) は、 \(\bs{Q}(\alpha)\) 上の \(m\)次方程式、
\(x^m+\tau(a_1)x^{m-1}+\cdots+\tau(a_m)=0\)
の解であった。従って \(t_j\) の選択肢は \(m\) 個あり、\(\bs{Q}(\alpha)\) の同型写像 \(\tau\) の延長は \(m\) 個ある。

一方、\(\alpha\) は \(\bs{Q}\) 上の \(n\)次既約多項式 \(f(x)\) の解の一つだから、\(\bs{Q}(\alpha)\) の同型写像 \(\tau\) は \(n\)個ある。これを \(\tau_i\:\:(0\leq i < n)\) と書くと、それぞれの \(\tau_i\) に対して同型写像の拡張 \(\sigma_{ij}\:\:(0\leq i < n,\:0\leq j < m)\) がある。従って \(\bs{Q}(\alpha,\beta)\) の 同型写像 \(\sigma_{ij}\) は \(nm\)個ある。[証明終]


5.2 ガロア拡大とガロア群


ガロア拡大
ガロア拡大:52A)

ガロア拡大は次のように定義される。この2つの定義は同値である。

① (最小分解体定義)体 \(\bs{F}\) 上の多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とするとき、\(\bs{L}/\bs{F}\) をガロア拡大という。

② (自己同型定義)体 \(\bs{F}\) の代数拡大体 \(\bs{K}\) があったとき、\(\bs{F}\) の元を不動にする \(\bs{K}\) の同型写像がすべて自己同型写像になるとき、\(\bs{K}/\bs{F}\) をガロア拡大という。

\(\bs{K}/\bs{F}\) がガロア拡大のとき、\(\bs{\bs{F}}\) を不変にする \(\bs{K}\) の自己同型写像の集合は群になる。これをガロア群といい、\(\mr{Gal}(\bs{K}/\bs{F})\) で表す。


[① \(\bs{\Rightarrow}\) ②の証明]

単拡大定理32B)により、\(\bs{L}\) は、\(\bs{L}\) の元 \(\theta\) を用いて \(\bs{L}=\bs{F}(\theta)\) と表すことができる。\(\theta\) の \(\bs{F}\) 上の最小多項式を \(g(x)\) とし、その次数を \(m\) とする。最小多項式は既約多項式の定理(31I)により、\(g(x)\) は既約多項式である。また、既約多項式の定理331F)により、方程式 \(g(x)=0\) の \(m\)個の解は全て異なっている。その解の一つは \(\theta\) なので、\(m\)個の解を、

 \(\theta=\theta_1,\:\theta_2,\:\cdots,\:\theta_m\)

とする。\(\theta_i\:\:(2\leq i\leq m)\) が \(\bs{L}\) の元かどうかは(この段階では)分からない。

\(\bs{F}\) の元を不変にする \(\bs{L}\) 上の同型写像の一つを \(\sigma\) とする。\(\sigma\) は \(\bs{F}\) の元を不変にするから、\(\bs{L}=\bs{F}(\theta)\) においては \(\sigma(\theta)\) を決めることによって \(\sigma\) が定義される。その同型写像は、方程式の解を共役な解に移す(51D)。そこで、\(m\)個の同型写像を、
 \(\sigma_i(\theta)=\theta_i\)
と定義する(\(\sigma_1=e\))。

一方、\(\bs{L}\) は \(\bs{F}\) 上の方程式 \(f(x)=0\) の最小分解体であった。\(f(x)=0\) の解を、
 \(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n\)
の \(n\)個とする。そうすると、
 \(\bs{L}=\bs{F}(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n)\)
である。\(\bs{L}\) の任意の元 は、\(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n\) の有理式(係数は \(\bs{F}\) の元)で表せる。\(\theta\) を有理式で表す式を、\(n\)変数の有理式 \(h(x_1,x_2,\cdots,x_n)\) を使って、
 \(\theta=h(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n)\)
と表したとする。\(h(x_i)\)は、\(n\)変数の多項式(係数は \(\bs{F}\) の元)を \(s(x_i)\) と \(t(x_i)\) として、
 \(h(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n)=\dfrac{s(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n)}{t(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n)}\)
である。

\(\theta\) に同型写像 \(\sigma_i\) を作用させる。\(\bs{F}\) 係数の有理式と \(\bs{F}\) を不変にする同型写像の演算順序は交換可能(51C)だから、
\(\begin{eqnarray}
&&\:\:\sigma_i(\theta)&=\sigma_i(h(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n))\\
&&&=h(\sigma_i(\alpha_1),\:\sigma_i(\alpha_2),\:\cdots,\:\sigma_i(\alpha_n))\\
\end{eqnarray}\)
となる。同型写像は方程式の解を共役な解に移す(51D)から、\(\sigma_i(\alpha_1),\:\sigma_i(\alpha_2),\:\cdots,\:\sigma_i(\alpha_n)\) は \(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n\) を入れ替えたものである(51E)。つまり \(\sigma_i(\theta)\) は \(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n\) の有理式で表現される。従って、
 \(\sigma_i(\theta)\:\in\:\bs{L}\)
である。\(\sigma_i(\theta)=\theta_i\) と定義したので、
 \(\theta_i\:\in\:\bs{L}\)
である。つまり \(m\)個の同型写像 \(\sigma_i\:\:(1\leq i\leq m)\) は全て \(\bs{L}\) の自己同型写像である。

[② \(\bs{\Rightarrow}\) ①の証明]

単拡大定理32B)により、\(\bs{K}\) は、\(\bs{K}\) の元 \(\theta\) を用いて \(\bs{K}=\bs{F}(\theta)\) と表すことができる。\(\theta\) の \(\bs{F}\) 上の最小多項式を \(f(x)\) とし、その次数を \(m\) とする。最小多項式は既約多項式の定理(31I)により、\(f(x)\) は既約多項式である。また既約多項式の定理331F)により、方程式 \(f(x)=0\) の \(m\)個の解は全て異なっている。解の一つは \(\theta\) なので、\(m\)個の解を、
 \(\theta=\theta_1,\:\theta_2,\:\cdots,\:\theta_m\)
とする。

\(\bs{F}\) の元を不変にする \(\bs{K}\) 上の同型写像の一つを \(\sigma\) とする。\(\sigma\) は \(\bs{F}\) の元を不変にするから、\(\bs{L}=\bs{F}(\theta)\) においては \(\sigma(\theta)\) を決めることによって \(\sigma\) が定義される。その同型写像は、\(\bs{F}\) 上の方程式の解を共役な解に移す(51D)。そこで、\(m\)個の同型写像を、
 \(\sigma_i(\theta)=\theta_i\)
と定義する。\(\bs{F}\) の元を不変にする \(\bs{K}\) 上の同型写像は自己同型写像なので、\(\sigma_i(\theta)=\theta_i\) は全て \(\bs{K}\) の元である。従って \(\bs{K}\) は \(\bs{F}\) 上の既約多項式 \(f(x)\) の解 \(\theta_i\) を用いて、

\(\begin{eqnarray}
&&\:\:\bs{K}&=\bs{F}(\theta)\\
&&&=\bs{F}(\theta_1,\:\theta_2,\:\cdots,\:\theta_m)\\
\end{eqnarray}\)

と表される。\(\bs{K}\) は \(\bs{F}\) 上の既約多項式の最小分解体である。[証明終]



① の定義は、方程式の解のありようを議論するガロア理論にとっては "ノーマルな" 定義のように見えます。しかし ② のように方程式という言葉を全く使わない定義もメリットがあります。たとえば「次数が違う2つの方程式の解によるガロア拡大が同じ」ということは、いくらでもありうるからです。

また、ガロア拡大は次のような定義もできます。

③ (正規拡大定義)体 \(\bs{F}\) の代数拡大体 \(\bs{K}\) があったとき、\(\bs{K}\) の任意の元の \(\bs{F}\) 上の最小多項式を \(f(x)\) とする。\(f(x)=0\) のすべての解が \(\bs{K}\) の元のとき、\(\bs{K}\) を \(\bs{F}\) の正規拡大と言う。ガロア拡大とは正規拡大のことである。

方程式という言葉は使っていますが、拡大体から始まる定義です。このように、互いに同値である多種の定義ができることがガロア理論の分かりにくいところですが、逆に「それだけ豊かな数学的内容を含んだ理論」とも言えるでしょう。

最小分解体の次数=ガロア群の位数
次数と位数の同一性:52B)

\(\bs{Q}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\)、ガロア群を \(G\) とするとき、\([\:\bs{L}\::\:\bs{Q}\:]=|G|\) である。


[証明]

単拡大定理32B)により、\(\bs{L}\) は、\(\bs{L}\) の元 \(\theta\) を用いて \(\bs{L}=\bs{Q}(\theta)\) と表すことができる。\(\theta\) の \(\bs{Q}\) 上の最小多項式を \(g(x)\) とし、その次数を \(m\) とする。最小多項式は既約多項式の定理(31I)により、\(g(x)\) は既約多項式である。また、既約多項式の定理331F)により、方程式 \(g(x)=0\) の \(m\)個の解は全て異なっている。解の一つは \(\theta\) なので、\(m\)個の解を、
 \(\theta=\theta_1,\:\theta_2,\:\cdots,\:\theta_m\)
とする。ここで、\(\theta_i\:\:(2\leq i\leq m)\) が \(\bs{L}\) の元かどうかは(この段階では)分からない。

\(\bs{L}\) 上の同型写像の一つを \(\sigma\) とする。\(\sigma\) は \(\bs{Q}\) の元を不変にするから、\(\bs{L}=\bs{Q}(\theta)\) においては \(\sigma(\theta)\) を決めることによって \(\sigma\) が定義される。その同型写像は、方程式の解を共役な解に移す(51D)。そこで、\(m\)個の同型写像を、
 \(\sigma_i(\theta)=\theta_i\)
と定義する(\(\sigma_1=e\))。単拡大体 \(\bs{Q}(\theta)\) に作用する同型写像は \(m\)個だから(51G)、これが同型写像のすべてである。

一方、\(\bs{L}\) は \(\bs{Q}\) 上の方程式 \(f(x)=0\) の最小分解体であった。\(f(x)=0\) の解を、
 \(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n\)
の \(n\)個とする。そうすると、
 \(\bs{L}=\bs{Q}(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n)\)
である。\(\bs{L}\) の任意の元 は、\(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n\) の有理式で表せる。\(\theta\) を有理式で表す式を、\(n\)変数の有理式 \(h(x_1,x_2,\cdots,x_n)\) を使って、
 \(\theta=h(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n)\)
と表したとする。\(h(x_i)\)は、\(n\)変数の多項式(係数は有理数)を \(s(x_i)\) と \(t(x_i)\) として、
 \(h(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n)=\dfrac{s(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n)}{t(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n)}\)
である。

\(\theta\) に同型写像 \(\sigma_i\) を作用させると、有理式と同型写像の演算順序は交換可能(51C)だから、
\(\begin{eqnarray}
&&\:\:\sigma_i(\theta)&=\sigma_i(h(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n))\\
&&&=h(\sigma_i(\alpha_1),\:\sigma_i(\alpha_2),\:\cdots,\:\sigma_i(\alpha_n))\\
\end{eqnarray}\)
となる。同型写像は方程式の解を共役な解に移すから(51D)、\(\sigma_i(\alpha_1),\:\sigma_i(\alpha_2),\:\cdots,\:\sigma_i(\alpha_n)\) は \(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n\) を入れ替えたものである(51E)。つまり \(\sigma_i(\theta)\) は \(\alpha_1,\:\alpha_2,\:\cdots,\:\alpha_n\) の有理式で表現される。従って、
 \(\sigma_i(\theta)\:\in\:\bs{L}\)
である。\(\sigma_i(\theta)=\theta_i\) と定義したので、
 \(\theta_i\:\in\:\bs{L}\)
である。つまり \(m\)個の同型写像 \(\sigma_i\:\:(1\leq i\leq m)\) は全て \(\bs{L}\) の自己同型写像である。以上により、
 \(\mr{Gal}(\bs{L}/\bs{Q})=\{\sigma_1,\:\sigma_2,\:\cdots,\:\sigma_m\}\)
であり、\(|G|=m\) である。

\(\theta\) の \(\bs{Q}\) 上の最小多項式(=既約多項式)の次数が \(m\) だから、単拡大体の基底の定理(33F)によって、最小分解体 \(\bs{L}=\bs{Q}(\theta)\) は \(\bs{Q}\) の \(m\)次拡大体であり、
 \([\:\bs{L}\::\:\bs{Q}\:]=|G|\)
である。[証明終]



この定理では \(\bs{Q}\) としましたが、任意の代数拡大体 \(\bs{F}\) としても成り立ちます。また、最小分解体はガロア拡大体です。従って、最も一般的に言うと次のようになります。


\(\bs{F}\) を代数拡大体とし、\(\bs{F}\) のガロア拡大を \(\bs{L}\) とする。\(\bs{L}\) のガロア群の位数は \(\bs{F}\) から \(\bs{L}\) への拡大次数に等しい。つまり、
 \([\:\bs{L}\::\:\bs{F}\:]=|\mr{Gal}(\bs{L}/\bs{F})|\)
である。


中間体
中間体からのガロア拡大:52C)

\(\bs{K}\) を \(\bs{F}\) のガロア拡大体とし、\(\bs{M}\) を \(\bs{F}\subset\bs{M}\subset\bs{K}\) である任意の体(=中間体)とするとき、\(\bs{K}\) は \(\bs{M}\) のガロア拡大体でもある。


[証明]

【最小分解体定義による】

\(\bs{K}\) が \(\bs{F}\) 上の方程式 \(f(x)=0\) の最小分解体であるとする。この方程式の解を \(\alpha_1,\:\alpha_2,\:\cdots\:\alpha_n\) とすると、\(\bs{K}=\bs{F}(\alpha_1,\:\alpha_2,\:\cdots\:\alpha_n)\) である。\(\bs{F}\subset\bs{M}\subset\bs{L}\) なので、
 \(\bs{F}(\alpha_1,\:\cdots\:\alpha_n)\:\subset\:\bs{M}(\alpha_1,\:\cdots\:\alpha_n)\:\subset\:\bs{K}(\alpha_1,\:\cdots\:\alpha_n)=\bs{K}\)
となるが、すなわち、
 \(\bs{F}\:\subset\:\bs{M}(\alpha_1,\:\alpha_2,\:\cdots\:\alpha_n)\:\subset\:\bs{K}\)
であり、\(\bs{K}=\bs{M}(\alpha_1,\:\alpha_2,\:\cdots\:\alpha_n)\) である。\(f(x)=0\) は \(\bs{M}\) 上の方程式でもあるので、\(\bs{K}\) は \(\bs{M}\) 上の方程式の最小分解体であり、\(\bs{M}\) のガロア拡大体である。

【自己同型定義による】

\(\bs{L}\) の同型写像のうち、\(\bs{M}\) の元を固定する任意の同型写像を \(\sigma\) とする。そうすると \(\sigma\) は \(\bs{M}\) の部分集合である \(\bs{F}\) の元も固定する。\(\bs{L}\) は \(\bs{F}\) のガロア拡大体なので、\(\bs{F}\) の元を固定する \(\bs{L}\) の同型写像は自己同型写像である。従って \(\sigma\) も自己同型写像であり、\(\bs{L}\) は \(\bs{M}\) のガロア拡大体である。[証明終]



\(\bs{F}\subset\bs{M}\subset\bs{K}\) という体の拡大列があったとき、\(\bs{F}\subset\bs{K}\) がガロア拡大だと上の定理(52C)によって \(\bs{M}\subset\bs{K}\) もガロア拡大です。しかし、\(\bs{F}\subset\bs{M}\) がガロア拡大になるとは限りません。\(\bs{F}\subset\bs{M}\) がガロア拡大になるためには条件が必要で、その条件が満たされば、\(\bs{F}\subset\bs{M}\subset\bs{K}\) は「ガロア拡大の連鎖」になり、そのことが方程式の可解性と結びつきます。それが次の節の大きな主題です。


5.3 ガロア対応


固定体と固定群
体 \(\bs{F}\) 上の方程式の最小分解体(=ガロア拡大体)を \(\bs{K}\) とし、ガロア群を \(G\) とします。\(G\) の部分群 \(H\) によって不変な \(\bs{K}\) の元の集合 \(\bs{M}\) は体になります。これを \(\bs{K}\) における \(H\) の固定体といい、\(\bs{K}(H)\) で表します。\(\bs{K}^H\) と書く流儀もあります。

\(\bs{M}\) が体になる理由は四則演算で閉じているからです。つまり \(\bs{M}\) の任意の2つの元を \(x,\:y\) とし、\(H\) の任意の元を \(\sigma\) とすると、\(x+y\in\bs{K},\:\sigma\in G\) なので \(\sigma(x+y)\) が定義できます。すると、
 \(\sigma(x+y)=\sigma(x)+\sigma(y)=x+y\)
となって、\(x+y\) は \(\sigma\) によって不変であり、\(x+y\in\bs{M}\) です。これは加算だけでなく加減乗除のすべてで成り立つので、\(\bs{M}\) は四則演算で閉じていて体です。

また \(\bs{K}\) の中間体 \(\bs{M}\) のすべての元を不変にする \(G\) の部分集合 \(H\) は群になります。これを \(G\) における \(\bs{M}\) の固定群と呼び、\(G(\bs{M})\) で表します。\(G^M\) と書く流儀もあります。

\(H\) が群になることを確認するため、\(\bs{M}\) の任意の元を \(x\)、\(H\) の2つの元を \(\sigma,\:\tau\) とします。すると、
 \(\sigma\tau(x)=\sigma(\tau(x))=\sigma(x)=x\)
となり、\(\sigma\tau\in H\) となって、\(H\) の元は群演算で閉じています。また \(H\) の元はもともと \(G\) の元なので、結合法則も成り立ちます。\(G\) の単位元を \(e\) とすると、\(e(x)=x\) なので \(e\in H\) です。さらに \(\sigma\) は \(G\) の元なので、\(G\) の中に \(\sigma^{-1}\) が存在します。すると、\(\sigma(x)=x\) の両辺に左から \(\sigma^{-1}\) をかけると、
 \(\sigma^{-1}\sigma(x)=\sigma^{-1}(x)\)
 \(x=\sigma^{-1}(x)\)
となり、\(\sigma^{-1}\) も \(H\) の元であることが分かります。\(H\) は群の定義を満たします。固定体と固定群を改めて定義として書くと次です。


固定体と固定群:53A)

体 \(\bs{F}\) 上の方程式の最小分解体(=ガロア拡大体)を \(\bs{K}\) とし、ガロア群を \(G\) とする。\(G\) の部分群 \(H\) によって不変な \(\bs{K}\) の元の集合 \(\bs{M}\) は体になる。これを \(\bs{K}\) における \(H\) の固定体といい、\(\bs{K}(H)\) で表す(または \(\bs{K}^H\))。

また \(\bs{K}\) の中間体 \(\bs{M}\) のすべての元を不変にする \(G\) の部分集合 \(H\) は群になる。これを \(G\) における \(\bs{M}\) の固定群と呼び、\(G(\bs{M})\) で表す(または \(G^M\))。


以上の固定体と固定群の概念を用いると、次のガロア対応の定理が成り立ちます。

ガロア対応の定理
ガロア対応:53B)

\(\bs{F}\) のガロア拡大体を \(\bs{K}\) とし、ガロア群を \(G\) とする。\(G\) の任意の部分群を \(H\) とし、\(H\) による \(\bs{K}\) の固定体 \(\bs{K}(H)\) を \(\bs{M}\) とする(次式)。

\(\begin{eqnarray}
&&G\:\supset\:H &\supset\:\{e\}\\
&&\bs{F}\:\subset\:\bs{K}(H)=\bs{M} &\subset\:\bs{K}\\
\end{eqnarray}\)

\(\bs{M}\)の固定群を \(G(\bs{M})\) とする(次式)。ガロア群の定義により \(G(\bs{M})=\mr{Gal}(\bs{K}/\bs{M})\) である。

\(\begin{eqnarray}
&&\bs{F}\:\subset\:\bs{M} &\subset\:\bs{K}\\
&&G\:\supset\:G(\bs{M}) &\supset\:\{e\}\\
\end{eqnarray}\)

このとき、
 \(G(\bs{M})=H\)
つまり、
\(\begin{eqnarray}
&&\:\:\mr{Gal}(\bs{K}/\bs{M})&=H \\
&&\:\:\bs{K}(G(\bs{M}))&=\bs{M}\\
\end{eqnarray}\)
が成り立つ。


[証明]

\(G\) の任意の部分群である \(H\) は \(\bs{K}\) の部分集合 \(\bs{M}\) を固定する。一方、\(G(\bs{M})\) は \(\bs{M}\) を固定する \(G\) のすべての元の集合で、それが部分群になっている。従って、\(G(\bs{M})\) は \(H\) を含む。つまり
 \(H\:\subset\:G(\bs{M})\)
である。

\(\bs{K}/\bs{F}\) はガロア拡大であり、\(\bs{M}\) はその中間体だから、中間体からのガロア拡大の定理(52C)によって、\(\bs{K}/\bs{M}\) はガロア拡大である。また、すべての代数拡大体は単拡大体だから(32B)、\(\bs{K}\) の元 \(\theta\) があって \(\bs{K}=\bs{F}(\theta)\) と表せる。これは、\(\bs{K}=\bs{M}(\theta)\) ということでもある。

\(H\) の \(|H|\:\:(=\#H)\) 個の元を \(\sigma_i\:\:(1\leq i\leq\#H)\) とし、多項式
 \(f(x)=\displaystyle\prod_{i=1}^{\#H}(x-\sigma_i(\theta))\)
を考える。この多項式の次数は \(\#H\) である。\(\sigma_i(\theta)\) は \(\theta\) の共役な元のどれかである。

\(f(x)\) を展開すると、その係数は \(\sigma_i(\theta)\:\:(1\leq i\leq\#H)\) の対称式になる。また、\(\sigma_i(\theta)\) に \(H\) の任意の元 \(\sigma_k\) を作用させても、\(\sigma_i\) は部分群だから演算で閉じており、\(\sigma_i(\theta)\) を入れ替えるだけである(51E)。従って \(\sigma_i(\theta)\) の対称式に \(\sigma_k\) を作用させても不変である。つまり、\(H\) の任意の元は \(f(x)\) の係数を固定する。ということは、\(\bs{M}\) の定義(= \(H\) による \(\bs{K}\) の固定体が \(\bs{M}\))によって、\(f(x)\) の係数は \(\bs{M}\) の元である。

\(\sigma_i\) は群だから単位元を含む。従って、
 \(f(\theta)=\displaystyle\prod_{i=1}^{\#H}(\theta-\sigma_i(\theta))=0\)
となり、\(\bs{\theta}\)\(\bs{\bs{M}}\) 上の \(\bs{\#H}\)次方程式 \(\bs{f(x)=0}\) の解の一つである。ゆえに \(\bs{M}\) から単拡大体 \(\bs{K}=\bs{M}(\theta)\) への拡大次数は、\(f(x)\) が \(\bs{M}\) 上の既約多項式なら単拡大体の基底の定理(33F)により \(\#H\) であり、一般には \(\#H\) 以下である。つまり、
 \([\:\bs{K}\::\:\bs{M}\:]\:\leq\:\#H\)
である。次数と位数の同一性52B)によると、拡大次数 \([\:\bs{K}\::\:\bs{M}\:]\) は、ガロア群 \(\mr{Gal}(\bs{K}/\bs{M})\) の位数に等しい。従って、
 \(|\mr{Gal}(\bs{K}/\bs{M})|\:\leq\:\#H\)
となる。このことにより、群の位数の大小関係から
 \(\mr{Gal}(\bs{K}/\bs{M})\:\subset\:H\)
つまり、
 \(G(\bs{M})\:\subset\:H\)
である。

以上により、\(H\:\subset\:G(\bs{M})\) かつ \(G(\bs{M})\:\subset\:H\) なので、
 \(G(\bs{M})=H\)
となる。従って、
\(\begin{eqnarray}
&&\:\:\mr{Gal}(\bs{K}/\bs{M})&=H \\
&&\bs{K}(G(\bs{M}))&=\bs{M}\\
\end{eqnarray}\)
である。[証明終]



証明の中に対称式という言葉が出てきます。対称式とは、
 変数の任意の入れ替えで不変な多項式
です。2変数 \(x,\:y\) だと、
 \(x+y,\:xy\)(ここまでが基本対称式)、\(x^2+y^2,\:\:(x-y)^2\)
などです。3変数 \(x,\:y\:,z\) だと、
 \(x+y+z,\:xy+yz+zx,\:xyz\)(基本対称式)、\(((x-y)(y-z)(z-x))^2\)
などです。

対称式でよく出てくるのは、方程式の根と係数の関係です。たとえば、\(\bs{Q}\) 上の既約な3次多項式を \(f(x)\) をとし、\(f(x)=0\) の解を \(\alpha,\beta,\gamma\) とします。
\(\begin{eqnarray}
&&\:\:f(x)&=x^3-ax^2+bx-c\\
&&&=(x-\alpha)(x-\beta)(x-\gamma)\\
\end{eqnarray}\)
と書くと、
 \(a=\alpha+\beta+\gamma\)
 \(b=\alpha\beta+\beta\gamma+\gamma\alpha\)
 \(c=\alpha\beta\gamma\)
と、係数が解の基本対称式で表現されます。

また ガロア群 \(\mr{Gal}(\bs{Q}(\alpha,\beta,\gamma)/\bs{Q})\) の任意の元 を \(\sigma\) とします。\(\alpha,\beta,\gamma\) の任意の対称式を \(S(\alpha,\beta,\gamma)\in\bs{Q}(\alpha,\beta,\gamma)\) とすると、
 \(\sigma(S(\alpha,\beta,\gamma))=S(\alpha,\beta,\gamma)\)
です。ガロア群の元は自己同型写像であり、方程式の解を解の一つに置き換えるので、これが成り立ちます。ガロア群の元を作用させて不変なのは有理数です。従って、\(S(\alpha,\beta,\gamma)\) は有理数です。もちろん \(f(x)\) が \(n\)次多項式であっても成り立ちます。



\(\bs{F}\subset\bs{M}\subset\bs{K}\) という体の拡大列で \(\bs{F}\subset\bs{K}\) がガロア拡大のとき、\(\bs{M}\subset\bs{K}\) は自動的にガロア拡大ですが(52C)、ある条件があれば \(\bs{F}\subset\bs{M}\) もガロア拡大になって、\(\bs{F}\subset\bs{M}\subset\bs{K}\) が「ガロア拡大の連鎖」になります。その条件は「ガロア対応」と「正規部分群」の概念を用いて示されます。それが次の正規性定理です。次では \(\bs{Q}\) から始まる体の拡大列で記述しています。

正規性定理
正規性定理:53C)

\(\bs{Q}\) のガロア拡大を \(\bs{K}\) とし、\(\mr{Gal}(\bs{K}/\bs{Q})=G\) とする。\(\bs{K}\) の中間体 \(\bs{M}\) と \(G\) の部分群 \(H\) がガロア対応になっているとする。このとき

① \(\bs{M}/\bs{Q}\) がガロア拡大である
② \(H\)が\(G\)の正規部分群である

の2つは同値である。また、これが成り立つとき、
 \(\mr{Gal}(\bs{M}/\bs{Q})\:\cong\:G/H\)
という群の同型が成り立つ。


[① \(\bs{\Rightarrow}\) ②の証明]

\(G\) の任意の元を \(g\) とし、\(\bs{M}\) の任意の元を \(m\) とする。

\(\bs{M}\) が \(\bs{Q}\) のガロア拡大なので、\(m\) の共役な元は \(\bs{M}\) に含まれる。従って、\(g\) を \(\bs{M}\) の元に限定して作用させると、それは自己同型写像になる。つまり \(g(m)\in\bs{M}\) である。また \(g^{-1}\) も \(G\) の元だから \(g^{-1}(m)\in\bs{M}\) である。

\(H\) の任意の元を \(h\) とする。\(H\) は \(\bs{M}\) とガロア対応をしているから、\(h\) は \(\bs{M}\) の元を不動にする。ゆえに、
 \(hg^{-1}(m)=g^{-1}(m)\)
である。従って、
 \(ghg^{-1}(m)=gg^{-1}(m)=m\)
となり、\(ghg^{-1}\) は \(\bs{M}\) の元を不動にするから \(H\) の元である。そうすると、
 \(gHg^{-1}\:\subset\:H\)
 \(gH\:\subset\:Hg\)
 \((\br{A})\)
が成り立つ。

また、\(g(m)\) も \(\bs{M}\) の元なので、
 \(hg(m)=g(m)\)
である。従って、
 \(g^{-1}hg(m)=g^{-1}g(m)=m\)
となり、\(g^{-1}hg\) も \(\bs{M}\) の元を不動にするから \(H\) の元である。そうすると、
 \(g^{-1}Hg\:\subset\:H\)
 \(Hg\:\subset\:gH\)
 \((\br{B})\)
が成り立つ。\((\br{A})\) と \((\br{B})\) により、
 \(gH=Hg\)
となって、左剰余類と右剰余類が一致するから、\(H\) は \(G\) の正規部分群である。

[② \(\bs{\Rightarrow}\) ①の証明]

\(\bs{M}\) の任意の元を \(m\) とする。同型写像の延長の定理(51H)により、\(\bs{M}\) の同型写像 \(s\) は \(\bs{K}\) の同型写像 \(g\) に延長できる。つまり、\(g\) を \(\bs{M}\) の元に限定して作用させたとき \(g(m)=s(m)\) となる \(g\) がある。

\(H\) の任意の元を \(h\) とすると、\(h\) は正規部分群の元なので、
 \(g^{-1}hg\:\in\:H\)
である。従って、
 \(g^{-1}hg(m)=m\)
 \(hg(m)=g(m)\)
となり、\(g(m)\) は \(H\) の任意の元で不動である。
ガロア対応の原理により \(\bs{K}(H)=\bs{M}\) なので、
 \(g(m)\:\in\:\bs{M}\)
となり、\(g(m)\) は \(H\) の固定体 \(\bs{M}\) の元である。

\(\bs{M}\)の元に \(g\) を作用させるときは \(g(m)\) は \(s(m)\) そのものなので、
 \(s(m)\:\in\:\bs{M}\)
となる。

以上により、\(\bs{M}\) の同型写像による \(m\) の移り先(= \(m\) と共役な元)は \(\bs{M}\) に含まれることになり、\(\bs{M}/\bs{Q}\) はガロア拡大である。[証明終]

\(\bs{\mr{Gal}(\bs{M}/\bs{Q})\:\cong\:G/H}\) の証明]

同型写像の延長の定理(51H)の証明で示したように、\(\bs{M}\) の同型写像 \(s\) を \(\bs{K}\) の同型写像に延長する可能性は複数ある。\(g_1\) と \(g_2\) を \(s\) の2つの延長とし、\(\bs{M}\)の元を \(m\) とする。\(g_1,\:g_2\) は、\(\bs{M}\) に限定して適用すると \(s\) に等しいから、
 \(g_1(m)=s(m)\)
 \(g_2(m)=s(m)\)
が成り立つ。

\(g_1^{-1}g_2\) を \(m\) に作用させると
\(\begin{eqnarray}
&&\:\:g_1^{-1}g_2(m)&=g_1^{-1}(s(m))\\
&&&=g_1^{-1}(g_1(m))=m\\
\end{eqnarray}\)
となり、\(g_1^{-1}g_2\) は \(\bs{M}\) の元を不動にする。よって、
 \(g_1^{-1}g_2\in\:H\)
 \(g_2\in\:g_1H\)
である。

つまり、\(g_2\) は \(H\) の剰余類の一つの集合 \(g_1H\) に入る。以上で、\(\bs{M}\) の同型写像 \(s\) は、同型写像の延長を通して 剰余類 \(G/H\) の一つを定めることが分かる。

逆に \(g_1\) と \(g_2\) が 剰余類 \(G/H\) の同じ集合に属すると、
 \(g_2\in\:g_1H\)
 \(g_1^{-1}g_2\in\:H\)
 \(g_1^{-1}g_2(m)=m\)
 \(g_2(m)=g_1(m)\)
となり、\(g_1\) と \(g_2\) は \(\bs{M}\) 上で全く同じ作用をする。従って、\(\bs{M}\) 上で \(g_1,\:g_2\) と同じ作用をする \(\mr{Gal}(\bs{M}/\bs{Q})\) の元 \(s\) を定められる。つまり、剰余類 \(G/H\) の一つの集合が \(\mr{Gal}(\bs{M}/\bs{Q})\) の元を一つ定める。

従って、
 \(\mr{Gal}(\bs{M}/\bs{Q})\:\cong\:G/H\)
である。[証明終]

「5.ガロア群とガロア対応」終わり 
次回に続く


nice!(0) 

No.355 - 高校数学で理解するガロア理論(2) [科学]

\(\newcommand{\bs}[1]{\boldsymbol{#1}}
\newcommand{\mr}[1]{\mathrm{#1}}
\newcommand{\br}[1]{\textbf{#1}}
\newcommand{\ol}[1]{\overline{#1}}\)
 
2.整数の群 
 

2.整数の群」「3.多項式と体」「4.一般の群」の3つの章は、第5章以下のガロア理論の核心に入るための準備です。

第2章の目的は2つあり、一つは整数を素材にして「群」と、それに関連した「剰余類」「剰余群」「既約剰余類」など、ガロア理論の理解に必要な概念を説明することです。

もう一つは、第2章の最後にある「既約剰余類群は巡回群の直積と同型である」という定理を証明することです。この定理はガロア理論の最終段階(6.可解性の必要条件)で必要なピースになります。

まず、整数論の基礎ともいえる「ユークリッドの互除法」「不定方程式」「法による演算」「中国剰余定理」から始めます。これらは、後の定理の証明にしばしば使います。


2.1 整数


ユークリッドの互除法
互除法の原理:21A)

自然数 \(a\) と \(b\) の最大公約数を \(\mr{gcd}(a,\:b)\) で表す。自然数 \(a\) を \(b\) で割った余りを \(r\) とすると、

 \(\mr{gcd}(a,\:b)=\mr{gcd}(b,\:r)\)

である。


[証明]

記述を簡略化するため、最大公約数を、
 \(\mr{gcd}(a,\:b)=x\)
 \(\mr{gcd}(b,\:r)=y\)
で表す。\(a\) を \(b\) で割った商を \(p\)、余りを \(r\) とすると、
 \(a=pb+r\) \((0\leq r < b)\)
と書ける。\(a\) と \(pb\) は \(x\) で割り切れるから、\(r\) も \(x\) で割り切れる。つまり \(x\) は \(r\) の約数である。\(x\) は \(b\) の約数でもあるから、\(x\) は \(b\) と \(r\) の公約数である。公約数は \(b\) と \(r\) の最大公約数 \(y\) 以下だから、
 \(x\leq y\)
である。

一方、\(pb\) と \(r\) は \(y\) で割り切れるから、\(y\) は \(a\) の約数である。\(y\) は \(b\) の約数でもあるから、\(y\) は \(a\) と \(b\) の公約数である。公約数は \(a\) と \(b\) の最大公約数以下だから、
 \(y\leq x\)
である。\(x\leq y\) かつ \(y\leq x\) なので \(x=y\)、つまり、
 \(\mr{gcd}(a,\:b)=\mr{gcd}(b,\:r)\)
である。[証明終]



この原理を利用して \(\mr{gcd}(a,\:b)\) を求めることができます。もし \(a\) が \(b\) で割り切れるなら \(\mr{gcd}(a,\:b)=b\) です。そうでないなら、\(a\) を \(b\) で割った余り \(r\) を求め、
 新 \(a\:\longleftarrow\:b\)
 新 \(b\:\longleftarrow\:r\)
と定義し直して、\(a\) が \(b\) で割り切れるかどうかを見ます。こうして次々と \(a\) と \(b\) のペアを作っていけば(=互除法)、\(b\) は単調減少していくので、いずれ \(a\) が \(b\) で割り切れるときがきます。なかなか割り切れなくても、\(b\) が \(1\) までくると絶対に割り切れる。つまり、
 \(\mr{gcd}(a,\:b)=b\)
となるのが最終段階で、そのときの \(b\) が最大公約数です。\(b\) が \(1\) までになってしまったら、最大公約数は \(1\)、つまり \(a\) と \(b\) は互いに素です。

多項式は整数と同じように、割り算はできませんが余り算はできます。互除法は多項式の性質を理解するときにも必須になります。

1次不定方程式
不定方程式の解の存在:21B)

2変数 \(x,\:y\) の1次不定方程式を、
 \(ax+by=c\)
  (\(a,\:b,\:c\) は整数。\(a\neq0,\:b\neq0\))
とし、\(a\) と \(b\) の最大公約数を \(d\) とする。このとき、
 \(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。



このことは1次不定方程式が3変数以上であっても成り立つ。つまり
 \(a_1x_1+a_2x_2+\:\cdots\:+a_nx_n=c\)
  (\(a_i\) は \(0\) 以外の整数)
とし、
 \(d=\mr{gcd}(a_1,a_2,\:\cdots\:,\:a_n)\)
とする。このとき、
 \(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。


[証明]

1次不定方程式が整数解を持つとしたら、方程式の左辺は \(d\) で割り切れる、つまり \(d\) の倍数だから、右辺の \(c\) も \(d\) の倍数である。このことの対偶は「\(c\) が \(d\) の倍数でなければ方程式は整数解を持たない」なので、題意の「そうでなければ整数解を持たない」が証明されたことになる。従って以降は「\(c=kd\) (\(k\) は整数)と表せるなら方程式は整数解を持つ」ことを証明する。まず、変数が2つの場合である。

係数の \(a\) と \(b\) に互除法21A)を適用し、それと同時に \(x,\:y\) の変数を変換して方程式を変形していく。まず、\(a\) を \(b\) で割った商を \(p\)、余りを \(r\) とする。
 \(a=pb+r\)
である。互除法の次のステップの係数と変数を次のように決める。

\(\:\:\:\:\br{①}\left\{
\begin{array}{l}
\begin{eqnarray}
&&a_1=b&\\
&&b_1=r&\\
\end{eqnarray}
\end{array}\right.\)

\(\:\:\:\:\br{②}\left\{
\begin{array}{l}
\begin{eqnarray}
&&x_1=px+y&\\
&&y_1=x&\\
\end{eqnarray}
\end{array}\right.\)

\(\br{②}\) を \(x,\:y\) について解くと、

\(\:\:\:\:\br{③}\left\{
\begin{array}{l}
\begin{eqnarray}
&&x=y_1&\\
&&y=x_1-py_1&\\
\end{eqnarray}
\end{array}\right.\)

である。このよう定義すると、\(\br{①}\)、\(\br{②}\) を使って、
\(\begin{eqnarray}
&&\:\:a_1x_1+b_1y_1&=b(px+y)+rx\\
&&&=pbx+by+rx\\
&&&=(pb+r)x+by\\
&&&=ax+by\\
\end{eqnarray}\)
と計算できるので、不定方程式は、
 \(a_1x_1+b_1y_1=c\)
となり、係数の値がより小さい方程式に変形できる。互除法の原理21A)により、\(a_1\) と \(b_1\) の最大公約数は \(d\) のままである。この方程式の \(x_1,\:y_1\) が求まれば、\(\br{③}\) を使って \(x,\:y\) が求まる。

以上の式の変形は、\(1\leq i\) として、\(a_i\) を \(b_i\) で割った商と余りを、
 \(a_i=p_ib_i+r_i\)
のように求め、互除法の次のステップを、
 \(a_{i+1}=b_i\)
 \(b_{i+1}=r_i\)
 \(x_{i+1}=p_ix_i+y_i\)
 \(y_{i+1}=x_i\)
とすることで続けていける。このように、係数に互除法の適用を繰り返し、同時に変数を変換していく。そして互除法の最終段階で、
 \(a_nx_n+b_ny_n=c\)
となったとする。この段階では \(a_n\) は \(b_n\) で割り切れ、そのときの \(b_n\) は最大公約数 \(d\) である。つまり。
 \(a_nx_n+dy_n=c\)
である。もし \(c\) が \(d\) の倍数であれば、つまり \(c=kd\) (\(k\) は整数)なら、
 \(x_n=0\)
 \(y_n=k\)
という整数解を必ずもつ。従って、変数の変換過程を逆にたどって \(x,\:y\) が求まる。以上で2変数の場合に題意が正しいことが証明でき、同時に1次不定方程式の解を求めるアルゴリズムも明らかになった。



数学的帰納法を使って、3変数以上の場合を証明する。\(n=2\) の場合に成り立つことを示したので、\(n=k\) の場合に成り立つと仮定する。つまり、

\(k\) 変数の不定方程式を、
 \(a_1x_1+a_2x_2+\:\cdots\:+a_kx_k=c_k\)
  (\(a_i\) は \(0\) 以外の整数)
 \(d_k=\mr{gcd}(a_1,a_2,\:\cdots\:,\:a_k)\)
とするとき、
 \(c_k=md_k\) (\(m\) は整数)
なら整数解がある。

仮定する。\(n=k+1\) の場合の不定方程式を、

 \(a_1x_1+a_2x_2+\:\cdots\:+a_kx_k+a_{k+1}x_{k+1}=c_{k+1}\)
\(\begin{eqnarray}
&&\:\: d_k&=\mr{gcd}(a_1,a_2,\:\cdots\:,\:a_k)\\
&&\:\: d_{k+1}&=\mr{gcd}(a_1,a_2,\:\cdots\:,\:a_k,\:a_{k+1})\\
\end{eqnarray}\)

とし、この方程式が整数解をもつ条件を調べる。方程式を移項すると、

 \(a_1x_1+a_2x_2+\:\cdots\:+a_kx_k=c_{k+1}-a_{k+1}x_{k+1}\)

となるが、この不定方程式が整数解をもつのは、数学的帰納法の仮定によって
 左辺\(=d_k\) の整数倍
のときである。つまり、
 \(c_{k+1}-a_{k+1}x_{k+1}=d_k\cdot y\)
という、2つの変数 \(x_{k+1},\:y\) の不定方程式が整数解をもつときである。式を移項すると、
 \(a_{k+1}x_{k+1}+d_k\cdot y=c_{k+1}\)
であるが、これは証明済みの \(n=2\) のときの定理によって、
 \(c_{k+1}=m\cdot\mr{gcd}(d_k,\:a_{k+1})\) (\(m\) は整数)
の場合に整数解をもつ。ここで、
 \(\mr{gcd}(d_k,\:a_{k+1})=d_{k+1}\)
なので、
 \(c_{k+1}=m\cdot d_{k+1}\) (\(m\) は整数)
の場合にのみ、\(n=k+1\) の不定方程式は整数解をもつことになる。

つまり、\(n=k\) のときに題意が成り立つと仮定すると、\(n=k+1\) のときにも成り立つ。\(n=2\) のときには成り立つから、\(n\geq3\) でも成り立つ。[証明終]



重要なのは、係数が互いに素な場合です。不定方程式の解の存在21B)から、次の定理がすぐに出てきます。

不定方程式の解の存在:21C)

\(0\) でない整数 \(a\) と \(b\) が互いに素とすると、1次不定方程式、
 \(ax+by=1\)
は整数解をもつ。また、\(n\) を任意の整数とすると、
 \(ax+by=n\)
は整数解をもつ。あるいは、任意の整数 \(n\) は、
 \(n=ax+by\) \((x,\:y\) は整数)
の形で表現できる。



これは3変数以上であっても成り立つ。たとえば3変数の場合は、\(0\) でない整数 \(a,\:b,\:c\) の最大公約数が \(1\)、つまり、
 \(\mr{gcd}(a,b,c)=1\)
であるとき、\(n\) を任意の整数として、1次不定方程式、
 \(ax+by+cz=n\)
は整数解を持つ。


互除法と同じように、不定方程式の解の存在定理 (21B)と(21C)も、多項式の性質を理解する上で重要です。

法による演算
法による演算の定義:21D)

\(a,\:b\) を整数、\(n\) を自然数とする。\(a\) を \(n\) で割った余りと、\(b\) を \(n\) で割った余りが等しいとき、
 \(a\equiv b\:\:(\mr{mod}\:n)\)
と書き、\(a\) と \(b\) は「法 \(n\) で合同」という。あるいは「\(\mr{mod}\:n\) で合同」、「\(\mr{mod}\:n\) で(見て)等しい」とも記述する。


法による演算の規則は、さまざまありますが、主なものは次の通りです。このような演算を以降の説明で適時使います。

法による演算規則:21E)

\(a,\:b,\:c,\:d\) を整数、\(n,r\) を自然数とし、
 \(a\equiv b\:\:(\mr{mod}\:n)\)
 \(c\equiv d\:\:(\mr{mod}\:n)\)
とする。このとき、
\((1)\:a+c\)\(\equiv b+d\) \((\mr{mod}\:n)\)
\((2)\:a-c\)\(\equiv b-d\) \((\mr{mod}\:n)\)
\((3)\:ac\)\(\equiv bd\) \((\mr{mod}\:n)\)
\((4)\:a^r\)\(\equiv b^r\) \((\mr{mod}\:n)\)
である。


中国剰余定理
中国剰余定理:21F)

\(n_1\) と \(n_2\) を互いに素な自然数とする。\(a_1\) と \(a_2\) を、\(0\leq a_1 < n_1,\:0\leq a_2 < n_2\) を満たす整数とする。このとき、
 \(x\equiv a_1\:\:(\mr{mod}\:n_1)\)
 \(x\equiv a_2\:\:(\mr{mod}\:n_2)\)
の連立方程式を満たす整数 \(x\) が存在する。この \(x\) は \(\mr{mod}\:n_1n_2\) でみて唯一である。つまり、\(0\leq x < n_1n_2\) の範囲に解が唯一存在する。


[証明]

もし \(x\) と \(y\:\:(y\leq x)\) が連立方程式を満たすとすると、
 \(x\equiv a_1\:\:(\mr{mod}\:n_1)\)
 \(y\equiv a_1\:\:(\mr{mod}\:n_1)\)
なので、
 \(x-y\equiv0\:\:(\mr{mod}\:n_1)\)
であり、\(x-y\) は \(n_1\) で割り切れる。同様にして \(x-y\) は \(n_2\) でも割り切れる。\(n_1\) と \(n_2\) は互いに素なので、\(x-y\) は \(n_1n_2\) で割り切れる。従って \(x-y\) は \(n_1n_2\) の倍数であり、
 \(x-y\equiv0\) \((\mr{mod}\:n_1n_2)\)
 \(x\equiv y\) \((\mr{mod}\:n_1n_2)\)
である。従って連立方程式に解があるとしたら \(\mr{mod}\:n_1n_2\) でみて唯一である。つまり \(0\leq x < n_1n_2\) の範囲で唯一に決まる。

\(n_1,\:n_2\) は互いに素なので、不定方程式の解の存在定理(21C)により、
 \(n_1m_1+n_2m_2=1\)
を満たす \(m_1,\:m_2\) が存在する。ここで、
 \(x=a_2n_1m_1+a_1n_2m_2\)
とおくと、
\(\begin{eqnarray}
&&\:\:x&=a_2n_1m_1+a_1n_2m_2\\
&&&=a_2n_1m_1+a_1(1-n_1m_1)\\
&&&=a_1+n_1m_1(a_2-a_1)\\
&&&\equiv a_1\:\:(\mr{mod}\:n_1)\\
\end{eqnarray}\)
であり、
\(\begin{eqnarray}
&&\:\:x&=a_2n_1m_1+a_1n_2m_2\\
&&&=a_2(1-n_2m_2)+a_1n_2m_2\\
&&&=a_2+n_2m_2(a_1-a_2)\\
&&&\equiv a_2\:\:(\mr{mod}\:n_2)\\
\end{eqnarray}\)
なので、\(x\) は連立方程式の解である。この解は、上での証明のとおり \(\mr{mod}\:n_1n_2\) でみて唯一である。[証明終]



中国剰余定理は3数以上に拡張できて、次が成り立ちます。

中国剰余定理・多連立:21G)

\(n_1,\:n_2,\:\cdots\:,\:n_k\) を、どの2つをとっても互いに素な自然数とする。\(a_i\) を \(0\leq a_i < n_i\:\:(1\leq i\leq k)\) を満たす整数とする。このとき、

 \(x\equiv a_1\:\:(\mr{mod}\:n_1)\)
 \(x\equiv a_2\:\:(\mr{mod}\:n_2)\)
  \(\vdots\)
 \(x\equiv a_k\:\:(\mr{mod}\:n_k)\)

の連立合同方程式を満たす整数 \(x\) が存在する。この \(x\) は \(\mr{mod}\:n_1n_2\cdots n_k\) でみて唯一である。つまり、\(0\leq x < n_1n_2\cdots n_k\) の範囲では唯一の解が存在する。


[証明]

自然数 \(N\) を
 \(N=n_1n_2\cdots n_k\)
と定義する。
 \(\mr{gcd}\left(\dfrac{N}{n_i},n_i\right)=1\:\:\:(1\leq i\leq k)\)
なので、不定方程式の解の存在の定理(21C)により、
 \(\dfrac{N}{n_i}s_i+n_it_i=1\:\:\:(1\leq i\leq k)\)
を満たす整数解、\(s_i,\:t_i\:\:(1\leq i\leq k)\) が存在する。
 \(x=\displaystyle\sum_{i=1}^{k}a_i\dfrac{N}{n_i}s_i\)
と定義すると、\(j\neq i\) である \(j\) について、
 \(\dfrac{N}{n_j}\equiv0\:\:(\mr{mod}\:n_i)\)
だから、\(\mr{mod}\:n_i\) でみると、\(x\) を定義する総和記号のなかは \(i\) の項だけが残る。つまり、
\(\begin{eqnarray}
&&\:\:x&\equiv a_i\dfrac{N}{n_i}s_i\:\:(\mr{mod}\:n_i)\\
&&&=a_i(1-n_it_i)\\
&&&\equiv a_i\:\:(\mr{mod}\:n_i)\\
\end{eqnarray}\)
となって、\(x\) は連立合同方程式の解である。

連立合同方程式に2つの解、\(x,\:y\) があったとすると、
\(\begin{eqnarray}
&&\:\:x-y&\equiv a_i-a_i &(\mr{mod}\:n_i)\\
&&&=0 &(\mr{mod}\:n_i)\\
\end{eqnarray}\)
となり、\(x-y\) は \(n_i\) の倍数である。これは \(1\leq i\leq k\) のすべての \(i\) で成り立ち、また \(n_i\:\:(1\leq i\leq k)\) は、どの2つをとっても互いに素である(=共通な因数が全くない)から、\(x-y\) は \(N\) の倍数である。従って、
 \(x\equiv y\:\:(\mr{mod}\:N)\)
であり、\(x\) は \(\mr{mod}\:n_1n_2\cdots n_k\) でみて唯一である。[証明終]


2.2 群


これ以降、整数を素材に「群」と、それに関連した概念の説明をします。まず、群の定義からです。

群の定義
群の定義:22A)

集合 \(G\) が次の ① ~ ④ を満たすとき、\(G\) は(group)であると言う。

① \(G\) の任意の元 \(x,\:y\) に対して演算(\(\cdot\)で表す)が定義されていて、\(x\cdot y\in G\) である。

② 演算について結合法則が成り立つ。つまり、
 \((x\cdot y)\cdot z=x\cdot(y\cdot z)\)

③ \(G\) の任意の元 \(x\) に対して
 \(x\cdot e=e\cdot x=x\)
を満たす元 \(e\) が存在する。\(e\) を単位元という。

④ \(G\) の任意の元 \(x\) に対して
 \(x\cdot y=y\cdot x=e\)
となる元 \(y\) が存在する。\(y\) を \(x\) の逆元といい、\(x^{-1}\) と表す。


整数 \(\bs{Z}\)
整数の集合を \(\bs{Z}\) と書きます。\(\bs{Z}\) は「加法(足し算)を演算とする群」になります。単位元は \(0\) で、元 \(x\) の逆元は \(-x\) です。この群の元の数は無限なので「無限群」です。

整数の加法は、\(x+y=y+x\) と演算の順序を入れ替えることができます。このような群が可換群です。アーベル群とも言います。

なお、有理数は \(\bs{Q}\)、実数は \(\bs{R}\)、複素数は \(\bs{C}\) で表しますが、\(\bs{Q}\)、\(\bs{R}\)、\(\bs{C}\) は、\(\bs{Z}\) を同じように加法に関して群です(=加法群)。と同時に \(\bs{Q}\)、\(\bs{R}\)、\(\bs{C}\) から加法の単位元 \(0\) を除くと、乗法に関しても群になります。その単位元は \(1\) です。

部分群 \(n\bs{Z}\)
群 \(G\) の部分集合 \(H\) が、\(G\) と同じ演算で群としての定義を満たすとき、\(H\) を部分群(subgroup)と言います。

\(G\) の単位元 \(e\) だけから成る部分集合 \(\{\:e\:\}\) は群としての定義を満たし、部分群です。また \(G\) そのものも "\(G\)の部分集合" であり、部分群です。これらを \(G\) の「自明な部分群」と言います。

\(\bs{Z}\) の元の一つを \(n\) とし(\(n\neq0\))、\(n\) の倍数の集合を \(n\bs{Z}\) と表記します。\(n\bs{Z}\) は加法を演算として群の定義を満たすので、\(\bs{Z}\) の部分群です。\(n\bs{Z}\) も無限群かつ可換群です。たとえば \(n=6\) とすると、

 \(6\bs{Z}=\{\cdots,\:-6,\:0,\:6,\:12,\:18,\:\cdots\}\)

です。

剰余類と剰余群
部分群を用いて、元の数が有限個である有限群を作ることができます。一般に、群 \(G\) の部分群を \(H\) とするとき(演算を "\(\cdot\)" とします)、\(G\) の任意の元 \(g\) を取り出して、
 \(g\cdot H\)
とした集合を剰余類(coset / residue class)と言います。これは「\(g\) と、集合 \(H\) のすべての元を演算した結果の集合」の意味です。

\(\bs{Z}\) と その部分群 \(6\bs{Z}\) を例にとると、\(\bs{Z}\) の任意の元を \(i\) として、
 \(i+6\bs{Z}\)
が剰余類です。具体的にその集合を書くと、
  \(\vdots\)
 \(0+6\bs{Z}=\{\cdots,\:-6,\:\:0,\:\phantom{1}6,\:12,\:18,\:\cdots\}\)
 \(1+6\bs{Z}=\{\cdots,\:-5,\:\:1,\:\phantom{1}7,\:13,\:19,\:\cdots\}\)
 \(2+6\bs{Z}=\{\cdots,\:-4,\:\:2,\:\phantom{1}8,\:14,\:20,\:\cdots\}\)
 \(3+6\bs{Z}=\{\cdots,\:-3,\:\:3,\:\phantom{1}9,\:15,\:21,\:\cdots\}\)
 \(4+6\bs{Z}=\{\cdots,\:-2,\:\:4,\:10,\:16,\:22,\:\cdots\}\)
 \(5+6\bs{Z}=\{\cdots,\:-1,\:\:5,\:11,\:17,\:23,\:\cdots\}\)
 \(6+6\bs{Z}=\{\cdots,\:\phantom{-}0,\:\:6,\:12,\:18,\:24,\:\cdots\}\)
 \(7+6\bs{Z}=\{\cdots,\:\phantom{-}1,\:\:7,\:13,\:19,\:25,\:\cdots\}\)
  \(\vdots\)
などです。以降、剰余類 \(i+6\bs{Z}\) を \(\ol{\,i\,}\) と記述します。つまり、
 \(\ol{\,i\,}=i+6\bs{Z}\)
です。上の表示を見ると分かるように、たとえば \(\ol{\,1\,}\) と \(\ol{\,7\,}\) は集合として同じものです。さらに、
 \(\cdots=\ol{-11}=\ol{-5}=\ol{\,1\,}=\ol{\,7\,}=\ol{13}=\cdots\)
であり、これらは同じ集合です。これらの集合の中から一つの元を選んで「代表元」と呼ぶことにします。以降、分かりやすいように \(1\) を代表元とします。その他の剰余類についても同じようにすると、部分群 \(6\bs{Z}\) による剰余類は、
 \(\ol{\,0\,},\:\ol{\,1\,},\:\ol{\,2\,},\:\ol{\,3\,},\:\ol{\,4\,},\:\ol{\,5\,}\)
の6つで表されることになります。これらの剰余類には重複がありません。また、全部の和集合をとると \(\bs{Z}\) になります。記号で書くと、\(\phi\) を空集合として、

 \(\ol{\,i\,}\:\cap\:\ol{\,j\,}\:=\:\phi\:\:(0\leq i,\:j\leq6,\:i\neq j)\)

 \(\bs{Z}=\ol{\,0\,}\:\cup\:\ol{\,1\,}\:\cup\:\ol{\,2\,}\:\cup\:\ol{\,3\,}\:\cup\:\ol{\,4\,}\:\cup\:\ol{\,5\,}\)

です。別の見方をすると、\(i,\:j\) を任意の整数するとき、

・  \(\ol{\,i\,}\) と \(\ol{\,j\,}\) の元は「全く同じ」か「全く重複しない」のどちらかである
・  \(\bs{Z}\) は剰余類で分類される

と言えます。平たく言うと、\(n\)(上の例では \(6\))で割った余りが同じ整数を集めたものが剰余類です。"剰余" という用語はそこからきています。

剰余群.jpg
剰余類と剰余群

整数 \(\bs{Z}\) の部分集合 \(6\bs{Z}\)(\(6\)の倍数の集合)から、\(\ol{\,i\,}=i+6\bs{Z}\) \((0\leq i\leq5)\) の定義で6つの「剰余類」が作れる。これらに重複はなく、\(\bs{Z}\) はこの6つで "分類" される。

整数 \(i,\:j,\:k\) に \(i+j=k\) の関係があるとき、\(\ol{\,i\,}+\ol{\,j\,}=\ol{\,k\,}\) で剰余類の加算を定義すると、この定義で剰余類は群となる。この群を「剰余群」と呼び \(\bs{Z}/6\bs{Z}\) で表わす(単位元は \(\ol{\,0\,}\))。この群では \(\ol{\,3\,}+\ol{\,5\,}=\ol{\,2\,}\) などの演算になるが、これは整数の合同式 \(3+5\equiv2\) \((\mr{mod}\:6)\) と同一視できる。

剰余類のうち、\(\ol{\,0\,}\) は \(\bs{Z}\) の部分群ですが、\(\ol{\,i\,}\:(i\neq0)\) の集合は \(\bs{Z}\) の部分群ではありません。集合の元と元のたし算が集合を "はみ出す" からです。しかし、剰余類同士の演算(=集合と集合の演算)を定義することにより、剰余類を元とする群を構成できます。それが次です。



剰余類に加算を定義できます。つまり、\(\ol{\,i\,}+\ol{\,j\,}\) を、
 \(\ol{\,i\,}+\ol{\,j\,}=\ol{(\:i+j\:)}\) (右辺の \(+\) は整数の加算)
と定義すると、この演算の定義で剰余類は群になり、
 \(\bs{Z}/n\bs{Z}\)
と表します。この群の元は集合(=剰余類)です。この群を剰余群(あるいは商群。quotient group)と言います。元の数は有限なので有限群です。また演算が整数の加算なので可換であり、「有限可換群」です。

\(\bs{Z}/n\bs{Z}\) という記法では、\(\bs{Z}\) も \(n\bs{Z}\) も群(この場合は加法群)です。一般に「群\(/\)部分群」と書けば、剰余群(商群)の意味です。これに対して「拡大体\(/\)体」は "体の拡大" を意味します。 \(\bs{Q}(\alpha)/\bs{Q}\) などです。

一般に、有限群 \(G\) の元の数を群の位数(order)と呼び、
 \(|G|\) あるいは \(\#G\)
で表します。剰余群では、
 \(|(\bs{Z}/n\bs{Z})|\)\(=n\)
 \(\#(\bs{Z}/n\bs{Z})\)\(=n\)
です。

生成元と巡回群
剰余群 \(\bs{Z}/n\bs{Z}\) は、元 \(\ol{\,1\,}\) だけをもとに群演算を繰り返すことによって、すべての元を作り出すことができます。\(\bs{Z}/6\bs{Z}\) を例にとると、
 \(\ol{\,2\,}=\ol{\,1\,}+\ol{\,1\,}\)
 \(\ol{\,3\,}=\ol{\,1\,}+\ol{\,1\,}+\ol{\,1\,}\)
などであり
 \(\ol{\,0\,}=\ol{\,1\,}+\ol{\,1\,}+\ol{\,1\,}+\ol{\,1\,}+\ol{\,1\,}+\ol{\,1\,}\)
です。群にこのような元がある場合、それを生成元(generator)と呼びます。\(\bs{Z}/6\bs{Z}\) の場合は \(\ol{\,1\,}\) のほかに \(\ol{\,5\,}\) も生成元です。\(\ol{\,i\,}\) を \(k\) 個加算することを、\(k\cdot\ol{\,i\,}\) と書くことにします。
 \(k\cdot\ol{\,i\,}=\overbrace{\ol{\,i\,}+\ol{\,i\,}+\cdots+\ol{\,i\,}}^{k\:個加算}\)
です。\(\ol{\,5\,}\) については、
 \(1\cdot\ol{\,5\,}=\ol{\,5\,},\:\:2\cdot\ol{\,5\,}=\ol{\,4\,},\:\:3\cdot\ol{\,5\,}=\ol{\,3\,}\)
 \(4\cdot\ol{\,5\,}=\ol{\,2\,},\:\:5\cdot\ol{\,5\,}=\ol{\,1\,},\:\:6\cdot\ol{\,5\,}=\ol{\,0\,}\)
のように、\(\ol{\,5\,}\) を起点として全部の元が生成され、\(\ol{\,5\,}\) が生成元であることがわかります。

剰余群 \(\bs{Z}/n\bs{Z}\) においては、\(1\leq g < n\) である整数 \(g\) が \(n\) と互いに素であるとき、\(\ol{\,g\,}\) は生成元になります。その理由ですが、
 \(\ol{\,g\,},\:\:2\cdot\ol{\,g\,},\:\:3\cdot\ol{\,g\,},\:\cdots\:,\:n\cdot\ol{\,g\,}\)
 \((\br{A})\)
という \(n\) 個の剰余類の列を考えると、これらは全て違ったものだからです。なぜなら、もし \(1\leq i < j\leq n\) である \(i,\:j\) について、
 \(i\cdot\ol{\,g\,}=j\cdot\ol{\,g\,}\)
だとすると、これは、法 \(n\) における整数の合同式で、
 \(ig\equiv jg\:\:(\mr{mod}\:n)\)
を意味します。つまり、
 \((j-i)g\equiv0\:\:(\mr{mod}\:n)\)
ですが、\(g\) が \(n\) と互いに素なため、\((j-i)\) は \(n\) で割り切れなければなりません。しかし \(1\leq(j-i)\leq(n-1)\) なので、矛盾します。従って、\(n\) 個の剰余類の列 \((\br{A})\) は、全て違ったものです。剰余群 \(\bs{Z}/n\bs{Z}\) の群位数は \(n\) なので、\((\br{A})\) は \(\bs{Z}/n\bs{Z}\) の全ての元であり、従って \(\ol{\,g\,}\) は生成元です。

\(n\) が素数 \(p\) の場合は、\(p\) 未満の自然数はすべて \(p\) と互いに素なので、単位元 \(\ol{\,0\,}\) を除く \(\bs{Z}/p\bs{Z}\) の元が生成元になります。

\(k\) 個 \(\ol{\,i\,}\) の群演算をして初めて、結果が単位元 \(\ol{\,0\,}\) になるときの \(k\) を、\(\ol{\,i\,}\) の位数(order)といいます。群の位数と紛らわしいですが、これは群の「元の位数」です。\(\bs{Z}/6\bs{Z}\) の場合、位数は、
 \(\ol{\,0\,}\:\rightarrow\:1,\:\:\ol{\,1\,}\:\rightarrow\:6,\:\:\ol{\,2\,}\:\rightarrow\:3\)
 \(\ol{\,3\,}\:\rightarrow\:2,\:\:\ol{\,4\,}\:\rightarrow\:3,\:\:\ol{\,5\,}\:\rightarrow\:6\)
です。位数という用語を使うと、生成元とは「位数が群位数に等しい元」のことです。



群 \(G\) が一つの生成元から生成されるとき、\(G\) を巡回群(cyclic group)と言います。\(\bs{Z}/10\bs{Z}\) の例をとると、\(10\) と互いに素な数を考えて、生成元は \(\ol{\,1\,},\:\ol{\,3\,},\:\ol{\,7\,},\:\ol{\,9\,}\) の4つです。従って、たとえば \(\ol{\,7\,}\) 同士の加算を繰り返すと、
 \(\ol{\,7\,}\:\rightarrow\)\( \:\ol{\,4\,}\:\rightarrow\)\( \:\ol{\,1\,}\:\rightarrow\)\( \:\ol{\,8\,}\:\rightarrow\)\( \:\ol{\,5\,}\:\rightarrow\)\( \:\ol{\,2\,}\:\rightarrow\)\( \:\ol{\,9\,}\:\rightarrow\)\( \:\ol{\,6\,}\:\rightarrow\)\( \:\ol{\,4\,}\:\rightarrow\)\( \:\ol{\,0\,}\:\rightarrow\)\( \:\ol{\,7\,}\:\rightarrow\)\( \:\ol{\,4\,}\:\rightarrow\)\( \:\ol{\,1\,}\:\rightarrow\)\( \:\ol{\,8\,}\:\rightarrow\)\( \:\cdots\)
というように、\(\bs{Z}/10\bs{Z}\) の全ての元が現れたあとに再び \(\ol{\,7\,}\) に戻って "巡回" します。"巡回" 群と呼ばれるゆえんです。

群の直積
\(G,\:H\) を群とします。\(G\) の任意の元 \(g\) と \(H\) の任意の元 \(h\) のペア \((g,\:h)\) 作り、このペアを元とする集合を考えます。以降、群の演算を表す "\(\cdot\)" を省略します。

集合の任意2つの元を、
 \(a=(g_a,\:h_a)\)
 \(b=(g_b,\:h_b)\)
とし、\(a\) と \(b\) の演算を、
 \(ab=(g_ag_b,\:h_ah_b)\)
   \(g_ag_b\) は \(G\) での群演算
   \(h_ah_b\) は \(H\) での群演算
で定義すると、この集合は群となります。この群を \(G\) と \(H\) の直積といい、
 \(G\times H\)
で表します。有限群の場合、群の位数は、
 \(|G\times H|=|G|\cdot|H|\) (\(\cdot\) は整数のかけ算)
です。以上は2つの群の直積ですが、同様に3つ以上の群の直積も定義できます。

群の同型
\(G\) と \(H\) を群とします。\(G\) から \(H\) への1対1の写像 \(f\) で、\(G\) の任意の2つの元 \(x,\:y\) について、
 \(f(xy)=f(x)f(y)\)
( \(xy\) は群 \(G\) の演算、\(f(x)f(y)\) は群 \(H\) の演算)
が成り立つ写像があるとき、\(G\) と \(H\) は「同型である」といい、
 \(G\cong H\)
と表します。同型であるということは、2つの群の元が1対1対応するのみならず、元の演算前、演算後も1対1対応していることを意味します。従って同型である群は「同じもの」と見なせます。

以降、剰余類を表す \(\bs{\ol{\,i\,}}\) のバーを省略して \(\bs{i}\) と書きます。従って \(i\) は整数か剰余類のどちらかを示しますが、2つは同一視できます。

\(\bs{Z}/15\bs{Z}\) で群の同型の例を示します。ここでは、整数 \(i\) を 整数 \(a\) で割った余りを \(i_a\) と書きます。\(\bs{Z}/15\bs{Z}\) の任意の元 \(i\:\:(0\leq i\leq14)\) について、写像 \(f\) を、
 \(f\::\:i\:\longmapsto\:(i_3,\:i_5)\)
で定めると、\(f\) は \(\bs{Z}/15\bs{Z}\) から \((\bs{Z}/3\bs{Z})\times(\bs{Z}/5\bs{Z})\) への同型写像になります。

そのことを確かめると、まず \(i\) を決めれば \(i_3,\:i_5\) は一意に決まります。また\(i_3,\:i_5\) を決めると、\(3\) と \(5\) は互いに素なので、中国剰余定理21F)により、\(0\leq i\leq14\) の範囲で \(i\) が一意に決まります。つまり \(f\) は1対1写像(数学用語で "全単射")です。また、2つの元 \(i,\:j\) について
\(\begin{eqnarray}
&&\:\:f(i+j)&=(\:(i+j)_3,\:(i+j)_5\:)\\
&&&=(i_3+j_3,\:i_5+j_5)\\
&&\:\:f(i)+f(j)&=(i_3,\:i_5)+(j_3,\:j_5)\\
&&&=(i_3+j_3,\:i_5+j_5)\\
&&\:\:f(i+j)&=f(i)+f(j)\\
\end{eqnarray}\)
が成り立つので、\(f\) は同型写像の要件を満たします。従って、
 \(\bs{Z}/15\bs{Z}\cong(\bs{Z}/3\bs{Z})\times(\bs{Z}/5\bs{Z})\)
です。一般に、\(a\) と \(b\) を互いに素な自然数とすると、
 \(\bs{Z}/(ab)\bs{Z}\cong(\bs{Z}/a\bs{Z})\times(\bs{Z}/b\bs{Z})\)
です。これは2つの数だけでなく、\(n\) が \(k\)個の数 \(a_1,\:a_2,\:\cdots\:a_k\) の積で表され、かつ、\(a_1,\:a_2,\:\cdots\:a_k\) のどの2つをとっても互いに素なときには、中国剰余定理・多連立21G)によって、

 \(\bs{Z}/n\bs{Z}\cong(\bs{Z}/a_1\bs{Z})\times(\bs{Z}/a_2\bs{Z})\times\cdots\times(\bs{Z}/a_k\bs{Z})\)

が成り立ちます。一般に 自然数 \(n\) は \(p_i\) を素数として、
 \(n=p_1^{n_1}p_2^{n_2}\cdots p_k^{n_k}\)
と素因数分解され、\(p_i^{n_i}\:\:(1\leq i\leq k)\) はどの2つをとっても互いに素なので、

 \(\bs{Z}/n\bs{Z}\cong(\bs{Z}/(p_1^{n_1})\bs{Z})\times(\bs{Z}/(p_2^{n_2})\bs{Z})\times\cdots\times(\bs{Z}/(p_k^{n_k})\bs{Z})\)

成り立ちます。


2.3 既約剰余類群


2.2 節の剰余群は、整数の加算を演算の定義とする群でした。これに対して、整数の乗算を演算の定義とする群が構成できます。それが既約剰余類群です。

既約剰余類群:23A)

剰余群 \(\bs{Z}/n\bs{Z}\) から、代表元が \(n\) と互いに素なものだけを選び出したものを既約剰余類という。

「既約剰余類」は、乗算に関して群になる。これを「既約剰余類群」といい、\((\bs{Z}/n\bs{Z})^{*}\) で表す。

定義により、\((\bs{Z}/n\bs{Z})^{*}\) の群位数は \(\varphi(n)\) である。\(\varphi\) はオイラー関数で、\(\varphi(n)\) は \(n\) 以下で \(n\) と互いに素な自然数の数を表す。\(n\) が素数 \(p\) の場合の群位数は \(\varphi(p)=p-1\) である。


[証明]

「既約剰余類」は、乗算に関して群になることを証明する。まず例をあげると、\((\bs{Z}/10\bs{Z})^{*}\) の元は \(10\) と互いに素な代表元をもつ \(1,\:3,\:7,\:9\) である。この元の乗算による演算表を作ると、

\(\begin{array}{r|rrrr} &1&3&7&9\\ \hline 1&1&3&7&9\\ 3&3&9&1&7\\ 7&7&1&9&3\\ 9&9&7&3&1\\ \end{array}\)

となって、演算は閉じていて、単元 \(1\) があり、逆元があることがわかる( \(3^{-1}=7,\:7^{-1}=3,\:9^{-1}=9\) である\()\)。つまり群として成り立っている。

一般に、\(a,\:b\) が \(n\) と素だとすると、\(ab\) も \(n\) と素なので、\((\bs{Z}/n\bs{Z})^{*}\) は乗算で閉じている。また、不定方程式の解の存在定理(21C)により、
 \(ax+ny=1\)
を満たす \(x,\:y\) が存在する。この式の両辺を \(\mr{mod}\:n\) でみると、
 \(ax\equiv1\:\:(\mr{mod}\:n)\)
となる。この方程式の解の一つ(=特殊解)を \(x_0\) とし、\(k\) を整数として、\(x=x_0+kn\) とおくと\(,\)
\(\begin{eqnarray}
&&\:\:ax&=a(x_0+kn)\\
&&&=ax_0+akn\\
&&&\equiv1\:\:(\mr{mod}\:n)\\
\end{eqnarray}\)
なので、\(x\) も解である。従って解を \(1\leq x < n\) の範囲で選ぶことができる。つまり、\((\bs{Z}/n\bs{Z})^{*}\) の元 \(a\) に対して逆元が定義できることになり、\((\bs{Z}/n\bs{Z})^{*}\) は群である。[証明終]


2.4 有限体 \(\bs{F}_p\)


\(\bs{Z}/p\bs{Z}\) は体
剰余群 \(\bs{Z}/n\bs{Z}\) において \(n\) が素数 \(p\) である \(\bs{Z}/p\bs{Z}\) を考えます。\(p\) 未満の自然数は \(p\) と互いに素なので、既約剰余類群 \((\bs{Z}/p\bs{Z})^{*}\) は、\(\bs{Z}/p\bs{Z}\) から 加法の単位元 \(0\) を除いたものになります。つまり \(\bs{Z}/p\bs{Z}\) は加法について群であり、\(\bs{Z}/p\bs{Z}\:-\:\{\:0\:\}\) が乗法について群になっている。このような集合を(field)と言います。

体とは加減乗除ができて、加法と乗法を結びつける分配則、
 \(a(b+c)=ab+ac\)
が成り立つ集合です。\(\bs{Z}/p\bs{Z}\) は整数の演算をもとに定義されているので分配則が成り立ちます。

\(\bs{\bs{Z}/p\bs{Z}}\) を体としてみるとき、\(\bs{\bs{F}_p}\) と表記します。有理数 \(\bs{Q}\)、実数 \(\bs{R}\)、複素数 \(\bs{C}\) は体ですが、これらは無限集合です。一方、\(\bs{F}_p\) は有限集合なので有限体です。

有限体 \(\bs{F}_p\) における定数、変数、多項式、方程式の計算は、有理数/実数/複素数と同じようにできます。以下、今後の証明に使うので、\(\bs{F}_p\) 上の多項式と方程式を説明します。つまり、係数が \(\bs{F}_p\) の数である多項式や方程式です。

有限体の多項式と方程式
\(\bs{F}_p\) 上の多項式は、

 \(f(x)=a_nx^n+a_{n-1}x^{n-1}+\:\cdots\:+a_1x+a_0\:\:\:(a_i\in\bs{F}_p)\)

です。見た目は整数係数の多項式ですが、係数は \(\bs{F}_p\) の元です。\(\bs{F}_p\) は体なので、\(\bs{F}_p\) 上の多項式は加減算\(\cdot\)乗算\(\cdot\)余りをともなう除算(=剰余算、余り算)が、\(\bs{Q}\) 上の多項式と同じようにできます。従ってこれらの演算にもとづいた概念、定理は、\(\bs{Q}\) 上の多項式の場合と同じです。つまり、

・ 因数分解
・ 割り切れる、割り切れないの概念
・ 最大公約数(共通に割り切る最大次数の多項式)
・ 互除法による最大公約数の計算
・ 互いに素の概念(最大公約数が定数)
・ 多項式の不定方程式31A
・ 既約多項式31B
・ 既約多項式の定理431G

などです(なお、多項式\(\cdot\)方程式についてのこれらの概念や定理は「3.1 多項式」で説明します)。

たとえば、\(\bs{F}_5\) における多項式、\(x^2+1\) は、
 \(x^2+1=(x-2)(x-3)\) [\(\bs{F}_5\)]
と、2つの1次多項式に因数分解できます。
\(\begin{eqnarray}
&&\:\:(x-2)(x-3)&=x^2-5x+6\\
&&&=x^2+1\\
\end{eqnarray}\)
が成り立つからです。従って、方程式、
 \(x^2+1=0\) [\(\bs{F}_5\)]
の解は、\(x=2,\:3\) です。

一方、\(\bs{F}_7\) において \(x^2+1\) はこれ以上因数分解できない多項式です。なぜなら、
 \(f(x)=x^2+1\) [\(\bs{F}_7\)]
とおくと、
 \(f(k)\neq0\:\:(0\leq k\leq6)\) [\(\bs{F}_7\)]
だからです。もちろん剰余算(余り算)はできて、\(x^2+1\) を \(x-2\) で割ると、
 \(x^2+1=(x-2)(x+2)+5\) [\(\bs{F}_7\)]
と計算できます。これは \(f(2)=5\)、つまり \(f(x)\) を \(x-2\) で割った余りは \(5\)、を意味します。

以上を踏まえて、\(\bs{F}_p\) 上の多項式\(\cdot\)方程式に関する次の定理を証明します(次節の定理の証明に使います)。方程式の "解" は "\(\bs{F}_p\) における解" の意味です。

有限体上の方程式1:24A)

\(\bs{F}_p\) 上の1次方程式、
 \(ax+b=c\)
は1個の解をもつ。


[証明]

両辺に \(b\) の加法の逆元 \(-b\) を加えると、
 \(ax=c+(-b)\)
となり、この両辺に 乗法の逆元 \(a^{-1}\) を掛けると、
 \(x=a^{-1}(c+(-b))\)
となり、唯一の解が求まる。[証明終]

有限体上の方程式2:24B)

\(\bs{F}_p\) 上の多項式を \(f(x)\) とする。
\(f(a)=0\) なら、\(f(x)\) は \(x-a\) で割り切れる。


[証明]

\(f(x)\) を \(x-a\) で割った商を \(g(x)\)、余りを \(b\) とする。
 \(f(x)=(x-a)g(x)+b\)
であるが、\(f(a)=0\) なので \(b=0\) である。従って、
 \(f(x)=(x-a)g(x)\)
と表され、\(f(x)\) は \(x-a\) で割り切れる。[証明終]

有限体上の方程式3:24C)

\(\bs{F}_p\) 上の \(n\)次多項式を \(f_n(x)\) とする。方程式、
 \(f_n(x)=0\)
の解は、高々 \(n\) 個である。


[証明]

\(n\) に関する数学的帰納法を使う。\(\bs{F}_p\) 上 の1次方程式の解は1個だから(24A)、題意は成り立つ。\(n\) 以下で題意が成り立つと仮定する。

\(\bs{F}_p\) 上の \(n+1\) 次方程式 \(f_{n+1}(x)=0\) の解がなければ、\(n+1\) でも題意は成り立っている。もし1個の解 \(a\) があるとすると\(f_{n+1}(a)=0\) なので、\(f_{n+1}(x)\) は \(x-a\) で割り切れる(24B)。つまり、
 \(f_{n+1}(x)=(x-a)g(x)\)
となるが、\(g(x)\) は \(n\)次以下の多項式だから、方程式、
 \(g(x)=0\)
の解は高々 \(n\) 個である。従って、\(f_{n+1}(x)=0\) の解は高々 \(n+1\) 個である。ゆえに帰納法により題意は正しい。[証明終]


2.5 既約剰余類群は巡回群


2.5 節の目的は、2章の最終目的である、
既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) は巡回群の直積に同型である
という定理を証明することです。証明には少々長いステップが必要ですが、この定理はガロア理論の最終段階で必要になります。まず、群の「元の位数」の性質から始めます。

位数
位数の定理:25A)

\((\bs{Z}/n\bs{Z})^{*}\) の元を \(a\) とする。以下が成り立つ。

[補題1]
\(a^x=1\) となる \(x\:\:(1\leq x)\) が必ず存在する。\(x\) のうち最小のものを \(d\) とすると、\(d\) を \(a\) の位数(order)と呼ぶ。

[補題2]
\(a,\:a^2,\:a^3,\:\cdots\:,\:a^d=1\) は 全て異なる。ないしは、
\(a^0=1,\:a,\:a^2,\:\cdots\:,a^{d-1}\) は 全て異なる。

[補題3]
\(n=p\)(素数)とする。\(d\) 乗すると \(1\) になる \((\bs{Z}/p\bs{Z})^{*}\) の元は、\(a,\:a^2,\:a^3,\:\cdots\:,\:a^d\) がそのすべてである。

[補題4]
\(a^x=1\) となる \(x\) は \(d\) の倍数である。

[補題5]
\(a\) の位数を \(d\) とすると、\(d\) は 群位数 の約数である。


[証明]

[補題1]
\((\bs{Z}/n\bs{Z})^{*}\) は有限群だから、\(a^j=a^i\:\:(i < j)\) となる \(i,\:j\) は必ず存在する。\(a^{-i}\) を両辺に掛けると \(a^{j-i}=1\) となり\(a^x=1\) となる \(x\) が必ず存在する。従って \(a\) の位数が定義できる。

[補題2]
\(a^j=a^i\:\:(1\leq i < j\leq d)\) となる \(i,\:j\) があったとすると、両辺に \(a^{-1}\) を掛けて \(a^{j-i}=1\) となるが、\(j-i < d\) だから、\(a^x=1\) となる最小の \(x\) が \(d\) ということと矛盾する。従って、\(a,\:a^2,\:a^3,\:\cdots\:,\:a^d=1\) は 全て異なる。

[補題3]
\(a^i\:\:(1\leq i\leq d)\) を \(d\) 乗すると、
 \((a^i)^d=(a^d)^i=1\)
であり、これら \(d\) 個の元はすべて \(d\) 乗すると \(1\) になる。

一方、\(d\) 乗すると \(1\) になる 元は 有限体 \(\bs{F}_p\) 上の \(d\) 次方程式 \(x^d-1=0\) の解であるが、有限体上の方程式3の定理(24C)により、\(d\) 次方程式の解の数は高々 \(d\) 個である。従って、\(a^i\:\:(1\leq i\leq d)\) の \(d\) 個の元は、\(d\) 乗すると \(1\) になる 元のすべてである。

[補題4]
\(x\) を \(d\) で割った商を \(q\:\:(1\leq q)\)、余りを \(r\:\:(0\leq r < d)\)とすると、
\(\begin{eqnarray}
&&\:\:a^{qd+r}&=1\\
&&\:\:(a^d)^q\cdot a^r&=1\\
&&\:\:a^r=1&\\
\end{eqnarray}\)
となるが、もし \(r\neq0\) なら、\(d\) より小さい数 \(r\) で \(a^r=1\) となり、これは \(a\) の位数が \(d\) であることと矛盾する。従って \(r=0\) であり、\(x\) は \(d\) の倍数である。

[補題5]
\((\bs{Z}/n\bs{Z})^{*}\) を \(G\) と書く。集合 \(A\) を、
 \(A=\{a,\:a^2,\:\cdots\:,\:a^d=1\}\)
とする。もし \(|G|=d\) なら、題意は満たされている。

\(d < |G|\) の場合、\(A\) に含まれない \(G\) の元の一つを \(b_1\) とし、
 \(A_1=\{b_1a,\:b_1a^2,\:\cdots\:,\:b_1a^d\}\)
とする。この \(A_1\) に \(A\) と共通な元はない。なぜならもし、
 \(a^i=b_1a^j\:\:(1\leq i,j\leq d)\)
だとすると、両辺に \(a^{-j}\) をかけて、
 \(a^{i-j}=b_1\)
となるが、左辺は \(A\) の元であり、右辺の \(b_1\) が \(A\) の元となって矛盾するからである。もし \(A\) と \(A_1\) で \(G\) の元を尽くしているなら、\(|G|=2d\) であり、題意は満たされている。

そうでない場合、\(A\) と \(A_1\) に含まれない \(G\) の元の一つを \(b_2\) とし、
 \(A_2=\{b_2a,\:b_2a^2,\:\cdots\:,\:b_2a^d\}\)
とする。上の論理と同じで \(A_2\) と \(A\) に共通な元はない。のみならず、\(A_2\) と \(A_1\) に共通な元もない。なぜなら、もし、
 \(b_2a^i=b_1a^j\:\:(1\leq i,j\leq d)\)
だとすると、両辺に \(a^{-i}\) をかけて、
 \(b_2=b_1a^{j-i}\)
となるが、\(a^{j-i}\) は \(A\) の元だから、\(b_1a^{j-i}\) は \(A_1\) の元であり、\(b_2\) が \(A_1\) の元ということになって矛盾するからである。もし \(A,\:A_1,\:A_2\) で \(G\) の元を尽くしているなら、\(|G|=3d\) であり、題意は満たされている。

そうでない場合、この操作を続けていくと、\(G\) は有限群だから、ちょうど \(G\) の元が尽くされたところで、操作は止まる。最後に作った部分集合が \(A_n\) だったとすると \(|G|=(1+n)d\) であり、\(a\) の位数 \(d\) は群位数の約数である。



\((\bs{Z}/n\bs{Z})^{*}\) の群位数は \(\varphi(n)\) なので(23A)、位数の定理25A)の[補題5]から、次のフェルマの小定理とオイラーの定理が成り立つことがわかります。

オイラーの定理:25B)

自然数 \(n\) と素な自然数 \(a\) について、
 \(a^{\varphi(n)}=1\:\:(\mr{mod}\:n)\)
が成り立つ(オイラーの定理)。\(\varphi\) はオイラー関数で、\(\varphi(n)\) は \(n\) 以下で \(n\) と互いに素な自然数の数を表す。

\(n=p\)(素数)の場合は、\(p\) と素な数 \(a\) について、
 \(a^{p-1}=1\:\:(\mr{mod}\:p)\)
となる(フェルマの小定理)。


生成元の存在1
\((\bs{Z}/p\bs{Z})^{*}\) には生成元が存在し、従って巡回群であることを証明します。まず、特定の位数 \(d\) をもつ元の数に関する定理からです。

位数 \(d\) の元の数:25C)

\(p\) を素数とする。\((\bs{Z}/p\bs{Z})^{*}\) において、群位数 \((p-1)\) の約数 \(d\) のすべてについて、位数 \(d\) の元が \(\varphi(d)\) 個存在する。


[証明]

[補題1]により、\((\bs{Z}/p\bs{Z})^{*}\) のすべての元に位数が定義できる。その位数は[補題5]により、群位数 \((p-1)\) の約数である。

\((p-1)\) の任意の約数を \(d\) とし、位数 \(d\) の元 \(a\) があったとする。[補題3]により、\(d\)乗すると \(1\) になる \((\bs{Z}/p\bs{Z})^{*}\) の元は、
 \(a,\:a^2,\:a^3,\:\cdots\:,\:a^d(=1)\)
の「\(a\) 系列」がそのすべてである。\((\bs{Z}/p\bs{Z})^{*}\) の位数 \(d\) の元は、\(d\)乗すると \(1\) になるから、\(a\) 以外の位数 \(d\) の元も「\(a\) 系列」の中に含まれている。

ここで、\(\mr{gcd}(j,d)\neq1\) である \(j\:\:(1 < j\leq d)\) をとると、\(a^j\) の位数は \(d\) より小さくなる。なぜなら、\(\mr{gcd}(j,d)=c\:( > 1)\) とすると、2つの数 \(s,\:t\) を選んで、
 \(j=c\cdot s\:\:(s < j)\)
 \(d=c\cdot t\:\:(t < d)\)
と表されるが、そうすると、
 \((a^j)t=a^{cst}=(a^d)^s=1\)
で、\(a^j\) の位数は \(t\) 以下だが、\(t < d\) なので \(a^j\) の位数は \(d\) より小さくなるからである。

一方、\(\mr{gcd}(j,d)\neq1\) である(=\(d\) と素な)\(j\:\:(1\leq j < d)\) をとると、\(a^j\) の位数は \(d\) になる。その理由は以下である。

\((a^j)^x\:\:(1\leq x\leq d)\) が \(x\) の値によってどう変わるかを調べると、まず、\(x=d\) のときは、
 \((a^j)^x=(a^j)^d=(a^d)^j=1\)
である。

次に \(1\leq x < d\) のときは \(jx\) は \(d\) の倍数でない。なぜなら、\(j\) は \(d\) と素なため、もし \(jx\) が \(d\) の倍数だとすると、\(x\) が \(d\) の倍数ということになり、\(1\leq x < d\) に反するからである。従って、ある数 \(s,\:t\) を選んで、
 \(jx=t\cdot d+s\:\:(0 < s < d)\)
と表せる。そうすると、
 \((a^j)^x=a^{td+s}=(a^d)^t\cdot a^s=a^s\)
となるが、\(a\) の位数は \(d\) だから、\(d\) 未満の数 \(s\) で \(a^s\) が \(1\) になることはない。従って \(a^s\neq1\) であり、
 \((a^j)^x\neq1\:\:(1\leq x < d)\)
である。

以上により
 \((a^j)^x\neq1\) \((1\leq x < d)\)
 \((a^j)^x=1\) \((x=d)\)
が分かったので、 \(a^j\) の位数は \(d\) である。\(j\) は \(\mr{gcd}(j,d)\neq1\) だったから、\(j\) のとりうる値は \(\varphi(d)\) 個ある。\((\bs{Z}/p\bs{Z})^{*}\) の位数 \(d\) の元は「\(a\) 系列」に含まれるから、\((\bs{Z}/p\bs{Z})^{*}\) に位数 \(\bs{d}\) の元があるとしたら、その数は \(\varphi(d)\) 個である。

まとめると、\((p-1)\) の任意の約数を \(d\) とし、\((\bs{Z}/p\bs{Z})^{*}\) の位数 \(d\) の元の数を \(\#\mr{ord}(d)\) と表記すると、
\(\#\mr{ord}(d)=\left\{ \begin{array}{l} \begin{eqnarray} &&\varphi(d)&\\ &&0&\\ \end{eqnarray} \end{array}\right.\)
のどちらかである。また、\((\bs{Z}/p\bs{Z})^{*}\) のすべての元には位数が定義でき、\((\bs{Z}/p\bs{Z})^{*}\) の \((p-1)\) 個の元は位数で分類できるから、
 \(\displaystyle\sum_{d|(p-1)}^{}\#\mr{ord}(d)=p-1\)
が成り立つ。ここで \(d|(p-1)\) は、\((p-1)\) のすべての約数 \(d\) についての和をとる意味である。



次に、オイラー関数についてオイラー関数の総和の定理が成り立つことを証明する。

オイラー関数の総和

\(n\) を任意の自然数とするとき、
 \(\displaystyle\sum_{d|n}^{}\varphi(d)=n\)
が成り立つ。\(d|n\) は、\(n\) のすべての約数 \(d\) についての和をとる。

[証明]

まず、次の2点に注意する。2つの自然数 \(a\) と \(b\) の最大公約数を \(\mr{gcd}(a,b)\) とすると、
 \(\dfrac{a}{\mr{gcd}(a,b)}\) と \(\dfrac{b}{\mr{gcd}(a,b)}\) は互いに素
である。これは最大公約数の定義そのものである。

次に、\(n\) の約数の一つを \(a\) とし、\(n=a\cdot b\) と表すと、\(b\) もまた \(n\) の約数の一つである。\(n\) に \(r\) 個の約数、\(a_i\:\:(1\leq i\leq r)\) があるとき、
 \(b_i=\dfrac{n}{a_i}\:\:(1\leq i\leq r)\)
と定義すると、\(b_i\:\:(1\leq i\leq r)\) もまた \(n\) の \(r\) 個の約数である。つまり、\(b_i\) は \(a_i\) を並び替えたものである。

以上の2点を前提に、まず \(n=12\) の場合で考察する。いま、\(1\) から \(12\) までの \(12\) 個の整数を「\(12\) との最大公約数で分類する」ことを考える。\(12\) の約数 \(d\) は、\(1,\:2,\:3,\:4,\:6,\:12\) の6つである。\(12\) との最大公約数が \(d\) である集合を \(S_d\) とすると、

 \(S_1\)\(=\{\:1,\:5\:,7\:,11\:\}\)
 \(S_2\)\(=\{\:2,\:10\:\}\)
 \(S_3\)\(=\{\:3,\:9\:\}\)
 \(S_4\)\(=\{\:4,\:8\:\}\)
 \(S_6\)\(=\{\:6\:\}\)
 \(S_{12}\)\(=\{\:12\:\}\)

となる。各集合に含まれる整数の個数を \(\#S_d\) として順に見ていくと、まず、オイラー関数の定義より、
 \(\#S_1=\varphi(12)\)
である。

次に、\(12\) との最大公約数が \(2\) の集合、\(S_2=\{\:2,\:10\:\}\) を考える。\(\{\:2,\:10\:\}\) を \(2\) で割り算した \(\{\:1,\:5\:\}\) のそれぞれは、最大公約数の定義により、\(12\) を \(2\) で割り算した \(6\) と互いに素である。従って、
 \(\#S_2=\varphi(6)\)
である。同様に他の集合についても、
 \(\#S_2\)\(=\varphi(4)\)
 \(\#S_4\)\(=\varphi(3)\)
 \(\#S_6\)\(=\varphi(2)\)
 \(\#S_{12}\)\(=\varphi(1)\)
となる。\(S_d\) は \(12\) 個の整数を分類したものだったので、そこに含まれる整数の個数の総和は \(12\) である。これにより、
 \(\varphi(12)+\varphi(6)+\varphi(4)+\varphi(3)+\varphi(2)+\varphi(1)=12\)
となる。総和の記号で書くと、
 \(\displaystyle\sum_{d|12}^{}\varphi(d)=12\)
である。



以上の考察は \(n=12\) の場合であるが、\(12\) に特別な意味はない。従って一般の \(n\) の場合も同様となる。

\(n\) が \(r\) 個の約数をもつとし、それらを \(a_i\:\:(1\leq i\leq r)\) とする。集合 \(S\) を \(1\) から \(n\) の \(n\) 個の整数の集合とし、その部分集合 \(S_i\) を、

 \(S_i\):\(n\) との最大公約数が \(a_i\) である \(S\) の元の集合

とする。このとき、\(S_i\) の任意の元を \(x\) とすると、
 \(\dfrac{x}{a_i}\) と \(\dfrac{n}{a_i}\) は互いに素
である。そもそも、そうなる \(x\) を集めたのが \(S_i\) であった。このことから、

 \(S_i\) の元の個数は \(\dfrac{n}{a_i}\) と素である \(S\) の元の個数

ということになる。\(S_i\) の元の個数を \(\#S_i\) と書くと、
 \(\#S_i=\varphi\left(\dfrac{n}{a_i}\right)\)
である。ここで \(b_i\) を、
 \(b_i=\dfrac{n}{a_i}\:\:(1\leq i\leq r)\)
と定義すると、
 \(\#S_i=\varphi(b_i)\)
となるが、この \(b_i\:\:(1\leq i\leq r)\) は \(n\) の約数のすべてであり、\(a_i\) を並び替えたものである。式の両辺の \((1\leq i\leq r)\) の総和をとると、\(\#S_i\) の総和は \(S\) の元の数なので、
 左辺\(=\displaystyle\sum_{i=1}^{r}\#S_i=n\)
である。一方、右辺の総和は、
\(\begin{eqnarray}
&&\:\:右辺&=\displaystyle\sum_{i=1}^{r}\varphi(b_i)=\displaystyle\sum_{i=1}^{r}\varphi(a_i)\\
&&&=\displaystyle\sum_{d|n}^{}\varphi(d)\\
\end{eqnarray}\)
となって、
 \(\displaystyle\sum_{d|n}^{}\varphi(d)=n\)
が成り立つ。



\((p-1)\) の約数に戻ると、オイラー関数の総和の定理より、
 \(\displaystyle\sum_{d|(p-1)}^{}\varphi(d)=p-1\)
である。一方、位数 \(d\) の元の総和は、
 \(\displaystyle\sum_{d|(p-1)}^{}\#\mr{ord}(d)=p-1\)
であった。この2点から、
 \(\#\mr{ord}(d)=\varphi(d)\)
が結論づけられる。\(\#\mr{ord}(d)=0\) となる \((p-1)\) の約数 \(d\) は無い。もしあるとすると矛盾が生じる。

従って \((\bs{Z}/p\bs{Z})^{*}\) においては、群位数 \((p-1)\) の約数 \(d\) のすべてについて、位数 \(d\) の元が \(\varphi(d)\) 個存在する。[証明終]



この位数 \(\bs{d}\) の元の数の定理(25C)により、次の生成元の存在1が成り立つことが分かります。

生成元の存在1:25D)

\(p\) を素数とするとき、\((\bs{Z}/p\bs{Z})^{*}\) には生成元が存在する。生成元とは、その位数が \((\bs{Z}/p\bs{Z})^{*}\) の群位数、\(p-1\) の元である。

なお、素数 \(p\) に対して、
 \(a^x\equiv1\:\:(\mr{mod}\:p)\)
となる \(x\) の最小値が \(p-1\) であるような \(a\) を、\(p\) の「原始根」という。既約剰余類群 \((\bs{Z}/p\bs{Z})^{*}\) の生成元=原始根である。


ちなみに、\(100\)以下の素数 \(p\)(\(2\) を除く \(24\)個)について、原始根の数 = \(\varphi(p-1)\) と最小の原始根をパソコンで計算すると、次のようになります。

 \(p\) 原始根
の数
最小の
原始根
\(3\)\(1\)\(2\)
\(5\)\(2\)\(2\)
\(7\)\(2\)\(3\)
\(11\)\(4\)\(2\)
\(13\)\(4\)\(2\)
\(17\)\(8\)\(3\)
\(19\)\(6\)\(2\)
\(23\)\(10\)\(5\)
\(29\)\(12\)\(2\)
\(31\)\(8\)\(3\)
\(37\)\(12\)\(2\)
\(41\)\(16\)\(6\)
 \(p\) 原始根
の数
最小の
原始根
\(43\)\(12\)\(3\)
\(47\)\(22\)\(5\)
\(53\)\(24\)\(2\)
\(59\)\(28\)\(2\)
\(61\)\(16\)\(2\)
\(67\)\(20\)\(2\)
\(71\)\(24\)\(7\)
\(73\)\(24\)\(5\)
\(79\)\(24\)\(3\)
\(83\)\(40\)\(2\)
\(89\)\(40\)\(3\)
\(97\)\(32\)\(5\)

この表を見ると、\(2\) が最小原始根になることが多いのがわかります。全体の半分(\(12\)個の素数)でそうです。そうでなれければ素数が多い。ただし、\(p=41\) のときの \(6\) のように、合成数が最小原始根になる場合もあります。

生成元の存在2
以降で \((\bs{Z}/p^n\bs{Z})^{*}\) にも生成元が存在することを証明します(ただし、\(p\neq2\))。まず、その証明に使う[補題6]を証明します。整数についての定理です。

[補題6]

\(p\) を奇素数とし、\(k\) を \(p\) と素な数とする(\(\mr{gcd}(k,p)=1\))。また、整数 \(m\) を \(m\geq1\) とする。

このとき、
 \((1+kp^m)^p=1+k'p^{m+1}\)
と表すことができて、\(k'\) は \(p\) と素である。


[証明]

表記を分かりやすくするため、まず \(m=1\) のときに成り立つことを証明する。\(m=1\) のときに[補題6]は、

[補題6]\(\bs{m=1}\)

\(p\) を奇素数とし、\(k\) を \(p\) と素な数( \(\mr{gcd}(k,p)=1\) )とする。このとき、
 \((1+kp)^p=1+k'p^2\)
と表すことができて、\(k'\) は \(p\) と素である。

となる。\((1+kp)^p\) を2項定理で展開すると、

 \((1+kp)^p\)
\(\begin{eqnarray}
&&\:\: =&1+{}_{p}\mr{C}_{1}kp+{}_{p}\mr{C}_{2}(kp)^2+{}_{p}\mr{C}_{3}(kp)^3+\:\cdots\:+\\
&&&{}_{p}\mr{C}_{p-1}(kp)^{p-1}+(kp)^p\\
&&\:\: =&1+p^2(k+{}_{p}\mr{C}_{2}k^2+{}_{p}\mr{C}_{3}k^3p+\:\cdots\:+\\
&&&   {}_{p}\mr{C}_{p-1}k^{p-1}p^{p-3}+k^pp^{p-2})\\
&&\:\: =&1+k'p^2\\
\end{eqnarray}\)

\(\begin{eqnarray}
&&\:\: k'=&k+{}_{p}\mr{C}_{2}k^2+{}_{p}\mr{C}_{3}k^3p+\:\cdots\:+\\
&&&  {}_{p}\mr{C}_{p-1}k^{p-1}p^{p-3}+k^pp^{p-2}\\
\end{eqnarray}\)

となる。\(k'\) の第3項(\({}_{p}\mr{C}_{3}k^3p\))以降は \(p\) の指数が \(1\) 以上だから \(p\) で割り切れる。第2項の \(p\) に関係した式は、
 \({}_{p}\mr{C}_{2}=\dfrac{p(p-1)}{2}\)
であるが、\(\bs{p}\) が奇素数(\(\bs{p\neq2}\))であるため、この第2項も \(p\) で割り切れる(\(p\) が奇数だと \(p\) で割り切れる)。第1項の \(k\) は、定理の前提によって \(p\) で割り切れない。つまり \(k'\) は第1項だけが唯一、\(p\) で割り切れず、他の項はすべて \(p\) で割り切れる。従って、
 \(\mr{gcd}(k',p)=1\)
である。

次に \(m\geq2\) のときであるが、\(m=1\) のときの上の証明において \(p\) を \(p^m\) に置き換えれば、同様の計算で証明できる。\((1+kp^m)^p\) を2項定理で展開すると、

 \((1+kp^m)^p\)
\(\begin{eqnarray}
&&\:\: =&1+{}_{p}\mr{C}_{1}kp^m+{}_{p}\mr{C}_{2}(kp^m)^2+{}_{p}\mr{C}_{3}(kp^m)^3+\:\cdots\:+\\
&&&{}_{p}\mr{C}_{p-1}(kp^m)^{p-1}+(kp^m)^p\\
&&\:\: =&1+p^{m+1}(k+{}_{p}\mr{C}_{2}k^2p^{m-1}+{}_{p}\mr{C}_{3}k^3p^{2m-1}+\:\cdots\:+\\
&&&    {}_{p}\mr{C}_{p-1}k^{p-1}p^{m(p-2)-1}+k^pp^{m(p-1)-1})\\
&&\:\: =&1+k'p^{m+1}\\
\end{eqnarray}\)

\(\begin{eqnarray}
&&\:\: k'=&k+{}_{p}\mr{C}_{2}k^2p^{m-1}+{}_{p}\mr{C}_{3}k^3p^{2m-1}+\:\cdots\:+\\
&&& {}_{p}\mr{C}_{p-1}k^{p-1}p^{m(p-2)-1}+k^pp^{m(p-1)-1}\\
\end{eqnarray}\)

\(k'\) の第2項以降は \(m\geq2\) なので \(p\) の指数は \(1\) 以上であり、\(p\) で割り切れる。第1項の \(k\) は、定理の前提によって \(p\) で割り切れない。つまり \(k'\) は、第1項だけが唯一、\(p\) で割り切れず、他の項はすべて \(p\) で割り切れる。従って、
 \(\mr{gcd}(k',p)=1\)
である。以上の結論として、題意が成り立つ。[証明終]



生成元の存在1の定理(25D)と[補題6]を用いて、\((\bs{Z}/p^n\bs{Z})^{*}\) に生成元が存在することを証明します。

生成元の存在2:25E)

\(p\) を \(p\neq2\) の素数(=奇素数)とする。また、\(g\) を \((\bs{Z}/p\bs{Z})^{*}\) の生成元とする。

このとき \(g\) または \(g+p\) は \((\bs{Z}/p^n\bs{Z})^{*}\) の生成元である。つまり、\((\bs{Z}/p^n\bs{Z})^{*}\) には生成元が存在する。


[証明]

フェルマの小定理25B)により、\((\bs{Z}/p\bs{Z})^{*}\) の任意の元は \((p-1)\) 乗すると \(1\) になる。従って、整数の記法で、
 \(g^{p-1}=1+kp\)
と書ける。以降、
 ・\(k\) の素因数に \(p\) を含まないとき
 ・\(k\) の素因数に \(p\) を含むとき
の2つに分けて証明する。

 \(k\) の素因数に \(p\) を含まないとき 

この場合は以下が成り立つ。

生成元の存在2(その1)

\(p\) を奇素数とし、\(g\) を \((\bs{Z}/p\bs{Z})^{*}\) の生成元とする。また、\(g\) は、
 \(g^{p-1}=1+kp\)
 \(\mr{gcd}(k,p)=1\)
と表されているとする。

この条件で、\(g\) は \((\bs{Z}/p^n\bs{Z})^{*}\) の生成元でもある。


[証明(その1)]

\(g\) は \(p\) と互いに素なので \((\bs{Z}/p^n\bs{Z})^{*}\) の元でもある。\((\bs{Z}/p^n\bs{Z})^{*}\) の群位数は、既約剰余類群の定義によって \(\varphi(p^n)\) である。\(p^n\) 以下で \(p\) で割り切れる数は、\(p^n\) を含んで \(\dfrac{p^n}{p}=p^{n-1}\) 個あるから、
\(\begin{eqnarray}
&&\:\:\varphi(p^n)&=p^n-p^{n-1}\\
&&&=p^{n-1}(p-1)\\
\end{eqnarray}\)
である。従って、オイラーの定理25B)より、
 \(g^{p^{n-1}(p-1)}\equiv1\:\:(\mr{mod}\:p^n)\)
が成り立つ。記述の簡素化のために、
 \(h=g^{p-1}\)
とおく。
 \(h^{p^{n-1}}\equiv1\:\:(\mr{mod}\:p^n)\)
である。

仮定によって \(h\) は、
 \(h=1+kp\)
 \(\mr{gcd}(k,p)=1\)
と表される。この \(h\) に対して "\(p\)乗する" 操作を \((n-1)\) 回繰り返すと、[補題6]を次々に使って、次のように計算できる。

 \(h^p\)\(=1+k_1p^2\)\(\mr{gcd}(k_1,p)=1\)
 \(h^{p^2}\)\(=(1+k_1p^2)^p\)\(=1+k_2p^3\)\(\mr{gcd}(k_2,p)=1\)
 \(h^{p^3}\)\(=(1+k_2p^3)^p\)\(=1+k_3p^4\)\(\mr{gcd}(k_3,p)=1\)
\(\vdots\)\(\vdots\)\(\vdots\)
 \(h^{p^{n-2}}\)\(=(1+k_{n-3}p^{n-2})^p\)\(=1+k_{n-2}p^{n-1}\) \(\mr{gcd}(k_{n-2},p)=1\)
 \(h^{p^{n-1}}\)\(=(1+k_{n-2}p^{n-1})^p\)\(=1+k_{n-1}p^n\)\(\mr{gcd}(k_{n-1},p)=1\)

この結果から、
 \(h^{p^{n-1}}\equiv1\:\:(\mr{mod}\:p^n)\)
であることがわかる。この式は \(n\geq1\) のすべての \(n\) で成り立つ。

従って、\(h^x\equiv1\:\:(\mr{mod}\:p^n)\) となる最小の \(x\) は \(p^{n-1}\) の約数であり、\((n-1)\) 個の \(p^i\:\:(1\leq i\leq n-1)\) のどれかである。

しかし、上の計算過程を見ると、
 \(h^{p^i}-1=k_i\cdot p^{i+1}\) \((\mr{gcd}(k_i,p)=1)\)
\((1\leq i\leq n-1)\)
であって、\(1\leq i\leq n-2\) であれば右辺の \(k_i\cdot p^{i+1}\) は \(p^n\) で割り切れない。つまり、
 \(h^{p^i}\not\equiv1\:\:(\mr{mod}\:p^n)\:\:(1\leq i\leq n-2)\)
である。従って、\(h\) は \(p^{n-1}\) 乗して初めて \(1\:\:(\mr{mod}\:p^n)\) になる。

\(h\) は \(g^{p-1}\) であった。ゆえに、\(g\) は \(p^{n-1}(p-1)\) 乗して初めて \(1\:\:(\mr{mod}\:p^n)\) になる。\((\bs{Z}/p^n\bs{Z})^{*}\) の群位数は \(p^{n-1}(p-1)\) だから、\(g\) は \((\bs{Z}/p^n\bs{Z})^{*}\) の生成元である。[証明(その1)終]

 \(k\) の素因数に \(p\) を含むとき 

\(g^{p-1}=1+kp\) と表したときの \(k\) の素因数に \(p\) を含む場合、ある数 \(k''\) があって、
 \(g^{p-1}=1+k''\cdot p^m\:\:(m\geq2)\)
 \(\mr{gcd}(k'',p)=1\)
と表すことができる。ここで \(k''\) を改めて \(k\) と書くと、次が成り立つ。

生成元の存在2(その2)

\(p\) を奇素数とし、\(g\) を \((\bs{Z}/p\bs{Z})^{*}\) の生成元とする。また、\(g\) は、
 \(g^{p-1}=1+kp^m\:\:(m\geq2)\)
 \(\mr{gcd}(k,p)=1\)
と表されているとする。

この条件では、\(g+p\) が \((\bs{Z}/p^n\bs{Z})^{*}\) の生成元である。


[証明(その2)]

\((g+p)^{p-1}\) を2項定理で展開する。

 \((g+p)^{p-1}\)
  \(=g^{p-1}\)\(+{}_{p-1}\mr{C}_{1}g^{p-2}p+{}_{p-1}\mr{C}_{2}g^{p-3}p^2+\:\cdots\:+p^{p-1}\)
  \(=1+kp^m\)\(+{}_{p-1}\mr{C}_{1}g^{p-2}p+{}_{p-1}\mr{C}_{2}g^{p-3}p^2+\:\cdots\:+p^{p-1}\)
  \(=1+p(kp^{m-1}+{}_{p-1}\mr{C}_{1}g^{p-2}+{}_{p-1}\mr{C}_{2}\cdot g^{p-3}p+\:\cdots+p^{p-2})\)
  \(=1+k'p\)

   \(k'=kp^{m-1}+{}_{p-1}\mr{C}_{1}g^{p-2}+{}_{p-1}\mr{C}_{2}\cdot g^{p-3}p+\:\cdots+p^{p-2}\)

\(m\geq2\) なので、\(k'\) の第2項以外はすべて \(p\) で割り切れる。第2項は \((p-1)g^{p-2}\) だが、\((p-1)\) も \(g^{p-2}\) も \(p\) で割り切れない。つまり \(k'\) は第2項だけが唯一、\(p\) で割り切れないから、
 \(\mr{gcd}(k',p)=1\)
である。まとめると、
 \((g+p)^{p-1}=1+k'p\)
 \(\mr{gcd}(k',p)=1\)
と表すことができる。ここで、
 \(h=1+k'p\)
と書くと、[補題6]を次々と使うことで、次の計算が成り立つ。

 \(h^p\)\(=1+k_1p^2\)\(\mr{gcd}(k_1,p)=1\)
 \(h^{p^2}\)\(=(1+k_1p^2)^p\)\(=1+k_2p^3\) \(\mr{gcd}(k_2,p)=1\)
 \(h^{p^3}\)\(=(1+k_2p^3)^p\)\(=1+k_3p^4\) \(\mr{gcd}(k_3,p)=1\)
\(\vdots\)\(\vdots\)\(\vdots\)
 \(h^{p^{n-2}}\)\(=(1+k_{n-3}p^{n-2})^p\)\(=1+k_{n-2}p^{n-1}\) \(\mr{gcd}(k_{n-2},p)=1\)
 \(h^{p^{n-1}}\)\(=(1+k_{n-2}p^{n-1})^p\)\(=1+k_{n-1}p^n\) \(\mr{gcd}(k_{n-1},p)=1\)

この計算は「\(\bs{k}\) の素因数に \(\bs{p}\) を含まないとき」と全く同じである。従って、そのときの結論を踏襲できて、\(h\) は \(p^{n-1}\) 乗して初めて \(1\:\:(\mr{mod}\:p^n)\) になる。

その \(h\) は、
 \(h=1+k'p=(g+p)^{p-1}\)
であった。\(h\) が \(p^{n-1}\) 乗して初めて \(1\:\:(\mr{mod}\:p^n)\) になるのだから、\(g+p\) は \(p^{n-1}(p-1)\) 乗して初めて \(1\:\:(\mr{mod}\:p^n)\) になる。\((\bs{Z}/p^n\bs{Z})^{*}\) の群位数は \(p^{n-1}(p-1)\) だから、\(g+p\) は \((\bs{Z}/p^n\bs{Z})^{*}\) の生成元である。[証明(その2)終]

以上により、\(g\) を \((\bs{Z}/p\bs{Z})^{*}\) の生成元とすると、\(g\) か \(g+p\) のどちらかは \((\bs{Z}/p^n\bs{Z})^{*}\) の生成元である。従って \((\bs{Z}/p^n\bs{Z})^{*}\) には生成元があり、群位数 \(p^{n-1}(p-1)\) の巡回群である。[証明終]



ちなみに、\(h=g^{p-1}\) とし、
 \(h=1+kp^2\)
 \(\mr{gcd}(k,p)=1\)
と表されているときは \(g+p\) が生成元ですが、\(\bs{g}\) は生成元ではありません。なぜなら[補題6]を次々と使うと、

 \(h^p\)\(=(1+kp^2)^p\)\(=1+k_1p^3\)\(\mr{gcd}(k_1,p)=1\)
 \(h^{p^2}\)\(=(1+k_1p^3)^p\)\(=1+k_2p^4\)\(\mr{gcd}(k_2,p)=1\)
 \(h^{p^3}\)\(=(1+k_2p^4)^p\)\(=1+k_3p^5\)\(\mr{gcd}(k_3,p)=1\)
\(\vdots\)\(\vdots\)\(\vdots\)
 \(h^{p^{n-2}}\)\(=(1+k_{n-3}p^{n-1})^p\)\(=1+k_{n-2}p^n\) \(\mr{gcd}(k_{n-2},p)=1\)

となり、\(h\) を \(p^{n-1}\) 乗する前の \(h^{p^{n-2}}\) の段階で、

 \(h^{p^{n-2}}\equiv1\:\:(\mr{mod}\:p^n)\)
  \(\longrightarrow\:g^{p^{n-2}(p-1)}\equiv1\:\:(\mr{mod}\:p^n)\)

となってしまいます。つまり \(g\) は生成元ではないのです。\(g^{p-1}=1+kp^m\:\:(m > 2)\) と表されるときも同じです。



実は、\((\bs{Z}/p\bs{Z})^{*}\) の生成元を \(g\) とすると、ほとんどの場合で \(g\) は \((\bs{Z}/p^2\bs{Z})^{*}\) の(従って \((\bs{Z}/p^n\bs{Z})^{*}\) の)生成元になります。生成元の存在1であげた、\(100\) 以下の素数 \(p\) の最小原始根の表ですが、そのすべては \((\bs{Z}/p^2\bs{Z})^{*}\) の生成元です。それどころか「\(100\) 以下の素数 \(p\) の原始根が \((\bs{Z}/p^2\bs{Z})^{*}\) の生成元にならない」というケースは、計算してみると次の4つしかありません。

 \(p=29,\:g=14\)
 \(p=37,\:g=18\)
 \(p=43,\:g=19\)
 \(p=71,\:g=11\)

たとえば \(p=29\) の場合、\(\varphi(28)=12\) なので原始根 \(g\) は \(12\)個あります。リストすると、
 \(g=2,\:3,\:8,\:10,\:11,\:14,\:15,\:18,\:19,\:21,\:26,\:27\)
の \(12\)個です。\(p^2=841\) であり、\((\bs{Z}/p^2\bs{Z})^{*}\) は \((\bs{Z}/841\bs{Z})^{*}\) のことです。その \((\bs{Z}/841\bs{Z})^{*}\) の群位数は、
 \(\varphi(p^2)=p(p-1)=29\cdot28=812\)
です。

\(g\) のうち、\(14\) を除く \(11\)個の位数は \(812\) です。ところが \(14\) だけは違って、
 \(14^{28}\equiv1\:\:(\mr{mod}\:841)\)
となり、位数は \(28\) です。もちろんこの場合でも、生成元の存在225E)の証明プロセスにあるように、
 \(g+p=14+29=43\)
の位数は \(812\) で、\((\bs{Z}/841\bs{Z})^{*}\) の生成元です。以上をまとめると、

\(100\) 以下の素数を \(p\) とするとき、\((\bs{Z}/p\bs{Z})^{*}\) の生成元 \(g\) は、\(p=29,\:37,\:43,\:71\) のときを除いて、すべてが \((\bs{Z}/p^2\bs{Z})^{*}\) の生成元であり、\(p=29,\:37,\:43,\:71\) の場合でも \(g\) が \((\bs{Z}/p^2\bs{Z})^{*}\) の生成元にならないケースは、それぞれについて1つしかない

となります。



生成元の存在225E)の証明は、[補題6]の証明での \(\bs{{}_{p}\mr{C}_{2}}\)\(\bs{p}\) で割り切れることがポイントになっていて、\(p\neq2\) である素数(奇素数)のときには成り立ちますが、\(p=2\) のときには成り立ちません。\(p=2\) では生成元が存在しないのです。

しかし \(p=2\) のとき、つまり \((\bs{Z}/2^n\bs{Z})^{*}\) は、生成元をもつ2つの巡回群の直積と同型であることが証明できます。


以降、整数 \(a\) について、

 \(a^x\equiv1\:\:(\mr{mod}\:n)\) となる最小の \(x\:(\geq1)\)

が存在するとき、\(x\) を「\(\bs{\mr{mod}\:n}\) での \(\bs{a}\) の位数」あるいは「\(a\) の位数 \((\mr{mod}\:n)\)」と呼びます。


2のべき乗の既約剰余類群
2のべき乗の既約剰余類群:25F)

2のべき乗の既約剰余類群は、

 \((\bs{Z}/2^n\bs{Z})^{*}\cong(\bs{Z}/2\bs{Z})\times(\bs{Z}/2^{n-2}\bs{Z})\)

である。つまり2つの巡回群の直積に同型である。


[証明]

まず \(n=5\) の場合である \((\bs{Z}/32\bs{Z})^{*}\) で考察する。

\((\bs{Z}/32\bs{Z})^{*}\) の元とは、\(1\) から \(31\) までの奇数の集合である。この奇数から「\(4\)で割ると \(1\) 余る奇数」を取り出して、集合 \(A\) とする。
 \(A=\{1,\:5,\:9,\:13,\:17,\:21,\:25,\:29\}\)
である。集合 \(A\) の要素の数は、\(32/4=8\) である。ここで、
 \(5\equiv1\:\:(\mr{mod}\:4)\)
であることに着目する。この両辺を \(k\) 乗(\(0\leq k\))すると、
 \(5^k\equiv1\:\:(\mr{mod}\:4)\)
だから(21E)、\(5^k\) は「\(4\)で割ると \(1\) 余る奇数」である。ここで、\(5^k\) を \(32\) で割った余りを \(j\) とする。つまり、
 \(5^k\equiv j\:\:(\mr{mod}\:32)\:\:(0\leq k,\:1\leq j\leq31)\)
である。すると \(j\) は「\(32\)未満の、\(4\)で割ると \(1\) 余る奇数」であり、\(A\) に含まれている。そこでもし、
 \(5^x\equiv1\:\:(\mr{mod}\:32)\)
を満たす最小の \(x\)(つまり \(\mr{mod}\:32\) での \(5\) の位数)が \(8\) であれば、位数の定理25A)の[補題2]によって「\(\mr{mod}\:32\) でみた \(5^k\:\:(0\leq k\leq7)\) はすべて異なる」から、それらは \(A\) そのものである。実際に計算してみると、

 \(5^0\equiv\:1\) \((\mr{mod}\:32)\)
 \(5^1\equiv\:5\) \((\mr{mod}\:32)\)
 \(5^2\equiv25\) \((\mr{mod}\:32)\)
 \(5^3\equiv29\) \((\mr{mod}\:32)\)
 \(5^4\equiv17\) \((\mr{mod}\:32)\)
 \(5^5\equiv21\) \((\mr{mod}\:32)\)
 \(5^6\equiv\:9\) \((\mr{mod}\:32)\)
 \(5^7\equiv13\) \((\mr{mod}\:32)\)
 \(5^8\equiv\:1\) \((\mr{mod}\:32)\)

となって、\(\mr{mod}\:32\) での \(5\) の位数は \(8\) であり、\(\mr{mod}\:32\) でみた \(5^k\:\:(0\leq k\leq7)\) には \(A\) の元がすべて現れる。これは \(A\) が巡回群と同型であることを示している。

一方、\((\bs{Z}/32\bs{Z})^{*}\) の元から「\(4\)で割ると \(3\) 余る奇数」を取り出し、それを集合 \(B\) とすると、
 \(B=\{3,\:7,\:11,\:15,\:19,\:23,\:27,\:31\}\)
である。ここで、\(A=\{4k+1\:|\:0\leq k\leq7\}\) と記述し、\(i=7-k\:\:(k=7-i)\) と定義すると、
\(\begin{eqnarray}
&&\:\:(-1)\cdot A&=\{-4k-1 &|\:0\leq k\leq7\}\\
&&&=\{-4(7-i)-1 &|\:0\leq i\leq7\}\\
&&&=\{4i+3-32 &|\:0\leq i\leq7\}\\
\end{eqnarray}\)
だから、\(\mr{mod}\:32\) でみると、
 \(B\equiv(-1)\cdot A\)
である。\((-1)\cdot A\) は、集合 \(A\) の要素すべてに \(-1\) を掛けた集合の意味である。

\((\bs{Z}/32\bs{Z})^{*}\) の元は \(A\) と \(B\) の和であり、\(A\) と \(B\) に重複はない。従って、\((\bs{Z}/32\bs{Z})^{*}\) の元は、\(\mr{mod}\:32\) でみて、
 \((-1)^j\cdot5^k\:\:(j=0,1)\) \((0\leq k\leq7)\)
の形に一意に表現できる。\(j=0\) の場合は \(A\) を、\(j=1\) なら \(B\) を表している。

\(\mr{mod}\:32\) でみて、\(5^k\) は群位数 \(8\) の巡回群であり、\((-1)^j\) は群位数 \(2\) の巡回群である。従って、\((\bs{Z}/32\bs{Z})^{*}\) は2つの巡回群の直積で表現できることになる。このことが成り立つキーポイントは、

 \(\mr{mod}\:32\) でみた \(5\) の位数が \(\dfrac{32}{4}=8\)

ということである。もしこれが \(2^5=32\) だけでなく \(2^n\:\:(2\leq n)\) で成り立てば、一般論に拡張できる。その、\(2^n\) で成り立つことは、次のように、[補題7]として証明できる。

[補題7]

\(n\geq2\) のとき、\(5\) の \(\mr{mod}\:2^n\) での位数は \(2^{n-2}\) である。


[証明]

数学的帰納法で証明する。題意は \(n=2\) のときに成り立つので( \(5\equiv1\:\:(\mr{mod}\:4)\) )、\(n\) で成り立つと仮定し、\(n+1\) でも成り立つことを証明する。\(\mr{mod}\:2^{n+1}\) での \(5\) の位数を調べるため、
 \(5^x\equiv1\:\:(\mr{mod}\:2^{n+1})\)
 \((\br{A})\)
を満たす \(x\) について考察する。\(x\) の最小値が \(2^{n-1}\) であれば、[補題7]が証明されたことになる。

一般に \(a\equiv b\:\:(\mr{mod}\:p^n)\) なら、\(1\leq i < n\) とするとき \(a\equiv b\:\:(\mr{mod}\:p^i)\) である。従って \((\br{A})\) 式が成り立つとき、
 \(5^x\equiv1\:\:(\mr{mod}\:2^n)\)
も成り立つ。帰納法の仮定により \(\mr{mod}\:2^n\) での \(5\) の位数は \(2^{n-2}\) だから、位数の定理25A)の[補題4]により \(x\) は \(2^{n-2}\) の倍数である。

従って \(x\) の最小値は \(2^{n-2}\) だが、\(x\) を \(2^{n-2}\) とすると \((\br{A})\) 式が成り立たない。なぜなら、
 \(5^{2^{n-2}}\equiv1+2^n\:\:(\mr{mod}\:2^{n+1})\)
 \((\br{B})\)
が言えるからである。

\((\br{B})\) 式が正しい理由を数学的帰納法で説明すると、\(n=2\) のとき \((\br{B})\) 式は \(5\equiv5\:\:(\mr{mod}\:8)\) だから成り立っている。そこで、ある整数 \(k\) を用いて \((\br{B})\) 式を等式化すると、
 \(5^{2^{n-2}}+k2^{n+1}=1+2^n\)
となる。記述を見やすくするため \(5^{2^{n-2}}=\alpha\) とおくと、
 \(\alpha+k2^{n+1}=1+2^n\)
である。この両辺を2乗すると、
 \((\alpha+k2^{n+1})^2=(1+2^n)^2\)
 \(\alpha^2+\alpha k2^{n+2}+k^22^{2n+2}=1+2^{n+1}+2^{2n}\)
となる。\(2\leq n\) のときは \(n+2\leq2n\) なので、両辺を \(\mr{mod}\:2^{n+2}\) でみると、左辺の第2項、第3項、右辺の第3項は \(0\) である。従って、
 \(\alpha^2\equiv1+2^{n+1}\:\:(\mr{mod}\:2^{n+2})\)
 \(5^{2^{n-1}}\equiv1+2^{n+1}\:\:(\mr{mod}\:2^{n+2})\)
となり、\((\br{B})\) 式は \(n\) を \(n+1\) に置き換えても成り立つ。従って \((\br{B})\) 式は正しい。

\((\br{A})\) 式の \(x\) は \(2^{n-2}\) の倍数であるが、\(x=2^{n-2}\) では \((\br{A})\) 式が成り立たないことが分かった。その次に小さな \(x\) の倍数は \(x=2\cdot2^{n-2}=2^{n-1}\) であり、これを \((\br{A})\) 式に入れると、
 左辺\(=5^{2^{n-1}}\)
である。一方、\((\br{B})\) 式の両辺を2乗すると、
\(\begin{eqnarray}
&&\:\:5^{2^{n-1}}&\equiv(1+2^n)^2\:\:(\mr{mod}\:2^{n+1})\\
&&&=1+2^{n+1}+2^{2n}\\
&&&\equiv1\:\:(\mr{mod}\:2^{n+1})\\
\end{eqnarray}\)
であるから、\(x=2^{n-1}\) のとき、
 \(5^x\equiv1\:\:(\mr{mod}\:2^{n+1})\)
が成り立つ。つまり \((\br{A})\) 式が成り立つ \(x\) の最小値は \(2^{n-1}\) であり、\(5\) の \(\mr{mod}\:2^{n+1}\) での位数は \(2^{n-1}\) である。これで、帰納法によって[補題7]が正しいことが証明できた。[補題7の証明終]



[補題7]が正しいので、\(n=5\) の例で展開した論理により、\((\bs{Z}/2^n\bs{Z})^{*}\) の元は、\(\mr{mod}\:2^n\) でみて、
 \((-1)^j5^k\:\:(j=0,1,\:\:0\leq k\leq2^{n-2}-1)\)
の形に一意に表現できることが分かった。

ここで、\((\bs{Z}/2^n\bs{Z})^{*}\) から \((\bs{Z}/2\bs{Z})\times(\bs{Z}/2^{n-2}\bs{Z})\) への写像 \(f\) を、
 \(f\::\) \((\bs{Z}/2^n\bs{Z})^{*}\) \(\longrightarrow\) \((\bs{Z}/2\bs{Z})\times(\bs{Z}/2^{n-2}\bs{Z})\)
\((-1)^j5^k\) \(\longmapsto\) \((j,\:k)\)
で定める。\((\bs{Z}/2^n\bs{Z})^{*}\) の群演算は乗算であり、\((\bs{Z}/2\bs{Z})\) と \((\bs{Z}/2^{n-2}\bs{Z})\) の群演算は加算であることに注意すると、\((\bs{Z}/2^n\bs{Z})^{*}\) の2つの元 \((-1)^j5^k\)、\((-1)^l5^m\) について、
\(\begin{eqnarray}
&&\:\:f((-1)^j5^k\cdot(-1)^l5^m)&=f((-1)^{j+l}5^{k+m})\\
&&&=(j+l,\:k+m)\\
&&\:\:f((-1)^j5^k)+f((-1)^l5^m)&=(j,k)+(l,m)\\
&&&=(j+l,\:k+m)\\
\end{eqnarray}\)
 \(f((-1)^j5^k\cdot(-1)^l5^m)=f((-1)^j5^k)+f((-1)^l5^m)\)
となり、\(f\) は同型写像の要件を満たしている。従って、

 \((\bs{Z}/2^n\bs{Z})^{*}\cong(\bs{Z}/2\bs{Z})\times(\bs{Z}/2^{n-2}\bs{Z})\)

であり、\((\bs{Z}/2^n\bs{Z})^{*}\) は、群位数 \(2\) と群位数 \(2^{n-2}\) の2つの巡回群の直積に同型である。[証明終]

既約剰余類群の構造
ここまでの準備を行うと、既約剰余類群の構造を明らかにできます。これが第2章のゴールです。

既約剰余類群の構造:25G)

既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) は巡回群の直積に同型である。


[証明]

以下の記述では、
 ・\(a_j\) は \(a\) を \(j\) で割った余り
 ・\((a+b)_j\) は \((a+b)\) を \(j\) で割った余り
を表す。

\(j\) と \(k\) を 互いに素な整数 \((2\leq j,k)\) とする。\(a\) を \(\bs{Z}/(jk)\bs{Z}\) の元とし \((0\leq a\leq jk-1)\)、\(\bs{Z}/(jk)\bs{Z}\) から \((\bs{Z}/j\bs{Z})\times(\bs{Z}/k\bs{Z})\) への写像、\(f\) を次のように定義する。

 \(f\::\) \(\bs{Z}/(jk)\bs{Z}\) \(\longrightarrow\) \((\bs{Z}/j\bs{Z})\times(\bs{Z}/k\bs{Z})\)
\(a\) \(\longmapsto\) \((a_j,\:a_k)\)

\(j\) と \(k\) が 互いに素なので、中国剰余定理21F)により、任意に選んだ \(a_j\) と \(a_k\) から \(a\) が一意に決まる。つまり、\(f\) は1対1写像(数学用語で "全単射")である。また、\(a\) とは別の \(\bs{Z}/(jk)\bs{Z}\) の元を \(b\) とすると、
\(\begin{eqnarray}
&&\:\:f(a+b)&=((a+b)_j,\:(a+b)_k)\\
&&\:\:f(a)+f(b)&=(a_j,\:a_k)+(b_j,\:b_k)\\
&&&=(a_j+b_j,\:a_k+b_k)\\
&&&=((a+b)_j,\:(a+b)_k)\\
&&\:\:f(a+b)&=f(a)+f(b)\\
\end{eqnarray}\)
となり、\(f\) は同型写像である。

いま、\(\mr{gcd}(a,jk)=1\)(\(a\) が \(jk\) と素)だとすると、既約剰余類群の定義により、\(a\) は \((\bs{Z}/(jk)\bs{Z})^{*}\) の元である。

ここで一般的に、
 \(\mr{gcd}(a,jk)=1\) なら
 \(\mr{gcd}(a,j)=1\) かつ \(\mr{gcd}(a,k)=1\)
である。また \(\mr{gcd}(a,j)=1\) なら \(\mr{gcd}(j,a_j)=1\) である。なぜなら互除法の原理21A)によって、\(a\) と \(j\) の公約数は \(j\) と \(a_j\) の公約数だからである。

従って、
 \(\mr{gcd}(j,a_j)=1\) かつ \(\mr{gcd}(k,a_k)=1\)
になる。つまり、\(a_j\) は \((\bs{Z}/j\bs{Z})^{*}\) の元であり、\(a_k\) は \((\bs{Z}/k\bs{Z})^{*}\) の元である。また、
 \(\mr{gcd}(a,j)=1\) かつ \(\mr{gcd}(a,k)=1\) なら
 \(\mr{gcd}(a,jk)=1\)
も成り立つので、任意の \((\bs{Z}/j\bs{Z})^{*}\) の元と \((\bs{Z}/k\bs{Z})^{*}\) の元を決めれば、\((\bs{Z}/(jk)\bs{Z})^{*}\) の元が定まる。

つまり、\(f\) は \((\bs{Z}/(jk)\bs{Z})^{*}\) から \((\bs{Z}/j\bs{Z})^{*}\times(\bs{Z}/k\bs{Z})^{*}\) への同型写像でもある。従って、\(j\) と \(k\) が互いに素という条件のもとで、
 \((\bs{Z}/(jk)\bs{Z})^{*}\cong(\bs{Z}/j\bs{Z})^{*}\times(\bs{Z}/k\bs{Z})*\)
 \((\br{C})\)
である。



いま、\(p,\:q\) を2つの素数とし、\(n\) の素因数分解が、
 \(n=p^a\cdot q^b\)
だとする。このとき \((\br{C})\) 式で \(j=p^a,\:k=q^b\) とおくと、
 \((\bs{Z}/n\bs{Z})^{*}\cong(\bs{Z}/p^a\bs{Z})^{*}\times(\bs{Z}/q^b\bs{Z})^{*}\)
となる。さらに、\(p,\:q,\:r\) を3つの素数とし、
 \(n=p^a\cdot q^b\cdot r^c\)
と表せたとする。\((\br{C})\) 式で \(j=p^a\cdot q^b,\:k=r^c\) とおくと、
\(\begin{eqnarray}
&&\:\:(\bs{Z}/n\bs{Z})^{*}&\cong(\bs{Z}/(p^aq^b)\bs{Z})^{*}\times(\bs{Z}/r^c\bs{Z})^{*}\\
&&&\cong(\bs{Z}/p^a\bs{Z})^{*}\times(\bs{Z}/q^b\bs{Z})^{*}\times(\bs{Z}/r^c\bs{Z})^{*}\\
\end{eqnarray}\)
となる。\(n\) の素因数の数が4以上に増えてもこの操作は繰り返せるから、既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) は \((\bs{Z}/p^a\bs{Z})^{*}\) の形の既約剰余類群の直積と同型である。

\((\bs{Z}/p^a\bs{Z})^{*}\) は、\(p=2\) のときは2のべき乗の既約剰余類群の定理(25F)により、2つの巡回群の直積と同型である。また、\(p\neq2\) の素数のときは生成元の存在2の定理(25E)により、それ自体が巡回群である。従って、既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) は \(n\) の値にかかわらず、巡回群の直積と同型である。[証明終]



「既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) は巡回群の直積と同型」(25G)は、ガロア理論の証明で次のように使います。\(1\) の \(n\)乗根(\(x^n-1=0\) の解)のうち、\(n\)乗して初めて \(1\) になるものを「\(1\) の原始\(n\)乗根」といいます。それを \(\zeta\) とすると、

① \(\bs{Q}(\zeta)\) のガロア群は \((\bs{Z}/n\bs{Z})^{*}\) と同型である。
② \((\bs{Z}/n\bs{Z})^{*}\) は巡回群の直積と同型である(25G)。
③ 巡回群の直積は可解群である。
④ \(\bs{Q}(\zeta)\) のガロア群は可解群である。

となり、④が証明できます。① と ③ は別途証明します。④ の「\(\bs{Q}(\zeta)\) のガロア群は可解群」が重要で、方程式の可解性の必要条件を証明するときの一つのポイントになります。

 
3.多項式と体 
 

ガロア理論では方程式の解を含む「体」の特性を分析することで、方程式が代数的に解けるかどうかを調べます。第3章ではその「体」と、方程式の元になる「多項式」に関する重要な定義と定理を説明します。


3.1 多項式


ガロア理論で対象とする多項式は、1つの変数(未知数)をもつ、有理数係数の多項式です。それを、

 \(f(x)=a_nx^n+a_{n-1}x^{n-1}+\:\cdots\:+a_1x+a_0\:\:(a_i\in\bs{Q})\)

で表します。\(\bs{f(x)}\) の「\(\bs{0}\) でない最高次の係数 \(\bs{n}\)」を、多項式の「次数」といい、\(\bs{\mr{deg}\:f(x)}\) で表します。通常、\(\mr{deg}\:f(x)\geq1\) ですが、便宜上、\(a_0\) 以外の係数が \(0\) の場合(=定数項のみの場合)も多項式と呼び「\(\bs{0}\) 次多項式」とします。また、全ての係数が \(0\) の場合を「\(\bs{0}\) 多項式(零多項式)」と呼びます。

多項式 \(a(x)\) を 多項式 \(b(x)\) で割った商を \(p(x)\)、余りを \(r(x)\) とすると、
 \(a(x)=p(x)b(x)+r(x)\)
   \((\:\mr{deg}\:r(x) < \mr{deg}\:b(x)\:)\)
です。整数のときと同じように互除法21A)を用い、次に \(b(x)\) を \(r(x)\) で割って余りを求める操作を繰り返すと、\(\mr{deg}\:r(x)\) が単調減少するので、いずれ \(b(x)\) が \(r(x)\) で割り切れるとき(=互除法の最終段階)がきます。\(r(x)\) が \(0\) 次多項式(=定数)なら、\(b(x)\) は \(r(x)\) で割り切れるので、最終段階は必ずあります。

\(b(x)\) が \(r(x)\) で割り切れるとき、\(r(x)\) が \(a(x)\) と \(b(x)\) の「最大公約数」です。実際は "数" ではなく多項式なので、「最大公約式」や「最大公約因子」といった言い方もありますが、一般的には「最大公約数」で通っています。

最大公約数が定数(\(0\) 次多項式)のとき、\(a(x)\) と \(b(x)\) は互いに素である、といいます。このとき、整数における不定方程式の解の存在定理(21C)と同様の、次の定理が成り立ちます。

不定方程式
多項式の不定方程式:31A)

\(a(x)\) と \(b(x)\) が互いに素な多項式のとき、
 \(a(x)f(x)+b(x)g(x)=1\)
を満たす多項式 \(f(x)\)、\(g(x)\)で、
 \(\mr{deg}\:g(x)\: < \:\mr{deg}\:a(x)\)
のものが存在する。

また、\(a(x)\) と \(b(x)\) が互いに素な多項式で、\(h(x)\) が任意の多項式のとき、
 \(a(x)f(x)+b(x)g(x)=h(x)\)
を満たす多項式 \(f(x)\)、\(g(x)\) で、
 \(\mr{deg}\:g(x)\: < \:\mr{deg}\:a(x)\)
のものが存在する。


[証明]

\(a(x)\) と \(b(x)\) に互除法21A)を適用して次数を下げ、同時に \(f(x),\:g(x)\) を変換して同等の方程式に変形していく。\(a(x)\) を \(b(x)\) で割った商を \(p(x)\)、余りを \(r(x)\) とする。
 \(a(x)=p(x)b(x)+r(x)\)
   \(\mr{deg}\:r(x) < \mr{deg}\:b(x)\)
である。互除法の次のステップの \(a_1(x),\:b_1(x)\)、\(f_1(x),\:g_1(x)\) を次のように決める。

\(\:\:\:\:\br{①}\left\{
\begin{array}{l}
\begin{eqnarray}
&&a_1(x)=b(x)&\\
&&b_1(x)=r(x)&\\
\end{eqnarray}
\end{array}\right.\)
\(\:\:\:\:\br{②}\left\{
\begin{array}{l}
\begin{eqnarray}
&&f_1(x)=p(x)f(x)+g(x)&\\
&&g_1(x)=f(x)&\\
\end{eqnarray}
\end{array}\right.\)

\(\br{②}\) を \(f(x),\:g(x)\) について解くと、

\(\:\:\:\:\br{③}\left\{
\begin{array}{l}
\begin{eqnarray}
&&f(x)=g_1(x)&\\
&&g(x)=f_1(x)-p(x)g_1(x)&\\
\end{eqnarray}
\end{array}\right.\)

である。このよう定義すると、\(\br{①}\)、\(\br{②}\) を使って、
 \(a_1(x)f_1(x)+b_1(x)g_1(x)\)
  \(=b(x)(p(x)f(x)+g(x))+r(x)f(x)\)
  \(=p(x)b(x)f(x)+b(x)g(x)+r(x)f(x)\)
  \(=(p(x)b(x)+r(x))f(x)+b(x)g(x)\)
  \(=a(x)f(x)+b(x)g(x)\)
と計算できるので、不定方程式は、
 \(a_1(x)f_1(x)+b_1(x)g_1(x)=1\)
となり、係数多項式 \(a_1(x),\:b_1(x)\) の次数が元々の \(a(x),\:b(x)\) より小さな方程式に変形できる。この方程式の解である \(f_1(x),\:g_1(x)\) が求まれば、\(\br{③}\) を使って \(f(x),\:g(x)\) が求まる。

以上の式の変形は、\(1\leq i\) として、\(a_i(x)\) を \(b_i(x)\) で割った商と余りを、
 \(a_i(x)=p_i(x)b_i(x)+r_i(x)\)
   \((\:\mr{deg}\:r_i(x) < \mr{deg}\:b_i(x)\:)\)
のように求め、次のステップを、
 \(a_{i+1}(x)=b_i(x)\)
 \(b_{i+1}(x)=r_i(x)\)
 \(f_{i+1}(x)=p_i(x)f_i(x)+g_i(x)\)
 \(g_{i+1}(x)=f_i(x)\)
とすることで、互除法を続けていける。このように係数多項式 \(a(x),\:b(x)\) の剰余算を繰り返し、同時に変数多項式 \(f(x),\:g(x)\) を変換していくと、この過程で \(\mr{deg}\:r_i(x)\) は単調減少していく。そして互除法の最終段階で、
 \(a_n(x)f_n(x)+b_n(x)g_n(x)=1\)
となったとする。元々の \(a(x)\) と \(b(x)\) は互いに素だったから、この段階の \(b_n(x)\) は \(0\) 次多項式=定数である。その定数を \(c\) とすると、
 \(a_n(x)f_n(x)+cg_n(x)=1\)
となるが、この不定方程式の解は、
 \(f_n(x)=0\)
 \(g_n(x)=\dfrac{1}{c}\)
である。この解を起点として \(f_i(x),\:g_i(x)\:\:(1\leq i\leq n)\) の変換過程を逆にたどると \(f(x),\:g(x)\) が求まる。



次に、
 \(a(x)f(x)+b(x)g(x)=1\)
 \((\br{A})\)
の解が、
 \(\mr{deg}\:g(x) < \mr{deg}\:a(x)\)
であるように選べることを示す。\(g(x)\) を \(a(x)\) で割った商を \(q(x)\)、余りを \(s(x)\) とする。
 \(g(x)=q(x)a(x)+s(x)\)
 \(s(x)=g(x)-q(x)a(x)\)
である。ここで、
 \(F(x)=f(x)+b(x)q(x)\)
 \(G(x)=s(x)\)
とおくと、
 \(a(x)F(x)+b(x)G(x)\)
\(\begin{eqnarray}
&&\:\: =&a(x)(f(x)+b(x)q(x))+b(x)s(x)\\
&&\:\: =&a(x)f(x)+a(x)b(x)q(x)+\\
&&&b(x)(g(x)-q(x)a(x))\\
&&\:\: =&a(x)f(x)+a(x)b(x)q(x)+\\
&&&b(x)g(x)-b(x)q(x)a(x)\\
&&\:\: =&a(x)f(x)+b(x)g(x)\\
\end{eqnarray}\)
となるので、
 \(a(x)f(x)+b(x)g(x)=1\)
であれば、
 \(a(x)F(x)+b(x)G(x)=1\)
である。つまり \(f(x),\:g(x)\) が不定方程式の解であれば、\(F(x),\:G(x)\)も解である。\(\mr{deg}\:G(x)=\mr{deg}\:s(x) < \mr{deg}\:a(x)\) なので、\(F(x),\:G(x)\) が題意を満たす解である。



\((\br{A})\) 式を満たす \(f(x),\:g(x)\) が求まったとする。\((\br{A})\) 式の両辺に \(h(x)\) を掛けると、
 \(a(x)f(x)h(x)+b(x)g(x)h(x)=h(x)\)
となる。
 \(F(x)=f(x)h(x)\)
 \(G(x)=g(x)h(x)\)
とおくと、\(F(x),\:G(x)\) は不定方程式、
 \(a(x)F(x)+b(x)G(x)=h(x)\)
の解である。\((\br{A})\) 式の解を \(\mr{deg}\:g(x) < \mr{deg}\:a(x)\) となるように選べることを上で証明したが、この過程において方程式の右辺は無関係であった。従って、全く同じプロセスをたどることで、
 \(\mr{deg}\:G(x) < \mr{deg}\:a(x)\)
とすることができる。[証明終]

既約多項式
有理数係数の多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の解がべき根で表現できるために必要十分条件を述べるのがガロア理論です。

このとき、多項式が有理数の範囲で因数分解できるのであれば、\(f(x)=0\) は、たとえば \(g(x)h(x)=0\)、\(g(x)=0,\:h(x)=0\) となって、より次数の低い方程式の問題に還元されてしまいます。これでは、たとえば \(f(x)\) が5次多項式だとしても、5次方程式の問題ではなくなる。

従って、方程式の解の議論をするときには「因数分解できない多項式」の議論をすればよいことになります。それが既約多項式です。

既約多項式の定義:31B)

有理数 \(\bs{Q}\) を係数とする多項式で、\(\bs{Q}\) の範囲ではそれ以上因数分解できない多項式を \(\bs{Q}\) 上で既約な多項式という。


たとえば多項式 \(x^2-2\) は \(\bs{Q}\) 上では因数分解できませんが、\(\bs{R}\) 上では \((x-\sqrt{2})(x+\sqrt{2})\) と因数分解できます。\(x^2+2\) は \(\bs{R}\) 上では因数分解できませんが、\(\bs{C}\) 上では \((x-\sqrt{2}i)(x+\sqrt{2}i)\) と因数分解できます。「代数学の基本定理」によると、\(n\)次方程式は 複素数の範囲で\(n\)個の解をもつので、\(\bs{C}\) 上の既約多項式は1次多項式しかないことになります。

つまり、既約多項式を議論するときには「どの体での既約多項式か」を明確にする必要があります。以下、既約多項式の性質を調べますが、その前に次の定理を証明します。


整数係数多項式の既約性:31C)

整数係数の多項式 \(f(x)\) が \(\bs{Q}\) 上で(=有理数係数の多項式で)因数分解できれば、整数係数でも因数分解できる。


この定理の対偶をとると、

整数係数の多項式 \(f(x)\) が整数係数で因数分解できなければ、有理数係数でも因数分解できず、つまり \(f(x)\) は既約多項式である

となります。有理数係数の多項式は、各係数を整数の分数で表現可能で、その分母の最小公倍数を多項式全体に掛けると整数係数の多項式になります。従って、ある多項式が既約かどうかという議論は整数係数の範囲で考えればよいことになり、話が随分シンプルになります。

これを証明するために、まず次の補題を証明します。

[補題]

2つの整数係数の多項式、\(g(x),\:\:h(x)\) があり、ともに係数の最大公約数は \(1\) とする。このとき、
 \(r(x)=g(x)h(x)\)
で定義される多項式 \(r(x)\) の係数の最大公約数も \(1\) である。


[証明]

背理法を使う。\(r(x)\) の係数の最大公約数が \(2\) 以上と仮定する。最大公約数を素因数分解したときに現れる素数の一つを \(\bs{p}\) とする。

 \(r(x)=a_0+a_1x+a_2x^2+\cdots+a_nx^n\)

とおくと、\(a_i\:\:(0\leq i\leq n)\) のすべては \(p\) で割り切れる。ここで、

 \(g(x)=b_0+b_1x+b_2x^2+\cdots+b_mx^m\)
 \(h(x)=c_0+c_1x+c_2x^2+\cdots+c_kx^k\)

とすると、\(g(x)\) の係数の最大公約数は \(1\) なので、係数のすべてが \(p\) で割り切れることはなく、少なくとも \(1\) つの係数は \(p\) で割り切れない。ここで、\(p\) で割り切れない \(g(x)\) の係数のうち \(x\) の次数が最小の係数を考える。以降の数式を見やすくするため、\(b_2\) が「\(p\) で割り切れない、\(x\) の次数が最小の係数」とする。このとき \(b_0,\:b_1\) は \(p\) で割り切れる。

全く同様にして \(h(x)\) に関しては、\(c_3\) が「\(p\) で割り切れない、\(x\) の次数が最小の係数」とする。つまり \(c_0,\:c_1,\:c_2\) は \(p\) で割り切れる。

ここで、\(r(x)=g(x)h(x)\) の等式の \(x^5\) の係数を比較する。左辺の \(x^5\) の項は \(a_5x^5\) であるが、背理法の仮定によって係数 \(a_5\) は \(p\) で割り切れる。

一方、右辺の \(g(x)h(x)\) の \(x^5\) の項は、
 \((b_0c_5+b_1c_4+b_2c_3+b_3c_2+b_4c_1+b_5c_0)x^5\)
であるが、この係数のうち \(b_2c_3\) は 素数 \(p\) で割り切れない。なぜなら、\(b_2\) も \(c_3\) も素数 \(p\) で割り切れないので、\(b_2c_3\) を素因数分解しても \(p\) が現れないからである。一方、\(b_2c_3\) 以外の5つの項は、\(b_0,\:b_1,\:c_0,\:c_1,\:c_2\) のいずれかを因数にもつから、\(p\) で割り切れる。従って、唯一、 \(b_2c_3\) だけが \(p\) で割り切れないので、右辺全体としては \(p\) で割り切れない。

ということは、\(r(x)=g(x)h(x)\) の等式は \(x^5\) の項に関して右辺が \(p\) で割り切れ、左辺が \(p\) で割り切れないことになり、矛盾が生じる。

表記を見やすくするために、\(b_2\) と \(c_3\) が素数 \(p\) で割り切れない最小の次数の係数としたが、これを \(b_i\:\:(0\leq i\leq m)\) と \(c_j\:\:(0\leq j\leq k)\) としても全く同じであり、左辺の \(x^{i+j}\) の係数である \(a_{i+j}\) が \(p\) で割り切れる(=背理法の仮定)にもかかわらず、右辺の \(x^{i+j}\) の係数が \(p\) で割り切れないという矛盾が生じる。

従って背理法の仮定は間違っていて、\(r(x)\) の係数すべてを割り切る素数はなく、係数の最大公約数は \(1\) である。[補題の証明終]



この補題を用いて、整数係数多項式の既約性の定理(31C)を証明します。

[証明]

整数係数の多項式 \(f(x)\) が、2つの有理数係数の多項式 \(g(x)\) と \(h(x)\) に因数分解されたとする。
 \(f(x)=g(x)h(x)\)
 \((\br{B})\)
\(f(x)\) の係数の最大公約数を \(d\) とし、全部の係数を \(d\) で割って作った多項式を \(f_r(x)\) とする。つまり、
 \(f(x)=df_r(x)\)
であり、\(f_r(x)\) の係数の最大公約数は \(1\) である。

\(g(x)\) の係数は有理数(=整数の分数)であるが、適当な整数 \(m_g\) をかけることによって整数係数の多項式 \(m_gg(x)\) にすることができる。この多項式 \(m_gg(x)\) の係数の最大公約数を \(d_g\) とし、\(m_gg(x)\) の各係数を \(d_g\) で割った多項式を \(g_r(x)\) とする。
 \(m_gg(x)=d_gg_r(x)\)
であり、\(g_r(x)\) の係数の最大公約数は \(1\) である。

同様に、\(h(x)\) の係数は有理数であるが、適当な整数 \(m_h\) をかけることによって整数係数の多項式 \(m_hh(x)\) にすることができる。この \(m_hh(x)\) の係数の最大公約数を \(d_h\) とし、\(m_hh(x)\) の各係数を \(d_h\) で割った多項式を \(h_r(x)\) とする。
 \(m_hh(x)=d_hh_r(x)\)
であり、\(h_r(x)\) の係数の最大公約数は \(1\) である。

以上にもとづいて \((\br{B})\) 式を書き換えると、
 \(df_r(x)\)\(=\dfrac{d_g}{m_g}g_r(x)\cdot\dfrac{d_h}{m_h}h_r(x)\)
\(=\dfrac{d_gd_h}{m_gm_h}g_r(x)\cdot h_r(x)\) 
\((\br{C})\)
となる。ここで、
 \(g_r(x)\cdot h_r(x)=r(x)\)
 \((\br{D})\)
と定義すると、[補題]により、多項式 \(r(x)\) の係数の最大公約数は \(1\) である。

\((\br{D})\) 式を \((\br{C})\) 式に代入すると、
 \(df_r(x)=\dfrac{d_gd_h}{m_gm_h}r(x)\)
 \((\br{E})\)
となる。この式で \(f_r(x)\) と \(r(x)\) はともに係数の最大公約数が \(1\) であるが、整数係数の多項式を、
 (整数)\(\times\)(係数の最大公約数が \(1\) の整数係数多項式)
と表現する方法は1種類しかない。従って \((\br{E})\) 式の両辺の係数と多項式は同じものであり、多項式の部分は、
\(\begin{eqnarray}
&&\:\:f_r(x)&=r(x)\\
&&&=g_r(x)\cdot h_r(x)\\
\end{eqnarray}\)
である。従って \(f(x)=df_r(x)\) を使って、
 \(f(x)=(dg_r(x))\cdot h_r(x)\)
と表現できる。結局、\(f(x)\) は整数係数の2つの多項式に因数分解できることになり、題意が証明された。[証明終]



この定理があるため、有理数係数の既約多項式を議論するときには、整数係数の既約多項式 \(f(x)\) を議論し、\(f(x)=0\) の解を調べればよいことになります。これ以降の説明では整数係数の方程式の例だけが出てきますが、その理由は整数係数の例で十分だからです。

以下、既約多項式がもつ重要な性質を4つあげます。最初の3つは方程式に関するものです。

 既約多項式の性質 

既約多項式の定理1:31D)

\(p(x)\) を \(\bs{Q}\) 上の既約多項式、\(f(x)\) を \(\bs{Q}\) 上の多項式とする。

方程式 \(p(x)=0\) と \(f(x)=0\) が(複素数の範囲で)共通の解を1つでも持てば、\(f(x)\) は \(p(x)\) で割り切れる。


[証明]

\(f(x)\) は \(p(x)\) で割り切れないと仮定して背理法で証明する。\(f(x)\) が \(p(x)\) で割り切れないのなら、\(f(x)\) と \(p(x)\) は互いに素である。なぜなら、もし互いに素でないとすると、1次式以上の多項式 \(h(x)\) があって、
 \(f(x)=f_1(x)h(x)\)
 \(p(x)=p_1(x)h(x)\)
と表現できるが、\(p(x)\) は既約多項式なので \(p_1(x)=1\) であり、つまり \(h(x)=p(x)\) である。そうすると \(f(x)=f_1(x)p(x)\) となり、\(f(x)\) は \(p(x)\) で割り切れることになって矛盾するからである。つまり、\(f(x)\) が \(p(x)\) で割り切れないのなら \(f(x)\) と \(p(x)\) は互いに素である。

\(f(x)\) と \(p(x)\) が互いに素なら、多項式の不定方程式の定理(31A)によって、
 \(f(x)a(x)+p(x)b(x)=1\)
を満たす \(a(x)\)、\(b(x)\) が存在する。そこで、方程式 \(p(x)=0\) と \(f(x)=0\) の共通の解を \(\alpha\in\bs{C}\) とし、この式に代入すると、左辺\(=0\) となって矛盾する。

従って、\(f(x)\) は \(p(x)\) で割り切れないとの仮定は矛盾を導くから、仮定は誤りであり、\(f(x)\) は \(p(x)\) で割り切れる。[証明終]



この定理は重要なことを言っています。\(\bs{Q}\) 上の方程式の解になる数を代数的数といいます。\(f(x)\) を既約多項式とし、ある代数的数 \(\alpha\) が \(f(x)=0\) の解とします。

もし、既約多項式 \(f(x)\) 以外の多項式 \(g(x)\) があって、\(g(x)=0\) の解の一つが\(\alpha\) だとすると、上記の定理により \(g(x)\) は \(f(x)\) で割り切れます。\(g(x)\) の次数が \(f(x)\) の次数と同じとすると、\(g(x)\) は \(f(x)\) の定数倍の既約多項式です。\(g(x)\) の次数が \(f(x)\) の次数より大きいとすると、\(g(x)\) は既約多項式ではありません。

つまり、\(\alpha\) を方程式の解とするとき、\(\bs{f(\alpha)=0}\) である既約多項式 \(\bs{f(x)}\) は、定数倍を除いて一意に決まることがわかります。

既約多項式の定理2:31E)

\(p(x)\) を \(\bs{Q}\) 上の既約多項式、\(f(x)\) を \(\bs{Q}\) 上の多項式とする。

\(f(x)\) の次数が1次以上で \(p(x)\) の次数未満のとき、方程式 \(p(x)=0\) と \(f(x)=0\) は(複素数の範囲で)共通の解を持たない。


[証明]

既約多項式の定理131D)により、もし方程式 \(p(x)=0\) と \(f(x)=0\) が共通の解を1つでも持てば \(f(x)\) は \(p(x)\) で割り切れるので、多項式 \(h(x)\)(定数の場合を含む)を用いて
 \(f(x)=p(x)h(x)\)
と表現できる。従って、
 \(f(x)\) の次数 \(\geq\:p(x)\)の次数
である。つまり、
方程式 \(p(x)=0\) と \(f(x)=0\) が共通の解を1つでも持てば、\(f(x)\) の次数 \(\geq\:p(x)\)の次数である
と言えるが、この対偶をとると、
\(f(x)\) の次数が1次以上で \(p(x)\) の次数未満のとき、方程式 \(p(x)=0\) と \(f(x)=0\) は共通の解を持たない
となる。[証明終]



この定理は、既約多項式の定理131D)と同じことを別の視点で述べたものです。「3.2 体」の「単拡大体の基底」で、既約多項式の定理231E)を使った証明を行います。

既約多項式の定理3:31F)

\(p(x)\) を \(\bs{Q}\) 上の既約多項式とすると、方程式 \(p(x)=0\) は(複素数の範囲で)重解を持たない。


[証明]

方程式 \(p(x)=0\) が重解 \(\alpha\) を持つとすると、
 \(p(x)=(x-\alpha)^2q(x)\)
となる。これを微分すると、
 \(p'(x)=2(x-\alpha)q(x)+(x-\alpha)^2q'(x)\)
となる。以上の2式に \(\alpha\) を代入すると、
 \(p(\alpha)\)\(=0\)
 \(p'(\alpha)\)\(=0\)
となる。つまり、
 ・既約多項式 \(p(x)\) の次数は \(2\) 以上
 ・\(p'(x)\) の次数は \(2\) 未満
であるにもかかわらず共通の解 \(\alpha\) を持つことになり、既約多項式の定理231E)に反して矛盾が生じる。従って方程式 \(p(x)=0\) は重解を持たない。[証明終]



この定理も重要です。以降で行う証明の中には「\(n\)次既約方程式 \(f(x)=0\) の \(n\) 個の解を \(\alpha_1,\alpha_2,\cdots,\alpha_n\) とする」といった、「\(n\)次方程式は \(\bs{n}\) 個の異なった解を持つのが当然」のような記述が出てきますが、\(\bs{f(x)}\) が既約多項式ならこの定理で保証されているからです。

既約多項式の定理4:31G)

\(p(x)\) を既約多項式とし、\(f(x),\:g(x)\) を多項式とする。\(f(x)g(x)\) が \(p(x)\) で割り切れるなら、\(f(x),\:g(x)\) の少なくとも1つは \(p(x)\) で割り切れる。


[証明]

\(f(x)\) が \(p(x)\) で割り切れないとする。\(f(x)\) と \(p(x)\) は互いに素なので、多項式の不定方程式の定理(31A)によって、
 \(f(x)a(x)+p(x)b(x)=1\)
を満たす \(a(x),\:b(x)\) が存在する。両辺に \(g(x)\) を掛けると、
 \(g(x)f(x)a(x)+g(x)p(x)b(x)=g(x)\)
となる。\(g(x)f(x)\) は \(p(x)\) で割り切れるので、
 \(g(x)f(x)=p(x)h(x)\)
と書ける。これを代入して、
 \(p(x)h(x)a(x)+g(x)p(x)b(x)=g(x)\)
 \(p(x)\cdot(h(x)a(x)+g(x)b(x))=g(x)\)
となり、\(g(x)\) は \(p(x)\) で割り切れる。従って \(f(x),\:g(x)\) の少なくとも1つは \(p(x)\) で割り切れる。[証明終]



この定理の \(f(x)\) を \(g(x)\) に置き換えると次が言えます。


\(p(x)\) を既約多項式とし、\(g(x)\) を多項式とする。\((g(x))^2\) が \(p(x)\) で割り切れるなら、\(g(x)\) は \(p(x)\) で割り切れる。また、\((g(x))^k\:\:(2\leq k)\) が \(p(x)\) で割り切れるなら、\(g(x)\) は \(p(x)\) で割り切れる。


既約多項式は、整数における素数に相当します。\(a\) を整数とし、\(a^2\) が \(3\) で割り切れれば、\(a\) は \(3\) で割り切れます。しかし \(a^2\) が \(4\) で割り切れたとしても \(a\) が \(4\) で割り切れるとは限らない。このアナロジーが成り立っています。

最小多項式
最小多項式の定義:31H)

\(\alpha\) を 方程式の解とする。\(\alpha\) を解としてもつ、体 \(\bs{Q}\) 上の方程式のうち、次数が最小の多項式を、\(\alpha\) の \(\bs{Q}\) 上の最小多項式と言う。



最小多項式は既約多項式:31I)

\(\bs{Q}\) 上の方程式、\(f(x)=0\) が \(\alpha\) を解としてもつとき、

① \(f(x)\) が 体 \(\bs{Q}\) 上の既約多項式である
② \(f(x)\) が \(\alpha\) の \(\bs{Q}\) 上の最小多項式である

の2つは同値である。


[② \(\bs{\Rightarrow}\) ① の証明]

最小多項式 \(f(x)\) が既約多項式でなければ、\(f(x)=g(x)h(x)\) となる \(\bs{Q}\) 係数の多項式 \(g(x)\)、\(h(x)\) が存在する。\(x\) に \(\alpha\) を代入すると、
 \(f(\alpha)=g(\alpha)h(\alpha)=0\)
となり、少なくとも \(g(\alpha)=0\)、\(h(\alpha)=0\) のどちらかは成り立つ。従って、\(f(x)\) より次数の低い多項式で \(\alpha\) を解にもつものが存在することになり、\(f(x)\) が最小次数であるという、最小多項式の定義に反する。従って \(f(x)\) は既約多項式である。

[① \(\bs{\Rightarrow}\) ② の証明]

\(g(x)\) を \(\alpha\) の \(\bs{Q}\) 上の最小多項式とする。すると、\(f(x)=0\) と \(g(x)=0\) は共通の解 \(\alpha\) を持つことになり、\(f(x)\) は既約多項式なので、既約多項式の定理131D)により \(g(x)\) は \(f(x)\) で割り切れる。従って \(g(x)\) は多項式 \(h(x)\) を用いて、
 \(g(x)=h(x)f(x)\)
と表せる。② \(\Rightarrow\) ①の証明により、最小多項式は既約多項式なので、\(g(x)\) は既約多項式である。既約多項式が \(1\)次多項式以上の因数をもつことはない。従って \(h(x)\) は \(0\)次多項式=定数である。ということは、\(f(x)\) も \(\alpha\) の最小多項式である。[証明終]



方程式 \(f(x)=0\) の解が \(\alpha\) である( \(f(\alpha)=0\) )という場合、方程式がまずあって、その解を考えます。しかしその逆、つまり代数的数 \(\alpha\) があり、\(\alpha\) を解にもつような方程式は何かと考えるのが最小多項式です。これは、ガロア理論でしばしば出てきます。


3.2 体


最小分解体
最小分解体の定義:32A)

体 \(\bs{Q}\) 上の多項式 \(f(x)\) を、
 \(f(x)=(x-\alpha_1)(x-\alpha_2)\cdots(x-\alpha_n)\)
と、1次多項式で因数分解したとき、
 \(\bs{Q}(\alpha_1,\:\alpha_2,\:\cdots\:,\:\alpha_n)\)
を \(f(x)\) の最小分解体と言う。\(f(x)\) は既約多項式でなくてもよい


この最小分解体は、あとに出てくるガロア拡大体と直結している重要な概念です。

\(\bs{Q}\) 上の方程式の解が四則演算とべき根で表されるかどうか、と言った場合、既約多項式だけを考えれば十分です。しかし最小分解体は、既約でない多項式をも含んだ定義です。ガロア理論でしばしば出てくるのは \(1\) の \(n\)乗根を求める、
 \(x^n-1=0\)
という方程式ですが、左辺は因数分解ができるので既約多項式ではありません。最小分解体の定義は、一般の多項式としておく方が都合が良いのです。

単拡大定理
単拡大定理:32B)

\(\bs{Q}\) 上の方程式の解をいくつか添加した代数拡大体 \(\bs{K}\) は単拡大である。つまり \(\bs{K}\) の元 \(\theta\) があって、\(\bs{K}=\bs{Q}(\theta)\) となる。この \(\theta\) を原始元という。


[証明]

\(\bs{Q}\) 上の方程式の解を \(\alpha\)、\(\beta\) とし、
 \(\theta=\alpha+c\beta\:\:(c\in\bs{Q})\)
とおく。すると、\(\alpha+c\beta\) と有理数の四則演算で作れる数は、\(\alpha,\:\beta,\) 有理数の四則演算で作れるから、
 \(\bs{Q}(\alpha,\beta)\:\supset\:\bs{Q}(\alpha+c\beta)=\bs{Q}(\theta)\)
である。次に、
 \(\bs{Q}(\alpha,\beta)\:\subset\:\bs{Q}(\alpha+c\beta)=\bs{Q}(\theta)\)
が成り立つような \(c\) が存在することを示す。

\(\alpha\) の \(\bs{Q}\) 上の最小多項式を \(f(x)\) とし、\(\beta\) の \(\bs{Q}\) 上の最小多項式を \(g(x)\) とする。そして、
 \(f(x)=0\) の解を \(\alpha_1=\alpha,\:\alpha_2,\:\cdots\:,\alpha_n\)
 \(g(x)=0\) の解を \(\beta_1=\beta,\:\beta_2,\:\cdots\:,\beta_m\)
とする。ここで、
 \(h(x)=f(\alpha+c\beta-cx)\)
とおくと、
 \(h(\beta)=f(\alpha)=0\)
 \(h(\beta_i)=f(\alpha+c\beta-c\beta_i)\:\:(2\leq i\leq m)\)
となる。

\(c\) は有理数であり、無数に選べるので、\(\alpha+c\beta-c\beta_i\:\:(2\leq i\leq m)\) のどれもが \(\alpha_1,\:\alpha_2,\:\cdots\:,\alpha_n\) と一致しないようにできる。具体的には、もし \(\alpha_j\:\:(1\leq j\leq n)\) と一致したとしたら、
 \(\alpha_j=\alpha+c\beta-c\beta_i\)
 \(c=-\dfrac{\alpha-\alpha_j}{\beta-\beta_i}\)
なので、\(i\) と \(j\) を \((2\leq i\leq m,\:\:1\leq j\leq n)\) の範囲で振って \(n(m-1)\) 個の \(c\) を計算し、これら以外の値を選べばよい。このように \(c\) を選んだとする。そうすると \(\alpha+c\beta-c\beta_i\) は方程式 \(f(x)=0\) の解にはなり得ないので、
 \(h(\beta_i)=f(\alpha+c\beta-c\beta_i)\neq0\:\:(2\leq i\leq m)\)
であり、\(g(x)=0\) と \(h(x)=0\) の共通解は \(\beta=\beta_1\) のみになる。

そうすると \(h(x)\) と \(g(x)\) は唯一の共通の因数 \((x-\beta)\) をもつので、\(h(x)\) と \(g(x)\) に互除法21A)を適用すると、\(k\) をある有理数として最後は \(k(x-\beta)\) で割り切れる。

\(g(x)\) は \(\bs{Q}\) 上の多項式だから、すなわち \(\bs{Q}(\alpha+c\beta)\) 上の多項式である。また、\(h(x)\) は \(h(x)=f(\alpha+c\beta-cx)\) と定義されるが、\(f(x)\) が \(\bs{Q}\) 上の多項式なので、\(h(x)\) は \(\bs{Q}(\alpha+c\beta)\) 上の多項式である。つまり \(h(x)\) も \(g(x)\) も \(\bs{Q}(\alpha+c\beta)\) 上の多項式である。

従って、互除法の最終結果である \(k(x-\beta)\) も \(\bs{Q}(\alpha+c\beta)\) 上の多項式である。これは、
 \(k,\:k\beta\:\in\:\bs{Q}(\alpha+c\beta)\)
であることを意味しており、従って、
 \(\beta\:\in\:\bs{Q}(\alpha+c\beta)\)
となる。また \(\alpha\) も、
 \(\alpha=(\alpha+c\beta)-c\beta\:\in\:\bs{Q}(\alpha+c\beta)\)
である。この結果、\(\alpha\)、\(\beta\) の両方が \((\alpha+c\beta)\) の四則演算で表現できることになり、
 \(\bs{Q}(\alpha,\beta)\:\subset\:\bs{Q}(\alpha+c\beta)=\bs{Q}(\theta)\)
である。従って、\(\bs{Q}(\alpha,\beta)\:\supset\:\bs{Q}(\theta)\) と合わせて、
 \(\bs{Q}(\alpha,\beta)=\bs{Q}(\theta)\)
が結論づけられた。

以上を繰り返し適用すると、\(\bs{Q}\) に添加する方程式の解は \(\alpha,\:\beta,\:\gamma,\:\cdots\) と増やしていける。従って、

\(\bs{Q}\)上の方程式の解をいくつか添加した代数拡大体 \(\bs{K}\) は単拡大であり、ある \(\bs{K}\) の元 \(\theta\) を使って \(\bs{K}=\bs{Q}(\theta)\) と表せる

ことが証明できた。[証明終]



「すべての代数拡大体は単拡大である」というのは、ちょっと驚くような定理です。方程式の解を複数添加した体は、このような性質をもっています。方程式の解の議論をするときに解を含む体の性質で議論することのメリットは、このような単拡大定理が使えることにも現れています。次の「単拡大の体」に関する定理も、単拡大定理があることで任意の代数拡大体につながっています。

なお、上の証明で本質的な役割を果たしているのはユークリッドの互除法が成り立つ原理(21A)です。互除法の "奥の深さ" がわかります。

単拡大の体
単拡大の体:32C)

ある代数的数 \(\alpha\) の \(\bs{Q}\) 上の最小多項式が \(n\)次多項式 \(f(x)\) であるとする。このとき 体 \(\bs{K}\) を、

\(\bs{K}\)\(\overset{\text{ }}{=}\)\(\{a_{n-1}\alpha^{n-1}+\)\(\:\cdots\:+\)\(a_2\alpha^2+\)\(a_1\alpha+\)\(a_0\:|\:a_i\in\bs{Q}\:\}\)
  \((0\leq i\leq n-1)\)

と定義すると、\(\bs{K}\) は体になり、\(\bs{K}=\bs{Q}(\alpha)\) である。その元の表し方は一意である。


[証明]

\(\bs{K}\) が四則演算で閉じていて体であることを証明する。\(\bs{K}\) の元は「\(\bs{Q}\) 上の、\(\alpha\) の \(n-1\) 次以下の式」で表されるので、\(\bs{K}\) の任意の2つの元を、\(\bs{Q}\) 上の \(n-1\) 次以下の2つの多項式 \(g(x),\:h(x)\) を用いて、\(g(\alpha),\:h(\alpha)\) とする。

\(g(\alpha)+h(\alpha),\:g(\alpha)-h(\alpha)\) は \(\alpha\) の \(n-1\) 次以下の式なので、\(\bs{K}\) は加減について閉じている。

乗法で閉じていることを言うため、\(g(x)h(x)\) を \(f(x)\) で割った商を \(q(x)\)、余りを \(r(x)\) とする。つまり、
 \(g(x)h(x)=q(x)f(x)+r(x)\)
である。\(x=\alpha\) を代入すると、\(f(\alpha)=0\) なので、
 \(g(\alpha)h(\alpha)=r(\alpha)\)
となる。\(r(x)\) は \(f(x)\) で割ったときの余りなので、次数は \(f(x)\) の次数 \(n\) よりも小さく、\(n-1\) 以下である。従って、\(g(\alpha)h(\alpha)\) は \(\alpha\) の \(n-1\) 次以下の式になり、\(\bs{K}\) は乗法で閉じている。

除法で閉じていることは、\(h(\alpha)\neq0\) のとき、\(\dfrac{g(\alpha)}{h(\alpha)}\) が \(\bs{Q}\) 上の「\(\alpha\) の \(n-1\) 次以下の多項式」で表されることを示せればよい。\(s(x),\:t(x)\) を未知の多項式とし、次の不定方程式を立てる。

 \(f(x)s(x)+h(x)t(x)=g(x)\)

\(f(x)\) は最小多項式なので、最小多項式は既約多項式の定理(31I)により既約多項式である。また、\(h(x)\) は \(f(x)\) で割り切れない。なぜなら、もし \(h(x)\) が \(f(x)\) で割り切れるとすると、\(h(x)=u(x)f(x)\) と書けるが、これに \(\alpha\) を代入すると \(h(\alpha)=u(\alpha)f(\alpha)=0\) となり、\(h(\alpha)\neq0\) に矛盾するからである。

\(h(x)\) が、既約多項式である \(f(x)\) で割り切れないので、\(h(x)\) と \(f(x)\) は互いに素である。すると、多項式の不定方程式の定理(31A)により、上記の不定方程式を満たす \(s(x),\:t(x)\) が存在して、\(t(x)\) を \(n-1\) 次以下にとることができる。不定方程式に \(x=\alpha\) を代入すると、
 \(h(\alpha)t(\alpha)=g(\alpha)\)
 \(\dfrac{g(\alpha)}{h(\alpha)}=t(\alpha)\)
となり、除法でも閉じていることが分かった。つまり \(\bs{K}\) は体である。

\(\bs{Q}(\alpha)\) は「有理数と\(\alpha\)」の四則演算で生成される全ての数から成る体である。\(\bs{K}\) の元は有理数と \(\alpha\) の四則演算で表現され、それは元の間の四則演算で完全に閉じている。従って \(\bs{K}=\bs{Q}(\alpha)\) である。

表現の一意性は次のようにして証明できる。もし \(\bs{Q}(\alpha)\) の元について \(g(\alpha)\) と\(h(\alpha)\) の2通りの表し方があったとする。つまり、
 \(g(\alpha)=h(\alpha)\)
 \(g(\alpha)-h(\alpha)=0\)
とする。\(g(x)-h(x)\) が1次式以上だと仮定すると、\(n-1\)次以下の方程式 \(g(x)-h(x)=0\) が \(\alpha\) を解にもつことになる。つまり \(f(x)=0\) と \(g(x)-h(x)=0\) は共通の解 \(\alpha\) を持つ。一方、\(f(x)\) は \(n\)次既約多項式であり、\(g(x)-h(x)\) は \(n-1\) 次以下の多項式である。この場合、既約多項式の定理231E)によって、方程式 \(f(x)=0\) と \(g(x)-h(x)=0\) は共通の解を持たない。従って矛盾が生じる。つまり \(g(x)-h(x)\) は1次式以上ではありえない。\(g(x)-h(x)\) は \(0\)次多項式=定数である。

\(g(x)-h(x)\) が定数であれば、\(g(\alpha)-h(\alpha)=0\) なので、その定数は \(0\) しかない。つまり \(g(x)\) と \(h(x)\) の係数は全く一致する。従って表現は一意である。[証明終]



単拡大定理32B)と、この単拡大の体の定理(32C)を合わせると、

代数拡大体のすべて元は、ある代数的数 \(\alpha\) の多項式で一意に表せる

ことになります。このことは、分子\(\cdot\)分母が \(\alpha\) の多項式である分数式があったとしても、分数を取り払った \(\alpha\) の多項式に変換できることを意味します。1.2 節の「方程式の解を含む体」で触れた "分母の有理化" が、どんなに複雑な分母であっても常に可能であることが分かります。

「3.2 体」終わり 
「3.多項式と体」は次回に続く


nice!(0) 

No.354 - 高校数学で理解するガロア理論(1) [科学]

\(\newcommand{\bs}[1]{\boldsymbol{#1}}
\newcommand{\mr}[1]{\mathrm{#1}}
\newcommand{\br}[1]{\textbf{#1}}
\newcommand{\ol}[1]{\overline{#1}}\)
今までに「高校数学で理解する ・・・・・・」と題した記事を何回か書きました。


の7つの記事です。「高校数学で理解する」という言葉の意味は、「高校までで習う数学の知識をベースに説明する」ということです。今回はそのシリーズの続編で、ガロア理論をテーマにします。その第1回目です。

ここで言う「ガロア理論」とは、

方程式の解が四則演算記号と \(n\)乗根の記号(\(\sqrt[n]{a}\))で表現できる(=方程式が "解ける")ための必要十分条件を示す理論

とし、その範囲に限定します。これが、そもそもの理論の発端であり、19世紀に夭折したフランスの数学者、ガロアが数学史に残した功績でした。

例によって、前提知識は高校までで習う数学に限定し、そこに含まれない定理は全部証明することにします。ただし、複素数と複素平面の知識は前提とします。また集合論の記号(\(\in \:\:\subset \:\:\supset \:\:\cup \:\:\cap \) など)を適時使います。さらに「すべての方程式は複素数の範囲に解をもつ」という "代数学の基本定理" は、証明はしませんが前提です。

以降の記述では、次の3つの本を特に参考にしました。
草場 公邦としくに 『ガロワと方程式』(朝倉書店 1989)
石井 俊全としあき 『ガロア理論の頂を踏む』(ベレ出版 2013)
加藤 文元ふみはる 『ガロア理論 12講』(KADOKAWA 2022)

全体の内容は以下です。「高校の数学に含まれない定理は全部証明する」方針なので、証明の完結までにはかなりの論証が必要です。そのため、全体は少々長くなります。第1章は、その全体像を俯瞰したもので、第2章からが本論です。


高校数学で理解するガロア理論

(1)           

1.証明の枠組み
 1.1 方程式とその可解性
  ・方程式
  ・方程式の可解性
 1.2 体
  ・体とは
  ・方程式の解を含む体
  ・べき根拡大
 1.3 ガロア群
  ・群の定義
  ・体の自己同型写像
  ・ガロア群の例
  ・可解群
 1.4 可解性の必要十分条件
  ・可解性の必要条件
  ・可解性の十分条件

(2)           

2.整数の群
 2.1 整数
  ・ユークリッドの互除法
  ・1次不定方程式
  ・法による演算
  ・中国剰余定理
 2.2 群
  ・群の定義
  ・整数 \(Z\)
  ・部分群 \(nZ\)
  ・剰余類と剰余群
  ・生成元と巡回群
  ・群の直積
  ・群の同型
 2.3 既約剰余類群
 2.4 有限体 \(F_p\)
  ・\(Z/pZ\) は体
  ・有限体の多項式と方程式
 2.5 既約剰余類群は巡回群
  ・位数
  ・生成元の存在1
  ・生成元の存在2
  ・2のべき乗の既約剰余類群
  ・既約剰余類群の構造

3.多項式と体
 3.1 多項式
  ・不定方程式
  ・既約多項式
    [整数係数の多項式]
    [既約多項式の性質]
  ・最小多項式
 3.2 体
  ・最小分解体
  ・単拡大定理
  ・単拡大の体

(3)           

 3.3 線形空間
  ・線形空間の定義
  ・1次独立と1次従属
  ・基底
  ・次元
  ・単拡大体の基底
  ・拡大次数とその連鎖律
  ・体の一致
  ・代数拡大体の構造

4.一般の群
 4.1 部分群・正規部分群、剰余類・剰余群
  ・部分集合の演算
  ・部分群の定理
    [部分群の十分条件]
    [部分群の元の条件]
    [部分群の共通部分]
  ・剰余類
  ・正規部分群
  ・剰余群
  ・部分群と正規部分群
 4.2 準同型写像
  ・準同型写像と同型写像
  ・準同型写像の像と核
  ・核が単位元なら単射
  ・核は正規部分群
 4.3 同型定理
  ・準同型定理=第1同型定理
  ・第2同型定理

5.ガロア群とガロア対応
 5.1 体の同型写像
  ・同型写像の定義
  ・同型写像と有理式の順序交換
  ・同型写像は解を共役な元に移す
  ・同型写像は解を入れ替える
  ・単拡大体の同型写像の存在
  ・単拡大体の同型写像は n個
  ・同型写像の延長
 5.2 ガロア拡大とガロア群
  ・ガロア拡大
  ・最小分解体の次数=ガロア群の位数
  ・中間体
 5.3 ガロア対応
  ・固定体と固定群
  ・ガロア対応の定理
  ・正規性定理

(4)           

6.可解性の必要条件
 6.1 可解群
 6.2 巡回拡大
  ・巡回拡大
  ・累巡回拡大
  ・累巡回拡大ガロア群の可解性
 6.3 原始n乗根を含む体とべき根拡大
  ・1 の原始n乗根
  ・\(\bs{Q}(\zeta )\)のガロア群
  ・円分拡大は累巡回拡大
  ・べき根拡大
  ・1 の原始n乗根を含むべき根拡大
 6.4 可解性の必要条件
  ・ガロア閉包
  ・可解性の必要条件
 6.5 5次方程式の解の公式はない
  ・対称群 \(S_n\)
    [巡回置換]
  ・交代群 \(A_n\)
  ・対称群の可解性
  ・一般5次方程式
 6.6 可解ではない5次方程式
  ・コーシーの定理
  ・可解ではない5次方程式

(5)           

7.可解性の十分条件
 7.1 1の原始n乗根
 7.2 べき根拡大の十分条件のため補題
  ・補題(1)
  ・補題(2)
 7.3 べき根拡大の十分条件
 7.4 べき根拡大と巡回拡大の同値性
 7.5 可解性の十分条件
 7.6 位数2の巡回拡大は平方根拡大
     :正5角形が作図できる理由
  ・\(x^5-1=0\)
  ・\(x^{17}-1=0\)
  ・作図可能の原理
 7.7 巡回拡大はべき根拡大
     :3次方程式が解ける理由
  ・3次方程式のガロア群
  ・\(C_3 : x^3-3x+1\)
  ・\(S_3 : x^3+px+q\)

(6)           

 7.8 可解な5次方程式
  ・\(x^5-2\) のガロア群
  ・\(x^5+11x-44\)

8.結論

定義・定理一覧


 
1.証明の枠組み 
 

方程式が解けるための必要十分条件の導出は、そこに至るためにかなり長いステップの証明が必要で、論理に論理を積み重ねる必要があります。そこでまず第1章で、証明の枠組みがどうなっているか、全体のアウトラインを説明します。

これは証明そのものではないし、数学的に曖昧なところもあります。しかし、ガロア理論の理解の道筋を示す意味で、2章からの本論の理解の助けになると思います。


1.1 方程式とその可解性


方程式
\(f(x)\) を、有理数を係数にもつ1変数の \(n\)次多項式とします。有理数の集合を \(\bs{Q}\) で表すので、
 \(f(x)=a_nx^n+a_{n-1}x^{n-1}+\:\cdots \:+a_1x+a_0\)
  \((\:a_n\neq 0,\:a_i\in \bs{Q}\:)\)
と定義できます。以降のガロア理論で問題にする \(n\)次方程式とは、
 \(f(x)=0\)
で表されるものです。これを \(\bs{\bs{Q}}\) 上の(=係数が有理数の)\(n\)次方程式といいます。

代数学の基本定理によると、複素数係数の方程式は複素数の集合 \(\bs{C}\) の中に必ず解をもちます。もちろん、有理数係数の方程式も複素数の集合 \(\bs{C}\) の中に解を持ちます。

有理数係数の方程式の解となる数を代数的数と呼びます。実数や複素数には代数的数でない数があり、たとえば円周率 \(\pi \) や、自然対数の底 \(e\) が有名です。

方程式の可解性
方程式の解が四則演算とべき根(\(\sqrt[n]{a}\))の組み合わせで記述できるとき、その方程式は、
 ・代数的に解ける
 ・代数的解法がある
 ・可解である
と言います(同じ意味です)。べき根(冪根)は累乗根ともいいます。

まず大切なところですが、べき根の定義を明確にしておきます。
 \(\sqrt[n]{a}\:\:(\:a\in \bs{C}\:)\)
とは \(n\) 乗して \(a\) になる数の意味ですが、\(a\) が正の実数の場合、「\(\sqrt[n]{a}\) は \(n\) 乗して \(a\) になる数のうちの正の実数を表わす」とします。

そして \(a\) が正の実数以外の、負の実数や複素数の場合は「\(\sqrt[n]{a}\) は \(n\) 乗して \(a\) になる数のうちのどれかを表わす」とします。"どれか" とするのは、\(n\) 乗して \(a\) になる複数の数を区別する方法がないからです。たとえば \(\sqrt{-1}\) は「2乗して \(-1\) になる2つの数のどちらか」であり、その一方を \(i\) と書くと、もう一方が \(-i\) です。2つの数のどちらが \(i\) かを決めることはできません。複素平面で上の方が \(i\) のように見えますが、それは話が逆で、\(i\) とした方を上に書くのが複素平面です。

従って、方程式の解をべき根で書くときには注意が必要です。たとえば仮想的な例ですが、
 \(\sqrt[3]{p}\:+\:\sqrt[3]{q}\)
という記述があったとき、3乗すると \(p,\:q\) になる数のどれでもよい場合もあります。3乗して特定の数になる数は基本的に3つあるので、3\(\times \)3=9種 のどれでもよい場合もあります。しかし、たとえば、
 \(\sqrt[3]{p}\cdot \sqrt[3]{q}=r\) であること
といった付帯条件が付いている(付ける必要がある)場合もある。そうすると \(p,\:q\) の選び方には制約が出てきます。べき根が複数の中の何を指すのか、その選択には注意が必要です。

方程式の可解性に戻りますと、
・ すべての3次方程式は可解
・ すべての4次方程式は可解
ですが(2次方程式はもちろん可解です)、
・ 5次方程式には(ないしは5次以上の方程式には)可解であるものと可解でないものがある
のです。従って、2次・3次・4次方程式では解の公式、つまり任意の(=係数が変数の)方程式の解を示す公式がありますが、5次以上の方程式には解の公式がありません。

もちろん、可解でない方程式の解が求まらないわけではありません。現代では数値計算ソフトウェアを使って、いくらでも詳しい精度で解を求めることができます。ただ、その解が四則演算とべき根では表せないと言っているのです。

べき根 \(\sqrt[n]{a}\) は \(n\)乗の逆関数です。方程式が \(\bs{n}\)乗の組み合わせでできているのに、解が \(\bs{n}\)乗の逆関数で表現できない(場合がある)というのは少々不思議ですが、数の世界はそうなっているのです。

それでは、方程式がどういう条件だったら可解で、どういう条件だったら可解でないのか、その必要十分条件は何かが問題になってきます。その必要十分条件を示したのがガロア理論です。


1.2 体


体とは
ガロア理論の出発点は、方程式の解の特性を考えるときに「方程式の解を含む体」を考えて、体の性質でもって解の特性を語ることにあります。

(field)とは、加減乗除の四則演算が成り立ち、加法と乗法を結びつける分配則が成り立つ集合です。分配則とは \(a(b+c)=ab+ac\) となることです。
 ・有理数(\(\bs{Q}\) で表す)
 ・実数(\(\bs{R}\) で表す)
 ・複素数(\(\bs{C}\) で表す)
は体で、これらは \(\bs{Q}\:\subset \:\bs{R}\:\subset \:\bs{C}\) の関係にあります。\(\bs{Z}\) で表す整数の集合は体ではありません。除算の結果が有理数になって、整数にはならないからです。一般に、集合の要素同士の演算結果がその集合の要素になるとき、集合はその演算に関して「閉じている」と言います。整数は除算で閉じていません。

\(\bs{Q},\:\bs{R},\:\bs{C}\) はいずれも複素数の集合 \(\bs{C}\) の部分集合であり、これらを数体と呼びます。\(\bs{C}\) は四則演算と分配則が成り立つので、その部分集合は四則演算ができて分配則が成り立ちます。従って、部分集合が体(=数体)である条件は、四則演算で閉じていることです。

数体はこの3つだけではありません。ガロア理論で問題にするのは、方程式の解を含む体です。

方程式の解を含む体
有理数係数の \(n\)次方程式 \(f(x)=0\) の一つの解を\(\alpha \:(\alpha \notin \bs{Q})\) とするとき、\(\bs{Q}\) と \(\alpha \)を含む最小の集合で体の定義を満たすものを \(\bs{Q}(\alpha )\) と書きます。これは、有理数と \(\bs{\alpha }\) の四則演算で作り出せるすべの数の集合です。四則演算は何回繰り返してもかまいません。

\(\bs{Q}(\alpha )\) を \(\bs{Q}\) の拡大体といい、「\(\bs{Q}\) に \(\alpha \) を添加した(ないしは付加した)体」ということもあります。\(\alpha \) は代数的数なので、\(\bs{Q}\) の代数拡大体ともいいます。\(\bs{Q}\) から \(\bs{Q}(\alpha )\) へは、体の拡大をしたことになり、集合の包括関係は \(\bs{Q}\:\subset \:\bs{Q}(\alpha )\) です。この拡大のことを \(\bs{Q}(\alpha )/\bs{Q}\) と書きます。「拡大体\(/\)元の体」の形です。

当然、\(\bs{Q}\) に複数の代数的数を付加した体も考えられて、
 \(\bs{Q}(\alpha ,\:\beta ,\:\gamma ,\:\cdots )\)
というように書きます。\(\alpha ,\:\beta ,\:\gamma ,\:\cdots \) が違った方程式の解であってもかまいません。

例として \(x^2-2=0\) の解での一つである \(\sqrt{2}\) を付加した \(\bs{Q}(\sqrt{2})\) を考えます。この体の任意の数 \(x\) は、
 \(x=a+b\sqrt{2}\:\:(a,b\in \bs{Q})\)
で表されます。この表現は四則演算で閉じています。加算・減算・乗算で閉じているのはすぐにわかります。また除算でも閉じています。というのも、分母の有理化のテクニックを使うと、
 \(\dfrac{1}{a+b\sqrt{2}}=\dfrac{a}{a^2-2b^2}-\dfrac{b}{a^2-2b^2}\sqrt{2}\)
となって、\(a+b\sqrt{2}\) の形になるからです。従って、乗算で閉じているので除算でも閉じていることになります。上の有理化は方程式の解を一つだけ添加した体の場合ですが、複数の解を添加した体でも有理化は常に可能です。このことは別途きっちりと証明します。

べき根拡大
\(\bs{Q}\:\subset \:\bs{Q}(\sqrt{2})\) という体の拡大を一般化します。\(\bs{Q}\) 上の \(n\)次方程式、
 \(x^n-a=0\:\:(a\in \bs{Q})\)
の解の一つで、\(\bs{Q}\) に属さないものを \(\alpha \) としたとき、
 \(\bs{Q}(\alpha )\)
を \(\bs{Q}\) のべき根拡大体といい、\(\bs{Q}\) から \(\bs{Q}(\alpha )\) を作ることをべき根拡大といいます。さらにもっと一般化して、体 \(\bs{F}\) があったとき、\(\bs{F}\) 上の(=\(\bs{F}\) 係数の)\(n\)次方程式、
 \(x^n-a=0\:\:(a\in \bs{F})\)
の解の一つで、\(\bs{F}\) に属さないものを \(\alpha \) としたとき、
 \(\bs{F}(\alpha )\)
が \(\bs{F}\) のべき根拡大体です。

ここで、ある代数的数 \(\alpha \) を、
 \(\alpha =\sqrt{3+\sqrt{2}}\)
とします。これは四則演算とべき根で表現された代数的数です。これを変形すると、
 \(\alpha ^2-3=\sqrt{2}\)
 \(\alpha ^4-6\alpha ^2+7=0\)
となるので、\(\alpha \) は方程式
 \(x^4-6x^2+7=0\)
という4次方程式の解の一つです。そこで、
 \(\bs{Q}\:\subset \:\bs{Q}(\sqrt{3+\sqrt{2}})\)
という体の拡大を考えたとき、この拡大は、
・ \(\bs{Q}\) 上の方程式 \(x^2-2=0\) の解 \(\sqrt{2}\) を \(\bs{Q}\) に付加して体を拡大
・ 次に、\(\bs{\bs{Q}(\sqrt{2})}\) 上の方程式 \(\bs{x^2-(3+\sqrt{2})=0}\) の解 \(\sqrt{3+\sqrt{2}}\) を \(\bs{Q}(\sqrt{2})\) に付加して体を拡大
の、2ステップの拡大と考えることができます。つまり、
 \(\bs{Q}\:\subset \:\bs{Q}(\sqrt{2})\:\subset \:\bs{Q}(\sqrt{2},\:\sqrt{3+\sqrt{2}})\)
という体の拡大です。そうすると各ステップが、\(x^n-a=0\) というタイプの方程式の解による体の拡大=べき根拡大になります。つまり「べき根拡大の系列」ができます。このことを一般化していうと、

方程式 \(f(x)=0\) の解の一つを \(\alpha \) とするとき、\(\alpha \) が四則演算とべき根で書けるなら、\(\bs{Q}\) から始まって \(\bs{Q}(\alpha \))に到達する「べき根拡大の系列」が存在する

となります。ガロア理論では、\(\bs{Q}\) 上の \(n\)次方程式 \(f(x)=0\) の解のすべてを \(\bs{Q}\) に添加した体を考えます。それを \(\bs{Q}\) のガロア拡大体といいます。つまり、\(f(x)=0\) の解を \(\alpha _1,\:\alpha _2,\:\cdots \:,\alpha _n\) とするとき、\(\bs{Q}(\alpha _1,\:\alpha _2,\:\cdots \:,\alpha _n)\) です。この記法を使うと、

\(\bs{Q}\) 上の \(n\)次方程式 \(f(x)=0\) の解を \(\alpha _1,\:\alpha _2,\:\cdots \:,\alpha _n\) とするとき、\(\bs{Q}\) から始まって \(\bs{Q}(\alpha _1,\:\cdots \:,\alpha _n)\) に到達する「べき根拡大の系列」が存在するなら、\(f(x)=0\) は可解である

と言えるわけです。式で書くと、
 \(\bs{F}_0=\bs{Q},\:\:\bs{F}_k=\bs{Q}(\alpha _1,\:\cdots \:,\alpha _n)\)
として、
\(\bs{Q}=\bs{F}_0\:\subset\)\( \:\bs{F}_1\:\subset\)\( \:\bs{F}_2\:\subset\)\( \:\cdots \:\subset\)\( \:\bs{F}_k=\bs{Q}(\alpha _1,\:\cdots \:,\alpha _n)\)
であり、かつ、
各ステップの拡大 \(\bs{F}_{i+1}/\bs{F}_i\) が全部べき根拡大
の条件が成立するとき、\(f(x)=0\) は可解です。これが成り立つのはどういう場合なのか、その条件を、\(\bs{Q}(\alpha _1,\:\cdots \:,\alpha _n)\) というガロア拡大体に "背後霊" のように付帯している "群"(=ガロア群)の性質で説明するのがガロア理論です。


1.3 ガロア群


そのガロア群を説明するために、まず(group)とは何か、その定義を明確にしておきます。

群の定義

集合 \(G\) が次の ① ~ ④ を満たすとき、\(G\) は群であると言う。

① \(G\) の任意の元 \(x,\:y\) に対して演算(\(\cdot \)で表す)が定義されていて、\(x\cdot y\in G\) である。

② 演算について結合法則が成り立つ。つまり、
 \((x\cdot y)\cdot z=x\cdot (y\cdot z)\)

③ \(G\) の任意の元 \(x\) に対して
 \(x\cdot e=e\cdot x=x\)
を満たす元 \(e\) が存在する。\(e\) を単位元という。

④ \(G\) の任意の元 \(x\) に対して
 \(x\cdot y=y\cdot x=e\)
となる元 \(y\) が存在する。\(y\) を \(x\) の逆元といい、\(x^{-1}\) と表す。


たとえば、有理数の集合 \(\bs{Q}\) は、加法という演算に関して群になります。単位元は \(0\) で、\(a\) の逆元は \(-a\) です。また、有理数の集合から \(0\) を除いた集合は、乗法という演算で群になります。単位元は \(1\) で、\(a\) の逆元は \(a^{-1}\) です。これらは無限個の元をもつ無限群であり、また \(ab=ba\) が成り立つ可換群アーベル群とも言う)です。

元の数が有限個の有限群もあります。たとえば、裏表のある正3角形を、もとの形と重なるように回転移動する、ないしは対称軸で折り返すという "操作" は群になります。頂点に番号を付け、時計回りに \(1,\:2,\:3\) とします。この操作は6個あって、それに \(e\)、\(\sigma \)(シグマ)、\(\tau \)(タウ)の記号をつけて列挙すると、
① 何もしない \(=\:e\)
② 反時計回りに \(120^\circ \)回転する \(=\:\sigma _1\)
③ 反時計回りに \(240^\circ \)回転する \(=\:\sigma _2\)
④ 頂点 \(1\) を通る対称軸で折り返す \(=\:\tau _1\)
⑤ 頂点 \(2\) を通る対称軸で折り返す \(=\:\tau _2\)
⑥ 頂点 \(3\) を通る対称軸で折り返す \(=\:\tau _3\)
となります。「時計回りに \(120^\circ \)回転する」のは「反時計回りに \(240^\circ \)回転する」のと頂点番号が同じになるので \(\sigma _2\) と同じものとします。「時計回りに \(240^\circ \)回転する」も同様です。

D3.jpg

そこで、集合 \(G\) を、
 \(G=\{e,\:\sigma _1,\:\sigma _2,\:\tau _1,\:\tau _2,\:\tau _3\:\}\)
とすると、この集合は「操作を続けてやるという演算」で群になります。なぜなら、
① 操作を続けてやっても元の配置と重なるのは間違いないので、演算で閉じている。
② 単位元 \(e\) がある。
③ 逆元がある。つまり、
  \(\sigma _2\sigma _1=\sigma _1\sigma _2=e\)
   : \(360^\circ \)回転すると元に戻る
  \(\tau _1\tau _1=e,\:\tau _2\tau _2=e,\:\tau _3\tau _3=e\)
   : 2回折り返すと元に戻る
が成り立つからです。\(G\) は有限群です。有限群に含まれる元の数を、群の位数と呼び、\(|G|\) または \(\#G\) で表します。

この \(G\) は可換群ではありません。\(\tau _i\) がからむ演算を実際にやってみると、
 \(\tau _1\sigma _1=\tau _2,\:\:\sigma _1\tau _1=\tau _3\)
 \(\tau _2\tau _1=\sigma _2,\:\:\tau _1\tau _2=\sigma _1\)
などとなり、演算順序を変えると結果が違ってきます(演算は右を先に行う)。この群では \(\sigma _1\) と \(\sigma _2\) の演算だけが可換です。

正3角形を対称移動する操作の群は、結局、\(1,\:2,\:3\) という3つの文字を置き換える(=置換する)操作と同じです。この置換の数は3文字の順列なので \(3\:!\) 個です。従って、
 \(e\) \(:\:1\:2\:3\:\longmapsto \:1\:2\:3\)
 \(\sigma _1\) \(:\:1\:2\:3\:\longmapsto \:2\:3\:1\)
 \(\sigma _2\) \(:\:1\:2\:3\:\longmapsto \:3\:1\:2\)
 \(\tau _1\) \(:\:1\:2\:3\:\longmapsto \:1\:3\:2\)
 \(\tau _2\) \(:\:1\:2\:3\:\longmapsto \:3\:2\:1\)
 \(\tau _3\) \(:\:1\:2\:3\:\longmapsto \:2\:1\:3\)
という対応関係がつきます。\(G\) をこのような文字の置き換えととらえるとき、置換群といいます。一方、正3角形の対称移動ととらえたときは(3次の)2面体群です。"2面体" というのは、裏表がある、裏返せるという意味です。

体の自己同型写像
ガロア群とは「体の自己同型写像がつくる群」です。まず、自己同型写像(automorphism)の定義をします。次において、体 \(\bs{F}\) は \(\bs{Q}\) の代数拡大体とします。


体 \(\bs{F}\) から 体 \(\bs{F}\) への写像(=自分自身への写像)\(f\) が1対1写像であり、\(\bs{F}\) の任意の元、\(x,\:y\) に対して、
\(\begin{eqnarray}
&&\:\:f(x+y)&=f(x)+f(y)\\
&&\:\:f(x-y)&=f(x)-f(y)\\
&&\:\:f(xy)&=f(x)f(y)\\
&&\:\:f\left(\dfrac{x}{y}\right)&=\dfrac{f(x)}{f(y)}\\
\end{eqnarray}\)
が成り立つとき、\(f\) を体 \(\bs{F}\) の自己同型写像という。

体 \(\bs{F}\) の部分集合である有理数体 \(\bs{Q}\) の元、\(a\) に対しては、
 \(f(a)=a\)
である。つまり、有理数は自己同型写像で不変である。


この定義でわかるように、自己同型写像とは、四則演算してから写像しても、写像してから四則演算しても同じになる写像です。このことを簡潔に、四則演算を保存する写像と表現します。なお、定義にある「1対1写像」とは、
・ \(x\neq y\) なら \(f(x)\neq f(y)\)
・ 任意の \(y\) について \(f(x)=y\) となる \(x\) がある
の2条件を満たす写像です。この定義の「有理数は自己同型写像で不変」のところは次のように証明できます。

\(f(x+y)=f(x)+f(y)\) において \(x=0,\:y=0\) とすると、
 \(f(0+0)=f(0)+f(0)\)
 \(f(0)=f(0)+f(0)\)
なので、
 \(f(0)=0\)
です。また、\(f(xy)=f(x)f(y)\) において \(x=1,\:y=1\) とすると、
 \(f(1\cdot 1)=f(1)f(1)\)
 \(f(1)=f(1)f(1)\)
となり、\(f(1)=0\) か \(f(1)=1\) です。しかし \(f(1)=0\) とすると \(f(0)=0\) かつ \(f(1)=0\) となってしまい、\(f\) が「1対1写像である」という定義に反します。従って、
 \(f(1)=1\)
です。次に、\(n\) を整数とすると、
\(\begin{eqnarray}
&&\:\:f(n)&=f(\:\overbrace{1+1+\cdots +1}^{1をn 個加算}\:)\\
&&&=f(1)+f(1)+\cdots +f(1)\\
&&&=nf(1)=n\\
\end{eqnarray}\)
なので、
 \(f(n)=n\)
です。任意の有理数 \(a\) は、2つの整数 \(n(\neq 0),\:m\) を用いて、
 \(a=\dfrac{m}{n}\)
と表されるので、
\(\begin{eqnarray}
&&\:\:f(a)&=f\left(\dfrac{m}{n}\right)=\dfrac{f(m)}{f(n)}=\dfrac{m}{n}\\
&&&=a\\
\end{eqnarray}\)
となり、有理数は自己同型写像で不変である(=自己同型写像は有理数を固定する)ことがわかります。

どんな体においても恒等写像 \(e\) は常に自己同型写像です。従って「すべての自己同型写像が有理数に対しては恒等写像として働く」ということは、「有理数体 \(\bs{Q}\) の自己同型写像は恒等写像 \(e\) しかない」ことになります。

しかし、\(\bs{Q}\) の代数拡大体 \(\bs{F}\) については、\(e\) を含む複数個の自己同型写像があります。そして、この複数個の自己同型写像の集合は群になり、それがガロア群です。具体的な例で説明します。

ガロア群の例
 \(x^2-2=0\) 

上で説明したように、この方程式に対応したガロア拡大体は \(\bs{Q}(\sqrt{2})\) であり、 \(\bs{Q}(\sqrt{2})\) の任意の元 \(x\) は、
 \(x=a+b\sqrt{2}\:\:(a,b\in \bs{Q})\)
と表せます。ここで写像 \(\sigma \) を「\(\sqrt{2}\) を \(-\sqrt{2}\) に置き換える写像」つまり、
 \(\sigma \::\:\sqrt{2}\:\longmapsto \:-\sqrt{2}\)
と定義します。これを、
 \(\sigma (\sqrt{2})=-\sqrt{2}\)
と表記します。この定義によって \(\sigma \) は \(\bs{Q}(\sqrt{2})\) の自己同型写像になります。

そのことを確認しますが、記述を見やすくするため \(a,\:b\) を変数ではなく具体的な数値で書きます。もちろん、一般性を失わないようにする前提です。
\(\begin{eqnarray}
&&\:\:x&=2+3\sqrt{2}\\
&&\:\:y&=5-4\sqrt{2}\\
\end{eqnarray}\)
とすると、
\(\begin{eqnarray}
&&\:\:\sigma (x+y)&=\sigma (7-\sqrt{2})=7+\sqrt{2}\\
&&\:\:\sigma (x)+\sigma (y)&=(2-3\sqrt{2})+(5+4\sqrt{2})\\
&&&=7+\sqrt{2}\\
\end{eqnarray}\)
なので、\(\sigma \)は加算を保存しています。減算についても同じです。また、
 \(\sigma (xy)\)
  \(=\sigma (2\cdot 5-3\cdot 4\cdot 2+3\cdot 5\sqrt{2}-2\cdot 4\sqrt{2})\)
  \(=\sigma (-14+7\sqrt{2})\)
  \(=-14-7\sqrt{2}\)
 \(\sigma (x)\sigma (y)\)
  \(=(2-3\sqrt{2})(5+4\sqrt{2})\)
  \(=2\cdot 5-3\cdot 4\cdot 2-3\cdot 5\sqrt{2}+2\cdot 4\sqrt{2}\)
  \(=-14-7\sqrt{2}\)
なので、\(\sigma \) は乗算を保存します。さらに、
\(\begin{eqnarray}
&&\:\:\dfrac{x}{y}&=\dfrac{2+3\sqrt{2}}{5-4\sqrt{2}}\\
&&&=\dfrac{(2+3\sqrt{2})(5+4\sqrt{2})}{(5-4\sqrt{2})(5+4\sqrt{2})}\\
&&&=\dfrac{10+24+(8+15)\sqrt{2}}{25-32}\\
&&&=-\dfrac{34}{7}-\dfrac{23}{7}\sqrt{2}\\
\end{eqnarray}\)
なので、
 \(\sigma \left(\dfrac{x}{y}\right)=-\dfrac{34}{7}+\dfrac{23}{7}\sqrt{2}\)
です。一方、
\(\begin{eqnarray}
&&\:\:\dfrac{\sigma (x)}{\sigma (y)}&=\dfrac{2-3\sqrt{2}}{5+4\sqrt{2}}\\
&&&=\dfrac{(2-3\sqrt{2})(5-4\sqrt{2})}{(5+4\sqrt{2})(5-4\sqrt{2})}\\
&&&=\dfrac{10+24+(8+15)\sqrt{2}}{25-32}\\
&&&=-\dfrac{34}{7}+\dfrac{23}{7}\sqrt{2}\\
\end{eqnarray}\)
です。従って、
 \(\sigma \left(\dfrac{x}{y}\right)=\dfrac{\sigma (x)}{\sigma (y)}\)
となって、除算も保存しています。以上は具体的数値での計算ですが、\(a,\:b\) を変数としても成り立つことは、上の計算プロセスを追ってみると分かります。

このようになる理由は、\(\bs{\sigma }\) が 方程式の解を、解のどれかに置き換える写像だからです。つまり、\(x^2-2=0\) の解は \(\sqrt{2}\) と \(-\sqrt{2}\) ですが、
 \(\sigma (\phantom{-}\sqrt{2})=-\sqrt{2}\)
 \(\sigma (-\sqrt{2})=\phantom{-}\sqrt{2}\)
となります。ここで「解を、解のどれかに置き換える」という表現は「解を自分自身に置き換える」ことも含みます。

このことは、\(x^2-2=0\) という "特別な" 方程式だけでなく、一般の2次方程で成り立ちます。2次方程式、
 \(x^2+px+q=0\)
の解を \(\alpha ,\:\beta \) とし、共に有理数ではないとします(\(\alpha ,\:\beta \notin \bs{Q}\))。\(\bs{Q}\) の代数拡大体、\(\bs{Q}(\alpha ,\beta )\) の自己同型写像を \(\sigma \) とします。\(\alpha \) は、
 \(\alpha ^2+p\alpha +q=0\)
を満たしますが、この式の両辺に対して \(\sigma \) による写像を行うと、
 \(\sigma (\alpha ^2+p\alpha +q)=\sigma (0)\)
 \(\sigma (\alpha )^2+p\sigma (\alpha )+q=0\)
となります。\(\sigma \) は四則演算を保存し、また \(\sigma (0)=0\) だからこうなります。ということは、\(\sigma (\alpha )\) は元の2次方程式の解です。従って、
 \(\sigma (\alpha )=\alpha \)
 \(\sigma (\alpha )=\beta \)
のどちらかです。\(\beta \) についても全く同じことが言えて、
 \(\sigma (\beta )=\beta \)
 \(\sigma (\beta )=\alpha \)
のどちらかです。従って \(\bs{Q}(\alpha ,\beta )\) の自己同型写像 は、
 \(e\)(恒等写像)
 \(\sigma (\alpha )=\beta \) となる写像
の2種類です。ここで、\(\sigma \) を \(\sigma (\alpha )=\beta \) となる写像と規定すると、必然的に \(\sigma (\beta )=\alpha \) になります。なぜなら、もし \(\sigma (\beta )=\beta \) だとすると、\(\sigma (\alpha )=\beta \) かつ \(\sigma (\beta )=\beta \) になり、\(\sigma \) が1対1写像であるという、そもそもの自己同型写像の定義に反するからです。2次方程式の解による代数拡大体の自己同型写像は、恒等写像と「2つの解を入れ替える写像」の2つです。

ここで、自己同型写像 \(e,\:\sigma \) の集合を \(G\) とします。つまり、
 \(G=\{e,\:\sigma \}\)
です。そうすると、\(G\) は群になります。\(e\) という恒等写像があり、
 \(\sigma ^2(\alpha )=\sigma (\sigma (\alpha ))=\sigma (\beta )=\alpha \)
なので、
 \(\sigma ^2=e\)
 \(\sigma ^{-1}=\sigma \)
となって、逆元があるからです。この \(G\) が \(\bs{Q}(\alpha ,\beta )\) のガロア群です。しかもこのガロア群は、\(\sigma \) の(群の要素としての)累乗をとっていくと、
 \(\sigma ,\:\sigma ^2=e,\:\sigma ^3=\sigma ,\:\sigma ^4=e,\:\cdots \)
というように1つの元を出発点として巡回します。このような群を巡回群(cyclic group)といいます。この場合、\(G\) は位数 \(2\) の巡回群です。位数 \(2\) の巡回群を \(C_2\) と表現します。

\(C_2\) は \(\sigma ,\:e,\:\sigma ,\:e,\:\cdots \) と、2つの元が交互に現れるだけなので、"巡回感" が薄いかもしれませんが、位数 \(3\) の巡回群(\(C_3\))になると "巡回してる感" が出てきます。それが次の方程式の例です。

 \(x^3-3x+1=0\) 

x^3-3x+1.jpg
\(y=x^3-3x+1\)
\(f(x)\) を3次多項式、
 \(f(x)=x^3-3x+1\)
とします。
 \(f(\phantom{-}2)\)\(=\phantom{-}3\)
 \(f(\phantom{-}1)\)\(=-1\)
 \(f(\phantom{-}0)\)\(=\phantom{-}1\)
 \(f(-1)\)\(=\phantom{-}3\)
 \(f(-2)\)\(=-1\)
と計算できるので、方程式 \(f(x)=0\) は、\(2\) と \(1\) の間、\(1\) と \(0\) の間、\(-1\) と \(-2\) の間に3つの実数解があります。それを大きい順に \(\alpha ,\:\beta ,\:\gamma \) とします。
 \(\phantom{-}1\)\( < \alpha < \phantom{-}2\)
 \(\phantom{-}0\)\( < \beta < \phantom{-}1\)
 \(-2\)\( < \gamma < -1\)
です。この \(\alpha ,\:\beta ,\:\gamma \) を実際に求めてみます。いずれの解も絶対値が \(2\) より小さいので、\(\theta \) を角度を表す変数として、
 \(x=2\mr{cos}\theta \:\:(0\leq \theta \leq \pi )\)
とおいて \(x\) から \(\theta \) へ変数を変換すると、
 \(f(x)=8\mr{cos}^3\theta -6\mr{cos}\theta +1\)
となります。ここで3倍角の公式、
 \(\mr{cos}3\theta =4\mr{cos}^3\theta -3\mr{cos}\theta \)
を使うと、
 \(f(x)=2\mr{cos}3\theta +1\)
となります。このことから \(f(x)=0\) の解は、
 \(2\mr{cos}3\theta +1=0\)
 \(\mr{cos}3\theta =-\dfrac{1}{2}\:\:(0\leq 3\theta \leq 3\pi )\)
を満たします。従って、
 \(3\theta \)\(=\dfrac{2\pi }{3},\:\dfrac{4\pi }{3},\:\dfrac{8\pi }{3}\)
 \(\theta \)\(=\dfrac{2\pi }{9},\:\dfrac{4\pi }{9},\:\dfrac{8\pi }{9}\)
です。ここから、\(\theta _0=\dfrac{2\pi }{9}\) として、
 \(\alpha =2\mr{cos}\dfrac{2\pi }{9}=2\mr{cos}\theta _0\)
 \(\beta =2\mr{cos}\dfrac{4\pi }{9}=2\mr{cos}2\theta _0\)
 \(\gamma =2\mr{cos}\dfrac{8\pi }{9}=2\mr{cos}4\theta _0\)
        \((\theta _0=\dfrac{2\pi }{9})\)
が求まります。なお、
\(\begin{eqnarray}
&&\:\:\alpha &=2\mr{cos}\dfrac{2\pi }{9}=2\mr{cos}(2\pi -\dfrac{2\pi }{9})\\
&&&=2\mr{cos}\dfrac{16\pi }{9}=2\mr{cos}8\theta _0\\
\end{eqnarray}\)
です。ここで倍角の公式、
 \(\mr{cos}2\theta =2\mr{cos}^2\theta -1\)
を使うと、
\(\begin{eqnarray}
&&\:\:\beta &=2\mr{cos}2\theta _0=2(2\mr{cos}^2\theta _0-1)\\
&&&=4\mr{cos}^2\theta _0-2=\alpha ^2-2\\
\end{eqnarray}\)
となります。同様にして、
\(\begin{eqnarray}
&&\:\:\gamma &=2\mr{cos}4\theta _0=\beta ^2-2\\
&&&=(\alpha ^2-2)^2-2\\
&&\:\:\alpha &=2\mr{cos}8\theta _0=\gamma ^2-2\\
&&&=(\beta ^2-2)^2-2\\
\end{eqnarray}\)
です。また、
\(\begin{eqnarray}
&&\:\:\beta &=\alpha ^2-2\\
&&&=(\gamma ^2-2)^2-2\\
\end{eqnarray}\)
であることも分かります。従って、
 \(\beta =\alpha ^2-2\)
 \(\gamma =\beta ^2-2\)
 \(\alpha =\gamma ^2-2\)
となり、\(\alpha ,\:\beta ,\:\gamma \) のどれか一つの加減乗除で他の2つが表現できることになります。方程式 \(x^3-3x+1=0\) は、3つの解の間に "特別な関係" があります。

ここまで、\(\alpha ,\:\beta ,\:\gamma \) を求めると言っても三角関数で表示しただけであり、四則演算とべき根で表したわけではありません。しかし、\(\alpha ,\:\beta ,\:\gamma \) の "特別な関係" を使ってガロア群を求めることができます。それが次です。



\(\bs{Q}\) に \(x^3-3x+1=0\) の3つの解、\(\alpha ,\:\beta ,\:\gamma \) を添加した代数拡大体 \(\bs{Q}(\alpha ,\beta ,\gamma )\) を調べます。\(\alpha ,\:\beta ,\:\gamma \) のどれか一つの加減乗除で他の2つが表現できるので、
 \(\bs{Q}(\alpha ,\:\beta ,\:\gamma )=\bs{Q}(\alpha )=\bs{Q}(\beta )=\bs{Q}(\gamma )\)
です。以下、\(\bs{Q}(\alpha )\) で語ることにすると、\(\bs{Q}(\alpha )\) の任意の元 \(x\) は、
 \(x=a\alpha ^2+b\alpha +c\:\:(a,b,c\in \bs{Q})\)
という "標準形" で表されます。なぜなら、\(\alpha ^3-3\alpha +1=0\)、つまり\(\alpha ^3=3\alpha -1\) という関係があるので、四則演算の結果で現れる \(\alpha ^3\) 以上の項は \(\alpha ^2\) 以下に「次数下げ」ができるからです。

"標準形" で表現できる数が、加算、減算、乗算で閉じていることは明白でしょう。乗算の結果も「次数下げ」で "標準形" になります。除算が問題ですが、例えば、\(x=\alpha ^2+\alpha +1\) の場合(計算過程は省きますが)、
\(\begin{eqnarray}
&&\:\:\dfrac{1}{x}&=\dfrac{1}{\alpha ^2+\alpha +1}\\
&&&=-\dfrac{3}{19}\alpha ^2-\dfrac{2}{19}\alpha +\dfrac{14}{19}\\
\end{eqnarray}\)
というように "分母の有理化" ができるので、除算でも閉じています。この分母の有理化は \(\alpha \) が方程式の解であること、つまり \(\alpha ^3-3\alpha +1=0\) という関係だけをもとにしています。もちろん、\(x=a\alpha ^2+b\alpha +c\) という任意の数で分母の有理化が可能です(ややこしい式になりますが)。このように \(\bs{Q}(\alpha )=\bs{Q}(\alpha ,\:\beta ,\:\gamma )\) は体の定義を満たすことが確認できました。



次に \(\bs{Q}(\alpha ,\beta ,\gamma )=\bs{Q}(\alpha )\) の自己同型写像を調べます。自己同型写像は、方程式の解を、解のどれかに移します。そこで \(\alpha \) に作用する自己同型写像を考えると、これには3つあります。
 \(\sigma _0(\alpha )=\alpha \)
 \(\sigma _1(\alpha )=\beta \)
 \(\sigma _2(\alpha )=\gamma \)
の \(\sigma _0,\:\sigma _1,\:\sigma _2\) です。\(\sigma _1\) は、\(\beta =\alpha ^2-2\) なので、
 \(\sigma _1(\alpha )=\alpha ^2-2\)
であり、\(\alpha \) を \(\alpha ^2-2\) に置き換える写像です。

ここで \(\alpha \) に \(\sigma _1\) を2回作用させると、
\(\begin{eqnarray}
&&\:\:\sigma _1^{\:2}(\alpha )&=\sigma _1(\sigma _1(\alpha ))\\
&&&=\sigma _1(\alpha ^2-2)\\
&&&=\sigma _1(\alpha )^2-\sigma _1(2)\\
&&&=\beta ^2-2=\gamma \\
\end{eqnarray}\)
となります。つまり、
\(\begin{eqnarray}
&&\:\:\sigma _2(\alpha )&=\gamma \\
&&\:\:\sigma _1^{\:2}(\alpha )&=\gamma \\
\end{eqnarray}\)
なので、
 \(\sigma _1^{\:2}=\sigma _2\)
であることが分かります。

次に、\(\sigma _1\) を \(\beta \) に作用させてみると、
\(\begin{eqnarray}
&&\:\:\sigma _1(\beta )&=\sigma _1(\sigma _1(\alpha ))\\
&&&=\sigma _1^{\:2}(\alpha )\\
&&&=\sigma _2(\alpha )=\gamma \\
\end{eqnarray}\)
となります。また \(\sigma _1\) を \(\gamma \) に作用させると、
\(\begin{eqnarray}
&&\:\:\sigma _1(\gamma )&=\sigma _1(\beta ^2-2)\\
&&&=\sigma _1(\beta )^2-\sigma _1(2)\\
&&&=\gamma ^2-2=\alpha \\
\end{eqnarray}\)
となります。

\(\sigma _2\) についても同様の計算をしてみると、
\(\begin{eqnarray}
&&\:\:\sigma _2(\beta )&=\sigma _1^{\:2}(\beta )\\
&&&=\sigma _1(\sigma _1(\beta ))\\
&&&=\sigma _1(\gamma )=\alpha \\
&&\:\:\sigma _2(\gamma )&=\sigma _1^{\:2}(\gamma )\\
&&&=\sigma _1(\sigma _1(\gamma ))\\
&&&=\sigma _1(\alpha )=\beta \\
\end{eqnarray}\)
です。

さらに、\(\sigma _0(\alpha )=\alpha \) である \(\sigma _0\) については、\(\beta \) と \(\gamma \) が \(\alpha \) の式で表されているので \(\sigma _0(\beta )=\beta \)、\(\sigma _0(\gamma )=\gamma \) であり、また、自己同型写像は有理数を固定するので、\(\sigma _0\) は \(\bs{Q}(\alpha ,\beta ,\gamma )\) のすべての元を固定する恒等写像 \(e\) です。

まとめると、\(\bs{Q}(\alpha ,\beta ,\gamma )\) の自己同型写像は、\(e,\:\sigma _1,\:\sigma _2\) の3つになります。この3つは、
 \(e\::\) 恒等写像
 \(\sigma _1(\alpha )=\beta \)、\(\sigma _1(\beta )=\gamma \)、\(\sigma _1(\gamma )=\alpha \)
 \(\sigma _2(\alpha )=\gamma \)、\(\sigma _2(\beta )=\alpha \)、\(\sigma _2(\gamma )=\beta \)
というように、\(x^3-3x+1=0\) の3つの解を入れ替えます。また、
 \(\sigma _1\sigma _2=\sigma _2\sigma _1=e\)
 \(\sigma _1^{-1}=\sigma _2,\:\:\sigma _2^{-1}=\sigma _1\)
であることも分かりました。

解の入れ替えは他に3種が考えられます。つまり一つの解を固定し他の2つを入れ替える写像\(\cdot \)3種ですが、一つの解で他の2つの解が表されているので、一つの解を固定する写像は全部の解を固定します。「一つの解を固定し、他の2つを入れ替える写像」は、この方程式の場合は存在しません。従って、\(\bs{Q}(\alpha ,\beta ,\gamma )\) の自己同型写像は、\(e,\:\sigma _1,\:\sigma _2\) の3つがすべてです。

\(G=\{e,\:\sigma _1,\:\sigma _2\}\) とすると、\(G\) は \(\bs{Q}(\alpha ,\beta ,\gamma )\) のガロア群になります。しかも \(\sigma _2=\sigma _1^{\:2}\)、\(\sigma _2\sigma _1=\sigma _1^{\:3}=e\) の関係があります。ここで \(\sigma _1\) をあらためて \(\sigma \) と書くと、

 \(G=\{e,\:\sigma ,\:\sigma ^2\}\)

が \(\bs{Q}(\alpha ,\beta ,\gamma )\) のガロア群です。\(\sigma \) は、

\(\begin{eqnarray}
&&\:\:\sigma \:: &\alpha \longmapsto \beta \\
&&&\beta \longmapsto \gamma \\
&&&\gamma \longmapsto \alpha \\
\end{eqnarray}\)

で定義される自己同型写像です。

この \(G\) は位数 \(3\) の巡回群(\(C_3\) で表される)です。そして、ガロア群が巡回群であるというのが、方程式が可解であるための条件の一つなのです。



ちなみに、数式処理ソフトウェアを使って \(x^3-3x+1=0\) の解のうちの最大である \(\alpha \) を計算してみると、
 \(\alpha =1.53208888623796\) ・・・
です。一方、3次方程式の根の公式を使って \(\alpha \) の厳密解を求めると、
 \(\alpha =\sqrt[3]{-\dfrac{1}{2}+\dfrac{\sqrt{-3}}{2}}+\sqrt[3]{-\dfrac{1}{2}-\dfrac{\sqrt{-3}}{2}}\)
となります。\(\sqrt{3}\:i\) と書かずにあえて \(\sqrt{-3}\) としました。この式はこれ以上簡略化できないし、また根号の中のマイナスを無くした表現にもできません。

つまり \(\alpha \) は、正真正銘の正の実数であるにもかかわらず、代数的に(=四則演算とべき根で)表そうとすると虚数を登場させざるを得ないわけです。

ただし、3次方程式の実数解のすべてに虚数 \(i\) が登場するわけではありません。3次方程式の実数解は、\(i\) なしで表わされるものと、\(i\) が必須の場合があります。このことは、任意の3次方程式の解を表わす公式には必ず \(\bs{i}\) が含まれることを意味します。

数学史をみると、そもそも虚数の必要性が認識されたのは3次方程式の解の表現からでした。そして、ガロア理論によると \(\bs{\sqrt{-3}=\sqrt{3}\:i}\) が現れるのは必然なのです。その理由はガロア理論の全体を理解することでわかります。



自己同型写像は方程式の解を入れ替えます("入れ替えない" を含む)。一般の3次方程式の場合、この入れ替えは \(3\:!\:=\:6\) 通りあります。解を \(1\:2\:3\) の文字で表すと、
 \(1\:2\:3\) \(\longmapsto \:1\:2\:3\)
\(\longmapsto \:2\:3\:1,\:\:3\:1\:2\)
\(\longmapsto \:1\:3\:2,\:\:3\:2\:1,\:\:2\:1\:3\)
の6通りです。入れ替えない、全部入れ替える(2個)、2つだけを入れ替える(3個)の6通りです。この6つの自己同型写像をもつ方程式の例が次です。

 \(x^3-2=0\) 

この方程式を解くため「\(1\) の原始 \(3\)乗根」を定義します(一般には、\(\bs{1}\) の原始\(\bs{n}\)乗根)。「\(1\) の原始 \(3\)乗根」とは、3乗して初めて \(1\) になる数です。これは \(x^3-1=0\) の根ですが、
 \(x^3-1=(x-1)(x^2+x+1)\)
と因数分解できるので、\(1\) の原始 \(3\)乗根は2次方程式、
 \(x^2+x+1=0\)
の、2つある解の両方です。そのどちらか一方を \(\omega \) とすると \(\omega ^2\) も2次方程式を満たす原始 \(3\)乗根です。\(\omega ,\:\omega ^2\) を具体的に書くと、
 \(\omega \)\(=\dfrac{-1+\sqrt{3}i}{2}\)
 \(\omega ^2\)\(=\dfrac{-1-\sqrt{3}i}{2}\)
です。逆でもかまいません。\(x^3-1=0\) の根は、
 \(1,\:\:\omega ,\:\:\omega ^2\)
です。

x^3-2=0.jpg
\(x^3-2=0\) の根
これを使って方程式 \(x^3-2=0\) を解くと、
 \(x^3-2=0\)
 \(\left(\dfrac{x}{\sqrt[3]{2}}\right)^3=1\)
 \(\dfrac{x}{\sqrt[3]{2}}=1,\:\:\omega ,\:\:\omega ^2\)
 \(x=\sqrt[3]{2},\:\:\sqrt[3]{2}\omega ,\:\:\sqrt[3]{2}\omega ^2\)
と求まります。以降、\(\alpha =\sqrt[3]{2}\) とします。方程式 \(x^3-2=0\) の3つの解は、
 \(\alpha ,\:\:\alpha \omega ,\:\:\alpha \omega ^2\)
であり、これらを含む \(\bs{Q}\) の代数拡大体は、
 \(\bs{Q}(\alpha ,\:\alpha \omega ,\:\alpha \omega ^2)=\bs{Q}(\omega ,\:\alpha )\)
です。この体のガロア群を調べます。

まず、写像 \(\tau \) を、
 \(\tau (\omega )=\omega ^2,\:\:\tau (\alpha )=\alpha \)
で定義される写像とします。この \(\tau \) は、
 \(\tau (\alpha \omega )=\alpha \tau (\omega )=\alpha \omega ^2\)
 \(\tau (\alpha \omega ^2)=\alpha \tau (\omega ^2)=\alpha \omega ^4=\alpha \omega \)
と、\(\alpha \omega \) と \(\alpha \omega ^2\) を入れ替える自己同型写像です。\(\tau ^2=e\) なので、
 \(\{e,\:\tau \}\)
は位数 \(2\) の巡回群(\(C_2\))です。

次に、写像 \(\sigma \) を、
 \(\sigma _i(\alpha )=\alpha \omega ^i\:\:(i=0,1,2)\)
 \(\sigma _i(\omega )=\omega \)
と定義します。すると、
 \(\sigma _0(\alpha )\)\(=\alpha \)
 \(\sigma _0(\alpha \omega )\)\(=\alpha \omega \)
 \(\sigma _0(\alpha \omega ^2)\)\(=\alpha \omega ^2\)
 \(\sigma _1(\alpha )\)\(=\alpha \omega \)
 \(\sigma _1(\alpha \omega )\)\(=\alpha \omega ^2\)
 \(\sigma _1(\alpha \omega ^2)\)\(=\alpha \omega ^3=\alpha \)
 \(\sigma _2(\alpha )\)\(=\alpha \omega ^2\)
 \(\sigma _2(\alpha \omega )\)\(=\alpha \omega ^3=\alpha \)
 \(\sigma _2(\alpha \omega ^2)\)\(=\alpha \omega ^4=\alpha \omega \)
となって、\(\sigma _i\) は解を、3つの解のどれかに移す写像です。また、
 \(\sigma _1^{\:2}=\sigma _2\)
 \(\sigma _1^{\:3}=\sigma _0\)
であることもわかります。\(\sigma _0\) は恒等写像です。改めて、
 \(\sigma _0=e\)
 \(\sigma _1=\sigma \)
と書くと、
 \(\sigma _i=\{e,\:\sigma ,\:\sigma ^2\}\)
であり、これは位数 \(3\) の巡回群(\(C_3\))です。



次に \(\{e,\:\tau \}\) の上に \(\{e,\:\sigma ,\:\sigma ^2\}\) を組み合わせた集合、\(G\) を、
\(\begin{eqnarray}
&&\:\:G&=\{\:\{e,\:\sigma ,\:\sigma ^2\}e,\:\{e,\:\sigma ,\:\sigma ^2\}\tau \}\\
&&&=\{e,\:\sigma ,\:\sigma ^2,\:\tau ,\:\sigma \tau ,\:\sigma ^2\tau \}\\
\end{eqnarray}\)
と定義します。\(\sigma \)、\(\tau \) の演算は右から順に行います。この \(G\) には恒等写像=単位元 \(e\) があり、次のように群の条件を満たします。

演算で閉じている
\(G\) は「写像を続けて行う」という演算に関して閉じています。なぜなら、\(\sigma \) も \(\tau \) も3つの解を入れ替える写像であり、いくら続けてやっても3つの解を入れ替えることに変わりないからです。また3つの解を入れ替える写像は最大6つですが、\(G\) の位数は \(6\) であり、要素同士を演算すると \(G\) のどれかになります。

逆元がある
\(\sigma \) と \(\tau \) の定義から
 \(\sigma ^{-1}\)\(=\sigma ^2\)
 \((\sigma ^2)^{-1}\)\(=\sigma \)
 \(\tau ^{-1}\)\(=\tau \)
は明確ですが、\(\sigma \tau ,\:\sigma ^2\tau \) はどうかという問題です。ここで、\(\tau \sigma \) を計算してみると、
 \(\tau \sigma (\alpha )\)\(=\tau (\alpha \omega )\)\(=\alpha \omega ^2\)
 \(\tau \sigma (\alpha \omega )\)\(=\tau (\alpha \omega ^2)\)\(=\alpha \omega ^4=\alpha \omega \)
 \(\tau \sigma (\alpha \omega ^2)\)\(=\tau (\alpha \omega ^3)\)\(=\tau (\alpha )=\alpha \)
となります。実はこれは \(\sigma ^2\tau \) と全く同じ写像です。確かめると、
 \(\sigma ^2\tau (\alpha )\)\(=\sigma ^2(\alpha )=\sigma (\sigma (\alpha ))\)
\(=\sigma (\alpha \omega )=\alpha \omega ^2\)
 \(\sigma ^2\tau (\alpha \omega )\)\(=\sigma ^2(\alpha \omega ^2)=\sigma (\sigma (\alpha \omega ^2))\)
\(=\sigma (\alpha \omega ^3)=\sigma (\alpha )=\alpha \omega \)
 \(\sigma ^2\tau (\alpha \omega ^2)\)\(=\sigma ^2(\alpha \omega ^4)=\sigma ^2(\alpha \omega )\)
\(=\sigma (\sigma (\alpha \omega ))=\sigma (\alpha \omega ^2)\)
\(=\alpha \omega ^3=\alpha \)
となって、全く同じ写像だとわかります。

\(\sigma \) と \(\tau \) は可換ではなく、
 \(\tau \sigma \neq \sigma \tau \)
です。しかし、上の計算で分かるように、
 \(\tau \sigma =\sigma ^2\tau \)
という関係が成り立っています。いわば "弱い可換性" です。これを "弱可換性" と呼ぶことにします(ここだけの用語です)。この弱可換性を使って計算すると、
\(\begin{eqnarray}
&&\:\:(\sigma \tau )(\sigma \tau )&=\sigma (\tau \sigma )\tau =\sigma (\sigma ^2\tau )\tau \\
&&&=\sigma ^3\tau ^2=e\\
&&\:\:(\sigma ^2\tau )(\sigma ^2\tau )&=\sigma ^2(\tau \sigma )(\sigma \tau )\\
&&&=\sigma ^2(\sigma ^2\tau )(\sigma \tau )\\
&&&=\sigma ^4(\tau \sigma )\tau =\sigma ^4(\sigma ^2\tau )\tau \\
&&&=\sigma ^6\tau ^2=e\\
\end{eqnarray}\)
となります。つまり、
\(\begin{eqnarray}
&&\:\:(\sigma \tau )^{-1}&=\sigma \tau \\
&&\:\:(\sigma ^2\tau )^{-1}&=\sigma ^2\tau \\
\end{eqnarray}\)
となって、すべての元の逆元が存在することが分かりました。以上により \(G\) は群であり、方程式 \(x^3-2=0\) の3つの解を含む代数拡大体、\(\bs{Q}(\omega ,\alpha )\:\:(\alpha =\sqrt[3]{2})\) のガロア群は \(G\) です。

\(G\) の元が3つの解をどのように入れ替えるかをまとめます。3つの文字 \(1\:2\:3\) を使って、
 \(1\::\:\alpha \)、 \(2\::\:\alpha \omega \)、 \(3\::\:\alpha \omega ^2\)
とすると、
 \(e\) \(:\:1\:2\:3\:\longmapsto \:1\:2\:3\)
 \(\sigma \) \(:\:1\:2\:3\:\longmapsto \:2\:3\:1\)
 \(\sigma ^2\) \(:\:1\:2\:3\:\longmapsto \:3\:1\:2\)
 \(\tau \) \(:\:1\:2\:3\:\longmapsto \:1\:3\:2\)
 \(\sigma \tau \) \(:\:1\:2\:3\:\longmapsto \:2\:1\:3\)
 \(\sigma ^2\tau \) \(:\:1\:2\:3\:\longmapsto \:3\:2\:1\)
となり、これは正3角形の対称移動の群(3次の2面体群)と同じものです。

しかし重要なことは、\(G\) が \(\{e,\:\tau \}\) と \(\{e,\:\sigma ,\:\sigma ^2\}\) という2つの巡回群の "2階建て構造" になっていることです。"2階建て構造" というのはここだけの言葉で、数学用語ではありません。数学的にきっちりとした定義は別途行います。

実は、方程式の解を含む代数拡大体のガロア群が "巡回群の2階建て構造" のときも、方程式は可解になります。このことをより正確に言うと以下のようになります。

可解群
方程式 \(x^3-2=0\) のガロア群、
 \(G=\{e,\:\sigma ,\:\sigma ^2,\:\tau ,\:\sigma \tau ,\:\sigma ^2\tau \}\)
の性質をさらに調べます。この中の、\(\{e,\:\sigma ,\:\sigma ^2\}\) は、それだけで群を構成しています。つまり \(G\) の部分群(subgroup)です。これに \(H\) という名前をつけて、
 \(H=\{e,\:\sigma ,\:\sigma ^2\}\)
とします。この \(H\) に左から \(\tau \) をかけて \(\tau H\) を作ります。\(\tau H\) とは、\(H\) のすべての元に左から \(\tau \) をかけた集合の意味です。弱可換性である \(\tau \sigma =\sigma ^2\tau \) に注意して \(\tau H\) を計算してみると、
\(\begin{eqnarray}
&&\:\:\tau H&=\{\tau ,\:\tau \sigma ,\:\tau \sigma ^2\}\\
&&&=\{\tau ,\:\sigma ^2\tau ,\:\sigma ^2\tau \sigma \}\\
&&&=\{\tau ,\:\sigma ^2\tau ,\:\sigma ^4\tau \}\\
&&&=\{\tau ,\:\sigma ^2\tau ,\:\sigma \tau \}\\
&&&=\{\tau ,\:\sigma \tau ,\:\sigma ^2\tau \}\\
&&&=H\tau \\
\end{eqnarray}\)
となります。つまり、
 \(\tau H=H\tau \)
です。さらに、この式に左から \(\sigma \) をかけると、
 \(\sigma \tau H=\sigma H\tau \)
ですが、\(H\) のすべての元は \(\sigma \) で表現できるので、\(\sigma H=H\sigma \) です。従って、
 \(\sigma \tau H=H\sigma \tau \)
です。同様にして、
 \(\sigma ^2\tau H=H\sigma ^2\tau \)
も分かります。つまり、

 任意の \(\bs{G}\) の元 \(\bs{x\in G}\) について、\(\bs{xH=Hx}\) が成り立つ

わけです。このような性質をもつ部分群 \(H\) を、\(G\) の正規部分群(normal subgroup)と言います。ちなみに \(\{e,\:\tau \}\) も \(G\) の部分群(=巡回群)ですが、\(\sigma \tau \neq \tau \sigma \) なので、これは \(G\) の正規部分群ではありません。

上の例の場合、\(H\) は巡回群でしたが、\(\{e,\:\tau \}\) がそうであるように、巡回群だからといって正規部分群になるわけではありません。正規部分群はあくまで \(G\)(全体)と \(H\)(部分)の関係性に依存します。正規部分群が巡回群のこともある、というのが正しい認識です。

正規部分群 \(H\) の任意の元 \(h\) は、\(G\) の任意の元 \(x\) と可換ではありません。しかし、\(H\) の別の元 \(h'\) との間で \(xh=h'x\) が成り立ちます。つまり \(H\) は、\(G\) の任意の元とグループとして可換なのです。\(H\) の元は \(G\) の任意の元と弱い可換性がある、ともいえるでしょう。

そこで、方程式の可解性と正規部分群の関係です。\(x^3-2=0\) のガロア群のところで、

方程式の解を含む代数拡大体のガロア群が "巡回群の2階建て構造" のとき、方程式は可解になる

としました。しかしこれは少々曖昧な表現で、正確には、

方程式の解を含む代数拡大体のガロア群が "巡回群と正規部分群の2階建て構造" のときに方程式は可解になる。ただしその正規部分群が巡回群であること

です。そして、上の言い方の最後、「ただしその正規部分群が巡回群であること」の部分は、必ずしも巡回群でなくてもよいのです。つまり、ガロア群が "巡回群と正規部分群Aの2階建て構造" であり、その "正規部分群Aが、巡回群と正規部分群B(=巡回群)の2階建て構造" でもよいのです。いわば、正規部分群を介した巡回群の入れ子構造です。この入れ子の "深さ" は何段階でもかまいません。"正規部分群を介する" のは多段階でもよい。まとめると、

方程式の解を含む代数拡大体のガロア群が、正規部分群を介した "巡回群の入れ子構造" になっているとき、方程式は可解である

わけです。この正規部分群という概念が、ガロア理論の最大のキモです。先ほどの例の正規部分群 \(H=\{e,\:\sigma ,\:\sigma ^2\}\) は巡回群でしたが、一般に正規部分群は巡回群ではありません。そのため、"正規部分群を介した巡回群の入れ子構造" が重要な意味をもつのです。

方程式 \(x^3-3x+1=0\) のところで書いたように、ガロア群が巡回群であれば方程式は可解でした。ここまでのことを踏まえて可解群の定義をすると、

ガロア群が、巡回群か、正規部分群を介した巡回群の入れ子構造のとき、その群を可解群という

となります。可解群とは "ほぼ巡回群" であり、"広義の巡回群" だとも言えるでしょう。巡回群は、一つの元の演算だけで群のすべての元が作り出せるという "最もシンプルな" 群です。可解群は巡回群より広い概念ですが、"かなりシンプルな" 群です。このかなりのシンプルさが方程式の可解性と関わっているのです。

巡回群の入れ子構造.jpg
正規部分群を介した巡回群の入れ子構造

可解群の「正規部分群を介した巡回群の入れ子構造」のイメージを図にしたものである。入れ子の深さは何段階でもよく、最後は正規部分群=巡回群で終わる。数学的には、巡回群 \(C_1\) は、\(C_1=G/H_1\) で定義される剰余群(商群)であり、また \(C_2=H_1/H_2\)、\(C_3=H_2/H_3\) である。各段階で剰余群が巡回群になるのが「入れ子構造」の条件である。

可解群は、方程式とは関係なく、純粋に群の構造として定義できる。ガロア理論では「方程式の解が四則演算とべき根で記述できるか」という問題が、群の構造の議論に置き換えられている。なお、この図はあくまでイメージであり、可解群の正確な定義は別途行う(第6章)。

可解群という概念は、ガロア群とは関係なく純粋に群の特性として定義することが可能です。もちろん可解というネーミングでわかるように、方程式の可解性と直結しています。なお、可解群の数学的に厳密な定義は別途きちっとやります(第6章)。


1.4 可解性の必要十分条件


ガロア理論は、
・ 方程式の解の特性を「方程式の解を含む体の性質」で語る
・ 「方程式の解を含む体の性質」を「体に付随した群=ガロア群の性質」で語る
というものでした。そこに、正規部分群の概念を利用した可解群という概念を持ち込むと、方程式の可解性の必要十分条件が導けます。

可解性の必要条件

\(n\)次方程式 \(f(x)\) の解を\(\alpha _1,\:\alpha _2,\:\cdots \:,\alpha _n\) とし、これらの解を含む \(\bs{Q}\) の代数拡大体を \(\bs{L}=\bs{Q}(\alpha _1,\alpha _2,\:\cdots \:,\alpha _n)\) とする。

もし、\(\bs{Q}\) から始まって \(\bs{L}\) に至る "べき根拡大体" の列、
 \(\bs{Q}=\bs{F}_0\subset \bs{F}_1\subset \bs{F}_2\subset \cdots \subset \bs{F}_m=\bs{L}\)
があるとしたら、\(\bs{L}\) のガロア群は可解群である。


なぜそう言えるのかの証明は、かなりのステップが必要です。それは別途やりますが、ここで重要なのは上の定理の対偶です。上の定理の対偶は、


\(n\)次方程式 \(f(x)=0\) の解を \(\alpha _1,\:\alpha _2,\:\cdots \:,\alpha _n\) とし、これらの解を含む \(\bs{Q}\) の代数拡大体を \(\bs{L}=\bs{Q}(\alpha _1,\alpha _2,\:\cdots \:,\alpha _n)\) とする。

もし、\(\bs{L}\) のガロア群が可解群でなければ、\(\bs{Q}\) から始まって \(\bs{L}\) に至る "べき根拡大体" の列、
 \(\bs{Q}=\bs{F}_0\subset \bs{F}_1\subset \bs{F}_2\subset \cdots \subset \bs{F}_m=\bs{L}\)
は存在しない。


となります。\(\bs{\bs{Q}}\) から始まるべき根拡大の連続で \(\bs{\bs{Q}(\alpha _1,\alpha _2,\:\cdots \:,\alpha _n)}\) に到達できないということは、すなわち \(\bs{\alpha _1,\alpha _2,\:\cdots \:,\alpha _n}\) が四則演算とべき根では表現できないということに他なりません。ガロア群が可解群ということが、方程式が "代数的に解ける" ための必要条件なのです。

2・3・4次方程式のガロア群はすべて可解群ですが、5次方程式のガロア群は可解群であるものとそうでないものがあります。だから5次方程式の解の公式(=あらゆる5次方程式に通用する公式)はないのです。

ここで定義を振り返ってみると、可解群は、巡回群か、正規部分群を介した巡回群の入れ子構造の群でした。方程式の "解ける解けない" が問題になるのは5次方程式です。実は、可解な5次方程式のガロア群は、巡回群か "巡回群と正規部分群(=巡回群)の2階建て" です(そのような5次方程式もかなりのレア・ケースですが)。可解な5次方程式を考える限り、"正規部分群を介した巡回群の入れ子構造" の "入れ子" は、1段階の非常にシンプルなものに過ぎないのです。

しかし、ある5次方程式が可解でないことを証明するには正規部分群が威力を発揮します。つまり、その5次方程式のガロア群に "正規部分群を介した巡回群の入れ子構造"がないことを言えばよいのですが、そもそも正規部分群がないことを証明してしまえば、その5次方程式は可解ではなくなるからです。そして実際に、ある特定の5次方程式が可解でないことの証明に使われるのは、その5次方程式のガロア群に正規部分群がないということなのです。先ほど「正規部分群という概念がガロア理論の最大のキモ」としたのは、そういう意味を含みます。

可解性の十分条件

\(n\)次方程式 \(f(x)=0\) の解を \(\alpha _1,\:\alpha _2,\:\cdots \:,\alpha _n\) とし、これらの解を含む \(\bs{Q}\) の代数拡大体を \(\bs{L}=\bs{Q}(\alpha _1,\alpha _2,\:\cdots \:,\alpha _n)\) とする。また、\(1\) の原始\(n\)乗根を \(\zeta \) とする。

\(\bs{L}\) のガロア群が可解群であれば、\(\bs{Q}(\zeta )\) から始まって \(\bs{L}\) に至る "べき根拡大体" の列、
 \(\bs{Q}(\zeta )=\bs{F}_0\subset \bs{F}_1\subset \bs{F}_2\subset \cdots \subset \bs{F}_m=\bs{L}\)
が存在する。


なぜそう言えるのか、また、なぜここに突然 \(1\) の原始\(n\)乗根が登場するのかは、別途厳密に証明します。この定理で言えることは、「ガロア群が可解群であれば、\(n\)次方程式の解は、有理数と \(\zeta \) の四則演算・べき根の組み合わせで表現できる」ということです。

ここで \(1\) の原始 \(n\)乗根である \(\zeta \) が問題になります。実は、\(1\) の原始 \(n\)乗根は有理数の四則演算とべき根で表現できることがガロア理論とは無関係に証明できます(その証明も別途やります)。従って、方程式は可解なのです。

方程式が代数的に解けるキーワードは可解群です。巡回群は代表的な可解群であり、ガロア群が巡回群だと方程式をべき根で解く手法が存在します。ガロア群が巡回群の入れ子構造でも、その手法を多段階に使うことによって、\(\bs{Q}\) から始まるべき根拡大の系列で方程式の解を含む代数拡大体に到達できます。可解性の十分条件の証明は、そのような組み立てになっています。



以上の必要条件と十分条件を組み合わせると、以下が言えます。


\(n\)次方程式 \(f(x)=0\) の解を \(\alpha _1,\:\alpha _2,\:\cdots \:,\alpha _n\) とし、これらの解を含む \(\bs{Q}\) の代数拡大体を \(\bs{L}=\bs{Q}(\alpha _1,\alpha _2,\:\cdots \:,\alpha _n)\) とする。

\(n\)次方程式 \(f(x)=0\) が可解である、つまり四則演算とべき根で解が表現できるための必要十分条件は、\(\bs{L}\) のガロア群(= 自己同型写像が作る群)が可解群であることである。


ガロア理論は、方程式が解けるための必要十分条件を示すものです。従って、ある方程式が可解であることの証明、あるいは逆に、可解でないことの証明はできます。しかし、可解である方程式の解を、具体的に四則演算とべき根で求めるための実用的なアルゴリズムを示しているわけではありません。そこが注意点です。



ここまで、方程式の可解性の必要十分条件を解き明かすガロア理論の全体構造、アウトラインを説明しました。以降ではこれを精密化し、数学的に正しい、首尾一貫した証明にしていきます。目次にあるように、全体は次の8章から成ります。

 1.証明の枠組み
 2.整数の群
 3.多項式と体
 4.一般の群
 5.ガロア群とガロア対応
 6.可解性の必要条件
 7.可解性の十分条件
 8.結論

第5章から第7章までが、ガロア理論の核心の部分です。第2章から第4章までは、核心部分の証明に使う各種の定義や定理の説明です。この部分がかなり長いのは、高校までで習う数学だけを前提知識とし、そうでないものは全部証明するという方針によります。

「1.証明の枠組み」 終わり 
次回に続く


nice!(0) 

No.353 - ウイルスがうつ病のリスクを高める [科学]

前回の No.352「トキソプラズマが行動をあやつる」で、トキソプラズマという微生物が人間の脳に影響を与え、人間の行動を変容させるのではという仮説を紹介しました。哺乳類に対しては、オオカミやハイエナの例、また、マウスでの実験で影響が明らかなので、人間に対してもそうだと考えるのが妥当なわけです。

これに関連してですが、微生物(=ウイルス)が人間の脳に影響を与え、その結果うつ病の発症リスクが高まるという研究がテレビ番組で放送されました。今回はその話です。

番組は、2022年10月4日放送の「ヒューマニエンス 49億年のたくらみ」(NHK BS プレミアム)で、その中での東京慈恵会医科大学のウイルス学者・近藤一博教授の研究です。大変興味深かったので、以下に番組のナレーションと近藤教授の話を再録します。


HHV-6 がうつ病のリスクを高める


【ナレーション(藤井アナウンサー)】

過度の疲労が続くと起こりやすくなるうつ病。その発症に関係していると近藤さんが考えているのが、ヒトヘルペスウイルス6、通称 HHV-6。これまでは、赤ちゃんに突発性発疹を引き起こすことだけが知られてきた。HHV-6 は、私たちのほぼ 100% が体内に宿しているが、大人になってからは健康被害を引き起こすことはないと言われてきた。

しかし近藤さんは、HHV-6 はうつ病と深いつながりがあると考えている。

【近藤教授】

うつ病患者の血液を調べますと、HHV-6 が作り出す SITH-1(シス・ワン)というタンパク質が、健康な人に比べて明らかに大量に作られているということがわかりました。

ウイルスとうつ病1a.jpg
(NHK BSプレミアムより)

【ナレーション】

これは健康な人とうつ病患者で、HHV-6 が作り出す SITH-1 タンパク質の量を比べたもの。はっきりと、うつ病患者の方が多いことが見てとれる。

【近藤教授】

このタンパク質が疲労によるストレス反応を増幅させて、うつ病を起こしやすくするのではないかと考えています。

【ナレーション】

近藤さんが考えるうつ病発症のメカニズムを見てみよう。HHV-6 は、普段は血液中の免疫細胞、マクロファージの中に潜伏感染している。疲労によって細胞にストレスがかかると、再活性化して増殖。血液を通じて唾液に集まる。しかしこの時は何の症状も起こさない。

ウイルスとうつ病2.jpg
(NHK BSプレミアムより)

うつ病のリスクが高まるのは、HHV-6 が唾液を通じて脳の近くにある嗅球しゅうきゅうに感染したあと。そこで HHV-6 は SITH-1 を作り出す。それが脳のストレス反応を高め、疲労などのストレスに敏感に反応するようになる。

すると人は不安をより強く感じるようになり、うつ病を発症するリスクが高まるというのだ。

【近藤教授】

我々は、どうやって この HHV-6、SITH-1 がうつ病を引き起こすのか、もう見つけているので、それを治す薬を今開発しているところです。

(うつ病は過去のものになりつつあるのかという質問に)

うつ病というのは心理的な要素も大きいのです。我々が見つけているのはうつ病の素因、いわゆる生物学的な要因というのですけど、これと、いわゆる悩みとかそういう心理的な要因が重なってうつ病が起こってくるので、この要素が強い人と、もっと心理的な要素が強い人でちょっと違うんですね。

(その、SITH-1 の要素を取り除いてやると、うつ病が楽になるのではという質問に対して)

だいぶ楽になります。うつ病の主な症状は、「抑うつ」と「喜びの消失」(何をやっても楽しくない)、それからもう一つは「疲労感」なんです。このうちの「喜びの消失」と「疲労感」、こがれ実は HHV-6、SITH-1 が関係していると我々は考えているのです。

(ウイルスということは、ワクチンで対処できるのでは、という質問に対して)

ワクチンで全員から HHV-6 を除いてしまうことは、必ずしも人間の進化上は得策ではない。実は、我々が考えている SITH-1 のメカニズムは、必ずしも悪いことばかりではないんですね。いわゆる、性格的に言うとすごく真面目な性格を作り出すんですね。周りの環境に敏感に反応できて自分の生存確率を上げることができる。人が生存していれば中に住んでいる HHV-6 も残るので、両得の関係できていたんですね。

ところが今の時代はストレスが強すぎるので、不安を誘導してうつ病を増やしたりするのですね。

【藤井アナウンサー】

もともとは宿主を長生きさせたいというウイルスの戦略だったのに、ちょっと今の時代にはマッチしなくって、うつ病を引き起こしてしまっているていう感じなんでしょうか。

【近藤教授】

そうなんです。時代が悪いんですよ。


微生物の精神面への影響


微生物が体に好影響、あるいは悪影響を与えるというのは常識です。であれば、脳に影響して人間の精神活動が変わる(変わりうる)のは当然そうかなという感想です。トキソプラズマやHHV-6 はそのほんの一角なのでしょう。今後、類似の研究が進むのではと思いました。

ちなみに SITH-1 の Sith(シス)は、スターウォーズに出てきます。つまり、銀河のエネルギーである「フォース」の "ダークサイド"を操る、ジェダイの敵対者集団です。この名前をウイルスが出すタンパク質につけたのは近藤教授のようで、ユーモアのある方だと思いました。




nice!(0) 

No.352 - トキソプラズマが行動をあやつる [科学]

No.350「寄生生物が行動をあやつる」で、トキソプラズマの話を書きました。今回はその補足です。トキソプラズマは単細胞の原生生物ですが、N0.350 の要点は次の通りでした。

◆ トキソプラズマは猫科の動物が最終宿主であり、そこでしか有性生殖できない。

◆ トキソプラズマは人間を含む幅広い哺乳類や鳥類に感染し(= 哺乳類や鳥類は中間宿主)、無性生殖(=分裂)を行う。

◆ トキソプラズマは感染した動物の行動を変える。狼は攻撃的になり、群のリーダになりやすい(仮説)。ネズミは猫を恐れなくなる。

この、トキソプラズマが感染した動物の行動をあやつることに関して、NHK BSプレミアムの番組の中で詳しく紹介されていました。

超進化論 第3集
すべては微生物から始まった
~ 見えないスーパーパワー ~
( NHK BSP 2023年1月8日)

です。今回はその番組からトキソプラズマの部分を紹介します。


超進化論・すべては微生物から始まった


ナレーション(廣瀬智美アナウンサー)

微生物は、ひょっとしたら意志をもっているのではないか。そう、思わせるような研究報告が相次いでいます。何と、感染した生き物の脳を操って自分の味方にしてしまうというのです。

ことの主役はトキソプラズマ。哺乳類や鳥類に感染する微生物です。人間に感染しても、胎児を除けば、ほとんど影響がないと考えられてきました。

チェコ・カレル大学のフレグルさん。トキソプラズマの驚くべき能力を明らかにしました。

ヤロスラフ・フレグル
  (チェコ・カレル大学 進化生物学者)

トキソプラズマは他の生き物を巧みに操ります。ネズミや人間の行動を変えてしまうのです。

ナレーション

ネズミや人間の行動を変える ? それを明らかにしたのがのが、こんな実験。ネズミを入れたケースの中にさまざまな匂いを置きます。ネズミの仲間、住み慣れた藁、そして天敵である猫の匂いです。

まずは、感染していないネズミをこのケースの中に入れます。それほど動き回らず、慎重に様子をうかがっているようです。苦手な猫の匂いも、確かめには行くものの、やはり、あまり寄りつきません。結局、住み慣れた藁や、何もない場所に長く滞在し、猫の匂いを置いた区画にいた時間は全体の 11% でした。

ところが、トキソプラズマに感染したネズミの場合、おやっ、苦手なはずの猫の匂いに近寄っています。

トキソプラズマ1 - 感染していないネズミ.jpg

トキソプラズマ2 - 感染しているネズミ.jpg
3つの匂いを入れた瓶を用意し、この上から撮った画面の左上には「自分の住処の匂い」、左下に「他のネズミの匂い」、右上に「天敵の猫の匂い」を置く。右下には何も置かない。この状態でネズミの4つの区画の滞在時間を調べる。

(上図)トキソプラズマに感染していないネズミは、左上「自分の住処の匂い」、右下「何も置かない」の滞在時間が長くなった。

(下図)トキソプラズマに感染したネズミでは、右上「天敵の猫の匂い」の区画に最も長く滞在した。
(NHK BSプレミアムより)

今回の実験では、猫の匂いの近くにいた時間が、先ほどの3倍。トキソプラズマに感染したネズミは、良く言えば大胆、悪く言えば慎重さに欠ける行動をとるようになるのです。

いったいなぜ、こんなことが起きるのか。実は、トキソプラズマには猫科の動物の体内でのみ子孫を増やせるという性質があります。ネズミに感染してしまうと、子孫は増やせない。そこで、ネズミの脳の働きを攪乱させ、猫に食べられやすくなるように操っているのではないかと考えられるのです。

ヤロスラフ・フレグル

こうしてトキソプラズマは、自分にとって子孫を残せる場所、つまり猫科の動物の胃袋にたどり着くことができます。なかなか洗練された戦略でしょう ? 高度な知性があるようにすら思えます。

ナレーション

では、人間がトキソプラズマに感染した場合にも、行動に変化は出るのでしょうか ───。ひょっとすると、大胆さが幸いして、企業の経営者などに向いているのではないかなど、さまざまな仮説が語られています。

一方、フレグルさんがデータを分析したところ、思いもよらない傾向が浮かび上がりました。それは交通事故。何と、感染した人は、していない人に比べて、事故の割合が 2.65 倍 高かったのです。行動を大胆に変化させるというトキソプラズマの働きが人間にも影響していると、フレグルさんは考えています。

トキソプラズマ3 - 交通事故.jpg
(NHK BSプレミアムより)

ヤロスラフ・フレグル

感染者の行動や振る舞いは、体内にいる微生物に左右されていると考えられます。性格や人格というのは、私たちにとって一番大事で誇りに思う部分でもあるでしょう。しかし実際には、遺伝や環境に操られています。微生物たちも、その環境の一つと考えるべきなのです。



トキソプラズマ関連の番組のナレーションはここまでです。


微生物と脳の働き


トキソプラズマが感染した哺乳類の行動を変えるというのは、さまざまな報告があるようです。番組で紹介されたのはネズミでの実験ですが、ナショナル・ジオグラフィック(2021.7.11 デジタル版)によると、トキソプラズマに感染したハイエナはライオンに近づき過ぎて、ライオンに襲われやすくなるそうです。

人間に感染している微生物は、それが人間と共生しているかどうかは別にして、身体に影響を与える(ことがある)のは常識です。だとすると、脳にも影響を与えると考えられます。性格やパーソナリティは遺伝と環境に影響されます。その環境の一部が微生物です。脳が感染している微生物に影響される(ことがある)のは、むしろ当然だと考えられます。

病気も含む「人間の精神のありよう」と微生物の関係は、今後の研究が進む分野であると思いました。




nice!(1) 

No.351 - 運動しても痩せないのはなぜか [科学]

No.221「なぜ痩せられないのか」で、「日経サイエンス」に掲載されたデューク大学のハーマン・ポンツァー准教授の論文を紹介しました。進化人類学者のポンツァーは、身体活動量が全く違うアフリカの狩猟採集民・ハッザ族とアメリカの都市生活者のエネルギー消費を比較し、それがほぼ同じであることを立証していました。運動によるエネルギー消費で減量を目指しても、その効果は無いか、限定的です。

もちろん、運動は健康維持に役立ちます。というより、健康維持のためには運動が必須です。そのことは、


で紹介しました。以上の話の発端となったポンツァー准教授が著した単行本が出版されました。

運動しても痩せないのはなぜか
代謝の最新科学が示す「それでも運動すべき理由」
ハーマン・ポンツァー(Herman Pontzer)著
(小巻靖子・訳 草思社 2022)


です。No.221 と重複する内容もありますが、単行本なのでさすがに詳しく記述してあります。今回はこの本(以下、本書)の内容をかいつまんで紹介します。なお、原題は、

BURN
New Research Blows the Lid Off
How We Really Burn Calories, Lose Weight, and Stay Healthy

です。直訳すると、

"燃焼"
目から鱗の最新研究
カロリーの消費、減量、健康維持の真実

となるでしょう(試訳)。


代謝


本書のメインテーマは、原書の題名や副題にあるように "カロリーの燃焼"、つまり「代謝」です。我々が健康を維持するには、体の仕組みを理解することが必須で、その重要なものが代謝です。

 代謝とは 

運動しても痩せないのはなぜか.jpg
ハーマン・ポンツァー
「運動しても痩せないのはなぜか」
(草思社 2022)
代謝とは、体内の細胞(人間では約37兆)のすべての "活動" ないしは "働き" を言います。細胞が種々の仕事をするにはエネルギーが必要で、我々はそのエネルギーを食物から得ています。エネルギー源となる食物成分の基本は、炭水化物(糖類)、脂質、タンパク質で、それらは体内で分解され、呼吸で得た酸素で "燃焼させて" エネルギーを得ている。燃焼の産物である二酸化炭素は呼吸で排出します。

もちろんエネルギーは、グリコーゲンや脂肪として蓄積でき、必要に応じてエネルギーに転換されます。タンパク質はアミノ酸に分解されて主に筋肉やその他の組織になりますが、必要ならブドウ糖に転換されてエネルギー源になります(=糖再生)。

体内のネルギー源は、最終的にはすべて ATP(アデノシン3リン酸)という分子になります。ATP は極小の充電式バッテリーのようなもので、ATP が ADP(アデノシン2リン酸)に変化するときにエネルギーが放出され、ADP にエネルギーを "チャージ" すると ATP に変化します。ATP は体内の「エネルギー通貨」です。

 エネルギー 

エネルギーとは、一言でいうと "仕事をする能力" で、多様な形をとります。高いところにある物質がもつ「位置エネルギー」、食物に含まれる分子の「化学エネルギー」、燃焼や太陽光の「熱エネルギー」、電気・電波などの「電磁波エネルギー」などです。

エネルギーを計る単位は、カロリー(cal。食品)とジュール(記号は J。食品以外)があります。1カロリーは1ミリリットルの水の温度を1度上げるのに必要なエネルギーで、カロリーの1000倍がキロカロリーです。栄養学ではキロカロリー(kcal)を使うのが伝統的です。

ジュールは、1ニュートン(N)の力で物体を力の方向に1メートル(m)動かすのに必要なエネルギーです。1キログラムの物体に働く重力が 9.8 N なので、1N は 102g の物体に働く重力です。ジュールはエネルギー(またはその等価物。仕事、熱量、電気量、など)を表す国際単位系です。ジュールの値を4で割ると、およそのカロリーになります(1 cal = 4.128 J)。欧州諸国では食品にジュールを使う国が多くあります。

ヒトにとって、エネルギーは通貨に似ています。我々は通貨を外部から得て、それをさまざまな目的のために消費します。一度消費した通貨は別の目的に消費することはできません。通貨は貯蔵することが可能です。また、モノを買うために消費した通貨は、そのモノを売るという形で再び通貨に変えることも可能です。

以上、ざっくり表現すると「代謝」とは「エネルギー消費」のことだといえます。

 基礎代謝 BMR 

我々は何もしないときでも一定のエネルギーを消費し続けています。これが基礎代謝(BMR。Basic Metabolic Rate)で、安静時のエネルギー消費量です。厳密には、

・ 早朝、空腹で(過去6時間に食事をしていない)
・ 快適な気温で
・ 横たわって、覚めてはいるが安静状態

におけるエネルギー消費量です。空腹を条件とするのは、消化のためにエネルギーを消費するからです。また快適な気温という条件は、寒いと体を暖かく保つためにエネルギーを消費するからです。

基礎代謝は体重に依存します(その他のエネルギー消費も体重に依存する)。人間の1日あたりの基礎代謝は、おおよそ次の式で計算できます(本書に記載の推定式)。

基礎代謝量(1日あたり。キロカロリー)

◆ 成人男性 : 7×体重 + 551
◆ 成人女性 : 5×体重 + 607

この式の体重はポンド表示です。kg表示の体重をポンドにするには2.2倍(1/0.45 倍)する必要があります。この式で具体的に計算してみると、

成人男性(体重 65kg)→ 1550 kcal/日
成人女性(体重 55kg)→ 1200 kcal/日

となって、よく言われる「男性:1500kcal 程度、女性:1200 kcal 程度」とほぼ同じ数字です。ただし、基礎代謝は人によって(体脂肪率や筋肉量が影響)、または年齢によって(加齢で低下)± 200 程度の差異があります。

 代謝当量 メッツ - METs 

我々が何らかの活動をすると、基礎代謝以外のエネルギーを消費します。これは「代謝当量 = METs(メッツ)」という単位で表されます(MET=Metabolic Equivalent of Task)。1 METs とは「1時間に体重1キログラムあたり1キロカロリーを消費」することを言います。1 METs は BMR にほぼ等しい値です

各種活動のエネルギー・コスト
活動メッツ備考
安静 1.0 睡眠はもう少し低く、0.95 メッツ
座る 1.3 読む、テレビを見る、コンピュータ作業も同じ
立つ 1.8 両足
ヨガ 2.5 ハタ・ヨガ
歩く 3.0 2.5マイル(4 km)/時。硬い、平らな地面
スポーツ 6.0 - 8.0 サッカー、バスケットボール、テニスなどの有酸素運動
家事 2.3 - 4.0 掃除、洗濯、モップがけなど
高強度活動 10 - 13 アメリカ海軍特殊部隊の訓練、ボクシング、舟を懸命に漕ぐなど
(本書の表を引用)

各種活動のエネルギー・コストを調べると分かることがあります。それは、運動で消費するエネルギーが意外に(がっかりするほど)少ないことです。150ポンド(68kg)の成人で考えると、1万歩(8キロ程度)歩いたときの消費エネルギーはおよそ250 kcalです。これは炭酸飲料1本分(240 kcal)、ビッグマック半分(270 kcal)に過ぎません(もちろん炭酸飲料には低カロリーのものもある)。

本書に興味深いグラフがあります。それは「ランニング・歩行・水泳・自転車のエネルギーコスト」が速度によってどう変わるかを示したものです。

運動しても痩せないのはなぜか-1.jpg
ランニング・歩行・水泳・自転車のエネルギーコスト
横軸 x は速度。縦軸 y は1マイルを移動するときのエネルギー消費量

注目すべきは、ランニングと歩行のエネルギー消費の違いです。上記の表は、横軸 x が速度で、縦軸 y は1マイルを移動するときのエネルギー消費量(="燃費")です。歩行は、一定距離を歩くのに最もエネルギー消費が少ない速度があり、y は x の2乗に比例しています。しかしランニングの燃費は速度にほとんど無関係で、y は x に単純比例し、その比例定数はわずかです。

歩行では体の重心が上下します。しかしランニングは、足のバネによって上下動が少なく、足の骨の作りもスムーズに前進できる構造をしている。ヒトは2足走行に適した体の作りなのです。なお、水泳、自転車は、流体(水・空気)の抵抗で歩行やランニングとは違った様相を呈します。



ここまでが「代謝」を巡る序論です。では、代謝という視点でヒトをみたらどうなるか。まずヒトを含む霊長類の話からです。


霊長類のエネルギー消費


霊長類は哺乳類の一種ですが、他の哺乳類と比較してエネルギー消費が少ない種です。たとえば、ヒト(成人)の1日のエネルギー消費量は普通、2500~3000 kcal 程度ですが、ヒトと同程度の大きさの哺乳類は 5000 kcal を越えます。ヒトを含む霊長類(ゴリラ、オランウータン、チンパンジーとボノボ、ヒト)は、哺乳類の中ではエネルギーの消費量が少ない、つまり代謝の速度が低いのです。

代謝は成長と密接な関係があります。霊長類は進化のある時点で代謝が低下し、成長・繁殖・老化に時間がかかるようになった。つまり、ゆっくりとしたライフサイクルをおくるようになったわけです。イヌの1年は人間の7年ドッグイヤーに相当するなどと言いますが、そのことを指しています。

運動しても痩せないのはなぜか-2.jpg
動物によるエネルギー消費の違い
哺乳類(非霊長類)と鳥類は、霊長類より1日のエネルギー消費量がはるかに多い。

ヒトを除く霊長類のライフスタイルをみると、類人猿はベジタリアンです。シロアリなども食べますが、基本的に植物食です。植物を食べる種は移動距離が少なくて済みます。類人猿のBMR(体重あたり)は、他の哺乳類のBMRとあまり変わらないのですが、植物食が中心で移動距離は少なく、エネルギー消費が少なく、代謝の速度が遅く、ゆっくりと成長して繁殖するように進化したのです。

しかし、霊長類の中でヒトは少々違います。ヒトは霊長類で比べるとエネルギー消費が多いのです。1日のエネルギー消費量は、110kg のオランウータン(オス)で2050 kcal、55kg のオランウータン(メス)で1600 kcal 程度です。これは、同体重のヒトに比べて約30%少ない値です。霊長類4科(チンパンジー・ボノボ、オランウータン、ゴリラ、ヒト)の中でヒトは他の3科と比較して、体重差を補正すると、20%~50%エネルギー消費が多い種なのです。

それはなぜそうなったのでしょうか。


社会的狩猟採集者としてのヒト


ヒトは200万年ほど前に、他の霊長類にはない行動を始めました、それが狩猟による肉食です。小動物だけではなく、シマウマなどの大型哺乳類も標的にする狩猟です。植物食とは違って、狩猟はかなりの身体活動を伴います。

さらにヒトは、根にデンプンを含む野生植物の塊茎を、道具を使い土を掘って採集して食物としました。これも身体活動が伴います。

現代の東アフリカには、農業や牧畜を一切行わず、狩猟採集だけで生活をしている部族がいます。ハッザ族はその一つですが、彼らも大型哺乳類を狩り(男性)、塊茎を採集する(女性)狩猟採集民です。

シマウマやキリンなどの大型哺乳類を狩って肉食をするということは、仲間で狩りをし、その肉を仲間で分配することが前提です。一人での狩りの成功は難しいし、一人が独占して食べる獲物としては大き過ぎるからです。

この「分配」が「代謝の向上」とセットになってヒトは進化しました。分配を伴う狩猟採集は「社会的狩猟採集」と呼べます。この社会的狩猟採集というライフスタイルにより、類人猿よりも多くのエネルギーを摂取し、かつ消費することが可能になりました。

運動しても痩せないのはなぜか-3.jpg
代謝革命
ヒトは社会性と採食行動を一体化させ、余分の食料を仲間で分配する。これにより消費できるカロリー量が増え、長い寿命、多くの子孫、大きな脳、活発な活動などにつながった。

これで可能になった大きなポイントが脳の発達です。「社会的狩猟採集」を始めたホモ属は、それ以前のアウストラロピテクスより20%以上も脳の体積が増加したことが確かめられています。

ヒトが社会的狩猟採集に適した進化を遂げたことの別の現れが、持久力の向上です。持久力の指標である「最大酸素摂取量」は、ヒトはチンパンジーの4倍あります。ざっくり言って、ヒトの持久力は霊長類(類人猿)の4倍です。持久力があると遠距離の狩猟が可能です。哺乳類をどこまでも追いかけ、獲物が弱ったところで(=人間で言う "熱中症" になったところで)仕留める「持久狩猟」も可能になりました。



さらに火の使用がエネルギー摂取量を大きくしました。加熱調理をすると食物の構造や化学的性質が変わり、栄養を摂取しやすくなります。たとえば、加熱調理したジャガイモは、生で食べるより2倍のエネルギーをとれます。

また火の使用は社会的狩猟採集というライフスタイルの質を向上させました。火で槍の先を硬くする、火でタールを溶かして石斧を作る、暖をとってエネルギー消費を押さえる、などの効果です。



一方、ヒトの代謝量が向上したことにはマイナス面もあります。それは代謝性疾患にかかるリスクで、肥満、2型糖尿病、心臓疾患などが代表的なものです。ただし狩猟採集民であるハッザ族ではこういった代謝性疾患はありません。活発な身体活動というライフスタイルがなくなったとき、リスクが表面化するのです。



こういった進化をとげてきたヒトのエネルギーを消費は身体活動量によってどう変わるのでしょうか。それが次です。


制限的日時消費カロリーモデル


人間が一定期間(たとえば1日)でどれだけエネルギーを消費するかは、従来は「要因加算法」で計算されてきました。これは、

基礎代謝量(BMR)に、消化に必要なエネルギーと、身体活動に必要なエネルギーを加えたものが総エネルギー消費量である

という仮定にもとづくものです。いかにも妥当な仮定にみえますが、これは根拠がない全くの空論であることが分かってきました。

それは、技術革新により消費エネルギーの厳密測定が可能になったからです。この技術が「2重標識水法」です。これは水素の同位元素である「重水素」と、酸素の同位元素である「酸素18」でできた水(=2重標識水)を使うものです。

なお、2重標識水法の解説を No.221「なぜ痩せられないのか」に書きました。また、霊長類などのエネルギー消費の厳密測定も2重標識水法で初めて可能になりました。

アフリカの狩猟採集民であるハッザ族と、現代アメリカ人のエネルギー消費量を調査したグラフがあります。それをみると、ハッザ族と現代アメリカ人は身体活動量が大きく違うにもかかわらず、エネルギー消費量は同じです。

運動しても痩せないのはなぜか-4.jpg
カロリー消費量の比較(ハッザ族と先進国)
丸は男性、四角は女性を表す。灰色の丸・四角の一つ一つは、先進国の男性集団・女性集団のカロリー消費量を調査した結果を示していて、それが多数プロットされている。黒い曲線が男性・女性の近似曲線である。

一方、ハッザ族の成人のカロリー消費量は黒い丸と四角である。これは黒い曲線の近辺にあり、先進国の数々の集団と同じであることを示している。

ハッザ族だけではありません。世界各地のさまざまなライフスタイルの民族を比較しても、エネルギー消費量は同じだという証拠が積み上がってきました。



では、同じ人が身体活動を変えると、エネルギー消費量はどう変化するのでしょうか。このわかりやすい例がオランダで行われた「ハーフマラソン研究」です。これは、

運動を全くしていなかった男女をプログラムに参加させ、1年間かけてハーフマラソンを走れるようにする

というものです。

運動しても痩せないのはなぜか-5.jpg
要因加算法とハーフマラソン研究
上の図は要因加算法の仮定で、「その他」となっているのは基礎代謝や消化のエネルギー消費などである。これに身体活動のエネルギーを加算したものが総エネルギー消費だとする。しかしこれには根拠が全くない。

下の図はオランダで行われたハーフマラソン研究の結果である。ランニングの時間が延びても、エネルギー消費量はほぼ変わらない。

以下、「ハーフマラソン研究」で判明したことを本書から引用します(なお、以降の引用では段落を増やしたところがあります)。


私が紹介したいのは、オランダのウェスタータープらが行った研究だ。これは、運動をまったくしていなかった男女を1年間のプログラムに参加させ、ハーフマラソンを走れるよう訓練するというものだった。

被験者となった3人の女性と4人の男性はプログラムの開始と訓練の段階が変わる8週目、20週目、40週目に1日のカロリー消費量の測定を受けた。被験者は初め、週に4日、1日に20分走っていたが、最後はそれが60分に延び、1週間のランニング距離は25マイル(40キロメートル)程度になった。

当然、このトレーニングで女性は4ポンド(2キロ)近くの筋肉がついた。また、体重とランニング距離に基づいて計算すると、1日のランニングで約360キロカロリーを消費していた。もし要因加算法モデルが正しいなら、研究の終了時までに1日のカロリー消費量は少なくとも360キロカロリー/日、筋肉の増加分が安静時に消費するカロリーを加えると、390キロカロリー近く増えていていいはずだ。

ところが4週目の計測では、増加は120キロカロリーにとどまっていた。運動をしたことのなかった女性が週に25マイル(約40キロメートル)走り、ハーフマラソンを完走できるまでになったが、1日のカロリー消費量は開始時点と実質的に変わらなかったのだ(図参照)。男性の被験者も結果は似たようなものだった。

ウェスタータープの研究期間は注目に値する。研究の世界で1年というと、意欲的な長期研究と考えられる。しかし、12ヵ月はそれほど長くはない。のちほど述べるが、新しいライフスタイルに適応するには何年もかかる。ハッザ族のような人々は長い年月 ── 文字通り生涯 ── をかけて高いレベルの身体活動になじんでいく。彼らは究極の長期研究対象集団だ。それならば、伝統的な暮らしを守る集団の1日のカロリー消費量の増加を示す証拠が見られなくても当然かもしれない。

ハーマン・ポンツァー
「運動で痩せないのはなぜか」

ハーフマラソンに向けての練習で消費したエネルギーの分だけ、身体のどこかのエネルギー消費が減り、トータルとしてのエネルギー消費がほぼ一定に保たれる。ヒトの体はそういうふうにできている(=そのように進化してきた)のです。これがエネルギー消費に関する「制限的日時消費カロリーモデル」です。

この種の研究は多数行われています。プログラムの期間や運動の強度によっていくらか結果は異なりますが、ほとんどの場合、制限的日次カロリー消費モデルに沿ったものとなっています。


運動が体によい理由


「制限的日時消費カロリーモデル」によって、運動が体によい理由の一つが見えてきます。このモデルをわかりやすく図示したのが次の図です。

運動しても痩せないのはなぜか-6.jpg
身体活動量とカロリー消費

運動でエネルギーを消費すると、必須ではない体の活動 = カロリーが余っているときにすればよい活動が制限され、体の維持に必須の活動はできるだけ守られます。つまり、運動はエネルギーの配分バランスを変えることになります。配分バランスの変化の結果、「体に悪影響を及ぼすエネルギー消費」が少なくなる。それは主として3つあります。

炎症

一つは「炎症」です。体に細菌やウイルス、あるいはダニのような寄生生物が進入すると、免疫細胞がその部位に集結し、異物を排除します。外見的にはその部位が腫れる。これが体の炎症反応です。これは侵入者に対処するための必須の仕組みです。

しかし炎症反応が真の標的を見誤り、花粉のように無害のものや、あるいは自己の細胞を攻撃するようになると、アレルギー、関節炎、動脈疾患などの広範囲の症状を引き起こします。それが脳の視床下部に影響すると、過食や、その他の体の調節異常を起こします。

定期的な運動が慢性炎症の抑制に効果的であることは、ずいぶん前から指摘されてきました。運動でカロリーを消費すると、体は残ったカロリーを倹約して使うようになります。運動は、炎症反応が本来の標的に対して働くように仕向け、免疫系が不要な活動にエネルギーを使うことを抑制します。

ストレス反応

何らかの緊急事態に遭遇したときや、普通ではない状況に陥ったときには、アドレナリンやコルチゾールが分泌されてストレス反応が起こります。これは緊急事態に対応するための正常な反応です。

しかし炎症と同じで、ストレス反応が間違って引き起こされたり、いつまでも続いたりすると、健康に重大な影響を及ぼします。

運動は気分を改善し、ストレスを軽減します。運動することによってストレス反応の大きさが押さえられるからです。中程度の鬱病患者の治療として運動が使われることもあります。

生殖ホルモン

運動を続けると生殖ホルモン(男性ホルモン、女性ホルモン)の分泌量が減ります。

生殖ホルモンの分泌量の低下は、子供の数という面ではマイナスです。ハッザ族では避妊は行われず、大家族が望まれますが、女性が子供を生む間隔は3~4年です。一方、アメリカでは、授乳中であれ、もし希望すれば1~2年おきに出産が可能です。これはアメリカの母親の方が身体活動レベルが低く、高カロリー食品を容易に摂取できるので、ハッザ族の女性よりも出産にエネルギーを回すことができ、出産後の回復も早いからです。

しかし、生殖ホルモンのレベルが高いと生殖系のがん(乳がんや前立腺がん)のリスク要因になります。運動はそのリスクを低下させます。むしろ、身体活動が高く、生殖ホルモンの分泌量が低下している状態の方が、ヒトの体の本来の姿と言えます。運動は本来の姿に戻します。

もちろん過度の運動による生殖ホルモンの低下は問題を引き起こします。女性であれば生理が止まったりすることがあります。



運動が健康に良いのは、以上に述べたような代謝からの要因(=エネルギー使用バランスの変化による要因)だけでありません。本書から、健康によい理由の部分(数々の研究から引用したもの)を引用します。


運動の効果はカロリー以外にも及ぶ。たとえば運動はあなたを強く、健康にする。これは死神を寄せつけないよい方法だ。

おもしろい例を1つあげよう。腕立て伏せを連続11回以上できる男性はできない男性に比べ、心臓まひを起こすリスクが60%以上低い。(中略)有酸素運動は心血管代謝疾患のリスクを抑える ── そして健康長寿をもたらす。

高齢になるにつれ、丈夫な体でいることがとくに重要になる。高齢者の体力の標準的指標に、6分間歩行距離がある。6分間に歩ける距離を測定するのだが、少なくとも1200フィート(約360メートル)歩ける人は今後10年間に亡くなるリスクが、950フィート(約290メートル)歩けない人の半分なのだ。

強度が6メッツ以上の激しい運動は、全身によい影響を及ぼす。ジョギング、サッカー、バスケットボールなどのスポーツや、バックパックを背負って歩く、自転車に乗るなどの運動は、心拍数を上げる。血流が速くなると、一酸化窒素が放出される。一酸化窒素は、血管を広げて柔らかい状態に保つはたらきがある。しなやかな血管は血圧を低めに保ち、詰まったり破れたりして心臓まひや脳卒中を引き起こす可能性も低い。

中程度の運動(メッツ3~6。きびきびと歩く、楽に自転車に乗る、ガーデニングなど)も効果があり、血管内のブドウ糖が細胞に入るのを促す。気分転換やストレス解消につながることもわかっていて、うつ病の治療にも役立つ。定期的に運動をすると頭をさえた状態に保つことができ、加齢に伴う認知機能の低下を鈍化させる。ランニングなどの有酸素運動は脳への血流を増やし、ニューロトロフィンの放出につながる。ニューロトロフィンは脳細胞の成長と健康を促す物質だ。デイブ・ライクレンの研究チームによると、ウォーキングとランニングは認知機能を改善する。スピードとバランスを維持しながら進むために、脳は次々と入ってくる視覚などの知覚情報をうまく処理しなければならないからだ。

運動の効果は他にもある。私の博士課程の指導教官だったダニエル・リーバーマンは、身体活動が免疫反応から生殖まで、体のすべてのシステムに影響を及ぼすと『Exercised(運動)』で詳しく述べている。その情報伝達のメカニズムがどのようになっているかはまだ解明されていないが、範囲の広さには驚くばかりだ。筋肉を鍛えると、全身に及んでいる神経系と循環系のはたらきに変化が生じ、さらに何百もの物質が血中に放出される。運動で体にどのような影響が生じるのかは、ようやくわり始めたところだ。そして、影響は体のあらゆる部分に及んでいる。

ハーマン・ポンツァー
「運動で痩せないのはなぜか」


世界にはさまざまな文化があるが、どの文化であれ、健康的に生きられるか、早世するかを予測する最も確かな指標の1つが身体活動量である。

アメリカでは5000人近い成人を5~8年間追跡し、その間に亡くなるリスクが日々の活動量によって変わるかどうかを調べる大規模研究が行われた。その結果、1日に1時間以上、中・高強度の運動をしている人は、座位で過ごす時間が最も長い人に比べ死亡リスクが90%低いことがわかった。

15万人の成人を対象にしたオーストラリアの同じような研究では、1日に1時間、高強度の運動をすると、丸1日のデスクワークが健康に及ぼす悪影響を和らげるのに役立つという結果が出た。

デンマークのコペンハーゲンで市民を対象に行われている有名なコペンハーゲン市心臓研究では、1日に少なくとも平均30分運動をしている人は死亡リスクが半分になることが示されている。

ハーマン・ポンツァー
「運動で痩せないのはなぜか」


まとめ


本書の重要ポイントをまとめると、次のようになるでしょう。

◆ 運動しても痩せないからこそ、運動する意義(の一つ)がある。それは運動によって体内のエネルギー消費=代謝のバランスが変化し、その変化が健康維持に役立つからである。

◆ もちろん、代謝の視点以外からも、運動(活発な身体活動)は、数々の理由で健康維持のために必須である。

痩せることを目標にして運動をはじめてはみたものの、思ったように痩せないので運動をやめた、というようなことがあるとしたら、これほど本末転倒なことはないわけです。

ヒトは、身体活動レベルが高いのが通常状態であり、それは「社会的狩猟採集」というライフスタイルに適合するように進化した結果です。つまり、ヒトの体の基本的なしくみは、東アフリカのサバンナで作られ、それは今も変わっていない(=体はまだサバンナにいる)と言えるでしょう。


サバンナでの映画上映


本書に、著者たちがアフリカのサバンナに住むハッザ族のキャンプに泊まりこんでフィールド調査をしたときのエピソードが出てきます。印象的な文章だったので、それを紹介します。

著者たちはパソコンを使って、ある自然ドキュメンタリー映画をハッザ族に見せました。映画の一場面は、動物たちが集まるサバンナの水飲み場です。その夜の映像です。


夜の水飲み場周辺が映る。乾季の真っ最中で、ゾウが水を求めてやってくる。

ところが、そばでライオンが待ち伏せをしている。ライオンはゾウの赤ん坊に襲いかかり、怖がって逃げるその首筋にかみついた。ゾウは小さな体を起こして弱々しい悲鳴を上げる。観客は、私も含め、見入っている。

大人のゾウがライオンを追い払おうとするが、無駄だ。ライオンの数は多く、次々と忍者のように襲ってくる。深い傷から血が流れ出る。攻撃はすぐに終わった。ああ、ゾウの赤ちゃんが!

なんと恐ろしいことだ。自然は過ちを犯した。こんなことがあってはならない。

ハッザの人たちが歓声をあげた。ほら! ライオンが勝った!
私は唖然とした。ライオンを応援するなんてどういうつもりだ?

そのあと、だんだんわかってきた。ゾウを気の毒だと思うのは、テレビでしか自然を体験したことがない都会に住む者の贅沢なのだ。自然の中で育つ、自然の中で毎日暮らすということは、自然は自分たちに寄り添ってなどくれないと理解するということだ。荘厳なドラマが展開して、精神的成長を促してくれるわけでもない。そこにはさまざまな種が集まっていて、自分もその寄せ集めの一部だ。悪意をもつものや無関心なものはいるが、友人と呼べるものはだれもいない。

ハッザの人々がゾウを嫌うのは、ゾウが巨大で、気むずかしく、ときどき仲間を死なせるからである。

ハーマン・ポンツァー
「運動で痩せないのはなぜか」

我々は「人間によって管理された自然」を体験しますが、そうではない自然、「さまざまな種が集まっていて、自分もその寄せ集めの一部にすぎない自然」に身を置いたことはないのですね(普通の人は)。そのことが思い起こされる文章でした。




nice!(0) 

No.350 - 寄生生物が行動をあやつる [科学]

No.348No.349 に続いて寄生の話です。No.348「蚊の嗅覚は超高性能」では、

ある種のウイルスは、宿主(= ウイルスが感染している生物)を、蚊の嗅覚に感知されやすいように変化させ、蚊の媒介によるウイルスの拡散が起こりやすくしている

との主旨を書きました。ウイルスの生き残り(ないしはコピーの拡散)戦略は誠に巧妙です。また、No.349「蜂殺し遺伝子」は、

ウイルスが芋虫に感染すると、その芋虫は寄生バチの卵や幼虫を死滅させるタンパク質を生成し、これによってハチに寄生される確率が下がる。このタンパク質を生成する「蜂殺し遺伝子」はウイルスがもたらす

との主旨でした。ウイルスにとって寄生パチは宿主(=芋虫)をめぐる競争相手です。従って競争相手を排除する仕組みを発達させたのです。

こういったウイルス、もっと広くとらえると「寄生体」は、この2例のように宿主の "体質" を変えることがあり、さらにそれだけでなく、宿主の行動をコントロールするケースがあることが知られています。そのような「宿主の行動をあやつる寄生体」として、カマキリにの寄生するハリガネムシの例を紹介します。ハリガネムシ(針金虫)とは、その名のとおり針金のような形の虫で、カマキリをはじめとする各種の昆虫に寄生します。


最強ハンター カマキリ


2022年11月7日のNHK BSプレミアムの番組、ワイルドライフ「鳥を襲う最強ハンター カマキリ 究極の技」で、驚きの映像が2つ紹介されました。一つは、カマキリが小鳥のベニヒワを襲う(=狩る)映像です。

能登半島の北、約50kmの位置にある舳倉へぐら島(石川県輪島市)は、世界的にも有名な渡り鳥の中継地で、その季節になるとバード・ウォッチャーの人たちで賑わいます。この島に生息するカマキリは、小鳥の一種であるベニヒワを襲うことがあるのです。放映された映像では、カマキリは草の上の方でじっと待ち、たまたま近くにベニヒワがとまると、そっとベニヒワの死角から忍び寄って、ベニヒワの後頭部に "カマ" を突き立てる。

映像ではカマキリが "狩り" に失敗したケースと成功したケースの両方が映し出されていました。成功したケースでは、ベニヒワはカマキリと一緒に地上に墜落して羽をバタつかせています。誠に驚くべき映像(=世界初)で、これを撮影した番組スタッフの執念に感心しました。

しかし、この番組ではもう一つの驚くべき映像がありました。泳げないカマキリが川に飛び込んで "自殺" する瞬間をとらえた映像です。このカマキリの行動は以前から知られていましたが、動画でとらえたのは初めてのようです。これは寄生体にからんでいるので、以下、この部分をそのまま紹介します。


カマキリの "自殺"


【ナレーション(首藤奈知子アナウンサー)】

昆虫界最強ハンター、カマキリ。でも、意外な原因で命を落とすことがあります。私たちは、その驚きの瞬間を目撃しました。

川に近づくハラビロカマキリ。水面をじっと見つめ ・・・・・・ なんと、飛び込んでしまいました。泳げないカマキリが自ら水に飛び込むなんて ・・・・・・ 。いったいなぜ、こんなことが起きたんでしょうか。

BSP - カマキリ1.jpg

BSP - カマキリ2.jpg
川に飛び込むハラビロカマキリ(番組より)

この謎の行動について研究を続けている佐藤拓哉博士。実はカマキリはある動物にあやつられているのだと言います。

佐藤博士が手のひらに乗せているヒモのようなもの。寄生虫のハリガネムシです。これがカマキリの体内に入り込んで動きを操っていたんです。

BSP - ハリガネムシ1.jpg
佐藤博士が川で採取したハリガネムシを示している(番組より)

【佐藤拓哉博士(京都大学生態学研究センター、准教授)】

ハリガネムシは、普段はあまり歩かないカマキリを、活動量が上がるようなタンパク質を出したり、光に応答してしまうようなタンパク質を出したりして、川や池に飛び込ませる。いわば洗脳してしまうような状態になると言われています。

【ナレーション】

何とも恐ろしいハリガネムシ。でも、なぜ水に飛び込むよう、仕向けるのでしょうか。

その理由はハリガネムシの暮らしにあります。ハリガネムシの一生は川の中で始まります。春、卵からかえった幼生は、川底にひそんで暮らします。カゲロウなどの幼虫が川底で食事をするとき、偶然、口から吸い込まれると、殻に包まれた状態に変化し、休眠状態に入ります。

やがて幼虫は羽化して森へ。それを待ち受けるのがカマキリ ・・・・・・ つかまえました(カマキリがカゲロウをつかまえるシーンが挿入される) ・・・・・・。するとハリガネムシはカマキリの体内へ移動。眠りから覚め、成長していきます。

でも、子孫を残すためには水中で産卵しなければなりません。そこで、神経を混乱させる物質を出してカマキリを操ります。こうして乗っ取られた状態になったカマキリは、川へ飛び込んでしまうんです。ハリガネムシは水に入るとカマキリの体から出て行きます。

BSP - ハリガネムシ2.jpg
水中でカマキリの体内から出てくるハリガネムシ(番組より)

最近の研究で、カマキリは飛び込む場所までハリガネムシにコントロールされているという、衝撃の事実が明らかになりました。

【佐藤拓哉博士】

これまでは、ハリガネムシに寄生されたカマキリは、水の反射光のキラキラ、明るさですね、明るさに引き寄せられると言われていたんですけれども、実際には自然界には水たまりとか、葉っぱに反射するキラキラ明るい所とか、いろんなものがあるわけですけど、そういう所にいちいち感染したカマキリが引き寄せられていると、川に戻れないというふうになってしまいます。

【ナレーション】

ハリガネムシに寄生されたカマキリが飛び込むのは、きまって川の深い所。佐藤博士たちは長年の研究の末、この謎をついに解き明かしました。

【佐藤拓哉博士】

ハリガネムシに感染したカマキリは、深い水辺に反射した光の中に含まれる「水平偏光」に引き寄せられて川に飛び込んでいるというようなことが分かってきました。

【ナレーション】

水平偏光とは、深い水中からの反射光に多く含まれる光の一種です。肉眼では見ることができませんが、特殊なカメラで覗いてみると、水平偏光が強い場所は赤っぽく写ります。浅い川では一見キラキラして見えますが、赤い部分はほとんどありません。一方、深い川は暗く見えますが、赤い部分が多いことが分かります。

ハリガネムシの繁殖に適しているのは深い川の中。寄生されたカマキリは、水平偏光の強い深い川に引き寄せられ、飛び込んでいたんです。

カマキリの命の奪う寄生虫、ハリガネムシ。研究を進めるうち、意外な事実も見えてきました。

【佐藤拓哉博士】

ハリガネムシは森の虫をつれて川に入ると、産卵をして死んでいくんですが、その過程で大量に入った森の虫が川の魚の餌になっている。つまり、ハリガネムシがいると森から川に大きなエネルギーの流れが起きるというようなことに気づいたんです。

【ナレーション】

寄生されたカマキリなどの昆虫は、川に飛び込んだあと魚に食べられることがよくあります。そうした昆虫たちが川の生態系に大きな役割を果たしているのです。

【佐藤拓哉博士】

調べてみると、調査した川に棲んでいる渓流魚が1年間に消費するエネルギーの約6割を、ハリガネムシが森から連れてきた虫によって担われているということが分かってきました。1年の6割をハリガネムシが担っているというのは、これは森と川がものすごく強くハリガネムシのおかげで繋がっているというようなことで、すごく驚きでした。

【ナレーション】

陸と川との思わぬ繋がり。それを支えているのは、カマキリなどの昆虫たちだったのです。



カマキリに寄生したハリガネムシが、カマキリの神経を混乱させ、川の深いところを選んで飛び込むようにあやつっている、というのは驚きの事実です。さらにもう一つの驚きは、こうしたハリガネムシの生活史が渓流魚の餌の供給を支えていて、エネルギー・ベースでは餌の6割にも相当する、ということです。



このカマキリとハリガネムシの話は、2022年12月4日の日本経済新聞にも載っていました。ただし記事のメインは「オオカミを操る寄生体」です。次にそれを紹介します。


オオカミ、寄生体がボス指名


その日本経済新聞のコラム記事は、

オオカミ、寄生体がボス指名
感染で脳操作、野心かきたてる


と題するものです。寄生体が操るのは、カマキリといった昆虫ではななく、なんとオオカミだというのです。


大自然を生きる動物たちは生存競争を勝ち抜き、次代にバトンをつなぐための行動力を磨き上げてきた。奔放で勇猛果敢な振る舞いは自由の象徴でもある。だが、その行動が自らの意思ではなく、誰かの手のひらで転がされているだけだったとしたら景色は一変する。みえてきたのは、自然界を陰で操る存在だった。

オオカミにとって群れのリーダーに名乗りを上げるのは大きな決断だ。才覚のあるものだけが務まる地位だからだ。

米国イエローストン国立公園にすむハイイロオオカミにもリーダーがいる。トップにたつ資質をひもといた米国モンタナ大学などのチームが11月末に発表した論文は、目を疑うような内容を伝えていた。

「群れのリーダーになる可能性は46倍以上に高まる」。チームのコナー・マイヤー氏は続ける。ある種の寄生体を宿すオオカミは「リーダーになりやすい。リスクを冒す傾向が強い」。寄生体がボスを指名するのか。リーダー像が覆った。

日本経済新聞(2022年12月4日)

オオカミは群れる.jpg
オオカミは群れる.
(日本経済新聞より)

記事でいう「目を疑うような内容」とは「ある種の寄生体を宿すオオカミはリスクを冒す傾向が強くリーダーになりやすい」という調査結果です。その寄生体が次に書いてあります。


1995~2020年に採取したオオカミ229匹の血液から、トキソプラズマという小さな寄生虫が感染した痕跡を調べた。この寄生虫はネコ科動物の腸を生まれ故郷とし、他の動物も渡り歩く。同公園にいる大型ネコ科動物ピューマは故郷の一つだ。健康であれば症状はほとんど出ないが、脳や筋肉に巣くう。

寄生体がオオカミに何をしたのかはよくわからないというが、チームの一人は「脳を操っている気がする。ホルモンの分泌を変え、リスクの高い行動を促しているのかもしれない」と疑う。

そこから浮かぶ仮説はこうだ。寄生体はピューマのフンなどを口にしたオオカミに感染し、やがて脳に居座る。脳を乱して攻撃性を高め、野心をかきたてる。こうした気質がリーダーへと導いていく。

日本経済新聞(2022年12月4日)

この研究はオオカミが「トキソプラズマに感染する」ことと「群れのリーダーになる」ことの間に強い相関関係があることを示したものです。しかし、相関関係があるからといって因果関係があるとは限りません。上に引用にもあるように、「トキソプラズマがオオカミを操って攻撃性を高める」というのはあくまで仮説です。しかし、あとで出てきますが、トキソプラズマが感染した動物の性格を変える例はほかにもあり、このオオカミの例は因果関係を疑わせるものなのです。

この寄生体の介入が、オオカミのボスを決めるだけならまだしも、それによる影響がオオカミの群に及ぶのでは、というのが研究チームの懸念です。


感染の痕跡が見つかるのは2000年以降だ。チームが気にかけるのは、寄生体の介入が招く影響だ。オオカミの死因には、狩猟や交通事故、けんかや獲物を襲う際のケガがある。恐れを知らぬリーダーが誕生すると仲間も大胆になる。大きなリスクをとる行動は繁殖や勢力拡大で時に幸運をもたらすが、同時に慎重な気質によって救われてきた命を危険にさらす。

気が大きくなったリーダーは、ピューマのそばにも群れを連れていく。ネコ科動物に近づけば、仲間にも寄生する危険がある。寄生体は身ごもった子や弱った体には悪さをする。

日本経済新聞(2022年12月4日)


トキソプラズマが感染したネズミは


トキソプラズマ(単細胞の原生生物)は、ネコ科の動物の腸が本来の住処であり、有性生殖するのはそこだけです。他の動物にも感染しますが、無性生殖しかできない。

トキソプラズマが感染したネズミがどうなるか、という話が次に出てきます。


自然界は動物たちが生き残りや子孫繁栄をかけて独自の生き方を貫き、それこそが生命の輝きと称されてきた。ところが寄生体が君臨するもう一つの世界が存在し、自分らしく生きる動物を見えざる力で操っているとしたら、世界の見方は変わる

陰の支配者は存在の根拠が実験で積み上がっている。「トキソプラズマに感染したネズミはネコのにおいにも恐れずに近づく」と帯広畜産大学の西川義文教授は話す。感染したばかりの急性期や再活動期は鬱に似た症状が出る。慢性期は記憶障害を起こす。脳のへんとう体や大脳で生体物質の調整がうまくいかない。

西川教授はいう。「恐怖はどうでもいいとネズミに思わせてネコが食べてくれたら、ネコの体で有性生殖をするトキソプラズマにとって都合がよい」

日本経済新聞(2022年12月4日)

ネズミがネコに食べられやすくなったら、ネズミの体内のトキソプラズマは「故郷」に帰れるし、ネコにとっては食料が増えて好都合です。そういうふうにトキソプラズマがネズミを操っているのです。

「この世界には様々な陰の支配者がおり、予想以上に大きな力を振るっている」と記事にもありました。その別の例が、NHK の番組にあった「カマキリを操るハリガネムシ」です。


カマキリを操るハリガネムシ



京都大学の佐藤拓哉准教授はカマキリが川や池に次々と飛び込む現象を追っている。21年、カマキリの光を感じる力をおなかに寄生したハリガネムシが惑わしているらしいと佐藤准教授(当時は神戸大)らは突き止めた。この仕組みは100年以上前から謎だった。

「指令」を受けたカマキリは水面の反射光が含む水平偏光に魅入り、水の中に落ちる。ハリガネムシは水中で繁殖し、複数の虫を巡り歩く。水中に戻るには生涯の終盤ですみ着いた陸の虫を水辺に誘う必要があった。水死した虫は多くの魚を育み、生態系を支える。寄生体の影響力は絶大だ。

日本経済新聞(2022年12月4日)

「ハリガネムシが寄生したカマキリ」は、さきほどの「トキソプラズマが寄生したネズミ = ネコに食べられやすい」とそっくりです。両方とも、寄生体にとって都合のよいように宿主の行動が変わるという意味でそっくりなのです。

寄生生物が行動を操る.jpg
寄生生物が行動を操る
(日本経済新聞より)


人間とトキソプラズマ


「この世界には様々な陰の支配者がおり、予想以上に大きな力を振るっている」としたら、人間も無関係ではありえません。


その力は人間にも向かう。ストックホルム大学のアントニオ・バラガン博士は、トキソプラズマが動物を支配下におけるのは「免疫細胞を乗っ取り、タクシーを使うように腸から血管、臓器へと動き回れるからだ。人間の免疫系を私たちよりも熟知する」という。脳にも入り、健康を損ねずに息を潜める。既に人類の3分の1以上に寄生しているとの情報もある。

科学者の関心事は人間の神経や精神の病気に関わるかだ。しかし、あれほど知的なオオカミが影響を受けるとした研究成果は「人類の普段の行動も左右しているのではないか」とさらなる好奇心をそそる。(サイエンスエディター 加藤宏志)

日本経済新聞(2022年12月4日)

従来、精神疾患は、遺伝的な要因や、本人が受けた精神的ストレスの要因が研究されてきましたが、最近注目されているのは微生物との関係です。一つは腸内細菌が脳に与える影響であり、もう一つは脳に潜む微生物・寄生体です。

最近の NHK BSプレミアムの番組ですが、2022年10月4日放送の「ヒューマニエンス」で、東京慈恵会医科大学のウイルス学者・近藤一博教授が、

ヒトに潜伏感染するヘルペス・ウイルスの一種、ヒトヘルペスウイルス6型(HHV-6)が、鬱病の発症リスクを高める

との主旨を語っておられました。HHV-6 は赤ちゃんに突発性発疹を起こすウイルスで、ヒトに対する影響はそれしかないと思われてきましたが、実は成人にも影響し、鬱病のリスク増大要因になるのです。

「自然界における寄生体は、予想以上に大きな力をもっている」のかもしれません。ヒトに寄生する生物が、ヒトの性格や行動、精神的な傾向に与える影響は、今後研究が進む分野だと思いました。




nice!(0) 

No.349 - 蜂殺し遺伝子 [科学]

前回の No.348「蚊の嗅覚は超高性能」で、

ある種のウイルスは、宿主(= ウイルスが感染している生物)を "蚊の嗅覚に感知されやすいように" 変化させ、蚊の媒介によるウイルスの拡散が起こりやすくしている

との主旨を書きました。ウイルスの生き残り(ないしはコピーの拡散)戦略は誠に巧妙です。

これは、2022年9月17日の日本経済新聞の記事から紹介したものですが、その1年ほど前の日経新聞にも「ウイルスの巧妙な戦略」の記事があったことを思い出しました。今回はその内容を紹介します。

ウイルスの脅威、競合相手にも
「感染者」横取り阻む
日本経済新聞(2021年8日22日)

と題した記事です。以下の引用は、日経デジタル(2021年8月21日 2:00)からです。


補食寄生


まず、この記事の前提は「補食寄生」です。ほとんどの寄生者は宿主(= 寄生する相手)と共存しますが、補食寄生とは最終的に宿主を殺してしまう寄生です。

エメラルドゴキブリバチ.jpg
エメラルドゴキブリバチの成虫(Wikipedia)
蜂の仲間には補食寄生を行う種が多々ありますが、最も "高度な" 寄生者として「エメラルドゴキブリバチ」が知られています。多くの補食寄生者は特定の1種の昆虫を宿主とします。エメラルドゴキブリバチの宿主は、ゴキブリの1種のワモンゴキブリ(輪紋ゴキブリ)です。日経サイエンス 2021年7月号の記事「エメラルドゴキブリバチは3度毒針を刺す」(K.C.カタニア:バンダービルト大学・米 テネシー州)によると、エメラルドゴキブリバチは次のように行動します。

① エメラルドゴキブリバチのメスは、ワモンゴキブリを見つけると、ゴキブリの腹にある「第1胸神経節」に針を刺し、毒素を注入する。これによってゴキブリの前足が一時的に麻痺する。

② エメラルドゴキブリバチは前足が麻痺したゴキブリの喉から2度目の針を刺し、脳に毒素を注入する。これによってゴキブリは動けなくなる(ゾンビ化する)。

③ ハチはゴキブリを閉じ込めるための適当な穴を探しに出かける。見つけたあと、ゴキブリを引っ張って穴の中に入れる。

④ ハチはゴキブリの「第2胸神経節」に3度目の針を刺し、毒素を注入する。これによってゴキブリの運動神経が活性化し、中足が開く。

⑤ ハチは、開いた中足の関節のつけ根にある薄い膜の上に卵を産みつける。その後、穴から出て石などで蓋をする。

⑥ 孵化した幼虫は、進入可能な唯一の部分である薄い膜を破ってゴキブリの体内に潜り込む。そしてゴキブリの体を食べて成長し、繭を作る。40~60日後に成虫がゴキブリの体から出てくる。

誠に驚くべき "高度な" 補食寄生者です。動きが活発なゴキブリの成虫に寄生する(卵を産みつける)ため、神経毒を3回注入し、しかもそれぞれ目的が違うというのは、ちょっと信じ難いような進化の結果です。

これほどまでの蜂はエメラルドゴキブリバチしか知られていないようです。つまり、ほとんどの補食寄生者はもっと "簡単な" やりかたをします。つまり、寄生する相手は昆虫の、

・ 
・ さなぎ
・ 幼虫(芋虫)

が普通で、動かないものか、動きがにぶいものです。そして日経新聞にあったのは幼虫(芋虫)のケースで、そこに、蜂だけなくウイルスが絡んできます。


蜂殺し遺伝子の発見


以上の「補食寄生」を踏まえて、日本経済新聞 2021年8日22日 の「蜂殺し遺伝子」の話を紹介します。蜂と芋虫の「寄生・被寄生」関係に割って入るウイルスがあるのです。


ガやチョウになる芋虫にとって寄生バチは厄介な存在だ。寄生バチが産みつけた卵からかえった幼虫は芋虫を食べて育ち、やがて巣立っていく。

芋虫とハチの対立だけならよくみる光景だ。東京農工大学の仲井まどか教授らがスペインやカナダの大学などと突き止めたのは、昆虫同士の争いに介入するウイルスの姿だった。

このウイルスは昆虫のみに感染する。芋虫がいなくなれば増殖できない。最大の関心事は「自分が感染する芋虫をいかに生き永らえさせるか」。ハチは目の上のたんこぶだ。

日本経済新聞 
(2021年8日22日)

図3.jpg
アワヨトウの幼虫に卵を産みつける寄生バチ「カリヤコマユバチ」。東京農工大学提供。
日本経済新聞(2021年8日22日)より

ウイルスと芋虫とハチの種が書いてないのですが、当然、昆虫のみに感染する、ある特定のウイルスです。そのウイルスは多種の芋虫に感染するのでしょう。芋虫・ハチの補食寄生の関係は特定の種同士かもしれないが、補食寄生は多くのハチにみられる現象なので、ウイルスが感染した芋虫もハチが卵を産みつける可能性が高い。そう理解できます。


アポトーシス


補食寄生に続く第2のキーワードは「アポトーシス」です。アポトーシスとは、いわば細胞の "自殺" ですが、ウイルスがもたらした遺伝子が、ハチの卵のアポトーシスを引き起こしているようなのです。


ウイルスがいる芋虫では寄生バチの卵や幼虫がなぜか育たない。3者の不思議な力関係は今でこそウイルスの策略だとわかったが、一線の研究者ですらこれまで頭を悩ましてきた。

感染した芋虫の体液から見つかった毒となるたんぱく質は、「アポトーシス」と呼ぶ作用で寄生バチの卵や幼虫を死滅させていた。この毒をつくるのが蜂殺し遺伝子だ。遺伝子が無いと寄生の成功率は上がる。

仲井教授は「蜂殺し遺伝子は進化の過程で芋虫とウイルスを行き来した可能性がある」とみる。

日本経済新聞 
(2021年8日22日)

図1.jpg
芋虫をめぐる2つの寄生者の競争イメージ
日本経済新聞(2021年8日22日)より

よく知られているように、ウイルスは自分の遺伝子を宿主の細胞に送り込み、その遺伝子は細胞が本来持っていなかった "モノ" 作り出します。それは普通、ウイルスの複製ですが、この場合は「寄生バチの卵や幼虫のアポトーシスを引き起こすタンパク質」も作り出す。そう理解できます。

芋虫にとっては「命を奪う寄生バチよりも体調不良で済むウイルスの方がマシ」なのでしょう。またウイルスからすると「助け舟を出しながら、芋虫を増殖に利用するのが狙い」です。仲井教授は仮説としてそう考えています。


進化的軍拡競争


さらに第3のキーワードは「進化的軍拡競争」です。つまり、生物が競争関係や敵対関係になると、互いに相手の形質を上回るような "進化の競争" が始まります。

図4.jpg
「進化的軍拡競争」の例
日本経済新聞(2021年8日22日)より


寄生のように生物同士が敵対関係になると、相手を上回る形質の獲得をめざす「進化的軍拡競争」が起きる。ウイルスは構造が単純で生物と認めない研究者もいるが「寄生バチとウイルスは全く階層が違うモノ同士だが、芋虫という同じ資源を巡って競争関係が生まれた」と仲井教授は話す。

自然界の進化的軍拡競争は一対一の敵対関係で説明されてきた。ウイルスを含む三つどもえの関係が明らかになり、「今後はより複雑な競争関係を論じる必要がある」(国際チーム)。

新たな競争関係の誕生はウイルスの怖さとしたたかさを改めて印象づけた。

感染の脅威なら新型コロナウイルスが明白に物語る。ヒトの細胞に取り付き、機能不全に陥れて健康を脅かす。だが今回、誰かが一線を越えて自らの利益を横取りしようとすれば、「第三者」であっても対抗手段を取り得ることが明らかになった。相手は「感染者」ではない。

日本経済新聞 
(2021年8日22日)

ウイルスと芋虫は、互いにメリットを与え合う「共存関係」にある、と理解できます。


ウイルスと生物


記事の最後には、ウイルスと生物の関係についてのマクロ的な解説があり、安定状態では共存が保たれるが、不安定な競合関係ではウイルスは脅威になるということが説明されていました。


今回の研究には参加していないが、ウイルスに詳しい東京農工大学の水谷哲也教授は「歴史が古いウイルスは理想の感染相手を見つけ、長い付き合いができている」と話す。

ヒトが間に分け入って感染や増殖のための安住の地を侵すと、ヒトとも不安定な関係が生まれる。

マダニが媒介する「重症熱性血小板減少症候群(SFTS)」はヒトでは致死率が1~3割程度だがシカやイノシシは平気だ。SFTSウイルスはマダニにひそむ。マダニがかんだ動物で増え、再びマダニに入る。ウイルスにヒトをあやめる利点はないが、山野を開発して野生生物を危機にさらすヒトとは競合する。

エボラウイルスもコウモリとは良好な関係だが、ヒトでは致死率が最大90%に達する。安定が揺らぐとき、ウイルスは脅威となる。

水谷教授はこうもいう。「新型コロナはまだ理想の相手に会えていないように思う。コウモリかもしれないが、少なくともヒトはいい相手ではない。だから暴れてしまうのではないか」

私たちはウイルスとの一対一の対決に力を注ぎがちだが、ウイルスの策略を知るには多くの生物が織りなす生態系への理解が不可欠だと芋虫の研究は物語っている。(下野谷涼子)

日本経済新聞 
(2021年8日22日)



以下は記事の感想です。この「蜂殺し遺伝子」の話は、前回の No.348「蚊の嗅覚は超高性能」に書いた、東京慈恵会医科大学の近藤教授の発言を思い起こさせます。再掲すると以下です。


昔からウイルス学者の言い伝えになっている言葉は「最も頭の悪いウイルスでも、最も頭のいいウイルス学者より賢い。」

ウイルスは自分の力で増えることができない。必ず寄生しないといけないので、ヒトに寄生しているウイルスは、生存戦略としてヒトの体のことをものすごくよく知っている。我々がいくらヒトの体を研究してても、ウイルスの命がけの戦略にはまだまだ勝てない。

東京慈恵会医科大学 ウイルス学講座 近藤一博教授
「ヒューマニエンス 49億年のたくらみ」より
(NHK BSP 2022年10月4日 22:00~23:00)

「ウイルスの策略を知るには多くの生物が織りなす生態系への理解が不可欠」と、日経新聞の記事の最後にありました。人間のウイルスについての理解は、マクロ的にみると "始まったばかり" か、それが言い過ぎなら "初期段階にある" と言えるのでしょう。




nice!(0) 

No.348 - 蚊の嗅覚は超高性能 [科学]

今まで何回か生物の "共生" について書きました。たとえば、
では、アフリカのサバンナにすむノドグロミツオシエという鳥が動物を蜂の巣へ誘導する行動が、かつてアフリカにいた絶滅人類との共生関係で成立したのではないかとする、ハーバード大学のランガム教授の仮説を紹介しました。また、
では、人体に住む常在菌(特に腸内細菌)が、人体に数々のメリットを与えていることをみました。

生物界における共生、ないしは依存関係で最も知られているのは、植物と昆虫の関係でしょう。植物は昆虫によって受粉・交配し、昆虫は蜜などを得る(=栄養として子孫を残すことに役立つ)という関係です。植物は昆虫にきてもらう為にいろんな手を尽くします。

オーストラリアに自生するある種のランは、特定の蜂のメスに擬態し、その蜂のオスが間違えて交尾にやってくると、可動する雄蕊おしべで花粉を蜂の背中につけるものがあります。こうなると、ランが蜂を「利用している」という印象になりますが、進化のプロセスが作り出したしくみは誠に奥深いというか、非常に巧妙だと思わざるを得ません。

ところで最近、植物と昆虫の関係に似た話が日本経済新聞に載っていました。それは「ウイルス」と、ウイルスを動物間で媒介する「蚊」の関係です。ちょっと信じがたいような内容だったので、それを紹介したいと思います。中国の清華大学のチームの成果です。


ウイルスが蚊をおびき寄せる


以下は、日本経済新聞のサイエンスエディター、加藤宏志氏の署名がある記事です。


ウイルスは私たちの体を蚊が舌なめずりするようなごちそうに仕上げる ──。中国の清華大学が率いるチームが暴いたウイルスの策略は信じ難い内容だった。

実験でウイルスに感染したネズミは体の一部のたんぱく質の働きが弱まり、皮膚にすむ微生物の均衡が崩れた。アセトフェノンと呼ぶ成分を作る微生物が増え、おいしそうなにおいが体から漂い始める。このにおいが多くの蚊を呼び寄せる。子どもたちの前に焼きたてのクッキーを持ってきた状況と同じだという。

血液に紛れたウイルスは血を吸う蚊に乗り移り、次の人へと渡る。訪れる蚊の数が多いと、ウイルスの乗り物は増える。感染を広げるには好都合だ。

出来すぎた話に思えるが「患者のにおい成分も蚊を引き寄せた。動物実験では、におい成分を抑えると近づく蚊が減った」とチームの一人はいう。この種のウイルスが頼りにしていたのは、蚊の鋭い嗅覚だった。

日本経済新聞 
(2022年9月18日)

蚊の嗅覚.jpg
上の内容を図に表したもの。ウイルスが蚊を宿主におびき寄せ、他の宿主に感染を広げるチャンスを増やす。日本経済新聞(2022年9月18日)より。

記事を書いた加藤氏は「信じ難い内容」としていますが、確かにそうです。内容は主に動物実験ですが、「患者のにおい成分も蚊を引き寄せた」とあるように、ウイルスに感染した患者のにおい成分は、普通の人のにおい成分よりも蚊を引きつけた(そういう実験をした)ということでしょう。記事には実験(検証)に使ったウイルスの種類が書いてありませんが、特定のウイルスで実験したのだと推測します。特定のウイルスだとしても巧妙なしくみです。

しかし、冒頭に書いた「特定のランと特定の蜂」の関係のように、ウイルスも含めた生命体が子孫を残す、ないしは子孫を増やすやりかたは巧妙です。しかもウイルスは単独では死滅するしかなく、宿主に寄生して数を増やすしかない。ということは、現在生き残っているウイルスは "極めて巧妙精緻な" やりかたで数を増やしてきた、ないしは、生き残ってきた、死滅しなかったと想像できます。上の記事のような状況があったとしても、不思議ではありません。

そして、このウイルスの "策略" が成り立つ要因は、「蚊の嗅覚が異常に鋭い」ということなのです。


世界保健機関(WHO)によると、蚊が病原体を運ぶマラリアは2020年に推定で62万7千人をあやめた。デング熱は毎年約1億人が発症するとされる。途上国は医療体制が整わないとはいえ、全ての元凶は蚊が人間のにおいや呼気の二酸化炭素を嗅ぐ能力の高さに行き着く。

日本経済新聞 
(2022年9月18日)

記事によると蚊の嗅覚は、「生物界の共通原則」を逸脱しているようです。


嗅覚を惑わしさえすれば刺されない。こんな希望は最新の研究で落胆に変わる。米ロックフェラー大学などのチームは8月、蚊の嗅覚は型破りだったとする論文を発表した。蚊は、においを察するセンサー(受容体)が通常の生物に比べて不釣り合いに多かった。

生物の鼻は、においの情報を脳に伝える細胞ごとに1つのセンサーがある。センサーが同じ細胞同士は先で1点につながる。この「1対1対1」となる嗅覚の原則は機能面で理にかない、生物では常に成り立つとチームは考えていた。

だが蚊は原則から外れる。センサーが多い理由はまだよくわからないとマーガレット・ヘレ博士はいう。「多くのセンサーがあれば、一部が壊れても人間のにおいを嗅げる。人間のにおいは数百種類が混ざり合う。微妙に異なるタイプの人間のにおいを検知できるのかもしれない」

日本経済新聞 
(2022年9月18日)

書いてある内容がちょっと専門的でわかりにくいのですが、調べてみると、生物界に共通する嗅覚のしくみは、まず臭いを検知する1つの受容体をもつ嗅細胞があり、そこからニューロン(神経繊維)が出て、臭いを判断して脳に送る嗅覚糸球体へと繋がっている。この対応は「1:1:1」が原則である。しかし蚊は複数の受容体を嗅細胞が持っているので原則からはずれる。そう解釈できます。これが蚊の鋭い嗅覚にどうつながるのか、その解明はこれからのようです。

蚊の嗅覚の鋭さについては、記事に次のような例が書いてありました。


蚊のすごみに関する話は事欠かない。東京慈恵会医科大学の嘉糠洋陸教授は「A 氏を好む蚊は B 氏が同席していても『無き者』として扱い、A 氏の血を吸う。その場に1人なら、好みにはこだわらない」と語る。

「殺虫剤を浴びて命拾いした蚊はネガティブな経験を感覚で学び、次から殺虫剤をかけた場所を避ける」。英キール大学のフレデリック・トリペ博士が突き止めたのは修正能力だ。

日本経済新聞 
(2022年9月18日)

BSテレ東「居間からサイエンス」(2022年10月17日)によると、人間を殺す生物ランキング(年間死者数)は、

1位 72万人
2位 人間 47万人
3位 ヘビ 5万人
 (出典:ビル&メリンダ・ゲイツ財団)

だそうです。もちろん、感染症の流行や戦争で死者数は変動するでしょうが、この数字はそういうことがない "定常状態" の値だと推測します。日本経済新聞の記事もこう結ばれていました。


世界で最も人を殺す動物は? かつてこんなクイズがあったが、今も答えは蚊のままだ。好ましからざる小さな相手に世界中の科学者らが熱い視線を送る現状が対策の難しさを物語る。(サイエンスエディター 加藤宏志)

日本経済新聞 
(2022年9月18日)


蚊の能力


記事に登場した東京慈恵会医科大学の嘉糠かぬか洋陸ひろたか教授は、NHK Eテレの、サイエンス ZERO「恐ろしくも華麗な "蚊" - 秘められた力を解明せよ」(2022年9月25日)に出演されました。

この番組ではまず、世界で最も人の命を奪っている生物は蚊、だとし、蚊が媒介する感染症で奪われる命は、年間、世界で72万人と紹介しています(ビル&メリンダ・ゲイツ財団の値と同じ)。感染症としてはマラリア、デング熱が代表的で、そのほかに日本脳炎や西ナイル熱もあります。最も人の命を奪っている生物だからこそ、蚊は世界中で研究されているのです。この番組の中で嘉糠教授は次のような内容を語っておられました。

◆ 全ての蚊が血を吸うのではない。日本にいる蚊で血を吸うのは 110種類中の3割である。またオスの蚊は血を吸わない。血を吸わない蚊は花の蜜などで栄養をとる。

◆ メスの蚊で、しかも交配済みのメスが血を吸う。未交配のメスは血を吸わない。

◆ 血液は栄養豊富なサプリメントである。蚊は血液を濃縮して濾しとったタンパク質で卵を作る。そうすることで効率良く、迅速に卵を作れる。つまり次の世代をどんどん作れる。

◆ 吸血する蚊の一種、ヒトスジシマカは、1回の吸血で200個前後の卵を生む。血を吸わない蚊はだいたい40~50個である。

◆ 人間は蚊に刺される運命にある。動物はたくさんの毛で覆われていて皮膚も厚く、蚊にとっては刺しにくい生き物だ。人間は毛が少なくて皮膚も薄く、蚊にとっては「どうぞ血を吸ってください」という生き物である。

◆ 現代は歴史上、人口が最も多い時期にある。従って蚊も生命の歴史上、最も数が多い時期にある。

◆ 蚊が人間を感知する仕組みは、距離によって4種ある。
① ヒトの呼吸中の二酸化炭素を感知する。これは10メートル離れていても可能である。
② 3~4メートルにくると、ヒトの臭いを感知する。
③ 1メートルの範囲では熱を察知する。
④ 最終的には、色でヒトの皮膚を判断する。

◆ 血液型が O型の人は、他の血液型の人より2倍程度、蚊に刺されやすい。我々も野外で研究用の蚊を集めるときに、O型の大学院生を "おとり" にして、その学生に寄ってくる蚊を捕獲したりする。なぜ O型が刺され易いのかは最新科学でもまだ謎である。

1メートル以内に蚊をおびき寄せるもののうち、① 二酸化炭素、③ 熱(赤外線)は、ヒトによる違いがないはずです。問題は ② の「臭い」で、これはヒトによって微妙に違うはずです。

日本経済新聞にあった嘉糠教授の「A 氏を好む蚊は B 氏が同席していても『無き者』として扱い、A 氏の血を吸う。その場に1人なら、好みにはこだわらない」との発言をみても、蚊が臭い(= ヒトが放出する化学物質)の微妙な違いを検知していることをうかがわせます。なお、10メートル離れても感知できる ① 二酸化炭素 も、嗅覚の働きです。


蚊を忌避する新戦略


「嗅覚を惑わしさえすれば刺されない。こんな希望は最新の研究で落胆に変わる。」と記事にあるように、蚊の臭いを感知する能力は極めて鋭敏なため、嗅覚を混乱させて蚊から逃れようとするのは困難なようです。

しかし最近、全く新しい原理で蚊を忌避する方法が開発されました。サイエンス ZEROに登場した、花王・パーソナルヘルスケア研究所の仲川喬雄たかお氏が次のような内容を語っていました。

◆ 蚊の足には微細構造があり、超撥水性がある。つまり、微細構造の中に空気が入り込み、水に浮くことができる。そのような超撥水性の足は、逆に、水と正反対の性質をもつオイルに馴染みやすい。

◆ 化粧品や日用品に使われる低粘度のシリコンオイルを肌に塗布すると、蚊が肌にとまったとき、毛細管現象で微細構造の中にオイルが吸い上げられる。その結果、オイルの表面張力で蚊の足を下に引き込む力が発生する(蚊に作用する重力の80%以上)。

◆ この力を蚊は敏感に感知し、一瞬で肌から離れる。

◆ この原理を使った忌避剤を、すでにタイで商品化した。

物理的作用で蚊を忌避する発想、蚊が肌にとまってもよいが刺されないとする考え方が斬新です。肌につける各種の液を長年研究してきた花王の技術力がベースにあるのでしょう。この花王の新商品は、ひょっとしたらマラリア蔓延国にとっての救世主になるかもしれません。


ウイルスの策略


話を最初のウイルスに戻します。蚊は人間を利用して子孫を残そうとし、そのために人間を感知する能力を高度に発達させました。一方、"蚊に刺される運命にある" 人間は、何とかそれを回避しようと(蚊が媒介する感染症による死者を減らそうと)知恵を絞っている。しかし、この "人間と蚊の戦い" の上を行くのがウイルスかもしれません。

同じ NHK の番組ですが、2022年10月4日放送の「ヒューマニエンス」(BSプレミアム)で、東京慈恵会医科大学のウイルス学者・近藤教授が次のように語っていました。


昔からウイルス学者の言い伝えになっている言葉は「最も頭の悪いウイルスでも、最も頭のいいウイルス学者より賢い。」

ウイルスは自分の力で増えることができない。必ず寄生しないといけないので、ヒトに寄生しているウイルスは、生存戦略としてヒトの体のことをものすごくよく知っている。我々がいくらヒトの体を研究してても、ウイルスの命がけの戦略にはまだまだ勝てない。

東京慈恵会医科大学 ウイルス学講座 近藤一博教授
「ヒューマニエンス 49億年のたくらみ」より
(NHK BSP 2022年10月4日 22:00~23:00)

新型コロナウイルスとの "戦い" に人間がてこずるのはあたりまえなのでしょう。また、完全撲滅は難しいのでしょう。ただ、近藤教授は「まだまだ勝てない」と言っていて「勝てない」という表現ではありません。ウイルスには(そしてヒトには)未解明のことが多々あるということだと思います。もちろん蚊についても ・・・・・・。




nice!(0) 

No.347 - 少なくともひとりは火曜日生まれの女の子 [科学]

No.149「我々は直感に裏切られる」No.325「高校数学で理解する誕生日のパラドックス」でとりあげた「誕生日のパラドックス」から話を始めます。

有名な「誕生日のパラドックス」は「バースデー・パラドックス」とも言われ、

23人のクラスで同じ誕生日のペアがいる確率は 0.5 を超える

というものです。これは正確に言うとパラドックスではなく "疑似パラドックス" です。パラドックスとは「一見すると妥当そうに思える推論から、受け入れがたい結論が導かれること」ですが、疑似パラドックスは「数学的には全く正しいが、人間の直感に反するように感じられる結論」です。

この "疑似パラドックス" が成り立つ理由を一般化して言うと、「確率が直感に反することが多々ある」でしょう。さらにもっと一般化すると「確率は難しい」ということだと思います。裏から言うと「誤った確率の使い方は人を誤解に導く」ともなるでしょう。誤っていることが往々にして分からないからです。

我々は「コインを投げたとき、表が出る確率は 1/2」とか「サイコロを振ったとき 1の目が出る確率は 1/6」のように、"確率を理解している" と思っているかもしれません。「2つのサイコロを振ったとき、2つとも 1 の目が出る確率は 1/36」もよいでしょう。しかし、我々が常識の範囲で理解できるのは、せいぜいこのあたりまでで、ちょっと込み入ってくると手に負えなくなってしまうようなのです。

イアン・スチュアート著「不確実性を飼いならす ── 予測不能な世界を読み解く科学」(徳田 功訳。白揚社 2021)を読んでいたら、確率に関することがいろいろ出ていました。イアン・スチュアートは世界的に著名なイギリスの数学者です。その本の文章をちょっと紹介します。


確率に対する人間の直感は絶望的だ

偶然の出来事が起こる確率をすばやく推定するように促されると、たいていはまったく間違った答えを出す。プロの賭博師や数学者のように鍛錬を積めば改善はできるが、時間も労力も必要だ。何かが起こる確率を即断しなければならないとき、私たちの答えは誤っていることが多い。

イアン・スチュアート
「不確実性を飼いならす」
第6章 誤謬とパラドックス
(徳田 功・訳。白揚社 2021)

イアン・スチュアートは「確率に対する人間の直感は絶望的」の典型例として、まず、モンティ・ホール問題をあげています。


モンティ・ホール問題


モンティ・ホール問題は確率に関する有名な問題です。モンティ・ホールとは、かつてのアメリカのテレビのゲーム・ショー番組「取引しよう」の初代司会者の名前です。

そのテレビ番組で行われたのは次のようなゲームです。3つの独立した部屋があり、前面にドアがあって閉じられています。3つの部屋のうちの1つには特別賞のクルマが、残りの2つには残念賞のヤギが隠されています。

クルマを当てたい回答者が一つのドアを選びます。ドアが開けられた時点で、そこにあるものはクルマであれヤギであれ、回答者のものになります。

そのとき司会者は、回答者が選ばなかった2つのドアのうち、ヤギがいる一つのドアを開けてヤギを見せます。そして回答者に「選ぶドアを変更してもよい」と言って、選び直しの機会を与えます。

クルマが欲しい回答者はどうすべきでしょうか。これが問題です。

クルマがあるのは、最初に回答者が選んだドアか、まだ開けられていないもう一つのドアか、そのどちらかです。従って「選び直しても、選び直さなかったとしても、クルマが当たる確率は同じ」と考えてしまいそうです。実際に回答者になって現場にいたとしたら、直感はそうでしょう。

さらに回答者としては「心理的な」直感も働く可能性が高い。つまり、司会者がわざわざ一つのドアをあけて「選び直してもよい」と言ったということは、選び直すように誘導しているに違いないと思う直感です。この2つの直感によって、回答者は選び直さない可能性の方が大きいと考えられます。



しかし真実は全く違います。クルマが当たる確率は、選び直した方が、選び直さないよりが2倍高いのが正解です。

これは次のように考えると分かります。ドアを A、B、C の3つとし、最初に回答者が A を選んだとします。クルマがあるのは A、B、C のどれかであり、この3つのケースの確率は全く同じです。

クルマが A にある確率は 1/3 です。この場合は「選び直さない方がよい」わけです。司会者が B か C のドアをあけてヤギを見せたとしても「選び直さない方がよい」のは変わらない。司会者がドアをあけたことでクルマは移動しないからです。

クルマが B にある確率は 1/3 であり、この場合は「選び直した方がよい」わけです。司会者が C のドアをあけてヤギを見せたとしても「選び直した方がよい」のは変わらない。選び直すとしたら B しかありません。つまり、この場合は選び直すと必ずクルマをゲットできることになります。

クルマが C にある確率も 1/3 で、この場合も「選び直した方がよい」わけです。司会者が B のドアをあけてヤギを見せたとしても「選び直した方がよい」のは変わらないし、選び直すと必ずクルマをゲットできます。司会者が、わざわざ選び直しの対象としての B を除外してくれたのだから ・・・・・・。

以上で「選び直さない方がよい」ケースは3回に1回起こり、「選び直した方がよい」ケースは3回に2回起こります。この状況は、最初に回答者が選んだドアが B でも C でも全く同じです。

従って、クルマが当たる確率は、選び直した方が、選び直さないよりが2倍高い、となります。



納得できたでしょうか。

NHK総合の「笑わない数学」の「確率論」(2022年9月21日放送)では、この問題を実際に実験していました。3つの箱の一つに景品を隠す実験です。回答者役と司会者役を2組用意し、一方の回答者は「必ず選び直す」、もう一方の回答者は「必ず選び直さない」とします。それぞれ100回の試行した結果、景品をゲットできた数は、

必ず選び直す回答者  : 70回
必ず選び直さない回答者  : 33回

でした。選び直した方が2倍有利という確率論の結果が(実験であるがゆえの誤差を含みつつ)実証されたわけです。実験は大切です。



それでも、なぜそうなるのか納得できないという人もいるのではないでしょうか。


ドアが10個だとしたら


イアン・スチュアートの本では、それでも納得できないという人のために、ある仮想実験による説明をしています。トランプの52枚のカードを使ったものですが、同じことなので「10個のドア」に焼き直して紹介します。もちろん、実際にはあり得ない仮想実験です。

モンティ・ホール問題と基本的に同じです。ただしドアは10個あります。そのうちの一つにクルマが隠されていて、残りの9個には何もありません(ヤギを9匹用意するのは大変なので)。

あなたは司会者から1つのドアを選ぶように言われます。もしそこにクルマがあったとしたら、あなたのものになります。何もなければ、賞品は無しです。

1つのドアを選んだあなたはどう考えるでしょうか。「クルマが隠されているドアを選ぶ確率は 1/10 である。これは、まず当たらないな」と考えるのが普通でしょう。10回チャレンジしてようやく1回当たるかどうかという確率です。ほとんど無理と思うでしょう。

ところがです。司会者はあなたが選ばなかった9個ドアから8個を選び、それを次々と空けて、そこには何もないことを示したのです。そしてこう宣告します。「あなたが選んだドアのほかに、まだ閉じらているドアが1つあります。今からドアの選択を変えるチャンスをあげましょう。変えても、変えなくてもどちらでもよい。どうしますか?」



・・・・・・ という状況だったら、あなたは間違いなくドアの選択を変えるはずです。だってそうでしょう。最初に選択したドアにクルマがある確率は 1/10 で、ほぼハズレです。選択しなかった9個のドアのどれかにクルマがある確率は 9/10 です。ほどんどの場合、その9個のうちのどれかにクルマがあると、誰にでもわかる。

しかし、その9個のドアのうちの8個にはクルマがないことが分かってしまった。わざわざ司会者がそう示してくれたのです。とすると、残りの1個に高い確率でクルマがあるに違いない。確率的には、選択を変えた方が変えないよりも9倍、クルマをゲットできる可能性が高いことになります。



この「10枚のドア」の状況は、モンティ・ホール問題の「3枚のドア」と全く同じ構造をしています。「10枚のドア」ではなく「100枚のドア」でも問題の構造は同じです。100枚のドアだと、ドアの選択を変えると 99% の確率でクルマがゲットできる。つまり、ほぼ確実にクルマがもらえることになります。


2人とも女の子の確率


イアン・スチュアートの本ではさらに「確率と人間の直感」を考える問題として、


スミス夫妻には2人の子どもがいます。2人とも女の子である確率はどれだけですか。


という問題と、その変形問題が示されています。まず前提として、子どもがいたとき、それが「男の子」か「女の子」かはどちらかに決まっているとします。常識的にはあたりまえなのですが、生物学的には男女の区別が曖昧というケースもあって、必ずしも正しくはない。しかしこういった生物学的な議論は無しにして、男か女のどちらであるとします。

さらに一番重要なのは、男の子が生まれる確率と女の子が生まれる確率は全く同じ、という前提です。これも生物学的にはそうではなく、人間においても男が生まれる確率がわずかに大きいことが知られています。また「男女の産み分け」も行われていて、そうなると半々だとはますます言えなくなります。しかしそういったことは一切抜きにして「男の子が生まれる確率と女の子が生まれる確率は全く同じ」が前提です。

さらに以下の説明で使うのでコメントしますが、2人の子どもを「第1子」と「第2子」と表現します。同時に生まれた双子だったとしても、兄・姉/弟・妹の区別をするので、兄・姉と呼ばれている子を「第1子」とします。

以上の前提のもと「スミス夫妻には2人の子どもがいます。2人とも女の子である確率はどれだけですか」という質問に対する答えは 1/4 が正解です。これは多くの人が納得でしょう。

高校などで、確率を習い始めの生徒がよくやる間違いは、子どもの組み合わせは「2人とも男」「男女一人ずつ」「2人とも女」の3つだから、答えは 1/3 とする間違いです。

この手の間違いを防止するために、ちょっと数学的になりますが、イアン・スチュアートの本にある「標本空間」と「標的事象」で考えてみます。

「標本空間」とは「起こりうる全ての事象をもれなく集めた集合」であり、「標的事象」とは、いま確率を問題にしている事象のことです。スミス夫妻の問題の場合の「標本空間」と「標的事象」を図で表すと、次のようになります。左側の青が「標本空間」、右側の赤が「標的事象」です。

標本空間・標的事象1.jpg
「2人の子どもがいます」の標本空間(左、青)と「2人とも女の子」に相当する標的事象(右、赤)

図で分かるように、標本空間には4つの事象があり、その確率は同じです。標的事象(2人とも女の子)は1つですから、答えは 1/4 です。


少なくともひとりは女の子


問題を少し変えます。


スミス夫妻には2人の子どもがいて、少なくともひとりは女の子です。2人とも女の子である確率はどれだけですか。


この問題では、標的事象(2人とも女の子)は前の問題と同じですが「少なくともひとりは女の子」という情報が追加されたため、標本空間が変化します。標本空間は3つ、標的事象は1つですから、答えは 1/3 です。

標本空間・標的事象2.jpg
「2人の子どもがいて、少なくともひとりは女の子」の標本空間(左、青)と「2人とも女の子」に相当する標的事象(右、赤)



ここまでは納得の範囲ではないでしょうか。少なくともひとりは女の子という情報が追加されたために、2人とも女の子の確率が上がった。最初の問題では 1/4 だった確率が 1/3 になる。直感とも合っているはずです。しかし問題になるのはこの次です。


少なくともひとりは火曜日生まれの女の子


さらに問題を少し変えます。


スミス夫妻には2人の子どもがいて、少なくともひとりは火曜日生まれの女の子です。2人とも女の子である確率はどれだけですか。


前提として「子どもが生まれる曜日はどの曜日も同じ確率」とします。この前提は現実社会では必ずしも正しくなく、「どの曜日もほぼ同じ確率」が正しいのですが、問題としては「同じ」とします。

この問題の答えは 13/27 です。えっ! と思うでしょう。"火曜日生まれの" という "些細な" 情報が追加されただけで、確率は劇的に変わってしまった。13/27 というと、ほぼ 1/2 の値です。1/4 が 1/3 になったよりも変化が大きい。全く直感に反しています。

そして、全く直感に反しているため、これは理にかなっていない、間違っている、と感じるのではないでしょうか。生まれた曜日など確率に関係ないと考える方が理にかなっている ・・・・・・。

しかし 13/27 は正しいのです。それは標本空間と標的事象を作ってみればわかります。この問題の標本空間を作るため、男女のそれぞれを曜日で7分割した図を用意します。

標本空間3a.jpg
男女のそれぞれを曜日で7分割した図。これは「2人の子どもがいます」という条件だけなら、この 14 × 14 = 196 のマス目の確率は全く同じである。

この図には 14 × 14 = 196 のマス目があります。もし単に「2人の子どもがいます」なら、この196の事象が起きる確率は全く同じです。

この図に「少なくともひとりは火曜日生まれの女の子」という条件を加味した標本空間を青く塗ってみると次の通りとなります。

標本空間3b.jpg
「2人の子どもがいます。少なくとも一人は火曜日生まれの女の子」の標本空間。マス目は 27 になる。

さらに、この標本空間の中に含まれる標的事象(=2人も女の子)を赤で塗ると、次の図になります。

標的事象3.jpg
標本空間の中で「2人とも女の子」に相当する標的事象。マス目は 13 である。

標本空間のマス目の数は 27、標本空間の中の標的事象のマス目の数は 13 なので、問題の解答は 13/27 です。問題には「火曜日」としましたが、これが何曜日であっても答は同じです。

これは、いわゆる「条件付き確率」です。

少なくとも一人は女の子

の条件では、女の子は「ひとりの可能性」と「2人の可能性」があって、2人の可能性は 1/3 です。この場合、2人の女の子を区別できる情報はありません。

これに「女の子が2人だった場合に、その2人を区別できる可能性を高める情報」が付け加えられると、その区別可能性が高いほど2人である確率は高まります。たとえば、"火曜日に生まれた" より区別可能性が高い情報を付け加えた例ですが、


スミス夫妻には2人の子どもがいて、少なくとも一人は第1子の女の子です。2人とも女の子である確率はどれだけですか。


という問題にすると、第1子はひとりしかいないので、答えは 1/2 となります。"火曜日生まれ" だと、2人とも火曜日生まれの可能性があって、必ずしも2人を区別できない。"第1子" は2人の女の子を区別するのに絶対に確実な情報です。

少なくともひとりは女の子だけれど、それが第1子か第2子かという情報(やその他の情報)が全くない状況では、確率が 1/3 に減ってしまうのです。

"火曜日に生まれた" より区別可能性が低い情報を付け加えた例を作ってみます(これはイアン・ステュアートの本にはありません)。男女とも血液型が A 型である確率を統計的に 50% とすると、


スミス夫妻には2人の子どもがいて、少なくとも一人は血液型がA型の女の子です。2人とも女の子である確率はどれだけですか。


の答えは、3/7 になり、13/27 と 1/3 の間の数になります。


確率は直感に反する


最初の「モンティ・ホール問題」は直感に反するように思えます。ただ、3つのドアではなく「10個のドア」とか「100個のドア」で説明されると、なるほどそうかという気にもなる。

しかし「少なくともひとりは火曜日生まれの女の子」問題は、いくら理論的に説明されても直感的には納得できません。

この話の教訓は「"正しい確率" は理解が難しい」ということであり、「"正しい確率" が直感に反するのは、むしろ当然」ぐらいに思った方がよいということだと思います。

このことを全く逆から言うと、「確率を持ち出して、そこからいかにも直感に合致する結論を主張する言説」があったとしたら、サイコロの目とかコインの裏表のように誰がみても明らかなものを除いて、そもそもその持ち出された "確率" なるものが怪しいのでは、と疑ってみた方がよいと言えるでしょう。

なぜなら、イアン・ステュアートが言っているように「確率に対する人間の直感は絶望的」であり、平たく言うと "正しい確率は直感と合致しない" のだから ・・・・・・。




nice!(0) 

No.345 - "恐怖" による生態系の復活 [科学]

No.126-127「捕食者なき世界」の続きです。No.126-127は、生態系における捕食者の重要性を、ウィリアム・ソウルゼンバーグ著「捕食者なき世界」(文春文庫 2014)に沿って紹介したものでした。

生態系において捕食者(例えば肉食獣)が、乱獲などの何らかの原因で不在になると、被捕食者(例えば草食動物)が増え過ぎ、そのことによって植物相が減少する。最悪の場合は草食動物もかえって数が減って生態系の荒廃が起こり得る。このようなことが、豊富な実例とともに示されていました。

生態系における「捕食・被捕食」の関係は、動植物の種が複雑に絡み合うネットワークを形成していて、そのネットワークには「不在になると他の種に連鎖的な影響を及ぼす種」(= キーストーン種。キーストーンは "要石かなめいし" の意味)があります。食物連鎖の頂点に位置する肉食獣は代表的なキーストーン種なのでした。

ところで、最近の NHK BS1 のドキュメンタリーで、人的要因によって激変してしまった生態系を、捕食者の再導入によって元に戻そうとするプロジェクトが放映されました。その番組は、

NHK BS1 BS世界のドキュメンタリー
2022年8月9日 15:00~15:45)

"恐怖" でよみがえる野生の王国」
Nature's Fear Factor)
 制作:Tangled Bank Studios(米国 2020)

です。今回はこの番組の概要を紹介します。日本語題名に「"恐怖" でよみがえる」とあり、また原題の意味は「自然の要素としての "恐怖"」です。つまり "恐怖" が重要なテーマになっています。これは、

捕食者は、単に被捕食者を殺して食べるだけでなく、被捕食者に常に "恐怖" を与えており、そのことによって被捕食者の行動は制限され、これが生態系維持の重要な要素になっている」

という意味です。このことは以降の概要で詳しく出てきます。プロジェクトの主役 = 捕食者は、アフリカに住むイヌに似た肉食獣の "リカオン" です。


ゴロンゴーザ国立公園とその荒廃


東アフリカのモザンビークにあるゴロンゴーザ国立公園は、アフリカの国立公園の中でも特に豊かな自然に恵まれている公園です。

ゴロンゴーザ 1.jpg
ゴロンゴーザ国立公園
サバンナ、林、氾濫原、湖、川、熱帯雨林などが複雑に入り組んだ自然生態系を成している。番組より。

モザンビークでは独立後、1970年代から15年以上ものあいだ、政府軍と反政府勢力の激しい内戦が続きました。この内戦による犠牲者は 100万人にのぼるとされています。

この内戦のあいだ、ゴロンゴーザ国立公園は反政府勢力の格好の隠れ家になり、戦場にもなったので、荒廃してしまいました。戦乱と密猟によって大型の哺乳類の数が激減してしまったのです。20年前の調査では、大型の哺乳類の数が内戦前に比べて 1/10 以下に減少していました。たとえば、

象 :  2500 → 250
カバ :  3500 → 100未満
ライオン :   200 → 10
シマウマ :  3500 → 0
ヌー :  6500 → 0
アフリカ水牛 : 14000 → 0

といった悲惨な状況です。ゴロンゴーザ国立公園の復活は不可能だと思われました。

しかし希望がありました。それは豊かな自然環境です。ゴロンゴーザ国立公園は、サバンナ、林、氾濫原、湖、川、熱帯雨林などがモザイク状に入り組んでいます。この自然環境がそのまま残っていたのです。


ゴロンゴーザ再生プロジェクト


世界各地からも専門家が集まって官民共同の「ゴロンゴーザ再生プロジェクト」が結成されました。このプロジェクトによって、大きく数を減らした動物の一部は他の地域から持ち込まれました。こうした努力の結果、動物の生息数は回復しつつあります。特に、草食動物の生息数は内戦前に近づきつつあります。

素晴らしいことのよう思えますが、専門家の判断によると健全な生態系の回復ではありません。動物によって増え方に偏りがあり、以前のような多様性が失われたのです。たとえば、一部の動物だけが急速に数を増やしています。中でも、ウォーターバックの数が爆発的に増えました。生息総数は6万頭に迫る勢いで、これは内戦前の10倍以上です。

ウォーターバック(雌).jpg
ウォーターバック(雌)
(Wikipedia)

「多種多様な生き物がそれぞれに適した場所で生息し、全体として安定した生態系を作っている」という、本来あるべき姿ではないのです。なぜ動物の数が偏るのでしょうか。この問題の解決策を探るべく、ゴロンゴーザ再生プロジェクトでは生態系の地道な調査をはじめました。


ブッシュバックの奇妙な行動


生態系の調査で判明したことの一つに、アンテロープ(=レイヨウ)の一種で、本来警戒心が強いブッシュバックの奇妙な行動があります。ブッシュバックはその名のとおり、本来なら茂みに隠れて暮らします。しかし林を離れて、開けた氾濫原に行動範囲を広げていました。より栄養がある食べ物を求めて氾濫原に踏み出したと考えられました。

ブッシュバック(雌).jpg
ブッシュバック(雌)
(Wikipedia)

草食動物がどの種類の草を食べているのか、糞を採取して調べること可能です。3年間で3000以上ものブッシュバックの糞が集められ、アメリカのプリンストン大学に送られました。含まれる植物のDNA分析の結果、氾濫原のブッシュバックは林の中の個体より栄養価の高い草を食べていることが分かりました。その結果、氾濫原に踏み出したブッシュバックは体が大きくなり、子どももたくさん作れるのです。


草食動物の食性変化


プロジェクトではさらに、ゴロンゴーザ国立の主な草食動物が何を食べているかを分析し、ケニアの似たような国立公園と比較しました。ケニアの草食動物は、種によって食べるものがはっきり分かれていました。一方、ゴロンゴーザでは複数の種が同じ物を食べていました。

ゴロンゴーザ 2.jpg
草食動物の食性の比較
[ケニア(左)とゴロンゴーザ(右)]
色の違いは草食動物の種を表し、ブッシュバック、ウォーターバック、リードバック、インパラ、オリビの5種である。点は個体で、個体が食べた草の種類によって3次元グラフにプロットし、それをある方向から2次元的に見たのが上の図である。ケニアの5種の草食動物は食性が分離しているが、ゴロンゴーザでは食性が重なっている。番組より。

動物たちがあらゆる場所に進出し好きなものを食べるようになった結果、食性における "種の境界線" が崩壊していたのです。こうなると過度の争いが起き、生態系が崩れてきます。


捕食者の不足


根本原因は2つの不足でした。「捕食者」と「恐怖」です。ゴロンゴーザにおける捕食者は、ライオン、ハイエナ、ヒョウ、チータ、リカオンでしたが、内戦が続いた結果、わずかなライオンを除いて姿を消しました。この結果、草食動物が "恐怖心"、つまり「他の動物の餌食になることを恐れる気持ち」を忘れたのです。


捕食者の役割は獲物をとって食べること、それ以外の側面は最近まで検証されてきませんでした。でもそれでは捕食者の存在意義の過小評価することになります。自然を俯瞰して見れば、捕食者たちが遙かに大きな役割を担っていることが分かります。

天敵の攻撃を避けるには、常に周囲を警戒していなければなりません。そうすることで生き延びるチャンスを増えますが、好きなだけ草を食べることはなかなかできなくなります。天敵のいない環境と比べると、警戒を強いられる環境では栄養状態が劣り、子どもの数も少なくなります。

リアナ・ザネット
ウェスタン大学 生態学者

本来、動物は捕食者の存在を意識し、襲われたときに不利になるような環境や地形を避けて行動範囲を決めています

このことを昆虫で明らかにした実験があります。森の中の草地に2種のネットを設置し、1種のネットにはバッタだけ、もう1種のネットにはバッタとその天敵の蜘蛛をいれます。そうすると、蜘蛛がいるネットのバッタは天敵から身を隠すのに適した植物を食べるので、体が小さくなりました。一方、蜘蛛がいないネットのバッタは、栄養が豊富な植物を食べるので体が大きくなり、繁殖数を増やしました。つまり「捕食されにくい行動」と「子孫を多く残す行動」のトレードオフ関係がみられたのです。



プロジェクトでは、ゴロンゴーザの生態系の荒廃を回復させるため、捕食者の再導入が計画されました。実は25年前、米国のイエローストーン国立公園ににオオカミが再導入され、成果をあげていました(No.126-127「捕食者なき世界」参照)。

しかしゴロンゴーザの動物は、もう何世代も捕食者のいない環境が続いています。果たして、今でも捕食者を恐れる行動をとるのでしょうか。

ゴロンゴーザ 3.jpg
氾濫原に進出したブッシュバック。番組より。

そこでまず、氾濫原のブッシュバックがヒョウの声に反応するかどうかの実験が行われました。ヒョウの声を録音し、氾濫原にスピーカーを設置して、何日かはただの雑音を流し、別の日にヒョウの声を流しました。すると、ヒョウの声でブッシュバックの行動が一変し、生息域を変えてヒョウの声を避けるようになったのです。

声だけで変化を起こせるのなら、本物の捕食者はもっと大きな変化を起こせるはずです。これで捕食者の再導入が決まりました。捕食者として選ばれたのはリカオンです。


リカオンの再導入


リカオン.jpg
リカオン
(Wikipedia)

リカオンは体にまだら模様があり、格好はイヌに似ています。しかし約150万年前にオオカミから枝分かれしてアフリカ大陸で独自の進化をとげた動物で、イヌやオオカミとは全く別の動物です。その生息数はアフリカ全土で7000頭以下に減少していて、絶滅の危機にあります。リカオンがゴロンゴーザ国立公園で最後に確認されたのは30年以上も前でした。

ゴロンゴーザ国立公園から800キロ離れた南アフリカの動物保護区から、14頭のリカオンが運ばれました。遺伝的な多様性を重視して、これらのリカオンは異なる群から選ばれた14頭です。

14頭のリカオンは、まず、ゴロンゴーザ国立公園に作られた囲いの中で共に過ごしました。この過程で群としての一体感が醸成され、リーダーのリカオンも決まっていきました。そして8週間後、囲いの