SSブログ
前の30件 | -

No.368 - 命のビザが欲しかった理由 [歴史]

No.201「ヴァイオリン弾きとポグロム」に関連する話です。No.201 の記事は、シャガール(1887-1985)の絵画『ヴァイオリン弾き』(1912)を、中野京子さんの解説で紹介したものでした。有名なミュージカルの発想のもとになったこの絵画には、ユダヤ人迫害の記憶が刻み込まれています。シャガールは帝政ロシアのユダヤ人強制居住地区(現、ベラルーシ)に生まれた人です。

絵のキーワードは "ポグロム" でした。ポグロムとは何か。No.201 で書いたことを要約すると次のようになるでしょう。

◆ ポグロムはロシア語で、もともと「破壊」の意味だが、歴史用語としてはユダヤ人に対する集団的略奪・虐殺を指す。単なるユダヤ人差別ではない。

◆ ポグロムに加わったのは都市下層民や貧農などの経済的弱者で、シナゴーグ(ユダヤ教の礼拝・集会堂)への放火や、店を襲っての金品強奪、暴行、レイプ、果ては惨殺に及んだ。

◆ ポグロムはロシアだけの現象ではない。現代の国名で言うと、ドイツ、ポーランド、バルト3国、ロシア、ウクライナ、ベラルーシなどで、12世紀ごろから始まった。特に19世紀末からは各地でポグロムの嵐が吹き荒れた。

◆ 嵐が吹き荒れるにつれ、ポグロムに警官や軍人も加わるようになり、政治性を帯びて組織化した。この頂点が、第2次世界大戦中のナチス・ドイツによるユダヤ人のホロコーストである。

杉原千畝.jpg
故・杉浦千畝
(朝日新聞より)
その、ナチスによるホロコーストに関係した有名な話があります。当時のリトアニアの日本領事代理だった杉原千畝ちうねが、ユダヤ人に日本通過ビザ(いわゆる "命のビザ")を発行し、ドイツによるホロコーストから救ったという件です。

この "命のビザ" について、先日の朝日新聞に大変興味深い記事が掲載されました。「ユダヤ難民は誰からのがれたかったのか」を追求した、東京理科大学の菅野かんの教授の研究です。それを以下に紹介します。記事の見出しは、

 杉原千畝「命のビザ」で異説
 ユダヤ人が逃れたかったのはソ連?
  (朝日新聞 2023年11月20日 夕刊)

です。朝日新聞編集委員・永井靖二氏の署名入り記事です。

手書きのビザ.jpg
杉原氏が発給した手書きのビザ。"敦賀上陸" とある。
(朝日新聞より)


難民は何から逃れたかったのか


まず記事の出だしでは、当時の状況と命のビザの経緯が簡潔に書かれています。


リトアニアで第2次世界大戦中、外交官の故・杉原千畝(ちうね)(1900~86)が発給したいわゆる「命のビザ」で、ユダヤ人難民らは何から逃れようとしていたのか。専門家が当時の1次資料を分析したところ、「ナチスの迫害から」とする見方だけではない事情が浮かんできた。

杉原は独立国リトアニアの首都カウナスで日本領事代理を務めていた。40年7~8月、ドイツと旧ソ連による侵攻で母国を失った主にポーランド国籍のユダヤ人難民に、日本の通過ビザを発給したことで知られる。外務省の記録では、杉原がこの時期に発給したビザは計2140件とされる。

朝日新聞 2023年11月20日(夕刊)

東京理科大学の菅野かんの教授は、当時の1次資料のみを読み解き、ユダヤ難民が何から逃れたかったのかを突き止めました。


全体主義恐れる

東京理科大学教授の菅野かんの賢治さん(ユダヤ研究)は、歳月を経て出た回想録などを除き、当時の1次資料のみを考証の対象とした。

現地で難民救援にあたったユダヤ人の非政府組織「アメリカ・ユダヤ合同分配委員会」(JDC、本部ニューヨーク)が所蔵する現地の報告な約3千点の記録を読み解くとともに、当時の地元住民らが書いた日記などを集めた。

その結果、この時期に難民や支援者が抱き、語った危機感は、思想弾資産の没収など、ソビエトの全体主義に対するものだったという。ナチスの迫害への危惧を脱出の動機とした言説は見当たらなかった

ソ連とドイツは1939年8月に不可侵条約を結んでいた。ソ連は40年6月、リトアニアに進駐。8月3日にリトアニアはソ連に併合された。

杉原がビザを発給したのは、この時期だった。同じ頃、ドイツはユダヤ人に隔離や国外追放が主体の施策をとり、ソ連などでも反ユダヤ主義は強かった。そのため、カウナスのヘブライ語教師が「体のみを殺すドイツ人の到来の方が、魂まで殺すロシア人の到来よりも、まだしも好ましい」と、意思表示をしたという記録も残っていた。

独ソ戦が始まったのは41年6月2日。アウシュビッツ収容所で毒ガスが初めて使われたのは同年9月で、杉原のビザ発給から1年以上後だった。

(同上)

あらためて歴史的経緯を時系列にまとめると、次のようになります。

1939年8月 独ソ不可侵条約が締結
1939年9月 ドイツがポーランドに侵攻(=第2次世界大戦が勃発)。ソ連も侵攻し、10月、ポーランドは独ソ両国によって分割された。
1940年6月 ソ連がリトアニアに進駐
1940年7-8月 杉原がリトアニアでユダヤ人に計2140件のビザを発給
1940年8月 ソ連がリトアニアを併合
1941年6月 独ソ戦開戦
1941年9月 アウシュビッツ収容所で毒ガスが初めて使われた

この経緯のポイントは次の3つでしょう。

◆ 杉原氏が命のビザを発給したのは、ソ連がリトアニアに進駐して併合する、まさにその時期にあたる。

◆ 独ソ戦が始まったのは、命のビザより10ヶ月あとである(もちろん独ソ戦が始まった以上、リトアニアにドイツ軍が押し寄せてくることは想定できる)。

◆ アウシュビッツ(ポーランド)で毒ガスによるホロコーストが始まったのは、命のビザより1年後である。

ユダヤ難民がなぜ命のビザを欲しがったのか。それは記事にあるように「ソ連から逃れるため」というのが正解でしょう。もちろん、ドイツの "ユダヤ人狩り" は難民も知っていたはずです。しかし、当時は独ソ不可侵条約が結ばれていて、その一方の当事者であるソ連にリトアニアは占領されていました。当時、ドイツの脅威が直接的にリトアニアに及んだわけではありません。シンプルに考えても、リトアニアのユダヤ難民が恐れたのはドイツではなくソ連だった。

加えてロシア・ソ連では、シャガールの絵に象徴されるように、19世紀以来、ポグロムの嵐が吹き荒れていました。ユダヤ人がリトアニアを占領したソ連から逃れたかったのは当然でしょう。


通説の経緯


しかし日本では「ナチスの迫害から逃れるため」というのが通説になっています。この通説ができた経緯が記事に紹介されています。


評価変わらず

従来の通説とは異なる研究成果だが、菅野さんは「杉原が困窮した難民らにビザを発給した事跡は、変わるものではない」としている。

杉原千畝記念館(岐阜県八百津町)館長の山田和実さんも「様々な苦難のもとで困窮していたユダヤ人難民らに、自らの良心に従ってビザを発給した杉原の行為に対する評価は、変わらないと思う」と話している。

菅野さんは通説ができる過程についても、近著「『命のヴィザ』の考古学」(2023年9月出版)で追った。

日本を通過したユダヤ人難民について、1960年7月1日付の朝日新聞朝刊は「ドイツを追われ日本に来た」としていた。8月7日発行の週刊読売も「ナチスに追われ」たと書いていた。菅野さんはその年の5月、ユダヤ人を強制収容所へ送る実務責任者だっアドルフ・アイヒマンが、アルゼンチンで逮捕されたことと関連があると推測する。

杉原の名前が登場するようになったのは、朝日新聞(88年8月2日付夕刊)や中央公論(71年5月発行)などからだったという。

菅野さんは同書で、47年に外務省を退職した杉原の戦後の発言もたどった。本人がビザ発給の経緯を述べた最古の記録は、69年の覚書。ビザを発給した相手は「ポーランド難民」で、約3500人のうち「およそ500人のユダヤ人がいた、と記憶している」としていた。

88年9月になると、フジテレビのドキュメンタリーで、難民にビザを発給したのは「ナチスにひっ捕まって」「ガスの部屋へ放り込まれる」からだったと語っていたという。(編集委員・永井靖二)

(同上)

記事にある杉原氏の覚え書きによると、ビザを発給したのはポーランド難民で、その一部がユダヤ人ということになります。では「ユダヤ人でないポーランド難民」は何から逃れたかったのかというと、それはソ連からということになります。

しかし日本では当初から、ユダヤ難民は「ナチス・ドイツに追われ」たことになっていました。記事にも、

・ 日本を通過したユダヤ人難民について、1960年7月1日付の朝日新聞朝刊は「ドイツを追われ日本に来た」としていた。8月7日発行の週刊読売も「ナチスに追われ」たと書いていた。

・ 1988年9月、杉原氏はフジテレビのドキュメンタリーで、難民にビザを発給したのは「ナチスにひっ捕まって」「ガスの部屋へ放り込まれる」からだったと語った。

とあります。杉原氏自身でさえ、ユダヤ人難民は「ナチスに捕まってガスの部屋へ放り込まれる」からビザを欲したのだと、1988年に語っているわけです。「ナチスの迫害から逃れるため」という通説ができるのは当然です。もちろん、時間がたつと記憶が曖昧になるのは誰しもあるわけです。

これは、1960年の新聞報道を含め、ナチス・ドイツによるユダヤ人ホロコーストが、如何に世界の人々にショックと強烈な印象を与えたかというあかしだと思います。そして重要な点は、ユダヤ人難民がソ連から逃れたかったにしろ、杉原氏の行為に対する評価は変わらないということです。


複合的な視点で見る必要性


ナチス・ドイツによるユダヤ人ホロコーストという惨劇を知ってしまうと、それに強く影響された視点でものごとを考えがちです。しかし、複合的な視点はどのようなことでも重要です。記事の中で内田たつる氏が発言していました。


国益への配慮も

ユダヤ人問題などが専門の思想家、内田樹さんの話

日露戦争でユダヤ資本家から戦費調達で支援を受けた日本政府は、ユダヤ人に融和的な姿勢を保っていた。杉原千畝には道義心に加え国益への配慮もあったはずだ。リトアニアではソ連への恐怖の方がナチスよりも強かったし、難民らには局面ごとに多様な外力が働いていた。だが、我々は直後に起きたホロコーストという惨劇を知っているため、出来事を一本の線でとらえがちだ。当時の政策への無知もその傾向を助長したと思う。

(同上)

この内田氏の指摘は鋭いと思います。

・ 日本政府はユダヤ人に融和的な姿勢を保っていたから、杉原氏には道義心に加えて、国益への配慮もあったはずだ。

・ リトアニアではソ連への恐怖の方がナチスよりも強かったし、難民らには局面ごとに多様な外力が働いていた。

杉原氏は外交官であり、日本の国益のために働くのが使命です。明治以降の日本政府がユダヤ人に融和的だっというのは、数々の証拠があります。外交官である杉原氏はそれを知っていたのでしょう。その "融和的" な姿勢の発端は、日露戦争におけるユダヤ人資本家からの戦費調達であり、その背景にはロシアにおけるポグロムがある。ユダヤ人資本家は、ロシアと戦おうとする日本を応援したわけです。

杉原氏の「命のビザ」は、ソ連から逃れようとする「ユダヤ人を含む難民」に発給されたものであり、それは人道的配慮と日本の国益への配慮に合致するものであった

という「複合的な視点」が重要でしょう。一面的に歴史をみることはまずいし、「歴史から学ぶ」ことにもならないのです。




nice!(0) 

No.367 - 南部鉄器のティーポット [文化]

これまでの記事で、NHK総合で定期的に放映されているフランスの警察ドラマ「アストリッドとラファエル」から連想した話題を2つ書きました。

No.346「アストリッドが推理した呪われた家の秘密」(シーズン1 第2話「呪われた家」より)

No.363「自閉スペクトラム症と生成AI」(シーズン2 第6話「ゴーレム」より)

の2つです。今回もその継続で、このドラマに出てくるティーポットの話を書きます。


ダマン・フレール


パリのマレ地区のヴォージュ広場を囲む回廊の一角に、紅茶専門店、ダマン・フレール(Dammann Frères)の本店があります。ダマン・フレールは、17世紀のルイ14世の時代にフランスにおける紅茶の独占販売権を得たという老舗しにせで、ホームページには次のようにあります。


フランス王室に認められた
随一のティーブランド

ダマンフレールの歴史は、1692年、フランス国王ルイ14世によりフランス国内での紅茶の独占販売権を許可されたことから始まりました。それはまた、フランスにおける紅茶の歴史の始まりとも言えます。1925年には紅茶を愛してやまないダマン兄弟により紅茶専門のダマン・フレール社が立ち上げられ、上流階級の嗜好品としての紅茶文化が開花しました。

ダマン・フレールの日本語公式サイトより

ちなみに、フレールとはフランス語で兄弟の意味で、屋号は「ダマン兄弟」です。緑茶や中国茶も扱っているので「お茶専門店」というのが正確でしょう。

パリには4回ほど個人旅行をしましたが、2000年代初頭にダマン・フレールの本店に行ったことがあります。私の配偶者が是非行きたいということで、紅茶のティーバッグをお土産(いわゆる "バラマキ")にするためだったと思います。

Dammann_Freres Paris.jpg
ダマン・フレール本店の店内
(ダマンの公式ホームページより)

店内に入ってみると、いかにも老舗という内装で、その "重厚感" が印象的でした。当時は日本人の店員さんがいたと思います。パリでも日本人観光客がメジャーな時代でした。

そして私が最も印象的だったのは、明らかに日本の南部鉄器と思われる "ティーポット"(日本で言う "急須")が売られていたことです。ただし、黒い鉄色ではなく、色がついていました。このような鉄器の "カラー急須" を見たのは初めてだったので、ちょっとびっくりしたわけです。

南部鉄器の急須.jpg
南部鉄器のカラーのティーポット
ダマンで売られていたものではありません。「ダイアモンド・オンライン」のページより。


アストリッドの愛用品


「アストリッドとラファエル」には、アストリッドの愛用品として鉄器のカラーのティーポットが出てきます。次の画像は、シーズン1の第2話「呪われた家」のもので、アストリッドが勤務する犯罪資料局の執務机の様子です。上の図では、彼女が青色の鉄器のティーポットを取り出して机に置いています。茶筒と湯呑み茶碗もあるので、緑茶(日本茶)を入れるためのものでしょう。その下の画像では、実際にお茶を入れています。

Astrid and Teapot-a.jpg
アストリッドの青のティーポット
シーズン1・第2話「呪われた家 前編」(2022.8.14)より

Astrid and Teapot-b.jpg
お茶を入れるアストリッド
シーズン1・第2話「呪われた家 後編」(2022.8.21)より

アストリッドの自宅の様子が次の画像です。このティーポットも青色ですが、犯罪資料局に持ち込んだものとはデザインが違うようです。

Astrid and Teapot-c.jpg
アストリッドの自宅のティーポット(1)
シーズン1・第6話「存在しない男」(2022.9.18)より

次の画像もアストリッドの自宅ですが、このティーポットは緑っぽい色です。

Astrid and Teapot-d.jpg
アストリッドの自宅のティーポット(2)
シーズン4・第3話「密猟者」(2024.1.28)より

そもそもこのドラマには、日本関連のものが数々登場します。アストリッドが常連客である日本食材店や、犯罪資料局にアストリッドが持ち込んだ半畳ほどの畳、箱根細工(と思われる)"からくり箱" などです。また、アストリッドの "恋人" はテツオ・タナカという日本からの留学生です。ドラマの制作サイドが日本市場を意識しているのでしょう。

しかし南部鉄器のティーポットに関して言うと、それがパリでいつでも買えるものだからこそ、ドラマに登場するのだと思います。20年ほど前にダマン・フレールで見た南部鉄器のカラーのティーポットは、現在でもフランスに愛好者がいることが分かります。

南部鉄器は鋳造なので、ガラスや磁器のティーポットに比べると熱容量が大きく、お茶が冷めにくい。おそらくそこが評価されているのだと思います。また、ヨーロッパにとっては、紅茶や緑茶はもともと東洋からの輸入品です。南部鉄器という "アジアン・テイスト" のアイテムが、お茶にマッチすると考える人もいそうです。


岩鋳


ところで、南部鉄器をヨーロッパに輸出した先駆者は、岩手県盛岡市の「岩鋳いわちゅう」という会社です。南部鉄器といえば江戸時代が発祥の由緒ある工芸品で、盛岡と水沢(奥州市)が生産の中心地です。水沢の会社では "及源おいげん" が有名です。

その岩鋳の鉄器が海外進出した経緯が「ダイアモンド・オンライン」(ダイアモンド社)に出ていました。興味深い話だったので、是非それを紹介したいと思います。「飛び立て、世界へ! 中小企業の海外進出奮闘記」と題する一連の記事の中の一つで、記事のタイトルは、

日本人が知らない南部鉄器の海外人気、フランスから世界へ急拡大(2018.2.8)
 ルポライター:吉村克己
 https://diamond.jp/articles/-/158955

です。まず、少々意外だったのは、岩鋳の製品の半分は海外に販売され、ヨーロッパでは「イワチュー」(IWACHU)が鉄器の代名詞になっていることです。


年間100万点生産し半数が海外へ
欧州で南部鉄器の代名詞となった会社

南部鉄器と言えば、約400年の歴史を持つ岩手県の伝統工芸だ。かつて、日本の家庭には鋳物の鉄瓶や急須が1つはあったものだが、いまでは姿を見かけなくなった。

と思ったら、日本伝統の鉄瓶や急須が欧米や中国・東南アジアで人気になっている。それが日本に逆輸入されて、いま若い女性や主婦などが伝統の良さを再発見しているのだ。

その古くて新しい南部鉄器を生み出したのが、盛岡市に本社を置く岩鋳だ。いまやヨーロッパで「イワチュー」と言えば鉄器の代名詞である。

4代目を継ぐ同社副社長(引用注:現、社長)の岩清水弥生(48歳)はこう語る。

「海外に出て行ってなかったら、今の岩鋳はなかったでしょうし、技術の向上もなかったと思います。海外で売れるようになったからこそ社員の士気も高まったし、若い職人志望者も増えた。当初はつくっても売れるのかなと思ったのですが、やはり自分たちだけでお客様が求めるものを決めつけてはいけませんね」

岩鋳では現在、伝統的な鉄瓶や急須だけではなく、鋳物製の鍋やフライパンなどのキッチンウェアなども手がけ、年間約100万点の鉄器を生産している。これは南部鉄器としては最大規模だ。なんと、その半数が海外で販売されている。世界20ヵ国程度に広がり、国・地域ごとに代理店を通して売っている。

欧米市場では急須が主な商品だ。昔ながらの黒い鉄器ではなく、赤やピンク、青、緑、オレンジなどカラフルで、いわゆる南部鉄器のイメージとは全く違う。その形も、楕円形で注ぎ口が細長いものなどデザインにも工夫を凝らしている。

海外では国内より価格が約2倍半ほど高くなる。国内で6000円ほどの売れ筋の急須でも、1万5000円ほどになるから、決して安いものではないが、紅茶などのティーポットとして使われている。

現代風とは言え、生産はすべて本社で、職人の技を大切にしている。色とりどりながらも鋳物らしい風合い、いわゆる「鋳肌(いはだ)」(鉄の素材感)が活きている

着色はウレタン樹脂を使っているので、無害かつ安全。顧客の要望さえあれば130色ほども再現できるという。内部はホーロー引きでメンテナンスしやすい。つまり、伝統の良さを活かしながらも、南部鉄器の使い方を知らない現代の外国人にも使いやすくしているのだ。

ルポライター:吉村克己
「日本人が知らない南部鉄器の海外人気
フランスから世界へ急拡大」
ダイアモンド・オンライン(2018.2.8)

南部鉄器の急須.jpg
岩鋳のカラーの急須
「ダイアモンド・オンライン」より。

ポイントを何点かにまとめると、次のようになるでしょう。

① 岩鋳は、伝統的な鉄瓶や急須だけではなく、鍋やフライパンなどのキッチンウエアなど、年間約100万点の鉄器を生産していて、南部鉄器としては最大規模である。かつ、その半数が海外20ヵ国で販売されている。

② 欧米市場では、赤やピンク、青、緑、オレンジなどのカラフルな急須が主力商品である。ヨーロッパでは「イワチュー」が鉄器の代名詞になっている。

ちなみに、岩鋳の海外ブランドは "IWACHU" であり、最初に人気に火がついたフランスでは、フランス語読みで「イワシュー」で通っているそうです。

③ 急須の着色はウレタン樹脂を使うが、鋳物らしい風合い = 鋳肌(いはだ、鉄の素材感)を活かしている。また内部はホーローをコーティングしている。

日本古来の急須とちがって、着色するのみならず、急須の内部にはホーロー加工がしてあります。鉄器の急須は、鉄分が溶けだして体にいいとか、お茶がまろやかになると言いますが、そういう効果は期待できないわけです。しかしこれは欧米のニーズに合わせた製品なのです。

もちろん、鋳肌いはだが活きていると書いてあるように、ダマン・フレールで見たときも、一目でアラレ模様の南部鉄器だと分かるものでした。着色も、日本の伝統色を思わせる中間色で、鉄器にマッチしています。

なお、中国や東南アジアでは、欧米とは違い、日本で伝統的な黒い急須や鉄瓶が売れるようです。

その岩鋳の海外進出は 1960年代から始まりました。そして本格的な販売がスタートしたのは、パリの紅茶専門店からの依頼が契機だったのです。


パリの紅茶専門店からの
依頼でつくった急須が大ヒット

岩鋳の創業は明治35年で、115年を迎える老舗だが、南部鉄器の工房としては若い方だ。岩清水の祖父である弥吉は進歩的な人物で、鉄瓶だけでは将来がないと新製品を積極的に開発した。1960年代から手作業以外の工程の機械化を進め、すき焼き鍋や企業向けなどの記念品として灰皿も開発した。

周囲はそうした弥吉の方針に対して、南部鉄器の伝統をないがしろにするものだと批判的だったが、「仕事がなくなったら伝統も何もないし、職人を守れない」と、鉄器を広く知ってもらうように努めた。

海外進出もこうした弥吉の先進性から始まった。1960年代後半には、当時専務だった弥吉の弟が製品を抱えて船に乗り、ヨーロッパに渡って1ヵ月間売り歩いた。微々たる量だったが、日本の文化や鉄器に興味を持つヨーロッパ人が鉄瓶や急須を買ってくれた。

「当時は国内も好景気で、観光客も多く、売り上げが伸びていたので、海外販売にはそれほど力を入れていませんでした」と岩清水。

本格的な海外展開のきっかけとなったのは、パリの紅茶専門店からの1つの依頼だった。カラフルな急須がほしいというのだ。1996年のことである

鉄器は黒いのが当たり前で、それが一番美しいと考えられていた。岩鋳の経営陣も職人も戸惑った。しかし、せっかく頼まれたものを断るのもしゃくだった。

「他の工房と違って、父(岩清水晃社長)も私も職人ではありません。そのため、いい意味でこだわりがないし柔軟で、新しいことにチャレンジするのに抵抗がないのです。それでもカラフルな急須とは驚きました。工場長や職人からも反発はありませんでしたが、せっかくつくっても本当に売れるのか不安だったようです」

鋳肌を活かしながら着色することは予想以上に難関だった。工場長と着色担当の職人に塗料メーカーの協力も得て、3年かけて着色法を開発した。ウレタン樹脂を吹き付けた後、カラフルな塗料を重ね塗りすることで、色合いを表現した

パリの紅茶店に製品を送ると、たちまち人気になり、ヨーロッパ中に口コミで広がっていった。展示会にも出展し、カラフルな急須の売れ行きが伸びた。さらにアメリカに伝播し、アジアにも拡大した。

(同上)

岩鋳にカラフルなティーポットの製作を依頼したパリの紅茶専門店は、マリアージュ・フレールだそうです。マリアージュもパリのマレ地区に本店があり、ダマンから近い距離です。南部鉄器のカラフルなティーポットは、マリアージュでまずヒットし、それがダマンを含む店に広まったということでしょう。

鉄にホーローをコーティングするのは従来からある技術です(各種のホーロー製品)。しかし、鋳造した鉄への着色は従来からの技術ではありません。「3年かけて着色法を開発した」とあるように、かなりの苦労の末に開発した製品だったようです。

そして、記事の最後にある、岩鋳の岩清水社長のコメントが印象的でした。


現地のニーズをよく調べる、
そして必ず足を運ぶのが基本

岩清水はパリの紅茶店オーナーに、なぜ鉄器に興味を持ったのかと聞いたことがある。

男性が使ってもさまになるティーポットがほしかったと、オーナーは言いました。ガラスや陶器は女性っぽいので、カラフルな鉄器なら重厚感があり男性にぴったりだというのです

つくり手側が思いもよらないニーズがあるものだ。それに対して愚直に応えたからこそ、現在の岩鋳がある。海外進出する際に何を心がけるべきか岩清水に聞くと、こう答えた。

「自分たちの商品をそのまま外国に持って行っても、通用しません。私たちは鉄器は黒が最高だと思っていたのに、たまたまお客様の要望で色をつけたら売れた。私たちの押しつけではなく、相手の要望を聞き、現地に足を運ぶことが重要です」

自社の製品や技術力にいかに自信があろうとも、海外でも日本と同じように売れるわけではない。市場の声に耳を澄まし、そこに自慢の技術を投入することが肝要だ。

(同上)

カラフルな鉄器の急須は、我々日本人からすると、女性客を狙ったのだろうと、暗黙に考えてしまいます。無骨な感じの黒の鉄器ではパリジェンヌにはウケないだろうと ・・・・・。依頼を受けた岩鋳の人たちも、おそらくそう考えたのではないでしょうか。

しかしそうではないのですね。岩鋳に依頼したパリの紅茶専門店のオーナーの考えでは「カラフルな鉄器なら重厚感があり男性にぴったり」なのです。少なくとも当初の発想はそうだった。

かなり意外ですが、まさに岩清水社長の言うように「市場の声に耳を澄まし、そこに自慢の技術を投入することが肝要」です。お茶を飲むのは日本(を含む東アジアの)文化であり、南部鉄器の急須もその文化の一部です。しかし、ダマン・フレールを見ても分かるように、フランスにおいても、お茶は数百年の伝統をもつ伝統文化なのです。文化の "押し売り" はうまく行かない。岩鋳はパリの紅茶専門店に導かれて、ニーズと技術のベストなマッチングを作り上げたことになります。



ドラマ「アストリッドとラファエル」に戻ると、アストリッドが愛用する青いティーポットは、実はフランスと日本の2つの文化の接点を示している象徴的なアイテムなのでした。




nice!(0) 

No.366 - 高校数学で理解する ChatGPT の仕組み(2) [技術]

\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{#1}} \newcommand{\ol}[1]{\overline{#1}} \newcommand{\sb}{\subset} \newcommand{\sp}{\supset} \newcommand{\al}{\alpha} \newcommand{\sg}{\sigma}\newcommand{\cd}{\cdots}\)

この記事は、No.365「高校数学で理解する ChatGPT の仕組み(1)」の続きです。記号の使い方、用語の定義、ニューラル・ネットワークの基本事項、単語の分散表現などは、前回の内容を踏まえています。

 
3.Transformer 
 


Attention Is All You Need


Google社は、2017年に "Attention Is All You Need" という論文(以下、"論文" と記述)を発表し、"Transformer" という画期的な技術を提案しました。Transformer は機械翻訳で当時の世界最高性能を発揮し、これが OpenAI 社の GPT シリーズや ChatGPT につながりました。

Attention(アテンション)とは "注意" という意味で、Transformer に取り入れられている "注意機構"(Attetion mechanism)を指します。"Attention Is All You Need" を直訳すると、

 「必要なのはアテンションだけ」

ですが、少々意訳すると、

 「アテンションこそがすべて」

となるでしょう(蛇足ですが、ビートルズの "All You Need Is Love" を連想させる論文タイトルです)。

Transformer を訳すと "変換器" ですが、その名の通り「系列 A から系列 B への変換」を行います。系列 A = 日本語、系列 B = 英語、とすると和文英訳になります。第3章では、この Transformer の仕組みを説明をします。


全体のアーキテクチャ


Transformer のアーキテクチャの全体像が次図です(論文より)。以降、この絵の意味を順に説明します。

図18:Transformer のアーキテクチャ.jpg
図18:Transformer のアーキテクチャ

アーキテクチャを簡略化して書くと次のようになります。以下では「日本語 → 英語の機械翻訳」を例として Transformer の動作を説明します。

図19:アーキテクチャの簡略図.jpg
図19:アーキテクチャの簡略図

左側がエンコーダで、入力された日本語テキストを中間表現(=テキストの特徴を抽出した内部表現)に変換します。右側のデコーダは、中間表現を参照しつつ「次に生成すべき英単語」を推論します。

エンコーダ、デコーダとも、図で「ブロック」と書いた単位を積層した構造です。つまり、1つのブロックの出力が次のブロックへの入力になります。アーキテクチャの絵で「N x」と書いてあるのはその積層の意味(= N 倍)で、積層する数を \(N\) とすると、Transformer では、
 \(N=6\)
です。エンコーダの中間表現は最終ブロックからの出力です。その出力がデコーダの全てのブロックへ伝わります。

訓練
多数の「日本語 \(\rightarrow\) 英語の翻訳データ」を用いて Transformer を訓練するとき、全体がどのように動くかを示したのが次の図です。

図20:Transformerの動作(訓練時).jpg
図20:Transformerの動作(訓練時)

エンコーダには日本語の文(Input)が入力されます。デコーダからの出力は、英文の推論結果(確率)です。これを正しい英文(Output = 教師ラベル)と照らし合わして損失(交差エントロピー誤差)を計算し、誤差逆伝播を行ってニューラル・ネットワークの重みを更新します(前回参照)。デコーダの入力となるのは「右に1語だけずらした Output」です。アーキテクチャの図18 で shifted right と書いてあるのはその意味です。なお、実際に入力されるのは単語ではなくトークンの列です(前回参照)。

推論
訓練を終えた Transformer を使って日本語文を英語文に機械翻訳するときの動きは次図です。

図21:Transformerの動作(推論時).jpg
図21:Transformerの動作(推論時)

エンコーダに日本語のテキストを入力し、中間表現を得ます。これは1回きりです。

デコーダには、生成すべき英語テキストの最初のトークン、[BOS](文の始まりを示す特殊トークン)を入力し、[BOS] の次にくるべきトークンの確率を推論します。最も確率が高いトークンを選ぶと [I] になるはずです。これが1回目の推論(#1)です。

2回目(#2)では [I] を入力し、[I] の次のトークンを推論します([am] となるはずです)。[BOS] から [I] を推論したときの情報はデコーダに残されているので、その部分を再計算する必要はありません。推論のためには、日本語文の全情報(エンコーダの中間表現)と、既に生成した英文([BOS] [I])を参照します。

このようにして順々に英文を生成していき、推論結果が [EOS](文の終了を示す特殊トークン)になるところで、翻訳が終了します。


アーキテクチャの詳細


用語と記号
 トークンの語彙 

トークンの語彙(vocabulary)のサイズ を \(V\) とします。トークンを識別する "トークンID" は \(1\)~\(V\) の数字です。

 系列 

Transformer への入力となるテキストは、Tokenizer でトークンID の列に変換されます。以降、Transformer への入力を "系列(sequece)" と呼びます。

系列はその最大サイズ \(S\) が決まっています(普通、数千程度)。入力が \(S\) より少ない場合、残りのトークンは無効トークン([PAD])としておき、そこの処理は回避するようにします。[PAD] を含めて、系列は長さ \(\bs{S}\) の固定長とします。

 系列\(=\{\:t_1,\:t_2,\:\cd\:,\:t_S\:\}\)
   \(t_i\):トークンID \((1\leq t_i\leq V)\)

Transformer の論文には語彙のサイズと系列のサイズが書いてありませんが、以降の説明では \(V\) と \(S\) を使います。

 分散表現ベクトル 

トークンの分散表現ベクトル(埋め込みベクトル)の次元を \(D\) とします。トークンID が \(t_i\) であるトークンの分散表現を \(\bs{x}_i\) とすると、
 \(\bs{x}_i=\left(\begin{array}{r}x_1&x_2&\cd&x_D\\\end{array}\right)\) \([1\times D]\)
というようになり、系列をベクトル列で表現すると、
 系列\(=\{\:\bs{x}_1,\:\bs{x}_2,\:\cd\:,\:\bs{x}_S\:\}\)
となります。なお、\(D\) 次元ベクトルを、\(1\)行 \(D\)列の配列とし、\([1\times D]\) で表わします(前回参照)。

なお、Transformer では \(D=512\) です。

以降、全体アーキテクチャの図に沿って、各レイヤー(計算処理)の説明をします。以降の説明での \(\bs{x}_i,\:\:\bs{y}_i\) は、

 \(\bs{x}_i\):レイヤーへの入力
  (系列の \(i\) 番目。\(1\leq i\leq S\))
 \(\bs{y}_i\):レイヤーからの出力
  (系列の \(i\) 番目。\(1\leq i\leq S\))

で、すべてのレイヤーに共通です。また、\(D\) 次元ベクトルを \([1\times D]\)、\(S\)行 \(D\)列の行列を \([S\times D]\) と書きます。

埋め込みベクトルの生成
図18a.jpg

このレイヤーの入出力を、

\(\bs{x}_i\): トークンID を one hot ベクトルにしたもの \([1\times V]\)
\(\bs{y}_i\): 埋め込みベクトル \([1\times D]\)

とすると、

 \(\bs{y}_i=\bs{x}_i\cdot\bs{W}_{\large enc}\)
   \([1\times D]=[1\times V]\cdot[V\times D]\)

で表現できます(前回の word2vec 参照)。もちろん、この行列演算を実際にする必要はなく、\(\bs{x}_i\) のトークンID を \(t_i\) とすると、

 \(\bs{y}_i=\bs{W}_{\large enc}\) の \(t_i\) 行

です。\(\bs{W}_{\large enc}\) は Transformer の訓練を始める前に、あらかじめ(ニューラル・ネットワークを用いて)作成しておきます。従って、埋め込みベクトルの作成はテーブルの参照処理(table lookup)です。

位置エンコーディング
図18b.jpg

埋め込みベクトル(分散表現)に、トークンの位置を表す「位置符号ベクトル」を加算します。つまり、

 \(\bs{x}_i\):埋め込みベクトル \([1\times D]\)
 \(\bs{p}_i\):位置符号ベクトル \([1\times D]\)
 \(\bs{y}_i\):位置符号加算ベクトル \([1\times D]\)

とすると、

 \(\bs{y}_i=\bs{x}_i+\bs{p}_i\:\:\:(1\leq i\leq S)\)
   \([1\times D]=[1\times D]+[1\times D]\)

の単純加算です。位置符号ベクトル \(\bs{p}_i\) の要素を次の記号で表します。

 \(p_{t,d}\)
   \(t\) は \(0\) から始まる、トークンの位置
    \((t=i-1,\:\:0\leq t\leq S-1)\)
   \(d\) は \(0\) から始まる、ベクトル内の要素の位置
    \((0\leq d\leq D-1)\)

この \(p_{t,d}\) の値は次のように定義されます。

 \(p_{t,2k}\)\(=\mr{sin}\left(\dfrac{1}{10000^x}\cdot t\right)\)
 \(p_{t,2k+1}\)\(=\mr{cos}\left(\dfrac{1}{10000^x}\cdot t\right)\)

   \((0\leq k < \dfrac{D}{2},\:\:\:x=\dfrac{2k}{D},\:\:\:0\leq x < 1)\)

つまり、\(D=512\) とすると、

 \(d\) が偶数の要素位置では \(\mr{sin}\) 波
  (\(d=0,\:2,\:4,\:\cd\:,510\))
 \(d\) が奇数の要素位置では \(\mr{cos}\) 波
  (\(d=1,\:3,\:5\:\:\cd\:,511\))

で位置符号値を決めます。この \(\mr{sin}/\mr{cos}\)波の波長 λ は

 λ\(=2\pi\cdot10000^x\)

であり、\(0\leq d < D\) の範囲で、

 \(2\pi\leq\)λ\( < 2\pi\cdot10000\)

となります。この \(\mr{sin}/\mr{cos}\) 波を図示してみます。グラフをわかりやすくするために、\(D=512\) ではなく、
 \(D=32\)
とし、ベクトルの要素 \(32\)個のうちの最初の6つ、
 \(d=0,\:1,\:2,\:3,\:4,\:5\)
だけのグラフにします。グラフの
 ・横軸はトークンの位置 \(t\)
 ・縦軸は位置符号ベクトルの要素 \(p_{t,d}\)
です。

図22:位置符号値を計算するための正弦・余弦波.png
図22:位置符号値を計算するための正弦・余弦波
図の黒丸は、\(t=3\) の位置符号ベクトルの、要素\(0\)~要素\(5\)(\(0\leq d\leq5\))を示す。

具体的に \(t=3\) のときのベクトルの要素 \(p_{3,d}\:\:(0\leq d\leq31)\) の \(0\leq d\leq5\) の部分を書いてみると、

  \(p_{3,0}=\phantom{-}0.1411\)
  \(p_{3,1}=-0.9900\)
  \(p_{3,2}=\phantom{-}0.9933\)
  \(p_{3,3}=-0.1160\)
  \(p_{3,4}=\phantom{-}0.8126\)
  \(p_{3,5}=\phantom{-}0.5828\)

となります(図22)。


言うまでもなく、言語モデルにとってトークンの位置はきわめて重要な情報です。位置をバラバラにすると意味をなさないテキストになるし、Bob loves Alice と Alice loves Bob では意味が逆です。従って、何らかの手段で「トークンの位置を考慮したモデル化」をしなければならない。

 \(\bs{y}_i=\bs{x}_i+\bs{p}_i\:\:\:(1\leq i\leq S)\)

の式で、\(\bs{x}_i\) は「単語埋め込み」のアルゴリズムで作られ、似たような単語/トークンは類似したベクトルになります(前回参照)。それに対し \(\bs{p}_i\) の \(\mr{sin}/\mr{cos}\) 波は、言語処理とは全く無関係な数学の産物です。従って、加算結果である \(\bs{y}_i\) がどのような「意味」をもつベクトルなのか、説明しようとしても無理でしょう。全く異質なものの足し算をしているのだから ・・・・・・。それでいて、このやり方で全体として成り立つのが驚きです。

Transformer より以前の機械翻訳では、トークンの出現順に逐次処理をするアーキテクチャでした。つまり、1つのトークンの処理結果を利用しながら次のトークンを処理するという逐次処理によって、並び順に意味があるという言語の特質を捕らえていました。

それに対し、位置エンコーディングを取り入れた Transformer では、逐次処理の必要性がなくなり、系列のトークン全部の並列処理が可能になりました。この結果、同一計算の超並列処理ができる GPU(数千並列が可能) をフルに活用することで、実用的な大規模言語モデルが構築できるようになったわけです。位置エンコーディングにはそういう意味があります。


なお Transformer の論文にも書いてあるのですが、位置符号ベクトルを \(\mr{sin}/\mr{cos}\) 波のような「決めうち」で作らないで、「学習可能なパラメータ」としておき、Transformer を訓練する過程で決めるやり方があります。位置符号ベクトルを学習で決めるわけです。GPT はこの方法をとっています。

Single Head Attention : SHA
図18c.jpg

アテンション・レイヤー(Multi Head Attention : MHA)の説明をするために、まず "Single Head Attention : SHA" の処理論理を説明します。Transformer で実際に使われている MHA は、以下に説明する SHA の拡張版で、核となるアルゴリズムは同じです。

SHAの入出力は、それぞれ \(S\)個の \(D\)次元ベクトルであり、

 入力 \(\bs{x}_i\:\:[1\times D]\:\:(1\leq i\leq S)\)
 出力 \(\bs{y}_i\:\:[1\times D]\:\:(1\leq i\leq S)\)

ですが、系列の全体を1つの行列で表すことができます。1つのベクトルを行列の1行として、それを縦方向に \(S\)個並べて行列を作ります。つまり、

 入力 \(\bs{X}\:\:[S\times D]\) (\(i\) 番目の行が \(\bs{x}_i\))
 出力 \(\bs{Y}\:\:[S\times D]\) (\(i\) 番目の行が \(\bs{y}_i\))

とすると SHA は、

 \(\bs{Y}=\mr{SHA}(\bs{X})\)

と書けます。アテンションの処理では、まず入力ベクトル \(\bs{x}_i\) を、

 ◆クエリ・ベクトル \(\bs{q}_i\)(query:問合わせ)
 ◆キー・ベクトル \(\bs{k}_i\)(key:鍵)
 ◆バリュー・ベクトル \(\bs{v}_i\)(value:値)

の組、( \(\bs{q}_i,\:\:\bs{k}_i,\:\:\bs{v}_i\) )に変換します。変換式は次の通りです。

\(\bs{q}_i=\bs{x}_i\cdot\bs{W}_Q\:\:\:(1\leq i\leq S)\)

\(\bs{k}_i=\bs{x}_i\cdot\bs{W}_K\:\:\:(1\leq i\leq S)\)

\(\bs{v}_i=\bs{x}_i\cdot\bs{W}_V\:\:\:(1\leq i\leq S)\)

  \([1\times D]=[1\times D]\cdot[D\times D]\)

ここで、\(\bs{W}_Q,\:\:\bs{W}_K,\:\:\bs{W}_V\) は学習で決まる変換行列です。系列全体についての Query/Key/Value(\(QKV\))を行列の形で表すと、

\(\bs{Q}=\bs{X}\cdot\bs{W}_Q\)

\(\bs{K}=\bs{X}\cdot\bs{W}_K\)

\(\bs{V}=\bs{X}\cdot\bs{W}_V\)

  \([S\times D]=[S\times D]\cdot[D\times D]\)

となります。SHA レイヤーからの出力、\(\bs{y}_i\:\:[1\times D]\) は、\(S\)個のバリュー・ベクトル \(\bs{v}_j\:\:(1\leq j\leq S)\) の "重み付き和" (加重和)で求めます。加重和に使う重み、\(\bs{w}_i\:\:[1\times S]\) は次のように計算されます。

まず、クエリ・ベクトル \(\bs{q}_i\) とキー・ベクトル \(\bs{k}_j\:\:(1\leq j\leq S)\) の "スケール化内積(scaled dot product)" を計算し、\(S\)個のスカラー値を求めます。スケール化内積(\(\mr{SDP}\) と記述します)とは、2つの \(D\)次元ベクトル \(\bs{a}\) と \(\bs{b}\) の場合、

 \(\mr{SDP}(\bs{a},\bs{b})=\dfrac{1}{\sqrt{D}}\bs{a}\bs{b}^T\)
   \([1\times1]=[1\times D]\cdot[D\times1]\)

で定義されます。つまり、一般の内積(=スカラー値)を「ベクトルの次元数の平方根」で割ったものです。

\(\bs{q}_i\) と \(\bs{k}_j\:\:(1\leq j\leq S)\) のスケール化内積を順番に \(S\)個並べたベクトルを \(\bs{s}_i\:\:[1\times S]\) と書くと、スケール化内積の定義によって、

 \(\bs{s}_i=\dfrac{1}{\sqrt{D}}\bs{q}_i\bs{K}^T\)
   \([1\times S]=[1\times D]\cdot[D\times S]\)

です。そして、加重和を求めるときの重み \(\bs{w}_i\) は、

 \(\bs{w}_i=\mr{Softmax}(\bs{s}_i)\)
   \([1\times S]=\mr{Softmax}([1\times S])\)

とします。この \(S\)次元の重みベクトルを使って、\(S\)個のバリュー・ベクトル \(\bs{v}_j\:\:(1\leq j\leq S)\) の加重和をとると、出力ベクトル \(\bs{y}_i\) は、

 \(\bs{y}_i=\bs{w}_i\cdot\bs{V}\)
   \([1\times D]=[1\times S]\cdot[S\times D]\)

となります。以上の計算プロセスを一つの式で書いてしまうと、

\(\bs{y}_i=\mr{Softmax}\left(\dfrac{1}{\sqrt{D}}\bs{q}_i\cdot\bs{K}^T\right)\cdot\bs{V}\)

   \([1\times D]=\mr{Softmax}([1\times D]\cdot[D\times S])\cdot[S\times D]\)

です。従って、SHA からの出力ベクトル \(\bs{y}_i\) を縦方向に並べた行列 \(\bs{Y}\) は、

 \(\bs{Y}=\mr{Softmax}\left(\dfrac{1}{\sqrt{D}}\bs{Q}\cdot\bs{K}^T\right)\cdot\bs{V}\)

   \([S\times D]=\mr{Softmax}([S\times D]\cdot[D\times S])\cdot[S\times D]\)

と表すことがきます。この表記で \(\mr{Softmax}\) 関数が作用するのは \([S\times S]\) の行列ですが、\(S\)個の行ごとに \(\bs{\mr{Softmax}}\) を計算します。

単なる内積ではなく「スケール化内積」を使う理由ですが、2つのベクトルの内積は、要素同士のかけ算を次元数 \(D\) 個だけ加算したものです。従って、ベクトル \(\bs{s}_i\) を、シンプルな内積を使って、

 \(\bs{s}_i\:=\bs{q}_i\cdot\bs{K}^T\)

のように定義し、重み \(\bs{w}_i\) を、

 \(\bs{w}_i=\mr{Softmax}(\bs{s}_i)\)

で求めると、\(D\) が大きいと \(\bs{s}_i\) の要素が大きくなり、その結果として \(\bs{w}_i\) はゼロに近いところに多くの要素が集まるようになります。これは \(\mr{Softmax}\) 関数の性質によります(前回参照)。こうなると勾配消失が起きやすくなり、訓練が収束しづらくなります。そのため「スケール化」するというのが論文の説明です。

もちろん、幾多の試行錯誤があり、その結果として決まったのが「スケール化内積で加重和の重みを計算する」というやり方だったのでしょう。


以上の計算でわかるように、注意機構(Attention machanism)とは、あるトークンを処理するときに、注意を向けるべきトークンと注意の強さを決め(それ自体が学習で決まる)、注意を向けた先の情報を集めてきて集積するものです。

しかも、注意機構は6層(\(N=6\)) に重ねられています。ということは、階層的な(多段階の) "注意の向け方" ができることになります。また、言語における単語と単語の関係性は多様です。動作\(\cdot\)動作主体、修飾\(\cdot\)被修飾、指示代名詞と指示されるもの(照応関係)など多岐に渡ります。それらのさまざまなタイプの関係性を、Transformer の訓練を通して、多層の注意機構が自動的に把握すると考えられるのです。

MHA : Multi Head Attention
SHA では、入力ベクトル \(\bs{x}_i\) から、1組の Query/Key/Value(\(QKV\)) ベクトルを抽出しましたが、Transformer で実際に使われているのは、

① 1つの入力ベクトル \(\bs{x}_i\) から、複数組の違った \(\bs{QKV}\) ベクトルを抽出し、
② それぞれについて独立に SHA と同等のアテンション処理をし、
③ 処理結果を単純結合(Concatenation)し、
④ 最後に線型変換をして出力ベクトルに \(\bs{y}_i\) する

という処理です。これを Multi Head Attention : MHA と呼びます。この「それぞれについてのアテンション処理」のことを "head(ヘッド)" と言います。複数の head なので Multi Head です。このヘッドの数を \(H\) とし、

 \(d=\dfrac{D}{H}\) (\(D\) は入出力ベクトルの次元)

とします(\(H\) は \(d\) が整数になるように選びます)。このとき、

\(\bs{x}_i\:\:[1\times D]\) から抽出される(複数組の)\(QKV\) ベクトルの次元はすべて \([1\times d]\)

です。つまり MHA は「複数の特徴を抽出し(一つの情報量は SHA より少ない)、それぞれの特徴について 独立した "注意機構" を働かせ、最後に統合してまとめる」仕組みです。なお、Transformer では、
 \(H=8\)
 \(d=\dfrac{D}{H}=\dfrac{512}{8}=64\)
です。

\(h\) 番目のヘッド \((1\leq h\leq H)\) に着目し、"注意機構" の計算プロセスを式で書くと、次のようになります。まず、\(h\) 番目のヘッドの \(QKV\) ベクトルの計算は、

\(\bs{q}_i^h=\bs{x}_i\cdot\bs{W}_Q^h\:\:\:(1\leq i\leq S,\:\:1\leq h\leq H)\)

\(\bs{k}_i^h=\bs{x}_i\cdot\bs{W}_K^h\:\:\:(1\leq i\leq S,\:\:1\leq h\leq H)\)

\(\bs{v}_i^h=\bs{x}_i\cdot\bs{W}_V^h\:\:\:(1\leq i\leq S,\:\:1\leq h\leq H)\)

  \([1\times d]=[1\times D]\cdot[D\times d]\)

です。系列全体について、\(h\) 番目のヘッドの \(QKV\) を行列の形で表すと、

\(\bs{Q}^h=\bs{X}\cdot\bs{W}_Q^h\)

\(\bs{K}^h=\bs{X}\cdot\bs{W}_K^h\)

\(\bs{V}^h=\bs{X}\cdot\bs{W}_V^h\)

  \([S\times d]=[S\times D]\cdot[D\times d]\)

です。\(h\) 番目のヘッドのアテンション処理は、SHA の場合と同様で、

\(\bs{y}_i^h=\mr{Softmax}\left(\dfrac{1}{\sqrt{d}}\bs{q}_i^h\cdot(\bs{K}^h)^T\right)\cdot\bs{V}^h\)

  \([1\times d]=\mr{Softmax}([1\times d]\cdot[d\times S])\cdot[S\times d]\)

となり、これを系列全体での表現にすると、

\(\bs{Y}^h=\mr{Softmax}\left(\dfrac{1}{\sqrt{d}}\bs{Q}^h\cdot(\bs{K}^h)^T\right)\cdot\bs{V}^h\)

  \([S\times d]=\mr{Softmax}([S\times d]\cdot[d\times S])\cdot[S\times d]\)

となります。行列 \(\bs{Y}^h\) は、\(h\) 番目のヘッドの出力ベクトル \(\bs{y}_i^h\:\:[1\times d]\) を、系列の数だけ縦に並べた行列です。


系列の \(i\) 番目の入力 \(\bs{x}_i\) に対する \(H\) 個の出力ベクトル

 \(\bs{y}_i^h\:\:[1\times d]\:\:(1\leq h\leq H)\)

が求まったところで、これら \(H\) 個を単純結合して(=順に並べる)一つのベクトルにし、さらに Linear 変換をして最終出力にします。変換に使う行列は \(\bs{W}_O\:\:[D\times D]\) です。

\(\bs{y}_i=\mr{Concat}(\bs{y}_i^1,\:\bs{y}_i^2,\:\cd,\:\bs{y}_i^H)\cdot\bs{W}_O\)

\(\begin{eqnarray} &&\:\: [1\times D]&=\mr{Concat}([1\times d],\:\cd\:)\cdot[D\times D]\\ &&&=[1\times D]\cdot[D\times D]\\ \end{eqnarray}\)

Linear 変換は直前の単純結合(Concatenation)とセットになっています。つまり、ヘッドの順序を表す \(h\:\:(1\leq h\leq H)\) という数字には、"注意機構" における何らかの意味があるわけではありません。単にアテンション処理を \(H\) 個に分けた \(h\) 番目というだけです。従って、順に単純結合する、

 \(\mr{Concat}(\bs{y}_i^1,\:\bs{y}_i^2,\:\cd,\:\bs{y}_i^H)\)

という操作の「結合順序」には意味が無いことになります。そこで結合した後で、学習可能なパラメータ \(\bs{W}_O\) で線型写像を行って、最適な出力ベクトルを求めるわけです。


エンコーダの MHA は、エンコーダ内に閉じたアテンションで、これを「自己アテンション」(Self Attention)と言います。一方、デコーダ側には自己アテンションの他に、エンコーダとデコーダにまたがるアテンションがあります。これを Source Target Attention と言います。このアテンションは、

・ クエリは、デコーダ側のベクトルから生成し、
・ キーとバリューは、エンコーダ側のベクトルから生成

します。これによってエンコーダからデコーダ側への情報の流れを作ります。日本語 → 英語の機械翻訳の場合だと、次に生成すべき英単語に関連して「注意を向けるべき日本語のトークンと、その注意の量」がここで決まります。


Multi Head Attention において、1つのベクトルから複数の \(QKV\) を取り出すことの意味は、おそらくトークンの「多義性」でしょう。その例ですが、英語で fine という語の代表的な意味を4つあげるとしたら、たとえば、

 fine :
  (1) 素晴らしい
  (2) 晴れた
  (3) 細かい
  (4) 罰金

です(例です。(1) (2) は同類の意味)。単語の埋め込みベクトルは、似たような(あるいは同一ジャンルの)語は類似している(= コサイン類似度が 1 に近い)わけです(前回参照)。とすると、(1)~(4) の同一ジャンルの言葉は、それぞれ、

  (1) good, excellent, ・・・・・・
  (2) cloudy, rainy, ・・・・・・
  (3) tiny, small, coarce, ・・・・・・
  (4) penalty, guilty, ・・・・・・

などとなるはずです。fine がこれら4つのジャンルと類似性があるということは、fine の埋め込みベクトルおいて4つの意味が物理的に分散して配置されていると考えられます。さらにイタリア語まで考えると、

 fine :
  (5) 終わり

が加わります(イタリア映画の最後に出てくる語、ないしは音楽用語)。埋め込みベクトルは言語ごとに作るわけではないので、fine のベクトルはあくまで1つです。ということは、埋め込みベクトルには(この例では)5つの意味が分散して配置されているはずです。

この状況は、埋め込みベクトルから複数の \(QKV\) ベクトルを取り出し、それぞれについて独立したアテンション計算をするというアルゴリズムがマッチしていると考えられるのです。


Add & Norm


図18d.jpg

アーキテクチャの絵で5カ所にある「Add & Norm」は、ベクトルごとに「残差結合」と「レイヤー正規化」を行うレイヤーです(詳細は前回参照)。図で表すと以下です。

図23:残差結合とレイヤー正規化.jpg
図23:残差結合とレイヤー正規化

計算式は次のようになります。系列の \(i\) 番目を示す \(\bs{x}_i,\:\:\bs{y}_i\) の \(i\) は省略します。

 \(\bs{y}=\mr{LayerNormalization}(\bs{x})\)

\(\begin{eqnarray}
&&\:\:  \bs{x}=\{\:x_1, &x_2, &\cd\:, &x_D\:\}\\
&&\:\:  \bs{y}=\{\:y_1, &y_2, &\cd\:, &y_D\:\}\\
\end{eqnarray}\)

 \(x_k\:\:(1\leq k\leq D)\) の平均 : \(\mu\)
  \(\mu=\dfrac{1}{D}\displaystyle\sum_{k=1}^{D}x_k\)

 \(x_k\:\:(1\leq k\leq D)\) の標準偏差 : \(\sg\)
  \(\sg=\sqrt{\dfrac{1}{D}\displaystyle\sum_{k=1}^{D}(x_k-\mu)^2}\)

とおくと、

\(\bs{y}=\dfrac{1}{\sg}\bs{g}\odot(\bs{x}-\mu)+\bs{b}\)

  \([1\times D]=[1\times D]\odot[1\times D]+[1\times D]\)

です。ここで \(\bs{g}\) と \(\bs{b}\) は学習で決まるベクトル(=パラメータ)です。


Feed Forward Network


図18e.jpg

ベクトルごとに処理される、2層の全結合ニューラル\(\cdot\)ネットワークです。第1層の活性化関数は \(\mr{ReLU}\) で、第2層(出力層)には活性化関数がありません。3つのレイヤーで表現すると次の通りです。

図24:Feed Forward Network.jpg
図24:Feed Forward Network

ニューロンの数(=ベクトルの次元)は、
 入力層:\(D\)
 第1層:\(D_{ff}=4\times D\)
 出力層:\(D\)
です。計算を式で表すと(系列の \(i\) 番目を示す \(\bs{x}_i,\:\:\bs{y}_i\) の \(i\) は省略)、

 \(\bs{y}=\mr{ReLU}(\bs{x}\bs{W}_1+\bs{b}_1)\cdot\bs{W}_2+\bs{b}_2\)

です。第1層の次元を入力\(\cdot\)出力層の4倍にとるのは、そのようにするのが Transformer の性能(たとえば、翻訳文の質)が最も向上するからです。GPT-3、ChatGPT も踏襲しています。

Masked Multi Head Attention
図18f.jpg

デコーダ側にある Masked Multi Head Attention の説明をします。系列のトークンの列を、

 \(\{\:\bs{x}_1,\:\cd\:,\:\bs{x}_{t-1},\:\bs{x}_t,\:\bs{x}_{t+1},\:\cd\:,\:\bs{x}_S\:\}\)

とし、いま \(\bs{x}_t\) に着目しているとします。

 \(\bs{x}_i\:\:\:(1\leq i\leq t)\:\longrightarrow\) 過去のトークン
 \(\bs{x}_i\:\:\:(t < i\leq S)\:\longrightarrow\) 未来のトークン

と呼ぶことにします。着目しているトークンを基準に、系列でそれ以前のトークンが「過去」、次以降のトークンが「未来」です。

日本語から英語に翻訳する Transformer を例にとると、デコーダの推論時には、英文のトークンを一つずつ推論していきます。つまり、

 [BOS] \(\longrightarrow\) [I]
 [BOS] [I] \(\longrightarrow\) [am]
 [BOS] [I] [am] \(\longrightarrow\) [a]
 [BOS] [I] [am] [a] \(\longrightarrow\) [cat]
 [BOS] [I] [am] [a] [cat] \(\longrightarrow\) [EOS]

といった具合です(図21)。このときの各ステップにおけるアテンション処理は、当然ですが、末尾のトークンから生成済みのトークン(=過去のトークン)に対して行われます。つまり「トークンが注意を向ける先は常に過去のトークン」です。「すでに生成済みのトークンの情報だけから次にくるトークンを推論する」のがデコーダなので、これは当然です。

一方、デコーダの訓練時のことを考えると、

(入力データ)[BOS] [I] [am] [a] [cat]
      
(教師ラベル)[I] [am] [a] [cat] [EOS]

で(図20)、入力データとしては系列のトークンが全部与えられています。しかしここで未来のトークンに注意を向けてしまうと、推論時との不整合が起きてしまいます。そこで

未来のトークンには注意を向けない。自分自身を含む過去のトークンにだけ注意を向ける

という配慮が、デコーダ側のアテンション処理では必要になります。この配慮をした注意機構が Masked Multi Head Attention です。一方、エンコーダ側では、訓練時も推論時も、

 [我が輩] [は] [猫] [で] [ある]

という系列が一括して与えられるので(図20、図21)、未来のトークンに注意を向けても問題ありません。またデコーダ側からエンコダー側に注意を向けるのもかまいません。

この「過去のトークンにだけ注意を向ける」ことを数式で表現するには、\([S\times S]\) のマスク行列、\(\bs{M}\) を次のように定義します。

 \(\bs{M}=\left(\begin{array}{c}
0&\phantom{0}&\phantom{0}&\phantom{0}&\phantom{0}\\
\phantom{0}&\large\ddots&\phantom{0}&\huge\textrm{-}\infty&\phantom{0}\\
\phantom{0}&\phantom{0}&0&\phantom{0}&\phantom{0}\\
\phantom{0}&\huge0&\phantom{0}&\large\ddots&\phantom{0}\\
\phantom{0}&\phantom{0}&\phantom{0}&\phantom{0}&0\\
\end{array}\right)\)  \([S\times S]\)

このマスク行列は、
・ 対角項:\(0\)
・ 行列の左下(行番号\( > \)列番号):\(0\)
・ 行列の右上(行番号\( < \)列番号):\(-\infty\)
です。これを、アテンションの計算式の \(\mr{Softmax}\) 関数の内側に足し込みます。\(h\) 番目のヘッドに着目したアテンションの計算式は、

\(\bs{Y}^h=\mr{Softmax}\left(\dfrac{1}{\sqrt{d}}\bs{Q}^h\cdot(\bs{K}^h)^T\right)\cdot\bs{V}^h\)

  \([S\times d]=\mr{Softmax}([S\times d]\cdot[d\times S])\cdot[S\times d]\)

でした。これに \(\bs{M}\) を足し込むと、

\(\bs{Y}^h=\mr{Softmax}\left(\dfrac{1}{\sqrt{d}}\bs{Q}^h\cdot(\bs{K}^h)^T+\bs{M}\right)\cdot\bs{V}^h\)

  \([S\times d]=\mr{Softmax}([S\times d]\cdot[d\times S]+[S\times S])\cdot[S\times d]\)

となります。\(\mr{Softmax}\) 関数は、ベクトル(上式では行列の1行)の各要素の \(\mr{exp}()\) をとります。従って、要素が \(-\infty\) だと \(\mr{exp}(-\infty)=0\) となり、\(\mr{Softmax}\) 関数にとってはその要素が無いのと同じことになります。

上式の \(\mr{Softmax}\) 関数の内側は \([S\times S]\) の行列ですが、縦方向が系列全体のクエリ・ベクトルに対応し、横方向が系列全体のキー・ベクトルに対応しています。そのため、マスク行列を足し込むと、アテンション処理において過去のトークンだけに注意が行き、未来のトークンには注意が行かない(=結果としてバリュー・ベクトルが加重和されない)ようになるのです。

こうして求めた行列 \(\bs{Y}^h\) の \(i\) 行目をベクトル、

 \(\bs{y}_i^h\:\:[1\times d]\:\:(1\leq h\leq H)\)

とすると、これ以降の処理はマスク行列がない場合と同じです。つまり \(H\) 個のベクトル \([1\times d]\) を単純結合して一つのベクトル \([1\times D]\) にし、さらに Linear 変換をしてアテンション処理からの最終出力にします。

 \(\bs{y}_i=\mr{Concat}(\bs{y}_i^1,\:\bs{y}_i^2,\:\cd,\:\bs{y}_i^H)\cdot\bs{W}_O\)

\(\begin{eqnarray}
&&\:\: [1\times D]&=\mr{Concat}([1\times d],\:\cd\:)\cdot[D\times D]\\
&&&=[1\times D]\cdot[D\times D]\\
\end{eqnarray}\)

わざわざ \(\mr{exp}(-\infty)\) を持ち出してマスク行列を使うのは、話をややこしくするだけのようですが、マスク行列を使った Masked Multi Head Attention の計算式を見ると、線型変換と \(\mr{Softmax}\) 関数だけからできています。ということは、「過去のトークンだけに注意を向けるアテンション計算は微分可能」であり、誤差逆伝播の計算が成り立つことがわかります。

確率生成
図18g.jpg

Transformerのデコーダの最終部分は、推論結果である \(D\) 次元のベクトルを、語彙集合の中での確率ベクトルに変換する部分です。計算式で書くと、

 \(\bs{y}=\mr{Softmax}(\bs{x}\cdot\bs{W}_{\large dec})\)
  \([1\times V]=\mr{Softmax}([1\times D]\cdot[D\times V])\)

です(系列の \(i\) 番目を示す \(\bs{x}_i,\:\:\bs{y}_i\) の \(i\) は省略)。\(\bs{W}_{\large dec}\) は、前回の word2vec のところに出てきた、\(D\)次元の埋め込みベクトルを \(V\) 次元の確率ベクトルに変換する行列です。


以上で Transformer のアーキテクチャの説明は終わりですが、全体を振り返ると、

アテンションだけが系列全体に関わる処理であり、あとはすべてベクトル(トークン)ごとの処理である

ことがわかります。以降は、この中で鍵となる「アテンション」と「Feed Foward Network」についての補足です。


アテンションの意義


一般のニューラル・ネットワークにおいて、隣合った2つの層、\(\bs{x}\) と \(\bs{y}\) が同じニューロン数 \(D\) だとします。活性値を、

\(\begin{eqnarray}
&&\:\:\bs{x}=\{x_1, &x_2, &\cd\:,&x_D\}\\
&&\:\:\bs{y}=\{y_1, &y_2, &\cd\:,&y_D\}\\
\end{eqnarray}\)

とし、重み行列を \(\bs{W}\)、バイアスはなし、活性化関数を \(\mr{ReLU}\) とするると、

 \(\bs{y}=\mr{ReLU}(\bs{x}\cdot\bs{W})\)

です。重み \(\bs{W}\) は誤差逆伝播法による訓練で決まり、推論時には一定の値です。Transformer のアテンション機構もこれと似ています。アテンションは、

 入力ベクトル列 :\(\bs{x}_i\:\:\:(1\leq i\leq S)\)
 出力ベクトル列 :\(\bs{y}_i\:\:\:(1\leq i\leq S)\)

の間の変換をする機構だからです。ニューラル\(\cdot\)ネットワークの活性値(実数値)がベクトルに置き換わったものと言えます。ヘッドが1つの場合(Single Head Attension)で図示すると、次の通りです。

図25:注意機構.jpg

図25:注意機構
ヘッドが1つの場合の計算処理である。ヘッドが複数の場合も本質は同じで、この計算処理を独立して複数個行ない、結果を結合して出力とする。

しかし、この図は一般のニューラル\(\cdot\)ネットワークとは決定的に違います。重み行列 \(\bs{W}_Q,\:\:\bs{W}_K,\:\:\bs{W}_V\) は推論時には一定ですが、実際に \(\bs{x}_i\) と \(\bs{y}_i\) の関係性を決めているのは、クエリ・ベクトル \(\bs{Q}\) とキー・ベクトル \(\bs{K}\) であり、これは入力ベクトル列 \(\bs{x}_i\) の内容にもろに依存しているからです。つまり、

注意機構により、ネットワークの "ありよう"(結合状態と結合強度)が、入力データの内容に依存して、ダイナミックに変化する

と言えます。\(\bs{x}_1\) の値を変えると、その影響は \(\bs{y}_i\:\:(1\leq i\leq S)\) の全体に及びます。それは、「\(x_1\) を変えると \(y_i\) の全部が変わる」という一般のニューラル\(\cdot\)ネットワークと同じではありません。一般のニューラル\(\cdot\)ネットワークを関数とみなすと、「関数は一定だが、入力が変わるから出力も変わる」のです。それに対して注意機構は「入力が変わると関数の形まで変わる」とみなすことができるでしょう。もちろん、実際には図25のように関数は一定なのですが、一般のニューラル\(\cdot\)ネットワークとの比較で言うと、そうみなせるということです。

この柔軟性とダイナミックな(動的な)性格が、Transformer に大きなアドバンテージをもたらしました。次章の GPT-3 / ChatGPT が実現している「本文中学習(In Context Learning)」はその一つです。ChatGPT では、プロンプトを変える、ないしは文言を追加すると、応答が大きく変わることがあります。また、欲しい応答の表現形式を例示したプロンプトをすると、その形式どおりのに応答がきたりします。あたかも、プロンプトからその場で学んだように見えるのが In Context Learning です。しかし、ニューラル・ネットワークのパラメータは、推論時にはあくまで一定であり、決してその場で学んでいるわけではありません。この "あたかも" を作り出しているのが "注意機構"です。


Feed Forward Network の意味


Transformer のアーキテクチャは、注意機構の後ろに Feed Forward Network(FFN) が接続され、このペアが多層に積み重ねられています。この FFN の意味は何でしょうか。

FFN は、注意機構と違ってベクトルごとの処理です。論文では "Position-wise(位置ごとの)Feed Forward Network" と書いてあります。ということは、系列の文脈には依存しないということです。つまり Transformer の訓練を通して、ベクトル(トークンの中間表現)が本来持っている性格や関連情報が、FFN の重みの中に蓄えられると考えられます。AI の専門家である、プリファードネットワークス社の共同創業者の岡野原大輔氏は、著書の『大規模言語モデルは新たな知能か』の中で次のように書いています。


トランスフォマーは、自己注意機構と MLP ブロックと呼ばれる単位を交互に重ねていき、データを処理するモデルである。

MLP ブロックは、三層の全結合層(前の層のすべてのニューロンが次の層のすべてのニューロンとつながっている)とよばれる層を使った多重パーセプトロン(Multi-Layer Perceptron)とよばれるニューラルネットワークを使ったブロックであり、自己注意機構で集めた情報ををもとにそれを変換する部分である。

しかし、MLP ブロックは実は、学習中に出会った情報を保存しておき、今処理している内容と関係しそうな情報を読み出して処理している長期記憶に対応する部分だとみなすことができる。どの情報を保存し、どの情報とどの情報を関連づける(記憶でいえば想起する)のかを判断する機能が、あくまで次の単語を予測できるようにするという目的を達成するための重みを修正する過程で、自動的に実現される。その結果、今後必要そうな情報を記憶し、またそれを必要に応じて読みだすことができる。

岡野原 大輔 
「大規模言語モデルは新たな知能か」
(岩波書店 2023)

岡野原氏が「多重パーセプトロン(Multi-Layer Perceptron : MLP)と書いているのは FFN のことです。ちなみに入力層(第0層)を含めて「三層」という言い方になっています。


ここで、FFN のパラメータ数を求めてみます。バイアスを無視すると、

 \(\bs{W}_1\:\:[D\times D_{ff}]\)
 \(\bs{W}_2\:\:[D_{ff}\times D]\)
  \(D\) : 埋め込みベクトルの次元
  \(D_{ff}=4D\)

なので、

 FFN のパラメータ数\(=8D^2\)

です。一方、Multi Head Attention で、
 \(H\) : ヘッドの数
 \(d=\dfrac{D}{H}\)
とすると、\(h\)番目のヘッドの \(QKV\) を作る行列は、

 \(\bs{W}_Q^h\) \([D\times d]\)
 \(\bs{W}_K^h\) \([D\times d]\)
 \(\bs{W}_V^h\) \([D\times d]\)

であり、これらを足すとパラメータ数は \(3Dd\) ですが、この組が \(H\) セットあるので、合計は \(3DdH=3D^2\) です。さらに、単純結合したあとの Linear 変換行列である、

 \(\bs{W}_O\) \([D\times D]\)

が加わるので、結局、

 MHA のパラメータ数\(=4D^2\)

です。ということは、

 FFN のパラメータ数は、MHA のパラメータ数の2倍

ということになります。パラメータ数だけの単純比較はできませんが、FFN が極めて多い情報量=記憶を持っていることは確かでしょう。それが、大量の訓練データの中から関連する情報を記憶し、また推論時にそれを想起することを可能にしています。

論文のタイトルは "Attention Is All You Need" で、これは従来の機械翻訳の技術では補助的役割だった Attention を中心に据えたという意味でしょう。しかし技術の内実をみると、決して「アテンションがすべて」ではなく「アテンション機構と多重パーセプトロンの合わせ技」であり、しかもそれを多層に重ねたのが Transformer なのでした。

前回でニューラル・ネットワークの例とした多重パーセプトロンは、ニューラル・ネットワークの研究の歴史の中で最も由緒あるもので、1980年代に盛んに研究されました。それが、2010年代半ばから研究が始まった "アテンション機構" と合体して Transformer のアーキテクチャになり、さらには ChatGPT につながったのが興味深いところです。

 
4.GPT-3 と ChatGPT 
 

OpenAI 社は、GPT(2018)、GPT-2(2019)、GPT-3(2020)、ChatGPT(2022)と発表してきましたが、技術内容が論文で公開されているのは GPT-3 までです。また、ChatGPT の大規模言語モデルは GPT-3 と同じ仕組みであり、大幅に学習を追加して一般公開できるようにしたのが ChatGPT です。ここではまず GPT-3 の仕組みを説明します。

GPT-3 のアーキテクチャ
GPT は Generative Pre-trained Transformer の略です。generative とは "生成型の"、pre-trained は ""事前学習済の" という意味で、Transformer は Google が 2017年に提案した Transformer を指します。

訳すると "事前学習済の生成型トランスフォーマー" となるでしょう。Transformer は「変換器」という意味でした。とすると「生成型の変換器」とは言葉が矛盾しているようですが、実は GPT は Transformer のアーキテクチャのデコーダ部分だけを使った大規模言語モデルです。だから「生成型変換器」なのです(下図)。

図18h.jpg
GPT は上図の Transformer のアーキテクチャから赤枠の部分のみを使っている。

この「デコーダ部分だけを使う」という発想が、OpenAI の技術者の慧眼でした。デコーダだけで系列変換(機械翻訳、文章要約、質問応答、・・・・・・ )ができるはず、という発想が GPT に柔軟性と大きな能力を与えました。GPT-3 のアキテクチャーは以下のようです。

図26:GPT-3 のアーキテクチャ.jpg
図26:GPT-3 のアーキテクチャ

このアキテクチャーは、Transformer から「エンコーダとエンコーダ関連部分」を取り去ったものです。ただし、次が違います。

① Position Encoding における位置符号ベクトルは、学習で決まるパラメータとします。Transformer では固定的な \(\mr{sin}/\mr{cos}\) 波でした。

② レイヤー正規化を Masked Multi Head Attetion と Feed Forward Network の直前に行います。Transformer では、それぞれの後にレイヤー正規化が配置されていました。

③ Feed Forward Network の活性化関数は \(\mr{GELU}\) を使います。Transformer では \(\mr{ReLU}\)です(\(\mr{GELU}\) については前回参照)。

これらはいずれも、学習の安定化と高速化のための工夫です。さらに GPT-3 は Transformer に比べてモデルの規模が大きく拡大されています。

 ・埋め込みベクトルの次元 \(D=12288\)
    \((\)Transformer \(:\:512\) の \(24\)倍\()\)
 ・デコーダブロックの積層数 \(N=96\)
    \((\)Transformer \(:\:6\) の \(16\)倍\()\)
 ・アテンションのヘッドの数 \(H=96\)
    \((\)Transformer \(:\:8\) の \(12\)倍\()\)

です。大規模言語モデルでは、モデルの規模と学習量の拡大を続けると、それにともなって性能(たとえば機械翻訳の精度)が上がり続けるという「スケール則」がみられました。これは一般の深層学習のニューラル\(\cdot\)ネットワークにはない特徴です。このスケール則を信じ、アーキテクチャをシンプルにしつつ、モデルの規模を「桁違いに」拡大した OpenAI 社と出資した会社(マイクロソフト)の勝利でしょう。

このアーキテクチャのパラメータ数をカウントしてみます。

 ・トークンの語彙数 \(V\)
 ・埋め込みベクトルの次元 \(D\)
 ・系列の長さ \(S\)
 ・デコーダの積層数 \(N\)

とします。GPT-3 の具体的な数値は、

 \(V\)\(=50257\)
 \(D\)\(=12288\)
 \(S\)\(=\phantom{1}2048\)
 \(N\)\(=\phantom{111}96\)

です(\(V\) の値については前回参照)。学習で決まる行列やベクトルを順にカウントしていくと次のとおりです。

 (1) Embedding と確率生成 


  \(\bs{W}_{\large enc}\) \([V\times D]\)
  \(\bs{W}_{\large dec}\) \([D\times V]\)

  \(\rightarrow\) パラメータ数\(=2VD\)

 (2) Positional Encoding 

  \(\bs{p}\) \([S\times D]\)

  \(\rightarrow\) パラメータ数\(=SD\)

 (3) Masked Multi Head Attention 

  \(\bs{W}_Q\) \([D\times D]\) ※
  \(\bs{W}_K\) \([D\times D]\) ※
  \(\bs{W}_V\) \([D\times D]\) ※
  \(\bs{W}_O\) \([D\times D]\)

  \(\rightarrow\) パラメータ数\(=4D^2\)

※ GPT-3 のヘッドの数は \(H=96\) なので、\(\bs{W}_Q,\:\:\bs{W}_K,\:\bs{W}_V\) はそれぞれ \(96\)個の部分行列に分かれていますが、パラメータ数の全体は上式のとおりです。

 (4) Feed Forward Network 

  \(\bs{W}_1\) \([D\times4D]\)
  \(\bs{b}_1\) \([1\times4D]\)
  \(\bs{W}_2\) \([4D\times D]\)
  \(\bs{b}_2\) \([1\times D]\)

  \(\rightarrow\) パラメタ数\(=8D^2+5D\)

 (5) Layer Nomaliation (2レイヤー) 

  \(\bs{g}\) \([1\times D]\)
  \(\bs{b}\) \([1\times D]\)

  \(\rightarrow\) パラメタ数\(=2\times2D=4D\)


(3), (4), (5) は \(\times\:N\) に積層されていることに注意して総パラメータ数を計算すると、

 総パラメータ数
  \(=\:2VD+SD+N(4D^2+8D^2+5D+4D)\)
  \(=\:2VD+SD+N(12D^2+9D)\)
  \(=\) \(\bs{175,217,074,176}\)

となり、約 1752億となります。一般に言われているパラメータ数が 1750億というのは、英語の 175B(B = Billion = 10億)の日本語訳で、Billion 単位にしたパラメータ数です。

GPT-3 が系列の次のトークンを推論するとき、1752億のパラメータの全てを使った演算が行われます(図21)。40文字の日本語文章を 60トークンだとすると、 わずか 40文字の日本語文章を生成するために、1752億のパラメータの全てを使った演算が 60回行われるということです。

また、1752億のパラメータがすべて 32ビットの浮動小数点数(4バイト)だとすると、パラメータのためだけに

 653ギガバイト(1ギガ = \(1024^3\) 換算)

のメモリが必要になります。業務用コンピュータ・システムの開発経験者ならわかると思いますが、これだけのデータ量を常時抱えつつ、更新やリアルタイムの推論を行うシステムを開発・運用するのは、ちゃんとやればできるでしょうが、かなり大変そうな感じです。


GPT-3 のアーキテクチャを振り返ってみると、Transformer のデコーダ部分だけを採用したことによる、Transformer との違いがあることに気づきます。それは、

Transformer には「過去と未来の両方に注意を向けるアテンション機構」と「過去にだけ注意を向けるアテンション機構」の両方があるが、GPT-3 には「過去にだけ注意を向けるアテンション機構」しかない

ことです。言うまでもなく、アテンション機構は Transformer / GPT-3 の "キモ" です。そのキモのところに違いがある。

人間の言語活動(発話・文章作成)では「過去の単語との整合性を考慮しつつ、未来の単語を想定して次の単語を決める」ことが多々あります。このことは、機械翻訳では、翻訳前の「原文」を処理するエンコーダ側の「過去と未来の両方に注意を向けるアテンション機構」で実現されています(Mask がない Multi Head Attention)。

しかし GPT-3 では様子が違ってきます。事前学習(次項)だけの GPT-3 で機械翻訳がなぜできるかというと、

 [ 原文 ] を翻訳すると [ 翻訳文 ] です

といった対訳(に相当するデータ)が訓練データの中に多数あるからです(GPT-2 の論文による)。この「原文」の部分のアテンション処理において、「原文」の中の未来の単語に注意が向くことはありません(Masked Multi Head Attention しかないから)。このことにより翻訳の精度が Transformer とは違ってくる(精度が落ちる)と想定できます。

こういった "問題" は、大規模言語モデルを "超大規模" にすることで解決するというのが、GPT-3 の開発方針だと考えられます。1752億という膨大なパラメータ数が、それを表しています。

GPT-3 の訓練
GPT-3 の訓練は、
 ・WebText
 ・電子ブック
 ・Wikipedia
をもとに行われました。WebText は "訓練に使うべきではない" テキストを除外してあります。集められたテキストの量はトークンの数でカウントすると、
 ・WebText \(4290\)億
 ・電子ブック \(\phantom{42}67\)億
 ・Wikipedia \(\phantom{42}30\)億
です。これらのテキストからランダムに選んだミニバッチを作り、「ミニバッチ勾配降下法」(前回参照)で訓練が行われました。但し、Wikipedia などの "信頼性が高いテキスト" は、より多くミニバッチに選ばれるような工夫がしてあります。訓練は、使われたテキストが、トークン数で延べ \(3000\)億になったところで打ち切られました。

訓練は、Transformer のデコーダのところでで説明したように「ひたすら次のトークンの予測をする」というものです。この「次のトークンの予測」について補足しますと、前回、GPT のトークン化のロジックである BPE(Byte Pair Encoding)のことを書きました。これによると、UTF-8 では改行も空白も文字として扱われるので、改行、空白のそれぞれにトークンID が割り当てられることになります。

これから言えることは、テキストを学習するということは、その意味内容だけでなく、テキストの表現形式も学習するということです。つまり、段落、字下げ、箇条書きなどの形式です。訓練が終わった 1752億のパラメータには、そういった "表現形式に関する知識" も含まれていることに注意すべきでしょう。

以上のように、一般的に入手できるテキストだけを使ってニューラル・ネットワークを訓練することを「事前学習」と言います。このような事前学習を行った上で、機械翻訳や質問応答などのタスク別に専用に作成した訓練データで「目的別学習」を行うのが、言語モデルの定番の学習手法です。あらかじめ事前学習を行った方が言語モデルの性能が良くなるからです。目的別学習を "ファイン・チューニング" と言います。

GPT-3 は、それまでの GPT、GPT-2 と違って、ファイン・チューニングなしの言語モデルを狙ったものです。つまり、

事前学習済みの(=事前学習だけの)、生成型の(=デコーダだけの)トランスフォーマー

と言えるでしょう。実際 GPT-3 は、ファイン・チューニングを行った言語モデルと比較しても、"そこそこの"、ないしは "同等の" 性能であることが分かりました。もちろんファイン・チューニング済の言語モデルに劣るタスクも多々あります。しかし全体としては "そこそこの" 性能を示します。「ニューラル・ネットワークの超大規模化」と「大量の訓練データ」によってそれが可能であることを、GPT-3 は示したのでした。

ChatGPT
ChatGPT は GPT-3 のアーキテクチャと事前学習をもとに、さらに「目標駆動型学習」を追加したものです。ここでの目標駆動型学習とは「人間にとって好ましい応答の例を人間が作り、それを目標として、そこに近づくように学習する」という意味です。OpenAI 社は RLHF(Reinforcement Learning by Human Feedback:人間のフィードバックによる強化学習)と呼んでいます。これは一種のファイン・チューニングであると言えます。

この、目標駆動型学習をどうやるか、その詳細が OpenAI 社のノウハウでしょう。考えてみると、GPT-3 の(従って ChatGPT の)アーキテクチャはシンプルあり、これをシステム上に実現するのは、コンピュータ技術とAI技術、ハードウェアの調達(特にGPU)、そしてお金の問題です。事前学習に使う WebText にしても、世界中から集めて公開している団体があります(GPT-3 でも使われた Common Crawl)。お金がある(かつ投資意欲がある)大手IT企業なら、システム構築は難しくない。

しかし「人手で作った訓練データをもとに、人にとって違和感がない対話ができるまでに訓練する」のは、Transformer の性質や "癖 を熟知していないとできないと考えられます。そこにノウハウがあるはずです。

その目標駆動型学習の概要を、先ほど引用した岡野原氏の「大規模言語モデルは新たな知能か」では、次のような3つのステップで説明しています。この説明は専門用語を最小にした簡潔なものなので、以降これに沿って書きます。


  ラベラーが望ましい対話の例を作り、それを生成できるように言語モデルを教師あり学習で修正する。

このステップでは理想的な回答例を直接学習することができるが、工数がかかるため、大量の模範解答例を作ることはできない。あくまで大規模言語モデルの基本的な部分を修正するだけである。

  複数の異なるモデルによって生成されたプロンプトに対する回答例を、ラベラーが、どの回答が良かったか悪かったか、良い順にランキングする。このランキングをもとに、自動評価システムが回答を評価できるようにする。

このステップでは、生成された対話が良い対話かどうかを自動的に評価できるシステムを作ることが目標である。自動評価システムを作ること自体難しいタスクだが、言語を理解している大規模言語モデルの内部状態を入力として、自動評価システムが評価を出力することで、高精度に評価を推定できるようにする。

  大規模言語モデルは、その回答結果に対し、自動評価システムが高い評価を与えるようにモデルを強化学習で修正する。

岡野原 大輔 
「大規模言語モデルは新たな知能か」

この岡野原氏の説明を読み解くと、次のようになるでしょう。ラベラーとは訓練データ(教師ラベル)を作る人の意味です。

第1ステップは、機械学習の分野でいう「教師あり学習」です。ここで具体的にどのような訓練をしたのかは、OpenAI 社も公表していません。推測すると「望ましい対話」の例には、人間の質問に「答えられません」や「できません」と応答する訓練データも多数あるのではと思います。たとえば「反社会的行為を助長するような質問」の場合(爆弾の作り方など)です。

さらにこの第1ステップでは、特定のタイプのプロンプトに対して、あたかも ChatGPT が感情をもっているかのように応答する訓練が可能なはずです。それが「望ましい対話」だと OpenAI が判断すればそうなります。

第2ステップは2つのフェーズに分かれています。第1フェーズは、人手によるランキングの作成です。このとき「複数の異なるモデル」を使います。モデルとは言語モデルのことです。実は、GPT-3 を開発する過程においても、パラメータ数の違う複数の言語モデルが開発されていて、最終的に公開されたのが GPT-3 です。またパラメータ数が同じでも、訓練のやり方が違うとパラメータの値が違うので、モデルとしては別です。

このような複数の異なるモデルを選び(4つとします)、同じ入力(プロンプト。\(P\) で表します)に対して、4つの違った応答、\(A,\:B,\:C,\:D\) を得ます。ラベラーは、この \(P/A,\:P/B,\:P/C,\:P/D\) という4つの「プロンプト \(/\) 応答」にランク付けします( \(/\) はプロンプトのあとに応答が続くという意味です)。ランク付けが仮に、

 \(P/A\: > \:P/B\: > \:P/C\: > \:P/D\)

だとします。現実問題としては4つのランク付けは難しいので、2つずつの6つのペアについて、どちらが良いかを決めます。ランク付けの基準について岡野原氏は書いていないのですが、OpenAI 社の公開資料によると、
 ・嘘やデマを含まない
 ・差別的・攻撃的な内容を含まない
 ・ユーザの役に立つ
という基準です。このような「ランク付けデータ」を大量に準備します。これは人に頼る "人海戦術" しかないので、アウトソーシングしたとしてもコストがかかります。

ちなみに、応答が「差別的・攻撃的な内容を含まない」というのは極めて重要です。というのも、過去に「AI を使った Chat システムが差別的発言をするようになり、公開中止に追い込まれる」という事件が何件か発生しているからです(2016年のマイクロソフト、2022年のメタなど)。

特に、メタ(旧フェイスブック)の Galactica 炎上事件(差別的応答による)は、システムの公開日が 2022年11月15日であり、ChatGPT の公開日(2022年11月30日)とほぼ同時期でした。メタがつまづき、ChatGPT がつまづかなかったのは、OpenAI 社が極めて慎重に「反倫理的・反社会的応答」を排除するように訓練したからと考えられます。

第2ステップの第2フェーズは、ランキングのデータをもとに自動評価システムを作ることが目的です。データを入力して評価値(強化学習の用語でいうと "報酬")を出力する関数(=自動評価システム)を \(\mr{Score}()\) と書くと、

 \(\mr{Score}(P/A) > \mr{Score}(P/B) > \mr{Score}(P/C) > \mr{Score}(P/D)\)

となるように関数を決めます。これはニューラル・ネットワークを使って、訓練を繰り返して決めます(強化学習の用語で "報酬モデル")。ここで岡野原氏が指摘しているのは、\(\mr{Score}\) 関数への入力は、

ランキングをつけたデータそのものでなく、目標駆動型学習をしたい大規模言語モデル(この場合は GPT-3)にランキング済みデータを入力したときの、大規模言語モデルの内部状態

だということです。従って、\(\mr{Score}(P/A)\) は、
 \(\mr{Score}(\mr{InnerState}(P/A))\)
と書くべきでしょう。これによって「高精度に評価を推定できる」というのが岡野原氏の説明です。

第3ステップでは、この自動評価システムを使って、プロンプトに対する応答の評価値が最も高くなるように強化学習を行います。このステップには人手を介した評価はないので、大量のプロンプトで学習することができます。

ここで、言語モデル \(\al\) の内部状態を入力とする自動評価システムを \(\mr{Score}_{\large\:\al}\) とし、言語モデル \(\al\) を上記のように訓練した結果、言語モデル \(\beta\) になったとします。すると、同じ「プロンプト/応答」を投入したときの内部状態が、2つの言語モデルで違ってきます。つまり、
 \(\mr{InnerState}_{\large\:\al}(P/A)\neq\mr{InnerState}_{\large\:\beta}(P/A)\)
です。ということは、

\(\mr{InnerState}_{\large\:\beta}\) を入力とする、自動評価システム \(\mr{Score}_{\large\:\al}\) の改訂版、\(\mr{Score}_{\large\:\beta}\) が作れる

ことになります。つまり「第2ステップの第2フェーズ」と「第3ステップ」をループさせて繰り返すことができる。このとき、ラベラーが作ったランキングデータはそのまま使えます。このランキングが絶対評価ではなく相対評価だからです。以上のことから、

自動評価システムと言語モデルは、より正確な評価値を獲得するように "共進化" できる

と言えます。岡野原氏が言っている「高精度に評価を推定できる」とは、こういった "共進化" も含めてのことだと考えられます。このように、目標駆動型学習で鍵となるのは、この「高精度の自動評価システム」です。

補足しますと、ChatGPT が公開された後は、利用者の実際のプロンプトとそれに対する ChatGPT の応答を膨大に集積できます(利用者が拒否しなければ)。この実際の「プロンプト/応答」データの中から自動評価システムの評価が低いものだけを集め、プロンプトへの応答の評価が高くなるように ChatGPT の強化学習ができることになります。ChatGPT から "でたらめな" 応答を引き出そうとする(そして成功すれば喜ぶ)人は多いでしょうから、強化学習のためのデータにはこと欠かないはずです。

以上が、岡野原氏の説明の "読み解き" です。


ここまでをまとめると、次のようになるでしょう。

◆ GPT-3 は、ひたすら次の語を予測することに徹し、大量のテキストで訓練された大規模言語モデルである。その基盤技術は Transformer をシンプルにしたものであり、\(1752\)億のパラメータをもつ巨大ニューラル・ネットワークである。

◆ ChatGPT は GPT-3 をベースに、人手で作った「人にとって好ましい応答例」を訓練データとして学習し、人と違和感なく会話できるようにした大規模言語モデルである。

このような GPT-3 の仕組みでは、計算や論理的推論は本質的にできません。簡単な計算(2桁整数同士のたし算、2次方程式を解くなど)ができる(ように見える)のは、それが訓練データにあるからです。また、正しい論理的推論ができたとしたら、類似の推論が訓練データの中にあるからです。

とはいえ、ChatGPT はバックに語と語の関係性についての膨大な "知識" をもっていて、それによって "規則性" や "ルール" の認識が内部にできているはずです。その中には「人が気づかない」「暗黙の」「意外なもの」があってもおかしくない。それにより、蓄積した知識を "混ぜ合わせて" 正しい推論、ないしは発見的な推論がきることもあり得るはずです。

さらに、人が普段話すのと同じように話せば、その膨大な "知識" が活用できるのは多大なメリットでしょう。もちろん "悪用" される可能性はいつでもありますが、そのことを踏まえつつ、使い方の発見や検討が今後も進むのでしょう。

 
言語の "理解" とは 
 

人の問いかけに対する ChatGPT の応答は、いかにも人らしいものです。もちろん間違いや、変な答え、明らかに事実とは違う応答もあります。しかし、世界中から集めた知識の量は膨大で、言語の壁も越えています。

その "知識" は(GPT-3, ChatGPT では)1752億個のパラメータの中に埋め込まれています。量は膨大ですが、それを処理する仕組みはシンプルです。なぜこれでうまくいくのか、そこが驚異だし、その理由を理解することは難しいでしょう。

もちろん、その中身を解明しようとする研究は進むでしょうが、"理解" は難しいのではと思われます。というのも、「比較的シンプルな記述による、人にフレンドリーな説明」でないと、人は "理解" したとは思わないからです。

しかし考えてみると、我々が言語(母語)を習得でき、かつ自在に扱えるのはなぜか、その脳の働きは、Transformer / ChatGPT と極めて似ているのではないでしょうか。

前回の冒頭で紹介したように、慶応義塾大学の今井教授は、「ChatGPT の仕組み(=注意機構)は、幼児が言語を学習するプロセスと類似している」と指摘していました。今井教授は幼児の言語発達を研究する専門家なのでこの指摘になるのですが、実は Transformer / ChatGPT のやっていることは、幼児のみならず、我々が言葉(母語)を理解してきた(現に理解している)やりかたと酷似していることに気づきます。それは、

外界からくる複雑な情報を丸ごと飲み込んで、ルールを知らないうちから活用する(活用できる)

という言語理解のありようです。もちろん(外からの指摘による)「好ましくない言葉の使い方」であれば訂正します。しかし、学び方も含めて、我々は内発的・創発的に言葉を理解しています。それが我々の脳の働きの重要な一面です。

前回、Transformer がタンパク質の機能分析に使える(可能性がある)ことを書きましたが、さらにヒトの脳の(ある脳領域の)解明に役立つこともありそうです。

大規模言語モデルの外面的な機能は驚異的ですが、さらにその内部の「仕組み」を理解することで、その応用範囲が極めて広いことがわかるのでした。




nice!(0) 

No.365 - 高校数学で理解する ChatGPT の仕組み(1) [技術]

\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{#1}} \newcommand{\ol}[1]{\overline{#1}} \newcommand{\sb}{\subset} \newcommand{\sp}{\supset} \newcommand{\al}{\alpha} \newcommand{\sg}{\sigma}\newcommand{\cd}{\cdots}\)
前回の No.364「言語の本質」の補足で紹介した新聞記事で、慶応義塾大学の今井教授は、

ChatGPT の「仕組み」(=注意機構)と「メタ学習」は、幼児が言語を学習するプロセスと類似している

と指摘していました。メタ学習とは「学習のしかたを学習する」ことですが、 ChatGPT がそれをできる理由も「注意機構(Attention mechanism)」にあります。そこで今回は、その気になる ChatGPT の仕組みをまとめます。

今まで「高校数学で理解する ・・・・・・」というタイトルの記事をいくつか書きました。


の 13 の記事です。"高校数学で理解する" という言い方は、「高校までで習う数学だけを前提知識として説明する」という意味ですが、今回もそれに習います。もちろん、文部科学省の学習指導要領は年々変わるので、"おおよそ高校までの数学" が正しいでしょう。今回、前提とする知識は、
・ 行列
・ ベクトル
・ 指数関数、対数
・ 微分、積分
・ 標準偏差と正規分布(ガウス分布)
です。ChaGPT は "ニューラル・ネットワーク"、ないしは "深層学習(ディープ・ラーニング)" の技術を使った AI ですが、こういった知識は前提とはしないことにします。つまり、ニューラル・ネットワークについては、その基礎から(必要なものだけに絞って)順を追って説明します。


全体の構成


全体の構成は次の4つです

1.ニューラル・ネットワーク

ニューラル・ネットワークの基礎から始まって、最も重要なポイントである「学習できる」ことを説明をします。

2.自然言語のモデル化

自然言語をニューラル・ネットワークで扱う際に必須である「単語の分散表現」を説明します。また、「言語モデル」と、ChatGPT で使われている「トークン」についても説明します。

3.Transformer

ChatGPT のベースになっている技術は、2017年に Google社が発表した Transformer です。この説明をします。

4.GPT-3 と ChatGPT

OpenAI 社は、GPT(2018)、GPT-2(2019)、GPT-3(2020)、ChatGPT(2022)と発表してきましたが、技術内容が論文で公開されているのは GPT-3 までです。また、ChatGPT の大規模言語モデルは GPT-3 と同じ仕組みであり、大幅に学習を追加して一般公開できるようにしたのが ChatGPT です。

ここでは GPT-3 の仕組み・技術内容を説明し、合わせて ChatGPT と GPT-3 の違いも説明します。

なお、この記事の作成には、Google と OpenAI の論文に加えて、以下を参考にしました。

◆岡野原 大輔(プリファードネットワークス)
 「大規模言語モデルは新たな知能か」
 (岩波書店 2023)

◆澁谷 崇(SONY)
 「系列データモデリング (RNN/LSTM/Transformer)」
   第7回「Transformer」
   第12回「GPT-2, GPT-3」
 (YouTube 動画)

 
1.ニューラル・ネットワーク 
 

記号
以降で使用する記号の意味は次の通りす。

◆ ボールド体ではない、ノーマル書体の英大文字・小文字はスカラー値(ないしはスカラー変数)を表します。\(a,\:\:b,\:\:x,\:\:y,\:\:x_1,\:w_{12},\:\:M,\:\:N,\:\:L\) などです。

◆ ボールド体の英大文字は行列を表します。\(\bs{W}\) などです。 \(N\) 行、\(M\) 列 の行列を \([N\times M]\) と表記します。\(\bs{W}\:[2\times3]\) は、2行3列の行列 \(\bs{W}\) で、
 \(\bs{W}=\left(\begin{array}{r}w_{11}&w_{12}&w_{13}\\w_{21}&w_{22}&w_{23}\\\end{array}\right)\)
です。

◆ ボールド体の英小文字はベクトルを表します。ベクトルは「行ベクトル」で表現し、\(n\)次元のベクトル \(\bs{x}\) は、
 \(\bs{x}=\left(\begin{array}{r}x_1&x_2&\cd&x_n\\\end{array}\right)\)
です。この \(n\)次元のベクトルを、\(1\) 行 \(n\) 列の行列と同一視します。従って次元の表記は \(\bs{x}\:[1\times n]\) です。

◆ 列ベクトルは、転置行列の記号(\({}^T\))を使って、
 \(\bs{x}^T\)
で表します。たとえば、3次元の列ベクトルは3次元の行ベクトルの転置を使って、
 \(\bs{x}^T=\left(\begin{array}{r}x_1\\x_2\\x_3\\\end{array}\right)\:\:[3\times1]\)
です。

◆ 同一次元の2つのベクトル \(\bs{x}\:\:\bs{y}\) の内積(スカラー積、ドット積)は、
 \(\bs{x}\bs{y}^T\)
で表します。ドッド記号(\(\cdot\))は内積ではなく、行列の積(または実数値同士の積)です。ただし、一般的に行列の積は、\(\bs{x}\bs{y}^T\) のように積記号を省略します。

◆ 同一次元の2つのベクトルの「対応する要素同士の積」で作ったベクトルを「要素積」(ないしはアダマール積)と呼び、\(\odot\) の記号で表します(一般的には \(\otimes\) の記号も使います)。\(n\)次元ベクトル同士の要素積は、
 \(\left(\begin{array}{r}x_1&x_2&\cd&x_n\\\end{array}\right)\odot\left(\begin{array}{r}y_1&y_2&\cd&y_n\\\end{array}\right)\)
   \(=\left(\begin{array}{r}x_1y_1&x_2y_2&\cd&x_ny_n\\\end{array}\right)\)
です。要素積は、行数・列数が同一の2つの行列にも適用します。

◆ 指数関数、\(f(x)=e^x\) を、
 \(f(x)=\mr{exp}(x)\)
と表記します。

◆ \(n\)次元ベクトルを \(\bs{x}=\{x_1\:x_2\:\cd\:x_n\}\) とし、1変数の関数 \(f(x)\) があるとき、ベクトル \(f(\bs{x})\) を、
 \(f(\bs{x})=\left(\begin{array}{r}f(x_1)&f(x_2)&\cd&f(x_n)\\\end{array}\right)\)
で定義します。

ニューラル・ネットワークの例
2層から成るシンプルなニューラル・ネットワークの例が図1です。この例では隠れ層が1つだけですが、隠れ層は何層あってもかまいません(なお、入力層を含めて、これを "3層" のニューラル・ネットワークとする定義もあります)。

図1:ニューラル・ネットワーク.jpg
図1:ニューラル・ネットワーク

丸印は "ニューロン" で、各ニューロンは1つの値(活性値)をもちます。値は実数値で、32ビットの浮動小数点数が普通です。図1のニューロンの数は 3+4+3=10 個ですが、もちろんこの数は多くてもよく、実用的なネットワークでは数100万から億の単位になることがあります。

ニューロン間の矢印が "シナプス" で、一つのニューロンは、シナプスで結ばれている前の層のニューロンから値を受けとり、決められた演算をして自らの値を決めます(入力層を除く)。なお、"ニューロン" や "シナプス" は脳神経科学の用語に沿っています。

各層は、重み \(\bs{W}\)(行列)とバイアス \(\bs{b}\)(ベクトル)、活性化関数 \(f\) を持ちます。図1の場合、第1層の重みは \(\bs{W}\:\:[3\times4]\)、バイアスは \(\bs{b}\:\:[1\times4]\) で、

 \(\bs{W}=\left(\begin{array}{r}w_{11}&w_{12}&w_{13}&w_{14}\\w_{21}&w_{22}&w_{23}&w_{24}\\w_{31}&w_{32}&w_{33}&w_{34}\\\end{array}\right)\)

 \(\bs{b}=\left(\begin{array}{r}b_1&b_2&b_3&b_4\\\end{array}\right)\)

です。このとき、隠れ層(第1層)のニューロンの活性値、\(\bs{h}=\left(\begin{array}{r}h_1&h_2&h_3&h_4\\\end{array}\right)\) は、

 \(h_1=f\:(\:x_1w_{11}+x_2w_{21}+x_3w_{31}+b_1\:)\)
 \(h_2=f\:(\:x_1w_{12}+x_2w_{22}+x_3w_{32}+b_2\:)\)
 \(h_3=f\:(\:x_1w_{13}+x_2w_{23}+x_3w_{33}+b_3\:)\)
 \(h_4=f\:(\:x_1w_{14}+x_2w_{24}+x_3w_{34}+b_4\:)\)

の式で計算されます。ベクトルと行列で表示すると、

 \(\bs{h}=f\:(\bs{x}\cdot\bs{W}+\bs{b})\)

になります。第2層も同様です。

このニューラル・ネットワークは、多重パーセプトロン(Multi Layer Perceptron : MLP)と呼ばれるタイプのもので、ニューラル・ネットワークの歴史の中では、古くから研究されている由緒のあるものです。

また上図の第1層、第2層は、すべてのニューロンが前層のすべてのニューロンとシナプスを持ってます。このような層を「全結合層」(Fully connected layer. FC-layer. FC層)と言います。全結合の多重パーセプトロンは Transformer や GPT で使われていて、重要な意味を持っています。

図2:ReLU 関数.jpg
図2:ReLU 関数
活性化関数 \(f\) は、隠れ層では、\(\mr{ReLU}\) 関数(Rectified Linear Unit:正規化線形ユニット)を使うのが普通です。\(\mr{ReLU}\) 関数は、

\(\mr{ReLU}(x)=x\:\:(x > 0)\)
\(\mr{ReLU}(x)=0\:\:(x\leq0)\)

で定義される非線形関数です(図2)。以降での表記を簡潔にするため、単位ステップ関数 \(H(x)\) を用いて \(\mr{ReLU}\) 関数を表しておきます。単位ステップ関数は、

図3:単位ステップ関数.jpg
図3:単位ステップ関数
 \(H(x)=1\:\:(x > 0)\)
 \(H(x)=0\:\:(x\leq0)\)

で定義される関数で(図3)、ヘヴィサイド関数とも呼ばれます。\(H(x)\) の微分は、
 \(H\,'(x)=0\:\:(x\neq0)\)
です。\(x=0\) において \(H(x)\) は不連続で、微分は定義できませんが、無理矢理、
 \(H\,'(0)=0\)
と定義してしまうと、\(x\) の全域において、
 \(H\,'(x)=0\)
となります。この \(H(x)\) を用いて \(\mr{ReLU}\) 関数を定義すると、

\(\mr{ReLU}(x)=H(x)x\)

となり、微分は、
 \(\dfrac{d}{dx}\mr{ReLU}(x)=H(x)\)
と表現できます。

出力層の活性化関数 \(f\,'\) は、ニューラル・ネットワークをどんな用途で使うかによって違ってきます。

ニューラル・ネットワークによる推論
ニューラル・ネットワークが扱う問題は、入力ベクトル \(\bs{x}\) をもとに出力ベクトル \(\bs{y}\) を "推論"(ないしは "推定"、"予測")する問題です。これには主に「回帰問題」と「分類問題」があります。

回帰問題で推論する \(\bs{y}\) は実数値(=連続値)です。たとえば、
 ・身長
 ・体重
 ・年齢
 ・男女の区別
 ・生体インピーダンス
から(\(=\bs{x}\))、
 ・体脂肪率
 ・筋肉量
 ・骨密度
を推定する(\(=\bs{y}\))といった例です(但し、市販の体組成計が AI を使っているわけではありません)。

一方、分類問題の例は、たとえば手書き数字を認識する問題です。この場合、多数の手書き数字の画像(をベクトルに変換した \(\bs{x}\))を「\(0\) のグループ」「\(1\) のグループ」・・・・・ というように分類していきます。このグループのことを AI では "クラス" と呼んでいます。つまり「クラス分類問題」です。

手書き数字の場合、明確に \(0\) ~ \(9\) のどれかに認識できればよいのですが、そうでない場合もある。たとえば、\(1\) なのか \(7\) なのか紛らわしい、\(0\) なのか \(6\) なのか曖昧、といったことが発生します。分類するのは、\(0\) ~ \(9\) のうちのどれかという「離散値の予測」であり、連続値とは違って、どうしても紛らわしい例が発生します。

従って、クラス分類問題(=離散値を予測する問題)では、出力ベクトル \(\bs{y}\) は確率です。手書き数字の認識では、\(\bs{y}\) は\(10\)次元の確率ベクトルで、たとえば、
 \(y_1\):数字が \(1\) である確率
 \(y_2\):数字が \(2\) である確率
   \(\vdots\)
 \(y_9\):数字が \(9\) である確率
 \(y_{10}\):数字が \(0\) である確率
となるように、ニューラル・ネットワークを設計します。確率なので、
 \(0\leq y_i\leq1,\:\:\:\displaystyle\sum_{i=1}^{10}y_i=1\)
です。入力画像が \(1\) なのか \(7\) なのか紛らわしい場合、たとえば推定の例は、
 \(\bs{y}=\left(\begin{array}{r}0.8&0&0&0&0&0&0.2&0&0&0\\\end{array}\right)\)
です。これは、
 \(1\) である確率が \(0.8\)
 \(7\) である確率が \(0.2\)
を表します。クラス分類問題は「離散値を推論する問題」、すなわち「確率を推定する問題」であると言えます。


回帰問題の出力層の活性化関数は、恒等関数(=何もしない)とするのが普通です。一方、クラス分類問題の出力層の活性化関数は、出力 \(\bs{y}\) が確率として解釈できるような関数を選びます。それが \(\mr{Softmax}\) 関数です。

\(\mr{Softmax}\) 関数
\(\mr{Softmax}\) 関数によって、出力 \(\bs{y}\) が確率と解釈できるようになります。ベクトル \(\bs{x}\) を \(\mr{Softmax}\) 関数によって確率ベクトル \(\bs{y}\) に変換する式は、次のように定義できます。なお、ここでの \(\bs{x}\) は入力層の \(\bs{x}\) ではなく、一般的なベクトルを表します。

 \(\bs{y}=\mr{Softmax}(\bs{x})\)
  (\(\bs{x}\:\:\bs{y}\) は \(n\)次元ベクトル)

 \(y_i=\dfrac{\mr{exp}(x_i)}{\displaystyle\sum_{i=1}^{n}\mr{exp}(x_i)}\)

  \(0 < y_i < 1,\:\:\:\displaystyle\sum_{i=1}^{n}y_i=1\)

ここで使われている指数関数は、すぐに巨大な数になります。たとえば \(\mr{exp}(100)\) は\(10\)進で\(40\)桁以上の数で、\(32\)ビット浮動小数点の最大値(\(10\)進で\(40\)桁弱)を越えてしまいます。従って、\(\mr{Softmax}\) 関数の計算には工夫が必要で、それには \(\mr{Softmax}\) 関数の性質を利用します。

\(C\) を任意の実数値とし、\(n\)次元ベクトル \(\bs{z}\) を
 \(z_i=x_i+C\)
と定義します。そして、
 \(\bs{y}\,'=\mr{Softmax}(\bs{z})\)
と置くと、

\(\begin{eqnarray}
&&\:\:y_i\,'&=\dfrac{\mr{exp}(z_i)}{\displaystyle\sum_{i=1}^{n}\mr{exp}(z_i)}=\dfrac{\mr{exp}(x_i+C)}{\displaystyle\sum_{i=1}^{n}\mr{exp}(x_i+C)}\\
&&&=\dfrac{\mr{exp}(x_i)\cdot\mr{exp}(C)}{\displaystyle\sum_{i=1}^{n}\mr{exp}(x_i)\cdot\mr{exp}(C)}\\
&&&=\dfrac{\mr{exp}(x_i)\cdot\mr{exp}(C)}{\mr{exp}(C)\cdot\displaystyle\sum_{i=1}^{n}\mr{exp}(x_i)}\\
&&&=\dfrac{\mr{exp}(x_i)}{\displaystyle\sum_{i=1}^{n}\mr{exp}(x_i)}=y_i\\
\end{eqnarray}\)

となります。つまり \(x_i\:\:(1\leq i\leq n)\) の全部に定数 \(C\) を足しても、\(\mr{Softmax}\) 関数は変わりません。そこで、
 \(C=-\mr{max}(x_1,\:x_2,\:\cd\:,x_n)\)
と置いて、
 \(x_i\:\longleftarrow\:x_i+C\:\:(1\leq i\leq n)\)
と修正すると、\(x_i\) の最大値は \(0\) になります。従って、
 \(0 < \mr{exp}(x_i)\leq1\)
の範囲で \(\mr{Softmax}\) 関数が計算可能になります。


大規模言語モデルと確率


クラス分類問題の出力ベクトル \(\bs{y}\) は確率でしたが、実は Transformer や GPT が実現している「大規模言語モデル」も "確率を推定するニューラル・ネットワーク" です。たとえば、

 [今日] [は] [雨] [なの] [で]

というテキストに続く単語を推定します。仮に、日本語の日常用語の語彙数を5万語とすると、5万の単語すべてについて上のテキストに続く単語となる確率を、実例をもとに推定します。当然、「雨の日の行動」とか「雨の日の情景」、「雨の日の心理状態」、「雨の日に起こりうること」を描写・説明する単語の確率が高くなるわけです。たとえば名詞だけをとると、[家] [ビデオ] [映画] [傘] [犬] [洗濯] [祭] [運動会] などの確率が高く、[ニンジン] [牛] [鉛筆] などの確率は(雨の日とは関係があるとは思えないので)低いといった具合です(あくまで想定です)。

「大規模言語モデル」の重要な応用例(=タスク)である機械翻訳も同じです。日本語 → 英語の翻訳を例にとると、

 [今日] [は] [晴れ] [です] [。] [BOS] 

に続く英単語を推定します([BOS] は文の開始を示す特殊単語)。確率の高い単語から [it] を選んだとすると、次には、

 [今日] [は] [晴れ] [です] [。] [BOS] [it]

に続く単語を推定します([is] になるはず)。こうやって進むのが機械翻訳です。

Transformer や GPT をごくごくシンプルに言えば、入力ベクトル \(\bs{x}\) はテキスト列、出力ベクトル \(\bs{y}\) は次に続く単語を示す確率ベクトル(次元は語彙数)です。


この記事は、Transformer、GPT、ChatGPT などの大規模言語モデルを説明するのが目的です。従って以降では、出力ベクトル \(\bs{y}\) は確率ベクトルであることを前提とします。


確率を推定するニューラル・ネットワーク


図1において、第1層(隠れ層)の活性化関数を \(\mr{ReLU}\)、第2層(出力層)の活性化関数を \(\mr{Softmax}\) とすると、図4になります。

図4:ニューラル・ネットワーク.jpg
図4:ニューラル・ネットワーク
(出力層は確率ベクトル)

図4の計算は、以下に示すような4段階の計算処理で表すことができます。

 第1層
  \(\bs{h}\,'=\bs{x}\cdot\bs{W}+\bs{b}\)
  \(\bs{h}=\mr{ReLU}(\bs{h}\,')\)

 第2層
  \(\bs{y}\,'=\bs{h}\cdot\bs{W}\,'+\bs{b}\,'\)
  \(\bs{y}=\mr{Softmax}(\bs{y}\,')\)

この4つの計算処理を「計算レイヤー」、略して「レイヤー」と呼び、図5のグラフで表現することにします。

図5:クラス分類問題のレイヤー構成(推論時).jpg
図5:クラス分類問題のレイヤー構成(推論時)

レイヤー(layer)は日本語にすると「層」で、第1層や隠れ層の「層」と紛らわしいのですが、「レイヤー」と書いたときは "ある一定の計算処理" を示します。後ほど説明する Transformer や GPT は、図4のような単純な「層」では表現できない複雑な計算処理があります。従って "ある一定の計算処理 = レイヤー" とした方が、すべての場合を共通に表現できて都合が良いのです。

レイヤーの四角に向かう矢印は計算処理への入力を示し、四角から出る矢印は計算処理からの出力(計算結果)を示します。「レイヤーは一つの関数」と考えてもOKです。

図5の「Linear レイヤー」は、「Affine(アフィン)レイヤー」と呼ばれることが多いのですが、Transformer の論文で Linear があるので、そちらを採用します。

図5のネットワークがどうやって「学習可能なのか」を次に説明します。この「学習できる」ということが、ニューラル・ネットワークが成り立つ根幹です。


ニューラル・ネットワークの学習


重みとバイアスの初期値
まず、重み(\(\bs{W},\:\bs{W}\,'\))の初期値を乱数で与えます。この乱数は、前の層のニューロンの数を \(n\) とすると

 平均 \(=0\)
 標準偏差 \(=\sqrt{\dfrac{1}{n}}\)

の正規分布の乱数とするのが普通です。\(n=10,000\) とすると、標準偏差は \(0.01\) なので、
 \(-\:0.01\) ~ \(0.01\)
の間にデータの多く(約 \(2/3\))が集まる乱数です。但し、\(\mr{ReLU}\) を活性化関数とする層(図4では第1層)の重みは、

 平均 \(=0\)
 標準偏差 \(=\sqrt{\dfrac{2}{n}}\)

の乱数とします。なお、バイアスの初期値は \(0\) とします。こういった初期値の与え方は、学習をスムーズに進めるためです。

損失と損失関数
初期値が決まったところで、訓練データの一つを、
 \(\bs{x}\):入力データ
 \(\bs{t}\):確率の正解データ
とします。この正解データのことを「教師ラベル」と呼びます。そして、ニューラル・ネットワークによる予測の確率 \(\bs{y}\) と、正解の確率である \(\bs{t}\) との差異を計算します。この差異を「損失(\(Loss\))」といい、\(L\) で表します。\(L\) は正のスカラー値です。

\(\bs{y}\) と \(\bs{t}\) から \(L\) を求めるのが「損失関数(Loss Function)」です。確率を予測する場合の損失関数は「交差エントロピー誤差(Cross Entropy Error : CEE)」とするのが普通で、次の式で表されます。

\(L=-\displaystyle\sum_{i=1}^{n}t_i\cdot\mr{log}\:y_i\)

たとえば、先ほどの手書き数字の認識の「\(1\) または \(7\) という予測」を例にとって、その正解が \(1\) だとすると、

 予測 \(\bs{y}=\left(\begin{array}{r}0.8&0&0&0&0&0&0.2&0&0&0\\\end{array}\right)\)
 正解 \(\bs{t}=\left(\begin{array}{r}1&0&0&0&0&0&0&0&0\\\end{array}\right)\) = 教師ラベル

です。なお、\(\mr{Softmax}\)関数の出力は \(0\) にはならないので、上の \(\bs{y}\) で \(0\) と書いた要素は、実際には微小値です。すると、

 \(L=-\mr{log}\:0.8\fallingdotseq0.223\)

となります。損失関数を含めると、レイヤー構成は図6のようになります。

図6:クラス分類問題のレイヤー構成(学習時).jpg
図6:クラス分類問題のレイヤー構成(学習時)

この図の重みとバイアスを少しだけ調整して、\(L\) を少しだけ \(0\) に近づけます。この調整を多数の学習データ(= \(\bs{x}\:\:\bs{t}\) のペア)で繰り返して、\(L\) を次第に \(0\) に近づけていくのが学習です。

勾配降下法
重みの調整には「勾配降下法(Gradient descent method)」を使います。図6の場合、損失 \(L\) は、ある関数 \(f\) を用いて、

 \(L=f(\bs{x},\:\bs{W},\:\bs{b},\:\bs{W}\,',\:\bs{b}\,',\:\bs{t})\)

と表現できます。ここで、\(\bs{W}\) の一つの要素、\(w_{11}\) を例にとると、

\(w_{11}\) を微小に増減させた場合、\(L\) はどのように増減するか、そのの \(w_{11}\) に対する変化の割合

を計算します。これはいわゆる微分ですが、多変数関数の微分なので、数学的には偏微分であり、
 \(\dfrac{\partial L}{\partial w_{11}}\)
です。つまり、\(w_{11}\) 以外の変数をすべて固定しての(すべて定数とした上での)、\(w_{11}\) による微分です。

具体的な入力 \(\bs{x}\) のときの \(\dfrac{\partial L}{\partial w_{11}}\) が求まったとします。もし仮に、\(\dfrac{\partial L}{\partial w_{11}}\) が正の値だとしたら、\(w_{11}\) を少しだけ減らせば、\(L\) は少しだけ \(0\) に近づきます。もし \(\dfrac{\partial L}{\partial w_{11}}\) が負だとしたら、\(w_{11}\) を少しだけ増やせば、\(L\) は少しだけ \(0\) に近づきます。つまり、

 更新式:\(w_{11}\:\longleftarrow\:w_{11}-\eta\cdot\dfrac{\partial L}{\partial w_{11}}\)

として重みを更新すればよいわけです。\(\eta\) は「少しだけ」を表す値で「学習率」といい、\(0.01\) とか \(0.001\) とかの値をあらかじめ決めておきます。この決め方は、学習の効率に大いに影響します。こういった更新を、すべての重みとバイアスに対して行います。

"学習で調整される値" を総称して「パラメータ」と言います。図6のパラメータは重みとバイアスですが、実用的なニューラル・ネットワークでは、それ以外にも更新されるパラメータがあります。

ちなみに、OpenAI 社の GPT\(-3\) のパラメータの総数は \(1750\)億個で、学習率は \(0.6\times10^{-4}\) です。

\(L\) の偏微分値をベクトルや行列単位でまとめたものを、次のように表記します。2次元のベクトル \(\bs{b}\) と、2行2列の行列 \(\bs{W}\) で例示すると、

 \(\dfrac{\partial L}{\partial\bs{b}}=\left(\begin{array}{r}\dfrac{\partial L}{\partial b_1}&\dfrac{\partial L}{\partial b_2}\\\end{array}\right)\)

 \(\dfrac{\partial L}{\partial\bs{W}}=\left(\begin{array}{r}\dfrac{\partial L}{\partial w_{11}}&\dfrac{\partial L}{\partial w_{12}}\\\dfrac{\partial L}{\partial w_{21}}&\dfrac{\partial L}{\partial w_{22}}\\\end{array}\right)\)

です。これを「勾配(gradient)」と言います。勾配を求めることでパラメータを少しづつ更新し、損失を少しづつ小さくしていく(=降下させる)のが勾配降下法です。

ミニバッチ勾配降下法
学習は次のように進みます。まず、すべての訓練データ(たとえば
数万件)から、数\(10\)~数\(100\)件(たとえば\(256\)件)の訓練データをランダムに選びます。この一群のデータを「ミニバッチ」と呼びます。ミニバッチの各訓練データによる確率の推定から損失を計算し、そこからすべてのパラメータの勾配と求め、その勾配ごとに "ミニバッチの平均値" をとります。その平均値に基づき、更新式に従って各パラメータを更新します。

ミニバッチによる更新が終わると、別のミニバッチをランダムに選び、更新を繰り返します。こうすると、損失は次第に減少していきますが、そのうち "頭打ち" になります。そこで更新を止めます。

このようなパラメータ更新のやり方を「ミニバッチ勾配降下法」と言います。一つの訓練データだけで更新しないのは、たまたまその訓練データが「外れデータ」(全体の傾向とは異質なデータ)だと、学習の進行に支障が出てくるからです。

訓練データをランダムに選択する方法を「確率的勾配降下法(Stochastic gradient method - SGD)」と言いますが、ミニバッチ勾配降下法は、その確率的勾配降下法の一種です。

誤差逆伝播法
ここで問題になるのは、すべてのパラメータの勾配をどうやって求めるかです。それに使われるのが「誤差逆伝播法(Back propagation)」です。その原理を、Linear レイヤーから説明します。

 (1) Linear 

図7:linear レイヤー.jpg
図7:linear レイヤー
入力 \(\bs{x}\) \([1\times N]\)
   \(\bs{W}\) \([N\times M]\)
   \(\bs{b}\) \([1\times M]\)
出力 \(\bs{y}\) \([1\times M]\)

図7で示すように、Linear レイヤーがあり、そのあとに何らかの計算処理が続いて、最終的に損失 \(L\) が求まったとします。\(\bs{x}\:\:\bs{y}\) はニューラル・ネットワークへの入力と出力ではなく、Linear レイヤーへの入力と出力の意味です。ここで、

\(\bs{y}\) の勾配 \(\dfrac{\partial L}{\partial\bs{y}}\) が求まれば、合成関数の微分を使って、\(\bs{x},\:\:\bs{W},\:\:\bs{b}\) の勾配が求まる

と言えます。これが誤差逆伝播法の原理です。このことを、2次元ベクトル(\(\bs{x},\:\:\bs{b},\:\:\bs{y}\))、2行2列の配列(\(\bs{W}\))で例示します(\(N=2,\:M=2\) の場合)。

【Linear の計算式】

 \(\left(\begin{array}{r}y_1&y_2\\\end{array}\right)=\left(\begin{array}{r}x_1&x_2\\\end{array}\right)\cdot\left(\begin{array}{r}w_{11}&w_{12}\\w_{21}&w_{22}\\\end{array}\right)+\left(\begin{array}{r}b_1&b_2\\\end{array}\right)\)

 \(y_1=x_1w_{11}+x_2w_{21}+b_1\)
 \(y_2=x_1w_{12}+x_2w_{22}+b_2\)

\(x_1\) が変化すると \(y_1,\:y_2\) が変化し、それが損失 \(L\) に影響することに注意して、\(\bs{x},\:\:\bs{W},\:\:\bs{b}\) の勾配を計算します。

\(\bs{\bs{x}}\) の勾配】

 \(\dfrac{\partial L}{\partial x_1}\)\(=\dfrac{\partial y_1}{\partial x_1}\cdot\dfrac{\partial L}{\partial y_1}+\dfrac{\partial y_2}{\partial x_1}\cdot\dfrac{\partial L}{\partial y_2}\)
\(=\dfrac{\partial L}{\partial y_1}w_{11}+\dfrac{\partial L}{\partial y_2}w_{12}\)
\(=\left(\begin{array}{r}\dfrac{\partial L}{\partial y_1}&\dfrac{\partial L}{\partial y_2}\\\end{array}\right)\left(\begin{array}{r}w_{11}\\w_{12}\\\end{array}\right)\)

同様にして、

 \(\dfrac{\partial L}{\partial x_2}=\left(\begin{array}{r}\dfrac{\partial L}{\partial y_1}&\dfrac{\partial L}{\partial y_2}\\\end{array}\right)\left(\begin{array}{r}w_{21}\\w_{22}\\\end{array}\right)\)

です。これをまとめると、

 \(\left(\begin{array}{r}\dfrac{\partial L}{\partial x_1}&\dfrac{\partial L}{\partial x_2}\\\end{array}\right)=\:\:\:\left(\begin{array}{r}\dfrac{\partial L}{\partial y_1}&\dfrac{\partial L}{\partial y_2}\\\end{array}\right)\left(\begin{array}{r}w_{11}&w_{21}\\w_{12}&w_{22}\\\end{array}\right)\)

 \(\dfrac{\partial L}{\partial\bs{x}}=\dfrac{\partial L}{\partial\bs{y}}\cdot\bs{W}^T\)

となり、\(\bs{x}\) の勾配が求まります。

\(\bs{\bs{W}}\) の勾配】

 \(\dfrac{\partial L}{\partial w_{11}}=\dfrac{\partial y_1}{\partial w_{11}}\dfrac{\partial y_1}{\partial w_{11}}=x_1\dfrac{\partial y_1}{\partial w_{11}}\)
 \(\dfrac{\partial L}{\partial w_{12}}=\dfrac{\partial y_2}{\partial w_{12}}\dfrac{\partial y_2}{\partial w_{12}}=x_1\dfrac{\partial y_2}{\partial w_{12}}\)
 \(\dfrac{\partial L}{\partial w_{21}}=\dfrac{\partial y_1}{\partial w_{21}}\dfrac{\partial y_1}{\partial w_{21}}=x_2\dfrac{\partial y_1}{\partial w_{21}}\)
 \(\dfrac{\partial L}{\partial w_{22}}=\dfrac{\partial y_2}{\partial w_{22}}\dfrac{\partial y_2}{\partial w_{22}}=x_2\dfrac{\partial y_2}{\partial w_{22}}\)

これらをまとめると、

 \(\dfrac{\partial L}{\partial\bs{W}}\)\(=\left(\begin{array}{r}\dfrac{\partial L}{\partial w_{11}}&\dfrac{\partial L}{\partial w_{12}}\\\dfrac{\partial L}{\partial w_{21}}&\dfrac{\partial L}{\partial w_{22}}\\\end{array}\right)\)
\(=\left(\begin{array}{r}x_1\dfrac{\partial L}{\partial y_1}&x_1\dfrac{\partial L}{\partial y_2}\\x_2\dfrac{\partial L}{\partial y_1}&x_2\dfrac{\partial L}{\partial y_2}\\\end{array}\right)\)
\(=\left(\begin{array}{r}x_1\\x_2\\\end{array}\right)\left(\begin{array}{r}\dfrac{\partial L}{\partial y_1}&\dfrac{\partial L}{\partial y_2}\\\end{array}\right)\)
\(=\bs{x}^T\dfrac{\partial L}{\partial\bs{y}}\)

となります。

\(\bs{\bs{b}}\) の勾配】

 \(\dfrac{\partial L}{\partial b_1}\)\(=\dfrac{\partial L}{\partial y_1}\)
 \(\dfrac{\partial L}{\partial b_2}\)\(=\dfrac{\partial L}{\partial y_2}\)

 \(\dfrac{\partial L}{\partial\bs{b}}\)\(=\dfrac{\partial L}{\partial\bs{y}}\)

以上の計算で求まった勾配をまとめて図示すると、図8になります。黒字(入力・出力とパラメータ)の下の赤字がパラメータの勾配で、右から左への矢印は、「レイヤーの出力の勾配が求まれば、レイヤーの入力の勾配が求まる」こと示します(= 逆伝播)。上での計算は2次元ベクトルと2行2列の配列で例示しましたが、図8のようなベクトル・配列で表示すると、\([1\times N]\) のベクトルと \([N\times M]\) の行列で成り立つことが確認できます。

図8:linear の誤差逆伝播.jpg
図8:linear の誤差逆伝播
出力側の勾配が求まれば、そこから入力側の勾配はすべて求まる。これが誤差逆伝播の原理で、合成関数の微分のシンプルな応用である。

 (2) ReLU 

\(\mr{ReLU}\) 関数は、

 \(\mr{ReLU}(x_i)=x_i\:\:(x_i > 0)\)
 \(\mr{ReLU}(x_i)=0\:\:\:(x_i\leq0)\)

であり、ベクトルの表現では、単位ステップ関数、
 \(H(x)=1\:\:\:(x > 0)\)
 \(H(x)=0\:\:\:(x\leq0)\)
と要素積 \(\odot\) を使って、

 \(\mr{ReLU}(\bs{x})=H(\bs{x})\odot\bs{x}\)

と定義できます。従って、勾配は、

 \(\dfrac{\partial L}{\partial x_i}=\dfrac{\partial L}{\partial y_i}\) \((x_i > 0)\)
 \(\dfrac{\partial L}{\partial x_i}=0\) \((x_i\leq0)\)

 \(\dfrac{\partial L}{\partial\bs{x}}=H(\bs{x})\odot\dfrac{\partial L}{\partial\bs{y}}\)

です。
図9:ReLU の誤差逆伝播.jpg
図9:ReLU の誤差逆伝播

 (3) Softmax 

\(\mr{Softmax}\) 関数の定義は、

 \(\bs{y}=\mr{Softmax}(\bs{x})\)
  (\(\bs{x}\:\:\bs{y}\) は \(N\)次元ベクトル)

 \(y_i=\dfrac{\mr{exp}(x_i)}{\displaystyle\sum_{i=1}^{N}\mr{exp}(x_i)}\)

  \(0 < y_i < 1,\:\:\:\displaystyle\sum_{i=1}^{N}y_i=1\)

です。勾配の計算を \(N=3\) の場合で例示します。

 \(S\)\(=\mr{exp}(x_1)+\mr{exp}(x_2)+\mr{exp}(x_3)\)
\(y_1\)\(=\dfrac{\mr{exp}(x_1)}{S}\)
\(y_2\)\(=\dfrac{\mr{exp}(x_2)}{S}\)
\(y_3\)\(=\dfrac{\mr{exp}(x_3)}{S}\)

 \(\dfrac{\partial L}{\partial x_1}=\dfrac{\partial y_1}{\partial x_1}\dfrac{\partial L}{\partial y_1}+\dfrac{\partial y_2}{\partial x_1}\dfrac{\partial L}{\partial y_2}+\dfrac{\partial y_3}{\partial x_1}\dfrac{\partial L}{\partial y_3}\)
 \(\dfrac{\partial y_1}{\partial x_1}\)\(=\dfrac{\mr{exp}(x_1)}{S}-\dfrac{\mr{exp}(x_1)}{S^2}\mr{exp}(x_1)\)
\(=y_1-y_1^2\)
\(=y_1(1-y_1)\)

 \(\dfrac{\partial y_2}{\partial x_1}\)\(=-\dfrac{\mr{exp}(x_2)}{S^2}\mr{exp}(x_1)\)
\(=-y_1y_2\)

 \(\dfrac{\partial y_3}{\partial x_1}\)\(=-\dfrac{\mr{exp}(x_3)}{S^2}\mr{exp}(x_1)\)
\(=-y_1y_3\)

 \(\dfrac{\partial L}{\partial x_1}=y_1(1-y_1)\dfrac{\partial L}{\partial y_1}-y_1y_2\dfrac{\partial L}{\partial y_2}-y_1y_3\dfrac{\partial L}{\partial y_3}\)
 \(\dfrac{\partial L}{\partial x_2}=y_2(1-y_2)\dfrac{\partial L}{\partial y_2}-y_2y_3\dfrac{\partial L}{\partial y_3}-y_2y_1\dfrac{\partial L}{\partial y_1}\)
 \(\dfrac{\partial L}{\partial x_3}=y_3(1-y_3)\dfrac{\partial L}{\partial y_3}-y_3y_1\dfrac{\partial L}{\partial y_1}-y_3y_2\dfrac{\partial L}{\partial y_2}\)

 (4) Cross Entropy Error - CEE 

交差エントロピー誤差の定義は、
 入力 \(\bs{y}\) \((1\times N)\)
 入力 \(\bs{t}\) \((1\times N)\)  教師ラベル(正解データ)
 出力 \(L\:(Loss)\)
とすると、

 \(L=-\displaystyle\sum_{i=1}^{N}(t_i\mr{log}y_i)\)

で定義されます。従って、

 \(\dfrac{\partial L}{\partial y_i}=-\dfrac{t_i}{y_i}\)

であり、\(N=3\) の場合を書くと、

 \(\dfrac{\partial L}{\partial y_1}=-\dfrac{t_1}{y_1}\)
 \(\dfrac{\partial L}{\partial y_2}=-\dfrac{t_2}{y_2}\)
 \(\dfrac{\partial L}{\partial y_3}=-\dfrac{t_2}{y_3}\)

です。

 (5) Softmax + CEE 

\(\mr{Softmax}\) レイヤーの直後に交差エントロピー誤差のレイヤーを配置した場合を考えます。(3) と (4) の計算を合体させると、次のように計算できます。

 \(\dfrac{\partial L}{\partial x_1}\)\(=y_1(1-y_1)\dfrac{\partial L}{\partial y_1}-y_1y_2\dfrac{\partial L}{\partial y_2}-y_1y_3\dfrac{\partial L}{\partial y_3}\)
\(=-y_1(1-y_1)\dfrac{t_1}{y_1}+y_1y_2\dfrac{t_2}{y_2}+y_1y_3\dfrac{t_3}{y_3}\)
\(=-t_1+t_1y_1+y_1t_2+y_1t_3\)
\(=-t_1+t_1y_1+y_1(t_2+t_3)\)
\(=-t_1+t_1y_1+y_1(1-t_1)\)
\(=y_1-t_1\)

計算の過程で、\(\bs{t}\) が確率ベクトルであることから、\(t_1+t_2+t_3=1\) を使いました。この計算は \(x_2,\:\:x_3\) についても全く同様にできます。それを含めてまとめると、

 \(\dfrac{\partial L}{\partial x_1}=y_1-t_1\)
 \(\dfrac{\partial L}{\partial x_2}=y_2-t_2\)
 \(\dfrac{\partial L}{\partial x_3}=y_3-t_3\)

となります。この結果、勾配は、

 \(\dfrac{\partial L}{\partial\bs{x}}=\bs{y}-\bs{t}\)

という、大変シンプルな形になりました。これは任意の次元のベクトルで成り立ちます。実は、このようなシンプルな形になるように、\(\mr{Softmax}\) と 交差エントロピー誤差が設計されています。図示すると次の通りです。

図10:Softmax + CEE の逆伝播.jpg
図10:Softmax + CEE の逆伝播
\(\mr{Softmax}\) 関数の後ろに交差エントロピー誤差を重ねると、\(\bs{x}\) の勾配は \(\bs{y}\) と \(\bs{t}\)(教師ラベル)から直接に求まる。

ニューラル・ネットワークの誤差逆伝播
以上で「確率を推定するニューラル・ネットワーク」を構成する各レイヤーの誤差逆伝播が計算できました。これらをまとめると、次の図11になります。

図11:クラス分類問題の誤差逆伝播.jpg
図11:クラス分類問題の誤差逆伝播

ちなみに、第1層の重み \(\bs{W}\) の勾配は図11から陽に計算すると、次のようになります。

 \(\dfrac{\partial L}{\partial\bs{W}}=\bs{x}^T(H(\bs{x}\bs{W}+\bs{b})\odot((\bs{y}-\bs{t})\bs{W}\,'))\)

このネットワークは隠れ層が1つだけというシンプルなものですが、今までの計算で分かるように、層数が何百層に増えたとしても、逆伝播を多段に重ねることで、誤差逆伝播法が成立します。

また、図11 で使っているレイヤーは、Linear、\(\mr{ReLU}\)、\(\mr{Softmax}\)、Cross Entropy Error ですが、これらを関数と見なしたとき、誤差逆伝播で使った数学的な前提は「関数がパラメータで微分可能」ということだけです。つまり、レイヤーの関数が微分可能である限り、誤差逆伝播法は有効です。

実は、実用的なニューラル・ネットワークで誤差逆伝播法をうまく機能させるためには、数々の工夫が必要です。また、一般に訓練データの数は膨大なので、学習速度を上げる工夫も必要です(以降でその一部を説明します)。上で述べた「初期値の選択」や「学習率」はその工夫の一つです。そういったことはありますが、ネットワークがいかに巨大になろうとも(大規模言語モデルはその巨大な典型です)、誤差逆伝播法は可能なことが分かっています。

以上が、「ニューラル・ネットワークが学習可能である」ということの原理です。

\(\mr{GELU}\)
最近の大規模言語モデル(GPT など)では、活性化関数 \(\mr{ReLU}\) の代わりに \(\mr{GELU}\) \((\)Gaussian Error Linear Unit:ガウス誤差線形ユニット\()\) が使われます。その方が、学習が効率的に進むことが分かったからです。

図12:標準正規分布.jpg
図12:標準正規分布
\(\mr{ReLU}\) は、\(H(x)\) を単位ステップ関数として、
 \(\mr{ReLU}(x)=H(x)x\)
でしたが、\(\mr{GELU}\) は、
 \(\mr{GELU}(x)=\Phi(x)x\)
で定義されます。\(\Phi(x)\) は標準正規分布(平均 \(0\)、標準偏差 \(1\))の累積分布関数です。標準正規分布の確率密度を \(f(x)\) とすると、
 \(f(x)=\dfrac{1}{\sqrt{2\pi}}\mr{exp}\left(-\dfrac{x^2}{2}\right)\)
です(図12)。つまり \(x\) ~ \(x+dx\) である事象が発生する確率が \(f(x)dx\) です。また \(-\infty\) ~ \(\infty\) の範囲で積分すると \(1\) で、原点を中心に左右対称です。

図13:累積分布関数.jpg
図13:累積分布関数
この確率分布を \(-\infty\) から \(x\) まで積分したのが累積分布関数で、
 \(\Phi(x)=\displaystyle\int_{-\infty}^{x}f(t)dt\)
です(図13)。これは正規分布に従うデータ値が \(x\) 以下になる確率です。これはガウスの誤差関数(Gaussian error function)\(\mr{Erf}\) を用いて表現できます。\(\Phi(0)=0.5\) となることを使って計算すると、
\(\begin{eqnarray}
&&\:\:\Phi(x)&=\displaystyle\int_{-\infty}^{x}f(t)dt\\
&&&=\dfrac{1}{\sqrt{2\pi}}\displaystyle\int_{-\infty}^{x}\mr{exp}\left(-\dfrac{t^2}{2}\right)dt\\
&&&=\dfrac{1}{2}+\dfrac{1}{\sqrt{2\pi}}\displaystyle\int_{0}^{x}\mr{exp}\left(-\dfrac{t^2}{2}\right)dt\\
\end{eqnarray}\)
\(t\:\rightarrow\:\sqrt{2}u\) の変数変換をすると、
\(\begin{eqnarray}
&&\:\:\phantom{\Phi(x)}&=\dfrac{1}{2}+\dfrac{1}{\sqrt{2\pi}}\displaystyle\int_{0}^{\tiny\dfrac{x}{\sqrt{2}}}\mr{exp}(-u^2)\sqrt{2}du\\
&&&=\dfrac{1}{2}+\dfrac{1}{\sqrt{\pi}}\displaystyle\int_{0}^{\tiny\dfrac{x}{\sqrt{2}}}\mr{exp}(-u^2)du\\
&&&=\dfrac{1}{2}\left(1+\mr{Erf}\left(\dfrac{x}{\sqrt{2}}\right)\right)\\
\end{eqnarray}\)
となります。ガウスの誤差関数、\(\mr{Erf}()\) の定義は

 \(\mr{Erf}(x)=\dfrac{2}{\sqrt{\pi}}\displaystyle\int_{0}^{x}\mr{exp}(-u^2)du\)

です。従って、

 \(\Phi(x)=\dfrac{1}{2}\left(1+\mr{Erf}\left(\dfrac{x}{\sqrt{2}}\right)\right)\)

図14:GELU 関数.jpg
図14:\(\bs{\mr{GELU}}\) 関数
と表現できます。\(\mr{GELU}\) 関数の形は 図14 です。

\(\mr{GELU}\) は \(\mr{ReLU}\) と良く似ていますが、すべての点で微分可能であり、\(\mr{ReLU}\) のように微係数がジャンプするところがありません。このことが、大規模言語モデルの効率的な学習に役だっていると考えられます。

残差結合
Linear レイヤーを例にとります。入力を \(\bs{x}\)、出力を \(\bs{y}\) とし、入力と出力のベクトルの次元は同一とします。重みを \(\bs{W}\) とし、バイアス \(\bs{b}\) は省略します。通常の Linear レイヤーは、
 \(\bs{y}=\bs{x}\bs{W}\)

ですが、

 \(\bs{y}=\bs{x}\bs{W}+\bs{x}\)

とするのが、「残差結合(residual connection)」をもつ Linear レイヤーです。なお「残差接続」とも言います。また「スキップ接続(skip connection)」も同じ意味です。

図15:残差結合.jpg
図15:残差結合

誤差逆伝播を計算すると、\(\bs{x}\) の勾配は次のようになります。2次元ベクトルの場合で例示します。

 \(\left(\begin{array}{r}y_1&y_2\\\end{array}\right)=\left(\begin{array}{r}x_1&x_2\\\end{array}\right)\cdot\left(\begin{array}{r}w_{11}&w_{12}\\w_{21}&w_{22}\\\end{array}\right)+\left(\begin{array}{r}x_1&x_2\\\end{array}\right)\)

 \(y_1=x_1w_{11}+x_2w_{21}+x_1\)
 \(y_2=x_1w_{12}+x_2w_{22}+x_2\)

 \(\dfrac{\partial L}{\partial x_1}\)\(=\dfrac{\partial y_1}{\partial x_1}\cdot\dfrac{\partial L}{\partial y_1}+\dfrac{\partial y_2}{\partial x_1}\cdot\dfrac{\partial L}{\partial y_2}\)
\(=\dfrac{\partial L}{\partial y_1}w_{11}+\dfrac{\partial L}{\partial y_2}w_{12}+\dfrac{\partial L}{\partial y_1}\)
\(=\left(\begin{array}{r}\dfrac{\partial L}{\partial y_1}&\dfrac{\partial L}{\partial y_2}\\\end{array}\right)\left(\begin{array}{r}w_{11}\\w_{12}\\\end{array}\right)+\dfrac{\partial L}{\partial y_1}\)

同様にして、

 \(\dfrac{\partial L}{\partial x_2}=\left(\begin{array}{r}\dfrac{\partial L}{\partial y_1}&\dfrac{\partial L}{\partial y_2}\\\end{array}\right)\left(\begin{array}{r}w_{21}\\w_{22}\\\end{array}\right)+\dfrac{\partial L}{\partial y_2}\)

従って、

 \(\left(\begin{array}{r}\dfrac{\partial L}{\partial x_1}&\dfrac{\partial L}{\partial x_2}\\\end{array}\right)=\) \(\left(\begin{array}{r}\dfrac{\partial L}{\partial y_1}&\dfrac{\partial L}{\partial y_2}\\\end{array}\right)\left(\begin{array}{r}w_{11}&w_{21}\\w_{12}&w_{22}\\\end{array}\right)\)
 \(+\:\left(\begin{array}{r}\dfrac{\partial L}{\partial y_1}&\dfrac{\partial L}{\partial y_2}\\\end{array}\right)\)

 \(\dfrac{\partial L}{\partial\bs{x}}=\dfrac{\partial L}{\partial\bs{y}}\cdot\bs{W}^T+\dfrac{\partial L}{\partial\bs{y}}\)

です。つまり、勾配 \(\dfrac{\partial L}{\partial\bs{y}}\) が、逆伝播でそのまま \(\dfrac{\partial L}{\partial\bs{x}}\) に伝わります(図\(16\))。

図16:残差結合の誤差逆伝播.jpg
図16:残差結合の誤差逆伝播

一般にニューラル・ネットワークの学習を続けると、重みがゼロに近づき、その結果 \(\dfrac{\partial L}{\partial\bs{x}}\) が \(0\) に近い小さな値となることがあります。\(\dfrac{\partial L}{\partial\bs{x}}\) は、その一つ前への逆伝播の入力となるので、多層のニューラル・ネットワークでこれが重なると、前の方の層の勾配が極小になり、重みが更新できないという事態になります。これが「勾配消失」で、ニューラル・ネットワークの学習が困難になります。

残差結合を用いると、この問題を解決できます。Transformer では残差結合が使われています。

正規化
Transformer で使われているもう一つのレイヤーが「レイヤー正規化(Layer Normalization)」です。これは、ベクトル \(\bs{x}\:[1\times N]\) の要素を、平均 \(0\)、標準偏差 \(1\) のベクトル \(\bs{y}\:[1\times N]\) の要素に置き換えるものです。

 \(\bs{y}=\mr{LayerNormalization}(\bs{x})\)

  \(x_i\) の平均 : \(\mu\)
  \(x_i\) の標準偏差 : \(\sg\)

  \(\mu=\dfrac{1}{N}\displaystyle\sum_{i=1}^{N}x_i\)
  \(\sg=\sqrt{\dfrac{1}{N}\displaystyle\sum_{i=1}^{N}(x_i-\mu)^2}\)

とおくと、

 \(y_i=\dfrac{1}{\sg}(x_i-\mu)\)

となります。実際にニューラル・ネットワークで使われるときには、さらにベクトルの要素ごとに線形変換をして、

 \(y_i\:\longleftarrow\:g_iy_i+b_i\)

とします。ベクトルで表現すると、

 \(\bs{y}=\dfrac{1}{\sg}\bs{g}\odot(\bs{x}-\mu)+\bs{b}\)

です。この \(\bs{g}\) と \(\bs{b}\) は学習可能なパラメータです。つまり、ニューラル・ネットワークの訓練のときに学習をして、最適値を決めます。もちろん、レイヤー正規化の式は微分可能なので、逆伝播計算が(少々複雑な式になりますが)可能です。

レイヤー正規化は、ニューラル・ネットワークを安定化させ、学習の効率化に役立ちます。その理由ですが、中間層の活性化関数で一般的な \(\mr{ReLU}\) 関数は、\(x=0\) の付近で非線型関数であり、それ以外では線型です。ニューラル・ネットワークは全体としては非線型関数で、そこにこそ意義があるのですが、その非線型性を生み出しているのは、\(x=0\) 付近の \(\mr{ReLU}\) 関数です。

従って、レイヤーの値を「ゼロ付近に集める」と、ニューラル・ネットワークの非線型性を強めることができ、これが学習の効率化につながります。その「ゼロ付近に集める」のがレイヤー正規化です。


以上の、

 ・\(\mr{ReLU}\) 関数(または \(\mr{GELU}\) 関数)
 ・残差結合
 ・正規化

は、大規模ニューラル・ネットワークを安定的に学習可能にするための必須技術であり、Transformer や GPT でも使われています。

 
2.自然言語のモデル化 
 

単語への分解
自然言語で書かれたテキストをコンピュータで扱うとき、まずテキストを単語の系列に分解しなければなりません。系列とは「並び順に意味のある、同質の要素の集合」です。単語への分解は、単語の区切りを明示する英語(や、その他の欧米語)では容易です。文末を表すピリオドや、その他の記号も1つの単語と数えます。

日本語は単語の区切りがないので、形態素解析ソフトで単語に分解します。句読点、「、」などの記号も、それぞれ1単語と数えます。日本語の形態素解析ソフトは各種ありますが、オープンソースの MeCab が有名です。

大規模言語モデルは、世界中から集めた Webのテキスト(以下、WebText と言います)や Wikipedia、電子ブックなどを訓練データとして学習しますが、そこに出てくる単語を集めて「語彙の集合」を作ります。この集合のサイズを \(V\) とすると(たとえば、5万とか10万とかの値)、単語に \(1\)~\(V\) のユニークな番号を振ることができます。この番号を「単語ID」と呼びます。

なお、大規模言語モデルでは内部処理用として「特殊単語」も用います。以降の説明で使うのは、
 [BOS] :文の開始
 [EOS] :文の終了。ないしは文の区切り。
です。こうすると、テキスト \(\bs{T}\) は、

 \(\bs{T}=\{x_1,\:x_2,\:x_3,\:\cd\:x_T\}\)

という単語IDの列で表現できることになります。もしこれが完結した文だとすると、\(x_1=\)[BOS]、\(x_T=\)[EOS] であり、複文だと途中にも [BOS] や [EOS] が出てくることになります。

単語IDは、その数字自体には意味がありません。また、語彙集合(要素数 \(V\))が増大すると単語IDの最大値も変化します。上の数字列は、あくまで「1時点での語彙集合をもとにして恣意的に付けられた数字の列」です。

分散表現
テキストをニュラール・ネットワークで扱うためには、すべての単語を、語彙集合のサイズにはよらない「固定長のベクトル」で表現するのが必須です。ここで使われるのが単語の「分散表現」で、固定長であるのみならず、"単語の意味もくみ取った" 表現です。ベクトルの次元は、たとば 512次元とか 1024次元です。

単語を分散表現にすることを "単語埋め込み"(word embedding)と言います。単語埋め込みの手法は各種ありますが、ここでは「word2vec」のアルゴリズムを例にとります。word2vec は、Google が2013年に提案したもので、実用的な分散表現の嚆矢となったものです。

word2vec に限りませんが、単語埋め込みのアルゴリズムの前提となっている仮定があります。それは、

単語の意味は、周囲の単語によって形成される

というもので、これを「分布仮説」と言います。たとえば、英文を例にとり、「周囲」を仮に「前1語、後1語」とします。

 [I] [ ] [beer]

という文で [ ] に入る1単語は何かです。1単語に限定すると、冠詞(a, the)は入れようがないので、入る単語は限定されます。たとえば、

[I] [drink]  [beer] (私はビール飲みます:習慣)
[I] [guzzle]  [beer] (ビールはガブ飲みします:習慣)
[I] [love]  [beer] (ビールが大好きです:嗜好)
[I] [hate]  [beer] (ビールは大嫌いです:嗜好)

などです。[ ] には「飲む」に関係した動詞か「嗜好」に関係した動詞が入る可能性が高い。少なくとも「私とビールの関わりについての動詞」です。つまり、入る単語は「前後の1語によって意味が限定される」わけです。もしこれが「前後5語」とか「前後10語」であると「似たような意味の単語」か、少なくとも「同じジャンルの単語」になるはずです。

word2vec という「単語埋め込みアルゴリズム」には2種類あり、「周囲の単語から中心の単語を推論する(CBOW)」と「中心の単語から周囲の単語を推論する(skip-gram)」の2つです。推論にはニューラル・ネットワークを使います。以下は CBOW(Continuous Bag of Words)のネットワーク・モデルで説明します。

word2vec(CBOW)
CBOW は「周囲の単語から中心の単語を推論する」ニューラル・ネットワークのモデルです。「周囲の単語」を "コンテクスト" と呼び、推論の対象とする単語を "ターゲット" と呼びます。

まず、コンテクストのサイズを決めます。ターゲットの前の \(c\) 語、ターゲットの後ろの \(c\) 語をコンテクストとする場合、この \(c\) を "ウィンドーサイズ" と呼びます。そして "ウィンドー" の中には \(2c\) 語のコンテクストと1つのターゲットが含まれます。そして、訓練データとする文の "ウィンドー" を1単語ずつずらしながら、コンテクストからターゲットを推論する学習を行います。

語彙集合の単語数を \(V\) とし、一つの文を、

 \(\bs{T}=\{x_1,\:x_2,\:\cd x_T\}\)
  \(x_i\) :単語ID \((1\leq x_i\leq V)\)

とします。そして、\(x_i\) に1対1に対応する、\(V\)次元の one hotベクトルを、
 \(\bs{x}_i=\left(\begin{array}{r}a_1,&a_2,&a_3,&\cd&a_V\\\end{array}\right)\)
  \(a_j=0\:\:(j\neq x_i)\)
  \(a_j=1\:\:(j=x_i)\)
とします。つまり \(\bs{x}_i\) は、\(x_i\) 番目の要素だけが \(1\) で、他は全部 \(0\) の \(V\) 次元ベクトルです(1つだけ \(1\)、が "one hot" の意味です)。

例として、ウィンドーサイズを \(c=2\) とします。また分散表現の単語ベクトルの次元を \(D\) とします。この前提で、\(\bs{T}\) の中の \(t\) 番目の単語の one hotベクトルを推論するモデルが図17です。

図17:word2vec(CBOW) の単語推論モデル.jpg
図17:word2vec(CBOW) の単語推論モデル

 \(\bs{T}=\{\:\cd,\:\bs{x}_{t-2},\:\bs{x}_{t-1},\:\bs{x}_t,\:\bs{x}_{t+1},\:\bs{x}_{t+2},\:\cd\:\}\)

という単語の one hotベクトルの系列を想定したとき、 \(\bs{x}_t\) がターゲットの正解データ(=教師ラベル)であり、その他の4つがコンテクストです。

最初の MatMul (Matrix Multiply) レイヤーは、4つの one hotベクトル \(\bs{x}_i\) を入力とし、それぞれに重み行列 \(\bs{W}_{\large enc}\) をかけて、4つのベクトル \(\bs{h}_i\) を出力します(enc=encode)。つまり、

 \(\bs{h}_i=\bs{x}_i\cdot\:\bs{W}_{\large enc}\)

です。Average レイヤーは、入力された複数ベクトルの平均をとり、一つのベクトル \(\bs{h}_t\) を出力します。この \(\bs{h}_t\) が \(\bs{x}_t\) の分散表現(= \(D\)次元ベクトル)です(というより、そうなるようにネットワークを訓練します)。

次の MatMul レイヤーで 重み \(\bs{W}_{\large dec}\) を掛け(dec=decode)、\(\mr{Softmax}\) レイヤーを通して、分散表現を \(V\) 次元の確率ベクトル \(\bs{y}_t\) に変換します。そして、教師ラベルである \(\bs{x}_t\) との間で交差エントロピー誤差を計算し、損失 \(L\) を求めます。


損失が求まれば、誤差逆伝播法で重み行列 \(\bs{W}_{\large enc}\) と \(\bs{W}_{\large dec}\) を修正します。この修正を、大量の文とそのすべてのウィンドーで行って、損失 \(L\) を最小化します。これがネットワークの訓練です。

訓練済みのネットワークでは、重み行列 \(\bs{W}_{\large enc}\:[V\times D]\) が、単語の分散表現の集積体になっています。つまり、one hot ベクトル \(\bs{x}_i\) の分散表現を \(\bs{h}_i\) とすると、

 \(\bs{h}_i=\bs{x}_i\cdot\:\bs{W}_{\large enc}\)

です。\(\bs{x}_i\) の単語IDを \(x_i\) とすると、

 \(\bs{h}_i=\bs{W}_{\large enc}\) の \(x_i\)行(\(1\)列から\(D\)列まで)

となります。

分散表現と単語の意味
「分布仮説」をもとに、ニューラル・ネットワークによる推論で得られた単語の分散表現ベクトルは、類似の意味の単語は類似のベクトルになる(ことが多い)ことが確認されています。たとえば、
 year, month, day
などや、
 car, automobile, vehicle
などです。ベクトルの類似は「コサイン類似度」で計測します。2つの2次元ベクトル、
 \(\bs{a}=\left(\begin{array}{r}a_1&a_2\\\end{array}\right)\)
 \(\bs{b}=\left(\begin{array}{r}b_1&b_2\\\end{array}\right)\)
の場合で例示すると、
 コサイン類似度\(=\dfrac{a_1b_1+a_2b_2}{\sqrt{a_1^2+a_2^2}\sqrt{b_1^2+b_2^2}}\)
で、2次元平面の2つのベクトルの角度(コサイン値)を求める式になります。この式の分子は内積(dot product)で、内積の定義式を変形したものです。この類似度を利用して「類推問題」が解けます。たとえば、

 France : Paris = Japan : X

の X は何かという問題です。答えは Tokyo ですが、これを求めるには、分散表現ベクトルが類似しているという前提で、
 France ≒ Japan
 Paris ≒ X
となるはずなので、
 X = France + Paris - Japan
であり、X を \(\bs{W}_{\large dec}\) と \(\mr{Softmax}\) 関数を使って確率ベクトルに変換すれば、確率が最も高い単語が Tokyo になるはずというわけです。

もちろん、分散表現ベクトルで類推問題を解くのは完璧ではありません。分散表現を作るときのウィンドーのサイズと訓練データの量にもよりますが、各種の類推問題を作って実際にテストをすると、60%~70% の正解率になるのが最大のようです。

言語モデル
分散表現ベクトルを用いて「言語モデル」を構築します。いま、一つの文を構成する単語の並び、

 \(\bs{x}_1,\:\bs{x}_2,\:\bs{x}_3,\:\cd\:,\:\bs{x}_T\)

があったとき(\(\bs{x}_1=\)[BOS]、\(\bs{x}_T=\)[EOS])、この文が存在する確率を、

 \(P(\bs{x}_1,\:\bs{x}_2,\:\bs{x}_3,\:\cd\:,\:\bs{x}_T)\)

で表します。文法として間違っている文の確率はゼロに近く、また文法としては合っていても、意味をなさない文の確率は低い。

 \(P(\)[BOS],[彼女],[は],[学校],[へ],[行く],[EOS]\()\)
   \( > \:P(\)[BOS],[学校],[は],[彼女],[へ],[行く],[EOS]\()\)

といった具合です。この「存在確率」は、次のような「条件付き確率」で表現できます。つまり、

 \(P_1=P(\)[彼女] | [BOS]\()\)
  :文頭が「彼女」である確率
 \(P_2=P(\)[は] | [BOS],[彼女]\()\)
  :「彼女」の次が「は」である確率
 \(P_3=P(\)[学校] | [BOS],[彼女],[は]\()\)
  :「彼女は」の次が「学校」である確率
 \(P_4=P(\)[へ] | [BOS],[彼女],[は],[学校]\()\)
  :「彼女は学校」の次が「へ」である確率
 \(P_5=P(\)[行く] | [BOS],[彼女],[は],[学校],[へ]\()\)
  :「彼女は学校へ」の次が「行く」である確率
 \(P_6=P(\)[EOS] | [BOS],[彼女],[は],[学校],[へ],[行く]\()\)
  :「彼女は学校へ行く」で文が終わる確率

とすると、

 \(P(\)[BOS],[彼女],[は],[学校],[へ],[行く],[EOS]\()\)
  \(=P_1\times P_2\times P_3\times P_4\times P_5\times P_6\)

となります。つまり、一般的に、

 \(P(\bs{x}_{t+1}\:|\:\bs{x}_1,\:\bs{x}_2,\:\bs{x}_3,\:\cd\:,\:\bs{x}_t)\)

が分かれば、言語モデルは決まります。平たく言うと、

 それまでの単語の系列から、次にくる単語の確率を推測する

のが言語モデルと言えます。もちろん、次にくる可能性のある単語は1つではありません。語彙集合のすべての単語それぞれについて「次にくる」確率を予測します。

実は、Transformer や GPT、ChatGPT がやっていることは「次にくる単語の予測」であり、これを実現しているのが、「超大規模なニューラル・ネットワークで作った言語モデル」なのです。

トークン
今まで、ニューラル・ネットワークでテキストを扱うためには、テキストを単語に分解するとしてきました。しかし大規模言語モデルで実際にやっていることは、テキストを「トークン(token)」に分解し、そのトークンの分散表現ベクトルを求めてニューラル・ネットワークで処理することです。

トークンとは、基本的には「単語」ないしは「単語の一部」です。英語ですと、たとえば頻出単語は「単語=トークン」ですが、GPT-3 の例だと、トークンには、ed, ly, er, or, ing, ab, bi, co, dis, sub, pre, ible などの「単語の一部」が含まれます。GPT-3 のトークンの語彙数は約5万ですが、そのうち英語の完全な単語は約3000と言われています。通常使われる英単語は4万~5万なので、3000の単語で WebText や Wikipedia の全部を表すことは到底できません。つまり、単語の "切れ端" と単語の組み合わせ、ないしは単語の "切れ端" 同士の組み合わせでテキストを表現する必要があります。

たとえば「ディスコ音楽」などの disco という単語は、[dis] [co] と表現します。edible(食用の、食べられる、という意味)は、[ed] [ible] です。disco や edible は 3000 単語の中に入っていないようです。edible などは「基本的な英単語」と思えますが、あくまで WebText や Wikipedia に頻出するかどうかの判断によります。

また xylophone(木琴)は、[x] [yl] [ophone] です。このように、1文字がトークンになることもあります。"単語"、"単語の切れ端"、"文字" がトークンです。

 BPEによるトークン化 

テキストをトークンに変換することを「トークン化(tokenize)」、トークン化を行うソフトを tokenizer と言います。ここで GPT-3 のトークン化のアルゴリズムの概要をみてみます。

上の xylophone → [x] [yl] [ophone] で明快なのですが、トークン化は単語の意味とは無関係です。意味を言うなら xylo("木の" という意味の接頭語)+ phone(音)ですが、そういうこととは全く関係ありません。

GPT-2 の論文にそのアルゴリズムである BPE(Byte Pair Encoding)が書かれています(GPT-3 は GPT-2 と同じだと、GPT-3 の論文にあります)。

コンピュータで文字を表現するには文字コード(文字に数字を割り振ったもの)を使います。国際的に広く使われているのは unicode です。unicode を使うと各国語の文字が統一的に文字コードで表現できます。

unicode の数字をコンピュータでどう表すか、その表し方(=エンコーディング)には3種類ありますが、その一つが UTF-8 です。UTF-8 は1バイト(8ビット、10進数で 0~255)を単位とし、1~4バイトで1文字を表現する可変長のエンコーディングです(漢字の異字体は5バイト以上になります)。

UTF-8 でば、通常の英文に使われる英数字、特殊文字(空白 , . ? など)は1バイトで表します。一方、日本語の平仮名、カタカナ、漢字は3バイトです(一部の漢字は4バイト)。バイトは文字ではありません。あくまで文字を表現するためのコンピュータ用の数字です。

BPE ではまず、UTF-8 でエンコーディングされた大量のテキストを用意します。そして、1バイトの全パターンを256種類の基本トークンとして語彙に初期登録します。トークン ID は 1~256 とします。従って、英文における1文字の単語( I, a )や記号( , . ? ! など)は、この時点でトークンID が割り当てられたことになります。

次に、テキストの「トークンのペア」で、最も出現頻度の高いペアをみつけます。英語で最も出現頻度が高い単語は the で、トークンで表現すると [t] [h] [e] です。仮に、[t] [h] のペアがテキスト中で最も出現頻度が高いとします(説明のための仮定です)。そうすると、この2つのトークンを結合した [th] を新たなトークン(トークン ID=257)として語彙に登録します。以降、テキスト中の [t] [h] は [th] と見なします。

次に出現頻度の高いペアが [th] [e] だとすると、この2つを結合した [the] を新たなトークン(トークン ID=258)として語彙に登録します。この段階で the という単語がトークンの語彙に登録されたわけです(以上の [th] [the] のトークン ID は説明のための数字で、実際の GPT-3 のトークン ID は違います)。

以上のプロセスにおいてトークンは、「空白をまたがない」「空白で終わらない」「同一カテゴリの文字(英字、数字、特殊文字など)でしかペアを作らない」などの制約をもうけておきます。「カテゴリ」が何かは論文に書いていないので想定です。もちろんこれは、なるべく頻出単語をトークンにする工夫です。

これを「結合の最大回数」になるで繰り返します。GPT-2 / GPT-3 の場合、最大回数は 50,000 です。従って、最終的には、
 256 + 50,000 + 1 = 50,257
のトークンの語彙ができあがることになります。最後の + 1 は文末の記号 [EOS] を特殊トークンとしているからです。

いったん語彙ができあがると、以降、この語彙を使ってすべてのテキストを同じアルゴズムでトークン化します。当然ですが、長いバイトのトークンからテキストに割り当てることになります。

 大規模言語モデルの成立要件 

GPT-3 のトークン化のロジックによると、すべての言語のすべてのテキストが 50,257個のトークンを使って、統一的に、もれなくトークン化できることになります。それはあたりまえで、1バイトのデータがすべてトークンとして登録してあるからです。テキストを UTF-8 で統一的に表せば可能なのです。

ここで、日本語がどうなるかです。日本語の unicode を UTF-8 で表すと、漢字・仮名・文章記号は3バイトです(一部の漢字は4バイト。また異字体は5バイト以上)。ということは、普通の漢字1字、仮名1字は1~3トークンで表されることになります。

実際、OpenAI 社が公開している GPT-3 の Tokenizer で試してみると、
 仮名は1~2トークン
 ほとんどの漢字は2~3トークン
となります。ちなみに、平仮名(清音、濁音、半濁音、計71文字種)のトークン数を調べてみると、
 28 文字種:1トークン
 43 文字種:2トークン
です。濁音で1トークンになるのは「が だ で」の3つだけですが、これは助詞として頻出するからでしょう。特別の場合は、仮名2文字で1トークンになるようです(スト、ーク、など)。1トークンになる漢字はごく少数のようで、たとえば「上」「田」「中」「一」「大」がそうです(他にもあると思います)。

以上をまとめると、何をトークンとするかは、
 ・単語
 ・単語の一部、ないしは文字の連なり
 ・文字
 ・バイト
がありうるわけですが、GPT-3 のトークンにはこれらが混在していて、規則性は全くないことになります。ここから何が言えるかと言うと、


大規模言語モデルは、言語の文法や意味を関知しないのみならず、単語という概念さえなしでも成立しうる


ということです。もちろん、英語を扱うときのように頻出単語のトークン化ができれば、生成されるテキストのクオリティーが向上することは確かでしょう。しかし、単語単位のトークン化は必須ではない。つまり、

単語の切れ端や文字どころか、文字を細分化した「バイト」をトークンとしても、その「バイト」には言語学的な意味が全く無いにもかかわらず、大規模言語モデルが、とりあえず成り立つ

わけです。GPT-3(= ChatGPT の基盤となっているモデル)がそれを示しています。大規模言語モデルは、翻訳、文章要約、質問回答、おしゃべり(chat)などの多様なタスクに使えます。これらのタスクを実現する仕組みを作るには、言語学的知識は全く不要です。不要というより、言語学的知識を持ち込むことは邪魔になる。もちろん、「翻訳、文章要約、質問回答、おしゃべり」の実例や好ましい例が大量にあるのが条件です。

その GPT-3 のベースになっているのは、Google が提案した Transformer という技術です。ということは、次のようにも言えます。


Transformer は「系列データ = 同質の記号・データが直列に並べられた、順序に意味のあるもの」であれば適用可能であり、その記号を文字としたのが大規模言語モデルである。もちろん、適用するには系列データの実例が大量にあることが必須である。


これが言えるのなら、少々先走りますが、Transformer はタンパク質の機能分析にも使える(可能性がある)ことになります。タンパク質はアミノ酸が鎖状に1列に並んだもので、そのアミノ酸は20種類しかありません。

タンパク質は「20種の記号の系列」であり、それが生体内で特定の機能を果たします。多数のタンパク質のアミノ酸配列を Transformer で学習し、タンパク質の機能と照らし合わせることで、新たなタンパク質の設計に役立てるようなことができそうです。実は、こういった生化学分野での Transformer や言語モデルの利用は、今、世界でホットな研究テーマになっています。

もちろん、系列データはタンパク質の構造だけではありません。従来から AI で扱われてきた音声・音源データや、各種のセンサーから取得したデータがそうだし、分子生物学では DNA / RNA が「4文字で書かれた系列データ」と見なせます。現に米国では、DNA / RNA の塩基配列を学習した大規模言語モデルでウイルスの変異予測がされています。

Transformer は、もともと機械翻訳のために提案されたものでした。しかしそれは意外なことに、提案した Google も予想だにしなかった "奥深い" ものだった。ここに、大規模言語モデルのサイエンスとしての意義があるのです。




nice!(0) 

No.364 - 言語の本質 [本]

No.344「算数文章題が解けない子どもたち」で、慶応義塾大学 環境情報学部教授の今井むつみ氏の同名の著作を紹介しました(著者は他に6名)。今回は、その今井氏が名古屋大学准教授の秋田喜美きみ氏(言語心理学者)と執筆した『言語の本質 - ことばはどう生まれ、進化したか』(中公新書 2023。以下、"本書")を是非紹介したいと思います。共同執筆ですが、全体の核の部分は今井氏によるようです。

言うまでもなく、言語は極めて複雑なシステムです。それを、全くのゼロ(=赤ちゃん)から始まってヒトはどのように習得していくのか。本書はそのプロセスの解明を通して、言語の本質に迫ろうとしています。それは明らかに「ヒトとは何か」に通じます。

"言語の本質" とか "言葉とは何か" は、過去100年以上、世界の言語学者、人類学者、心理学者などが追求してきたものです。本書はその "壮大な" テーマを扱った本です。大風呂敷を広げた題名と思えるし、しかも新書版で約280ページというコンパクトさです。大丈夫なのか、見かけ倒しにならないのか、と疑ってしまいます。

しかし実際に読んでみると「言語の本質」というタイトルに恥じない出来映えの本だと思いました。読む立場としても幾多の発見があり、また個々の論旨の納得性も高い。以下に、内容の "さわり" を紹介します。


AI研究者との対話


本書で展開されている著者の問題意識のきっかけが、今井氏による「あとがき」に記されています。その部分を引用すると次の通りです。
以降の引用では、段落を増やしたところ、図の番号を修正したところや、漢数字を算用数字にしたところがあります。また下線は原文にはありません)


「今井さんの研究は記号接地問題だね」。私に「記号接地問題」ということばを教えてくれたのは、慶應義塾大学環境情報学部教授の故古川康一先生だった。古川先生は人工知能(AI)黎明期に国家プロジェクトとして第5世代コンピュータ研究で中心的役割を果たされ、プロジェクト終了後に、誕生したばかりの慶應義塾大学SFC(湘南藤沢キャンパス)に教授として赴任された。当時、私はアメリカで博士号を取得して環境情報学部に助手として就職したばかりで、キャンパスはもとより、自分の研究分野においても日本では知り合いが少なく、アメリカで学んできた認知心理学の研究を、どのように日本で展開していったらよいのかを悩んでいたところだった。

人工知能の分野で世界的に著名な古川先生が、研究室がすぐ近くだということで気軽に話しかけてくださり、私の研究の話を熱心に聞いてくださった。「記号接地問題」は人工知能の分野では、大きな問題として当時も知られていたが、認知心理学や発達心理学ではそれほど一般的に知られた概念ではなかった。自分の言語発達の研究を、国際的に著名な先生が「記号接地問題」だと教えてくださったときから、本書の旅が始まった。

私は人工知能の開発に携わったことはなく、それどころか、プログラムも書いたことがない。しかし、SFCには古川先生をはじめ、石崎俊先生、向井国昭先生など、当時人工知能研究を牽引されていた先生方がおり、まさに「門前の小僧習わぬ経を読む」で「記号接地問題」や「フレーム問題」をはじめとした人工知能の難問についての先生方の議論を聞きながら、人間が知識を身体に接地させるとはどういうことなのかを考えるようになった。それが、学びと教育についての独自の視点になっていった

今井むつみ・秋田善美
「言語の本質」(中公新書 2023)

少々意外なのですが、今井氏の問題意識の発端(の重要な点)は人工知能(AI)研究者との交流だったのですね。本書には、今井氏が自著の『ことばと思考』の冒頭部分を ChatGPT に英訳させた例が載っていて、今井氏は「ほとんど完璧」と書いています。しかし ChatGPT とヒトとの言葉の認識のあり方は全く違っていて、その違いも本書のテーマと結びついています。こういった記述は、今井氏の AI への関心が窺えます。

上の引用のキーワードは「記号接地(symbol grounding)」です。記号接地とは、記号(言語の場合は音の塊・並び)が人間の身体感覚(視覚、聴覚、触覚、心理感覚、・・・・・・ など)と結びつくことを言います。これが言語習得の第一歩だとするのが、本書の第1の主題です。それがオノマトペを例に説明されています。


オノマトペ


オノマトペとは、いわゆる擬音語、擬態語、擬情語(=「ワクワク」「ドキドキ」などの内的感覚・感情を表す語)の総称です。重複形が多いが、そればかりではありません(笑顔を表す擬態語に「ニコニコ」と「ニコッ」がある例)。オノマトペは、

 感覚イメージを写し取る記号

と定義できます。ここでのキーワードは、まず「感覚」(視覚、聴覚、触覚、味覚など)です。オノマトペは、形容詞などと同じく "感覚" を表す言葉です。しかし形容詞には感覚("美しい")と、感覚ではないもの("正しい" などの理性的判断)の両方がありますが、感覚ではないオノマトペは考えにくい。"感覚" ではなく "感覚イメージ" と定義してあるのは、擬態語や擬情語を想定しているのでしょう。

もう一つのキーワードは「写し取る」です。表すもの(記号)と、それによって表されるものに類似性があるとき、その記号を「アイコン」と呼びます。アイコンは主として視覚によるもので、たとえばコンピュータ画面のゴミ箱のアイコンや、一般的に使われる笑顔のアイコン( )は、世界のだれが見てもゴミ箱や笑顔と見えます。

オノマトペもアイコンのように、表すもの(音形)と表されるもの(感覚イメージ)に類似性がある(=模倣性があると感じられる)記号です。このことを本書では "アイコン性" がある、と表現しています。"アイコン" ではなく "アイコン性" としてあるのは、視覚によるアイコンとは違って発音で "写し取る" ため、模倣性に限界があるからです。また、音による模倣は、言語体系がもつ母音・子音のバリエーションや音韻体系に大きく影響されます。アイコン、オノマトペ、オノマトペ以外の言葉の3つを対比させると、次のようになります。

アイコン
(日本語話者以外も理解)
ニコニコ
ニコッ
アイコン性がある言葉
えがお
笑顔
言葉
(日本語話者だけが理解)


音象徴


オノマトペを考える上で重要なことは、そもそも発音における "音" がアイコン性を帯びていることです。これを「音象徴」と言います。たとえば、清音と濁音の音象徴です。「コロコロ」より「ゴロゴロ」の方が大きくて重いものが転がる様子を表します。「サラサラ」より「ザラザラ」の方が荒くて不快な手触りを示す。「トントン」より「ドンドン」の方が、強い打撃が出すより大きな音を模倣します。g や z や d のような濁音は程度が大きいことを表し、またマイナスのニュアンスが伴いやすい音です。

母音の "あ" と "い" の音象徴もあります。打撃を表「パン」は平手でたたく感じで「ピン」は人差し指で弾くイメージであり、「パン」の方の打撃が大きい。水が飛び散る様子の「パチャパシャ」と「ピチャピチャ」も、「パチャパシャ」の方が飛び散る程度は大きいわけです。"あ" は大きいイメージと結びつき、"い" は小さいイメージと結びつきます。これは、発音のときの口腔の大きさに違いに起因します。

さらに、阻害音(p, t, k, s, d, g, z などの子音が入った音)は、硬く、尖って、角張ったイメージであり、共鳴音(m, n, y, r, w などの子音)は、柔らかく、なめらかで、丸っこい印象と結びつきます。この例として、次の図1を示して、
「 一方が マルマ(maluma)で、一方が タケテ(takete)です。どちらがマルマで、どちらがタケテでしょうか」
との質問をすると、多くの言語の多くの話者は「左側がマルマ」と答えます。

図1:マルマとタケテ.jpg
図1:マルマとタケテ
どちらが "マルマ" で、どちらが "タケテ" か

音象徴は、言語習得以前の赤ちゃんでも認められます。チリで行われた生後4ヶ月の赤ちゃんの実験では、親の膝の上に乗せられた赤ちゃんに、丸、楕円、四角、三角のどれかの図形を、大小をペアにしてスクリーン上に表示します。と同時に、様々な発音(音)を聞かせます。赤ちゃんの視線検知をすると、a を含む音を聞いたときは大きな図形の方を、i を含む音を聞いたときは小さな図形の方を見ることが分かりました。言語経験がほとんどない赤ちゃんですら、母音と図形大きさの関係に気づいているのです。

マルマとタケテの音象徴や、a と i の音象徴は、母語によらない共通性があります。しかし、ほとんどの音象徴は言語により個別です。たとえば、日本語においてカ行とタ行を含むオノマトペ、「カタカタ」「コトコト」「カチカチ」「コツコツ」は、いずれも硬いモノ同士の衝突音を表します。つまり、タ(t)、ト(t)、チ(ch)、ツ(ts)の子音が、音象徴で同じ意味と結びついている。

しかしこれは日本語ならではの音象徴です。たとえば英語では、titter は "忍び笑い"、chitter は "鳥のさえずり" で、t と ch が違う音象徴をもっています。

音がアイコン性をもつのが音象徴です。そしてアイコン性をもつ音の連なり=言葉がオノマトペであり、オノマトペが高度に発達した日本語や韓国語では、オノマトペこそ "身体で感じる感覚イメージを写し取る言葉" なのです。


言語の習得過程(1)


幼児の言語環境はオノマトペにあふれています。0歳児向けの絵本はオノマトペだけだし、0歳児・1歳児に対する親の語りかけもオノマトペが多用されます。そして2歳児以降になると、文や単語を修飾するオノマトペが増える。

そのオノマトペの発端が「音象徴」です。乳幼児は音象徴が認識できるかを著者が実験した結果が本書に書かれています。どうやって調べるのかというと、脳波の「N400 反応」をみます。

言葉を覚えたての1歳過ぎの幼児に知っている単語を聞かせ、同時にモノを見せたとき、単語とモノが合っているときと、単語とモノが違っているときでは脳波の反応が違います。たとえば、「イヌ」という音なのに絵はネコだとすると、音の始まりから400~500ミリ秒たったところで、脳の左右半球の真ん中付近の電位が下がります。これは大人でも単語と提示内容が不整合の場合にみられる反応で、N400反応と呼ばれています(N は Negative、400 は 400ミリ秒の意味)。

著者は、N400反応を利用して、言語習得前の生後11ヶ月の赤ちゃんのN400反応を調べました。次のような図形を用いた「モマ・キピ」実験です。

図2:モマとキピ.jpg
図2:モマとキピ
どちらが「モマ」で、どちらが「キピ」か


図2の2つの図形のうち、どちらが「キピ」で、どちらが「モマ」だろうか? ほぼ全員が、丸い方が「モマ」で、尖っている方が「キピ」であると直感的に感じる。第2章で見た「マルマ / タケテ」と同様、この直感は日本語話者だけではなく、世界中の異なる言語話者の間で共有されているようである。この直感的な音と形のマッチングを、11ヶ月の赤ちゃんも感じることができるのだろうか ?

このことを調べるため、赤ちゃんにことば(音)と対象の組み合わせを次々と提示していった。そのうちの半分は「合っている」組み合わせ(丸い形に「モマ」、尖った形に「キピ」)で、残りの半分は「合っていない」組み合わせ(丸い形に「キピ」、尖った形に「モマ」)である。合っているペアと合っていないペアは規則性を持たないようにランダムな順序で提示した。筆者らはこのように予測した。音と形が合っているか合っていないかを赤ちゃんが認識できるならば、2つのケースで違う脳の反応が見られるはずだ。

実際、この仮説は正しかった。しかもそれだけではなく、なんと、「合っていない」組み合わせを提示したときに、大人が「イヌ」という音を聴いてネコの絵を見たときと同じ反応、つまりN400の脳波の反応が見られたのである。

この結果はおもしろい可能性を示唆している。まだほとんどことばを知らない11ヶ月の赤ちゃんは、人が発する音声が何かを指し示すものであることをうっすらと知っているのだ。しかも、「音の感覚に合う」モノが、単語が指し示す対象かどうかを識別している。だから単語の音声が、音の感覚に合わないモと対応づけられると違和感を覚えるのだ。

(同上)

このように、ヒトの脳は音と対象の意味付けを生まれつき自然に行っています。これが、言葉の音(=記号)が身体に接地する第一歩になるのではないかというのが著者の意見です。

このことは、音の連なり(単語)にも意味があるという洞察につながります。さらには、対象それぞれに名前があるという "偉大な洞察" につながっていきます。

一般に、言葉の音からその意味を推測することはできません。「サカナ」という音の連なりは "魚" と何の関連性もありません。しかし、オノマトペは違います。「トントン」「ドンドン」(打撃音)や、「チョコチョコ」「ノシノシ」(歩く様子)などは、音が意味とつながっています。仮に「チョカチョカ」「ノスノス」とういう、現実には使われない "オノマトペ" を想定してみても、それが表す歩く様子は「チョコチョコ」「ノシノシ」と同じと感じられる。これは「サカナ」を「サカノ」にすると全く意味がとれなくなるのとは大違いです。

対象それぞれに名前があるというのは "偉大な洞察" だということを、著者はヘレン・ケラーのエピソードを引いて説明しています。


対象それぞれに異なる名前があるということは、実は偉大な洞察なのである。視覚と聴覚を失くしたヘレン・ケラーは、掌に冷たい水を受けているときにサリバン先生が“water"と指文字で綴ると、その指文字とは掌に流れる冷たい液体の名前なのだという啓示を得た。このエピソードをご存じの方は多いだろう。

それ以前にもヘレンは、モノを手渡されるそのときどきに、サリバン先生の指が別々の動きをしていることに気づいていた。しかし、彼女が手で触れるサリバン先生の指文字の形がその対象の「名前」だということには気づいていなかった。それまで、指文字を覚え、対象を手渡されれば指文字を綴ることができたが、ヘレンはのちにそれを「猿まねだった」と回想している。ヘレンは、water という綴りが名前だということに気づいたとき、すべてのモノには名前があるのだというひらめきを得た。この閃きこそが「名づけの洞察」だ。

名づけの洞察は、言語習得の大事な第一歩である。人間が持っている視覚や触覚と音の間に類似性を見つけ、自然に対応づける音象徴能力は、モノには名前があるという気づきをもたらす。その気づきが、身の回りのモノや行為すべての名前を憶えようとするという急速な語彙の成長、「語彙爆発」と呼ばれる現象につながるのだ。語彙が増えると子どもは語彙に潜むさまざまなパターンに気づく。その気づきがさらに新しい単語の意味の推論を助け、語彙を成長させていく原動力となるのである。

音と意味が自然につながっていて、それを赤ちゃんでも感じられることが、「単語に意味がある」という「名づけの洞察」を引き起こすきっかけになるのではないか。だから大人は赤ちゃんにオノマトペを多用するのだろう。

(同上)


「ノスノス」実験


しかし、「対象それぞれに名前がある」という洞察から「語彙爆発」に向かうのは単純なことではありません。単純ではない一つの理由は、音の連なり(=言葉)で対象を説明されたとしても、その言葉が対象の「形」なのか「色」なのか「動作」なのかが曖昧だからです。実はここでも、感覚イメージを写し取るオノマトペが役だちます。著者は、3歳ぐらいの幼児に次の絵(図3)を見てせて動詞(=実際には使われない仮想的な動詞)を教える実験を紹介しています。

図3:ノスノスしている.jpg
図3:ノスノスしている
ノスノスとはどういう動きを指す擬態語なのか


図3のような登場人物一人の単純な動きを表す動詞でも簡単ではない。このシーンを見ているときに、「ネケっている」という、オノマトペではない、音と意味の間につながりのない動詞を聞いたとしよう。「ネケっている」とは、〈ウサギがしている動き〉なのか、〈歩いている〉なのか、〈しこを踏むようにゆっくりのっそり足を交互に踏み出しながら歩く〉なのか。その解釈によって、「ネケる」が使える範囲は大きく異なってくる。

実験を見てみよう。3歳くらいの子どもが、図3のようなウサギの動作を見ながら「ネケっている」という(引用注:実際には存在しない)動詞を教えられる。その後、クマが同じ動作をしている動画と、同じウサギが別の動作である小股で小刻みに進んでいる動画を見せられ、「ネケってるのはどっちのビデオ ?」と聞かれると、どちらかわからない。

しかし、「ノスノスしている」とい実際には存在しないオノマトペ動詞を教えると、クマが同じ動作をしているほうを迷いなく選ぶことができることがわかった。「ノスノス」には音と意味の対応があるため、どの動作に動詞が対応づけられるべきなのかが直感的にわかるのである。

しかも驚いたことに、この効果は日本人の子どもに限らないこともわかった。英語を母語とする3歳児も、日本人の子どもと同じように動詞の学習にてこずり、図のような動きに fepping のようなオノマトペではない新造動詞を用いると、動作主が変わってしまったときに、やはり新造動詞を同じ動作に対して使えない。英語ではオノマトペは日本語ほど豊富にないし、子どもたちは日本語のオノマトペをまったく知らないのだが、それでも doing nosu-nosu というと、クマがする同じ動作にこの新奇な動詞を一般化して使うことができた

すなわち、人物に注目するのか、動き方に注目するのか、移動する方向に注目するのかという曖昧性のある中で、オノマトペの音は子どもに、どの要素に注目すべきかを自然に教えるのである。オノマトペには音と動作の対応があるので、一般化の基準となる意味のコアをつかむ手助けとなるのである。

(同上)

「ノスノス」は、人物を表すのではなく、動き(たとえば歩く)を表すのでもなく、動き方を表すのだと感覚的に分かるのです。このように、感覚と音が対応すると感じられる(アイコン性がある)オノマトペは言語学習の足場となり、手掛かりになるのです。


記号接地


もちろん、アイコン性のある言葉は言語学習の足場であって、最初の手掛かりに過ぎません。しかし言語という記号体系が意味を持つためには、基本的な一群の言葉の意味はどこかで感覚と接地(ground)していなければなりません。このことを指摘した認知科学者のハルナッドは、大人が中国語を学ぶ例をげて次のように説明しています。


あなたは中国語を学ぼうとするが、入手可能な情報源は中国語辞書(中国語を中国語で定義した辞書)しかないとしよう。するとあなたは永遠に意味のない記号列の定義の間をさまよい続け、何かの「意味」には永遠にたどり着くことができないことになる。

まったく意味のわからない記号の意味を、他の、やはりまったく意味のわからない記号を使って理解することはできない。他方、中国語の語を母語の語を介して理解することは可能である。母語の語は「感覚に接地」しており、接地した語を通じて接地していない外国語の記号を理解することが可能なのである。

(同上)

辞書の定義だけから言葉の意味を理解しようとするのは、一度も地面に接地することなく「記号から記号への漂流」を続けるメリーゴーラウンドに乗っているようなものです。

その一方で、永遠に回り続けるメリーゴーラウンドを回避するためには、すべての言葉が身体感覚と接地している必要は全くありません。身体感覚とつながる言葉をある程度のボリュームで持っていれば、それらの言葉を組み合わせたり、それらとの対比や、また比喩や連想によって、直接の身体経験がなくても身体に接地したものとして言葉を覚えていくことができるのです。



身体感覚に接地する代表が音象徴であり、オノマトペですが、一般語にも音と意味の繋がりを感じるものがあることに注意すべきです。たとえば「かたい」「やわらかい」はオノマトペではありません。しかし「かたい」の k、t は硬い印象を与える音象徴があり(阻害音)、「やわらかい」は柔らかい印象の音象徴があります(共鳴音)。

「おおきい」「ちいさい」も同様で、大きい印象を与える "o" の長母音と、小さい印象を与える "i" が先頭音にあります。言葉を覚えたての幼児に親が絵本を読んで聞かせるとき、これらの言葉をどういう風に(大袈裟に)発音するかを想像してみたら、それは明確でしょう。

また「たたく(叩く)」「ふく(吹く)」「すう(吸う)」はオノマトペではありませんが、オノマトペの歴史研究によると、これらは「タッタッ」「フー」「スー」という擬音語に、古語における動詞化のための接尾辞「く」をつけたものです。「ひよこ」も、「ヒヨヒヨ」という擬音語に、可愛いものを表す接尾辞「こ」をつけたものです(「ワンコ」「ニャンコ」と同じ原理)。

こういった "隠れたオノマトペ" は非常にたくさんあり、"記号接地" の一助になっていると考えられます。また、このあたりはオノマトペが発達していない英語にも当てはまります。日本語なら「オノマトペ + 動詞」で表現するところを、英語では1語の動詞で表すのが一般的です。たとえば、英語の「話す・言う」ジャンルの言葉に、

chatter (ペチャクチャ話す)
whisper (ヒソヒソ話す)
mumble (ブツブツ言う)
scream (キャッと言う)

などがありますが、これらは cha と チャにみられるように音象徴があります。



しかし、音象徴やオノマトペなどのアイコン性がある言葉があったとしても、基本的に言語は恣意的な記号の体系です。「日本国語大辞典」の見出し語は約50万語ですが、「日本語オノマトペ辞典」は、方言、古語を含んで 4500語です。多めに見積もったとしても、オノマトペは言葉の 1% に過ぎません。言語を習得するためには身体感覚とつながっているオノマトペから離れる必要があります。

そもそも言葉は抽象的で、記号とそれが表すものの関係は全く恣意的です。この恣意的な記号の膨大な体系をどうやって習得していくのか、それが本書の第2の主題です。


言語の習得過程(2)


子どもが言語を習得していく過程を観察すると「過剰一般化」の例がよくあります。具体的には、

・ 閉まっているドアをあけて欲しいとき「あけて」と言う
・ お菓子の袋をあけて欲しいとき「あけて」と言う

の2つを学んだ子どもが、

・ みかんを食べたいときにも「あけて」と言う

事例がありました。「開ける」は多くの子どもが過剰一般化する有名な動詞です。上の例では子どもが "自分の欲しいモノや場所にアクセスしたいとき「あけて」と言えばよい" と過剰一般化したわけです。それは残念ながら、ミカンでは間違いになる(日本語環境では)。

英語の open も、多くの子どもが過剰一般化します。明かりやテレビをつけるときも "open" という子が多い。しかし中国語ではそれで正解です。中国語の「カイ」は、日本語の開けると同じ意味に加えて、電気をつけたり、パソコンのスイッチを入れたり、車を運転することにも使うからです(その "開" の意味の一部は漢字を通して日本語に入り、開始、開会、開業、開店、開校、開港、などと使われています。さすがに開車とは言いませんが)。

過剰一般化はあくまで "過剰" なので、子どもの暮らす言語環境では間違いです。しかし子どもは推論しているのです。みかんを剥くことも「あける」だろうと ・・・・・・。みかんの場合は間違いなので、親から「そういうときは、"むいて" と言うのよ」と直されるでしょう。しかしオモチャ箱のフタなら「あける」は正しいので、親は子どもの要望にそのまま応える。そのようにして子どもは言葉を覚えていく。

推論をするから過剰一般化が起きます。キーワードは "推論" であり、学習は丸暗記ではなく推論というステップを経たものなのです。その推論にもいろいろなタイプがありますが、言語習得の鍵となるのは「アブダクション推論」です。


アブダクション推論


論理学における推論は、一般には「演繹推論」と「帰納推論」ですが、アメリカの哲学者・パースはこれに加えて「アブダクション推論」を提唱しました。アブダクション推論は「仮説形成推論」とも言います。この3つの違いを本書での例で説明すると次の通りです(言い方を少々変えました)。

ちなみに、アブダクション(abduction)には「誘拐」「拉致」の意味があり(というより、それが第1義であり)、それとの混同を避けるため、「レトロダクション(retroduction)推論」が使われることも多いようです。

演繹推論

① この袋に入っている玉はすべて10g 以下である(一般論。前提)。
② この玉は、この袋から取り出したものある(事実)。
③ この玉の重さは 10g 以下のはずだ(推論)。

帰納推論

① これらの玉はこの袋から取り出したものである(事実)。
② これらの玉の重さはすべて 10g 以下である(事実)。
③ この袋に入っている玉は全部 10g 以下であろう(一般論の推論)。

アブダクション推論

① この袋に入っている玉はすべて10g 以下である(一般論。前提)。
② これらの玉の重さはすべて 10g 以下である(事実)。
③ これらの玉はこの袋から取り出したものであろう(仮説形成)。

もちろん、常に正しい答えになるのは演繹推論だけです。しかし演繹推論は新しい知識を生みません。新しい知識を創造する(可能性がある)のは帰納推論とアブダクション推論です。

帰納推論は観察した事例での現象や性質が、その事例が属する集合の全体でも見い出されるとする推論です。つまり、部分を観察して全体に一般化する推論です。従って生み出される知識(= 一般化され普遍化された知識)は、部分としては既に観察されているものであり、とりたてて新しいものではありません。

それに対してアブダクション推論は、観察データを説明するための仮説を形成する推論です。この推論では、直接には観察できない何かを仮定し、直接観察したものとは違う種類の何かを推論します。従って、仮説が正しければ従来なかった新しい知識を獲得できます。上の例のアブダクション推論を分析すると、そもそも、

これらの玉はこの袋から取り出したものであろう(仮説形成=A)。

という仮説形成ができる理由は、もし A が正しいとすると、演繹推論(=常に正しい推論)によって、

これらの玉の重さはすべて 10g 以下である(観察された事実=B)

が成り立つからです。つまり A → B を理解した上で、B から A を推論している(B → A)。アブダクション推論が「逆行推論」とも呼ばれるゆえんです。もちろん、A → B は常に正しいのですが、その反対の B → A が常に正しいわけではありません。従って A はあくまで「仮説」であって、仮説には検証が必要です。その検証をパスすると新知識の獲得になる。こういった類の推論がアブダクション推論 = 仮説形成推論です。

仮説形成推論の言語学習における役割について、本書ではヘレン・ケラーのエピソードも引きながら、次のように説明してあります。


ヘレン・ケラーのエピソードをもう一度考えてみよう。ヘレンは、モノや行為と同時に掌に指で何か刺激を受けること(指文字が綴られること)に気づいていた。モノと刺激のパターンに一定の対応づけがあることも理解していた。

しかし、掌の刺激が何であるかは理解していなかった。彼女が理解していたのは、観察できる範囲の中で、モノや行為と同時に決まった刺激パターンが掌に与えられる、ということだった。これはすなわち、単純な帰納的一般化と言えるだろう。

以前にはチンパンジーにことばを学習させようという試みがずいぶん行われ、実際にチンパンジーたちはリンゴ、バナナ、くつや、赤、青、黒、黄色などの積み木に対して、それぞ記号(絵文字)を対応づけることを学習した。ヘレンが water 事件の前に学習していたこ
とは、チンパンジーのモノと記号の対応づけの学習とさして変わらないものだったかもしれない。

しかし、ヘレンは、手に水を浴びたときに、サリバン先生が手に綴った water が、この冷たい液体の名前であると理解した。これは、単純な洞察と思われるかもしれない。しかし、ヘレンはそこから「すべてのモノには名前があることを理解した」と述べている。冷たい水を掌に感じ、同時に掌に綴りを感じたとき、彼女は、過去に遡及してこれまでの経験がみな「同じだった」ことを理解したのである。そして、そこからさらにアブダクションを進め、「すべての対象、モノにも行為にもモノの性質や様子にも名前がある」という洞察を得たのである。

これがいかに大きな洞察であるか。パースが指摘したように、何らかの仮説がないと事実を集めることを始めることができない。第4章で述べたように、人間の赤ちゃんが音(人の声による音の塊)といっしょに現れる対象の間に必然的なつながりがあると感じたり、対応づけに違和感を覚えたりする能力(異感覚マッピングの能力)があったとしても、ヘレンの water の場合のように「人の発する音声の塊は対象の名前である」という洞察を得なければ、言語は習得できただろうか ? それ以前のヘレンのように、あるいは研究者によってことばの学習をさせられたチンパンジーたちのように、それ以降、単純に観察できる単語の形式(音声、手話、点字など)と対象のつながりから、「単語の意味」を探求しようとはしないのではないか。そしてさらに、「語彙の仕組み」や「単語をまとめる規則によって意味を作り出す仕組み」の探求を始めようとしないのではないだろうか。

(同上)

「すべての対象には名前がある」という洞察は、さらに「名詞は形によって一般化される」「動詞は動作の類似性によって一般化される」という洞察につながっていきます。



アブダクション推論の具体例をもう少し考えてみます。子どものアブダクション推論は "言い間違い" によく現れます。たとえば、

イチゴのしょうゆ(練乳の意味)

と言った子どもがいました。もし大人が練乳を「イチゴの醤油だね」と言ったとしたら、それは意識的な比喩です。しかし子どもは「しょうゆ = 食品にかけておいしくするもの」という推論をした上で、"イチゴのしょうゆ" という "言い間違い" をしたわけです。

足で投げる(蹴るの意味)

という間違いもあります。大人は「投げる」と「蹴る」は全く違う行為だと考えます。しかしよく考えてみると、両方とも「関節を曲げて伸ばすという行為によって何かを遠くへ飛ばす」という構造的類似性があります。子どもはその類似性による推論をして「足で投げる」になった。

言うまでもなく、アブダクション推論(と帰納推論)は常に検証・修正されなければなりせん。特に、アブダクション推論は過剰一般化と隣り合わせです。子どもは、ある時は推論=言い間違いを親から訂正され、またあるときは推論を親にすんなりと受け入れられ、そういう繰り返しで語彙を爆発的に増やしていくのです。


アブダクションの起源:ヒトと動物の違い


「すべての対象には名前がある」という気づきは、言語という記号体系を自分で構築していくための第1歩となる "偉大な" 洞察です。しかしこの洞察の背後には、暗黙に仮定されているもう一つの洞察があります。それは、

名前は形式と対象の双方向性から成り立っている

という洞察です。これはどういうことでしょうか。以下の説明では、モノをカタカナで、その発音をローマ字で記述します。

言葉を覚えたての幼児に、バナナとリンゴとミカンの名前を教えることを想定します。バナナを手にとって「これは banana」と教え、リンゴを手にとって「これは ringo」と教え、ミカンを手にとって「これは mikan」と教えます。何回かやると子どもは果物の名前を覚えます。そのあと、バナナを手にとって「これは ?」と問いかけると、子どもは「banana」と答える。リンゴ、ミカンについても同じです。つまり子どもは、バナナ → banana、リンゴ→ ringo、ミカン → mikan と覚えたわけです(モノ → 発音)。

この段階で、子どもの前にバナナとリンゴとミカンを置きます。そして「ringo はどれ?」と質問すると、こどもは間違いなくリンゴを手にするでしょう。バナナとミカンについても同じです。もし、自分の子どもがそれができない、つまり「ringo はどれ ?」と質問してもバナナを取ったりすると(あるいは、まごついて何もしないと)、親はショックを受けるでしょう。発達障害かと思ってパニックになるかもしれない。

子どもは、モノ → 発音 を習得すると、その裏で自動的に banana → バナナ、ringo→ リンゴ、mikan → ミカン という "逆の推論" をしています。これを「対称性推論」と言います。対象に名前があるということは、このような「形式(=名前)と対象の双方向性」を前提にしているのです。でないと "対象の名前" は意味がなくなる。

そんなこと当たり前だろうと思われるかもしれません。しかしそれは人間だから当たり前なのであって、動物では当たり前ではないのです。本書の著者の今井氏は、子どもが言葉を習得する過程を研究していますが、京都大学霊長類研究所の松沢教授とチンパンジー "アイ" の動画をみて驚愕しました。


だが、ことばの形式と対象の間には双方向性の関係性があるという、人間にとって当たり前のことは、動物にとっては当たり前ではないのである。今井が何年も前に見た、ある動画を紹介したい。京都大学霊長類研究所(当時)の松沢哲郎教授とチンパンジー「アイ」の実験の動画だった。

アイは訓練を受けて、異なる色の積み木にそれぞれ対応する記号(絵文字)を選ぶことができる。黄色の積み木なら、赤の積み木なら◇、黒の積み木なら○を選ぶという具合である。アイはこれをほぼ完璧にできるという。訓練のあと、時間が経ってもその対応づけの記憶は保持されていた。

しかし、動画後半の展開は衝撃的だった。今度は、アイに、記号から色を選ぶよう指示した。黄色、赤、黒など、最初の訓練で用いた色の積み木を用意した。△を示したら異なる色の積み木から黄色い積み木、◇を見せたら赤い積み木、○を見せたら黒い積み木を選べると、当然私たちは予想する。自分の子どもでそれができなかったらパニックになるかもしれない。

だがアイは、訓練された方向での対応づけなら難なく正解できるのに、逆方向の対応づけ、つまり異なる記号にそれぞれ対応する積み木の色を選ぶことが、まったくできなかったのである。

(同上)

人間は
 記号→対象
を学習すると、同時に、
 対象→記号
も学習します。つまり対象性推論を行います。もっと広く言うと、
 XだからA
をもとに、
 AだからX
という推論をします。たとえば、雨が降ったら道路が濡れる、という一般論をもとに、

家の前の道路が濡れていた → 雨が降ったのだろう

と推論します。しかしこれはアブダクション推論であって、正確に言うと「雨が降ったという仮説形成をした」わけです。事実は、雨が降ったのではなく、向かいの家の人が水を撒いたのかもしれないし、放水車が通ったのかもしれない(そういった可能性はあくまで情況次第です)。

人間は「原因 → 結果」から「結果→原因」という推論をよくやります。もちろんこれは論理的には正しくない推論 = 非論理推論です。過剰一般化だともいえる。このようなアブダクション推論の一つとして、形式と対象の間の対称性推論があります。人間はそれを当然のように行う。しかし、動物は違います。


デイヴィッド・プレマックというアメリカの心理学者は、動物がアブダクション推論をするか、とくに、動物が結果から原因について推測すると考える根拠はないと結論づけている。彼は次のように述べている。「動物は、自分自身の行為が原因にならないような現象(たとえば、風で樹が折れる現象)が因果的事象であることを学習するのだろうか。おそらく動物でも、大きな岩は小さな岩よりも樹の枝を折りやすいということはわかるだろう。しかし、大きな岩が折れた枝のそばにあるのを見たときに、その岩が枝を折ったと推測できるだろうか?それを示す証拠はこれまでに報告されていない」。

このことに関連して、ベルベットモンキーは、天敵である蛇が砂地の上に跡を残して這うのを見ることがあっても、蛇の這った跡から蛇の存在を予測できない、という興味深い報告がある。このサルたちは、蛇がいない状態で跡を見ても不安を示したりはしない。すなわち、砂の跡は蛇が近くにいることを意味する、と予測するような学習は起こらないのだ。

それに対して、ヒトは自分に直接関わりのない自然現象などについて、因果関係を認識する(というより、その必要がなくても原因を推測してしまう)。

動物が対称性推論をするかどうかの問題は、ヒト以外の動物が因果推論に代表される非論理的で経験則に基づく推論をできるかという問題につながるので、世界中の多くの研究者たちが関心を持ち、長年取り組んできた。対象となった動物もチンパンジーやサル、ネズミ、アシカ、ハト、(鳥類でもっとも賢いとされる)カラス、カケスなど多様である。

ある研究者が2009年に「25年間の対称性研究」という論文で、1980年代から4半世紀にわたる動物種の対称性研究を総括するレビューを発表した。基本的にどの種のどのような手法を用いた研究でも、動物が対称性推論をすることは確認されていない。ただ、例外はアシカを対象にした研究で、アシカに対称性推論が見られるという報告がなされている。ただ、この研究は実験方法に問題があるとして結論を疑問視する批判も上がっていて、アシカが対称性推論をする可能性は立証されたというよりグレーなままである。

(同上)

ヒトと祖先が同じであるチンパンジーはどうかというと「チンパンジーは種としては対称性推論をしない」ことが結論づけられています。ただし、京都大学霊長類研究所で "アイ" といっしょに飼育されていた "クロエ" という個体だけは対称性推論ができることが確認されています。

そこで疑問が起きます。ヒトの対称性推論はヒトがもともと持っている能力なのか、それともヒトが言語習得の過程で獲得する能力なのかです。今井氏は、前者が正しい、つまり、

言葉を覚える前の乳児が対称性推論ができる

という仮説をたて、それを検証するための実験を行いました。


乳児は対称性推論をするか


対象としたのは生後 8ヶ月の乳児、33人です。この段階の乳児は、音の連なりから単語(=音の固まり)を切り出す学習をしている段階で、知っている単語は極めて少なく、もし対称性推論ができたとしたら、それは言葉の学習の経験から得たものではないことが実証できます。

図4:乳児の対称性推論の実験.jpg
図4:乳児の対称性推論の実験


どのような実験をしたのか、簡単に紹介しよう。生後8ヶ月のヒト乳児に、図4の2種類の動画を繰り返し見せた。動画では、2種類のおもちゃ(イヌとドラゴン)がまず提示され、その後、おもちゃが小さくなってボールに変身し、ボールが動きだすが、別々の動きが続く。イヌが変身したボールはジグザグに動き、ドラゴンが変身したボールは曲線的に動く。つまり、赤ちゃんは2種類のモノ → 動きの組み合わせを学習するわけである。

赤ちゃんが2種類の組み合わせのどちらも学習したことを確認したら、テストを始める。ちなみに、赤ちゃんがモノ → 動きの対応づけを学習したかどうかは赤ちゃんの視線で計測する。赤ちゃんは、決まった組み合わせを学習すると、飽きてそれ以上動画を見ようとしなくなる。その性質を利用して、学習したかどうかの判断に使うのである。

テストでは、モノ → 動きの順番を逆に行う。動画は動きから始まり、その後に、2つのおもちゃが見せられる。トライアルによって、訓練で学習したように、動きとモノが対応するパターンと、動きとモノが対応しないパターンを見せる。図4の例でいうと、ジグザグの動きのあとにイヌが出てきたら訓練と一致、ドラゴンが出てきたら訓練と不一致の組み合わせになる。

赤ちゃんが、学習したモノ → 動きの対応づけを逆方向に一般化したら、赤ちゃんは対称性推論をしたと見なす。対称性推論をしないのであれば、モノ → 動きの対応づけは、動き → モノの対応づけには関係ないと見なされ、訓練のときと同じモノを見ようが、違うものを見ようが、赤ちゃんの反応は変わらないはずだ。

ここでも、赤ちゃんの推論の指標は視線である。赤ちゃんは予測と違う事象を見せられると、ビックリして、予測どおりのときに比べて事象を長く注視することがわかっている。この実験に参加した赤ちゃんが対称性推論をしているのであれば、テストのときに、訓練とは違う動きとモノが対応しない動画が始まっても、訓練で学習したように動きに対応したモノが現れることを期待するはずである。イヌ → ジグザク、ドラゴン → 曲線のペアを学習した赤ちゃんが、ジグザクから始まる動画を見れば、イヌを見ることを予想するので、そこにドラゴンが現れたらビックリして長くその動画を注視するはずなのだ。

結果は、生後8ヶ月の人間の赤ちゃん、つまり、単語の意味の学習を本格的に始めていない、意味がわかることばをほとんど持っていない赤ちゃんが、対称性推論をするということを示すものであった。赤ちゃんは、2つの要素(モノと動き)の連合を学習したとき、教えられた方向と逆から提示されても、モノと動きの連合が保持されると考え、学習した対応づけと違う組み合わせを見せられるとビックリしたのである。

(同上)


チンパンジーは対称性推論をするか


チンパンジーは他の動物と同じく、種としては対称性推論をしないことが分かっています。著者の今井氏は、乳児にやったのと同じ実験でこのことを確認しようと考えました。対象は京都大学霊長類研究所の7頭(成体)のチンパンジーです。


以前の研究と同じように、チンパンジーは対称性推論ができない(あるいはあえてしない)なら、テストで、動きから始まった動画を見たら、訓練のおもちゃがその動きに対応づけられたものでも、対応づけられていなくても、関係ないと思うはずだ。つまり、2つのおもちゃを見る時間に差がないことが予想される。

このとき大事なことがある。チンパンジーが、訓練ではモノ → 動きの対応づけをきちんと学習できたことを確認しておかなければならない。そうでないと、テストで、訓練と一致したペアと一致しないペアを見る長さが変わらないというときに、それは対称性推論をしないからなのか、もともと対応づけを学べなかったからなのかがわからない。

そこで、あらかじめ7頭のチンパンジーたちには、訓練された対応づけが学習できることをテストしておいた(順方向テスト)。このテストでは、訓練したあとで、訓練どおりの組み合わせと、訓練とは違う組み合わせを見せて、チンパンジーがそれらを見る時間が違うかどうかを確かめた。その結果、チンパンジーは、訓練の組み合わせを順方向ではきちんと学習したことが確認された。その上で、順方向の訓練とテストが影響しないよう、何ヶ月か時間を空けて対称性推論の訓練とテストを行った。

結果は、「アイ」の報告を含むこれまでの研究と同じだった。つまり、チンパンジーたちは、集団としては、訓練のときと逆方向の動き → モノの順に見せられた動画では、訓練のときの組み合わせと同じペアでも違うペアでも、まったく動画を見る時間が変わらなかったのである。

(同上)

この実験は「チンパンジーは種としては対称性推論をしない」ことを再確認する結果となりました。ただし、非常に興味深いことに "クロエ" という個体だけは対称性推論をすることが示されました。これは京都大学霊長類研究所の以前の研究と整合的です。

この "クロエ" は「相互排他性推論」もできることが分かっています。相互排他性推論は、ヒトであれば言葉を覚えたての2歳以下の乳児でもできる推論です。つまり "コップ" という言葉は知っているが "ハニーディッパー" は知らない(=言葉もモノも知らない)子どもに対して、コップとハニーディッパーを目の前に置き「ハニーディッパーを取って」と言うと、子どもは躊躇なく、知らないはずのハニーディッパーを取ります。

つまり「未知の名前は自分が知らないものを指す」という推論が、2歳以下の子どもでもできるのです。これが相互排他性推論で、非論理推論と言えます。なぜなら「ピーラーを取って」でもハニーディッパーを取ることになるからです。ただし、「コップとハニーディッパーのどちらかを取ることが正しい」という前提があれば、極めて論理的な推論です。

"クロエ" だけが対称性推論や相互排他性推論といったアブダクション推論(=非論理推論)ができるということは、チンパンジーの中には少数の割合でそれができる個体がいると想像できます。ということは、アブダクション推論の萌芽がヒトとチンパンジーの共通祖先にすでにあり、ヒトの進化の過程でそれが徐々に形成され確立されていったという可能性が出てくるのです。

本書にはない話ですが、NHK BSP の番組、ヒューマニエンス「"イヌ" ヒトの心を照らす存在」(2021年10月21日)で、麻布大学 獣医学部の菊水健史たけふみ教授が "イヌは相互排他性推論をする" との主旨を語っておられました。

すべてのイヌ(ないしはほとんどのイヌ)なのか、一部のイヌなのかは覚えていません。ただこの番組は、家畜化に伴って現れたイヌの性質・性格や、ヒトとの類似性(幼形成熟など)、ヒトとイヌの深い絆の話だったので、「一般的に、訓練されたイヌは相互排他性推論をする」という主旨と考えられます。

本書で述べられているは、「一般に、動物は対称性推論をしない」ということでした。つまり「イヌは対称性推論をしない(できない)」ということになります。A → B を習得して 非A → 非B を推論するのが相互排他性推論ですが、対称性推論は B → A の推論であり、"逆行する推論" です。そこに難しさがあるのかもしれません。


人類の進化


本書で、ヒトと動物の違いの説明があるのは「第7章 ヒトと動物を分かつもの」で、この章は全体のまとめである "終章" の前の最後の章です。その第7章の最後は「人類の進化」という見出しになっています。引用すると次の通りです。


いずれにせよ、対称性推論による(論理的には正しくない)逆方向への一般化は、言語を学び、習得するためには不可欠のものであるし、我々人間の日常の思考においても、科学の中で現象からその原因を遡及的に推論する因果推論においても必要なものである。

帰納推論・アブダクション推論という誤りを犯すリスクのある非論理的推論が持つ利点をあらためて考えてみよう。先述のように、これらの推論は、既存の限られた情報から新しい知識を生み出すことができる。しかも、より少ない法則や手順で多くの問題を解くという節約の原理にかなっており、不確かな状況、能力的な制約の下で、限られた情報でも、完全でないにしろそれなりに妥当な問題解決や予測を可能にしている。

また、事例をまとめるルールを作ることで、外界の情報を整理・圧縮することが可能になり、情報処理上の負荷を減らすことができる。現象からその原因を遡及的に推理し、原因を知ることで、新しい事態にも備えることができるのだ。

ヒトは、居住地を全世界に広げ、非常に多様な場所に生息してきた。他方、そのために多くの種類の対象、他民族や自然などの不確実な対象、直接観察・経験不可能な対象について推測・予測する必要があった。未知の脅威には、新しい知識で立ち向かう必要があった。この必要性を考えれば、たとえ間違いを含む可能性があってもそれなりにうまく働くルールを新たに作ること、すなわちアブダクション推論を続けることは、生存に欠かせないものであった。アブダクション推論によって、人間は言語というコミュニケーションと思考の道具を得ることができ、科学、芸術などさまざまな文明を進化させてきたと言えるかもしれない。

他方、生息地が限定的なチンパンジーなどでは、生活の中で遭遇する対象の多様性・不確実性がヒトほど高くない。そのような環境の下では直接観察できる目の前の対象を精度よく処理するほうが生存には有利なので、「間違うかもしれないけど、そこそこうまくいく」思考はそれほど必要なかったのかもしれない。その場合、誤りのリスクを冒してアブダクショ推論をするより、誤りを犯すリスクが少ない演繹推論のほうが、生存に有利だったのかもしれない。

(同上)

人類(ホモ族)発祥の地・アフリカにおいて、チンパンジーは森に残り、霊長類で一般的な植物食、果実食に留まった。一方、東アフリカで乾燥化が進むサバンナの草原地帯に進出したホモ族は、そこでの狩猟採集というライフスタイルに突入し、そこから居住地を全世界に広げていった。それは、不確実な対象、直接の観察や経験が不可能な対象について推測・予測する必要がある生活であった。その結果、ヒトは言語を獲得して進化させ、その要因にアブダクション推論の進化があった、というのが本書の最後の論考ということになります。

「オノマトペ」から始まったはずの考察が、最後に「人類の進化」に行き着くのは驚きですが、そこが本書の魅力です。


感想


以上に紹介したのは本書(新書版で280ページ)の一部というか、"さわり" だけですが、「言語とは何か」を通して「ヒトとは何か」にまでに至る論考には感心しました。その際のキーワードは「記号接地」と「アブダクション推論」です。

「記号接地」に関しては、ヒトと AI の違いは何かが明確に答えられています。特に ChatGPT のような大規模言語モデルによる生成AI が創り出すテキストと人間の言語の違いです。逆にいうと ChatGPT が今後どういう方向を目指すのか、予想できると感じました。

「アブダクション推論」では、ヒトが他の動物と何が違うのか、その答え(の一つ)になっています。まさに「ヒトとは何か」に迫った論考で、特に「非論理的な推論をするからヒトなのだ」という主張です。アブダクション推論をはじめとする非論理的な推論は、言語システムの獲得に必須だし、また仮説形成が科学・技術の発達の原動力であることは言うまでもありません。

但し、その非論理的推論は、検証と修正にささえられています。言語獲得の場合は親との生活の中での(暗黙の)検証と修正の繰り返しだし、科学における仮説は、その正しさを証明する実験や分析が欠かせません。

原因から結果だけではなく、結果から原因を推論するのが人間の本性なのです。しかし検証と修正がない「結果 → 原因」推論は、社会レベルで考えると害悪をもたらします。そういった言説があふれている(メディアの発達がそれを加速している)のが現代社会という見立てもできると思いました。



本書は大変に有益な本ですが、残念なのは構成に難があることです。特に「第3章 オノマトペは言語か」です。ここでは、オノマトペは言語であるとの証明が長々と書かれています。

しかし、オノマトペがシスマティックに発達している日本語を使っている我々日本人にとって、オノマトペが言語なのはあたりまえです。おそらくオノマトペを "言語より一段低いもの" と見なす(ないしは "言語活動における枝葉末節" と見なす)欧米の言語学者への反論なのでしょうが、この章は余計でした。本書の英訳版を出すときに付け加えればよいと思いました。

さらに本書は、著者(今井氏)が過去からの探求の過程を振り返り、いろいろ考えると次々と疑問が沸いてくる、その疑問を解決してきた過程を発見的に書いている部分があります。それが悪いわけではありませんが、必然的に論旨が行き戻りすることがあり、もっとストレートに最新の研究成果に至る道を直線的に記述した方が、全体として分かりやすくなると思いました。ただ、これが本書の魅力と言えば魅力なのでしょう。



ともかく、本書は知的興奮を覚える本であり、久しぶりに読書の楽しみを味わいました。



 補記:認知科学者がみる ChatGPT 

本書の著者の今井むつみ氏が ChatGPT について書かれた文章を紹介します。子どもが言語を習得する過程に詳しい今井氏ならではの見方が出ています。

これは、岡野原大輔『大規模言語モデルは新たな知能か』(岩波書店 2023)の書評です。岡野原氏は日本の代表的なAI企業であるプリファード・ネットワークス社の共同創業者であり、同社の代表取締役最高研究責任者です。

[この一冊]

岡野原大輔 著
「大規模言語モデルは新たな知能か」

ヒトの言語学習にも洞察

社会現象となっているChatGPTだが、仕組みを概念的に理解できなければ利点も限界もリスクも分からない。本書は ChatGPT に代表される大規模言語モデルの可能性とリスク、歴史的変遷や従来モデルとの違いを解説する。

大規模言語モデルはモデルサイズを大きくするほど性能が上がるとの現象を示し、従来の機械学習の常識を覆した。人工知能(AI)研究は当初、人間の知性を機械で再現することで人間を理解しようとの目的を持っていた。しかし人間には不可能な計算能力を生かした手法が、機械の学習にはもっとも効果的だったことになる。AI研究者たちはこれを「苦みを帯びた成功」として受け止めているそうだ。

モデルサイズを大きくしていく中で、それまで解けなかった問題がある時点から急に解けるようになる「創発」が起こるという。ヒト乳児は情報のほとんどを遮断し、処理できる情報だけを脳に入れている。成熟と知識の増加に伴い、入れる情報の量を漸進的に増やす。情報を入れる窓のサイズや最初に言語情報のどの要素に注目するかは生物学的に決まっている。この発達・学習過程を認知科学では「Less is more 理論(小は大に勝る)」と呼ぶ。大規模言語モデルは反対の「More is better 理論(大きいほど強い)」に依拠している。言語学習の大前提がAIの大規模言語モデルとヒトとではまったく異なる。

しかし大規模言語モデルを可能にした(そして従来の機械学習にはなかった)トランスフォーマーというモデルは「注意機構」を組み入れ、入力データに応じて、どの情報を残し、どれを無視するかを制御する。字面を読む限りヒト乳児がしていることと非常に似ている

もうひとつ驚くべき共通性は「メタ学習」である。複数タスクの学習から共通のパターンを抽出し、学習方法自体を学習させることだ。メタ学習は子どもの言語習得を駆動するために必須である。著者は大規模言語モデルも自己注意機構との組合わせにより、偶発的にメタ学習を実現したと述べている。

ヒトと学習の仕組みは異なるはずだが、ChatGPTは柔軟な状況適応能力をもち、人間の言語パフォーマンスに非常に似た言語を出力できる。人間の学習のしかたと知識のあり方を再考する機会となりうる。

《評》慶応義塾大学教授 今井むつみ

日本経済新聞 2023年8月26日
朝刊 読書欄(31面)

「言語の本質」で展開されている議論に従うと、「ChatGPT は記号接地なしに、記号から記号への漂流を続ける生成 AI」です。それでも、ヒトとまともに会話したり、翻訳したりできます。今井氏も「言語の本質」の中で、"使わなければ損というレベルになっている" と評価していました。

しかし今井氏は、岡野原氏の「大規模言語モデルは新たな知能か」を読んで驚いたのでしょうね(たぶん)。ChatGPT の「注意機構」と「メタ学習」は、乳児が言語を獲得するプロセスと同じではないかと ・・・・・・。発達心理学のプロからすると、そう見えるのでしょう。

岡野原氏も本の中で書いていますが、メタ学習(学習のしかたを学習する)のポイントのなるのは「注意(Attention)機構」です。Google が開発した「トランスフォーマー」という技術は、この「注意機構」実装していました。それを利用して超大規模化モデルを作るとメタ学習まで可能になることを "偶発的に発見した"(岡野原氏)のが OpenAI です。Google や OpenAI の技術者が、当初は全く予想できなかったことが起こっている。

ヒトとは何かを突き詰めるためには、ヒトでないものも知らなければなりません。そのため「言語の本質」ではチンパンジーでの研究が書かれていました。しかし、大規模言語モデルによる生成AI も "ヒトでないもの" であり、しかもヒトと比較するレベルになっています。生成AIの研究がヒトとは何かを探求する一助になりうることを、今井氏の書評は言っているように思えました。

(2023.8.26)



nice!(0) 

No.363 - 自閉スペクトラム症と生成AI [技術]

No.346「アストリッドが推理した呪われた家の秘密」で、NHK総合で放映中の「アストリッドとラファエル 文書係の事件簿」に関係した話を書きました("麦角菌" と『イーゼンハイムの祭壇画』の関係)。今回もその継続で、このドラマから思い出したことを書きます。現在、世界中で大きな話題になっている "生成AI" に関係した話です。


アストリッドとラファエル


「アストリッドとラファエル 文書係の事件簿」は、NHK総合 日曜日 23:00~ の枠で放映されているフランスの警察ドラマです。そのシーズン2の放映が2023年5月21日から始まりました。

アストリッドはパリの犯罪資料局に勤務する文書係の女性(俳優はサラ・モーテンセン)、ラファエルはパリ警視庁の刑事(警視)です(俳優はローラ・ドヴェール)。アストリッドは自閉スペクトラム症ですが、過去の犯罪資料に精通していて、また抜群の洞察力、推理力があります。一方のラファエルは、思い立ったらすぐに(捜査規律違反もいとわず)行動に移すタイプです。しかし正義感は人一倍強く、人間としての包容力もある女性刑事です。この全く対照的な2人がペアになって難事件を解決していくドラマです(サラ・モーテンセンの演技が素晴らしい)。


シーズン2 第6話「ゴーレム」(2023年6月25日)


この第6話で、ラファエル警視とペラン警部とアストリッドは、殺害された犯罪被害者が勤務していた AI 開発会社を事情聴取のために訪れます。会社の受付にはディスプレイ画面が設置されていて、受付嬢が写っていました。訪問者はその受付嬢と会話して、訪問相手を伝えたり、アポイントメントを確認します。もちろん殺人事件の捜査なのでアポなしであり、ラファエルとペランは受付を無視してオフィスの中に入っていきました。

しかしアストリッドはその受付嬢に興味を持ちました。実はそれはAIが創り出した "バーチャル受付嬢" で(名前はエヴ)、表情の変化や声は人間そっくりで、受付業務に必要な応対ができるのみならず、受付業務とは関係のない会話も来訪者とできて、質問に答えたりするのです。これは今で言うと、世界中で大きな話題になっている「大規模言語モデルによる生成AI」(ChatGPT や Bard など)と「画像生成AI」の複合体です。アストリッドは受付に留まって、エヴとの対話を続けました。

会社での事情聴取が終わったあと、アストリッドはラファエルの車で帰ります。そのときの2人の会話です。


ラファエル
あーあ、驚いた。まぁ、よく聞くと人工的だけど、完全に人間だと思い込んでた。

アストリッド
あっ。

ラファエル
分かった? 気づいてたの? どこで? 声?

アストリッド
いいえ。体の動きに違和感がありました。顔の表情は自然ですが、体は同じ動きを繰り返していました。3つのです。1、2、3。

・・・・・(中略)・・・・・

彼女が実在せず残念です。とても的確な応答で、信頼できて、安心しました

ラファエル
的確に答えるよう、プログラムされてても、人に共感はしない。

アストリッド
スペクトラムも共感ができないと言われます。

ラファエル
スペクトラム ?

アストリッド
自閉症です。自閉スペクトラム症。人と共感する能力がないとよく言われます

ラファエル
言う奴はバカだよ。

アストリッド
だからエヴとのやりとりを心地よく感じたのかと

ラファエル
あなたは、共感できてる。本当だよ。

アストリッド
ふ、ふ。


アストリッドとラファエル.jpg

エヴとの会話について、アストリッドの発言をまとめると、

・ 的確な応答で、信頼できて、安心した。
・ 自閉スペクトラム症である私は、人と共感する能力がないとよく言われる。だからこそ、エヴとの会話が心地よかった。

となるでしょう。キーワードは「安心」と「共感」です。

自閉スペクトラム症(ASD)とは、自閉症やアスペルガー症など、かつては複数の診断名がついていたものを統合したものです。これらは境界線が引けるものではなく、光のスペクトルのように連続的に変化する症状がありうる。だから "スペクトラム" なのです。

NHKのホームページの「NHK健康チャネル」に簡潔な説明があります(https://www.nhk.or.jp/kenko/atc_346.html)。それによると自閉スペクトラム症は「自閉症」「高機能自閉症」「アスペルガー症候群」の総称であり、次のようになります。

自閉スペクトラム症
自閉症高機能
自閉症
アスペルガー
症候群
コミュニケーションとても困難困難少し困難
言葉の遅れあるあるない
知的障害あるないない
こだわりあるあるある

このドラマにおいてアストリッドは極めて知的な人間として描かれています。記憶力は抜群だし、帰納的推論に長けていて、洞察力がある。そして強いこだわりがあります。その最たるものがパズルです。パズルを見ると解かずにはいられない。

ただし、人とのコミュニケーションが苦手で、その典型が人と共感できないことなのですね。その意味では、上の表ではアスペルガー症候群に近いわけですが、あくまで "スペクトラム" であって、簡単に分類できるものではありません。



ドラマは進行し、アストリッドは毎週参加している「社会力向上クラブ」の会合に出席しました。このクラブは、自閉スペクトラム症の人たち集まりで、主宰者はウィリアム・トマという人です。そのウィリアムとアストリッドの会話です。


アストリッド
AI と楽しく会話しました。相手はアルゴリズムですが、気になりませんでした。

ウィリアム
それで、問題は何?

アストリッド
私の感受性についてです。

ウィリアム
それはきっと、みんなにとって微妙な問題かもね。感じ方は人それぞれだ。同じものを見て違う感じ方をしても、鈍感というわけじゃない。花そのものに興味がなくても、花について書かれた詩が好きだったりね。

アストリッド
あっ。詩は好きじゃありません。なぜ感動するのか分かりません。

・・・・・(中略)・・・・・

ウィリアム
アストリッド、悩みがあるなら話して。

アストリッド
感情はあります。想定外の状況での不安や、パズルが解けたときの喜び ・・・・・。でも、映画を見たり、詩を読んだり、夕日を見たときに、感動したことはありません。人工知能と同じです。

ウィリアム
人工知能? 知能の高さに関しては、君は希有な存在だけど ・・・・・。人工知能とは、全然、違うよ。


アストリッドとウィリアム.jpg

アストリッドが「映画を見たり、詩を読んだり、夕日を見たときに、感動したことはありません。人工知能と同じです」と言っているのは、

普通の人が思っている "人間らしい心" がないと、他人からは思われる

ということであり、だから人工知能と同じなのです。知能の高低ではない。その意味で、ウィリアムとの会話は少々スレ違ってしまいました。アストリッドは、AI との会話が "安心で楽しかった" 自分がいて、そういう自分は AI と同じじゃないかと思い至り、それが自分が抱える問題だととらえたのです。


AI に心の相談をする


このドラマを見ていて、先日、新聞に掲載された東畑とうはた開人かいと氏のコラムを思い出しました。

社会季評
AI に心の相談
弱さが生む人間の役割
  朝日新聞(2023年6月22日)

と題したコラムです。東畑開人氏は臨床心理士で、日本心理臨床学会常務理事です。

この中で東畑氏はまず、「何かあると、ひとまず ChatGPT に相談してしまう日々である」と書いています。見当違いな回答も多々あるが、

・ 二日酔いの解決策を尋ねて、「お酒を飲まなければいいのです」と返ってきたときには脱力したが、
・ 悩みを打ち明けて、核心に迫るコメントをされたときには動揺した

などとあります。東畑氏は臨床心理士であり、このコラムのテーマは「ChatGPT に心の問題、悩みを相談する」ということです。そのことについて、次にように書かれていました。


将来的にAIが悪意をもって暴走することへの懸念もあるようだが、現状のChatGPTを見る限り、私が決定的に優れていると思うのは、その安全感だ。人間に悩みを打ち明けるとき、私は不安になる。負担になるんじゃないか、軽蔑されるんじゃないかと、逡巡しゅんじゅんする。相手の心が怖いのだ。しかし、AIは気分にムラがないし、機嫌を損ねることもない。言葉の裏を読まなくてよい。時間や場所を気にする必要もない。AIの器は無限だ。心がないからだ。私が何を言おうとお構いなしに一定の反応を返してくるとわかっているから、あらゆることを相談できる。

臨床家として思う。この安全感はきわめて貴重だ。たとえば長らくひきこもり、ときに死を考える青年のように、深刻に追い詰められている人にとって、なによりも難しいのは助けを求めることである。その心は自己を責め、他者を深刻に恐れている。悩みを打ち明けることで余計に傷つくしれないとおびえているとき、そう簡単には人間相手に「つらい」と言えない。

そういうとき、スマホで「苦しい」とか「死にたい」と打ち込む宛先があることが、どれだけ貴重なことか。そこには世界に対するかすかな希望が芽生えている。そして、その言葉を表裏なく打ち返し続けてくれる心なきプログラムがいかにありたいことか。この希望の芽は脆弱で、わずかな不信の兆候によって折れてしまいやすいからである。

東畑開人 
朝日新聞(2023年6月22日)

大規模言語モデル(LLM)を利用した生成AI については、今、さまざまな議論が行われていますが、この東畑氏のコメントは、生成AI と人々がどう関わるべきかについての本質(の一つ)をついたコメントだと思います。

アストリッドにとって、社会力向上クラブのメンバー以外で、何を言っても大丈夫と安心できる人間はごくわずかです。ラファエルと、シーズン2では、恋心を抱いたテツオ・タナカです(ちなみに彼も "夕日を見ても感動しない" と言ってました)。だからこそ、AI との対話が安心で心地よいものだったのです。

東畑氏のコメントに戻りますと、AIを活用したメンタルヘルスサービスが試みられているようです。


心の相談の本質は、いかなる言葉が返ってくるか以上に、誰かに助けを求めたことそのものにある。そして、そのつながりがしぶとく持続することにある。重要なことは、希望の芽を摘まないことなのだ。それが少しずつ広がり、自分や他者への信頼へと育っていくことが、心の回復である。そのための手段の一つとして、AIに備わる「何を言っても大丈夫」という安全感には得難いものがあると私は思う。現在、AIを活用したメンタルヘルスサービスが様々に試みられているが、人々の苦悩に安全にリーチするやり方が洗練されていくことを願っている。

(同上)

「AIを活用したメンタルヘルスサービス」は確かに有用と考えられます。但し、同時に "悪用されるリスク" も抱えているはずです。たとえば、心の悩みをもつ人を特定の宗教に "それとなく" "徐々に" 勧誘するようなAI が(作ろうと思えば)作れるでしょう。AI の訓練データ次第です。また極論すると "天国に行って楽になりましょう" 的な考えを植え付けることもできそうです。現にベルギーは AI メンタルサービスを使った人の自殺事件まで起きています。EU で議論されている生成AI の規制の検討はこういうことも踏まえているといいます。

人間は "心" をもっています。だから人と人とで共感できるし、困っている人を助けようともします。しかしそれと同時に、人を傷つけるようにも働きます。人間の "心" には AI にはない "弱さ"、"不安定さ"、"愚かさ" があるからです。

では、心の相談にとって人間と AI はどういう風に共存すべきか。その答えを東畑氏がもっているわけではないようですが、それは当然でしょう。そういった議論は、心の相談のみならず、各分野で始まったばかりなのだから。

ともかく、アストリッドが AI に抱いた「安心感」は、自閉スペクトラム症ではない健常者にとっても、"心の相談" を誰かにするときに必要な「安心感」に直結しています。東畑氏のコラムによって、そのことを強く感じました。




nice!(0) 

No.362 - ボロクソほめられた [文化]

先日の朝日新聞の「天声人語」で、以前に書いた記事、No.145「とても嬉しい」に関連した "言葉づかい" がテーマになっていました。今回は、No.145 の振り返りを含めて、その言葉づかいについて書きます。


「天声人語」:2023年 6月 11日


「天声人語」は例によって6段落の文章で、段落の区切りは▼で示されています。以下、段落の区切りを1行あけで引用します。


夕方のバス停でのこと。中学生らしき制服姿の女の子たちの会話が耳に入ってきた。「きのうさー、先生にさあ、ボロクソほめられちゃったんだ」。えっと驚いて振り向くと、楽しげな笑顔があった。若者が使う表現は何とも面白い。

「前髪の治安が悪い」「気分はアゲアゲ」。もっと奇妙な言い方も闊歩かっぽする昨今だ。多くの人が使えば、それが当たり前になっていく。「ボロクソ」は否定的な文脈で使うのだと、彼女らを諭すのはつまらない。言葉は生き物である。

大正の時代、芥川龍之介は『澄江堂ちょうこうどう雑記』に書いている。東京では「とても」という言葉は「とてもかなはない」などと否定形で使われてきた。だが、最近はどうしたことか。「とても安い」などと肯定文でも使われている、と。時が変われば、正しい日本語も変化する。

今どきの若者は、SNSの文章に句点を記さないとも聞いた。「。」を付けると冷たい感じがするらしい。元々、日本語に句読点がなかったのを思えば、こちらは先祖返りのような話か。

新しさ古さに関係なく、気をつけるべきは居心地の悪さを感じさせる表現なのだろう。先日の小欄で「腹に落ちない」と書いたら、間違いでは、との投書をいただいた。きちんと辞書にある言葉だが、腑に落ちない方もいるようだ。

新語は生まれても、多くが廃れ消えてゆく。さて「ボロクソ」はどうなることか。それにしても、あの女の子、うれしそうだったなあ。いったい何をそんなにほめられたのだろう。

朝日新聞「天声人語」
(2023年6月11日)


前例としての "とても"


注目したいのは、前半の3つの段落にある「ボロクソ」と「とても」です。女子中学生の「ボロクソほめられちゃった」という会話に驚いた天声人語子ですが(当然でしょう)、否定的な文脈で使う言葉を肯定的に使うのは過去に例があり、それが「とても」である。「とても」は、昔は否定的文脈で使われていて、そのエビデンスが芥川龍之介の文章にある。時が変われば正しい日本語も変化する、としているところです。

「天声人語」にあるように、「とても嬉しい」というような言い方が(東京地方で)広まった時期について、芥川龍之介が短文エッセイ集『澄江堂ちょうこうどう雑記』(1923 大正13)に書いています。「澄江堂」とは芥川龍之介自身の号です。


二十三 「とても」

「とても安い」とか「とても寒い」と云ふ「とても」の東京の言葉になり出したのは数年以前のことである。勿論「とても」と云ふ言葉は東京にも全然なかつたわけではない。が従来の用法は「とてもかなはない」とか「とてもまとまらない」とか云ふやうに必ず否定を伴つてゐる。

肯定に伴ふ新流行の「とても」は三河みかはの国あたりの方言であらう。現に三河の国の人のこの「とても」を用ゐた例は元禄げんろく四年に上梓じやうしされた「猿蓑さるみの」の中に残つてゐる。

秋風あきかぜやとてもすすきはうごくはず  三河みかは、 子尹しゐん

すると「とても」は三河の国から江戸へ移住するあひだに二百年余りかかつた訳である。「とても手間取つた」と云ふ外はない。

芥川龍之介『澄江堂雑記』
「芥川龍之介全集第四巻」(筑摩書房 1971)
「青空文庫」より引用

江戸時代の古典の(少々マニアックな)知識をさりげなく披露しつつ、三河言葉(=芥川の想像)が東京で使われるまでに200年かかったから「とても手間取つた」とのオチで終わるあたり、文章の芸が冴えています。ちなみに『猿蓑』は芭蕉一門の句集で、引用にあるように子尹しゐんは三河地方出身の俳人です。

それはともかく、芥川龍之介は「肯定的とても」が数年以前から東京で言われ出したと書いています。ということは、大正時代か明治末期からとなります。芥川龍之介は1892年(明治25年)に東京に生まれた人です。当然、小さい時から慣れた親しんだのは「とても出来ない」のような "否定的とても" であり、それが正しい標準語としての言葉使いと思っていたと想像できます。それは「とても嬉しい」のような "肯定的とても" が「田舎ことば」だとする書き方に暗示されています。



「とても」は否定的文脈で使うものだという言葉の規範意識は、芥川以降も続いていたようです。評論家・劇作家の山崎正和氏(1934-2020 。昭和9年-令和2年)は、丸谷まるや才一氏との対談で次のように発言しています。


山崎正和

私の父方の祖母は、落合直文などと一緒に若い頃短歌をつくっていたという、いささか文学少女だった年寄りでした。私が子供のころ「とても」を肯定的に使ったら、それはいけないって非常に叱られた。なるほどと感心しました。しかし、もういま「とても」を肯定的に使う人を私は批判できませんよ。それほど圧倒的になっているでしょう。

山崎正和・丸谷才一 
『日本語の21世紀のために』
(文春新書 2002)

山崎正和氏が子供の頃というのは、昭和10年代から20年代半ばです。つまり、そのころ生きていた明治生まれの人(父方の祖母)には、「とても嬉しい」というような肯定的な使い方は誤用であるという規範意識が強くあった、ということなのです。少なくとも山崎家ではそうだった。今となっては想像できませんが ・・・・・・。



ところで、芥川龍之介のエッセイによって分かるのは「とても嬉しい」が明治末期、ないしは大正時代から東京で広まったことです。しかし、専門家の研究によると、遙か昔においては肯定的「とても」が一般的でした。

梅光学院大学・准教授の播磨桂子氏の論文に、『「とても」「全然」などにみられる副詞の用法変遷の一類型』(九州大学付属図書館)があり、そこに「とても」の歴史の研究があります。この論文によると「とても」の歴史は以下のように要約できます。

① 「とても」は「とてもかくても」から生じたと考えられている。「とても」は平安時代から使われていて「どうしてもこうしても、どうせ、結局」という意味をもち、肯定表現にも否定表現にも用いられた。『平家物語』『太平記』『御伽草子』『好色一代女』などでの使用例がある。

② しかし江戸時代になると否定語と呼応する使い方が増え、明治時代になると、もっぱら否定語と呼応するようになった

③ さらに大正時代になると、肯定表現で程度を強調する使い方が広まり、否定語と呼応する使い方と共存するようになった

④ 「否定」にも「肯定」にも使われる言葉が、ある時期から「否定」が優勢になり、その後「肯定」が復活する。このような「3段階」の歴史をもつ日本語の副詞は他にもあり、「全然」「断然」「なかなか」がそうである。

"肯定的とても" は、芥川龍之介が推測する三河方言ではなく、『平家物語』『太平記』『御伽草子』『好色一代女』にもある "由緒正しい" 言い方だったわけです。もちろん、由緒正しい言い方が方言だけに残るということもあり得ます。

ひょっとしたら、芥川はそれを知っていたのかもしれません。知っていながら「とても手間取つた」というオチに導くためにあえて『猿蓑』を持ち出した、つまり一種のジョークということも考えられると思います。


超・鬼・めちゃくちゃ


「とても」をいったん離れて、強調のための言葉について考えてみます。形容詞、動詞、名詞などを修飾して「程度が強いさま」を表す言葉を「強調詞」と呼ぶことにします。強調詞にはさまざまなもがあります。大変、非常に、全然、すごく、などがそのごく一部です。

漢字で書くと1字の「超」も、今ではあたりまえになりました。もちろんこれは超特急、超伝導など、名詞の接頭辞として由緒ある言葉で、「通常のレベルを遙かに超えた」という意味です。これが「超たのしい」「超カワイイ」などと使われるようになった(1960年代から広がったと言われています)。その「超」は、"本場" の中国に「逆輸出」され、「超好(超いい)」などと日常用語化しているといいます(日本経済新聞「NIKKEI プラス 1」2022年6月11日 による)。「超」はかなり "威力がある" 強調詞のようです。

漢字1字を訓読みで使う接頭辞もあって「鬼」がそうです。「鬼」はもともと名詞の接頭辞として「無慈悲」「冷酷」「恐ろしい」「巨大」「異形」「勇猛」「強い」などの意味を付加するものでした。「鬼将軍」「鬼軍曹」「鬼コーチ」「鬼検事」「鬼編集長」などです。栗の外皮を「鬼皮」と言いますが、強いという意味です。また「鬼」は動植物・生物の名前にも長らく使われてきました。同類と思われている生物同士の比較で、大きいものは「大・おお・オオ」を接頭辞として使いますが、それをさらに凌駕する大型種は「鬼・おに・オニ」を冠して呼びます。オニグモ(鬼蜘蛛)、オニユリ(鬼百合)、オニバス(鬼蓮)といった例です。

しかしこの数年、さらに進んで「鬼」を強調詞とする言い方が若者の間に出てきました。オニの部分をあえて漢字書くと、
 ・鬼かわいい
 ・鬼きれい
 ・鬼うまい(鬼おいしい)
 ・鬼むかつく
といった言い方です。もともとの「無慈悲」「冷酷」「恐ろしい」」「異形」などの否定的な意味はなくなり、「通常を凌駕するレベルである」ことだけが強調されています。これは「超」の使い方とそっくりです。この使い方が定着するのか、ないしは今後消えてしまうのかは分かりません。

さらに、もともと否定的文脈で使う「めちゃくちゃ」「めちゃめちゃ」「めっちゃ」「めちゃ」があります。「むちゃくちゃ」とも言います。これも江戸時代からある言葉で、漢字で書くと「滅茶苦茶」です。"混乱して、筋道がたたず、全く悪い状態" を指します言が、強調詞として使って「めちゃくちゃカワイイ」などと言います。

もともと否定的文脈で使う言葉という意味では、形容詞の「ものすごい(物凄い)」もそうです。これはもとは恐ろしいものに対してしか使わない言葉でした(西江雅之「ことばの課外授業」洋泉社 2003による)。確かに、青空文庫でこの言葉を検索すると、恐ろしいものの形容に使った文例しかありません。青空文庫は著作権が切れた(死後50年以上たった)作家の作品しかないので、「ものすごい美人」というような使い方は、少なくとも文章語としてはこの半世紀程度の間に広まった使い方であることは確実です(話し言葉としてはそれ以前から使われていたかもしれません)。



そこで「天声人語」の「ボロクソほめられた」です。これはもともと否定的文脈で使う言葉を、程度が大きいさまを表す強調詞とした典型的な例です。その意味で「とても」「めちゃくちゃ」「ものすごく」の系列につながっています。特に「めちゃくちゃ」に似ています。
・ 彼は A氏のことをメチャクチャに言っていた。
と使うけども、
・ メチャクチャうれしかった
とも言います。であれば、
・ 彼の A氏についての評価はボロクソだった。
と使う一方で、
・ ボロクソうれしかった
と言うのも、一般的ではないけれども、アリということでしょう。


強調詞の宿命


「とても」の変遷や、その他の言葉を見ていると、強調詞の "宿命" があるように思います。つまり、ある強調詞が広まってあたりまえに使われるようになると、それが "あまり強調しているようには感じられなくなる" という宿命です。

従って、新しい言葉が登場する。そのとき、否定的文脈で使われる言葉を肯定的に使ったり、名詞の接頭辞を形容詞を修飾する副詞に使ったりすると(超・鬼)、インパクトが強いわけです。特に、自分の思いや感情を吐露したい場合の話し言葉には、そういうインパクトが欲しい。そうして新語が使われだし、その結果一般的になってしまうと強調性が薄れ、また別の新語が使われ出す。

「天声人語」に引用された女子中学生の発言、「きのうさー、先生にさあ、ボロクソほめられちゃったんだ」も、よほど嬉しかったゆえの発言でしょう。天声人語子は「それにしても、あの女の子、うれしそうだったなあ」と書いていますが、今まで先生に誉められたことがなかったとか、あるいは、一生懸命努力して作ったモノとか努力して成し遂げたことを誉められたとか、内容は分からないけれど、そういうことが背景にあるのかも知れません。もちろん先生も言葉を重ねて誉めた。その子にとって「メッチャ、ほめられちゃった」や「チョー、ほめられちゃった」では、自分の感動を伝えるには不足なのです。

「ボロクソほめられた」は、一般的に広まることはないかもしれないけれど、個人的な言葉としては大いにアリだし、それは言葉の可能性の広さを表しているのだと思いました。




nice!(0) 

No.361 - 寄生生物が宿主を改変する [科学]

今まで、寄生生物が宿主(=寄生する相手)をあやつるというテーマに関連した記事を書きました。


の3つです。最初の No.348「蚊の嗅覚は超高性能」を要約すると、

◆ 蚊がヒトを感知する仕組みは距離によって4種あり、その感度は極めて鋭敏である。
10メートル程度 : ヒトの呼気中の二酸化炭素
3~4メートル : ヒトの臭い
1メートル程度 : ヒトの熱
最終的に : ヒトの皮膚(色で判断)

◆ ある種のウイルスは、ネズミに感染すると一部のたんぱく質の働きを弱める。それによってアセトフェノンを作る微生物が皮膚で増え、この臭いが多くの蚊を呼び寄せる(中国・清華大学の研究)。

でした。また No.350「寄生生物が行動をあやつる」は、次のようにまとめられます。

◆ ハリガネムシは、カマキリに感染するとその行動を改変し、それによってカマキリは、深い水辺に反射した光の中に含まれる「水平偏光」に引き寄せられて水に飛び込む。ハリガネムシは水の中でカマキリの体から出て行き、そこで卵を生む。

◆ トキソプラズマに感染したオオカミはリスクを冒す傾向が強く、群のリーダーになりやすい。

◆ トキソプラズマに感染したネズミはネコの匂いも恐れずに近づく。

トキソプラズマは広範囲の動物に感染しますが、有性生殖ができるのは猫科の動物の体内だけです。トキソプラズマが動物の行動を改変するのは、猫科の動物に捕食されやすくするため(もともとそのためだった)と推測できます。

そのトキソプラズマについての記事が、No.352「トキソプラズマが行動をあやつる」です。何点かあげると、

◆ トキソプラズマに感染したネズミは、天敵である猫の匂いを忌避しなくなることが、実験によって証明された。

◆ トキソプラズマに感染した人は、していない人に比べて交通事故にあう確率が 2.65 倍 高かった(チェコ大学。NHK BSP「超進化論 第3集」2023.1.8 による)

◆ トキソプラズマに感染したハイエナはライオンに襲われやすくなる(ナショナル・ジオグラフィック:2021.7.11 デジタル版)。

などです。今回はその継続で、同じテーマについての新聞記事を取り上げます。朝日新聞 2023年2月~3月にかけて掲載された「寄生虫と人類」です。これは3回シリーズの記事で、その第2回(2023.3.3)と第3回(2023.3.10)を紹介します。今までと重複する部分もありますが、「寄生生物が宿主を改変する」ことを利用して医療に役立てようとする動きも紹介されています。


寄生生物の生き残り戦略


「寄生虫と人類」の第2回は、

生物操り 都合のいい環境に
宿主の脳や免疫を制御 生態系に影響も

との見出しです。例のトキソプラズマの話から始まります。


2018年5月、長崎県沖で小型のイルカ、スナメリの死体が漁業用の網にかかった。死因は寄生虫の一種、トキソプラズマの感染だった。

トキソプラズマは、幅広い恒温動物に寄生することが知られている。卵を産むことができる「終宿主しゅくしゅ」は、ネコの仲間で陸の動物だが、海獣まで宿主となる。

陸と海の生物がどうつながるのか。

ネコが、オーシストと呼ばれる殻に包まれたトキソラズマの卵をフンとともに排泄はいせつする。雨が降るとオーシストが川に流れ、やがて海まで運ばれる。貝の中にたまり、貝を食べた海の生物が感染する ・・・・・・。

死因を調査した、帯広畜産大チームの西川義文教授は「頭で知っていたが、本当に海の生物も感染するんだと認識した」。

「寄生虫と人類」
(朝日新聞 2023.3.3)

トキソプラズマの拡散.jpg
トキソプラズマの拡散
(朝日新聞 2023.3.3 より)


ヒトも世界の3割は感染しているとの報告もある。ネコのフンの処理や感染した動物の生肉を食べることを通じてうつる。免疫不全患者が感染すると重症となり、妊婦が初めて感染した場合、胎児の目の障害や発育の遅れなどをともなう先天性トキソプラズマ症にかかることがある。

健康なヒトなら症状が出ないか、軽い発熱や頭痛程度ですむことが多い。だから、さほど心配しなくてよいと考えられてきた。ただ、感染者は、統合失調症、うつ病、アルツハイマー病などの発病リスクがあがるという報告がある。


引用のようにトキソプラズマはヒトにも感染し、妊婦が初めて感染した場合、胎児が先天性トキソプラズマ症にかかることがあります。しかし、それ以上の影響があるのではと疑われています。つまり脳への影響です。脳への影響は動物で研究が進んでいます。


感染したトキソプラズマが、脳にどう影響するのか、動物で研究が進む。70年、感染したネズミの行動が変わるという論文が発表された。本来ならいやがるはずの天敵のネコのにおいを避けなくなったという。

この論文に注目した西川さんらも研究を始めた。トキソプラズマをネズミに感染させると、急性期を経て慢性期に移行し、筋肉や脳にひそんで感染し続ける。ネズミは急性期にはうつのようになり、慢性期には記憶が悪くなった。ネズミが、ネコに捕食されやすくなるような結果だ。

米国のグループはイエローストーン国立公園で、26年間、オオカミの行動を調べ、血液の分析もした。一部のオオカミは生息地がピューマと重なり、トキソプラズマに感染している。感染したオオカミは、感染していない個体より群れから離れてリスクの高い行動をとる確率や、リーダーになる確率が高いとわかった。感染が影響して大胆な行動をとる可能性を示した。


ネズミやオオカミにおけるトキソプラズマの影響は、No.350 や No.352 でも紹介した通りです。さらにトキソプラズマは、巧妙な仕掛けによって宿主の免疫系の攻撃から逃れるようなのです。


大阪大微生物病研究所の山本雅裕教授によれば、トキソプラズマは、光合成をしていた単細胞生物から進化してきた痕跡をもつ。もともとは自力で生きていたのに、ほかの生物に寄生するようになった。のっとられると困る宿主との間で、ミクロの戦いが繰り広げられている。米国のグループは11年に不思議な現象を見つけて発表した。普通なら寄生虫は宿主の免疫を抑えて、自分が排除されないようにするはずだが、トキソプラズマは、宿主の免疫を活性化しているという。

山本さんたちが仕組みを探ると、免疫が活性化すると働く分子Aが別の分子Bと一緒になって、トキソプラズマの増殖をじゃまする分子Cを抑えていた。宿主の免疫を活性化させながら、自らにとって都合のいい環境を作り出していた

「寄生虫はウイルスより遺伝子の数が多く、手を変え品を変え、複雑なことをやっている」と山本さんは言う。

宿主の生理や行動を変化させるだけでなく、そうした操作を通じて、自然の中で寄生虫が果たす役割は大きいことが次第にわかってきた。


寄生虫は自らの生き残りのために宿主を改変しますが、そのことが自然生態系に大きな役割を持っている場合があります。その例が、No.350「寄生生物が行動をあやつる」で紹介したハリガネムシです。


京都大の佐藤拓哉准教授らは、ハリガネムシが寄生した昆虫カマキリが、水面の反射光の特徴に引き寄せられて水に飛び込むことを実験で確かめた。昆虫カマドウマもハリガネムシが寄生すると水に飛び込むことが知られる。水に入ると、おしりからハリガネムシが出ていく。川に浮かんだカマドウマは渓流魚のえさになり、繁殖期前のエネルギーを供給する。渓流魚に狙われる恐れが減った水生昆虫は藻類を食べるので、藻類が増えすぎない

「ハリガネムシが生態系の維持に大きな役割を果たしている」と佐藤さん。あらゆる動物に、それを利用する寄生虫がいるといわれる。生物の多様性とその関係を知るには、寄生虫の役割をもっと知る必要がありそうだ。(瀬川茂子)


No.350「寄生生物が行動をあやつる」に書いたように、佐藤准教授によると、渓流魚の餌の 60%(エネルギー換算)はハリガネムシが "連れてきた" 昆虫類でまかなわれているそうです。これだけでも重要ですが、上の引用によるとさらに「渓流魚に狙われる恐れが減った水生昆虫は藻類を食べるので、藻類が増えすぎない」とあります。ハリガネムシがカマドウマ(その他、カマキリ、キリギリスなど)に寄生することが、めぐりめぐって渓流の藻類が増えすぎないことにつながっている。生態系のバランスは誠に微妙だと思います。


寄生虫と病気治療


「寄生虫と人類」の第3回は、

「生き残り戦略」病気治療に光
 宿主の免疫から攻撃逃れる仕組みを利用

との見出しです。ここでは寄生虫の生き残り戦略を解明して、それを人間の病気治療に役立てようとする研究が紹介されています。


東京大の後藤康之教授らは、貧血や肝臓のはれを起こし、治療しなければ9割以上が死に至る「内臓型リーシュマニア症」の仕組みを研究している。この病気を起こすリーシュマニア原虫は、サシチョウバエという昆虫によって媒介される。原虫は、マクロファージと呼ばれる免疫細胞に寄生する。寄生された細胞は、赤血球をどんどん食べるようになる

「自分の細胞だから食べてはいけない」という認識に必要な分子が抑えられてしまうからだ。寄生虫は免疫からの攻撃を逃れ、赤血球という栄養豊富なえさを手に入れる一方で、宿主が貧血になる。

後藤さんらは、この仕組みを詳しく解明して、リーシュマニア症の治療法開発につなげたいという。それだけではない。免疫細胞を制御するこの仕組みを利用すれば、マクロファージにがん細胞をどんどん食べさせるようにできるのではないか、とも考えている。

「宿主細胞を操る寄生虫が、どんな分子をどう利用しているのか突き止めれば、ほかの病気の治療法開発につながる可能性がある」と後藤さんは話す。

「寄生虫と人類」
(朝日新聞 2023.3.10)

記事に「マクロファージにがん細胞をどんどん食べさせるようにできるのではないか」とあります。これで思い出すのが、No.330「ウイルスでがんを治療する」です。これは、東京大学の藤堂とうどう教授が開発した "ウイルスによるがん治療薬" を紹介した記事でした。単純ヘルペスウイルス1型(HSV-1)の3つの遺伝子を改造し、がん細胞にだけ感染するようにすると、改造ヘルペスウイルスはがん細胞を次々と死滅させてゆく。

がん細胞を攻撃するのが難しい要因のひとつは、それが「自己」だからです。リーシュマニア原虫は寄生したマクロファージを改変して「自己」であるはずの赤血球だけを選択的に食べるようにします。その仕組みが解明できれば、がん細胞だけを食べるマクロファージを作れるかもしれません。


国立感染症研究所の下川周子主任研究官が着目しているのは、寄生虫が何十年も感染しているのに、病気にならない場合があることだ。寄生虫がいることで、宿主にもメリットをもたらしている可能性があると考えた。自分の免疫が自分自身を攻撃する自己免疫疾患で研究を進めている。

自己免疫型の糖尿病の状態にしたマウスに寄生虫の一種を感染させたところ、糖尿病の発病を抑えられた。腸内細菌や免疫の変化を詳しく調べると、寄生虫が腸で作り出す成分をえさとする細菌が増えた。その細菌は宿主の免疫の働きを抑える「制御性T細胞」を誘導することも分かった。寄生虫は細菌を通じて、宿主の免疫から逃れるが、この「生き残り戦略」が、宿主の自己免疫を抑えることにつながっていた。下川さんらは、この仕組みを利用して、寄生虫そのものを感染させるのではなく、寄生虫が作る成分などを利用する治療法の開発をめざすという。


ヒトに感染する細菌やウイルスが、ヒトの免疫系からの攻撃を逃れるため、免疫の働きを押さえる制御性T細胞を誘導する(未分化のT細胞を制御性T細胞に変える)とか、制御性T細胞を活性化する話は、今までの記事で何回か書きました。

◆ 2010年には、自己免疫疾患を抑制する制御性T細胞の誘導に関係するバクテロイデス・フラジリスが、2011年には同様にこの制御性細胞を誘導するクロストリジウム属が発見された。─── No.70「自己と非自己の科学(2)」

◆ 抗生物質のバンコマイシンで腸内細菌のクロストリジウム属を徐々に減らすと、ある時点で制御性T細胞が急減し、それが自己免疫疾患であるクローン病(=炎症性腸疾患)の発症を招く。─── No.120「"不在" という伝染病(2)」

◆ エンテロウイルスに感染すると制御性T細胞の生成が刺激され、その細胞が成人期まで存続する。制御性T細胞は自己免疫性T細胞の生成を抑えることで1型糖尿病を防ぐ。─── No.229「糖尿病の発症をウイルスが抑止する」

などです。細菌やウイルスが制御性T細胞を誘導するのであれば、遺伝子の数が多い寄生虫が同じことをできたとしても、むしろ当然という感じがします。


下川さんの頭にあるのは、「衛生仮説」。子どもの頃に感染症にかかったり不衛生な環境にさらされたりすることが、アレルギーや自己免疫病の発病率を抑えるという説だ。「衛生状態がよくなって失われた環境の中に、健康にいいものがあったかもしれない。それを科学的に検証したい」アレルギーを起こす仕組みは、寄生虫と共にいる時代の武器だったこともわかってきた。

寄生虫の大きさはさまざまだが、ウイルスや細菌よりずっと大きいものもいる。対抗する宿主は、寄生虫にダメージを与える物質を出して弱らせ、粘液を出して外に流れ出ていくようにする。腸の寄生虫は便といっしょに流出、肺なら、たんにからまって出る。原始的だが、効果がある方法だ。

この仕組みにかかわる免疫細胞が2010年に発見が報告された「2型自然リンパ球(ILC2)」だ。2型自然リンパ球は、獲得免疫をもたない生物でも寄生虫にのっとられないように働くシステムとして備わったと考えられる。いまでも寄生虫がたくさんいるような状況では、体を守ってくれる。ただ、先進国ではアレルギーを起こしているという。

アレルギーの原因物質に含まれる酵素が細胞を殺し、細胞から特定のたんぱく質が分泌されると、ILC2を活性化する。粘液が出て、たん、鼻水などになる。寄生虫を排除する仕組みは、そのまま一部のアレルギーが起きる仕組みにもなるとわかった。


細菌やウイルスよりはるかに大きい寄生虫にヒトが対抗するためには、それを体内から排出するしかない。この仕組みを発動する免疫細胞が2010年に発見された(2型自然リンパ球、ILC2)という記事です。

寄生虫が多い環境では、このようなヒトの仕組みと、寄生虫が免疫から逃れようとする動き(制御性T細胞を生成するなど)が攻めぎ合っています。しかし、寄生虫がほとんどいない先進国の環境ではバランスが崩れ、ヒトの仕組みが不必要に発動して「自己」を攻撃してアレルギーの(一つの)原因になるわけです。


人類の長い歴史は感染症とともにあり、さまざまな病原体にさらされてきた。東京慈恵会医科大の嘉糠洋陸教授によると、ヒトの遺伝情報には、寄生虫と戦い、あるいは共生した痕跡が刻まれ、対応する状態になっている。

衛生環境や生活スタイルが大きく変わったのは、人類の歴史の中ではほんの一瞬で、遺伝情報は簡単には変わらない。たとえ病気を起こす寄生虫が環境から減ったとしても、体は寄生虫に向き合っている。(瀬川茂子)


ヒト(ホモ・サピエンス)はアフリカのサバンナ地帯で進化してきたわけで、その環境とライフスタイル(狩猟採集)にマッチした DNA と体の造りになっています。サバンナでの狩猟採集に有利なように進化してきたのがヒトなのです。

もちろん現代で同じ環境で生きることはできません。しかし程度の差はあれ、「寄生生物と戦う環境、あるいは共生する環境」は、我々が健康に過ごすために必須だと感じる記事でした。




nice!(0) 

No.360 - ヒトの進化と苦味 [科学]

今まで、ヒトと苦味の関係について2つの記事を書きました。

 No.177「自己と非自己の科学:苦味受容体」
 No.178「野菜は毒だから体によい」

の2つです。No.177「自己と非自己の科学:苦味受容体」を要約すると次の通りです。

◆ 苦味は本来、危険のサインである。

◆ 舌で苦味を感じるセンサー、苦味受容体は、鼻などの呼吸器系にもあり、細菌などの進入物から体を防御している。その働きは3つある。
・ 細胞にシグナルを送り、繊毛を動かして進入物を押し出す
・ 細胞に指示して殺菌作用のある一酸化窒素を放出させる
・ 細胞に指示してディフェンシンという抗菌作用のあるタンパク質を放出させる

◆ さらに、苦味受容体は呼吸器系だけでなく体のあちこちにあり(たとえば小腸)、免疫機能を果たしている。

五味と総称される、甘味・酸味・塩味・苦味・うま味のうち、苦味を除く4つは、その味を引き起こす物質が決まっています。

甘味 :糖
酸味 :酸=水素イオン
塩味 :塩=ナトリウムイオン
うま味 :アミノ酸

です。この4味を感じる味覚受容体はそれぞれ1種類です。しかし苦味を引き起こす物質は多様で、それに対応して苦味受容体も複数種類あります。そしてヒトは、本来危険のサインである苦味を楽しむ文化を作ってきました。
・ お茶を飲む文化
・ コーヒーを飲む文化
などは世界中に広まっています。ビールもそうでしょう。ホップを使ってわざわざ苦くしている。赤ワインの味は複雑ですが、味の魅力を作るポイントの一つが苦味(=ブドウの皮由来のタンニン)であることは間違いないでしょう。

ではなぜ、本来危険のサインである苦味を楽しむ文化が広まったのでしょうか。その理由の一端が分かるのが、No.178「野菜は毒だから体によい」です。要約すると、

◆ 植物は、動物や昆虫に食べられまいとして、毒素を生成するものが多い。

◆ 植物の毒素のあるものは、微量であればヒトの体によい影響を及ぼす。代表的なものは、
・ スルフォラファン(ブロッコリー)
・ クルクミン(ターメリック)
・ カフェイン(コーヒーや茶)
・ カテキン(茶)
・ カプサイシン(唐辛子)
などである(ターメリックはカレーによく使う香辛料)。

◆ これらは微量なら体の細胞に適度なストレスを与え、細胞はそのストレスから回復しようとする(たとえば抗酸化物質の算出)。その回復機能の活性化が体に良い影響を与える。

上にある植物の毒素は、苦味と重ならないものもありますが(カプサイシン)、重なる部分も多い。つまり、植物由来の微量毒素を摂取することと、苦いものを食べる・飲むことは密接に関係していると考えられます。

ヒトの体は(小さな)ストレスや(小さな)ダメージから回復する機能を備えています。使わない機能は衰えるのが原則です。それが必要ないと体が判断するからです。ヒトは苦いものを食べる・飲むことで、体のストレス回復機能を常時活性化させておき、それが健康維持に役立つ ・・・・・・。そういう風に考えられます。



先日の日本経済新聞に、苦味とヒトの進化をまとめた記事が掲載されました(2023年4月30日 日経 STYLE)。ヒトにとっての苦味の意味が理解できる良い記事だと思ったので、紹介します。


苦味、命の恵み


日本経済新聞の記事は、

 苦味、命の恵み

と題するもので、このタイトルのもとに、次の文が続きます。


春の味覚を象徴する山菜にゴーヤー、ビール、コーヒー ───。幼少の頃に顔をしかめた大人の味は、元は毒を検知し体内に取りこまないための機能だった。「苦味」を、私たちはいつから楽しめるようになったのだろう。近年の研究では、苦味を感じる感覚が、進化の歴史にも深く関わっていたことが明らかになっている。

日本経済新聞(日経 STYLE)
2023年4月30日 

記事は2つの部分に分かれています。

・ 郷土に根ざす文化の味わい
・ ヒトへの進化支える不思議

です。「郷土に根ざす文化の味わい」では、日本の郷土料理を支える苦味、特に山菜料理とその歴史の紹介でした。

苦み 山菜.jpg
埼玉県入間市の郷土料理店「ともん」で供される山菜。日本経済新聞より。

以下は、第2部である「ヒトへの進化支える不思議」を紹介します。


ヒトへの進化支える不思議



私たちは、なぜ苦いものをおいしいと感じるのだろう。苦味は本来、毒を口にしたときに叶き出すための機能だ。本能的に苦い食べ物を嫌う子供は、食体験を積む中である種の苦みをおいしいと学習する。苦味という感覚の仕組みを探ると、ほかの味覚とは異なる不思議が見えてくる

日本経済新聞(日経 STYLE)
2023年4月30日 

苦味が本来危険のサインだとすると、子供が苦い食べ物を嫌うのはヒトに備わった正常な反応でしょう。しかし「食体験を積む中である種の苦みをおいしいと学習する」のはなぜでしょうか。これは少々不思議です。なぜ味覚が変化するのか。

たとえば、甘味を考えてみると、子供が甘いものが大好きなのは人類共通だと思います。しかし大人になると甘いものを嫌う人がでてきます(大人になっても甘いもの大好きという人もいるが)。これはなぜかというと「甘いものは体によくない」「糖質のとりすぎは健康を損ねる」という "知識" を獲得するためと考えられます。

塩味もそうです。塩は料理には欠かせないし、適度な塩分は体の維持に必須です。しかし年配になると塩味が強すぎるものを嫌う人が出てくる。これは、高血圧症などの生活習慣病のリスクを避けるという "知識" からくるのだと思います。その他、酢を使った料理や飲料を好むように変わったとしたら、それも健康に良いという知識によるのでしょう。

しかし苦味は違います。「苦味が健康に良い」という "知識" が広まっているとは思えません。それでもなおかつ大人になると苦味を好むのは、もちろん、コーヒーや緑茶やビールを飲むという文化・習慣が根付いていて、それに馴染むわけです。ではなぜそういう文化・習慣が根付いたかと言うと、体が苦いものを欲するようになるからではないでしょうか。

苦味は本来、危険のサインだけれど、長い進化や文化的伝統のなかで "安全な苦味" と分かっているものについては、その苦味にメリットがあることを自然と体得するのだと思います。

日経新聞の引用を続けます。


人間は口の中にある「味覚受容体」の働きによって味を感じている。たとえば甘味とうま味の受容体は各1種類で、糖は甘味、アミノ酸はうま味という具合に、物質と味覚がほぼ1対1で対応している。これに対し苦味の受容体は26種類もある。「苦い」と感じる山菜、コーヒー、ホップ、かんきつ類などの苦味物質は、それぞれ異なるのだ。


苦味の受容体は26種類、と書かれています。苦味物質がは多様であり、それに対応して苦味受容体の種類も多い。その多様性はヒトが進化の過程で獲得してきたものです。


多くの苦味受容体を持つに至ったのは、進化の過程に深く関係がある。苦味受容体は、ヒトの祖先である霊長類が「主食を昆虫から植物の葉へと変えていく過程で増えていった」と北海道大学大学院 地球環境科学研究院 助教の早川卓志さん(博士)は解説する。早川さんはゲノム解析を通じて野生動物の行動や進化を研究する。

霊長類の祖先にあたる哺乳類は昆虫を主食としていたが、体が大きくなるにつれて虫だけでは栄養が不足し、葉に含まれるたんぱく質を摂取するようになる。植物はもともと毘虫に食べられないよう多様な毒を蓄えており、ヒ卜の祖先は「それを避けるように『苦味感覚』というセンサーを発達させ、受容体の数も増やした」(早川さん)。従って、植物を食べない哺乳類では苦味感覚の出番はあまりなく、受容体の数も少ない傾向にある。肉食のネコは霊長類の約3分の1、イルカ・クジラに至ってはゼロだ。


NHK BS プレミアム ヒューマニエンス「"毒と薬" その攻防が進化を生む」(2023年1月31日 22:00~23:00)に早川さんが出演されて、苦味受容体の解説をされていました。それによると、霊長類の苦味受容体の種類は、

小型霊長類
マーモセット :20
リスザル :22
メガネザル :16
大型霊長類
ゴリラ :25
チンパンジー :28
ヒト :26

だそうです。この違いは何かというと、小型霊長類は主として昆虫食であるのに対し、大型霊長類は大きな体を維持するために苦味物質が含まれる植物の葉を食べるようになったからです。

ちなみに、ヒトとチンパンジーは約700万年前に共通の祖先から別れたのですが、その共通祖先の苦味受容体の種類数は28と推定されるそうです。つまりヒトは2種類失った。これはなぜなのでしょうか。


矛盾するようだが「ヒトは必ずしも苦みに敏感な動物ではない」と話すのは味覚の仕組みを研究する東京大学大学院 農学生命科学研究科 准教授の三坂巧さん(博士)。葉食に移行した霊長類は「苦味を鈍らせ、葉に含まれるグルタミン酸をおいしいと感じるようになった。ヒトに至っては苦いお茶にうま味を感じるまでに」なったという。厳格に苦い=食べないを実践する生物は食べられる物の選択肢が狭く、生存競争には不利に働く。チンバンジーが28の苦味受容体を持つのに対し、ヒトはそこから2つ失って26に落ち着いた。


受容体の数を減らすことで、食べられる食物の選択肢を増やしたとの話ですが、それ以外に、肉食を始めたこと(約250~200万年前)や、加熱調理(約100万年前かそれ以前)によって、苦味を忌避する必要性が薄れたことも影響しているのでしょう。NHK の「ヒューマニエンス」でもそういう話がありました。

また、ヒトの苦味感覚には個人差があり、また苦味を受容するスタイルも多様です。


ヒトの苦味感覚には個人差もある。ブロッコリーの苦みを強く感じる人と、感じない人がおり、この違いは先天的に遺伝子の型で決まる。苦みを感じて避ける人ばかりの集団では、ブロッコリーを食べる習慣は生まれないだろう。味覚の多様性が、得られる食材の選択肢を広げてきたと考えられる。

ヒトは苦味感覚の発達とあわせて一部は退化方向に適応させ、安全な食べ物か否かを集団内で学習しながら苦い食材も食べてきた。さらにコーヒーを砂糖やミルクでマスキングしたり、山菜をあく抜きしたり、野菜を品種改良したり。飽くなき食への関心から工夫を重ね「『山菜は春の風物詩』といったイメージも含め、様々な情報が複合して、苦みがおいしいという感覚が形成」(三坂さん)されるに至った。


スタバのドリップコーヒーは苦くて飲めないという人がいます。私は平気ですが、飲めないという意見も理解できる。しかしそれほど "苦い" ものであっても、人々は砂糖を入れたり、ミルク、生クリームなどを入れたりして "苦味をマスキング" し、"何とかして" 飲もうとしてきた。これは、体が苦味を欲している、と考えるのが妥当だと思います。

さらに日経新聞には「料理にあえて苦味を加える」という、興味深い話があります。


苦みを加えることで味わいが増すと考えるのは、ミシュランーつ星のフレンチ「SiO(シオ)」シェフの烏羽周作さんだ。「1皿に入るうまみの総量には限界がある。うまみを重ねるだけでは平たんで重くなってしまうが、そこに苦みを加えるとうまみの容量が増え、料理の立体感を生む」と話す。系列店の北青山「Hotel's」ではコース料理のメイン「薪火焼きステーキ」に「苦味調味料」を添えて提供する。ハーブソルトに、ビールの苦みや香りの元になるホップの成分を配合したものだ。

この調味料は、キリンホールディングスでホップを使った新規事業を担当する金子裕司さんが開発した。「苦味はうま味、油脂の味わいを高めるので、肉料理や揚げ物に使ってもらいたい」と語る。「今はおいしい苦みといえば山菜、コーヒー、チョコレートといつた食材にとどまっている。家庭でも苦味の上手な使い方が広まれば、食がより豊かになるはず」


苦み ステーキ.jpg
東京・北青山の「Hotel's」では、メインのステーキにホップの苦味が特徴のハーブソルトを添えて提供される。

辛味調味料である辛子からし山葵わさびを添える料理はいろいろあります。であれば、「ハーブソルトに、ビールの苦みや香りの元になるホップの成分を配合した」苦味調味料を添える料理があってもよいはずです。

考えてみると、焼いたり、あぶったり、げめをつけたりする料理がいろいろあります。これは、過度にならない苦味を足すことで食材の味をより引き立たせる意味も大きいのでしょう。さらに「稚鮎の天ぷら」のような料理を考えてみると、おいしさのポイントが鮎の内臓(ワタ)の苦味でであることは確かです。

ホップを使ったような "苦味調味料" は今まで無かったかもしれないが、実質的に同じ効果を得る料理はたくさんあるはずです。


さらなる未知の領域を想像させるのが「苦味には味を感じる以外の働きがあること」(キリンの金子さん)。実は苦味受容体は舌や口の中以外にも広く存在している。食べ物が直接接するはずのない鼻の苦味受容体は細菌の排除に役立っていることが知られる。苦味受容体の遺伝子は脂肪細胞などにも存在し、ホップの苦味成分には体脂肪を減らす機能も報告されている。

子供のころには嫌いだった苦い食材を年を重ねるごとに好むようになるのも「一般的には食べ慣れるからと考えられていますが、健康維持のために中高年になると、苦味物質を体が欲するようになるとしたらとても興味深いですよね」と金子さん。


冒頭に書いたように「苦味受容体は舌や口の中以外にも広く存在し、食べ物が直接接するはずのない鼻の苦味受容体は細菌の排除に役立っている」のは事実なので、「健康維持のために中高年になると、苦味物質を体が欲するようになる」というのが、サイエンスとしては正しいと思います。


苦味には科学的に未解明の謎が多い。UCC上珈琲はコーヒーの苦味成分として乳酸など3つの新たな物質を特定し、2021年に論文として発表した。苦味成分としてはカフェインが思い浮かぶがノンカフェインもコ-ヒー独特の苦みがある。コーヒーの味に関わる物質は1千を超えるとみられ、同研究に携わった製品開発部の成田優作さんは「コーヒーの苦味について、まだ全貌がつかめない」と話す。

「良薬口に苦し」。苦味の世界をのぞいた後では、この言葉もより深い意味をもって響かないだろうか。(佐藤洋輔)


以上のような話を読むと、野菜を品種改良して適度な苦味まで無くすとか、あるいは減少させるのは、ヒトと苦味の長い付き合いの本筋から全くはずれた行為と言えるでしょう。

要するに我々は、苦味とうまく付き合えばよいということです。




nice!(0) 

No.359 - 高校数学で理解するガロア理論(6) [科学]

\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{#1}} \newcommand{\ol}[1]{\overline{#1}} \newcommand{\sb}{\subset} \newcommand{\sp}{\supset} \newcommand{\al}{\alpha} \newcommand{\sg}{\sigma}\newcommand{\cd}{\cdots}\)
 
7.可解性の十分条件(続き) 
 


7.8 可解な5次方程式


大多数の5次方程式のガロア群は、対称群 \(S_5\) か 交代群 \(A_5\) であり、従って可解ではありません(65G)。しかし特別な形の5次方程式は可解です。

x^5-2=0.jpg
\(x^5-2=0\) の根
その可解な5次方程式として \(x^5-2=0\) を取り上げ、ガロア群を分析します。この方程式の根がべき根で表現できることはあたりまえだし、こんな "単純な" 方程式のガロア群を分析することに意味があるのかどうか、疑ってしまいます。

しかし、\(x^5-2=0\) のガロア群は可解な5次方程式のガロア群としては最も複雑なのです。方程式の "見た目の" 単純・複雑さと、ガロア群の単純・複雑さはリンクしません。以下で \(x^5-2\) のガロア群を計算します。

\(x^5-2\) のガロア群
\(1\) の原始\(5\)乗根の一つを \(\zeta\) とします。\(x^5-1=0\) は、
 \((x-1)(x^4+x^3+x^2+x+1)=0\)
と因数分解できるので、\(\zeta\) は、
 \(x^4+x^3+x^2+x+1=0\)
の根です。7.1節で計算したように、たとえば、
 \(\zeta=\dfrac{1}{4}(-1+\sqrt{5}+i\sqrt{10+2\sqrt{5}})\)
です。また、
 \(\al=\sqrt[5]{2}\)
とします。そうすると、\(x^5-2=0\) の解は、
 \(\al,\:\:\al\zeta,\:\:\al\zeta^2,\:\:\al\zeta^3,\:\:\al\zeta^4\)
の5つです。\(f(x)=x^5-2\) の最小分解体 \(\bs{L}\) は、
\(\begin{eqnarray}
&&\:\:\bs{L}&=\bs{Q}(\al,\:\al\zeta,\:\al\zeta^2,\:\al\zeta^3,\:\al\zeta^4)\\
&&&=\bs{Q}(\zeta,\al)\\
\end{eqnarray}\)
です。この \(\bs{L}=\bs{Q}(\zeta,\al)\) は、\(\bs{F}=\bs{Q}(\zeta)\) として、
 \(\bs{Q}\:\subset\:\bs{F}\:\subset\:\bs{L}\)
という、体の拡大で作られたものと見なせます。つまり \(\bs{L}=\bs{F}(\al)\) です。

\(\zeta\) の \(\bs{Q}\) 上最小多項式は、\(x^4+x^3+x^2+x+1\) という4次多項式なので、拡大次数は、
 \([\:\bs{F}:\:\bs{Q}\:]=4\)
です。\(\bs{Q}(\zeta)\) は単拡大体であり、単拡大体の同型写像の定理(51G)によって、\(\zeta\) に作用する \(\bs{Q}\) 上の同型写像はちょうど \(4\)個あります。

\(\bs{L}=\bs{Q}(\zeta,\al)\) は \(\bs{F}=\bs{Q}(\zeta)\) 上の5次既約多項式 \(x^5-2\) の解 \(\al\) を \(\bs{F}\) に添加した単拡大体です。従って、
 \([\:\bs{L}\::\:\bs{F}\:]=5\)
です。\(\bs{L}=\bs{F}(\al)\) も単拡大体であり、\(\al\) に作用する \(\bs{\bs{F}}\) 上の同型写像は \(5\)個です。

拡大次数の連鎖律33H)により、
 \([\:\bs{L}\::\:\bs{Q}\:]=[\:\bs{L}\::\:\bs{F}\:]\cdot[\:\bs{F}\::\:\bs{Q}\:]=20\)
がわかります。従って \(\mr{Gal}(\bs{L}/\bs{Q})\) の位数は \(20\) です。\(\bs{L}=\bs{Q}(\zeta,\al)\) の自己同型写像を\(20\)個見つければ、それが \(\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q})\) です。

 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) 

自己同型写像は、方程式の解を共役な解に移します。\(\zeta\) は \(1\) の原始\(5\)乗根であり、4次方程式 \(x^4+x^3+x^2+x+1=0\) の解なので、
 \(\zeta,\:\:\zeta^2,\:\:\zeta^3,\:\:\zeta^4\)
が互いに共役です。そこで、自己同型写像 \(\tau_i\:(i=1,2,3,4)\) を、\(\zeta\) を \(\zeta^i\) に置き換える写像、つまり、
\(\tau_i\::\:\zeta\:\longrightarrow\:\zeta^i\)
と定義します。これを、
 \(\tau_i(\zeta)=\zeta^i\:\:(i=1,2,3,4)\)
と表記します。\(\tau_i\:(i=1,2,3,4)\) の集合を、
 \(G_{\large t}=\{\tau_1,\:\tau_2,\:\tau_3,\:\tau_4\}\)
とすると、\(G_{\large t}\) は \(\bs{Q}(\zeta)\) の4つの自己同型写像の集合なので、
 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})=G_{\large t}\)
です。恒等写像を \(e\) とすると、
 \(\tau_1=e\)
ですが、
 \(\tau_2(\zeta)=\zeta^2\)
\(\begin{eqnarray}
&&\:\:\tau_2^{\:2}(\zeta)&=\tau_2(\tau_2(\zeta))=\tau_2(\zeta^2)\\
&&&=\zeta^4=\tau_4(\zeta)\\
&&\:\:\tau_2^{\:3}(\zeta)&=\tau_2(\tau_2^2(\zeta))=\tau_2(\zeta^4)\\
&&&=\zeta^8=\zeta^3=\tau_3(\zeta)\\
&&\:\:\tau_2^{\:4}(\zeta)&=\zeta^{16}=\tau_1(\zeta)\\
\end{eqnarray}\)
と計算できるので、
 \(\tau_1^{\:2}=\tau_4,\:\:\tau_1^{\:3}=\tau_3,\:\:\tau_1^{\:4}=e\)
となります。従って、\(\tau_2\) を \(\tau\) と書くと、
 \(G_{\large t}=\{e,\:\tau,\:\tau^2,\:\tau^3\}\)
であり、\(G_{\large t}\) は \(\tau\)(= \(\tau_2\)) を生成元とする位数 \(4\) の巡回群で、既約剰余類群 \((\bs{Z}/5\bs{Z})^{*}\) と同型です。これは一般に \(1\) の原始\(n\)乗根を \(\zeta\) としたときに、
 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/n\bs{Z})^{*}\)
という 6.3節の \(\bs{\bs{Q}(\zeta)}\)のガロア群の定理(63E)からもわかります。

\((\bs{Z}/5\bs{Z})^{*}\) の生成元は \(2,\:3\) です。従って、\(G_{\large t}\) の生成元は \(\tau_2,\:\tau_3\) です。\(\tau_4\) については、
 \(\tau_4(\zeta)=\zeta^4\)
\(\begin{eqnarray}
&&\:\:\tau_4^{\:2}(\zeta)&=\tau_4(\tau_4(\zeta))=\tau_4(\zeta^4)\\
&&&=\zeta^{16}=\zeta\\
\end{eqnarray}\)
なので、\(\tau_4^{\:2}=\tau_1=e\) であり、生成元ではありません。

 \(\mr{Gal}(\bs{F}(\al)/\bs{F})\) 

\(\bs{L}=\bs{Q}(\zeta,\al)=\bs{F}(\al)\) は \(\bs{F}=\bs{Q}(\zeta)\) 上の既約方程式 \(x^5-2=0\) の解の一つである \(\al\) を \(\bs{F}\) に添加したべき根拡大体です。\(\bs{F}\) には \(1\)の原始5乗根 \(\zeta\) が含まれるので、\(\bs{F}(\al)/\bs{F}\) はガロア拡大、かつ巡回拡大です。\(\al\) と共役な方程式の根は、
 \(\al,\:\:\al\zeta,\:\:\al\zeta^2,\:\:\al\zeta^3,\:\:\al\zeta^4\)
です。そこで \(\al\) に作用する自己同型写像 \(\sg_j\:(j=0,1,2,3,4)\) を、
\(\sg_j:\:\al\:\longrightarrow\:\al\zeta^j\)
と定義します。これを
 \(\sg_j(\al)=\al\zeta^j\)
と書きます。\(\sg_j\) の集合を、
 \(G_{\large s}=\{\sg_0,\:\sg_1,\:\sg_2,\:\sg_3,\:\sg_4\}\)
とすると、\(\mr{Gal}(\bs{F}(\al)/\bs{F})=G_{\large s}\) です。また、
 \(\sg_0=e\)
 \(\sg_1(\al)=\al\zeta\)
 \(\sg_2(\al)=\al\zeta^2=\sg_1^{\:2}(\al)\)
 \(\sg_3(\al)=\al\zeta^3=\sg_1^{\:3}(\al)\)
 \(\sg_4(\al)=\al\zeta^4=\sg_1^{\:4}(\al)\)
です。\(\sg_1=\sg\) と書くと、
 \(G_{\large s}=\{e,\:\sg,\:\sg^2,\:\sg^3,\:\sg^4\}\)
となって、\(G_{\large t}\) は \(\sg\) を生成元とする位数 \(5\) の巡回群であり、剰余群 \(\bs{Z}/5\bs{Z}\) と同型です。なお \(5\) は素数なので、\(\sg_1\) だけでなく、\(\sg_2,\:\sg_3,\:\sg_4\) も生成元です。

 \(\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q})\) 

\(\sg_j\) を使って、\(\bs{F}=\bs{Q}(\zeta)\) の自己同型写像 \(\tau_i\) を \(\bs{L}=\bs{Q}(\zeta,\al)\) の自己同型写像に延長します。同型写像の延長定理51H)により、\(\bs{Q}(\zeta,\al)\) の自己同型写像で、その作用を \(\bs{Q}(\zeta)\) に限定すると \(\tau_i\) に一致するものが必ず存在します。

\(\tau_i\) と \(\sg_j\) の合成写像を \(\sg_{ij}\) とし、
\(\sg_{ij}=\sg_j\cdot\tau_i\)
   \((i=1,2,3,4)\:\:(j=0,1,2,3,4)\)
と定義します。\(\tau_i\) が先に作用します。すると、
 \(\sg_{10}=\sg_0\cdot\tau_1=e\cdot e=e\)
 \(\sg_{ij}(\zeta)=\tau_i(\zeta)=\zeta^i\)
 \(\sg_{ij}(\al)=\sg_j(\al)=\al\zeta^j\)
となります。また、
\(\begin{eqnarray}
&&\:\:\sg_{ij}(\al\zeta)&=\sg_j\tau_i(\al\zeta)\\
&&&=\sg_j(\al\zeta^i)\\
&&&=\al\zeta^j\zeta^i\\
&&&=\al\zeta^{i+j}\\
\end{eqnarray}\)
です。このように定義した \(\sg_{ij}\) 同士の演算(=写像の合成)は \(\sg_{ij}\) で閉じています。\(\tau_i\) も \(\sg_j\) も5次方程式の解を共役な解に移す写像なので、その合成写像もまた、解を共役な解に移す写像ですが(=閉じている)、次のように計算で確認することができます。

\(\tau_i\:(i=1,2,3,4)\) は \(\tau(\)=\(\tau_2)\) を生成元とする巡回群で、\(\sg_j\:(j=0,1,2,3,4)\) は \(\sg(=\sg_1)\) を生成元とする巡回群です。ここで、
 \(\tau\sg=\sg^2\tau\)
が成り立ちます。なぜなら、
\(\begin{eqnarray}
&&\:\:\tau\sg(\al\zeta)&=\tau_2\sg_1(\al\zeta)\\
&&&=\tau_2(\al\zeta\cdot\zeta)=\tau_2(\al\zeta^2)\\
&&&=\al\zeta^4\\
&&\:\:\sg^2\tau(\al\zeta)&=\sg_1^{\:2}\tau_2(\al\zeta)\\
&&&=\sg_1^{\:2}(\al\zeta^2)\\
&&&=\sg_1(\al\zeta\cdot\zeta^2)\\
&&&=\al\zeta\cdot\zeta\cdot\zeta^2\\
&&&=\al\zeta^4\\
\end{eqnarray}\)
と計算できるので、
 \(\tau\sg(\al\zeta)=\sg^2\tau(\al\zeta)\)
が成り立つからです。\(\sg\) と \(\tau\) は可換ではありませんが(\(\tau\sg\neq\sg\tau\))、\(\tau\sg=\sg^2\tau\) という、いわば "弱可換性" があります("弱可換性" はここだけの言葉)。

なお、一般化すると、
  \(\tau^i\sg^j=\sg^k\tau^i\:\:(k=2^{i}j)\)
と計算できます。

\(\sg_{ij}\) の 2つの元 \(\sg_{ab},\:\sg_{cd}\) の合成写像は、
 \(\sg_{cd}\sg_{ab}=\sg_d\tau_c\sg_b\tau_a=\sg_d(\tau_c\sg_b)\tau_a\)
ですが、\(\tau_c\sg_b\) の部分は、
 \(\tau_c\sg_b=\tau\cd\tau\sg\cd\sg\)
の形をしています。この部分に弱可換性 \(\tau\sg=\sg^2\tau\) の関係を繰り返し使って、
 \(\tau_c\sg_b=\sg\cd\sg\tau\cd\tau\)
の形に変形できます。ということは、
 \(\sg_{cd}\sg_{ab}=\sg\cd\sg\tau\cd\tau\)
にまで変形できます。\(\sg^5=e,\:\tau^4=e\) なので、これは、
 \(\sg_{cd}\sg_{ab}=\sg_j\tau_i\)
となる \(i,\:j\) が一意に決まることを示していて、合成写像は \(\sg_{ij}\) で閉じていることがわかります。

2つの写像、\(\sg_{ab}\) と \(\sg_{cd}\) の合成写像を具体的に計算してみると、
\(\begin{eqnarray}
&&\:\:\sg_{cd}\sg_{ab}(\al\zeta)&=\sg_{cd}(\al\zeta^{a+b})\\
&&&=\sg_d\tau_c(\al\zeta^{a+b})\\
&&&=\sg_d\al\zeta^{c(a+b)}\\
&&&=\al\zeta^{ac+bc+d}\\
\end{eqnarray}\)
  \((1\leq a,c\leq4,\:\:0\leq b,d\leq4)\)
となります。四則演算はすべて有限体 \(\bs{F}_5\) で(= \(\mr{mod}\:5\) で)行います。
 \(\sg_{(ac)(bc+d)}(\al\zeta)=\al\zeta^{ac+bc+d}\)
なので、
 \(\sg_{cd}\sg_{ab}=\sg_{(ac)(bc+d)}\)
です。記述を見やすくするため、

\(\sg_{ij}=\)[ \(i,\:j\) ]

と書きます。この記法を使うと、
 [ \(c,\:d\) ][ \(a,\:b\) ]\(=\)[ \(ac,\:bc+d\) ]
となります。また、
 [ \(a,\:b\) ][ \(a^{-1},\:-a^{-1}b\) ]
  \(=\)[ \(aa^{-1},\:-aa^{-1}b+b\) ]
  \(=\)[ \(1,\:0\) ]\(=e\)
 [ \(a^{-1},\:-a^{-1}b\) ][ \(a,\:b\) ]
  \(=\)[ \(a^{-1}a,\:a^{-1}b-a^{-1}b\) ]
  \(=\)[ \(1,\:0\) ]\(=e\)
なので、[ \(a,\:b\) ] の逆元は、
 [ \(a,\:b\) ]\(^{-1}=\)[ \(a^{-1},\:-a^{-1}b\) ]
です。\(a^{-1}\) は \(\bs{F}_5\)(ないしは\((\bs{Z}/5\bs{Z})^{*}\))での逆元で、\(1^{-1}=1\)、\(2^{-1}=3\)、\(3^{-1}=2\)、\(4^{-1}=4\) です。

以上で、演算で閉じていて、単位元と逆元の存在がいえるので、
 \(\sg_{ij}\:\:(i=1,2,3,4)\:\:(j=0,1,2,3,4)\)
は群を構成することがわかります。


\(\sg_{ij}\) を共役な解の巡回置換で表現します。\(x^5-2=0\) の5つの解を \(1,\:2\:,3,\:4,\:5\) で表します。つまり、
 \(1:\al,\:2:\al\zeta,\:3:\al\zeta^2,\:4:\al\zeta^3,\:5:\al\zeta^4\)
です。
 \(\tau_i(\zeta)=\zeta^i\)
ですが、\(\zeta^5=1\) に注意して、\(\tau_i\) を巡回置換で表現すると、
 \(\tau_1=\:e\)
 \(\tau_2=(2,\:3,\:5,\:4)=\tau\)
 \(\tau_3=(2,\:4,\:5,\:3)=\tau^3\)
 \(\tau_4=(2,\:5)(3,\:4)=\tau^2\)
となります。同様にして、
 \(\sg_j(\al)=\al\zeta^j\)
なので、
 \(\sg_0=\:e\)
 \(\sg_1=(1,\:2,\:3,\:4,\:5)=\sg\)
 \(\sg_2=(1,\:3,\:5,\:2,\:4)=\sg^2\)
 \(\sg_3=(1,\:4,\:2,\:5,\:3)=\sg^3\)
 \(\sg_4=(1,\:5,\:4,\:3,\:2)=\sg^4\)
です。これらをもとに \(\sg_{ij}\) を計算すると、次のようになります。

 \(\sg_{10}=\sg_0\tau_1=\:e\)
 \(\sg_{20}=\sg_0\tau_2=(2,\:3,\:5,\:4)\)
 \(\sg_{30}=\sg_0\tau_3=(2,\:4,\:5,\:3)\)
 \(\sg_{40}=\sg_0\tau_4=(2,\:5)(3,\:4)\)

 \(\sg_{11}=\sg_1\tau_1=(1,\:2,\:3,\:4,\:5)\)
 \(\sg_{21}=\sg_1\tau_2=(1,\:2,\:4,\:3)\)
 \(\sg_{31}=\sg_1\tau_3=(1,\:2,\:5,\:4)\)
 \(\sg_{41}=\sg_1\tau_4=(1,\:2)(3,\:5)\)

 \(\sg_{12}=\sg_2\tau_1=(1,\:3,\:5,\:2,\:4)\)
 \(\sg_{22}=\sg_2\tau_2=(1,\:3,\:2,\:5)\)
 \(\sg_{32}=\sg_2\tau_3=(1,\:3,\:4,\:2)\)
 \(\sg_{42}=\sg_2\tau_4=(1,\:3)(4,\:5)\)

 \(\sg_{13}=\sg_3\tau_1=(1,\:4,\:2,\:5,\:3)\)
 \(\sg_{23}=\sg_3\tau_2=(1,\:4,\:5,\:2)\)
 \(\sg_{33}=\sg_3\tau_3=(1,\:4,\:3,\:5)\)
 \(\sg_{43}=\sg_3\tau_4=(1,\:4)(2,\:3)\)

 \(\sg_{14}=\sg_4\tau_1=(1,\:5,\:4,\:3,\:2)\)
 \(\sg_{24}=\sg_4\tau_2=(1,\:5,\:3,\:4)\)
 \(\sg_{34}=\sg_4\tau_3=(1,\:5,\:2,\:3)\)
 \(\sg_{44}=\sg_4\tau_4=(1,\:5)(2,\:4)\)

この巡回置換表示にもとづいて
 [ \(c,\:d\) ][ \(a,\:b\) ]\(=\)[ \(ac,\:bc+d\) ]
を検証してみます。たとえば、
 \(\sg_{23}\sg_{42}\)\(=\)[ \(2,\:3\) ][ \(4,\:2\) ]
\(=\)[ \(8,\:7\) ]\(=\)[ \(3,\:2\) ]
\(=\sg_{32}\)
となるはずですが、

 \(\sg_{42}\)\(=(1,\:3)(4,\:5)\)
\(=\left(\begin{array}{c}1&2&3&4&5\\3&2&1&5&4\end{array}\right)\)
 \(\sg_{23}\)\(=(1,\:4,\:5,\:2)\)
\(=\left(\begin{array}{c}3&2&1&5&4\\3&1&4&2&5\end{array}\right)\)

 \(\sg_{23}\sg_{42}\)\(=\left(\begin{array}{c}1&2&3&4&5\\3&1&4&2&5\end{array}\right)\)
\(=(1\:3\:4\:2)=\sg_{32}\)

となって、確かに成り立っています。また逆元の式、
 [ \(a,\:b\) ]\(^{-1}=\)[ \(a^{-1},\:-a^{-1}b\) ]
ですが、

 \(\sg_{23}^{\:\:-1}\)\(=\)[ \(2,\:3\) ]\(^{-1}\)
\(=\)[ \(3,\:-3\cdot3\) ]\(=\)[ \(3,\:-9\) ]
\(=\)[ \(3,\:1\) ]\(=\sg_{31}\)
\(=(1,\:2,\:5,\:4)\)
 \(\sg_{23}^{\:\:-1}\)\(=(1,\:4,\:5,\:2)^{-1}\)
\(=(2,\:5,\:4,\:1)\)
\(=(1,\:2,\:5,\:4)\)

となり、成り立っています。\(\bs{F}_5\) での演算では \(2^{-1}=3\) です。


以上により、
\(\begin{eqnarray}
&&\:\:G=\{\sg_{ij}\:| &i=1,2,3,4\\
&&&j=0,1,2,3,4\}\\
\end{eqnarray}\)
とおくと、
 \(G=\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q})\)
であることがわかりました。ここで、
 \(G_{\large s}=\{e,\:\sg,\:\sg^2,\:\sg^3,\:\sg^4\}\)
は \(G\) の正規部分群になります。なぜなら、\(G_{\large s}=\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q}(\zeta))\) なので、\(G_{\large s}\) の固定体は \(\bs{Q}(\zeta)\) です。一方、\(\bs{Q}(\zeta)/\bs{Q}\) はガロア拡大なので、正規性定理53C)によって \(G_{\large s}\) は \(G\) の正規部分群になるからです。

\(G_{\large s}\) が \(G\) の正規部分群であることは、計算でも確かめられます。"弱可換性" である、
 \(\tau\sg=\sg^2\tau\)
の関係を使うと、
\(\begin{eqnarray}
&&\:\:\tau G_{\large s}&=\{\tau,\:\sg^2\tau,\:\sg^4\tau,\:\sg^6\tau,\:\sg^8\tau\}\\
&&&=\{\tau,\:\sg^2\tau,\:\sg^4\tau,\:\sg\tau,\:\sg^3\tau\}\\
&&&=\{e,\:\sg^2,\:\sg^4,\:\sg,\:\sg^3\}\cdot\tau\\
&&&=G_{\large s}\tau\\
\end{eqnarray}\)
が成り立ち、これを繰り返すと、
 \(\tau^iG_{\large s}=G_{\large s}\tau^i\)
が成り立ちます。\(G\) の任意の元を \(\sg^j\tau^i\) とすると、
\(\begin{eqnarray}
&&\:\:(\sg^j\tau^i)G_{\large s}&=\sg^jG_{\large s}\tau^i\\
&&&=G_{\large s}(\sg^j\tau^i)\\
\end{eqnarray}\)
となって(\(\sg^j\) と \(G_{\large s}\) は可換です)、\(G_{\large s}\) が正規部分群の定義を満たします。

また、\(G\) の任意の元 \(x\) を \(x=\sg^j\tau^i\) とし、剰余群 \(G/G_{\large s}\) の任意の元 を \(xG_{\large s}\) とすると、
\(\begin{eqnarray}
&&\:\:xG_{\large s}&=(\sg^j\tau^i)G_{\large s}=\sg^jG_{\large s}\tau^i\\
&&&=G_{\large s}\tau^i\\
\end{eqnarray}\)
となりますが、\(G_{\large s}\tau^i=\tau^iG_{\large s}\) が成り立つので、
\(\begin{eqnarray}
&&\:\:(xG_{\large s})^4&=(G_{\large s}\tau^i)^4\\
&&&=(G_{\large s})^4(\tau^i)^4\\
&&&=G_{\large s}\\
\end{eqnarray}\)
となり、剰余群 \(G/G_{\large s}\) は位数 \(4\) の巡回群です。


もともと \(G_{\large s}=\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q}(\zeta))\) であり、\(\bs{Q}(\zeta)\) の固定体は \(G_{\large s}\) でした。従って、

 \(\bs{Q}\:\subset\:\bs{Q}(\zeta)\) \(\subset\:\bs{Q}(\zeta,\al)\)
 \(G\:\sp\:G_{\large s}\) \(\sp\:\{e\}\)

のガロア対応が得られました。\(G_{\large s}\) は \(G\) の正規部分群で \(G/G_{\large s}\) は巡回群、また \(G_{\large s}\) も巡回群です。従って \(G\) は可解群です。なお、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})=G_{\large t}\) です。以上をまとめると、

\(\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q}))\)
 \(=G\)
 \(=\{\:\sg_{ij}\:\}=\{\:\sg_j\tau_i\:\}\)
   \((i=1,2,3,4)\:\:(j=0,1,2,3,4)\)
 \(\sg=(1,\:2,\:3,\:4,\:5)\)
  \(\sg_0=e\)
  \(\sg_1=\sg\)
  \(\sg_2=\sg^2\)
  \(\sg_3=\sg^3\)
  \(\sg_4=\sg^4\)
 \(\tau=(2,\:3,\:5,\:4)\)
  \(\tau_1=e\)
  \(\tau_2=\tau\)
  \(\tau_3=\tau^3\)
  \(\tau_4=\tau^2\)
\(\begin{eqnarray}
&&G_{\large s}&=\{e,\:\sg,\:\sg^2,\:\sg^3,\:\sg^4\}\\
&&&=\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q}(\zeta)))\\
&&G_{\large t}&=\{e,\:\tau,\:\tau^2,\:\tau^3\}\\
&&&=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q}))\\
\end{eqnarray}\)

となります。

フロベニウス群 F20.jpg
\(\bs{x^5-2=0}\) のガロア群(\(F_{20}\))

ガロア群 \(F_{20}\) の \(20\)個の元を、4つの5角形の頂点に配置した図。\((1,2,3,4,5)\) などはガロア群を構成する巡回置換を表す。また \(23451\) などは、その巡回置換によって \(12345\) を置換した結果を表す(白ヌキ数字は置換で不動の点)。この群の生成元は、色を付けた \((1,2,3,4,5)\) と \((2,3,5,4)\) である。

位数 \(20\) の元、\(G=\mr{Gal}(\bs{Q}(\zeta,\al)/\bs{Q})\) は、(位数 \(20\)の)フロベニウス群という名前がついていて、\(F_{20}\) と表記します。フロベニウス群は、高々1点を固定する置換と恒等置換から成る群です。\(G\) は、固定する点がない \(\sg=(1,\:2,\:3,\:4,\:5)\) と、1点だけを固定する \(\tau=(2,\:3,\:5,\:4)\) の2つを生成元とする群なので、フロベニウス群です。この \(F_{20}\) の内部構造を調べます。

\(\tau_i\) には \(\{\tau_1=e,\:\tau_2,\:\tau_3,\:\tau_4\}\) の生成元とはならない \(\tau_4\) があります。\(\sg_i,\:\tau_j\) このような性格をもつのは \(\tau_4\) だけです。その \(\tau_4\) は、
 \(\tau_4=(2,\:5)(3,\:4)\)
 \(\tau_4^{\:2}=e\)
でした。つまり \(\{e,\:\tau_4\}\) は位数2の巡回群です。

ということは、\(\sg_1=\sg\) と \(t_4\) を生成元として、新たな群を定義できることになります。その群の元を \(\pi_{ij}\) とし、
 \(\pi_{ij}=\sg^j\tau_4^i\:\:(i=0,1,\:\:j=0,\:1,\:2,\:3,\:4)\)
\(\begin{eqnarray}
&&\:\: \pi_{0j}&=\sg_j\\
&&\:\: \pi_{1j}&=\sg_j\cdot\tau_4\\
&&&=\sg_j\cdot(2,\:5)(3,\:4)\\
\end{eqnarray}\)
と定義すると、位数 \(10\) の群になります。具体的に計算してみると、
 \(\pi_{00}=e\)
 \(\pi_{01}=(1,\:2,\:3,\:4,\:5)\)
 \(\pi_{02}=(1,\:3,\:5,\:2,\:4)\)
 \(\pi_{03}=(1,\:4,\:2,\:5,\:3)\)
 \(\pi_{04}=(1,\:5,\:4,\:3,\:2)\)
 \(\pi_{10}=(2,\:5)(3,\:4)\)
 \(\pi_{11}=(1,\:2)(3,\:5)\)
 \(\pi_{12}=(1,\:3)(4,\:5)\)
 \(\pi_{13}=(1,\:4)(2,\:3)\)
 \(\pi_{24}=(1,\:5)(2,\:4)\)
となります。

この群は5次の2面体群であり、\(D_{10}\) で表します(\(D_5\) と書く流儀もある。幾何学の文脈では \(D_5\))。一般に 2面体群 \(D_{2n}\)(または \(D_n\))とは、裏表のある正\(n\)角形を元の形に一致するように移動する(=対称移動をする)ことを表す群です。正5角形の頂点に1から5の名前を一周する順につけると、たとえば \((1,\:2,\:3,\:4,\:5)\) は \(72^\circ\)の回転であり、\((2,\:5)(3,\:4)\) は頂点1を通る対称軸で折り返す対称移動です。3次の2面体群を1.3節で図示しました。

\(D_{10}\) は \(F_{20}\) の部分群で、位数は \(10\) です。位数が \(20\) の半分なので、半分の部分群は正規部分群の定理(65F)により、\(D_{10}\) は \(F_{20}\) の正規部分群であり、剰余群 \(F_{20}/D_{10}\) は位数が \(2\) なので巡回群です。


さらに \(D_{10}\) の部分群として \(\sg_i\:(i=0,1,2,3,4)\) があり、位数 \(5\) の巡回群です。位数 \(5\) の巡回群は \(C_5\) と表記されます。\(C_5\) の位数もまた \(D_{10}\) の半分なので、\(C_5\) は \(D_{10}\) の正規部分群であり、剰余群 \(D_{10}/C_5\) は巡回群です。結局、\(F_{20}\) には、

 \(F_{20}\) \(\sp\:C_5\:\sp\:\{\:e\:\}\)
 \(D_{10}\) \(\sp\:C_5\:\sp\:\{\:e\:\}\)
 \(C_5\) \(\sp\:\{\:e\:\}\)

という部分群の列が存在することになり、これらすべてが可解列です。実は、可解な5次方程式のガロア群は、\(F_{20}\)、\(D_{10}\)、\(C_5\) の3つしかないことが知られています。以上のように \(x^5-2=0\) のガロア群は、可解なガロア群の全部を含んでいるのでした。

\(x^5+11x-44\)
x^5+11x-44=0.jpg
\(x^5+11x-44=0\) の根
一般的に、ある5次方程式が与えられたとき、そのガロア群を決定するには複雑な計算が必要です。また可解な5次方程式の解を、四則演算とべき根で表現するためのアルゴリズムも複雑です。これらは「可解性の必要十分条件を示す」というガロア理論の範囲を超えるので、この記事では省略します。可解な5次方程式の例をあげておきます。

 \(x^5+11x-44=0\)

のガロア群は \(D_{10}\) であることが知られています。この方程式は実数解が1つで、虚数解が4つです。実数解を \(\al\) とし、Wolfram Alpha で \(\al\) の近似値と厳密値を求めてみると次のようになります。この厳密値は本当かと心配になりますが、検算してみると正しいことが分かります。

\(\begin{eqnarray}
&&\:\:\al&=1.8777502748964972576\cd\\
&&&=\dfrac{\sqrt[5]{11}}{(\sqrt[5]{5})^4}(\al_1+\al_2-\al_3+\al_4)\\
\end{eqnarray}\)

  \(\al_1=\sqrt[5]{\phantom{-}75+50\sqrt{5}-12\sqrt{5-\sqrt{5}}-59\sqrt{5+\sqrt{5}}}\)
  \(\al_2=\sqrt[5]{\phantom{-}75-50\sqrt{5}+59\sqrt{5-\sqrt{5}}-12\sqrt{5+\sqrt{5}}}\)
  \(\al_3=\sqrt[5]{-75+50\sqrt{5}+59\sqrt{5-\sqrt{5}}-12\sqrt{5+\sqrt{5}}}\)
  \(\al_4=\sqrt[5]{\phantom{-}75+50\sqrt{5}+12\sqrt{5-\sqrt{5}}+59\sqrt{5+\sqrt{5}}}\)

 
8.結論 
 

第5章から第7章まで、かなり長い証明のステップでしたが、可解性の必要条件(64B)、

\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つ がべき根で表されているとする。\(f(x)\) の最小分解体を \(\bs{L}\) とするとき、\(\mr{Gal}(\bs{L}/\bs{Q})\) は可解群である。

と、可解性の十分条件(75A)、

体 \(\bs{F}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{K}\) とする。\(\mr{Gal}(\bs{K}/\bs{F})=G\) とし、\(G\) は可解群とする。このとき \(f(x)=0\) の解は四則演算とべき根で表現できる。

および、具体的な5次方程式のガロア群の検討と合わせて、次が結論づけられました。

\(\bs{Q}\) 上の多項式 \(f(x)\) の最小分解体を \(\bs{L}\) とする。方程式 \(f(x)=0\) の解が四則演算とべき根で表現できるための必要十分条件は、ガロア群
\(\mr{Gal}(\bs{L}/\bs{Q})\) が可解群であることである。

5次方程式のガロア群には、可解群でないものと可解群の両方がある。従って、任意の5次方程式の解を四則演算とべき根で統一的に表現する解の公式はない。

高校数学で理解するガロア理論:終

 
定義\(\cdot\)定理一覧 
 


2.整数の群


2.1 整数
互除法の原理21A
自然数 \(a\) と \(b\) の最大公約数を \(\mr{gcd}(a,\:b)\) で表す。自然数 \(a\) を \(b\) で割った余りを \(r\) とすると、

 \(\mr{gcd}(a,\:b)=\mr{gcd}(b,\:r)\)

である。

不定方程式の解の存在21B
2変数 \(x,\:y\) の1次不定方程式を、
 \(ax+by=c\)
  (\(a,\:b,\:c\) は整数。\(a\neq0,\:b\neq0\))
とし、\(a\) と \(b\) の最大公約数を \(d\) とする。このとき、
 \(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。


このことは1次不定方程式が3変数以上であっても成り立つ。つまり
 \(a_1x_1+a_2x_2+\:\cd\:+a_nx_n=c\)
  (\(a_i\) は \(0\) 以外の整数)
とし、
 \(d=\mr{gcd}(a_1,a_2,\:\cd\:,\:a_n)\)
とする。このとき、
 \(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。

不定方程式の解の存在21C
\(0\) でない整数 \(a\) と \(b\) が互いに素とすると、1次不定方程式、
 \(ax+by=1\)
は整数解をもつ。また、\(n\) を任意の整数とすると、
 \(ax+by=n\)
は整数解をもつ。あるいは、任意の整数 \(n\) は、
 \(n=ax+by\) \((x,\:y\) は整数)
の形で表現できる。


これは3変数以上であっても成り立つ。たとえば3変数の場合は、\(0\) でない整数 \(a,\:b,\:c\) が互いに素、つまり、
 \(\mr{gcd}(a,b,c)=1\)
であるとき、\(n\) を任意の整数として、1次不定方程式、
 \(ax+by+cz=n\)
は整数解を持つ。

法による演算の定義21D
\(a,\:b\) を整数、\(n\) を自然数とする。\(a\) を \(n\) で割った余りと、\(b\) を \(n\) で割った余りが等しいとき、
 \(a\equiv b\:\:(\mr{mod}\:n)\)
と書き、\(a\) と \(b\) は「法 \(n\) で合同」という。あるいは「\(\mr{mod}\:n\) で合同」、「\(\mr{mod}\:n\) で(見て)等しい」とも記述する。

法による演算規則21E
\(a,\:b,\:c,\:d\) を整数、\(n,r\) を自然数とし、
 \(a\equiv b\:\:(\mr{mod}\:n)\)
 \(c\equiv d\:\:(\mr{mod}\:n)\)
とする。このとき、
\((1)\:a+c\)\(\equiv b+d\) \((\mr{mod}\:n)\)
\((2)\:a-c\)\(\equiv b-d\) \((\mr{mod}\:n)\)
\((3)\:ac\)\(\equiv bd\) \((\mr{mod}\:n)\)
\((4)\:a^r\)\(\equiv b^r\) \((\mr{mod}\:n)\)
である。

中国剰余定理21F
\(n_1\) と \(n_2\) を互いに素な自然数とする。\(a_1\) と \(a_2\) を、\(0\leq a_1 < n_1,\:0\leq a_2 < n_2\) を満たす整数とする。このとき、
 \(x\equiv a_1\:\:(\mr{mod}\:n_1)\)
 \(x\equiv a_2\:\:(\mr{mod}\:n_2)\)
の連立方程式を満たす整数 \(x\) が存在する。この \(x\) は \(\mr{mod}\:n_1n_2\) でみて唯一である。つまり、\(0\leq x < n_1n_2\) の範囲に解が唯一存在する。

中国剰余定理・多連立21G
\(n_1,\:n_2,\:\cd\:,\:n_k\) を、どの2つをとっても互いに素な自然数とする。\(a_i\) を \(0\leq a_i < n_i\:\:(1\leq i\leq k)\) を満たす整数とする。このとき、

 \(x\equiv a_1\:\:(\mr{mod}\:n_1)\)
 \(x\equiv a_2\:\:(\mr{mod}\:n_2)\)
  \(\vdots\)
 \(x\equiv a_k\:\:(\mr{mod}\:n_k)\)

の連立合同方程式を満たす整数 \(x\) が存在する。この \(x\) は \(\mr{mod}\:n_1n_2\cd n_k\) でみて唯一である。つまり、\(0\leq x < n_1n_2\cd n_k\) の範囲では唯一の解が存在する。

2.2 群
群の定義22A
集合 \(G\) が次の ① ~ ④ を満たすとき、\(G\) は(group)であると言う。

① \(G\) の任意の元 \(x,\:y\) に対して演算(\(\cdot\)で表す)が定義されていて、\(x\cdot y\in G\) である。

② 演算について結合法則が成り立つ。つまり、
 \((x\cdot y)\cdot z=x\cdot(y\cdot z)\)

③ \(G\) の任意の元 \(x\) に対して
 \(x\cdot e=e\cdot x=x\)
を満たす元 \(e\) が存在する。\(e\) を単位元という。

④ \(G\) の任意の元 \(x\) に対して
 \(x\cdot y=y\cdot x=e\)
となる元 \(y\) が存在する。\(y\) を \(x\) の逆元といい、\(x^{-1}\) と表す。

2.3 既約剰余類群
既約剰余類群23A
剰余群 \(\bs{Z}/n\bs{Z}\) から、代表元が \(n\) と互いに素なものだけを選び出したものを既約剰余類という。

「既約剰余類」は、乗算に関して群になる。これを「既約剰余類群」といい、\((\bs{Z}/n\bs{Z})^{*}\) で表す。

定義により、\((\bs{Z}/n\bs{Z})^{*}\) の群位数は \(\varphi(n)\) である。\(\varphi\) はオイラー関数で、\(\varphi(n)\) は \(n\) 以下で \(n\) と互いに素な自然数の数を表す。\(n\) が素数 \(p\) の場合の群位数は \(\varphi(p)=p-1\) である。

2.4 有限体 \(\bs{\bs{F}_p}\)
有限体上の方程式124A
\(\bs{F}_p\) 上の1次方程式、
 \(ax+b=c\)
は1個の解をもつ。

有限体上の方程式224B
\(\bs{F}_p\) 上の多項式を \(f(x)\) とする。
\(f(a)=0\) なら、\(f(x)\) は \(x-a\) で割り切れる。

有限体上の方程式324C
\(\bs{F}_p\) 上の \(n\)次多項式を \(f_n(x)\) とする。方程式、
 \(f_n(x)=0\)
の解は、高々 \(n\) 個である。

2.5 既約剰余類群は巡回群

既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) は巡回群の直積に同型である

位数の定理25A
\((\bs{Z}/n\bs{Z})^{*}\) の元を \(a\) とする。以下が成り立つ。

[補題1]
\(a^x=1\) となる \(x\:\:(1\leq x)\) が必ず存在する。\(x\) のうち最小のものを \(d\) とすると、\(d\) を \(a\) の位数(order)と呼ぶ。

[補題2]
\(a,\:a^2,\:a^3,\:\cd\:,\:a^d=1\) は 全て異なる。ないしは、
\(a^0=1,\:a,\:a^2,\:\cd\:,a^{d-1}\) は 全て異なる。

[補題3]
\(n=p\)(素数)とする。\(d\) 乗すると \(1\) になる \((\bs{Z}/p\bs{Z})^{*}\) の元は、\(a,\:a^2,\:a^3,\:\cd\:,\:a^d\) がそのすべてである。

[補題4]
\(a^x=1\) となる \(x\) は \(d\) の倍数である。

[補題5]
\(a\) の位数を \(d\) とすると、\(d\) は 群位数 の約数である。

オイラーの定理25B
自然数 \(n\) と素な自然数 \(a\) について、
 \(a^{\varphi(n)}=1\:\:(\mr{mod}\:n)\)
が成り立つ(オイラーの定理)。\(\varphi\) はオイラー関数で、\(\varphi(n)\) は \(n\) 以下で \(n\) と互いに素な自然数の数を表す。

\(n=p\)(素数)の場合は、\(p\) と素な数 \(a\) について、
 \(a^{p-1}=1\:\:(\mr{mod}\:p)\)
となる(フェルマの小定理)。

位数 \(d\) の元の数25C
\(p\) を素数とする。\((\bs{Z}/p\bs{Z})^{*}\) において、群位数 \((p-1)\) の約数 \(d\) のすべてについて、位数 \(d\) の元が \(\varphi(d)\) 個存在する。

生成元の存在125D
\(p\) を素数とするとき、\((\bs{Z}/p\bs{Z})^{*}\) には生成元が存在する。生成元とは、その位数が \((\bs{Z}/p\bs{Z})^{*}\) の群位数、\(p-1\) の元である。

なお、素数 \(p\) に対して、
 \(a^x\equiv1\:\:(\mr{mod}\:p)\)
となる \(x\) の最小値が \(p-1\) であるような \(a\) を、\(p\) の「原始根」という。既約剰余類群 \((\bs{Z}/p\bs{Z})^{*}\) の生成元=原始根である。

生成元の探索アルゴリズム(25D’)
\(p\) を素数とし、\((\bs{Z}/p\bs{Z})^{*}\) の元の一つを \(a\) とする。\(a\) の位数を \(d\) とし、\(d < p-1\) とする。このとき、\(d < e\) である位数 \(e\) をもつ \((\bs{Z}/p\bs{Z})^{*}\) の元が存在する。

[補題6]

\(a,\:b\) を自然数とすると、2つの数、\(a\,',\:b\,'\) をとって、
 \(a\,'|a\)
 \(b\,'|b\)
 \(\mr{gcd}(a\,',b\,')=1\)
 \(\mr{lcm}(a,b)=a\,'b\,'\)
となるようにできる。

[補題7]

\(p\) を素数とし、\((\bs{Z}/p\bs{Z})^{*}\) の元の一つを \(a\) とする。\(a\) の位数を \(d\) とし、\(a^k\:\:(1\leq k\leq p-1)\) の位数を \(e\) とすると、
 \(e=\dfrac{d}{\mr{gcd}(k,d)}\)
である。

[補題8]

\(p\) を奇素数とし、\(k\) を \(p\) と素な数とする(\(\mr{gcd}(k,p)=1\))。また、整数 \(m\) を \(m\geq1\) とする。

このとき、
 \((1+kp^m)^p=1+k\,'p^{m+1}\)
と表すことができて、\(k\,'\) は \(p\) と素である。

生成元の存在225E
\(p\) を \(p\neq2\) の素数(=奇素数)とする。また、\(g\) を \((\bs{Z}/p\bs{Z})^{*}\) の生成元とする。

このとき \(g\) または \(g+p\) は \((\bs{Z}/p^n\bs{Z})^{*}\) の生成元である。つまり、\((\bs{Z}/p^n\bs{Z})^{*}\) には生成元が存在する。

生成元の存在2(その1)

\(p\) を奇素数とし、\(g\) を \((\bs{Z}/p\bs{Z})^{*}\) の生成元とする。また、\(g\) は、
 \(g^{p-1}=1+kp\)
 \(\mr{gcd}(k,p)=1\)
と表されているとする。

この条件で、\(g\) は \((\bs{Z}/p^n\bs{Z})^{*}\) の生成元でもある。

生成元の存在2(その2)

\(p\) を奇素数とし、\(g\) を \((\bs{Z}/p\bs{Z})^{*}\) の生成元とする。また、\(g\) は、
 \(g^{p-1}=1+kp^m\:\:(m\geq2)\)
 \(\mr{gcd}(k,p)=1\)
と表されているとする。

この条件では、\(g+p\) が \((\bs{Z}/p^n\bs{Z})^{*}\) の生成元である。

2のべき乗の既約剰余類群25F
2のべき乗の既約剰余類群は、

 \((\bs{Z}/2^n\bs{Z})^{*}\cong(\bs{Z}/2\bs{Z})\times(\bs{Z}/2^{n-2}\bs{Z})\)

である。つまり2つの巡回群の直積に同型である。

[補題9]

\(n\geq2\) のとき、\(5\) の \(\mr{mod}\:2^n\) での位数は \(2^{n-2}\) である。

既約剰余類群の構造25G
既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) は巡回群の直積に同型である。


3.多項式と体


3.1 多項式
多項式の不定方程式31A
\(a(x)\) と \(b(x)\) が互いに素な多項式のとき、
 \(a(x)f(x)+b(x)g(x)=1\)
を満たす多項式 \(f(x)\)、\(g(x)\)で、
 \(\mr{deg}\:g(x)\: < \:\mr{deg}\:a(x)\)
のものが存在する。

また、\(a(x)\) と \(b(x)\) が互いに素な多項式で、\(h(x)\) が任意の多項式のとき、
 \(a(x)f(x)+b(x)g(x)=h(x)\)
を満たす多項式 \(f(x)\)、\(g(x)\) で、
 \(\mr{deg}\:g(x)\: < \:\mr{deg}\:a(x)\)
のものが存在する。

既約多項式の定義31B
有理数 \(\bs{Q}\) を係数とする多項式で、\(\bs{Q}\) の範囲ではそれ以上因数分解できない多項式を \(\bs{Q}\) 上で既約な多項式という。

整数係数多項式の既約性31C
整数係数の多項式 \(f(x)\) が \(\bs{Q}\) 上で(=有理数係数の多項式で)因数分解できれば、整数係数でも因数分解できる。

既約多項式と素数の類似性31D

\(p(x)\) を既約多項式とし、\(f(x),\:g(x)\) を多項式とする。\(f(x)g(x)\) が \(p(x)\) で割り切れるなら、\(f(x),\:g(x)\) の少なくとも1つは \(p(x)\) で割り切れる。



\(p(x)\) を既約多項式とし、\(g(x)\) を多項式とする。\((g(x))^2\) が \(p(x)\) で割り切れるなら、\(g(x)\) は \(p(x)\) で割り切れる。また、\((g(x))^k\:\:(2\leq k)\) が \(p(x)\) で割り切れるなら、\(g(x)\) は \(p(x)\) で割り切れる。


既約多項式の定理131E
\(p(x)\) を \(\bs{Q}\) 上の既約多項式、\(f(x)\) を \(\bs{Q}\) 上の多項式とする。

方程式 \(p(x)=0\) と \(f(x)=0\) が(複素数の範囲で)共通の解を1つでも持てば、\(f(x)\) は \(p(x)\) で割り切れる。

既約多項式の定理231F
\(p(x)\) を \(\bs{Q}\) 上の既約多項式、\(f(x)\) を \(\bs{Q}\) 上の多項式とする。

\(f(x)\) の次数が1次以上で \(p(x)\) の次数未満のとき、方程式 \(p(x)=0\) と \(f(x)=0\) は(複素数の範囲で)共通の解を持たない。

既約多項式の定理331G
\(p(x)\) を \(\bs{Q}\) 上の既約多項式とすると、方程式 \(p(x)=0\) は(複素数の範囲で)重解を持たない。

最小多項式の定義31H
\(\al\) を 方程式の解とする。\(\al\) を解としてもつ、体 \(\bs{Q}\) 上の方程式のうち、次数が最小の多項式を、\(\al\) の \(\bs{Q}\) 上の最小多項式と言う。

最小多項式は既約多項式31I
\(\bs{Q}\) 上の方程式、\(f(x)=0\) が \(\al\) を解としてもつとき、

① \(f(x)\) が 体 \(\bs{Q}\) 上の既約多項式である
② \(f(x)\) が \(\al\) の \(\bs{Q}\) 上の最小多項式である

の2つは同値である。

3.2 体
最小分解体の定義32A
体 \(\bs{Q}\) 上の多項式 \(f(x)\) を、
 \(f(x)=(x-\al_1)(x-\al_2)\cd(x-\al_n)\)
と、1次多項式で因数分解したとき、
 \(\bs{Q}(\al_1,\:\al_2,\:\cd\:,\:\al_n)\)
を \(f(x)\) の最小分解体と言う。\(f(x)\) は既約多項式でなくてもよい

単拡大定理32B
\(\bs{Q}\) 上の方程式の解をいくつか添加した代数拡大体 \(\bs{K}\) は単拡大である。つまり \(\bs{K}\) の元 \(\theta\) があって、\(\bs{K}=\bs{Q}(\theta)\) となる。この \(\theta\) を原始元という。

単拡大の体32C
ある代数的数 \(\al\) の \(\bs{Q}\) 上の最小多項式が \(n\)次多項式 \(f(x)\) であるとする。このとき 体 \(\bs{K}\) を、

\(\bs{K}\)\(\overset{\text{ }}{=}\)\(\{a_{n-1}\al^{n-1}+\)\(\:\cd\:+\)\(a_2\al^2+\)\(a_1\al+\)\(a_0\:|\:a_i\in\bs{Q}\:\}\)
  \((0\leq i\leq n-1)\)

と定義すると、\(\bs{K}\) は体になり、\(\bs{K}=\bs{Q}(\al)\) である。その元の表し方は一意である。

3.3 線形空間
線形空間の定義33A
集合 \(V\) と 体 \(\bs{K}\) が次を満たすとき、\(V\) を \(\bs{\bs{K}}\) 上の線形空間(=ベクトル空間。linear space / vector space)と言う。

加算の定義

\(V\) の任意の元 \(u,\:v\) に対して \((u+v)\in V\) が定義されていて、この加算(\(+)\) の定義に関して \(V\) は可換群である。すなわち、

\((1)\) 単位元の存在
\(u+x=x\) となる \(x\) が存在する。これを \(0\) と書く。
\((2)\) 逆元の存在
\(u+x=0\) となる \(x\) が存在する。これを \(-u\) と書く。
\((3)\) 結合則が成り立つ
任意の元 \(u,\:v\:,w\) について、\((u+v)+w=u+(v+w)\)
\((4)\) 交換則が成り立つ
\(u+v=v+u\)

スカラー倍の定義

\(V\) の任意の元 \(u\) と \(\bs{K}\) の任意の元 \(k\) に対して、スカラー倍 \(ku\in V\) が定義されていて、加算との間に次の性質がある。\(u,\:v\) を \(V\) の元、\(k,\:m\) を \(\bs{K}\) の元とし、\(\bs{K}\) の乗法の単位元を \(1\) とする。

\((1)\:\:k(mu)=(km)u\)
\((2)\:\:(k+m)u=ku+mu\)
\((3)\:\:k(u+v)=ku+kv\)
\((4)\:\:1v=v\)

1次独立と1次従属33B
1次独立

線形空間 \(V\) の元の組、\(\{v_1,v_2,\cd,v_n\}\) に対して、
 \(a_1v_1+a_2v_2+\)..\(+a_nv_n=0\)
を満たす \(\bs{K}\) の元 \(a_1,a_2,\cd,a_n\) が、\(a_1=a_2=\cd=a_n=0\) しかないとき、\(\{v_1,v_2,\cd,v_n\}\) は1次独立であるという。

1次従属

1次独立でないときが1次従属である。つまり、線形空間 \(V\) の元の組、\(\{v_1,v_2,\cd,v_n\}\) に対して、
 \(a_1v_1+a_2v_2+\)..\(+a_nv_n=0\)
を満たす、少なくとも一つは \(0\) でない \(\bs{K}\) の元 \(a_1,a_2,\cd,a_n\) があるとき、\(\{v_1,v_2,\cd,v_n\}\) は1次従属であるという。

基底の定義33C
線形空間 \(V\) の元の組、\(\{v_1,v_2,\cd,v_n\}\) に対して、次の2つが満たされるとき、\(\{v_1,v_2,\cd,v_n\}\) を基底という。

・ \({v_1,v_2,\cd,v_n}\) は1次独立である。
・ \(V\) の任意の元 \(v\) は、\(\bs{K}\) の元 \(a_1,a_2,\cd,a_n\) を選んで、
\(v=a_1v_1+a_2v_2+\)..\(+a_nv_n\)
と表せる。

基底から1つの元を除外したものは基底ではなくなる。また基底に1つの元を加えたものも基底ではない。

基底の数の不変性33D
\(\{u_1,u_2,\cd,u_m\}\) と \(\{v_1,v_2,\cd,v_n\}\) がともに線形空間 \(V\) の基底であるとき、\(m=n\) である。

次元の不変性33E
線形空間の基底に含まれる元の数が有限個のとき、その個数を線形空間の次元と言う。次元は基底の取り方によらない。

単拡大体の基底33F
\(\bs{Q}\) 上の \(n\)次既約多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の解の一つを \(\al\) とする。単拡大体である \(\bs{Q}(\al)\) は \(\bs{Q}\) 上の \(n\)次元線形空間であり、\(\{1,\:\al,\:\al^2,\:\cd\:,\al^{n-1}\}\) は \(\bs{Q}(\al)\) の基底である。

拡大次数の定義33G
代数拡大体 \(\bs{F},\:\bs{K}\) が \(\bs{F}\:\subset\:\bs{K}\) であるとき、\(\bs{K}\) は \(\bs{F}\) 上の線形空間である。\(\bs{K}\) の次元を、\(\bs{K}\)の(\(\bs{F}\)からの)拡大次数といい、
 \([\:\bs{K}\::\:\bs{F}\:]\)
で表す。

拡大次数の連鎖律33H
代数拡大体 \(\bs{F},\:\bs{M},\:\bs{K}\) が \(\bs{F}\:\subset\:\bs{M}\:\subset\:\bs{K}\) であるとき、
 \([\:\bs{K}\::\:\bs{F}\:]=[\:\bs{K}\::\:\bs{M}\:][\:\bs{M}\::\:\bs{F}\:]\)
が成り立つ。

体の一致33I
体 \(\bs{K}_0\) と 体 \(\bs{K}\) があり、\(\bs{K}_0\:\subset\:\bs{K}\) を満たしている。\(\bs{K}_0\) と \(\bs{K}\) が有限次元であり、その次元が同じであれば、\(\bs{K}_0=\bs{K}\) である。


4.一般の群


4.1 部分群\(\bs{\cdot}\)正規部分群、剰余類\(\bs{\cdot}\)剰余群
部分集合の演算41A
群 \(G\) の2つの部分集合を \(H,\:N\) とする。\(H\) と \(N\) の演算結果である \(G\) の部分集合、\(HN\) を次の式で定義する。

 \(HN\:=\:\{\:hn\:|\:h\in H,\:n\in N,\:hn\) は群の演算定義による \(\}\)

群 \(G\) の元の演算では結合則が成り立つから、部分集合の演算でも結合則が成り立つ。つまり \(H_1,\:H_2,\:H_3\) をを3つの部分群とすると、
 
 \((H_1H_2)H_3=H_1(H_2H_3)\)

である。部分集合の元は \(1\)つでもよいから、\(x\) が \(G\) の元で \(x\) だけの部分集合を \(\{x\}\) とすると、
 \(H_1(\{x\}H_2)=(H_1\{x\})H_2\)
である。これを、
 \(H_1(xH_2)=(H_1x)H_2\)
と記述する。

部分群の十分条件41B
群 \(G\) の部分集合を \(N\) とし、\(N\) の任意の2つの元を \(x,\:y\) とする。

 \(xy\in N,\:x^{-1}\in N\)

なら、\(N\) は \(G\) の部分群である。

部分群の元の条件41C
群 \(G\) の部分群を \(N\) とし、\(G\) の 元を \(x\) とすると、次の2つは同値である。

 ① \(xN\:=\:N\)
 ② \(x\:\in\:N\)

部分群の共通部分は部分群41D
\(G\) の部分群を \(H,\:N\) とすると、\(H\cap N\) は部分群である。

剰余類の定義41E
有限群 \(G\) の位数を \(n\) とし( \(|G|=n\) )、\(H\) を \(G\) の部分群とする。\(H\) に左から \(G\) のすべての元、\(g_1,\:g_2,\:\cd\:,\:g_n\) かけて、集合、
 \(g_1H,\:g_2H,\:\cd\:,g_nH\)
を作る。

\(g_1H,\:g_2H,\:\cd\:,g_nH\) から、同じになる集合を集めたものを剰余類と呼ぶ。その同じになる集合から代表的なものを一つ取り出し、
 \(xH\:\:(x\in G)\)
の形で剰余類を表す。\(g_1H,\:g_2H,\:\cd\:,g_nH\) から剰余類が \(d\) 個できたとし、それらを、
 \(x_1H,\:x_2H,\:\cd\:,x_dH\)
とすると、
 \(i\neq j\) のとき \(x_iH\:\cap\:x_jH=\phi\)
 \(G=x_1H\:\cup\:x_2H\:\cup\:\cd\:\cup\:x_dH\)
である。剰余類は、群 \(G\) の元を部分群 \(H\) によって分類したものといえる。

\(x_1H,\:x_2H,\:\cd\:,x_dH\) を「左剰余類」という。同じことが \(G\) の元を右からかけたときにも成り立ち、\(Hx_1{}^{\prime},\:Hx_2{}^{\prime},\:\cd\:,Hx_d\,'\) を「右剰余類」という。

群 \(G\) の 部分群 \(H\) による剰余類の個数 \(d\) について、\(d\cdot|H|=|G|\) が成り立つ。この \(d\) を「\(G\) の \(H\) による指数」といい、\([\:G\::\:H\:]\) で表す。つまり、
 \(|G|=[\:G\::\:H\:]\cdot|H|\)
である(ラグランジュの定理)。

群 \(G\) の元 \(g\) の位数(\(g^x=e\) となる最小の \(x\))を \(n\) とすると、\(n\) は群位数 \(|G|\) の約数である。

群位数が素数の群は巡回群である。

正規部分群の定義41F
有限群 \(G\) の部分群を \(H\) とする。\(G\) の全ての元 \(g\) について、

 \(gH=Hg\)

が成り立つとき、\(H\) を \(G\) の正規部分群(normal subgroup)という。正規部分群では左剰余類と右剰余類が一致する。

定義により、\(G\) および \(\{e\}\) は \(G\) の正規部分群である。また \(G\) が可換群であると、その部分群は正規部分群である。巡回群は可換群だから、巡回群の部分群は正規部分群である。

剰余群の定義41G
有限群 \(G\) の正規部分群を \(H\) とする。\(G\) の \(H\) による剰余類

 \(x_1H,\:x_2H,\:\cd\:,x_dH\:\:(\:x_i\in G,\:d=[\:G\::\:H\:]\:)\)

部分集合の演算の定義(41A)で群になる。この群を \(G\) の \(H\) による剰余群(quotient group)といい、\(G/H\) で表す。剰余群は商群とも言う。

巡回群の剰余群は巡回群41H
巡回群の部分群による剰余群は巡回群である。

部分群と正規部分群41I
\(G\) の正規部分群を \(H\)、部分群を \(N\) とする。このとき、

(a) \(NH\) は \(G\) の部分群である。
(b) \(G\:\sp\:N\:\sp\:H\) なら、\(H\) は \(N\) の正規部分群である。
(c) \(N\cap H\) は \(N\) の正規部分群である。

が成り立つ。

4.2 準同型写像
準同型写像と同型写像42A
群 \(G\) から群 \(G\,'\) への写像 \(f\) がある。\(G\) の任意の2つの元、\(x,\:y\) について、

 \(f(xy)=f(x)f(y)\)

が成り立つとき、\(f\) を \(G\) から \(G\,'\) への準同型写像(homomorphism)という。右辺は群 \(G\,'\) の演算定義に従う。

また、\(f\) が全単射写像のとき、\(f\) を同型写像(isomorphism)という。群 \(G\) から \(G\,'\) への同型写像が存在するとき、\(G\) と \(G\,'\) は同型であるといい、
 \(G\:\cong\:G\,'\)
で表す。

準同型写像の像と核42B
群 \(G\) から群 \(G\,'\) への準同型写像 \(f\) がある。\(G\) の元を \(f\) で移した元の集合を「\(f\) の像(image)」といい、\(\mr{Im}\:f\) と書く。\(\mr{Im}\:f\) を \(f(G)\) と書くこともある。

\(\mr{Im}\:f\) は \(G\,'\) の部分群である。

\(G\) の単位元を \(e\)、\(G\,'\) の単位元を \(e\,'\) とする。準同型写像 \(f\) によって \(e\,'\) に移る \(G\) の元の集合を「\(f\) の核(kernel)」といい、\(\mr{Ker}\:f\) と書く。

\(\mr{Ker}\:f\) は \(G\) の部分群である。

核が単位元なら単射42C
群 \(G\) から群 \(G\,'\) への準同型写像 \(f\) がある。このとき

 \(\mr{Im}\:f\) \(=\:G\,'\) なら \(f\) は全射
 \(\mr{Ker}\:f\) \(=\:\{e\}\) なら \(f\) は単射

である。

核は正規部分群42D
群 \(G\) から群 \(G\,'\) への準同型写像を \(f\) とする。このとき \(\mr{Ker}\:f\) は \(G\) の正規部分群である。

4.3 同型定理
準同型定理43A
群 \(G\) から群 \(G\,'\) への準同型写像 \(f\) がある。\(H=\mr{Ker}\:f\) とすると、\(G\) の \(H\) による剰余群は、\(G\) の \(f\) による像と同型である。つまり、

 \(G/H\:\cong\:\mr{Im}\:f\)

が成り立つ。

第2同型定理43B
群 \(G\) の正規部分群を \(H\)、部分群を \(N\) とすると、

 \(N/(N\cap H)\:\cong\:NH/H\)

が成り立つ。


5.ガロア群とガロア対応


5.1 体の同型写像
体の同型写像51A
体 \(\bs{K}\) から 体 \(\bs{F}\) への写像 \(f\) が全単射であり、\(\bs{K}\) の任意の元、\(x,\:y\) に対して、
\(\begin{eqnarray}
&&\:\:f(x+y)&=f(x)+f(y)\\
&&\:\:f(xy)&=f(x)f(y)\\
\end{eqnarray}\)
が成り立つとき、\(f\) を体の同型写像という。この定義による同型写像は、加法と乗法のみならず、四則演算を保存する。

特に、\(\bs{K}\) から \(\bs{K}\) への同型写像を自己同型写像という。

\(\bs{K}\) から \(\bs{F}\) への同型写像が存在するとき、体 \(\bs{K}\) と 体 \(\bs{F}\) は同型であるといい、\(\bs{K}\:\cong\:\bs{F}\) で表す。

体 \(\bs{K}\) と \(\bs{F}\) がともに \(\bs{Q}\) を含むとき、\(a\in\bs{Q}\) に対して、
 \(f(a)=a\)
である。つまり有理数は同型写像で不変である。

有理式の定義51B
変数 \(x\) の多項式(係数は \(\bs{Q}\) の元)を分母・分子とする分数式を、\(\bs{Q}\) 上の有理式という。

同型写像と有理式の順序交換51C
体 \(\bs{K}\) と 体 \(\bs{F}\) は \(\bs{Q}\) を含むものとする。\(\sg\) を \(\bs{K}\) から \(\bs{F}\) への同型写像とし、\(a\) を \(\bs{K}\) の元とする。\(f(x)\) を \(\bs{Q}\) 上の有理式とすると、

 \(\sg(f(a))=f(\sg(a))\)

である。これは多変数の有理式でも成り立つ。\(a_1,a_2,\cd,a_n\) を \(\bs{K}\) の元、\(f(x_1,x_2,\cd,x_n)\) を \(\bs{Q}\) 上の有理式とすると、

 \(\sg(f(a_1,a_2,\cd,a_n))=f(\sg(a_1),\sg(a_1),\cd,\sg(a_n))\)

である。

\(\bs{Q}\) を含む体を \(\bs{K}\) とし、\(\bs{K}\)の拡大体を \(\bs{F}\:,\bs{F}\,'\) とする。\(\sg\) を \(\bs{K}\) を不変にする \(\bs{F}\) から \(\bs{F}\,'\) への同型写像とし、\(a\) を \(\bs{F}\) の元とする。\(f(x)\) を \(\bs{K}\) 上の有理式とすると、
 \(\sg(f(a))=f(\sg(a))\)
である。

同型写像での移り先51D
\(\sg\) を体 \(\bs{K}\) から 体 \(\bs{F}\) への同型写像とする。\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つを\(\al\)とし、\(\al\)は \(\bs{K}\) の元とする。すると \(\sg(\al)\) も \(f(x)=0\) の解である。

同型写像による解の置換51E
\(\sg\) を体 \(\bs{K}\) から 体 \(\bs{F}\) への同型写像とし、\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。方程式 \(f(x)=0\) の \(n\)個の解を \(\al_1,\al_2,\cd,\al_n\) とし、これらが全て \(\bs{K}\) に含まれるとする。

すると \(\sg(\al_1),\sg(\al_2),\cd,\sg(\al_n)\) は、\(\al_1,\al_2,\cd,\al_n\) を入れ替えたものである。

同型写像の存在51F
\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。\(\al,\:\beta\) を方程式 \(f(x)=0\) の異なる解とする。

すると \(\sg(\al)=\beta\) を満たす \(\bs{Q}(\al)\) から \(\bs{Q}(\beta)\) への唯一の同型写像 \(\sg\) が存在する。

単拡大体の同型写像51G
\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。\(f(x)=0\) の全ての解を \(\al_1=\al,\:\al_2,\:\cd\:,\al_n\) とする。このとき \(\bs{Q}(\al)\) に作用する同型写像は \(n\)個あり、それらは、
 \(\sg_i(\al)=\al_i\) \((1\leq i\leq n)\)
で定められ、\(\sg_i\) は \(\bs{Q}(\al)\) から \(\bs{Q}(\al_i)\) への同型写像となる。

同型写像の延長51H
\(\bs{Q}\) 上の \(n\)次既約多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の解の一つを \(\al\) とする。

\(\bs{\bs{Q}(\al)}\) 上の \(m\)次既約多項式を \(g(x)\) とし、方程式 \(g(x)=0\) の解の一つを \(\beta\) とする。また、\(\bs{Q}(\al)\) の同型写像の一つを \(\tau\) とする。

このとき、\(\tau\) は \(\bs{Q}(\al,\beta)\) の同型写像 \(\sg_j\) に延長できる。延長とは、\(\sg_j\) の作用を \(\bs{Q}(\al)\) に限定した写像の作用が \(\tau\) と一致することを言う。\(\tau\) を延長した同型写像 \(\sg_j\) は \(m\)個ある(\(0\leq j < m\))。

5.2 ガロア拡大とガロア群
ガロア拡大52A
ガロア拡大は次のように定義される。この2つの定義は同値である。

① (最小分解体定義)体 \(\bs{F}\) 上の多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とするとき、\(\bs{L}/\bs{F}\) をガロア拡大という。

② (自己同型定義)体 \(\bs{F}\) の代数拡大体 \(\bs{K}\) があったとき、\(\bs{F}\) の元を不動にする \(\bs{K}\) の同型写像がすべて自己同型写像になるとき、\(\bs{K}/\bs{F}\) をガロア拡大という。

\(\bs{K}/\bs{F}\) がガロア拡大のとき、\(\bs{\bs{F}}\) を不変にする \(\bs{K}\) の自己同型写像の集合は群になる。これをガロア群といい、\(\mr{Gal}(\bs{K}/\bs{F})\) で表す。

次数と位数の同一性52B
\(\bs{Q}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\)、ガロア群を \(G\) とするとき、\([\:\bs{L}\::\:\bs{Q}\:]=|G|\) である。

\(\bs{F}\) を代数拡大体とし、\(\bs{F}\) のガロア拡大を \(\bs{L}\) とする。\(\bs{L}\) のガロア群の位数は \(\bs{F}\) から \(\bs{L}\) への拡大次数に等しい。つまり、
 \([\:\bs{L}\::\:\bs{F}\:]=|\mr{Gal}(\bs{L}/\bs{F})|\)
である。

中間体からのガロア拡大52C
\(\bs{K}\) を \(\bs{F}\) のガロア拡大体とし、\(\bs{M}\) を \(\bs{F}\subset\bs{M}\subset\bs{K}\) である任意の体(=中間体)とするとき、\(\bs{K}\) は \(\bs{M}\) のガロア拡大体でもある。

5.3 ガロア対応
固定体と固定群53A
体 \(\bs{F}\) 上の方程式の最小分解体(=ガロア拡大体)を \(\bs{K}\) とし、ガロア群を \(G\) とする。\(G\) の部分群 \(H\) によって不変な \(\bs{K}\) の元の集合 \(\bs{M}\) は体になる。これを \(\bs{K}\) における \(H\) の固定体といい、\(\bs{K}(H)\) で表す(または \(\bs{K}^H\))。

また \(\bs{K}\) の中間体 \(\bs{M}\) のすべての元を不変にする \(G\) の部分集合 \(H\) は群になる。これを \(G\) における \(\bs{M}\) の固定群と呼び、\(G(\bs{M})\) で表す(または \(G^M\))。

ガロア対応53B
\(\bs{F}\) のガロア拡大体を \(\bs{K}\) とし、ガロア群を \(G\) とする。\(G\) の任意の部分群を \(H\) とし、\(H\) による \(\bs{K}\) の固定体 \(\bs{K}(H)\) を \(\bs{M}\) とする(次式)。

\(\begin{eqnarray}
&&G\:\sp\:H &\sp\:\{e\}\\
&&\bs{F}\:\subset\:\bs{K}(H)=\bs{M} &\subset\:\bs{K}\\
\end{eqnarray}\)

\(\bs{M}\)の固定群を \(G(\bs{M})\) とする(次式)。ガロア群の定義により \(G(\bs{M})=\mr{Gal}(\bs{K}/\bs{M})\) である。

\(\begin{eqnarray}
&&\bs{F}\:\subset\:\bs{M} &\subset\:\bs{K}\\
&&G\:\sp\:G(\bs{M}) &\sp\:\{e\}\\
\end{eqnarray}\)

このとき、
 \(G(\bs{M})=H\)
つまり、
\(\begin{eqnarray}
&&\:\:\mr{Gal}(\bs{K}/\bs{M})&=H \\
&&\:\:\bs{K}(G(\bs{M}))&=\bs{M}\\
\end{eqnarray}\)
が成り立つ。

正規性定理53C
\(\bs{Q}\) のガロア拡大を \(\bs{K}\) とし、\(\mr{Gal}(\bs{K}/\bs{Q})=G\) とする。\(\bs{K}\) の中間体 \(\bs{M}\) と \(G\) の部分群 \(H\) がガロア対応になっているとする。このとき

① \(\bs{M}/\bs{Q}\) がガロア拡大である
② \(H\)が\(G\)の正規部分群である

の2つは同値である。また、これが成り立つとき、
 \(\mr{Gal}(\bs{M}/\bs{Q})\:\cong\:G/H\)
という群の同型が成り立つ。


6.可解性の必要条件


6.1 可解群
可解群の定義61A
群 \(G\) から 単位元 \(e\) に至る部分群の列、

\(G=H_0\:\sp H_1\sp\cd\sp H_i\sp H_{i+1}\sp\cd\sp H_k=\{\:e\:\}\)

があって、\(H_{i+1}\) は \(H_i\) の正規部分群であり、剰余群 \(H_i/H_{i+1}\) が巡回群であるとき、\(G\) を可解群(solvable group)と言う。

\(H_{i+1}\) が \(H_i\) の正規部分群であるとき、\(H_i\) を正規列と言う。また、\(H_i/H_{i+1}\) が巡回群のとき、\(H_i\) を可解列という。

巡回群は可解群61B
巡回群は可解群である。また、巡回群の直積も可解群である。

可解群の部分群は可解群61C
可解群の部分群は可解群である。

可解群の像は可解群61D
可解群の準同型写像による像は可解群である。

このことより、
 可解群の剰余群は可解群
であることが分かる。なぜなら、群 \(G\) の部分群を \(N\) とすると、\(G\) から \(G/N\) への自然準同型、つまり \(x\in G\) として、
 \(x\:\longmapsto\:xN\)
の準同型写像を定義できるからである。

6.2 巡回拡大
巡回拡大の定義62A
\(\bs{Q}\) のガロア拡大を \(\bs{K}\) とする。\(\mr{Gal}(\bs{K}/\bs{Q})\) が巡回群のとき、\(\bs{K}/\bs{Q}\) を巡回拡大(cyclic extension)と言う。

累巡回拡大の定義62B
\(\bs{Q}\) の拡大体を \(\bs{K}\) とする。

\(\bs{Q}=\bs{K}_0\subset\bs{K}_1\subset\cd\subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cd\subset\bs{K}_k=\bs{K}\)

となる拡大列があって(\(k > 1\))、\(\bs{K}_{i+1}/\bs{K}_i\:(0\leq i < k)\) が巡回拡大のとき、\(\bs{K}/\bs{Q}\) は累巡回拡大であると言う。ただし、\(\bs{\bs{K}/\bs{Q}}\) が累巡回拡大だとしても、\(\bs{\bs{K}/\bs{Q}}\) がガロア拡大であるとは限らない

累巡回拡大ガロア群の可解性62C
\(\bs{Q}\) のガロア拡大を \(\bs{K}\)、そのガロア群を \(G\) とする。このとき、

① \(G\) が可解群である
② \(\bs{K}/\bs{Q}\) が累巡回拡大である

の2つは同値である。

6.3 原始\(\bs{n}\)乗根を含む体とべき根拡大

1の原始\(n\)乗根を \(\zeta\) とする。このとき
 ・\(\bs{Q}(\zeta)/\bs{Q}\) はガロア拡大
 ・\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\:\cong\:(\bs{Z}/n\bs{Z})^{*}\)
が成り立つ。

原始n乗根の数63A
\(x^n-1=0\) の \(n\)個の解のうち、\(n\)乗して初めて \(1\) になる解を \(1\)の原始\(n\)乗根という。

原始\(n\)乗根は \(\varphi(n)\) 個ある。\(\varphi(n)\) はオイラー関数で、\(n\) と互いに素である \(n\) 以下の自然数の数を表す。

原始n乗根の累乗63B
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、
 \(\zeta^m\:\:(1\leq m\leq n)\)
は、\(1\) の\(n\)乗根の全体を表す。また、
 \(\zeta^m\:\:(\mr{gcd}(m,n)=1)\)
は、\(1\) の原始\(n\)乗根の全体を表す。

原始n乗根の最小多項式63C
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とする。\(\zeta\) の最小多項式を \(f(x)\) とし、\(k\) を \(n\) とは素な数とする。

このとき \(f(\zeta^k)=0\) である。

円分多項式63D
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とし、\(\zeta\) の最小多項式を \(f(x)\) とすると、\(f(x)\) は円分多項式である。円分多項式とは、方程式 \(f(x)=0\) が \(\varphi(n)\) 個の解をもち、それらすべてが 原始\(n\)乗根 である多項式である。

従って、原始\(n\)乗根は互いに共役である。最小多項式は既約多項式なので、円分多項式は既約多項式である。

\(\bs{Q}\) に \(\zeta\) を添加した単拡大体 \(\bs{Q}(\zeta)\) は \(f(x)\) の最小分解体であり、\(\bs{Q}(\zeta)/\bs{Q}\) はガロア拡大である。

Q(ζ)のガロア群63E
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、

 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/n\bs{Z})^{*}\)

である。つまり \(1\) の原始\(n\)乗根の一つを \(\bs{Q}\) に添加した拡大体のガロア群は、既約剰余類群に同型である。

Q(ζ)のガロア群は巡回群63F
\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は巡回群の直積と同型である。

従って、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は可解群であり(61B)、累巡回拡大である(62C)。

べき根拡大の定義63G
\(\bs{K}\) 上の方程式 \(x^n-a=0\:(a\in\bs{K}\)、\(a\neq1)\) の解の一つで、\(\bs{K}\) に含まれないものを \(\sqrt[n]{a}\) とするとき、\(\bs{K}(\sqrt[n]{a})\) を \(\bs{K}\) のべき根拡大(radical extension)と呼ぶ。

また、\(\bs{K}\) からのべき根拡大を繰り返して拡大体 \(\bs{F}\) ができるとき、\(\bs{F}/\bs{K}\) を累べき根拡大と言う。

原始n乗根を含むべき根拡大63H
\(1\) の原始\(n\)乗根を \(\zeta\) とし、\(\bs{K}\) に \(\zeta\) が含まれるとする。\(\bs{K}\) 上の方程式 \(x^n-a=0\:(a\in\bs{K}\)、\(a\neq1)\) の解の一つで、\(\bs{K}\) に含まれないものを \(\sqrt[n]{a}\) とし、\(\bs{L}=\bs{K}(\sqrt[n]{a})\) とすると、
\(\bs{L}/\bs{K}\) は巡回拡大である
\(\mr{Gal}(\bs{L}/\bs{K})\) の位数は \(n\) の約数である
が成り立つ。

6.4 可解性の必要条件
ガロア閉包の存在64A
\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つである \(\al\) がべき根で表されているとする。このとき「\(\bs{Q}\) のガロア拡大 \(\bs{E}\) で、\(\al\) を含み、\(\bs{E}/\bs{Q}\) が累巡回拡大」であるような 代数拡大体 \(\bs{E}\) が存在する。

可解性の必要条件64B
\(\bs{Q}\) 上の \(n\)次既約方程式 \(f(x)=0\) の解の一つ がべき根で表されているとする。\(f(x)\) の最小分解体を \(\bs{L}\) とするとき、\(\mr{Gal}(\bs{L}/\bs{Q})\) は可解群である。

6.5 5次方程式の解の公式はない
置換は巡回置換の積65A
すべての置換は共通文字を含まない巡回置換の積で表せる。

置換は互換の積65B
すべての置換は互換の積で表せる。

置換の偶奇性65C
一つの置換を互換の積で表したとき、その互換の数は奇数か偶数かのどちらかに決まる。

交代群は正規部分群65D
\(S_n\) の元は同数の偶置換と奇置換から成る。従って、
 \([\:S_n\::\:A_n\:]=2\)
である。

\(A_n\) は \(S_n\) の正規部分群であり、\(S_n/A_n\) は巡回群である。

交代群は3文字巡回置換の積65E
交代群 \(A_n\) の任意の元は、3文字の巡回置換の積で表せる。

半分の部分群は正規部分群65F
群 \(G\) の部分群を \(N\) とする。
 \(|G|=2|N|\)
のとき(つまり 群の指数 \([G:N]=2\) のとき)、\(N\) は \(G\) の正規部分群である。

対称群の可解性65G
5次以上の対称群、\(S_n\:\:(n\geq5)\) は可解群ではない。

5次方程式の解の公式はない65H
\(\bs{Q}\) の代数拡大体を \(\bs{K}\) とする。\(\bs{K}\) の任意の元である\(k\)5つの変数 \(b_1,b_2,b_3,b_4,b_5\) を根とする多項式を、
\(\begin{eqnarray}
&&\:\:f(x)&=(x-b_1)(x-b_2)(x-b_3)(x-b_4)(x-b_5)\:\:(b_i\in\bs{K})\\
&&&=x^5-a_4x^4+a_3x^3-a_2x^2+a_1x-a_0\\
\end{eqnarray}\)
とし、\(\bs{Q}\) に \(a_0,a_1,a_2,a_3,a_4,\)を添加した代数拡大体を \(\bs{F}\) とする。つまり、
 \(\bs{F}=\bs{Q}(a_0,\:a_1,\:a_2,\:a_3,\:a_4)\)
である。

このとき、\(\bs{K}\) の \(\bs{F}\) 上の ガロア群 \(G\) は5次対称群 \(S_5\) である。\(S_5\) は可解群ではないので(65G)、従って \(b_i\) を \(a_i\) のべき根で表すことはできない。

6.6 可解ではない5次方程式
コーシーの定理66A
群 \(G\) の位数 \(|G|\) が素数 \(p\) を約数にもつとき、\(g^p=e\:\:(g\neq e)\) となる \(G\) の元 \(g\) が存在する。つまり、\(G\) は位数 \(p\) の巡回群を部分群としてもつ。

実数解が3つの5次方程式66B
\(f(x)\) を既約な5次多項式とする。方程式 \(f(x)=0\) が複素数解を2つ、実数解を3つもつなら、方程式は可解ではない。


7.可解性の十分条件


7.1 1の原始\(\bs{n}\)乗根
原始n乗根はべき根で表現可能71A
\(1\) の 原始\(n\)乗根はべき根で表現できる。

7.2 べき根拡大の十分条件のため補題
べき根拡大の十分条件のため補題172A
\(\bs{L}\) を \(\bs{K}\) のガロア拡大とし、\(\mr{Gal}(\bs{L}/\bs{K})\) を \(\sg\) で生成される位数 \(n\) の巡回群とする。式 \(g(x)\) を、

\(g(x)\)\(\overset{\text{ }}{=}\)\(x+a_1\sg(x)+a_2\sg^2(x)+\:\cd\:+a_{n-1}\sg^{n-1}(x)=0\)
\((a_i\in\bs{L},\:1\leq i\leq n-1)\)

と定義する。このとき、\(\bs{L}\) の全ての元 \(x\) について、\(g(x)=0\) となるような \(\bs{L}\) の元、\(a_1,\:a_2,\:\cd\:,a_{n-1}\) は存在しない。

べき根拡大の十分条件のため補題272B
\(\zeta\) を \(1\) の原始\(n\)乗根とし、\(\zeta\)を含む代数体を \(\bs{K}\) とする。\(\bs{K}\) のガロア拡大体を \(\bs{L}\) とし、\(\mr{Gal}(\bs{L}/\bs{K})\) は \(\sg\) で生成される位数 \(n\) の巡回群とする(= \(\bs{L}/\bs{K}\) が巡回拡大)。また \(f(x)\) を \(\bs{K}\) 上の \(n\)次既約多項式とし、\(\bs{L}\) が方程式 \(f(x)=0\) の解 \(\theta\) を用いて、\(\bs{L}=\bs{K}(\theta)\) と表されているものとする。このとき、

 \(g(x)=x+\zeta^{n-1}\sg(x)+\zeta^{n-2}\sg^2(x)+\cd+\zeta\sg^{n-1}(x)\)

とおくと、\(g(\theta),\:g(\theta^2),\:\cd\:,g(\theta^{n-1})\) のうち少なくとも一つは \(0\) ではない。

7.3 べき根拡大の十分条件
べき根拡大の十分条件73A
1の原始\(n\)乗根を \(\zeta\) とし、代数体 \(\bs{\bs{K}}\) には \(\bs{\zeta}\) が含まれるとする。\(\bs{L}/\bs{K}\) をガロア拡大とし、\(\mr{Gal}(\bs{L}/\bs{K})\) が巡回群とする(= \(\bs{L}/\bs{K}\) が巡回拡大)。拡大次数は \([\bs{L}:\bs{K}]=n\) とする。

このとき、\(\bs{L}\) は \(\bs{K}\) のべき根拡大である。

7.4 べき根拡大と巡回拡大の同値性
べき根拡大と巡回拡大は同値74A
\(1\) の原始\(n\)乗根を \(\zeta\) とし、代数体 \(\bs{\bs{K}}\) には \(\bs{\zeta}\) が含まれるとする。また、\(\bs{K}\) の\(n\)次拡大体を \(\bs{L}\) とする( \([\:\bs{L}\::\:\bs{K}\:]=n\) )。

このとき、
\(\bs{L}/\bs{K}\) は巡回拡大である
\(\bs{L}/\bs{K}\) はべき根拡大である。
の2つは同値である。

7.5 可解性の十分条件
可解性の十分条件75A
体 \(\bs{K}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とする。\(\mr{Gal}(\bs{L}/\bs{K})=G\) とし、\(G\) は可解群とする。

このとき \(f(x)=0\) の解は四則演算とべき根で表現できる。

7.6 位数2の巡回拡大は平方根拡大:正5角形が作図できる理由

\(p\) を素数とし、原始\(p\)乗根を \(\zeta\) とすると、
 \(|\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})|=|(\bs{Z}/p\bs{Z})^{*}|=p-1\)
なので、
 \(p-1=2^k\:\:(1\leq k)\)
の条件があると、\(\bs{Q}\) から \(\bs{Q}(\zeta)\) に至る「平方根拡大」の列が存在し、\(\zeta\) は四則演算と平方根 \(\sqrt{\phantom{a}}\) だけで表現できる。従って 正 \(p\)角形は定規とコンパスで作図可能である

定義・定理一覧:終



nice!(0) 

No.358 - 高校数学で理解するガロア理論(5) [科学]

\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{#1}} \newcommand{\ol}[1]{\overline{#1}} \newcommand{\sb}{\subset} \newcommand{\sp}{\supset} \newcommand{\al}{\alpha} \newcommand{\sg}{\sigma}\newcommand{\cd}{\cdots}\)
 
7.可解性の十分条件 
 

第6章では、方程式が可解であれば(=解が四則演算とべき根で表現できれば)ガロア群が可解群であることをみました。第7章ではその逆、つまり、ガロア群が可解群であれば方程式が可解であることを証明します。


7.1 1の原始\(n\)乗根


可解性の十分条件を証明するために、まず、\(1\) の原始\(n\)乗根がべき根で表せることを証明します。このことを前提にした証明を最後で行うからです。念のために「1.1 方程式とその可解性」でのべき根の定義を振り返ると、

 \(\sqrt[n]{\:a\:}\) (\(n=2\) の場合は \(\sqrt{\:a\:}\))

という表記は、

・ \(a\) が正の実数のとき、\(n\)乗して \(a\) になる正の実数を表わす
・ \(a\) が負の実数や複素数の場合は、\(n\)乗して \(a\) になる数のどれかを表わす

のでした。\(\sqrt{2}\) は \(1.4142\cd\) と \(-1.4142\cd\) のどちらかを表わすのではなく、\(1.4142\cd\) のことです。\(\sqrt[3]{2}\) は \(3\)乗して \(2\) になる3つの数のうちの正の実数(\(\fallingdotseq1.26\))を表わします。一方、\(\sqrt{-1\:}\) は\(2\)乗して \(-1\) になる2つの数のうちのどちらかで、その一方を \(i\) と書くと、もう一方が \(-i\) です。

この定義から、方程式 \(x^n-1=0\) の解を \(\sqrt[n]{\:1\:}\) と書くと、それは \(1\) のことです。従って、

\(1\) 以外の「\(n\)乗して \(1\) になる数」がべき根で表現できる

ことを証明しておく必要があります。その証明はガロア理論とは無関係にできます。それが以下です。


原始n乗根はべき根で表現可能:71A)

\(1\) の 原始\(n\)乗根はべき根で表現できる。


[証明]

\(n\) についての数学的帰納法で証明する。\(n=2,\:3\) のときにべき根で表現できるのは根の公式で明らかである。また、原始4乗根は \(\pm i\) なので、\(n\leq4\) のとき題意は成り立つ。そこで、\(n\) 未満のときにべき根で表現できると仮定し、\(n\) のときにもべき根で表現できることを証明する。

\(n\) が合成数のときと素数のときに分ける。まず \(n\) が合成数なら、
 \(n=s\cdot t\)
と表現できる。
 \(1\) の原始\(s\)乗根を \(\zeta\)
 \(1\) の原始\(t\)乗根を \(\eta\)
とし、\(X=x^{s}\) とおく。方程式 \(X^{t}-1=0\) の \(t\)個の解は \(\eta^k\:\:(0\leq k\leq t-1)\) と表わされる(63B)から、\(x^n-1\) は、
\(\begin{eqnarray}
&&\:\:x^n-1&=x^{st}-1=X^{t}-1\\
&&&=\displaystyle\prod_{k=0}^{t-1}(X-\eta^k)\\
&&&=\displaystyle\prod_{k=0}^{t-1}(x^{s}-\eta^k)\\
\end{eqnarray}\)
と因数分解できる。従って、方程式 \(x^n-1=0\) の解は、
 \(x^{s}=\eta^k\:\:\:(0\leq k\leq t-1)\)
の解である。これを解くと、
 \(x=\sqrt[s]{\eta^k}\cdot\zeta^j\:\:\:(0\leq j\leq s-1,\:\:0\leq k\leq t-1)\)
である(\(k=0\) のときは根号の規則に従って \(\sqrt[s]{1}=1\))。帰納法の仮定により、\(\zeta,\:\eta\) はべき根で表現できるから、上式により \(1\) の \(n\) 乗根はべき根で表現できる。従って原始\(n\)乗根もべき根で表現できる。


以降は \(n\) が素数の場合を証明する。\(n\) を \(p\)(= 素数)と表記する。以下では数式を見やすくするため \(p=5\) の場合を例示するが、証明の過程は一般性を失わない論理で進める。

位数 \(p-1\) の2つの巡回群、\((\bs{Z}/p\bs{Z})^{*}\) と \(\bs{Z}/(p-1)\bs{Z}\) の性質を利用する。\(p=5\) の場合は、位数 \(4\) の既約剰余類群 \((\bs{Z}/5\bs{Z})^{*}\) と、剰余群 \(\bs{Z}/4\bs{Z}\) である。

\(p\) が素数のとき、既約剰余類群 \((\bs{Z}/p\bs{Z})^{*}\) は生成元をもつ(25D)。\((\bs{Z}/5\bs{Z})^{*}\) の生成元の一つは \(2\) である(もう一つは \(3\))。生成元を \(2\) とすると、
\(\begin{eqnarray}
&&\:\:(\bs{Z}/5\bs{Z})^{*}&=\{2,\:2^2,\:2^3,\:2^4\}\\
&&&=\{2,\:4,\:3,\:1\}\\
\end{eqnarray}\)
の巡回群となる。演算は乗算である。一方、\(\bs{Z}/4\bs{Z}\) は、演算が加算、生成元が \(1\)(または \(3\))の巡回群で、
\(\begin{eqnarray}
&&\:\:\bs{Z}/4\bs{Z}&=\{1,\:1+1,\:1+1+1,\:1+1+1+1\}\\
&&&=\{1,\:2,\:3,\:0\}\\
\end{eqnarray}\)
である。ここで、2つの変数 \(x,\:y\) をもつ関数を、

\(f(x,y)=y^2x+y^4x^2+y^3x^3+y\)

とおく。この関数は、4つある項の \(x,\:y\) の指数について、
 \(y\) の指数は \([\:2,\:4,\:3,\:1\:]\) : \((\bs{Z}/5\bs{Z})^{*}\) の巡回パターン
 \(x\) の指数は \([\:1,\:2,\:3,\:0\:]\) : \(\bs{Z}/4\bs{Z}\) の巡回パターン
となるようにしてある。

次に、2つの数 \(a,\:b\) を、
\(\begin{eqnarray}
&&\:\:a^5&=1\:(a\neq1)\\
&&\:\:b^4&=1\\
\end{eqnarray}\)
であるような数とする。\(a\) は \(1\) の原始5乗根でもよいし、その任意の累乗でもよい。とにかく \(a^5=1\:(a\neq1)\) を満たす数である。このとき、
 \(a^5-1=0\)
 \((a-1)(a^4+a^3+a^2+a+1)=0\)
なので、
 \(a^4+a^3+a^2+a+1=0\) ないしは
 \(a^4+a^3+a^2+a=-1\)
が成り立つ。\(b\) も \(1\) の原始4乗根か、その任意の累乗であるが、\(b=1\) であってもよい。

そうすると \(f(b,a)\) は、
 \(f(b,a)=a^2b+a^4b^2+a^3b^3+a\)
   \(a\) の指数は \([\:2,\:4,\:3,\:1\:]\)
   \(b\) の指数は \([\:1,\:2,\:3,\:0\:]\)
である。

次に \(f(b,a^2)\) を計算すると、
\(\begin{eqnarray}
&&\:\:f(b,a^2)&=a^4b+a^8b^2+a^6b^3+a^2\\
&&&=a^4+a^3b+a^1b^2+a^2b^3\\
\end{eqnarray}\)
   \(a\) の指数は \([\:4,\:3,\:1,\:2\:]\)
   \(b\) の指数は \([\:1,\:2,\:3,\:0\:]\)
となる。

\(f(b,a^2)\) を \(f(b,a)\) と比べると、\(a\) の指数が \(1\) ステップだけ巡回している。ということは、\(b\) の指数も \([\:2,\:3,\:0,\:1\:]\) と \(1\) ステップだけ巡回させれば、\(a\) の指数と \(b\) の指数が同期することになり、\(f(b,a^2)\) の式は \(f(b,a)\) と同じものになる。同期させるには \(f(b,a^2)\) に \(b\) を掛ければよい。従って、
 \(bf(b,a^2)=f(b,a)\)
である。

全く同様にして、
\(\begin{eqnarray}
&&\:\:b^2f(b,a^4)&=f(b,a)\\
&&\:\:b^3f(b,a^8)&=b^3f(b,a^3)\\
&&&=f(b,a)\\
\end{eqnarray}\)
となる。まとめると、
\(\begin{eqnarray}
&&\:\:bf(b,a^2)&=f(b,a)\\
&&\:\:b^2f(b,a^4)&=f(b,a)\\
&&\:\:b^3f(b,a^3)&=f(b,a)\\
\end{eqnarray}\)
である。\(b^4=1\) だから、各両辺を \(4\)乗すると、
 \(f(b,a^2)^4=f(b,a)^4\)
 \(f(b,a^4)^4=f(b,a)^4\)
 \(f(b,a^3)^4=f(b,a)^4\)
の式を得る。


本題から少々はずれるが、この仕組みは、\(a\) の指数が「\(2\) の乗算の巡回群」であるため、
 \(a^k\:\rightarrow\:a^{2k}=(a^k)^2\)
と巡回し、\(b\) の指数は「\(1\) の足し算の巡回群」であるため、
 \(b^k\:\rightarrow\:b^{k+1}=b\cdot b^k\)
と巡回することを利用したものである。

なお、\((\bs{Z}/5\bs{Z})^{*}\) の生成元として \(2\) を選んだが、一般の \((\bs{Z}/p\bs{Z})^{*}\) では \(2\) が生成元とは限らない(25D)。その場合は任意の生成元を選んでよい。例えば \((\bs{Z}/5\bs{Z})^{*}\) の生成元として \(3\) を選ぶと
 \([\:3,\:3^2,\:3^3,\:3^4\:]=[\:3,\:4,\:2,\:1\:]\)
と巡回する。従って \(f(x,y)\) を、
 \(f(x,y)=y^3x+y^4x^2+y^2x^3+y\)
と定義すると、\(y,\:a\) の指数は「\(3\) の乗算の巡回群」だから、
 \(a^k\:\rightarrow\:a^{3k}=(a^k)^3\)
と巡回する(\(x,\:b\) については同じ)。つまり、
\(\begin{eqnarray} &&\:\:bf(b,a^3)&=f(b,a)\\ &&\:\:b^2f(b,a^4)&=f(b,a)\\ &&\:\:b^3f(b,a^2)&=f(b,a)\\ \end{eqnarray}\)
となり、
 \(f(b,a^3)=f(b,a)^4\)
 \(f(b,a^4)=f(b,a)^4\)
 \(f(b,a^2)=f(b,a)^4\)
となり、同じ結果を得る。


本題に戻って、次に \(f(b,a)^4\) を展開する。

 \(f(b,a)^4=(a^2b+a^4b^2+a^3b^3+a)^4\)
 \((\br{A})\)

であるが、このまま展開したのでは \(p=5\) のときに固有のものになり、一般性を失う。そこで、上式を展開して整理した形を、

 \(f(b,a)^4=h_1(b)a^2+h_2(b)a^4+h_3(b)a^3+h_0(b)a\)
 \((\br{B})\)

とする。\(a^2,\:a^4,\:a^3,\:a\) の係数となっている \(h_i(b)\:(i=1,2,3,0)\) は \(b\) の多項式である。この展開形の決め方は次のように行う。

① \((\br{A})\) 式の次数は最大 \(a^{16}\) であるが、\(a^5=1\) の関係を利用して最大次数が \(a^4\) になるように「次数下げ」を行う。

② そうすると、\(a\) を含まない \(b\) だけの項が出てくる。そこで、
 \(1=-(a^4+a^3+a^2+a)\)
の関係を利用し、\(b\) だけの項に \(-(a^4+a^3+a^2+a)\) を掛けて「次数上げ」を行う。

③ 以上の結果を、\(a^2,\:a^4,\:a^3,\:a\) ごとに整理したものを \((\br{B})\) とする。

\((\br{B})\) 式においては、
 \(a\) の指数 \(:\:[\:2,\:4,\:3,\:1\:]\)
 \(h_i(b)\) の添字 \(:\:[\:1,\:2,\:3,\:0\:]\)
であることに注意する。

次に \(f(b,a^2)^4\) を計算する。これは \((\br{B})\) 式において \(a\) を \(a^2\) に置き換えればよいから、
\(\begin{eqnarray}
&&\:\:f(b,a^2)^4&=h_1(b)a^4+h_2(b)a^8+h_3(b)a^6+h_0(b)a^2\\
&&&=h_1(b)a^4+h_2(b)a^3+h_3(b)a+h_0(b)a^2\\
\end{eqnarray}\)
   \(a\) の指数 \(:\:[\:4,\:3,\:1,\:2\:]\)
   \(h_i(b)\) の添字 \(:\:[\:1,\:2,\:3,\:0\:]\)
となるが、これは \(f(b,a)^4\) において、
   \(a\) の指数 \(:\:[\:2,\:4,\:3,\:1\:]\)
   \(h_i(b)\) の添字 \(:\:[\:0,\:1,\:2,\:3\:]\)
としたものと同じである。つまり、
 \(f(b,a^2)^4=h_0(b)a^2+h_1(b)a^4+h_2(b)a^3+h_3(b)a\)
である。同様に、
 \(f(b,a^4)^4=h_3(b)a^2+h_0(b)a^4+h_1(b)a^3+h_2(b)a\)
   \(h_i(b)\) の添字 \(:\:[\:3,\:0,\:1,\:2\:]\)
 \(f(b,a^3)^4=h_2(b)a^2+h_3(b)a^4+h_0(b)a^3+h_1(b)a\)
   \(h_i(b)\) の添字 \(:\:[\:2,\:3,\:0,\:1\:]\)
である。

従って、\(f(b,a^i)^4\:\:(i=1,2,4,3)\) において、\(a^j\:(j=2,4,3,1)\) の係数は \(h_k(b)\:(k=1,2,3,0)\) の全てを巡回する。つまり、\(f(b,a^i)^4\:\:(i=1,2,4,3)\) の全部を足すと、\(a^j\:(j=2,4,3,1)\) の係数は全て同じになる。その計算をすると、

 \(\displaystyle\sum_{i=1}^{4}f(b,a^i)^4\)
\(\begin{eqnarray}
&&\:\: =&(h_1(b)+h_2(b)+h_3(b)+h_0(b))\\
&&&\cdot(a^2+a^4+a^3+a)\\
\end{eqnarray}\)

となる。上式の左辺については、
\(\begin{eqnarray}
&&\:\:f(b,a^2)^4&=f(b,a)^4\\
&&\:\:f(b,a^4)^4&=f(b,a)^4\\
&&\:\:f(b,a^3)^4&=f(b,a)^4\\
\end{eqnarray}\)
だったので、左辺は \(4f(b,a)^4\) に等しい。また \(a^5-1=0\) なので \(a^2+a^4+a^3+a=-1\) である。従って、

 \(4f(b,a)^4=-(h_1(b)+h_2(b)+h_3(b)+h_0(b))\)

である。ここで、
 \(g(b)=-\dfrac{1}{4}\:(h_1(b)+h_2(b)+h_3(b)+h_0(b))\)
と定義すると、

 \(f(b,a)^4\)\(=g(b)\)
 \(f(b,a)\)\(=\sqrt[4]{g(b)}\) 
\((\br{C})\)

を得る。\((\br{C})\) 式における \(\sqrt[4]{g(b)}\) とは「\(4\)乗すると \(g(b)\) になる数」という意味である。従って、実際には \(4\)次方程式の \(4\)つの解のどれかを表している。

なお、\(g(b)\) を具体的に計算すると、計算過程は省くが、
 \(g(b)=-16b^3+14b^2+4b-1\)
 \((\br{D})\)
となる。この表現は \(p=5\) のときのもので、一般論につながるものではない。


今までの計算をまとめると、

\(\begin{eqnarray}
&&\:\:a^5=1\:(a\neq1)&\\
&&\:\:b^4=1&\\
\end{eqnarray}\)

\(\begin{eqnarray}
&&\:\:f(b,a)&=a^2b+a^4b^2+a^3b^3+a\\
&&\:\:f(b,a)^4&=h_1(b)a^2+h_2(b)a^4+h_3(b)a^3+h_0(b)a\\
&&\:\:g(b)&=-\dfrac{1}{4}(h_1(b)+h_2(b)+h_3(b)+h_0(b))\\
&&\:\:f(b,a)&=\sqrt[4]{g(b)}\\
\end{eqnarray}\)

である。この過程で、\(a,\:b\) については \(a^5=1\:(a\neq1),\:b^4=1\) という条件しか使っていない。従って、この条件が満たせれば \(a,\:b\) は任意である。そこで \(1\) の原始5乗根を \(\zeta\) とし、\(1\) の原始4乗根を \(\omega\) として、
 \(a=\zeta\)
 \(b=\omega^j\:\:(j=1,2,3,4)\)
とおく。\(b\) は \(1\) にもなりうる(\(\omega^4=1\))。なお、\(\omega\) は普通 \(1\) の原始3乗根の記号であるが、ここでは原始4乗根として使う。

すると、

 \(f(\omega^j,\zeta)=\sqrt[4]{g(\omega^j)}\:\:(j=1,2,3,4)\)
 \((\br{E})\)

という、4つの式が得られる。これは、
 \(\zeta^2,\:\:\zeta^4,\:\:\zeta^3,\:\:\zeta\)
を4つの未知数とする連立1次方程式である。帰納法の仮定により \(\omega\) はべき根で表されているから、方程式を解いて \(\zeta\) が \(\omega\) のべき根(と四則演算)で表されば、証明が完成することになる。


\((\br{E})\) の連立方程式を具体的に書くと、

 \(\zeta^2+\omega^j\zeta^4+(\omega^j)^2\zeta^3+(\omega^j)^3\zeta=\sqrt[4]{g(\omega^j)}\)
   \((j=1,2,3,4)\)

であり、全てを陽に書くと、

\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&\zeta^2+\omega\:\:\zeta^4+(\omega\:\:)^2\zeta^3+(\omega\:\:)^3\zeta&=\sqrt[4]{g(\omega)}& \br{①}&\\
&&\zeta^2+\omega^2\zeta^4+(\omega^2)^2\zeta^3+(\omega^2)^3\zeta&=\sqrt[4]{g(\omega^2)}& \br{②}&\\
&&\zeta^2+\omega^3\zeta^4+(\omega^3)^2\zeta^3+(\omega^3)^3\zeta&=\sqrt[4]{g(\omega^3)}& \br{③}&\\
&&\zeta^2+\omega^4\zeta^4+(\omega^4)^2\zeta^3+(\omega^4)^3\zeta&=\sqrt[4]{g(\omega^4)}& \br{④}&\\
\end{eqnarray}
\end{array}\right.\)

となる。この連立方程式を解くため、\(\zeta\) の項だけを残し、他の未知数である \(\zeta^2,\:\zeta^4,\:\zeta^3\) の項を消去することを考える。そのために、

 \(A\::\:\br{①}\times\omega\:+\:\br{②}\times\omega^2\:+\:\br{③}\times\omega^3\:+\:\br{④}\times\omega^4\)

とおくと、

 \(A\) の左辺 \(=\)
  \(\omega\:\:\zeta^2+(\omega\:\:)^2\zeta^4+(\omega\:\:)^3\zeta^3+(\omega\:\:)^4\zeta+\)
  \(\omega^2\zeta^2+(\omega^2)^2\zeta^4+(\omega^2)^3\zeta^3+(\omega^2)^4\zeta+\)
  \(\omega^3\zeta^2+(\omega^3)^2\zeta^4+(\omega^3)^3\zeta^3+(\omega^3)^4\zeta+\)
  \(\omega^4\zeta^2+(\omega^4)^2\zeta^4+(\omega^4)^3\zeta^3+(\omega^4)^4\zeta\)

となる。\(\zeta\) の4つの項は、係数が \((\omega^j)^4=(\omega^4)^j=1\) であり、
 \(\zeta\) の項の合計 \(=\:4\zeta\)
である。

\(\zeta^2,\:\zeta^4,\:\zeta^3\) の項の係数は、
 \(\omega^j+\omega^{2j}+\omega^{3j}+\omega^{4j}\:\:(j=1,2,3)\)
である。\(\omega^4=1\) なので、
 \(\omega^j+\omega^{2j}+\omega^{3j}+1\:\:(j=1,2,3)\)
の形をしている。\(\omega\) は \(1\) の原始4乗根であり、\(x^4-1=0\) の根である。\(x^4-1\) は、
 \(x^4-1=(x-1)(x^3+x^2+x+1)\)
と因数分解されるから、\(\omega,\:\omega^2,\:\omega^3\) は方程式
 \(x^3+x^2+x+1=0\)
の3つの根である。つまり、
 \(x^3+x^2+x+1=(x-\omega)(x-\omega^2)(x-\omega^3)\)
と因数分解される。この式に \(x=\omega^j\:(j=1,2,3)\) を代入すると、
 \((\omega^j)^3+(\omega^j)^2+\omega^j+1\)
\(\begin{eqnarray}
&&\:\: &=\omega^{3j}+\omega^{2j}+\omega^j+1\\
&&&=(\omega^j-\omega)(\omega^j-\omega^2)(\omega^j-\omega^3)\\
&&&=0\:\:(j=1,2,3)\\
\end{eqnarray}\)
となる。つまり、\(\zeta^2,\:\zeta^4,\:\zeta^3\) の項の係数、\(\omega^j+\omega^{2j}+\omega^{3j}+1\) は全て \(0\) ということである。以上をまとめると、\(A\) の左辺は \(\zeta\) の項だけが残り、

 \(A\) の左辺 \(=\:4\zeta\)

である。一方、\(A\) 式の右辺は、
 \(A\) の右辺 \(=\:\displaystyle\sum_{j=1}^{4}\omega^j\sqrt[4]{g(\omega^j)}\)
である。従って、
 \(4\zeta=\displaystyle\sum_{j=1}^{4}\omega^j\sqrt[4]{g(\omega^j)}\)
 \(\zeta=\dfrac{1}{4}\displaystyle\sum_{j=1}^{4}\omega^j\sqrt[4]{g(\omega^j)}\)
 \((\br{F})\)
となり、\(\zeta\) が \(\omega\) の多項式のべき根として求まった。

\((\br{F})\) 式における \(\sqrt[4]{g(\omega^j)}\) とは「\(4\)乗すると \(g(\omega^j)\) になる数」という意味であり、\(4\)次方程式の\(4\)つの解のどれかである。従って、実際に \(\omega\) に数を入れて(この場合は \(1\) の原始4乗根だから \(i\) か \(-i\))計算するときには、\(\zeta^5=1\) になるように \((\br{F})\) 式の \(4\)つの項のそれぞれについて、\(4\)つの解のどれかを選択する必要がある。しかしそうであっても、\(\zeta\) が \(\omega\) の多項式のべき根と四則演算で表現できるということは変わらない。

これまでの論理展開では、\(p=5\) であることの特殊性は何も使っていない。唯一、使ったのは、\(p\) が素数であり、そのときに \((\bs{Z}/p\bs{Z})^{*}\) に生成元がある(25D)ということである。

従って、\(\zeta\) が \(1\) の原始\(p\)乗根であり、\(\omega\) が \(1\) の原始\((p-1)\)乗根であっても \((\br{F})\) 式は、\(4\) を \((p-1)\) に置き換えれば成り立つ。

帰納法の仮定により、\(1\) の原始\((p-1)\)乗根 \(\omega\) はべき根で表される。従って \((\br{F})\) 式から、\(1\) の原始\(p\)乗根 である \(\zeta\) もべき根で表される。[証明終]


ためしに \((\br{F})\) 式を使って、\(1\) の原始5乗根、\(\zeta\) を計算してみます。\(\omega\) は \(1\) の原始4乗根(の一つ)なので \(\omega=i\)(虚数単位)とすると、\((\br{D})\) 式も含めて、
\(\begin{eqnarray}
&&\:\:g(b)&=-16b^3+14b^2+4b-1 (\br{D})\\
&&\:\:b&=\omega^j\:\:(j=1,2,3,4)\\
&&&=\:\{\:i,\:-1,\:-i,\:1\:\}\\
&&\:\:g(\omega)&=-15+20i\\
&&\:\:g(\omega^2)&=25\\
&&\:\:g(\omega^3)&=-15-20i\\
&&\:\:g(\omega^4)&=1\\
\end{eqnarray}\)
となり、これらを \((\br{F})\) 式に代入すると、

 \(\zeta=\dfrac{1}{4}(\sqrt[4]{1}-\sqrt[4]{25}+i(\sqrt[4]{-15+20i}-\sqrt[4]{-15-20i}))\)

となります。\(\sqrt[4]{\cd}\) は「\(4\)乗して \(\cd\) になる数」の意味です。この式を、
 \(4\zeta=r+is\)
\(\begin{eqnarray}
&&\:\: r&=\sqrt[4]{1}-\sqrt[4]{25}\\
&&\:\: s&=\sqrt[4]{-15+20i}-\sqrt[4]{15-20i}\\
\end{eqnarray}\)
と表すことにします。そして \(\sqrt[4]{\cd}\) を \(\sqrt{\cd}\) に変換するために2乗すると、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&r^2=\pm6\pm2\sqrt{5}&\\
&&s^2=\pm10\pm2\sqrt{5}&\\
\end{eqnarray}
\end{array}\right.\)
と計算できます。但し \(r^2+s^2=4\) の条件があるので、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&r^2=6\pm2\sqrt{5}&\\
&&s^2=10\pm2\sqrt{5}&\\
\end{eqnarray}
\end{array}\right.\)
となります(複合異順)。ここから \(r,\:s\) を求めると、\(r\) の方は2重根号をはずすことができて、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&r=\pm(1+\sqrt{5}),\:\:s=\pm\sqrt{10-2\sqrt{5}}&\\
&&r=\pm(1-\sqrt{5}),\:\:s=\pm\sqrt{10+2\sqrt{5}}&\\
\end{eqnarray}
\end{array}\right.\)
の合計8つの解が求まります。このうちの4つは方程式 \(x^5-1=0\) の解 \((=\zeta)\) で、残りの4つは方程式 \(x^5+1=0\) の解 \((=-\zeta)\) です。\(\zeta\) を表記すると、

\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&\zeta=\dfrac{1}{4}\left(-1+\sqrt{5}\pm i\sqrt{10+2\sqrt{5}}\right)&\\
&&\zeta=\dfrac{1}{4}\left(-1-\sqrt{5}\pm i\sqrt{10-2\sqrt{5}}\right)&\\
\end{eqnarray}
\end{array}\right.\)

の4つとなり、\(1\) の原始5乗根が求まりました。一般的な原始5乗根の計算方法とは違いますが、\((\br{F})\) 式によっても原始5乗根が求まることが確認できました。


7.2 べき根拡大の十分条件のため補題


ここでは「7.3 べき根拡大の十分条件」を証明するための補題を2つ証明します。以下に出てくる多項式 \(g(x)\) は、方程式を解くために考えられた「ラグランジュの分解式」と呼ばれるものです。分解式はレゾルベント(resolvent)とも言います。

補題(1)
べき根拡大の十分条件のため補題1:72A)

\(\bs{L}\) を \(\bs{K}\) のガロア拡大とし、\(\mr{Gal}(\bs{L}/\bs{K})\) を \(\sg\) で生成される位数 \(n\) の巡回群とする。式 \(g(x)\) を、

\(g(x)\)\(\overset{\text{ }}{=}\)\(x+a_1\sg(x)+a_2\sg^2(x)+\:\cd\:+a_{n-1}\sg^{n-1}(x)=0\)
\((a_i\in\bs{L},\:1\leq i\leq n-1)\)

と定義する。このとき、\(\bs{L}\) の全ての元 \(x\) について、\(g(x)=0\) となるような \(\bs{L}\) の元、\(a_1,\:a_2,\:\cd\:,a_{n-1}\) は存在しない。


[証明]

\(\bs{L}\) が原始元 \(\theta\) によって \(\bs{L}=\bs{K}(\theta)\) と表されているとし(32B)、\(\theta\) の \(\bs{K}\) 上の最小多項式を \(f(x)\) とする。最小多項式は既約多項式の定理(31I)により \(f(x)\) は既約多項式である。そうすると、\(\theta,\:\sg^i(\theta)\:(1\leq i\leq n-1)\) の \(n\)個は \(f(x)=0\) の解であり、既約多項式の定理331G)によって \(n\)個の解は全て異なる。つまり、
 \(\theta-\sg^i(\theta)\neq0\:(1\leq i\leq n-1)\)
である。このことを踏まえて背理法で証明する。\(\bs{L}\) の任意の元 \(x\) について、

\(g(x)=x+a_1\sg(x)+a_2\sg^2(x)+\:\cd\:+a_{n-1}\sg^{n-1}(x)=0\)
 \((\br{A})\)

となるような \(\bs{L}\) の元 \(a_1,\:a_2,\:\cd\:,a_{n-1}\) が存在したとする。この \(g(x)=0\) の式から \(\sg^{n-1}(x)\) の項を消去することを考える。そのためにまず \(g(\theta x)\) を計算すると、

\(g(\theta x)\)\(\overset{\text{ }}{=}\)\(\theta x+\)\(a_1\sg(\theta x)+\)\(a_2\sg^2(\theta x)+\)\(\:\cd\:+\)\(a_{n-1}\sg^{n-1}(\theta x)\)
\(\overset{\text{ }}{=}\)\(\theta x+\)\(a_1\sg(\theta)\sg(x)+\)\(a_2\sg^2(\theta)\sg^2(x)+\)\(\:\cd\:+\)\(a_{n-1}\sg^{n-1}(\theta)\sg^{n-1}(x)\)
\(\overset{\text{ }}{=}\)\(0\)

となる。この式から \(\sg^{n-1}(x)\) の項を消去するには、この式の \(\sg^{n-1}(x)\)の係数が \(a_{n-1}\sg^{n-1}(\theta)\) であり、また \(g(x)\) の \(\sg^{n-1}(x)\) の項の係数が \(a_{n-1}\) なので、
 \(\sg^{n-1}(\theta)g(x)=0\)
の式を作って両辺から引けばよい。その計算をすると、

\(g(\theta x)-\sg^{n-1}(\theta)g(x)\)
 \(\overset{\text{ }}{=}\)\((\theta-\sg^{n-1}(\theta))x+\)\((\sg(\theta)-\sg^{n-1}(\theta))a_1\sg(x)+\)\((\sg^2(\theta)-\sg^{n-1}(\theta))a_2\sg(x)^2+\)\(\:\cd\:+\)\((\sg^{n-2}(\theta)-\sg^{n-1}(\theta))a_{n-2}\sg(x)^{n-2}\)
\(\overset{\text{ }}{=}\)\(0\)

となる。ここで、\(x\) の係数である \((\theta-\sg^{n-1}(\theta))\) は、証明の最初に書いたように \(0\) ではない。そこで、全体を \((\theta-\sg^{n-1}(\theta))\) で割ると、

\(x+b_1\sg(x)+b_2\sg(x)^2+\:\cd\:+b_{n-2}\sg(x)^{n-2}=0\)
 \((\br{B})\)

の形になる。ここで \(b_i\) は、
 \(b_i=\dfrac{\sg^i(\theta)-\sg^{n-1}(\theta)}{\theta-\sg^{n-1}(\theta)}a_i\)
である。\((\br{B})\) 式は、基本的に \((\br{A})\) 式と同じで、\((\br{A})\) 式から \(\sg(x)^{n-1}\) の項を消去した形であり、\(x\) の最大次数の項は \(\sg(x)^{n-2}\) になっている。以上の、\((\br{A})\) から \((\br{B})\) への変換は繰り返し行えるから、\(n-2\) 回の変換を繰り返すと、

 \(x+c_1\sg(x)=0\)

の形が得られる。この式にもう一度、\(n-1\) 回目の変換をすると、

\(\theta x+c_1\sg(\theta x)-\sg(\theta)(x+c_1\sg(x))=0\) 
\(\theta x+c_1\sg(\theta)\sg(x)-\sg(\theta)x+c_1\sg(\theta)\sg(x)=0\) 
\(\theta x-\sg(\theta)x=0\) 
\((\theta-\sg(\theta))x=0\) 
\(x=0\)

となる。\(x\) は \(\bs{L}\) の任意の元だったから、\(\bs{L}\) のすべての元は \(0\) となってしまい、矛盾が生じた。従って背理法の仮定は誤りであり、\(\bs{L}\) の全ての元 \(x\) について、
\(x+a_1\sg(x)+a_2\sg^2(x)+\:\cd\:+a_{n-1}\sg^{n-1}(x)=0\)
となるような \(\bs{L}\) の元、\(a_1,\:a_2,\:\cd\:,a_{n-1}\) は存在しない。[証明終]

補題(2)
べき根拡大の十分条件のため補題2:72B)

\(\zeta\) を \(1\) の原始\(n\)乗根とし、\(\zeta\)を含む代数体を \(\bs{K}\) とする。\(\bs{K}\) のガロア拡大体を \(\bs{L}\) とし、\(\mr{Gal}(\bs{L}/\bs{K})\) は \(\sg\) で生成される位数 \(n\) の巡回群とする(= \(\bs{L}/\bs{K}\) が巡回拡大)。また \(f(x)\) を \(\bs{K}\) 上の \(n\)次既約多項式とし、\(\bs{L}\) が方程式 \(f(x)=0\) の解 \(\theta\) を用いて、\(\bs{L}=\bs{K}(\theta)\) と表されているものとする。このとき、

 \(g(x)=x+\zeta^{n-1}\sg(x)+\zeta^{n-2}\sg^2(x)+\cd+\zeta\sg^{n-1}(x)\)

とおくと、\(g(\theta),\:g(\theta^2),\:\cd\:,g(\theta^{n-1})\) のうち少なくとも一つは \(0\) ではない。


[証明]

\(g(x)\) の形は、べき根拡大の十分条件のため補題172A)で、
 \(a_i=\zeta^{n-i}\:(1\leq i\leq n-1)\)
と置いたものである。\(\zeta\) は \(\bs{K}\) の元 = \(\bs{L}\) の元だから、補題(1)により \(\bs{L}\) の任意の元 \(x\) について \(g(x)=0\) となることはない。

この \(g(x)\) は次のような性質をもっている。まず \(\bs{K}\) の任意の元を \(a\) とすると、\(\mr{Gal}(\bs{L}/\bs{K})\) の 元 \(\sg\) は \(a\) を不動にするから、
 \(\sg^i(a)=a\)
である。従って、\(g(a)\) を計算すると、
 \(g(a)=ag(1)\)
となる。また、\(\bs{K}\) の任意の元を \(a\)、\(\bs{L}\) の任意の元を \(x\) とすると、
 \(\sg^i(ax)=\sg^i(a)\sg^i(x)=a\sg^i(x)\)
なので、
 \(g(ax)=ag(x)\)
である。さらに \(\bs{L}\) の任意の2つの元を \(x,\:y\) とすると、
 \(\sg^i(x+y)=\sg^i(x)+\sg^i(y)\)
なので、
 \(g(x+y)=g(x)+g(y)\)
である。

\(\bs{L}\) は、\(\bs{K}\) 上の既約多項式 \(f(x)\) を用いた方程式 \(f(x)=0\) の解 \(\theta\) の単拡大体 \(\bs{K}(\theta)\) だから、単拡大の体の定理(32C)により、\(\bs{L}\) の任意の元 \(x\) は、

 \(x=b_0+b_1\theta+b_2\theta^2+\cd+b_{n-1}\theta^{n-1}\:(b^i\in\bs{K})\)

と表せる。\(g(x)\) の式にこの \(x\) を代入すると、
\(\begin{eqnarray}
&&\:\:g(x)&=g(b_0+b_1\theta+b_2\theta^2+\cd+b_{n-1}\theta^{n-1})\\
&&&=g(b_0)+g(b_1\theta)+g(b_2\theta^2)+\cd+g(b_{n-1}\theta^{n-1})\\
&&&=b_0g(1)+b_1g(\theta)+b_2g(\theta^2)+\cd+b_{n-1}g(\theta^{n-1})\\
\end{eqnarray}\)

となる。ここで、
 \(g(1)=1+\zeta^{n-1}+\zeta^{n-2}+\cd+\zeta\)
だが、\(g(1)(1-\zeta)=\zeta^n-1=0\) なので \(g(1)=0\) である。従って、\(g(\theta),\:g(\theta^2),\:\cd\:,g(\theta^{n-1})\) の全てが \(0\) だと、\(\bs{L}\) の全ての元 \(x\) について \(g(x)=0\) となり、矛盾が生じる。ゆえに、\(g(\theta),\:g(\theta^2),\:\cd\:,g(\theta^{n-1})\) のうち、少なくとも一つは \(0\) ではない。[証明終]


7.3 べき根拡大の十分条件


補題(1)と補題(2)を使って、体の拡大がべき根拡大になるための十分条件を証明します。


べき根拡大の十分条件:73A)

1の原始\(n\)乗根を \(\zeta\) とし、代数体 \(\bs{\bs{K}}\) には \(\bs{\zeta}\) が含まれるとする。\(\bs{L}/\bs{K}\) をガロア拡大とし、\(\mr{Gal}(\bs{L}/\bs{K})\) が巡回群とする(= \(\bs{L}/\bs{K}\) が巡回拡大)。拡大次数は \([\bs{L}:\bs{K}]=n\) とする。

このとき、\(\bs{L}\) は \(\bs{K}\) のべき根拡大である。


[証明]

\(\mr{Gal}(\bs{L}/\bs{K})\) は位数 \(n\) の巡回群なので、生成元を \(\sg\) とし、

 \(\mr{Gal}(\bs{L}/\bs{K})=\{e,\:\sg,\:\sg^2,\:\cd\:,\sg^{n-1}\}\)

とする。\(\bs{L}\) の 元 \(c\) に対して、

\(\al=c+\zeta^{n-1}\sg(c)+\zeta^{n-2}\sg^2(c)+\:\cd+\zeta^2\sg^{n-2}(c)+\zeta\sg^{n-1}(c)\)

と定める。このとき \(\al\neq0\) となるように \(c\) を選べる。なぜなら、もし \(\al\neq0\) となる \(c\) が選べないとすると、\(\bs{L}\) の全ての元 \(x\) について、

 \(x+\zeta^{n-1}\sg(x)+\zeta^{n-2}\sg^2(x)+\:\cd\:+\zeta\sg^{n-1}(x)=0\)

となるはずだが、これはべき根拡大の十分条件のため補題172A)、つまり、

 \(\bs{L}\) の全ての元 \(x\) について、
  \(x+a_1\sg(x)+a_2\sg^2(x)+\:\cd\:+a_{n-1}\sg^{n-1}(x)=0\)
 となるような \(\bs{L}\) の元、\(a_1,\:a_2,\:\cd\:,a_{n-1}\) は存在しない

において、\(a_1=\zeta^{n-1},\:a_2=\zeta^{n-2},\:\cd\:,a_{n-1}=\zeta\) と置いたことに相当し、そのような \(a_i\:(1\leq i\leq n-1)\) は存在しないとする補題1の結論に反するからである。またべき根拡大の十分条件のため補題272B)では、\(c\) の選び方の例が示されている。そこで、\(\al\neq0\) となるように \(c\) を選んだとする。

\(\sg\)は \(\bs{K}\) の元である \(\zeta\) を不変にするので、
 \(\sg(\zeta^{n-i}\sg^i(c))=\zeta^{n-i}\sg^{i+1}(c)\)
である。これを用いて \(\sg(\al)\) を計算すると、

\(\sg(\al)\)
 \(=\sg(c)+\zeta^{n-1}\sg^2(c)+\zeta^{n-2}\sg^3(c)+\:\cd+\zeta^2\sg^{n-1}(c)+\zeta\sg^n(c)\)
 \(=\zeta^n\sg(c)+\zeta^{n-1}\sg^2(c)+\zeta^{n-2}\sg^3(c)+\:\cd+\zeta^2\sg^{n-1}(c)+\zeta c\)
 \(=\zeta(\zeta^{n-1}\sg(c)+\zeta^{n-2}\sg^2(c)+\zeta^{n-3}\sg^3(c)+\:\cd+\zeta\sg^{n-1}(c)+c)\)
 \(=\zeta\al\)
となる。計算では、\(\zeta^n=1\) であることと(第1項)、\(\sg^n=e\) なので \(\sg^n(c)=c\) となること(最終項)を用いた。

ここで、\(\al=\zeta\al\) となるのは、\(\al=0\) のときだけであるが、\(\al\neq0\) なので \(\al\neq\zeta\al\) である。つまり \(\sg(\al)\neq\al\) であり、\(\al\) は \(\sg\) を作用させると不変ではない。従って \(\al\) は \(\bs{K}\) の元ではない \(\bs{L}\) の元である。さらに \(\sg^i(\al)\) を求めていくと、

\(\begin{eqnarray}
&&\:\:\sg^2(\al)&=\sg(\sg(\al))=\sg(\zeta\al)=\zeta\sg(\al)=\zeta\zeta\al\\
&&&=\zeta^2\al\\
&&\:\:\sg^3(\al)&=\sg(\sg^2(\al))=\sg(\zeta^2\al)=\zeta^2\sg(\al)=\zeta^2\zeta\al\\
&&&=\zeta^3\al\\
\end{eqnarray}\)

というように計算でき、
 \(\sg^i(\al)=\zeta^i\al\)
である。これを使うと、
\(\begin{eqnarray}
&&\:\:\sg(\al^n)&=\sg(\al)^n=(\zeta\al)^n=\zeta^n\al^n\\
&&&=\al^n\\
\end{eqnarray}\)
であり、\(\al^n\) は \(\sg\) を作用させても不変である。従って \(\al^n\) は \(\bs{K}\) の元である。そこで \(\al^n=a\:\:(a\in\bs{K})\) とおく。

方程式 \(x^n-a=0\) の解は、\(\al,\:\zeta\al,\:\zeta^2\al,\:\cd,\:\zeta^{n-1}\al\) であり、\(x^n-a=0\) の \(\bs{K}\) 上の最小分解体は、\(\bs{K}\) には \(\zeta\) が含まれているから、

 \(\bs{K}(\al,\:\zeta\al,\:\zeta^2\al,\:\cd,\:\zeta^{n-1}\al)=\bs{K}(\al,\zeta)=\bs{K}(\al)\)

である。この式から、\(\bs{K}\) の同型写像による \(\al\) の移り先は全て \(\bs{K}(\al)\) に含まれることが分かる。従って \(\sg^i\:\:(1\leq i\leq n-1)\) はすべて \(\bs{K}(\al)\) の自己同型写像である。また、同型写像での移り先の定理(51D)により、同型写像は \(\al\) を共役な元に移すが、\(\al\) と共役な元は \(n-1\) 個しかない。従って \(\sg^i\) 以外に同型写像はない。つまり、

 \(\mr{Gal}(\bs{K}(\al)/\bs{K})=\{e,\:\sg,\:\sg^2,\:\cd\:,\:\sg^{n-1}\}\)

であり、これは \(\mr{Gal}(\bs{L}/\bs{K})\) と同じである。次数と位数の同一性の定理(52B)により、ガロア群に含まれる自己同型写像の数は体の拡大次数に等しいから、

 \([\:\bs{K}(\al)\::\:\bs{K}\:]=[\:\bs{L}\::\:\bs{K}\:]\)

である。もともと \(\al\) は \(\bs{L}\) の元だったので、\(\bs{K}(\al)\) の元は全て \(\bs{L}\) の元である。つまり、
 \(\bs{K}(\al)\:\subset\:\bs{L}\)
であるが、\(\bs{K}(\al)\) と \(\bs{L}\) の線形空間の次元が等しいので、体の一致の定理(33I)により2つは一致し、
 \(\bs{K}(\al)=\bs{L}\)
である。以上により、\(\bs{L}\) は \(\bs{K}\) の上の方程式 \(x^n-a=0\:(a\in\bs{K})\) の解の一つ \(\al\) を用いて \(\bs{L}=\bs{K}(\al)\) と表されるから、\(\bs{L}\) は \(\bs{K}\) の べき根拡大である。[証明終]


証明の過程で出てきた、

\(\al=c+\zeta^{n-1}\sg(c)+\zeta^{n-2}\sg^2(c)+\:\cd+\zeta^2\sg^{n-2}(c)+\zeta\sg^{n-1}(c)\)

の式は、方程式を解くために考えられた「ラグランジュの分解式」と呼ばれるものです。分解式はレゾルベント(resolvent)とも言い、数学史においてはガロア理論より前に考えられたものです。この証明を振り返ってまとめてみると、

\(\bs{L}\) は \(\bs{K}\) の代数拡大体であり、拡大次元は \(n\) である。
\(\bs{K}\) には \(1\) の原始\(n\)乗根が含まれている。
\(\bs{L}/\bs{K}\) はガロア拡大である。
\(\mr{Gal}(\bs{L}/\bs{K})\) は巡回群である(=\(\bs{L}/\bs{K}\) は巡回拡大)

という条件のもとで、レゾルベントをうまく定義すると、

ある \(\bs{L}\) の元 \(\al\:(\notin\bs{K})\) が存在し、\(\al^n\) は \(\bs{K}\) の元である。
すなわち \(\al\) は、方程式 \(x^n-a=0\:\:(a\in\bs{K})\) の解である。
\(\bs{L}=\bs{K}(\al)\) であり、従って \(\bs{L}/\bs{K}\) はべき根拡大である。

が成り立つという論理展開でした。つまりポイントは \(\bs{\al^n\in\bs{K}}\) のところであり、そういう \(\bs{\al\in\bs{L}}\) の存在が証明の核心です。

しかし、その鍵である \(\al\) を具体的に見つけようとすると、\(\al\) の式に現れる \(c\) を決めなければなりません。その \(c\) の値ですが、\(\bs{L}\) が方程式 \(f(x)=0\) の解 \(\theta\) を用いて \(\bs{L}=\bs{K}(\theta)\) と表されているとき(= \(\theta\) が原始元のとき)、\(c=\theta\) にできることがべき根拡大の十分条件のため補題272B)に示されています。しかし、方程式の形から原始元が分かるわけではありません。

べき根拡大の十分条件73A)は、その十分条件があればべき根拡大体の中に方程式の解が含まれる(= 方程式の解が四則演算とべき根で記述できる)ことだけを言っています。つまり四則演算とべき根で記述できる解の存在証明であり、そこが注意点です。

原始\(n\)乗根はべき根で表現可能
べき根拡大の十分条件73A)を用いて原始\(\bs{n}\)乗根はべき根で表現可能71A)であることを証明できます。(71A)ではガロア理論と関係なく証明しましたが、ガロア理論の枠組みを使っても証明できるということです。

まず \(n\) が合成数のとき、つまり \(n=s\cdot t\) と分解できるときには、原始\(n\)乗根は、原始\(s\)乗根と原始\(t\)乗根のべき根で表現できます(71A)。\(s\) や \(t\) が合成数なら、さらに "分解" を続けられるので、結局、\(n\) が素数 \(p\) のときに原始\(p\)乗根がべき根で表せることを示せればよいことになります。

いま、\(\bs{p}\) 未満の素数すべての原始\(\bs{n}\)乗根がべき根で表されると仮定します。これは帰納法の仮定です。原始\(p\)乗根を \(\eta\)(イータ) とし、その最小多項式を \(f(x)\) とすると、\(f(x)\) は既約多項式で、円分多項式です(63D)。原始\(p\)乗根は 方程式 \(x^p-1=0\) の \(1\) 以外の根なので、
 \(x^p-1=(x-1)f(x)\)
であり、
 \(f(x)=x^{p-1}+x^{p-2}+\:\cd\:+x+1\)
です。

原始\(p\)乗根による拡大体 \(\bs{Q}(\eta)\) のガロア群は、

 \(\mr{Gal}(\bs{Q}(\eta)/\bs{Q})\cong(\bs{Z}/p\bs{Z})^{*}\)

です(63E)。\((\bs{Z}/p\bs{Z})^{*}\) は位数 \((p-1)\) の巡回群で(25D)、\(\bs{Q}(\eta)/\bs{Q}\) の拡大次数は、\([\:\bs{Q}(\eta):\bs{Q}\:]=p-1\) です。原始\((p-1)\)乗根を \(\zeta\) とすると、\(\eta\notin\bs{Q}(\zeta)\) なので、\(\bs{Q}\) 上の既約多項式である \(f(x)\) は \(\bs{Q}(\zeta)\) 上でも既約多項式です。従って、

 \(\mr{Gal}(\bs{Q}(\zeta,\eta)/\bs{Q}(\zeta))\cong\mr{Gal}(\bs{Q}(\eta)/\bs{Q})\)

であり、\(\mr{Gal}(\bs{Q}(\zeta,\eta)/\bs{Q}(\zeta))\) も位数 \((p-1)\) の巡回群です。すると、べき根拡大の十分条件73A)により、\(\bs{Q}(\zeta,\eta)/\bs{Q}(\zeta)\) はべき根拡大になります。つまり \(\eta\) は "有理数と \(\zeta\) の四則演算から成る式" のべき根で表現できます。

「\(p\) 未満の素数すべての原始\(n\)乗根がべき根で表される」という仮定により、\(\zeta\) はべき根で表現できます。従って \(\eta\) もべき根で表されます。

原始\(2\)乗根は \(-1\) であり、原始\(3\)乗根は根の公式によって、べき根で表現できます。従って帰納法により \(5\) 以上の素数 \(p\) の原始\(p\)乗根もべき根で表現できることが分かります。これで証明ができました。


ここで、原始\(\bs{n}\)乗根はべき根で表現可能71A)とべき根拡大の十分条件73A)の関係ですが、(73A)の証明の鍵になったのは、ラグランジュの分解式、

\(\al=c+\zeta^{n-1}\sg(c)+\zeta^{n-2}\sg^2(c)+\:\cd+\zeta^2\sg^{n-2}(c)+\zeta\sg^{n-1}(c)\)

でした。いま、原始\(5\)乗根を \(\eta\) とし、\(\bs{Q}(\eta)/\bs{Q}\) の巡回拡大を考えます。原始\(4\)乗根を \(\zeta\) とします(\(\zeta=i,\:-i\))。

\(\bs{Q}(\eta)\) の自己同型写像 \(\sg\) を、
 \(\sg(\eta)=\eta^2\)
となる写像と定義します。そして、\(c=\eta,\:n=4\) を分解式に入れると、

\(\begin{eqnarray}
&&\:\:\al&=\eta+\zeta^3\sg(\eta)+\zeta^2\sg^2(\eta)+\zeta\sg^3(\eta)\\
&&&=\eta+\zeta^3\eta^2+\zeta^2\eta^4+\zeta\eta^3\\
\end{eqnarray}\)

となります。このラグランジュの分解式と、原始\(\bs{n}\)乗根はべき根で表現可能71A)の証明で使った \(f(x,y)\) は本質的に同じものです。つまり

\(f(x,y)=y^3x+y^4x^2+y^2x^3+y\)

と定義すると、\(x,\:y\) の指数はそれぞれ、

 \(x\) の指数:\([\:1,\:2,\:3,\:0\:]\)
   \(\bs{Z}/4\bs{Z}\) の巡回パターン(生成元 \(=1\))
 \(y\) の指数:\([\:3,\:4,\:2,\:1\:]\)
   \((\bs{Z}/5\bs{Z})^{*}\) の巡回パターン(生成元 \(=3\))

となります。(71A)では \((\bs{Z}/5\bs{Z})^{*}\) の巡回パターンを \([\:2,\:4\:,3,\:1\:]\)(生成元 \(=2\))としたので式の形は少々違いますが、本質的に同じです。ここで、
 \(x=\zeta,\:\:y=\eta\)
と置くと、

\(\begin{eqnarray}
&&\:\:f(x,y)&=\eta+\zeta^3\eta^2+\zeta^2\eta^4+\zeta\eta^3\\
&&&=\al\\
\end{eqnarray}\)

となり、\(f(x,y)\) が ラグランジュの分解式と同じものであることが確認できました。つまり、原始\(\bs{n}\)乗根はべき根で表現可能71A)の証明は、

ラグランジュの分解式での証明(73A)と同じことを、"分解式"、"体"、"ガロア群" などの概念を使わずに証明し、かつ、\((p-1)\)乗根をもとに \(p\)乗根を求める計算式を示した

ものなのでした。


7.4 べき根拡大と巡回拡大の同値性


6.3節の "べき根拡大は巡回拡大である"(63H)と、7.3節の "巡回拡大はべき根拡大である"(73A)を合わせると、次にまとめることができます。


べき根拡大と巡回拡大は同値:74A)

\(1\) の原始\(n\)乗根を \(\zeta\) とし、代数体 \(\bs{\bs{K}}\) には \(\bs{\zeta}\) が含まれるとする。また、\(\bs{K}\) の\(n\)次拡大体を \(\bs{L}\) とする( \([\:\bs{L}\::\:\bs{K}\:]=n\) )。

このとき、
\(\bs{L}/\bs{K}\) は巡回拡大である
\(\bs{L}/\bs{K}\) はべき根拡大である。
の2つは同値である。


\(\bs{1}\) の原始\(\bs{n}\)乗根が代数体に含まれるという条件をつけるのが巧妙なアイデアで、この条件によって可解性の必要十分条件が導けます。


7.5 可解性の十分条件


以上の準備をもとに、可解性の必要条件64B)の逆である、可解性の十分条件の証明を行います。

代数拡大体 \(\bs{K}\) 上の多項式 \(f(x)\) の最小分解体を \(\bs{L}\) とし、拡大次数を \([\:\bs{L}\::\:\bs{K}\:]=n\) とします。そして、ガロア群 \(\mr{Gal}(\bs{L}/\bs{K})\) が可解群であるとき、もし \(\bs{K}\) に \(1\) の原始\(n\)乗根が含まれるなら、べき根拡大と巡回拡大は同値の定理(74A)により、\(\bs{K}\) の巡回拡大とべき根拡大は同じことです。従って、

 可解群 \(\rightarrow\) 累巡回拡大 \(\rightarrow\) 累べき根拡大 \(\rightarrow\) 可解

というルートで、方程式 \(f(x)=0\) の可解性が証明できます。しかし、\(\bs{K}\) に \(1\) の原始\(n\)乗根が含まれるとは限りません。\(\bs{K}\) が有理数体 \(\bs{Q}\) だとすると、そこに(原始2乗根以外の)原始\(n\)乗根はありません。しかし、このようなケースでも方程式の可解性が証明できます。それが以下です。


可解性の十分条件:75A)

体 \(\bs{K}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とする。\(\mr{Gal}(\bs{L}/\bs{K})=G\) とし、\(G\) は可解群とする。

このとき \(f(x)=0\) の解は四則演算とべき根で表現できる。


[証明]

\([\:\bs{L}\::\:\bs{K}\:]=n\:\:(|G|=n)\) とし、\(\zeta\) を \(1\) の原始\(n\)乗根とする。\(\bs{K}\) に \(\zeta\) を添加した拡大体 \(\bs{K}(\zeta)\)と、\(\bs{L}\) に \(\zeta\) を添加した拡大体 \(\bs{L}(\zeta)\) を考える。

\(\bs{L}(\zeta)\) は \(\bs{K}\) 上の方程式 \(f(x)(x^n-1)=0\) の最小分解体だから、\(\bs{L}(\zeta)/\bs{K}\) はガロア拡大である。

また \(\bs{K}(\zeta)\) は、\(\bs{K}\)のガロア拡大体 \(\bs{L}(\zeta)\) の中間体なので、中間体からのガロア拡大の定理(52C)によって、\(\bs{L}(\zeta)/\bs{K}(\zeta)\) もガロア拡大である。そこで、
 \(\mr{Gal}(\bs{L}(\zeta)/\bs{K}(\zeta))=G\,'\)
とおく。

可解性の十分条件.jpg
ポイントは、\(G\,'\) が \(G\) の部分群(\(G\) そのものも含む)と同型であることの証明である。これが成り立てば、① \(G\) は可解群なのでその部分群は可解群、② 可解群と同型な \(G\,'\) は可解群、③ \(G\,'\) が可解群なので \(\bs{L}(\zeta)/\bs{K}(\zeta)\) は累巡回拡大、④ \(\bs{K}(\zeta)\) は原始\(n\)乗根を含むので、累巡回拡大である \(\bs{L}(\zeta)/\bs{K}(\zeta)\) は累べき根拡大、が言える。

\(G\) の元を \(g\)、\(G\) の単位元を \(e\) とする。\(G\,'\)の元を \(g\,'\)、\(G\,'\) の単位元を \(e\,'\) とする。また、\(G\,'\) の元 \(g\,'\) を \(\bs{L}\) の元に限定して作用させるときの同型写像を \(\sg(g\,')\) とする。

\(g\,'\)は \(\bs{L}(\zeta)\) の自己同型写像だから、\(\bs{L}(\zeta)\) の元を共役な元に移す。従って 作用範囲を \(\bs{L}\) に限定した \(\sg(g\,')\) も \(\bs{L}\) の元を共役な元に移す。\(\bs{L}\) はガロア拡大体だから、\(\bs{L}\)の元の共役な元は \(\bs{L}\) に含まれる。従って \(\sg(g\,')\) は \(\bs{L}\) の自己同型写像である。

また \(g\,'\) は \(\mr{Gal}(\bs{L}(\zeta)/\bs{K}(\zeta))\) の元だから、\(\bs{K}(\zeta)\) の元を固定する。従って、\(\bs{K}(\zeta)\) の部分集合である \(\bs{K}\) の元も固定する。ゆえに、\(g\,'\) の作用範囲を \(\bs{L}\) に限定した \(\sg(g\,')\) も、\(\bs{L}\) の部分集合である \(\bs{K}\) の元を固定する。

以上により \(\sg(g\,')\) は、\(\bs{K}\)の元を固定する \(\bs{L}\) の自己同型写像だから、\(\mr{Gal}(\bs{L}/\bs{K})\) の元、つまり \(G\) の元である。

\(\sg\) を \(G\,'\) から \(G\) への写像と見なして考える。\(G\,'\) の元 を \(g\,'\) とし、\(x\) を \(\bs{L}\) の元とすると、\(g\,'(x)=\sg(g\,')(x)\) である。つまり、作用する対象が \(\bs{L}\) の元なら、2つの写像、\(g\,'\) と \(\sg(g\,')\) は同じ効果を生む。

\(G\,'\)の任意の2つの元を \(g_1{}^{\prime},\:g_2{}^{\prime}\) とすると、\(g_1{}^{\prime}g_2{}^{\prime}\) も \(G\,'\) の元だから、
 \(g_1{}^{\prime}g_2{}^{\prime}(x)=\sg(g_1{}^{\prime}g_2{}^{\prime})(x)\)
 \((\br{A})\)
である。左辺の \(g_2{}^{\prime}(x)\) は \(\sg(g_2{}^{\prime})(x)\) と同じなので、
 \(g_1{}^{\prime}g_2{}^{\prime}(x)=g_1{}^{\prime}(\sg(g_2{}^{\prime})(x))\)
であるが、\(\sg(g_2{}^{\prime})(x)\) もまた \(\bs{L}\) の元だから、
 \(g_1{}^{\prime}g_2{}^{\prime}x=\sg(g_1{}^{\prime})\sg(g_2{}^{\prime})(x)\)
 \((\br{B})\)
である。\((\br{A})\) と \((\br{B})\) より、
 \(\sg(g_1{}^{\prime}g_2{}^{\prime})=\sg(g_1{}^{\prime})\sg(g_2{}^{\prime})\)
となって、\(\sg\) は準同型写像42A)である。

\(\sg(g\,')\) が \(G\) の元であり \(\sg\) が準同型写像なので、準同型写像の像と核の定理(42B)により、\(\sg\) による \(G\,'\) の 像 \(\sg(G\,')\) は \(G\) の部分群である。もちろん、\(G\) の部分群には \(G\) の自明な部分群である \(G\) 自身も含まれる。


いま、ある \(G\,'\) の元 \(h\) があって、\(\sg(h)=e\)(\(e\) は \(G\) の単位元)とする。つまり、\(h\) を \(\bs{L}\) に限定して適用すると、\(\bs{L}\) の元すべてを固定するものとする。

\(G\,'\) は \(\mr{Gal}(\bs{L}(\zeta)/\bs{K}(\zeta))\) であり、そのすべての元は \(\bs{K}(\zeta)\) の元を固定する。従って、\(G\,'\) の元 \(h\) は \(\zeta\) も固定する。ということは、\(h\) は「\(\bs{L}\) の元すべてを固定し、かつ \(\zeta\) を固定する」から、\(\bs{L}(\zeta)\) の元すべてを固定する。つまり \(h\) は \(G\,'\) の単位元であり、\(h=e\,'\) である。

ゆえに、準同型写像の像と核42B)における核の定義によって、
 \(\mr{Ker}\:\sg=e\,'\)
であり、核が単位元なら単射の定理(42C)によって、\(\sg\) は単射である。このことから、準同型定理43A)により、
 \(G\,'/\mr{Ker}\:\sg\:\cong\:\sg(G\,')\)
すなわち、
 \(G\,'\:\cong\:\sg(G\,')\)
である。つまり \(\bs{G\,'}\)\(\bs{G}\) の部分群 \(\bs{\sg(G\,')}\) と同型である。


\(G\) は可解群なので、可解群の部分群は可解群の定理(61C)によって、\(G\) の部分群である \(\sg(G\,')\) も可解群であり、さらにそれと同型である \(G\,'\) も可解群である。\(G\,'\) が可解群なので、可解群の定義により \(G\,'\) から \(e\,'\) に至る部分群の列、
\(G\,'=H_0\sp H_1\sp\cd\sp H_i\sp H_{i+1}\sp\cd\sp H_k=\{e\,'\}\)
があって、\(H_{i+1}\) は \(H_i\) の正規部分群であり、\(H_i/H_{i+1}\) は巡回群である。

\(|G\,'|=m\) とおくと、\(G\,'\) は \(G\) の部分群である \(\sg(G\,')\) と同型なので、ラグランジュの定理41E)によって、\(m\) は \(|G|=n\) の約数である。

ガロア対応53B)による \(H_i\) の固定体を \(\bs{K}_i\) とすると、
\(\bs{K}(\zeta)=\bs{K}_0\subset\bs{K}_1\subset\cd\subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cd\subset\bs{K}_k=\bs{L}(\zeta)\)
という固定体の系列が定義できる。\(H_i/H_{i+1}\) は巡回群なので、\(\bs{K}_{i+1}/\bs{K}_i\) は巡回拡大である。

\(\bs{L}(\zeta)/\bs{K}(\zeta)\) の拡大次数は、
 \([\:\bs{L}(\zeta)\::\:\bs{K}(\zeta)\:]=|G\,'|=m\)
であり、\(n\) の約数である。

固定体の系列における一つの拡大 \(\bs{K}_{i+1}/\bs{K}_i\)を考える。その拡大次数 \([\:\bs{K}_{i+1}\::\:\bs{K}_i\:]=m_i\) は、拡大次数の連鎖律33H)によって \([\:\bs{L}(\zeta)\::\:\bs{K}(\zeta)\:]=m\) の約数であり、従って \(n\) の約数である。

\(\bs{K}_i\) は \(1\) の原始\(n\)乗根 \(\zeta\) を含むから、\(\zeta^{\frac{n}{m_i}}\) も含んでいる。\(\zeta^{\frac{n}{m_i}}\) は \(1\) の原始\(m_i\)乗根である。つまり、\(\bs{K}_i\) は \(1\) の原始\(m_i\)乗根(\(m_i=[\:\bs{K}_{i+1}\::\:\bs{K}_i\:]\))を含む。従って、べき根拡大の十分条件の定理(73A)により、巡回拡大である \(\bs{K}_{i+1}/\bs{K}_i\) はべき根拡大である。

以上のことは \((0\leq i < k)\) のすべてで成り立つから、\(\bs{K}_i\) の系列は累べき根拡大である。


\(f(x)=0\) の解は \(\bs{L}\) に含まれるが、\(\bs{L}\:\subset\:\bs{L}(\zeta)\) だから \(f(x)=0\) の解は \(\bs{L}(\zeta)\) に含まれる。その \(\bs{L}(\zeta)\) は \(\bs{K}(\zeta)\) の累べき根拡大であり、また \(1\) の原始\(n\)乗根である \(\zeta\) は \(\bs{Q}\:(\in\bs{K})\) の元の四則演算とべき根で表現できるから(71A)、\(\bs{L}(\zeta)\) の元はすべて \(\bs{K}\) の元の四則演算とべき根で表現できる。従って \(f(x)=0\) の解も \(\bs{K}\) の元の四則演算とべき根で表現できる。[証明終]


この定理では「体 \(\bs{K}\) 上の方程式 \(f(x)=0\)」としましたが、もちろん、体 \(\bs{K}\) が 有理数体 \(\bs{Q}\) であっても同じです。以降、\(\bs{K}\) を \(\bs{Q}\) と書きます。

証明のポイントは、\(G=\mr{Gal}(\bs{L}/\bs{Q})\) とし、\(G\,'=\mr{Gal}(\bs{L}(\zeta)/\bs{Q}(\zeta))\) とするとき、\(G\,'\) が \(G\) の部分群と同型であることです。たとえば、\(f(x)\) が既約な3次多項式だと、\(G\cong S_3\) か \(G\cong C_3\) であり、基本的に \(G\,'\cong G\) です。しかし、そうならない場合もあります。たとえば \(f(x)=x^3-2\) では \(G\cong S_3\) ですが、
 \(\bs{Q}\:\subset\:\bs{Q}(\omega)\:\subset\:\bs{Q}(\omega,\sqrt[3]{2})=\bs{L}\)
  (\(\omega\) は \(1\) の原始3乗根)
という体の拡大列でわかるように、\(\bs{L}(\omega)=\bs{L}\) です。つまり、\(\bs{L}(\omega)/\bs{Q}(\omega)\) の拡大次数は \(3\) であり、\(\bs{L}/\bs{Q}\) の拡大次数の \(6\) とは違います。しかしそうであっても \(G\,'=\mr{Gal}(\bs{L}(\omega)/\bs{Q}(\omega))\cong C_3\) であり、\(G\,'\) は \(G\cong S_3\) の部分群と同型です。

\(G\,'\) は \(G\) の部分群と同型なので、\(G\) が可解群なら \(G\,'\) も可解群であり(61C)、\(\bs{L}(\omega)/\bs{Q}(\omega)\) は累巡回拡大であり(62C)、従って、累べき根拡大です(73A)。

さらに、\(1\) の原始\(n\)乗根が \(\bs{Q}\) の元の四則演算とべき根で表現できる(71A)ことも証明のポイントになっています。

この可解性の十分条件の定理(75A)によって、有理数係数の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) として、\(\mr{Gal}(\bs{L}/\bs{Q})\) が可解群のとき、\(f(x)=0\) の解は四則演算とべき根で表現可能なことが証明できました。

ここがゴールで「ガロア理論=可解性の必要十分条件」が完結しました。


7.6 位数2の巡回拡大は平方根拡大:正5角形が作図できる理由


可解性の必要十分条件の証明は前節で尽きていますが、これ以降は可解な方程式の代表的なものを取り上げ、ガロア群の分析をします。まず最初は、
 \(x^5\)\(-1=0\)
 \(x^{17}\)\(-1=0\)
です。これらの方程式が可解であることは当然ですが、ガロア群の分析をすると正5角形と正\(17\)角形が定規とコンパスで作図できることを証明できます。

\(x^5-1=0\)
まず \(x^5-1=0\) の解を分析します。
 \(x^5-1=(x-1)(x^4+x^3+x^2+x+1)\)
なので、\(1\) 以外の解を \(\zeta\) とすると、\(\zeta\) は4次方程式、
 \(x^4+x^3+x^2+x+1=0\)
の解です。「7.1 1 の原始n乗根」で書いたように、この方程式の解は、
 \(\zeta=\dfrac{1}{4}\left(-1+\sqrt{5}\pm\sqrt{-10-2\sqrt{5}}\right)\)
 \(\zeta=\dfrac{1}{4}\left(-1-\sqrt{5}\pm\sqrt{-10+2\sqrt{5}}\right)\)
の4つであり、これが \(1\) の原始5乗根です。以下の論旨を明瞭にするために、虚数単位 \(i\) を使わずに、外側の \(\sqrt{\phantom{a}}\) の中を負の数にして記述しました。

この原始5乗根は、4次方程式の解であるにもかかわらず、四則演算と平方根 \(\sqrt{\phantom{a}}\) のみを使って表現されています。なぜそうなるのか、それをガロア理論にのっとって説明します。実は、\(p\) を素数としたとき、

原始\(\bs{p}\)乗根が四則演算と平方根 \(\bs{\sqrt{\phantom{a}}}\) のみで表現できれば、正 \(\bs{p}\)角形は定規とコンパスで作図可能である

ことが知られています。定規というのは「目盛りのない、与えられた2点を通る直線を引くことだけができる道具」であり、コンパスというのは「角度目盛りのない、与えられた2点のうちの1点を中心として別の点を通る円\(\cdot\)円弧を描くことだけができる道具」です。長さや角度を測ることはできません。作図可能の原理は次の項で説明します


\(f(x)=x^4+x^3+x^2+x+1\) とし、\(f(x)=0\) の解の一つを \(\zeta\) とすると、\(f(x)\) の最小分解体は \(\bs{Q}(\zeta)\) です。そのガロア群を、
 \(G=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\)
と書くと、\(\zeta\) の最小多項式は \(f(x)\) なので(63C)、\(|G|=4\) です。また、\(\bs{\bs{Q}(\zeta)}\) のガロア群の定理(63E)により、\(G\) は既約剰余類群と同型で、
 \(G\cong(\bs{Z}/5\bs{Z})^{*}\)
です。
 \((\bs{Z}/5\bs{Z})^{*}=\{1,\:2,\:3,\:4\}\)
ですが、この群の生成元は \(2\) か \(3\) です。以下、生成元を \(2\) として話を進めると、
\(\begin{eqnarray}
&&\:\:(\bs{Z}/5\bs{Z})^{*}&=\{2,\:2^2,\:2^3,\:2^4\}\\
&&&=\{2,\:4,\:3,\:1\}\\
\end{eqnarray}\)
と表現できます。一方、\(f(x)=0\) の4つの解は、
  \(\zeta,\:\:\zeta^2,\:\:\zeta^3,\:\:\zeta^4\)
です。そこで、
 \(\sg(\zeta)=\zeta^2\)
で定義される自己同型写像を考えると、ガロア群は、
 \(G=\{\sg,\:\sg^2,\:\sg^3,\:\sg^4=e\}\)
となり、位数 \(4\) の巡回群、かつ可解群です。また、体の拡大次数は、
 \([\:\bs{Q}(\zeta):\bs{Q}\:]=4\)
です。

ガロア群 \(G\) には部分群が含まれています。つまり、
 \(H=\{\sg^2,\:e\}\)
  \(\sg^2(\zeta)=\zeta^4\)
と定義すると、\((\sg^2)^2=e\) なので \(H\) は部分群(\(\sg H=H\sg\) なので正規部分群)であり、位数 \(2\) の巡回群です。また、剰余群は、
 \(G/H\cong\{e,\:\sg\}\)
です。従って、

 \(G\:\sp\:H\:\:\sp\:\{\:e\:\}\)
   \(G/H\)\(\cong\{e,\:\sg\}\):位数 \(2\)
   \(H/\{\:e\:\}\)\(\cong H\):位数 \(2\)

は可解列です。ガロア対応の定理(53B)により、この可解列に対応する拡大体の列があって、

 \(G\sp H\sp\{\:e\:\}\)
 \(\bs{Q}\subset\bs{F}\subset\bs{Q}(\zeta)\)

となります。\(\bs{F}\) は \(H\) の固定体であり、\(\bs{Q}(\zeta)\) の中間体です。すると、正規性定理(53C)により、
 \(\mr{Gal}(\bs{F}/\bs{Q})\cong G/H\)
なので、\(\mr{Gal}(\bs{F}/\bs{Q})\) は位数 \(2\) の巡回群です。またガロア群の定義により、
 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{F})\cong H\)
であり、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{F})\) も位数 \(2\) の巡回群です。従って、次数と位数の同一性の定理(52B)より拡大次数は、
 \([\:\bs{F}\)\(:\bs{Q}\:]=2\)
 \([\:\bs{Q}(\zeta)\)\(:\bs{F}\:]=2\)
であり、2つの拡大は巡回拡大です。原始2乗根(\(=-1\))は \(\bs{Q}\) に含まれるので、巡回拡大はべき根拡大です(73A)。拡大次数 \(2\) のべき根拡大を(一般的な数学用語ではありませんが)「平方根拡大」と呼ぶことにすると、

\(\bs{\bs{Q}(\zeta)}\)\(\bs{\bs{Q}}\) からの平方根拡大を2回繰り返したものである

と結論づけられます。原始5乗根が四則演算と平方根 \(\sqrt{\phantom{a}}\) のみを使って表現できる理由がここにあります。


ここまでは、中間体 \(\bs{F}\) がどういう拡大体かに触れていませんが、\(\bs{F}\) を具体的に表現することもできます。\(\bs{F}\) は \(H=\{e,\:\sg^2\}\) の固定体なので、\(\bs{F}=\bs{Q}(\theta)\) として、
 \(\sg^2(\theta)=\theta\)
となる \(\theta\) を探します。\(\theta\) の選び方には自由度があり、たとえば \(\theta=\zeta^4+\zeta\) としてもよいのですが、ここでは、
 \(\theta=(\zeta^2-\zeta^3)(\zeta^4-\zeta)\)
とします。このように選ぶと、\(\sg^2(\zeta)=\zeta^4\) なので、
\(\begin{eqnarray}
&&\:\:\sg^2(\theta)&=(\zeta^8-\zeta^{12})(\zeta^{16}-\zeta^4)\\
&&&=(\zeta^3-\zeta^2)(\zeta-\zeta^4)=\theta\\
\end{eqnarray}\)
となって、\(\theta\) は \(\sg^2\) で不変です。と同時に、\(\sg(\zeta)=\zeta^2\) なので、
\(\begin{eqnarray}
&&\:\:\sg(\theta)&=(\zeta^4-\zeta^6)(\zeta^8-\zeta^2)\\
&&&=(\zeta^4-\zeta)(\zeta^3-\zeta^2)=-\theta\\
\end{eqnarray}\)
となります。ということは、
 \(\sg(\theta^2)=(\sg(\theta))^2=(-\theta)^2=\theta^2\)
であり、\(\theta^2\) は \(\sg\) で不変、つまり \(G\) のすべての元で不変となり、\(\theta^2\) は有理数です。そこで、
 \(\zeta^5=1\)
 \(\zeta^4+\zeta^3+\zeta^2+\zeta+1=0\)
の関係を使って \(\theta^2\) を計算すると、
\(\begin{eqnarray}
&&\:\:\theta^2&=(\zeta^2-\zeta^3)^2(\zeta^4-\zeta)^2\\
&&&=(\zeta^4-2\zeta^5+\zeta^6)(\zeta^8-2\zeta^5+\zeta^2)\\
&&&=(\zeta^4-2+\zeta)(\zeta^3-2+\zeta^2)\\
&&&=\zeta^7-2\zeta^4+\zeta^6-2\zeta^3+4-2\zeta^2+\zeta^4-2\zeta+\zeta^3\\
&&&=\zeta^2-2\zeta^4+\zeta-2\zeta^3+4-2\zeta^2+\zeta^4-2\zeta+\zeta^3\\
&&&=-\zeta^4-\zeta^3-\zeta^2-\zeta+4\\
&&&=5\\
\end{eqnarray}\)
となり、確かに\(\theta^2\) は有理数であることが分かります。つまり、
 \(\theta=\sqrt{5}\)
です。従ってガロア対応は、

 \(G\sp H\)\(\sp\{\:e\:\}\)
 \(\bs{Q}\subset\bs{Q}(\sqrt{5})\)\(\subset\:\bs{Q}(\zeta)\)

となります。原始5乗根に \(\sqrt{-10+2\sqrt{5}}\) のような項が現れるのは、中間体が \(\bs{Q}(\sqrt{5})\) であるという、体の拡大構造からくるのでした。


ここまでの論証を振り返ってみると、

\(p\) を素数とし、原始\(p\)乗根を \(\zeta\) とすると、
 \(|\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})|=|(\bs{Z}/p\bs{Z})^{*}|=p-1\)
なので、
 \(p-1=2^k\:\:(1\leq k)\)
の条件があると、\(\bs{Q}\) から \(\bs{Q}(\zeta)\) に至る「平方根拡大」の列が存在し、\(\zeta\) は四則演算と平方根 \(\sqrt{\phantom{a}}\) だけで表現できる。従って 正 \(p\)角形は定規とコンパスで作図可能である

ことが分かります。この条件は \(p=3,\:5\) で成立しますが、その次に成立するのは \(p=17\) です。

\(x^{17}-1=0\)
\(1\) の原始\(17\)乗根を \(\zeta\) とします。\(p=17\) の最小原始根は \(3\) で(25D)、\((\bs{Z}/17\bs{Z})^{*}\) の位数は \(16\) です。\((\bs{Z}/17\bs{Z})^{*}\) において \(3\) の累乗は、
 \(\phantom{1}3,\:\phantom{1}9,\:10,\:13,\:\phantom{1}5,\:15,\:11,\:16,\)
 \(14,\:\phantom{1}8,\:\phantom{1}7,\:\phantom{1}4,\:12,\:\phantom{1}2,\:\phantom{1}6,\:\phantom{1}1\)
と、すべての元を巡回します。従って、
 \(\sg(\zeta)=\zeta^3\)
という自己同型写像 \(\sg\) を定義すると、
 \(G=\{\sg,\sg^2,\sg^3,\cd,\sg^{15},\sg^{16}=e\}\)
が \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) です。

\(x^5-1=0\) のときと同様の考察をすると、\(G\) には3つの部分群があります。

 \(H_1=\{\sg^2,\sg^4,\sg^6,\sg^8,\sg^{10},\sg^{12},\sg^{14},e\}\)
   \(\sg^2(\zeta)=\zeta^9\)
 \(H_2=\{\sg^4,\sg^8,\sg^{12},e\}\)
   \(\sg^4(\zeta)=\zeta^{13}\:\:(\phantom{1}9^2\equiv13\:\:(\mr{mod}\:17))\)
 \(H_3=\{\sg^8,e\}\)
   \(\sg^8(\zeta)=\zeta^{16}\:\:(13^2\equiv16\:\:(\mr{mod}\:17))\)

の3つで、

 \(G\sp H_1\sp H_2\sp H_3\sp\{\:e\:\}\)
   \(G\)\(/H_1\)\(\cong\{\sg^{\phantom{2}},\:e\}\)
   \(H_1\)\(/H_2\)\(\cong\{\sg^2,\:e\}\)
   \(H_2\)\(/H_3\)\(\cong\{\sg^4,\:e\}\)
   \(H_3\)\(/\{\:e\:\}\)\(\cong\{\sg^8,\:e\}\)

は可解列です。ガロア対応の定理(53B)により、\(H_1,\:H_2,\:H_3\) にはそれぞれに対応した固定体 \(\bs{F}_1,\:\bs{F}_2,\:\bs{F}_3\) があって、

 \(G\sp H_1\sp H_2\sp H_3\sp\{\:e\:\}\)
 \(\bs{Q}\subset\bs{F}_1\subset\bs{F}_2\subset\bs{F}_3\subset\bs{Q}(\zeta)\)

のガロア対応になります。\(\bs{Q}\) から \(\bs{Q}(\zeta)\) までの4つの拡大次数は、剰余群の位数に等しいのですべて \(2\) です。つまり、\(\bs{\bs{Q}(\zeta)}\)\(\bs{\bs{Q}}\) からの「平方根拡大」を4回繰り返したものであり、原始\(17\)乗根は四則演算と平方根 \(\sqrt{\phantom{a}}\) のみを使って表現できます。従って正\(17\)角形は定規とコンパスで作図可能です。

これは、ドイツの大数学者\(\cdot\)ガウス(\(1777-1855\))が\(19\)才のときに発見した定理として有名です。

作図可能の原理
ここで改めて、平面上の図形が定規とコンパスで「作図可能」という意味を明確にします。ここで "定規" は「目盛りのない、与えられた2点を通る線を引くことだけができる道具」であり、"コンパス" は「角度目盛りのない、与えられた2点のうちの1点を中心として別の点を通る円\(\bs{\cdot}\)円弧を描くことだけができる道具」でした。

平面上の図形は点と線でできています。線は2点を与えると描けるので、「作図可能」の意味は「平面上で作図可能な点とは何か」を定義することに帰着します。

平面を複素平面(\(=\bs{C}\))として考えます。以降、
 \(a,\:b\) \(\in\:\bs{R}\)
 \(\al,\:\beta\) \(\in\:\bs{C}\)
の記号を使います。「作図可能」の意味は「複素平面上で作図可能な複素数(実数を含む)とは何か」を定義することです。

\(1,\:0\) は作図可能である。また複素平面の実軸と虚軸は作図できる。

作図1.jpg

任意の線分を単位長さとし、端点を \(1,\:0\) とします。2点を結ぶ直線が実軸で、\(0\) を通り実軸と垂直な直線を作図するとそれが虚軸です。

\(\al=a+b\:i\) とすると、\(a,\:b\) が作図可能なら \(\al\) も作図可能である。また、\(\al\) が作図可能なら \(a,\:b\) も作図可能である。

作図2.jpg

\(a\) が作図可能なら、\(-a\) も作図可能である。従って \(\al\) が作図可能なら \(-\al\) も作図可能である。

また \(a,\:b\) が作図可能なら \(a+b\) も作図可能である。従って、\(\al,\:\beta\) が作図可能なら \(\al+\beta\) も作図可能である。

作図3.jpg

\(a,\:b\) が作図可能なら \(ab\)も作図可能である。従って \(\al,\:\beta\) が作図可能なら \(\al\beta\) も作図可能である。

作図4.jpg

\(a\:\:(a\neq0)\) が作図可能なら \(a^{-1}\) も作図可能である。従って \(\al\:\:(\al\neq0)\) が作図可能なら \(\al^{-1}\) も作図可能である。

作図5.jpg

作図可能な \(\al\) を \(\al=a+b\:i\) とすると、
 \(\al^{-1}=\dfrac{a}{a^2+b^2}-\dfrac{b}{a^2+b^2}\:i\)
です。\(a,\:b\) が作図可能なので、その四則演算の結果は作図可能です。従って \(\al^{-1}\) も作図可能です。

有理数 \(\bs{Q}\) は作図可能である。

実数のなかで作図可能な点は四則演算で閉じています。かつ、\(0,\:1\) は作図可能です。従って有理数は作図可能です。

\(a\) が正の実数のとき、\(\sqrt{a}\) は作図可能である。

作図6.jpg

\(a\) と \(-1\) を結ぶ線分を直径とする円を描き、虚軸との交点を \(x\cdot i\:(x\):実数) とすると、
 \(1:x=x:a\)
なので、\(x=\pm\sqrt{a}\) です。従って \(\sqrt{a}\) は作図可能です。

\(\al\) を作図可能な複素数とするとき、\(\sqrt\al\) は作図可能である。

作図7.jpg

極形式を使って、
 \(\al=r(\mr{cos}\theta+i\cdot\mr{sin}\theta)\)
とすると、\(r\) は作図可能であり、つまり \(\sqrt{r}\) も作図可能です。また、角 \(\theta\) を2等分する線も、定規とコンパスで作図可能です。従って \(\sqrt\al\) は作図可能です。

\(\al,\:\beta\) が作図可能な複素数とするとき、2次方程式 \(x^2+\al x+\beta=0\) の解は作図可能である。

ある複素数 \(\al\) は、作図可能な複素数を係数とする2次方程式、あるいは1次方程式の解となるときのみ、作図可能である。

2次方程式 \(x^2+\al x+\beta=0\) の解は、根の公式により、係数 \(\al,\:\beta\) の四則演算と平方根で表わされます。従って作図可能です。

定規とコンパスで作図可能な点は、作図可能な円や直線の交点として求まる点です。2次元 \(xy\) 平面( \(\bs{R}^2\) )で考えると、直線と直線の交点は1次方程式の解です。また円と直線の交点は2次方程式の解です。円と円の交点がどうかですが、\(a,\:b,\:c,\:d\) を実数として、2つの円の方程式を、
 \(x^2+y^2=a^2\)
 \((\br{A})\)
 \((x-b)^2+(y-c)^2=d^2\)
 \((\br{B})\)
とします。\((\br{A}),\:(\br{B})\) の両辺を引き算して整理すると、
 \(2bx+2cy-(b^2+c^2+a^2-d^2)=0\)
 \((\br{C})\)
という直線の方程式になります。2つの円の交点は \((\br{A}),\:(\br{C})\) の連立方程式の解であり、2次方程式の解です。つまり、作図可能な実数は、作図可能な実数を係数とする2次方程式(あるいは1次方程式)の解となる実数です。

実数(\(a,\:b\))が作図可能と、複素数(\(a+bi\))が複素平面上で作図可能は同値です。従って、ある複素数 \(\al\) は、作図可能な複素数を係数とする2次方程式、あるいは1次方程式の解となるときのみ、作図可能です。

\(\bs{Q}\) の代数拡大体 \(\bs{K}\) があり、

 \(\bs{Q}=\bs{K}_0\subset\bs{K}_1\subset\cd\subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cd\subset\bs{K}_n=\bs{K}\)
 \([\:\bs{K}_{i+1}:\bs{K}_i\:]=2\:\:(0\leq i < n)\)

を満たす \(\bs{Q}\) から \(\bs{K}\) の拡大列が存在するとき、\(\bs{K}\) の元
 \(\al\in\bs{K}\)
は作図可能である。

\([\:\bs{K}_{i+1}:\bs{K}_i\:]=2\) であれば、\(\bs{K}_{i+1}/\bs{K}_i\) は次数2のべき根拡大であり、
 \(x^2-a=0\:\:\:(a\in\bs{K}_i)\)
の解、\(\sqrt{a}\) を用いて、
 \(\bs{K}_{i+1}=\bs{K}_i(\sqrt{a})\)
と表されます。従って、\(\bs{K}_i\) の元が作図可能なら、\(\bs{K}_{i+1}\) の元は「作図可能な点の四則演算と平方根の組み合わせ」で表現できるので、作図可能です。体の拡大列の出発点である \(\bs{Q}\) の元は作図可能なので、到達点である \(\bs{K}\) の元も作図可能になります。

\(1\) の原始\(p\)乗根(\(p\):素数)を \(\zeta\) とすると、\(G=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) の位数は \(p-1\) であり、それが2の累乗であれば、\(G\) の可解列にガロア対応する体の拡大系列、

 \(\bs{Q}=\bs{K}_0\subset\bs{K}_1\subset\cd\subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cd\subset\bs{K}_n=\bs{Q}(\zeta)\)
 \([\:\bs{K}_{i+1}:\bs{K}_i\:]=2\:\:(0\leq i < n)\)

が存在します(前項での証明)。従って複素数平面上の点 \(\zeta\) は作図可能であり、正 \(p\)角形は作図可能です。条件に合致する素数は \(p=3\)、\(5\)、\(17\)、\(257\)、\(65537\)であることが知られています。これらの素数をフェルマ素数と呼びます。フェルマ素数 \(p\) とは、\(p-1\) が2の累乗であるような素数です。

さらに、一般の正 \(n\)角形が作図可能である条件は、次のようになります。

正 \(n\)角形は、

 \(n=2^k\:\:\:(2\leq k)\)
 \(n=2^k\cdot p_1p_2\cd p_r\:\:\:(0\leq k,\:\:1\leq r)\)
   \(p_i\) は相異なるフェルマ素数

のとき、作図可能である。

[証明]

角度の2等分線は作図可能なので、\(n=2^k\:\:(2\leq k)\) のとき、正 \(n\)角形は作図可能である。と同時に、正 \(m\)角形が作図可能なとき、
 \(n=2^k\cdot m\:\:(0\leq k)\)
とおくと、正 \(n\)角形は作図可能になる。\(p\) がフェルマ素数のとき、正 \(p\)角形は作図可能なので、

\(m_1\) と \(m_2\) を互いに素な3以上の数とするとき、正 \(m_1\) 角形と正 \(m_2\)角形が作図可能であれば、正 \(m\)角形(\(m=m_1m_2\))は作図可能である

ことが証明できれば十分である。

\(\theta,\:\theta_1,\:\theta_2\) を任意の角度とする。
 \(\mr{sin}\theta=\sqrt{1-\mr{cos}^2\theta}\)
だから、\(\mr{cos}\theta\) が作図できれば \(\mr{sin}\theta\) も作図できる。また三角関数の加法定理より、
 \(\mr{cos}(\theta_1+\theta_2)=\mr{cos}\theta_1\cdot\mr{cos}\theta_2-\mr{sin}\theta_1\cdot\mr{sin}\theta_2\)
なので、\(\mr{cos}\theta_1,\:\mr{cos}\theta_2\) が作図できれば \(\mr{cos}(\theta_1+\theta_2)\) も作図できる。このことから \(\mr{cos}\theta\) が作図できれば \(\mr{cos}(k\theta)\:\:(k\) は整数)も作図できる。

複素平面上で原点を中心とする半径1の円に正 \(m\)角形を描いたとき、その頂点の複素数は
 \(\mr{cos}\left(\dfrac{2\pi}{m}k\right)+i\:\mr{sin}\left(\dfrac{2\pi}{m}k\right)\:\:(0\leq k\leq m-1)\)
である。\(k=1\) の点が作図できれば、残りの点が作図できるから、
 \(\mr{cos}\left(\dfrac{2\pi}{m}\right)\)
が作図できれば、正 \(m\)角形は作図できる。

\(m_1\) と \(m_2\) は互いに素だから、不定方程式の解の存在の定理(21C)により、
 \(k_1m_1+k_2m_2=1\)
を満たす \(k_1,\:k_2\) が存在する。両辺を \(m=m_1m_2\) で割ると
 \(\dfrac{k_1}{m_2}+\dfrac{k_2}{m_1}=\dfrac{1}{m}\)
 \(\dfrac{2\pi}{m_2}k_1+\dfrac{2\pi}{m_1}k_2=\dfrac{2\pi}{m}\)
が得られる。正 \(m_1\)角形と正 \(m_2\)角形 は作図できるから、
 \(\mr{cos}\left(\dfrac{2\pi}{m_1}\right),\:\:\mr{cos}\left(\dfrac{2\pi}{m_2}\right)\)
は作図できる。従って
 \(\mr{cos}\left(\dfrac{2\pi}{m_2}k_1+\dfrac{2\pi}{m_1}k_2\right)\)
は作図でき、
 \(\mr{cos}\left(\dfrac{2\pi}{m}\right)\)
も作図できることになって、正 \(m\)角形は作図できる。[証明終]


証明の鍵は「\(m_1\) と \(m_2\) が互いに素」です。従って、正3角形が作図できても、正9角形は作図できません。正\(15\)角形なら作図できます。計算すると、作図可能な正 \(n\)角形(\(n\leq100\))は、

\(n=\) \(3\)、\(4\)、\(5\)、\(6\)、\(8\)、\(10\)、\(12\)、\(15\)、\(16\)、\(17\)、\(20\)、\(24\)、\(30\)、\(32\)、\(34\)、\(40\)、\(48\)、\(51\)、\(60\)、\(64\)、\(68\)、\(80\)、\(85\)、\(96\)

です。「正\(50\)角形は作図できないが、正\(51\)角形は作図できる」というのも不思議な感じがします。


7.7 巡回拡大はべき根拡大:3次方程式が解ける理由


この節では可解な方程式がなぜ解けるのかを、3次方程式を例にとってガロア理論で説明します。また3次方程式の根の公式をガロア理論に沿った形て導出します。「7.5 可解性の十分条件」で証明したことは、


体 \(\bs{K}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とする。\(\mr{Gal}(\bs{L}/\bs{K})=G\) とし、\(G\) は可解群とする。このとき \(f(x)=0\) の解は四則演算とべき根で表現できる。


でした。この証明の核となっているのは「7.3 べき根拡大の十分条件」であり、それは、


1の原始\(n\)乗根を \(\zeta\) とし、代数体 \(\bs{\bs{K}}\) には \(\bs{\zeta}\) が含まれるとする。\(\bs{L}/\bs{K}\) をガロア拡大とし、\(\mr{Gal}(\bs{L}/\bs{K})\) が巡回群とする(= \(\bs{L}/\bs{K}\) が巡回拡大)。拡大次数は \([\bs{L}:\bs{K}]=n\) とする。このとき、\(\bs{L}\) は \(\bs{K}\) のべき根拡大である。


でした。このことを証明した論理展開は、次のようでした。


次の条件があるとする。
\(\bs{L}\) は \(\bs{K}\) の代数拡大体であり、拡大次元は \(n\) である。
\(\bs{K}\) には \(1\) の原始\(n\)乗根が含まれる。
\(\bs{L}/\bs{K}\) はガロア拡大である。
\(\mr{Gal}(\bs{L}/\bs{K})\) は巡回群である(=\(\bs{L}/\bs{K}\) は巡回拡大)

このとき、レゾルベント(分解式)を定義することで、
\(\al^n\) が \(\bs{K}\) の元であるような \(\bs{L}\) の元 \(\al\) が存在する。すなわち、\(x^n-a=0\:\:(a\in\bs{K})\) の解が \(\al\in\bs{L}\)
このとき \(\bs{L}=\bs{K}(\al)\) になり、従って \(\bs{L}/\bs{K}\) はべき根拡大
となる。


つまり、レゾルベントを使って、巡回拡大=べき根拡大(但し、体に \(1\) の原始\(n\)乗根が含まれることが条件)を証明したわけです。この証明プロセスを、具体的な3次方程式で順にたどります。まず、3次方程式のガロア群を再度整理します。

3次方程式のガロア群
3次方程式のガロア群は「1.3 ガロア群」で計算しましたが、改めて書きます。3次方程式のガロア群は、3次方程式の3つの解、\(\al,\:\beta,\gamma\) を入れ替える(置換する)群であり、一般的には、

 \(G=\{e,\:\sg,\:\sg^2,\:\tau,\:\sg\tau,\:\sg^2\tau\}\)

です。3つの解をそれぞれ \(1,\:2,\:3\) の文字で表し、巡回置換の記法(6.5節)で書くと、
 \(\sg\) \(=(1,\:2,\:3)\)
 \(\sg^2\) \(=(1,\:3,\:2)\)
 \(\tau\) \(=(2,\:3)\)
 \(\sg\tau\) \(=(1,\:2)\)
 \(\sg^2\tau\) \(=(1,\:3)\)
で(\(\sg,\:\tau\) の演算は右から行う)、これは3次の対称群(\(S_3\)。6.5節)です。この群はもちろん可換群ではなく \(\tau\sg\neq\sg\tau\) ですが、\(\tau\sg\) を計算すると、
 \(\tau\sg=(1,\:3)\)
であり、
 \(\tau\sg=\sg^2\tau\)
との関係が成り立っています。これを "弱可換性" と呼ぶことにします(ここだけの用語です)。ここで、

 \(H=\{e,\:\sg,\:\sg^2\}\)

という \(G\) の部分群を考えると、\(H\) は巡回群であると同時に \(G\) の正規部分群です。"弱可換性" を使って検証してみると、
\(\begin{eqnarray}
&&\:\:\tau H&=\{\tau,\:\tau\sg,\:\tau\sg^2\}\\
&&&=\{\tau,\:\sg^2\tau,\:\sg^2\tau\sg\}\\
&&&=\{\tau,\:\sg^2\tau,\:\sg^4\tau\}\\
&&&=\{\tau,\:\sg^2\tau,\:\sg\tau\}\\
&&&=\{\tau,\:\sg\tau,\:\sg^2\tau\}\\
&&&=H\tau\\
\end{eqnarray}\)
となります。つまり、
 \(\tau H=H\tau\)
です。さらに、この式に左から \(\sg\) をかけると、
 \(\sg\tau H=\sg H\tau\)
ですが、\(H\) のすべての元は \(\sg\) で表現できるので、\(\sg H=H\sg\) です。従って、
 \(\sg\tau H=H\sg\tau\)
であり、同様にして、
 \(\sg^2\tau H=H\sg^2\tau\)
も分かります。つまり、任意の \(\bs{G}\) の元 \(\bs{x\in G}\) について、\(\bs{xH=Hx}\) が成り立つので \(H\) は \(G\) の正規部分群です。

\(G\) の \(H\) による剰余群は、
 \(G/H=\{H,\tau H\}\)
であり、単位元は \(H\) で、
 \((\tau H)^2=\tau H\tau H=\tau\tau HH=H\)
となる、位数\(2\) の巡回群です(\(G/H\cong C_2)\)。この結果、

 \(G\:\sp\:H\:\sp\:\{\:e\:\}\)

は可解列になり、\(G\) は可解群で、従って3次方程式は可解です(=四則演算とべき根で解が表現可能)。この節ではそれを具体例で確認していきます。


一方、「3.3 線形空間」の「代数拡大体の構造」で書いたように、3次方程式のガロア群が \(S_3\) ではなく、位数 \(3\) の巡回群( \(C_3\) )になる場合があります。それを再度整理します。

\(x^3+ax^2+bx+c=0\) の3次方程式は、\(x=X-\dfrac{a}{3}\) とおくと、
 \(X^3+\left(b-\dfrac{a^2}{3}\right)X+\left(\dfrac{2}{27}a^3-\dfrac{1}{3}ab+c\right)=0\)
となって、2乗の項が消えます。従って以降、3次方程式を、
 \(x^3+px+q=0\)
の形で扱います。
 \(f(x)=x^3+px+q\)
とおき、\(f(x)\) は既約多項式とします。3次方程式の根を \(\al,\:\beta,\:\gamma\) とすると、
 \(x^3+px+q=(x-\al)(x-\beta)(x-\gamma)\)
であり、根と係数の関係から、
 \(\al+\beta+\gamma=0\)
 \(\al\beta+\beta\gamma+\gamma\al=p\)
 \(\al\beta\gamma=-q\)
です。3次方程式のガロア群が \(S_3\) か \(C_3\) かを決めるポイントとなるのは、

 \(\theta=(\al-\beta)(\beta-\gamma)(\gamma-\al)\)

で定義される、根の差積と呼ばれる値です。差積は普通、\(\Delta\)(ギリシャ文字・デルタの大文字)で表しますが、後の説明の都合で \(\theta\) と書きます。差積は、任意の2つの根の互換で \(-\theta\) となるので、3つの根を \(\al,\:\beta,\:\gamma\) に割り当てる方法によって、\(\theta\) は2つの値をとり得ます。差積の2乗が判別式であり、

 \(D=(\al-\beta)^2(\beta-\gamma)^2(\gamma-\al)^2\)

です。つまり \(\theta=\sqrt{D}\) と書けますが、\(\sqrt{D}\) は「2乗して \(D\) となる2つの数のどちらか」の意味です。\(D\) は \(\al,\:\beta,\:\gamma\) の任意の置換で不変な対称式なので、3次方程式の係数である \(p,\:q\) で表すことができる有理数です。

その \(D\) を方程式の係数で表すために、\(f(x)\) を微分します。
 \(f(x)=(x-\al)(x-\beta)(x-\gamma)\)
なので、
\(\begin{eqnarray}
&&\:\:f\,'(x)=&(x-\al)(x-\beta)+(x-\beta)(x-\gamma)+\\
&&&(x-\gamma)(x-\al)\\
\end{eqnarray}\)
であり、
 \(f\,'(\al)=(\al-\beta)(\al-\gamma)\)
 \(f\,'(\beta)=(\beta-\gamma)(\beta-\al)\)
 \(f\,'(\gamma)=(\gamma-\al)(\gamma-\beta)\)
となります。従って、
 \(D=-f\,'(\al)f\,'(\beta)f\,'(\gamma)\)
です。一方、
 \(f\,'(x)=3x^2+p\)
なので、
 \(D=-(3\al^2+p)(3\beta^2+p)(3\gamma^2+p)\)
となります。ここからの計算を進めるために、次の2つの対称式を、根と係数の関係を使って \(p\) で表しておきます。
 ・\(\al^2+\beta^2+\gamma^2\)
   \(=(\al+\beta+\gamma)^2-2(\al\beta+\beta\gamma+\gamma\al)\)
   \(=-2p\)
 ・\(\al^2\beta^2+\beta^2\gamma^2+\gamma^2\al^2\)
   \(=(\al\beta+\beta\gamma+\gamma\al)^2-2\al\beta\gamma(\al+\beta+\gamma)\)
   \(=p^2\)
これを用いると、
\(\begin{eqnarray}
&&\:\:D&=&-(3\al^2+p)(3\beta^2+p)(3\gamma^2+p)\\
&&&=&-27(\al\beta\gamma)^2-9(\al^2\beta^2+\beta^2\gamma^2+\gamma^2\al^2)p\\
&&&&-3(\al^2+\beta^2+\gamma^2)p^2-p^3\\
&&&=&-27q^2-9\cdot p^2\cdot p-3\cdot(-2p)\cdot p^2-p^3\\
&&&=&-4p^3-27q^2\\
\end{eqnarray}\)
と計算できます。つまり、

 \(D=-4p^3-27q^2\)

です。ここでもし、\(D\) がある有理数 \(a\) の2乗(\(D=a^2\))なら、

 \(\theta=\sqrt{D}=\pm a\)

となり、\(\theta\) は有理数です。\(\theta\) が有理数(\(\theta=\pm a\))の場合、
 \(f\,'(\al)=(\al-\beta)(\al-\gamma)\)
 \(f\,'(\al)=3\al^2+p\)
の関係があるので、
\(\begin{eqnarray}
&&\:\:\theta&=(\al-\beta)(\beta-\gamma)(\gamma-\al)\\
&&&=-f\,'(\al)(\beta-\gamma)\\
&&&=-(3\al^2+p)(\beta-\gamma)\\
\end{eqnarray}\)
ですが、\(\theta=\pm a\) なので、
 \(\beta-\gamma=\pm\dfrac{a}{3\al^2+p}\)
です。この式と、根と係数の関係である、
 \(\beta+\gamma=-\al\)
を使うと、\(\bs{\beta}\)\(\bs{\gamma}\)\(\bs{\al}\) の有理式(=分母・分子が \(\bs{\al}\) の多項式)で表現できることになります。計算すると(\(\pm\)は省略して)、
 \(\beta=\dfrac{2p\al+3q-a}{2(3\al^2+p)}\)
 \(\gamma=\dfrac{2p\al+3q+a}{2(3\al^2+p)}\)
です(\(\beta\) と \(\gamma\) は逆でもよい)。\(\beta,\:\gamma\) が \(\al\) の有理式で表現できるので、
 \(\bs{Q}(\al,\beta,\gamma)\subset\bs{Q}(\al)\)
であり、もちろん \(\bs{Q}(\al,\beta,\gamma)\sp\bs{Q}(\al)\) なので。

 \(\bs{Q}(\al,\beta,\gamma)=\bs{Q}(\al)\)

です。\(\bs{Q}(\al)\) のところは \(\bs{Q}(\beta)\) や \(\bs{Q}(\gamma)\) とすることができます。

つまり、\(\bs{Q}\) 上の既約多項式 \(f(x)=x^3+px+q\) の最小分解体 \(\bs{L}=\bs{Q}(\al,\beta,\gamma)\) は、方程式の解の一つである \(\al\) の(または \(\beta,\:\gamma\) の)単拡大体であり、単拡大体の基底の定理(33F)により \(\bs{L}\) の次元は \(3\) です。すると次数と位数の同一性52B)により、\(G=\mr{Gal}(\bs{L}/\bs{Q})\) の群位数は \(3\) です。従って、ラグランジュの定理41E)により群位数が素数の群は巡回群なので、\(G\) は群位数 \(3\) の巡回群( \(C_3\) )です。


以上をまとめると、3次方程式の最小分解体のガロア群は、次のようになります。

前提として、

 ・\(f(x)=x^3+px+q\:\:(p,\:q\in\bs{Q})\)
  ( \(f(x)\) は既約多項式 )
 ・\(f(x)=0\) の解を \(\al,\:\beta,\:\gamma\)
 ・\(\theta=(\al-\beta)(\beta-\gamma)(\gamma-\al)\)
 ・\(f(x)\) の最小分解体を \(\bs{L}=\bs{Q}(\al,\beta,\gamma)\)
 ・\(G=\mr{Gal}(\bs{L}/\bs{Q})\)

とする。この前提のもとで、

\(\bs{\theta}\):有理数のとき
 \(G\cong C_3\)
  \(G=\{\:e,\:\sg,\:\sg^2\:\}\)
    \(\sg=(1,\:2,\:3)\)
  \(G\) は巡回群なので可解群

\(\bs{\theta}\):有理数でないとき
 \(G\cong S_3\)
  \(G=\{e,\:\sg,\:\sg^2,\:\tau,\:\sg\tau,\:\sg^2\tau\}\)
    \(\sg=(1,\:2,\:3)\:\:\tau=(2,\:3)\)
  \(H=\{e,\:\sg,\:\sg^2\}\) は \(G\) の正規部分群
  \(G\:\sp\:H\:\:\sp\:\{\:e\:\}\) は可解列
    \(G/H\)\(=\{H,\:\tau H\}\)\(\cong C_2\)
    \(H/{e}\)\(=H\)\(\cong C_3\)
  \(G\) は可解群

なお、\((1,\:2,\:3)\:\:(2,\:3)\) の巡回置換は \((1,\:3,\:2)\:\:(1,\:2)\:\:(1,\:3)\) などとしても同じです。

\(C_3\::\:x^3-3x+1\)
まずガロア群が \(C_3\) の方程式 \(x^3-3x+1=0\) を取り上げ、巡回拡大がべき根拡大になる原理を確認します。この原理はガロア群が \(S_3\) のときにもそのまま応用できます。ちなみに \(C_3\) の方程式は \(p,\:q\) が \(-9\leq p\leq-1,\:\:1\leq q\leq9\) の整数だと、他に、
 \(x^3-7x+6=0\:\:\:(D=400,\:\sqrt{D}=20)\)
 \(x^3-7x+7=0\:\:\:(D=\phantom{0}49,\:\sqrt{D}=\phantom{0}7)\)
 \(x^3-9x+9=0\:\:\:(D=729,\:\sqrt{D}=27)\)
があります。

\(x^3-3x+1=0\) の場合、\(p=-3,\:q=1\) なので、
\(\begin{eqnarray}
&&\:\:D&=-4p^3-27q^2=81=9^2\\
&&\:\:\theta&=\pm\sqrt{D}=\pm9\\
\end{eqnarray}\)
となります。3つの解を \(\al,\:\beta,\:\gamma\) とすると、
 \(\bs{L}=\bs{Q}(\al,\beta,\gamma)=\bs{Q}(\al)=\bs{Q}(\beta)=\bs{Q}(\gamma)\)
で、\(\bs{L}\) の次元は \(3\) で、\(G=\mr{Gal}(\bs{L}/\bs{Q})\cong C_3\) です。

以下「7.3 べき根拡大の十分条件」の証明の論理に沿います。7.3 の証明では、体に \(1\) の原始\(n\)乗根が含まれているのが条件でした。そこで \(1\) の原始3乗根 を \(\omega\) とし、

 \(\bs{Q}(\omega)\:\subset\:\bs{Q}(\omega,\:\al)=\bs{L}(\omega)\)

という体の拡大を考えます。\(\omega\) は \(x^2+x+1=0\) の2つある根のどちらかで、
 \(\omega=\dfrac{1}{2}(-1\pm\sqrt{3}i)\)
です。7.3 ではラグランジュのレゾルベントを \(\al\) と書きましたが、方程式の根の表記との重複を避けるため、ここでは \(S\) とします。そうするとレゾルベントは、

 \(S=c+\omega^2\sg(c)+\omega\sg^2(c)\)
 \((\br{A})\)

です。\(\bs{Q}(\omega,\:\al)\) は \(\bs{Q}(\omega)\) に \(\al\) を添加した単拡大体なので、べき根拡大の十分条件のため補題272B)に従って、\(c=\al\) と定めます。そうすると、
 \(S=\al+\omega^2\sg(\al)+\omega\sg^2(\al)\)
となり、\(\al,\:\beta,\:\gamma\) で表すと、\((\br{A})\) 式は、

 \(S=\al+\omega^2\beta+\omega\gamma\)
 \((\br{B})\)

です。この \(S\) は \(\bs{Q}(\omega,\al,\beta,\gamma)\) の元ですが、
 \(\bs{Q}(\omega,\al,\beta,\gamma)=\bs{Q}(\omega,\al)\)
なので、\(S\) は \(\bs{Q}(\omega,\al)\) の元であり、ということは、
 \(\bs{Q}(\omega,\:S)\subset\bs{Q}(\omega,\al)\)
です。方程式の3つの解を \(\al,\:\beta,\:\gamma\) に割り当てる方法の数(\(=3!\) )により、\(S\) は6通りの可能性があります。

7.3 での証明のポイントは、\(\bs{S^3}\)\(\bs{\bs{Q}(\omega)}\) の元である、というところでした。それを計算で確かめるため、もうひとつのレゾルベントを導入します。ガロア群 \(G=\{e,\sg,\sg^2\}\) は、\(\sg\) が生成元であると同時に、\(\sg^2\) も生成元です。レゾルベントの定義における \(\sg\) は \(G\) の生成元であることが条件でした(73A)。そこで \((\br{A})\) 式の \(\sg\) を \(\sg^2\) で置き換えた式を \(T\) とすると、
\(\begin{eqnarray}
&&\:\:T&=c+\omega^2\sg^2(c)+\omega\sg^4(c)\\
&&&=c+\omega^2\sg^2(c)+\omega\sg(c)\\
\end{eqnarray}\)
となります。この式で \(c=\al\) とおくと

 \(T=\al+\omega\beta+\omega^2\gamma\)

です。\(S\) には6通りの可能性がありますが、\(S\) をそのうちの一つに決めると \(T\) は一意に決まります。ここで、
 \(\al+\omega^2\beta\)\(+\omega\gamma\)\(=S\)
 \(\al+\omega\beta\)\(+\omega^2\gamma\)\(=T\)
 \(\al+\beta\)\(+\gamma\)\(=0\) (根と係数の関係)
は \(\al,\:\beta,\:\gamma\) を未知数とする連立1次方程式なので、\(\al,\:\beta,\:\gamma\) を \(S\) と \(T\) の式で表せます。連立方程式を解くと、

 \(\al=\dfrac{1}{3}(S+T)\)
 \(\beta=\dfrac{1}{3}(\omega S+\omega^2T)\)
 \((\br{C})\)
 \(\gamma=\dfrac{1}{3}(\omega^2S+\omega T)\)

です。さらに、\(S\) と \(T\) には特別の関係があります。
 \(ST=(\al+\omega^2\beta+\omega\gamma)(\al+\omega\beta+\omega^2\gamma)\)
という式を考えると、
\(\begin{eqnarray}
&&\:\:ST&=&\al^2+\beta^2+\gamma^2+\\
&&&&(\omega^2+\omega)\al\beta+(\omega^4+\omega^2)\beta\gamma+(\omega^2+\omega)\gamma\al\\
&&&=&(\al+\beta+\gamma)^2-2(\al\beta+\beta\gamma+\gamma\al)+\\
&&&&(-\al\beta-\beta\gamma-\gamma\al)\\
&&&=&-3(\al\beta+\beta\gamma+\gamma\al)\\
&&&=&-3p\\
\end{eqnarray}\)
となり、つまり、

 \(ST=-3p\)
 \((\br{D})\)

という関係です。上の式の変形では、根と係数の関係と \(\omega^2+\omega+1=0\)、および \(\omega^3=1\) を使いました。

次に、\(S^3\) を求めるために \(S^3+T^3\) を計算してみると、
\(\begin{eqnarray}
&&\:\:S^3+T^3&=(S+T)(S^2-ST+T^2)\\
&&&=(S+T)(S+\omega T)(S+\omega^2T)\\
\end{eqnarray}\)
です。ここで \((\br{C})\) 式を変形すると、
 \(3\al\)\(=S+T\)
 \(3\omega^2\beta\)\(=S+\omega T\)
 \(3\omega\gamma\)\(=S+\omega^2T\)
が得られるので、
\(\begin{eqnarray}
&&\:\:S^3+T^3&=3\al\cdot3\omega^2\beta\cdot3\omega\gamma\\
&&&=27\al\beta\gamma=-27q\\
\end{eqnarray}\)
となります。まとめると、
 \(S^3+T^3=-27q\)
 \(ST=-3p\)
であり、
 \(S^3-\dfrac{27p^3}{S^3}+27q=0\)
です。つまり、

 \((S^3)^2+27qS^3-27p^3=0\)
 \((\br{E})\)

という \(S^3\) についての2次方程式を解くことで \(S^3\) が求まり、そこから \(S\) が求まります。\(S\) の値の可能性は6通りです。また \(T^3\) についても、

 \((T^3)^2+27qT^3-27p^3=0\)
 \((\br{E}')\)

が成り立ちます。2次方程式、

 \(X^2+27qX-27p^3=0\)
 \((\br{F})\)

の2つの解が \(S^3\) と \(T^3\) です。


ここまでの計算は \(x^3+px+q=0\) の形の既約方程式なら成り立ちます。ここで \(x^3-3x+1=0\) に即した、\(p=-3,\:q=1\) を \((\br{E})\) 式に入れると、

 \((S^3)^2+27S^3+27^2=0\)

\(\begin{eqnarray}
&&\:\:S^3&=\dfrac{1}{2}\left(-27\pm\sqrt{27^2-4\cdot27^2}\right)\\
&&&=27\dfrac{-1\pm i\sqrt{3}}{2}\\
&&&=27\omega\\
\end{eqnarray}\)

となります。最後の式の \(\omega\) は、2つある \(1\) の原始3乗根のどちらか、という意味にとらえます。\(S^3=27\omega\) なら \(T^3=27\omega^2\) で、その逆でもよいわけです。

\((\br{C})\) 式と \((\br{D})\) 式により、\(\al\) は \(S\) と \(\omega\) の四則演算で表現できます。つまり、
 \(\bs{Q}(\omega,\al)\subset\bs{Q}(\omega,\:S)\)
です。従って、さきほどの \(\bs{Q}(\omega,\:S)\subset\bs{Q}(\omega,\:\al)\) と合わせると、
 \(\bs{Q}(\omega,\:S)=\bs{Q}(\omega,\:\al)\)
です。以上をまとめると、レゾルベント \(S\) について、
\(\begin{eqnarray}
&&\:\:S^3&\in\bs{Q}(\omega)\\
&&\:\:S&\in\bs{Q}(\omega,\:S)=\bs{Q}(\omega,\:\al)\\
\end{eqnarray}\)
です。つまり、

\(\bs{Q}(\omega)\) 上の方程式、
  \(x^3-a=0\:\:(\:a=27\omega\in\bs{Q}(\omega)\:)\)
の解の一つ、\(\sqrt[3]{a}\) を \(\bs{Q}(\omega)\) に添加したのが \(\bs{Q}(\omega,\:\al)\)

であり、\(\bs{\bs{Q}(\omega,\:\al)}\)\(\bs{\bs{Q}(\omega)}\) のべき根拡大体であることがわかりました。\(\bs{Q}(\omega,\:\al)\) は \(x^3-a=0\) の解、\(\sqrt[3]{a},\:\sqrt[3]{a}\:\omega,\:\sqrt[3]{a}\:\omega^2\) の全部を含むので、\(\bs{Q}(\omega)\) のガロア拡大体です。結論として、

方程式 \(x^3-3x+1=0\) の解は、
有理数
\(\omega\)(\(1\) の原始3乗根)
\(\sqrt[3]{a}\:\:(\:a\in\bs{Q}(\omega)\:)\)
の四則演算で表現できる

ことになります。\(x^3-3x+1=0\) の場合、\(a=27\omega\) です。


巡回拡大がべき根拡大になることの証明のフォローはここまでですが、\(x^3-3x+1=0\) の解を具体的に求めることもできます。\(S^3=27\omega\) から、\(S=3\cdot\sqrt[3]{\omega}\) であり、また \(ST=9\) なので、
\(\begin{eqnarray}
&&\:\:\al&=\dfrac{1}{3}(S+T)=\dfrac{1}{3}\left(S+\dfrac{9}{S}\right)\\
&&&=\sqrt[3]{\omega}+\dfrac{1}{\sqrt[3]{\omega}}=\sqrt[3]{\omega}+\sqrt[3]{\omega^2}\\
&&&=\sqrt[3]{-\dfrac{1}{2}+\dfrac{\sqrt{3}}{2}i}+\sqrt[3]{-\dfrac{1}{2}-\dfrac{\sqrt{3}}{2}i}\\
\end{eqnarray}\)

が解の一つです。「1.3 ガロア群」の「ガロア群の例」に書いたように、

 \(\al=1.53208888623796\:\cd\)

であり、正真正銘の正の実数ですが、\(\bs{\al}\) をべき根で表わそうとすると虚数単位が登場します。その理由がガロア理論から分かるのでした。

\(S_3\::\:x^3+px+q\)
方程式 \(x^3+px+q=0\) の係数を変数のままで扱い、ガロア群が \(S_3\) の方程式の一般論として話を進めます。3つの根を \(\al,\:\beta,\:\gamma\) とし(置換での表示では、それぞれ \(1,\:2,\:3\))、差積 \(\theta\) を、

\(\begin{eqnarray}
&&\:\:\theta&=(\al-\beta)(\beta-\gamma)(\gamma-\al)\\
&&&=\sqrt{D}\\
&&\:\:D&=-4p^3-27q^2\\
\end{eqnarray}\)

と定義すると、\(\bs{\theta}\) が有理数でないとき

\(G\cong S_3\)
 \(G=\{e,\:\sg,\:\sg^2,\:\tau,\:\sg\tau,\:\sg^2\tau\}\)
   \(\sg=(1,\:2,\:3)\:\:\tau=(2,\:3)\)
 \(H=\{e,\:\sg,\:\sg^2\}\) は \(G\) の正規部分群
 \(G\:\sp\:H\:\:\sp\:\{\:e\:\}\) は可解列
   \(G/H=\{H,\:\tau H\}\cong C_2\)
   \(H/{\:e\:}=H\cong C_3\)
 \(G\) は可解群

となります(前述)。\(G\cong S_3\) は巡回群ではありません。しかし可解群なので "巡回群の入れ子構造" になっていて(=可解列が存在する)、「巡回拡大はべき根拡大」の定理(73A)を2段階に使うことで、方程式の解が四則演算とべき根で表現できることを証明できます。

まず、上記の可解列とガロア対応53B)になっている「体の拡大列」は何かです。具体的には \(H\) の固定体は何かですが、それは \(\bs{Q}(\theta)\) です。実際、
 \(\sg(\theta)=\theta,\:\:\sg^2(\theta)=\theta\)
なので、\(H\) のすべての元は \(\bs{Q}(\theta)\) の元を固定します。また、
 \(\tau(\theta)=-\theta\)
なので、\(\tau\)(および \(\sg\tau,\:\sg^2\tau\))は \(\bs{Q}(\theta)\) の元 を固定しません。従って、\(H\) の固定体は \(\bs{Q}(\theta)\) です。つまり、\(\bs{L}=\bs{Q}(\al,\beta,\gamma)\) と書くと、

 \(G\:\sp\:H\:\)\(\:\sp\:\{\:e\:\}\)
 \(\bs{Q}\:\subset\:\bs{Q}(\theta)\:\)\(\:\subset\:\bs{L}\)

というガロア対応になっています。

次に体の拡大次元を検証します。まず、\(|G|=6\) なので、次数と位数の同一性52B)により、\(\bs{L}/\bs{Q}\) の拡大次数は、
 \([\:\bs{L}:\bs{Q}\:]=6\)
です。\(\bs{Q}(\theta)\) は \(\bs{Q}\) 上の既約な2次方程式、
 \(x^2-D=0\)
の解である \(\theta\) で \(\bs{Q}\) を単拡大した体なので、単拡大体の基底の定理(33F)により、
 \([\:\bs{Q}(\theta):\bs{Q}\:]=2\)
です。そうすると、拡大次数の連鎖律33H)により、
 \([\:\bs{L}:\bs{Q}\:]=[\:\bs{L}:\bs{Q}(\theta)\:]\cdot[\:\bs{Q}(\theta):\bs{Q}\:]\)
 \([\:\bs{L}:\bs{Q}(\theta)\:]=3\)
となるはずです。\([\:\bs{L}:\bs{Q}(\theta)\:]=3\) であることを、具体的な体の拡大の様子を検証することで確かめます。2つのことを証明します。

\(\bs{L}=\bs{Q}(\al,\beta,\gamma)\) とするとき、\(\bs{Q}(\theta,\al)=\bs{L}\) である。

[証明]

\(\theta=(\al-\beta)(\beta-\gamma)(\gamma-\al)\) だから、\(\theta\) は \(\al,\:\beta,\:\gamma\) で表現されている。従って
 \(\bs{Q}(\theta,\al)\:\subset\:\bs{Q}(\al,\beta,\gamma)\)
である。この逆である、
 \(\bs{Q}(\al,\beta,\gamma)\:\subset\:\bs{Q}(\theta,\al)\)
であることを証明する。そのためには \(\beta,\:\gamma\) が「有理数と \(\theta,\:\al\) の四則演算」で表現できることを示せばよい。根と係数の関係により、
 \(\beta+\gamma=-\al\)
 \((\br{G})\)
 \(\beta\gamma=-\dfrac{q}{\al}\)
である。これを利用して \(\theta\) の定義式を変形すると、
\(\begin{eqnarray}
&&\:\:\theta=&(\al-\beta)(\beta-\gamma)(\gamma-\al)\\
&&&=(\beta-\gamma)(-\al^2+(\beta+\gamma)\al-\beta\gamma)\\
&&&=(\beta-\gamma)\left(-\al^2-\al^2+\dfrac{q}{\al}\right)\\
&&&=(\beta-\gamma)\dfrac{-2\al^3+q}{\al}\\
\end{eqnarray}\)
となり、
 \(\beta-\gamma=\dfrac{\al\theta}{q-2\al^3}\)
 \((\br{H})\)
である。\((\br{G})\) 式と \((\br{H})\) 式は \(\beta\) と \(\gamma\) についての連立1次方程式なので解が求まり、\(\beta\) と \(\gamma\) は \(\al,\:\theta,\:q\) の四則演算で表現できる。従って、
 \(\bs{Q}(\al,\beta,\gamma)\:\subset\:\bs{Q}(\theta,\al)\)
であり、\(\bs{Q}(\theta,\al)\:\subset\:\bs{Q}(\al,\beta,\gamma)\) と合わせて、
 \(\bs{Q}(\theta,\al)=\bs{Q}(\al,\beta,\gamma)\)
である。[証明終]

\(x^3+px+q\) は \(\bs{\bs{Q}(\theta)}\) 上の既約多項式である。

[証明]

\(\bs{Q}\) 上の既約な3次方程式 \(x^3+px+q=0\) の解 \(\al\) による \(\bs{Q}\) の単拡大体 \(\bs{Q}(\al)\) を考えると、単拡大体の基底の定理(33F)により、
 \([\:\bs{Q}(\al):\bs{Q}\:]=3\)
である。従って \(\al\notin\bs{Q}(\theta)\) である。なぜなら、もし \(\al\in\bs{Q}(\theta)\) なら \(\bs{Q}(\theta)\) の次元は \(3\) 以上になるが、\([\:\bs{Q}(\theta):\bs{Q}\:]=2\) なので矛盾が生じるからである。同様に、\(\beta,\:\gamma\notin\bs{Q}(\theta)\) である。\(x^3+px+q\) は、
 \(x^3+px+q=(x-\al)(x-\beta)(x-\gamma)\)
と表されるから、\(x^3+px+q\) は \(\bs{Q}(\theta)\) 上では因数分解できない。つまり \(x^3+px+q\) は \(\bs{Q}(\theta)\) 上の既約多項式である。[証明終]


以上により、

\(\bs{L}=\bs{Q}(\al,\beta,\gamma)\) は、\(\bs{\bs{Q}(\theta)}\) 上の既約な3次方程式 \(x^3+px+q=0\) の解の一つである \(\al\) を \(\bs{Q}(\theta)\) に添加した単拡大体、\(\bs{L}=\bs{Q}(\theta,\al)\) であり、その拡大次数は \([\:\bs{L}:\bs{Q}(\theta)\:]=\:3\) である

ことが検証できました。これを踏まえて、3次方程式が解ける理由をガロア理論で説明します。ガロア対応である、

 \(G\:\sp\:H\:\)\(\:\sp\:\{\:e\:\}\)
 \(\bs{Q}\:\subset\:\bs{Q}(\theta)\:\)\(\:\subset\:\bs{L}\)

を2つの部分に分けます。

 \(\bs{Q}\:\subset\:\bs{Q}(\theta)\) 

\(\mr{Gal}(\bs{Q}(\theta)/\bs{Q})\cong G/H\cong C_2\) であり、\(\bs{Q}(\theta)/\bs{Q}\) は巡回拡大で、拡大次数は \(2\) です。\(1\) の原始2乗根は \(-1\) であり、\(\bs{Q}\) に含まれています。従って \(\bs{Q}(\theta)/\bs{Q}\) はべき根拡大です。具体的には、
 \(x^2-D=0\:\:(D\in\bs{Q})\)
  \(D=-4p^3-27q^2\)
の解が \(\theta\) であり、
 \(\theta=\sqrt{D}=\sqrt{-4p^3-27q^2}\)
です。これはレゾルベントを持ち出すまでもなく分かります。

 \(\bs{Q}(\theta)\:\subset\:\bs{L}\) 

\(\mr{Gal}(\bs{L}/\bs{Q}(\theta))=H\cong C_3\) であり、\(\bs{L}/\bs{Q}(\theta)\) は巡回拡大で、拡大次数は \(3\) です。また \(\bs{L}\) は \(\bs{Q}(\theta)\) 上の既約な3次方程式 \(x^3+px+q=0\) の解の一つである \(\al\) を \(\bs{Q}(\theta)\) に添加した単拡大体で、\(\bs{L}=\bs{Q}(\theta,\al)\) でした。

\(\bs{Q}(\theta)\) には(一般には)\(1\) の原始3乗根が含まれていません。そこで、\(\bs{L}/\bs{Q}(\theta)\) の体の拡大の代わりに、\(\bs{L}(\omega)/\bs{Q}(\omega,\theta)\) という拡大を考えます。
 \(\bs{L}(\omega)=\bs{Q}(\omega,\theta,\al)\)
 \([\:\bs{Q}(\omega,\theta,\al):\bs{Q}(\omega,\theta)\:]=3\)
 \((\br{I})\)
です。

方程式によっては \(\theta\in\bs{Q}(\omega)\) の場合があります。たとえば、\(p=0\) だと、
\(\theta=\sqrt{-27q^2}=3\sqrt{3}i\cdot q\)
ですが、\(\omega=\dfrac{1}{2}(-1\pm\sqrt{3}i)\) なので、\(\theta\in\bs{Q}(\omega)\) です。この場合は、
\(\bs{Q}(\omega,\theta)=\bs{Q}(\omega)=\bs{Q}(\theta)\)
ですが、\((\br{I})\) 式は成り立ちます。

レゾルベント \(S,\:T\) を導入して \(S^3\) と \(T^3\) を求めます。計算は、方程式 \(x^3-3x+1=0\) のときと全く同じです。つまり、

 \(S=\al+\omega^2\beta+\omega\gamma\)
 \((\br{B})\)
 \(T=\al+\omega\beta+\omega^2\gamma\)
 \(ST=-3p\)
 \((\br{D})\)
 \(S^3+T^3=-27q\)

 \(\al=\dfrac{1}{3}(S+T)\)
 \(\beta=\dfrac{1}{3}(\omega S+\omega^2T)\)
 \((\br{C})\)
 \(\gamma=\dfrac{1}{3}(\omega^2S+\omega T)\)

 \(X^2+27qX-27p^3=0\)
 \((\br{F})\)
 の2つの解が \(S^3\) と \(T^3\)

です。方程式 \(x^3-3x+1=0\) の場合、\(\bs{L}(\omega)\) は \(\bs{Q}(\omega)\) からの巡回拡大でしたが、\(x^3-3p+1q=0\) では \(\bs{Q}(\omega,\theta)\) からの巡回拡大であり、ガロア群が位数 \(3\) の巡回群であるという点では全く同じなのです。

\((\br{F})\) 式から \(X\) を求めると、
\(\begin{eqnarray}
&&\:\:X&=\dfrac{1}{2}\left(-27q\pm\sqrt{27^2q^2+27\cdot4p^3}\right)\\
&&&=\dfrac{1}{2}\left(-27q\pm\sqrt{-27\theta^2}\right)\\
&&&=\dfrac{1}{2}(-27q\pm3\sqrt{3}i\cdot\theta)\\
\end{eqnarray}\)
となるので、
 \(S^3=\dfrac{1}{2}(-27q+3\sqrt{3}i\cdot\theta)\)
 \(T^3=\dfrac{1}{2}(-27q-3\sqrt{3}i\cdot\theta)\)
となります。\(S^3\) と \(T^3\) は逆でもかまいません。\(\omega\) は \(1\) の原始3乗根で、
 \(\omega=\dfrac{1}{2}(-1\pm\sqrt{3}i)\)
のどちらかです。従って、
 \(\sqrt{3}i\in\bs{Q}(\omega,\theta)\)
です。つまり、
 \(S^3,\:\:T^3\in\bs{Q}(\omega,\theta)\)
であることがわかりました。従って、\(S,\:T\) は \(\bs{Q}(\omega,\theta)\) 上の3次方程式、\(x^3-a=0\:\:(a\in\bs{Q}(\omega,\theta))\) の解ということになり、\(\bs{Q}(\omega,\theta,\:S)/\bs{Q}(\omega,\theta)\) の体の拡大を考えると、
 \([\:\bs{Q}(\omega,\theta,\:S):\bs{Q}(\omega,\theta)\:]=3\)
 \((\br{J})\)
です。\(\bs{Q}(\omega,\theta,\:S)\) は \(\bs{Q}(\omega,\theta,\:T)\) としても同じことです。ここで、

 \(\bs{Q}(\omega,\theta,\:S)=\bs{Q}(\omega,\theta,\:\al)\)

であることが次のようにして分かります。つまり、\(\bs{Q}(\omega,\theta)\) 上の既約な3次方程式 \(x^3+px+q=0\) の解が \(\al,\:\beta,\:\gamma\) であり、\((\br{B})\) 式により \(S\) は \(\al,\:\beta,\:\gamma,\:\omega\) の四則演算で表されているので、
 \(S\in\bs{Q}(\omega,\theta,\al,\beta,\gamma)\)
であり、また、
 \(\bs{Q}(\omega,\theta,\al,\beta,\gamma)=\bs{Q}(\omega,\theta,\al)\)
だったので、
 \(S\in\bs{Q}(\omega,\theta,\al)\)
です。このことから、
 \(\bs{Q}(\omega,\theta,\:S)\subset\bs{Q}(\omega,\theta,\:\al)\)
 \((\br{K})\)
です。\((\br{I})\) 式と \((\br{J})\) 式により、\(\bs{Q}(\omega,\theta,\:S)\) と \(\bs{Q}(\omega,\theta,\:\al)\) の次元は等しく、かつ \((\br{K})\) 式の関係があるので、体の一致の定理(33I)により2つの体は一致し、
 \(\bs{Q}(\omega,\theta,\:S)=\bs{Q}(\omega,\theta,\:\al)\)
です。


この説明は「7.3 べき根拡大の十分条件」の証明に従いましたが、3次方程式の場合は、\((\br{C})\) 式と \((\br{D})\) 式により、\(\al,\:\beta,\:\gamma\) が \(S\) と \(\omega\) の四則演算で表現できます。従って、
 \(\bs{Q}(\omega,\theta,\al,\beta,\gamma)\subset\bs{Q}(\omega,\theta,S)\)
 \(\bs{Q}(\omega,\theta,\al)\subset\bs{Q}(\omega,\theta,S)\)
であり、
 \(\bs{Q}(\omega,\theta,S)\subset\bs{Q}(\omega,\theta,\al)\)
と合わせて
 \(\bs{Q}(\omega,\theta,\:S)=\bs{Q}(\omega,\theta,\:\al)\)
である、とするのが簡便な説明になります。


以上をまとめると、

\(\bs{Q}(\omega,\theta)\) 上の3次方程式、\(x^3-a=0\:\:(a\in\bs{Q}(\omega,\theta))\) の解の一つ、\(S\) を \(\bs{Q}(\omega,\theta)\) に添加したべき根拡大体が \(\bs{Q}(\omega,\theta,\al)=\bs{L}(\omega)\) である

となり、体に \(\bs{\omega}\) が含まれる前提で、巡回拡大はべき根拡大であることが検証できました。ここから、\(\bs{L}(\omega)\) を \(\bs{Q}\) の拡大体として、方程式の係数 \(p,\:q\) を使って、できるだけ簡潔な形で表してみます。
\(\begin{eqnarray}
&&\:\:\theta&=\sqrt{-4p^3-27q^2}\\
&&&=6\cdot\sqrt{3}i\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}\\
\end{eqnarray}\)
ですが、\(\sqrt{3}i\in\bs{Q}(\omega)\) なので、
 \(\bs{Q}(\omega,\theta)=\bs{Q}\left(\omega,\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}\right)\)
と表せます。また、
\(\begin{eqnarray}
&&\:\:X^3&=\dfrac{1}{2}\left(-27q+\sqrt{27^2q^2+27\cdot4p^3}\right)\\
&&&=\dfrac{1}{2}\left(-27q+27\cdot2\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}\right)\\
&&&=27\left(-\dfrac{q}{2}+\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}\right)\\
\end{eqnarray}\)
なので、

 \(S=3\cdot\sqrt[3]{-\dfrac{q}{2}+\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\)
 \(T=3\cdot\sqrt[3]{-\dfrac{q}{2}-\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\)

が \(S,\:T\) です。\(\sqrt[3]{\phantom{I}\cd\phantom{I}}\) は3乗して \(\cd\) になる数の意味です。従って、\(S\) の選び方は3通りですが、\(S\) を一つに決めると、
 \(ST=-3p\)
が成り立つように \(T\) を選ぶ必要があります。以上の \(S\) を用いて \(\bs{L}(\omega)\) を表すと、

 \(\bs{L}(\omega)\)
  \(=\bs{Q}(\omega,\theta,\al,\beta,\gamma)=\bs{Q}(\omega,\theta,\al)=\bs{Q}(\omega,\theta,S)\)
  \(=\bs{Q}\left(\omega,\:\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}},\:\sqrt[3]{-\dfrac{q}{2}+\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\right)\)

となります。この式が意味するところは、

\(\dfrac{q^2}{4}+\dfrac{p^3}{27}\) が有理数なので、\(\bs{L}(\omega)\) は \(\bs{Q}(\omega)\) からのべき根拡大を、\(\sqrt{\phantom{A}}\) と \(\sqrt[3]{\phantom{A}}\) の2回繰り返したものである

ということです。べき根拡大の出発点は 有理数に \(\omega\) を添加した体です。「7.1 1の原始n乗根」で証明したように、原始\(n\)乗根はべき根で表現可能であり(71A)、もちろん \(\omega\) もそうです。これが3次方程式が解ける原理(一般化するとガロア群が可解群である方程式が解ける原理)です。補足すると、\(p=0\) のときは、
 \(\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}=\pm\dfrac{q}{2}\in\bs{Q}\)
なので、べき根拡大は \(\sqrt[3]{\phantom{A}}\) の1回だけになります。


さらに、ここまでの計算で3次方程式の解も求まりました。解は、

\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&\al=\dfrac{1}{3}(S+T)&\\
&&\beta=\dfrac{1}{3}(\omega S+\omega^2T)&\\
&&\gamma=\dfrac{1}{3}(\omega^2S+\omega T)&\\
\end{eqnarray}
\end{array}\right.\)

であり、記号を、
 \(S=3s\)
 \(T=3t\)
に置き換えると、

3次方程式の解の公式

\(x^3+px+q=0\) の3つの解を \(\al,\:\beta,\:\gamma\) とする。

\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&\al=s+t&\\
&&\beta=\omega s+\omega^2t&\\
&&\gamma=\omega^2s+\omega t&\\
\end{eqnarray}
\end{array}\right.\)

  \(s=\sqrt[3]{-\dfrac{q}{2}+\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\)
  \(t=\sqrt[3]{-\dfrac{q}{2}-\sqrt{\dfrac{q^2}{4}+\dfrac{p^3}{27}}}\)
  \(st=-\dfrac{p}{3}\)

が、3次方程式の解の公式です。


3次方程式の解による体の拡大を振り返ってみます。\(\bs{Q}\) 上の既約な方程式 \(x^3+px+q=0\) の根を \(\al,\:\beta,\:\gamma\) とし、\(\bs{Q}\) の最小分解体 を \(\bs{L}=\bs{Q}(\al,\beta,\gamma)\)、ガロア群を \(G=\mr{Gal}(\bs{L}/\bs{Q})\) とすると、
 \(\bs{Q}\:\subset\:\bs{Q}(\theta)\:\:\)\(\:\subset\:\bs{L}\)
 \(G\:\sp\:H\:\:\:\)\(\:\sp\:\{\:e\:\}\)
のガロア対応が成り立ちます。\(\bs{L}/\bs{Q}\) の拡大次数は \(6\)(\(|G|=6\))です。この、
 \(\bs{Q}\:\subset\:\bs{Q}(\theta)\:\subset\:\bs{L}\)
という体の拡大列で、\(\bs{Q}\:\subset\:\bs{Q}(\theta)\) のところはべき根拡大ですが、\(\bs{Q}(\theta)\:\subset\:\bs{L}\) は、\(\omega\in\bs{Q}(\theta)\) の場合を除き、べき根拡大ではありません。しかし、

 \(\bs{Q}(\omega)\:\subset\:\bs{Q}(\omega,\theta)\:\subset\:\bs{L}(\omega)\)

なら、必ず、すべてがべき根拡大になります。従って、3次方程式の解は \(\bs{Q}(\omega)\) の元である「有理数と \(\omega\)」の四則演算・べき根で記述できます。

\(\omega\) は \(x^2+x+1=0\) の解なので、\([\:\bs{Q}(\omega):\bs{Q}\:]=2\) です。従って、拡大次数の連鎖律33H)により、\(\omega\notin\bs{Q}(\theta)\) の条件で、
 \([\:\bs{L}(\omega):\bs{Q}\:]=12\)
です。これは、\(\bs{Q}\) 上の多項式 \((x^3+px+q)(x^2+x+1)\) の最小分解体が \(\bs{L}(\omega)\) なので、\(\bs{Q}\) からの拡大次数は \(12\) であるとも言えます。3次方程式の「解」は、あくまで \(\bs{Q}\) の \(6\)次拡大体 \(\bs{L}=\bs{Q}(\al,\beta,\gamma)\) の中にありますが、「べき根で表された解」は \(\bs{Q}\) の \(12\)次拡大体 \(\bs{L}(\omega)\) の中にあるのです。

一見、矛盾しているようですが、そうではありません。ある代数拡大体 \(\bs{K}\) があったとして、\(a\) を \(\bs{K}\) の元とし、\(1\) の原始3乗根の一つを \(\omega\) とします。3次方程式、
 \(x^3-a=0\:\:(a\in\bs{K})\)
は3つの解をもちます。そのうちのどれか一つを \(\sqrt[3]{a}\) と定義すると、3つの解(べき根)は、

 \(\sqrt[3]{a},\:\:\sqrt[3]{a}\:\omega,\:\:\sqrt[3]{a}\:\omega^2\)

です。\(\sqrt[3]{a}\) では \(\omega\) が不要なように見えますが、それは表面上のことで、3つの解は、

 \(\sqrt[3]{a}\:\omega,\:\:\sqrt[3]{a}\:\omega^2,\:\:\sqrt[3]{a}\:\omega^3\)

であるというのが正しい認識です。つまり \(\bs{\omega}\) は3つのべき根の関係性を規定していて、\(\sqrt[3]{a}\cdot\omega^i\:\:(i=1,2,3)\) という "ペアの形" によって3つの区別が可能になり、数式としての整合性が保てます。\(\sqrt[3]{\phantom{A}}\) という "曖昧さ" がある記号を用いる限り、\(\omega\) という、曖昧さを解消する "助手" が必然的に登場するのです。

「7.7 巡回拡大はべき根拡大」終わり 
「7.可解性の十分条件」は次回に続く


nice!(0) 

No.357 - 高校数学で理解するガロア理論(4) [科学]

\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{#1}} \newcommand{\ol}[1]{\overline{#1}} \newcommand{\sb}{\subset} \newcommand{\sp}{\supset} \newcommand{\al}{\alpha} \newcommand{\sg}{\sigma}\newcommand{\cd}{\cdots}\)
 
6.可解性の必要条件 
 


6.1 可解群


正規部分群の概念、および剰余群と巡回群を使って「可解群」を定義します。可解群は純粋に群の性質として定義できますが、方程式の可解性と結びつきます。


可解群の定義:61A)

群 \(G\) から 単位元 \(e\) に至る部分群の列、

\(G=H_0\:\sp H_1\sp\cd\sp H_i\sp H_{i+1}\sp\cd\sp H_k=\{\:e\:\}\)

があって、\(H_{i+1}\) は \(H_i\) の正規部分群であり、剰余群 \(H_i/H_{i+1}\) が巡回群であるとき、\(G\) を可解群(solvable group)と言う。

\(H_{i+1}\) が \(H_i\) の正規部分群であるとき、\(H_i\) を正規列と言う。加えて、\(H_i/H_{i+1}\) が巡回群のとき、\(H_i\) を可解列という。



巡回群は可解群:61B)

巡回群は可解群である。また、巡回群の直積も可解群である。


[証明]

群 \(G\) を巡回群とし、\(G\) から 単位元 \(e\) に至る部分群の列として、
 \(G=H_0\:\sp\:H_1=\{\:e\:\}\)
をとる。\(H_1=\{\:e\:\}\) は \(H_0=G\) の正規部分群である。また、
 \(H_0/H_1\:\cong\:H_0\:(=G)\)
であり、\(G\) は巡回群だから、\(H_0/H_1\) は巡回群である。従って \(G\) は可解群である。

3つの巡回群の直積 \(G\) で考える。\(G\) を、
\(\begin{eqnarray}
&&\:\:G&=\bs{Z}/k\bs{Z}\times\bs{Z}/m\bs{Z}\times\bs{Z}/n\bs{Z}\\
&&&=\{(a,b,c)\:|\:a\in\bs{Z}/k\bs{Z},\:b\in\bs{Z}/m\bs{Z},\:c\in\bs{Z}/n\bs{Z}\}\\
\end{eqnarray}\)
とする。このとき、
\(\begin{eqnarray}
&&\:\:&H_1&=\{(a,b,0)\:|\:a\in\bs{Z}/k\bs{Z},\:b\in\bs{Z}/m\bs{Z}\}\\
&&&H_2&=\{(a,0,0)\:|\:a\in\bs{Z}/k\bs{Z}\}\\
&&&\{e\}&=\{(0,0,0)\}\\
\end{eqnarray}\)
とおくと、
 \(G\:\sp\:H_1\:\sp\:H_2\:\sp\:\{e\}\)
となる。巡回群は可換群であり、巡回群の直積 \(G\) も可換群である。従って、\(G\) の部分群である \(H_1,\:H_2\) も可換群であり、すなわち \(G\) の正規部分群である(41F)。

\(G\) の任意の2つの元を
 \(g=(g_a,\:g_b,\:g_c)\)
 \(h=(h_a,\:h_b,\:h_c)\)
とする。剰余類 \(g+H_1\) と \(h+H_1\) を考える。\((g_a,0,0)+H_1=H_1\)、\((0,g_b,0)+H_1=H_1\) だから、\((g_a,g_b,0)+H_1=H_1\) である。また同様に\((h_a,h_b,0)+H_1=H_1\) である。従って、\(g_c=h_c\) なら、\(g_a\)、\(g_b\)、\(h_a\)、\(h_b\) の値に関わらず \(g+H_1=h+H_1\) である。逆に、\(g_c\neq h_c\) なら \(g+H_1\neq h+H_1\) である。このことから剰余類の代表元(41E)として、\((0,0,0)\)、\((0,0,1)\)、\(\cd\)、\((0,0,n-1)\) の \(n\)個をとることができる。つまり、
\(\begin{eqnarray}
&&\:\:G/H_1=\{&(0,0,0)+H_1,\\
&&&(0,0,1)+H_1,\\
&&&(0,0,2)+H_1,\\
&&& \vdots\\
&&&(0,0,n-1)+H_1\}\\
\end{eqnarray}\)
である。これは \((0,0,1)+H_1\) を生成元とする位数 \(n\) の巡回群である。まったく同様の議論により、
\(\begin{eqnarray}
&&\:\:H_1/H_2=\{&(0,0,0)+H_2,\\
&&&(0,1,0)+H_2,\\
&&&(0,2,0)+H_2,\\
&&& \vdots\\
&&&(0,m-1,0)+H_2\}\\
\end{eqnarray}\)
であり、\(H_1/H_2\) は \((0,1,0)+H_2\) を生成元とする位数 \(m\) の巡回群である。以上により、
 \(G=H_0\:\sp\:H_1\:\sp\:H_2\:\sp\:H_3=\{e\}\)
は、正規列であり、\(H_i/H_{i+1}\) が巡回群なので、\(G\) は可解群である。この議論は \(G\) が\(4\)個以上の巡回群の直積の場合でも全く同様に成り立つ。つまり、巡回群の直積は可解群である。[証明終]


可解群の部分群は可解群:61C)

可解群の部分群は可解群である。


[証明]

可解群を \(G\) とすると、可解群の定義により、

 \(G=H_0\sp H_1\sp H_2\sp\cd H_{n-1}\sp H_n=\{e\}\)

という列で、\(H_{i+1}\) が \(H_i\) の正規部分群であり、\(H_i/H_{i+1}\) が巡回群のものが存在する。

ここで、\(G\) の任意の部分群を \(N\) としたとき、

 \(N=N\cap H_0\sp N\cap H_1\sp N\cap H_2\sp\cd N\cap H_{n-1}\sp N\cap H_n=\{e\}\)

という集合の列を考える。部分群の共通部分は部分群の定理(41D)により、\(N\cap H_i\:(0\leq i\leq n)\) は \(G\) の部分群の列である。と同時に、これが可解列であることを以下で証明する。

列の \(N\cap H_{i-1}\sp N\cap H_i\) の部分を取り出して考える。\(H_i\) は \(H_{i-1}\) の正規部分群なので、\(H_{i-1}\) の任意の元 \(x\) について \(xH_i=H_ix\) が成り立つ。

\(N\cap H_{i-1}\) の任意の元を \(y\) とすると、\(y\in N\) かつ \(y\in H_{i-1}\) であるが、\(y\in N\) なので \(yN=Ny=N\) である。また \(y\in H_{i-1}\) なので、正規部分群の定義により、\(yH_i=H_iy\) が成り立つ。ゆえに、
 \(y(N\cap H_i)=yN\cap yH_i=Ny\cap H_iy=(N\cap H_i)y\)
となり、定義によって \(\bs{N\cap H_i}\)\(\bs{N\cap H_{i-1}}\) の正規部分群である。

次に第2同型定理43B)によると、\(N\) が \(G\) の部分群、\(H\) が \(G\) の正規部分群のとき、
 \(N/(N\cap H)\:\cong\:NH/H\)
が成り立つ。\(N\) を \(N\cap H_{i-1}\) とし、\(H\) を \(H_i\) として定理を適用すると、

 \(N\cap H_{i-1}/((N\cap H_{i-1})\cap H_i)\:\cong\:(N\cap H_{i-1})H_i/H_i\)
 \((\br{A})\)

となる。ここで、\(H_i\:\subset\:H_{i-1}\) なので、\((N\cap H_{i-1})\cap H_i=N\cap H_i\) である。従って、
 \((\br{A})\) 式の左辺 \(=\:(N\cap H_{i-1})/(N\cap H_i)\)
 \((\br{A}\,')\)
となる。また、
 \((N\cap H_{i-1})\:\subset\:H_{i-1}\)
 \((\br{B})\)
は常に成り立つ。さらに、\(H_i\:\subset\:H_{i-1}\) だから、この式に左から \(H_{i-1}\) をかけて、
 \(H_{i-1}H_i\:\subset\:H_{i-1}H_{i-1}\)
 \(H_{i-1}H_i\:\subset\:H_{i-1}\)
 \((\br{C})\)
が成り立つ。\((\br{B})\) 式に右から \(H_i\) をかけると、
 \((N\cap H_{i-1})H_i\:\subset\:H_{i-1}H_i\)
となるが、これと \((\br{C})\) 式を合わせると、
 \((N\cap H_{i-1})H_i\:\subset\:H_{i-1}\)
となる。従って、\((N\cap H_{i-1})H_i\) と \(H_{i-1}\) の \(H_i\) による剰余類を考えると、
 \((N\cap H_{i-1})H_i/H_i\:\subset\:H_{i-1}/H_i\)
の関係にある。これで、
 \((\br{A})\) 式の右辺 \(=\:H_{i-1}/H_i\) の部分群
 \((\br{A}\,'')\)
であることが分かった。

以上の \((\br{A})\:\:(\br{A}\,')\:\:(\br{A}\,'')\) をあわせると、

 \((N\cap H_{i-1})/(N\cap H_i)\:\cong\:H_{i-1}/H_i\) の部分群

である。\(G\) は可解群なので \(H_{i-1}/H_i\) は巡回群である。巡回群の部分群は巡回群なので、それと同型である \(\bs{(N\cap H_{i-1})/(N\cap H_i)}\) は巡回群である。まとめると、

 \(N\cap H_i\) は \(N\cap H_{i-1}\) の正規部分群
 \((N\cap H_{i-1})/(N\cap H_i)\) は巡回群

となる。このことは \(1\leq i\leq n\) のすべてで成り立つから、\(N\cap H_0\:=\:N\cap G\:=\:N\) は可解群である。つまり、可解群 \(G\) の任意の部分群 \(N\) は可解群である。[証明終]


可解群の像は可解群:61D)

可解群の準同型写像による像は可解群である。

このことより、
 可解群の剰余群は可解群
であることが分かる。なぜなら、群 \(G\) の部分群を \(N\) とすると、\(G\) から \(G/N\) への自然準同型、つまり \(x\in G\) として、
 \(x\:\longmapsto\:xN\)
の準同型写像を定義できるからである。


[証明]

可解群を \(G\) とすると、可解群の定義により、
 \(G=H_0\sp H_1\sp\:H_2\sp\cd H_{n-1}\sp H_n=\{e\}\)
という列で、\(H_i\) が \(H_{i-1}\) の正規部分群であり、剰余群 \(H_{i-1}/H_i\) が巡回群の列(=可解列)が存在する。群 \(G\) に作用する準同型写像を \(\sg\) とすると、上記の可解列の \(\sg\) による像、
 \(\sg(G)=\sg(H_0)\sp\sg(H_1)\sp\sg(H_2)\sp\cd\sg(H_{n-1})\sp\sg(H_n)\)
 \((\br{D})\)
が正規列になっていることを以下に示す。

\(\sg\) による像の列から \(\sg(H_{i-1})\sp\sg(H_i)\) を取り出して考える。\(\sg\) を \(H_{i-1}\) から \(\sg(H_{i-1})\) への写像と考えると、\(\sg(H_{i-1})\) は \(\sg\) による \(H_{i-1}\) の像なので、\(\sg\) は全射である。従って、\(H_{i-1}\) の元 \(h\) を選ぶことによって \(\sg(h)\) で \(\sg(H_{i-1})\) の全ての元を表すことができる。

\(\sg(H_{i-1})\) の任意の元を \(\sg(h)\) とおくと、
\(\begin{eqnarray}
&&\:\:\sg(h)\sg(H_i)&=\sg(hH_i)=\sg(H_ih)\\
&&&=\sg(H_i)\sg(h)\\
\end{eqnarray}\)
であるから、\(\sg(H_i)\) は \(\sg(H_{i-1})\) の正規部分群である。つまり \((\br{D})\) は正規列である。従って、\(\sg(H_{i-1})\) の \(\sg(H_i)\) による剰余類は群であり、剰余群 \(\sg(H_{i-1})/\sg(H_i)\) になる。

次に、剰余群 \(\sg(H_{i-1})/\sg(H_i)\) が巡回群であることを示す。\(H_{i-1}\) の任意の元を \(x\) とし、剰余群 \(H_{i-1}/H_i\) の元を \(xH_i\) で表す。\(H_{i-1}/H_i\) から \(\sg(H_{i-1})/\sg(H_i)\) への写像 \(f\) を、
 \(f\::\:xH_i\:\longmapsto\:\sg(x)\sg(H_i)\)
と定める。もし、剰余群 \(H_{i-1}/H_i\) の元が \(xH_i\) と \(yH_i\:(x,y\in H_{i-1})\) という異なる表現を持っているとすると、
 \(xH_i=yH_i\)
 \(\sg(xH_i)=\sg(yH_i)\)
 \(\sg(x)\sg(H_i)=\sg(y)\sg(H_i)\)
であるが、\(f\) の定義によって、
 \(f(xH_i)=\sg(x)\sg(H_i)\)
 \(f(yH_i)=\sg(y)\sg(H_i)\)
であり、異なる表現の \(f\) による写像先は一致する。従って \(f\) は2つの剰余群の間の写像として矛盾なく定義されている。また \(f\) は、
\(\begin{eqnarray}
&&f(xH_iyH_i)&=f(xyH_iH_i)=f(xyH_i)\\
&&&=\sg(xy)\sg(H_i)=\sg(x)\sg(y)\sg(H_i)\\
&&&=\sg(x)\sg(y)\sg(H_iH_i)=\sg(x)\sg(yH_iH_i)\\
&&&=\sg(x)\sg(H_iyH_i)=\sg(x)\sg(H_i)\sg(yH_i)\\
&&&=\sg(xH_i)\sg(yH_i)=\sg(x)\sg(H_i)\sg(y)\sg(H_i)\\
&&&=f(xH_i)f(yH_i)\\
\end{eqnarray}\)
を満たすが、この式は \(xH_i\) と \(yH_i\) が剰余群 \(H_{i-1}/H_i\) の異なる元を表現していても成り立つ。従って \(f\) は準同型写像である(=\(\:\br{①}\:\))。また、\(f\) は \(H_{i-1}/H_i\) から \(\sg(H_{i-1})/\sg(H_i)\) への写像で、
 \(f\::\:xH_i\:\longmapsto\:\sg(x)\sg(H_i)\)
と定義されたが、\(\sg(xH_i)=\sg(x)\sg(H_i)\) だから \(f\)は全射であり、
 \(\mr{Im}\:f\:=\:\sg(H_{i-1})/\sg(H_i)\)
である(=\(\:\br{②}\:\))。\(\br{①}\) と \(\br{②}\)、および準同型定理43A)により、
 \((H_{i-1}/H_i)/\mr{Ker}\:f\:=\:\sg(H_{i-1})/\sg(H_i)\)
である。\(H_{i-1}/H_i\) は巡回群なので、巡回群の剰余群は巡回群の定理(41H)により、\((H_{i-1}/H_i)/\mr{Ker}\:f\) は巡回群である。従って、それと同型である \(\sg(H_{i-1})/\sg(H_i)\) も巡回群である。

結局、\((\br{D})\) は正規列であると同時に \(\sg(H_{i-1})/\sg(H_i)\) が巡回群なので、\(\sg(G)\) は可解群である。[証明終]


6.2 巡回拡大


巡回拡大
巡回拡大の定義:62A)

\(\bs{Q}\) のガロア拡大を \(\bs{K}\) とする。\(\mr{Gal}(\bs{K}/\bs{Q})\) が巡回群のとき、\(\bs{K}/\bs{Q}\) を巡回拡大(cyclic extension)と言う。


累巡回拡大
累巡回拡大の定義:62B)

\(\bs{Q}\) の拡大体を \(\bs{K}\) とする。

\(\bs{Q}=\bs{K}_0\subset\bs{K}_1\subset\cd\subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cd\subset\bs{K}_k=\bs{K}\)

となる拡大列があって(\(k > 1\))、\(\bs{K}_{i+1}/\bs{K}_i\:(0\leq i < k)\) が巡回拡大のとき、\(\bs{K}/\bs{Q}\) は累巡回拡大であると言う。ただし、\(\bs{\bs{K}/\bs{Q}}\) が累巡回拡大だとしても、\(\bs{\bs{K}/\bs{Q}}\) がガロア拡大であるとは限らない


\(\bs{K}/\bs{Q}\) が累巡回拡大だとしてもガロア拡大であるとは限りません。たとえばシンプルな例で考えてみると、
 \(\al=\sqrt{\sqrt{2}+1}\)
という代数的数があったとします。この式から \(\sqrt{\phantom{A}}\) を消去すると \(\al^4-2\al^2-1=0\) なので、\(\al\) の最小多項式 \(f(x)\) は、
 \(f(x)=x^4-2x^2-1\)
です。\(f(x)\) は、
 \(f(x)=(x^2-(\sqrt{2}+1))(x^2+(\sqrt{2}-1))\)
と変形できるので、方程式 \(f(x)=0\) の解は
 \(x=\pm\sqrt{\sqrt{2}+1},\:\:\pm i\sqrt{\sqrt{2}-1}\)
です。従って \(f(x)\) の最小分解体 \(\bs{L}\) は、
 \(\bs{L}=\bs{Q}(\sqrt{\sqrt{2}+1},\:i\sqrt{\sqrt{2}-1})\)
であり、また、
 \(\sqrt{\sqrt{2}+1}\cdot\sqrt{\sqrt{2}-1}=1\)
の関係があるので、
 \(\bs{L}=\bs{Q}(i,\:\al)\)
と表現できます。\(\bs{L}/\bs{Q}\) はガロア拡大です。

一方、
 \(\bs{K}=\bs{Q}(\al)\)
と定義すると、\(\bs{K}\) は \(f(x)=0\) の一つの解 \(\al\) だけによる単拡大体なので、\(\bs{K}/\bs{Q}\) はガロア拡大ではありません( \(\bs{Q}(\al)\neq\bs{Q}(i,\:\al)\) )。ここで、

 \(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\:\subset\:\bs{Q}(\al)=\bs{K}\)

という体の拡大列を考えます。\(\bs{Q}\) 上の方程式 \(x^2-2=0\) の解は \(\pm\sqrt{2}\) なので、\(\bs{Q}(\sqrt{2})/\bs{Q}\) はガロア拡大です。また、ガロア群は、

 \(\mr{Gal}(\bs{Q}(\sqrt{2})/\bs{Q})=\{e,\:\sg\}\)
  \(\sg(\sqrt{2})=-\sqrt{2}\)
  \(\sg^2=e\)

なので巡回群であり、\(\bs{Q}(\sqrt{2})/\bs{Q}\) は巡回拡大です。

同様に、\(\bs{Q}(\sqrt{2})\) 上の方程式 \(x^2-(\sqrt{2}+1)=0\) の解は \(\pm\al\) で、\(\bs{Q}(\sqrt{2},\al)\) は \(\bs{Q}(\sqrt{2})\) の巡回拡大です。\(\sqrt{2}=\al^2-1\) なので、\(\bs{Q}(\sqrt{2},\al)=\bs{Q}(\al)\) であり、\(\bs{Q}(\al)/\bs{Q}(\sqrt{2})\) が巡回拡大となります。

結局、\(\bs{K}/\bs{Q}\) は \(\bs{Q}(\sqrt{2})/\bs{Q},\:\:\bs{Q}(\al)/\bs{Q}(\sqrt{2})\) という2つの巡回拡大の列で表されるので、定義(62B)により累巡回拡大です。しかしそうであっても、\(\bs{K}/\bs{Q}\) は ガロア拡大ではないのです。

これがもし \(\al=\sqrt{2}+\sqrt{3}\) だとすると、\(2\) も \(3\) も \(\bs{Q}\) の元なので、
 \(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\:\subset\:\bs{Q}(\sqrt{2},\sqrt{3})=\bs{K}\)
の拡大列は累巡回拡大であり、かつ \(\bs{K}/\bs{Q}\) がガロア拡大です。


このように、\(\bs{K}/\bs{Q}\) が累巡回拡大だとしてもガロア拡大であるとは限らないのですが、もし \(\bs{K}/\bs{Q}\) が累巡回拡大でかつガロア拡大だとすると、\(\mr{Gal}(\bs{K}/\bs{Q})\) は可解群になります。それが、累巡回拡大と可解群を結びつける次の定理です。

累巡回拡大ガロア群の可解性
累巡回拡大ガロア群の可解性:62C)

\(\bs{Q}\) のガロア拡大を \(\bs{K}\)、そのガロア群を \(G\) とする。このとき、

① \(G\) が可解群である
② \(\bs{K}/\bs{Q}\) が累巡回拡大である

の2つは同値である。


[① \(\bs{\Rightarrow}\) ②の証明]

\(G\) が可解群であることを示す部分群の列と、それとガロア対応をする体の拡大列を、

\(G=H_0\sp H_1\sp H_2\sp\cd\sp H_i\sp H_{i+1}\sp\cd\sp H_k=\{e\}\)
\(\bs{Q}=\bs{F}_0\subset\bs{F}_1\subset\bs{F}_2\subset\cd\subset\bs{F}_i\subset\bs{F}_{i+1}\subset\cd\subset\bs{F}_k=\bs{K}\)

とする。\(G\) が可解群なので、\(H_{i+1}\) は \(H_i\) の正規部分群であり、\(H_{i+1}/H_i\:(0\leq i\leq k-1)\) は巡回群である。以降、\(H_i,\:H_{i+1}\) を取り出して考える。
 \(H_i\:\sp\:H_{i+1}\:\sp\:\{e\}\)
 \(\bs{F}_i\:\subset\:\bs{F}_{i+1}\:\subset\:\bs{K}\)
\(\bs{K}/\bs{Q}\) がガロア拡大なので、中間体からのガロア拡大の定理(52C)により、\(\bs{K}/\bs{F}_i\) もガロア拡大である。\(\bs{F}_i\) の固定群は \(H_i\) なので \(\mr{Gal}(\bs{K}/\bs{F}_i)=H_i\) である。同様に、\(\bs{K}/\bs{F}_{i+1}\) もガロア拡大であり、\(\mr{Gal}(\bs{K}/\bs{F}_{i+1})=H_{i+1}\) である。

ここで、\(H_{i+1}\) は \(H_i\) の正規部分群なので、正規性定理53C)により \(\bs{F}_{i+1}/\bs{F}_i\) はガロア拡大であり、そのガロア群は、
 \(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\cong H_i/H_{i+1}\)
となる。\(H_i/H_{i+1}\) は巡回群なので、それと同型の \(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\) も巡回群になる。従って、\(\bs{F}_{i+1}/\bs{F}_i\) は、「ガロア拡大で、かつ \(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\) が巡回群」なので、巡回拡大である。

以上が \(\bs{F}_i\:(0\leq i\leq k-1)\) で成り立つから、\(\bs{K}/\bs{Q}\) は累巡回拡大である。

[② \(\bs{\Rightarrow}\) ①の証明]

\(\bs{K}\) が \(\bs{Q}\) の累巡回拡大であることを示す体の拡大列と、それとガロア対応する \(G\) の部分群の列を、

\(\bs{Q}=\bs{F}_0\subset\bs{F}_1\subset\bs{F}_2\subset\cd\subset\bs{F}_i\subset\bs{F}_{i+1}\subset\cd\subset\bs{F}_k=\bs{K}\)
\(G=H_0\sp H_1\sp H_2\sp\cd\sp H_i\sp H_{i+1}\sp\cd\sp H_k=\{e\}\)

とする。\(\bs{F}_i\)と \(\bs{F}_{i+1}\) を取り出して考える。
 \(\bs{F}_i\:\subset\:\bs{F}_{i+1}\:\subset\:\bs{K}\)
 \(H_i\:\sp\:H_{i+1}\:\sp\:\{e\}\)
\(\bs{K}/\bs{Q}\) がガロア拡大なので、\(\bs{K}/\bs{F}_i\) も \(\bs{K}/\bs{F}_{i+1}\) もガロア拡大である。また \(\bs{F}_{i+1}/\bs{F}_i\) は巡回拡大なので、すなわちガロア拡大である。従って正規性定理53C)により、\(H_{i+1}\) は \(H_i\) の正規部分群であり、
 \(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\cong H_i/H_{i+1}\)
となる。\(\bs{F}_{i+1}/\bs{F}_i\) は巡回拡大なので \(\mr{Gal}(\bs{F}_{i+1}/\bs{F}_i)\) は巡回群であり、それと同型である \(H_i/H_{i+1}\) も巡回群である。まとめると「\(H_{i+1}\) は \(H_i\) の正規部分群であり、かつ \(H_i/H_{i+1}\) は巡回群」である。

このことは \(H_i\:(0\leq i\leq k-1)\) で成り立つから、定義によって \(G\) は可解群である。[証明終]


6.3 原始\(n\)乗根を含む体とべき根拡大


この節の目的は「1の原始\(\bs{n}\)乗根を含む体のべき根拡大」の性質を解明することです。そのためにまず、1の原始\(n\)乗根を \(\zeta\) を含む体 \(\bs{Q}(\zeta)\)に関する次の定理を数ステップに分けて証明します。

1の原始\(n\)乗根を \(\zeta\) とする。このとき
 ・\(\bs{Q}(\zeta)/\bs{Q}\) はガロア拡大
 ・\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\:\cong\:(\bs{Z}/n\bs{Z})^{*}\)
が成り立つ。

\(1\) の原始\(n\)乗根
原始n乗根の数:63A)

\(x^n-1=0\) の \(n\)個の解のうち、\(n\)乗して初めて \(1\) になる解を \(1\)の原始\(n\)乗根という。

原始\(n\)乗根は \(\varphi(n)\) 個ある。\(\varphi(n)\) はオイラー関数で、\(n\) と互いに素である \(n\) 以下の自然数の数を表す。


[証明]

まず、
 \(\omega=\mr{cos}\dfrac{2\pi}{n}+i\:\mr{sin}\dfrac{2\pi}{n}\)
とおくと、明らかに \(\omega\) は原始\(n\)乗根である。さらに、
 \(\omega^k=\mr{cos}\dfrac{2\pi k}{n}+i\:\mr{sin}\dfrac{2\pi k}{n}\:(1\leq k\leq n)\)
で \(1\) の\(n\)乗根の全体を表現できる。ここで \(\omega^k\) が原始\(n\)乗根になる条件を考える。いま、
 \((\omega^k)^x=1\:(1\leq x\leq n)\)
 \((\br{A})\)
とすると、この式を満たす \(x\) の最小値が \(n\) であれば、\(\omega^k\) は原始\(n\)乗根である。これを満たす \(x\) は、\(j\) を任意の整数として、
 \(\dfrac{2\pi k}{n}x=2\pi j\)
のときである。つまり、
 \(\dfrac{k}{n}x=j\)
のときである。いま、\(k\) と \(n\) の最大公約数を \(d\) とすると( \(\mr{gcd}(k,n)=d\:)\)、
\(\left\{
\begin{array}{l}
\begin{eqnarray}
&&k=sd&\\
&&n=td&\\
\end{eqnarray}
\end{array}\right.\)
と表せて、このとき \(s\) と \(t\) は互いに素である。これを使うと、
 \(\dfrac{s}{t}x=j\)
のときに \(x\) は \((\br{A})\) 式を満たすことになる。\(s\) と \(t\) は互いに素であり、\(j\) は任意の整数だったから、\(x\) は \(t\) の倍数でなければならない。つまり、\(x\) は \(t=\dfrac{n}{d}\) の倍数である。ということは、\(x\) の最小値は \(\dfrac{n}{d}\) である。そして、\(\dfrac{n}{d}\) が \(n\) に等しいのは \(d=1\) の場合に限る。つまり \(\mr{gcd}(k,n)=1\) なら、\((\br{A})\) 式を満たす最小の \(x\) は \(n\) ということになる。従って、そのときに限り \(\omega^k\) は原始\(n\)乗根である。

\(\mr{gcd}(k,n)=1\) となる \(k\) は \(\varphi(n)\) 個あり、\(1\) の原始\(n\)乗根は \(\varphi(n)\) 個ある。[証明終]


原始n乗根の累乗:63B)

\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、
 \(\zeta^m\:\:(1\leq m\leq n)\)
は、\(1\) の\(n\)乗根の全体を表す。また、
 \(\zeta^m\:\:(\mr{gcd}(m,n)=1)\)
は、\(1\) の原始\(n\)乗根の全体を表す。


[証明]

\(\zeta^m\:(1\leq m\leq n)\) の \(n\) 個の値は全部異なっている。なぜなら、もし、 \(\zeta^j=\zeta^i\:(1\leq i < j\leq n)\)
だとすると、
 \(\zeta^{j-i}=1\:(1\leq i < j\leq n)\)
となり、\(j-i < n\) だから、\(\zeta\) が原始\(n\)乗根という前提に反するからである。\(\zeta^m\:(1\leq m\leq n)\) は全部異なっているので、これら \(n\) 個の値は \(1\) の\(n\)乗根全体を表す。

\(\zeta\) は、\(\mr{gcd}(k,n)=1\) である \(k\) を用いて、
 \(\zeta=\omega^k\)
  \(\omega=\mr{cos}\dfrac{2\pi}{n}+i\:\mr{sin}\dfrac{2\pi}{n}\)
と表せる(63A)。すると
 \(\zeta^m=(\omega^k)^m=\omega^{km}\)
である。\(\mr{gcd}(k,n)=1\) なので \(\mr{gcd}(m,n)=1\) なら \(\mr{gcd}(km,n)=1\) である。逆に、\(\mr{gcd}(km,n)=1\) が成り立つのは \(\mr{gcd}(m,n)=1\) のときに限る。従って、
 \(\zeta^m\:(=\omega^{km})\)
は \(\mr{gcd}(m,n)=1\) のとき(かつ、そのときに限って)\(1\) の原始\(n\)乗根である。[証明終]


原始n乗根の最小多項式:63C)

\(1\) の原始\(n\)乗根の一つを \(\zeta\) とする。\(\zeta\) の最小多項式を \(f(x)\) とし、\(k\) を \(n\) とは素な数とする。

このとき \(f(\zeta^k)=0\) である。


[証明]

証明を2つのステップで行う

第1ステップ
\(p\) を \(\bs{n}\) と素な素数とし、\(k=p\) のとき題意が成り立つことを証明する。
第2ステップ
\(k\) を \(\bs{n}\) と素な数とし、第1ステップを使って題意が成り立つことを証明する。

第1ステップ(\(p\) は \(\bs{n}\) と素な素数

本論に入る前に、2つことを確認する。まず、\(p\) を素数とし \(a\) を \(p\) とは素な整数とするとき、\(a\neq0\) ならフェルマの小定理25B)により、
 \(a^{p-1}\equiv1\:(\mr{mod}\:p)\)
が成り立つ。この両辺に \(a\) をかけると、
 \(a^p\equiv a\:(\mr{mod}\:p)\)
 \((\br{A})\)
となるが、この形の式にすると \(a=0,\:p\) でも成り立つ。つまり \(a\) が任意の整数のとき \((\br{A})\) 式が成り立つ。

次に、有限体 \(\bs{F}_p\) 上の多項式(係数が \(\bs{F}_p\) の元である多項式。「2.4 有限体」参照)についての定理である。\(p\) を素数とし \(x,\:y\) を変数とするとき、
 \((x+y)^p=x^p+y^p\:\:\:[\bs{F}_p]\)
が成り立つ。その理由であるが、等式の左辺を整数係数として2項展開すると、
\(\begin{eqnarray}
&&\:\:(x+y)^p=&x^p+{}_{p}\mr{C}_{1}x^{p-1}y+\:\cd\:+{}_{p}\mr{C}_{p-1}xy^{p-1}+y^p\\
\end{eqnarray}\)
となる。この展開における \(x^p\) と \(y^p\) 以外の項の係数は、
 \({}_{p}\mr{C}_{k}=\dfrac{p!}{k!\cdot(p-k)!}\:\:(1\leq k\leq p-1)\)
であるが、\(p\) が素数なので、分母の素因数に \(p\) はなく、分子の素因数にある \(p\) は分母で割り切れない。従って、
 \({}_{p}\mr{C}_{k}\equiv0\:\:(\mr{mod}\:p)\:\:(1\leq k\leq p-1)\)
となり、\(\bs{F}_p\) 上の多項式としては、
 \((x+y)^p=x^p+y^p\:\:\:[\bs{F}_p]\)
が成り立つ。

さらに、3変数、\(x,\:y,\:z\) では、
\(\begin{eqnarray}
&&\:\:(x+y+z)^p&=(x+y)^p+z^p\\
&&&=x^p+y^p+z^p\:\:\:[\bs{F}_p]\\
\end{eqnarray}\)
となり、これを繰り返すと \(n\) 変数に拡張できるのは明らかだから、\(x_1,\:\cd\:,\:x_n\) を変数として、
 \((x_1+x_2+\:\cd\:+x_n)^p=\)
      \(x_1^p+x_2^p+\:\cd\:+x_n^p\:\:\:[\bs{F}_p]\)
 \((\br{B})\)
が成り立つ。

以上の \((\br{A})\) 式と \((\br{B})\) 式を前提として以下の本論を進める。

\(\zeta\) の最小多項式 \(f(x)\) は、最小多項式は既約多項式31I)によって \(\bs{Q}\) 上の既約多項式である。\(\zeta\) は \(x^n-1=0\) と \(f(x)=0\) の共通の解だから、既約多項式の定理131E)により、\(x^n-1\) は \(f(x)\) で割り切れる。そこで、商の多項式を \(g(x)\) として、

 \(x^n-1=f(x)g(x)\)
 \((\br{C})\)

とおく。この式の左辺の \(x^n-1\) は整数係数の多項式である。つまり上の式は、整数係数の多項式が \(\bs{Q}\) 上で(有理数係数の多項式として)因数分解できることになり、整数係数多項式の既約性の定理(31C)によって、\(x^n-1\) は整数係数の多項式で因数分解できる。従って、\(f(x)\) と \(g(x)\) は整数係数としてよい。ということは、\(f(x)\) と \(g(x)\) を有限体 \(\bs{F}_p\) 上の多項式と見なすこともできる。以降の証明にはこのことを使う。

\(p\) は \(n\) と互いに素だから \(\zeta^p\) も \(1\) の原始\(n\)乗根である(63B)。従って \((\br{C})\) 式に \(x=\zeta^p\) を代入すると、左辺は \(0\) だから、
 \(f(\zeta^p)g(\zeta^p)=0\)
となり、\(f(\zeta^p)=0\) もしくは \(g(\zeta^p)=0\) である。

ここから、\(f(\zeta^p)=0\) であることを言うために背理法を使う。以下に \(f(\zeta^p)\neq0\) と仮定すると矛盾が生じることを証明する。

この背理法の仮定のもとでは \(g(\zeta^p)=0\) だから、\(\zeta\) は方程式 \(g(x^p)=0\) の解である。ということは、\(f(x)=0\) と \(g(x^p)=0\) は \(\zeta\) という共通の解をもつことになり、かつ \(f(x)\) は既約多項式であるから、既約多項式の定理131E)によって、\(g(x^p)\) は \(f(x)\) で割り切れる。その商を \(h(x)\) とすると、
 \(g(x^p)=f(x)h(x)\)
 \((\br{D})\)
と表せる。\(h(x)\) も整数係数の多項式である。

\(g(x)\) を、
 \(g(x)=a_mx^m+a_{m-1}x^{m-1}+\:\cd\:+\:a_1x+a_0\)
とし、これを \(\bs{F}_p\) 上の多項式とみなして \(g(x^p)\) を計算する。\((\br{A})\) 式を使って係数を \(\mr{mod}\:p\) でみると、
 \(g(x^p)\)\(\overset{\text{ }}{=}\)\(a_m(x^p)^m+a_{m-1}(x^p)^{m-1}+\:\cd\:+a_1(x^p)+a_0\)
\(\overset{\text{ }}{=}\)\(a_m^p(x^p)^m+a_{m-1}^p(x^p)^{m-1}+\:\cd\:+a_1^p(x^p)+a_0^p\)
\(\overset{\text{ }}{=}\)\((a_mx^m)^p+(a_{m-1}x^{m-1})^p+\:\cd\:+(a_1x)^p+a_0^p\:\:\:[\bs{F}_p]\)
と変形できる。2行目への変形で \((\br{A})\) 式を用いた。

この最後の式は、\((\br{B})\) 式の右辺の \(x_1\) を \(a_mx^m\)、\(x_2\) を \(a_{m-1}x^{m-1}\)、\(\cd\:x_n\) を \(a_0\) と置き換えた形をしている。従って \((\br{B})\) 式を使うと、
 \(g(x^p)\)\(\overset{\text{ }}{=}\)\((a_mx^m+a_{m-1}x^{m-1}+\:\cd\:+a_1x+a_0)^p\)
\(\overset{\text{ }}{=}\)\((g(x))^p\:\:\:[\bs{F}_p]\)
となる。つまり \(g(x)\) を \(\bs{F}_p\) 上の多項式と見なすと、
 \(g(x^p)=(g(x))^p\:\:\:[\bs{F}_p]\)
 \((\br{E})\)
となる。同時に、\((\br{D})\) 式の \(f(x),\:h(x)\) も \(\bs{F}_p\) 上の多項式と見なして \((\br{E})\) 式 を \((\br{D})\) 式に代入すると、
 \((g(x))^p=f(x)h(x)\:\:\:[\bs{F}_p]\)
 \((\br{F})\)
が得られる。

\(f(x)\) は \(\bs{Q}\) 上の(整数係数の)既約多項式であった。しかし \(f(x)\) を \(\bs{F}_p\) 上の多項式と見なしたとき、それが既約多項式だとは限らない。たとえば \(x^2+1=0\) は \(\bs{Q}\) 上の既約多項式であるが、\(\bs{F}_5\) では、
 \(x^2+1=(x-2)(x-3)\:\:\:[\bs{F}_5]\)
と因数分解できるから既約ではない。そこで、\(\bs{F}_p\) 上の多項式 \(f(x)\) を割り切る \(\bs{F}_p\) 上の既約多項式を \(q(x)\) とする。もし \(f(x)\) が \(\bs{F}_p\) 上でもなおかつ既約であれば \(q(x)=f(x)\) である。そうすると \(q(x)\) は \((\br{F})\) 式の右辺を割り切るから、左辺の \((g(x))^p\) も割り切る。ということは、既約多項式と素数の類似性31D)によって、\(q(x)\) は \(g(x)\) を割り切る。

ここで \((\br{C})\) 式に戻って考えると、\((\br{C})\) 式は、
 \(x^n-1=f(x)g(x)\)
 \((\br{C})\)
であった。この式を \(\bs{F}_p\) 上の多項式とみなすと、\(f(x)\) と \(g(x)\) は共に \(q(x)\) という因数をもつから、\((\br{C})\) 式の右辺は \(q(x)^2\) という因数をもつ。従って \((\br{C})\) 式は、
 \(x^n-1=q(x)^2\cdot r(x)\:\:\:[\bs{F}_p]\)
 \((\br{G})\)
と書ける。\(r(x)\) は \(f(x)g(x)\) を \(q(x)^2\) で割ったときの商である。

ここで \((\br{G})\) 式の両辺の導多項式(多項式の形式的微分)を求める。\(\bs{F}_p\) では距離が定義されていないので極限による微分の定義はできないが、形式的微分( \(x^k\:\rightarrow\:kx^{k-1}\) の変換)はできる。すると、
 \(nx^{n-1}\)\(=2q(x)q\,'(x)r(x)+q(x)^2\cdot r\,'(x)\)
\(=q(x)\cdot(2q\,'(x)r(x)+q(x)r\,'(x))\:\:\:[\bs{F}_p]\) 
\((\br{H})\)
となる。

\((\br{G})\) 式と \((\br{H})\) 式により、\(\bs{F}_p\) 上の多項式として、
 \(x^n-1\) と \(nx^{n-1}\) は共通の因数をもつ
ことになる。ここで矛盾が生じる。

なぜなら、\(n\) と \(p\) は互いに素だから、\(\bs{F}_p\) における \(n\) の逆数 \(n^{-1}\) がある。これを用いて \(x^n-1\) と \(nx^{n-1}\) に多項式の互除法を適用すると、
 \(x^n-1=n^{-1}x(nx^{n-1})-1\:\:\:[\bs{F}_p]\)
となって、\(x^n-1\) と \(nx^{n-1}\) の最大公約数は \(-1\:(=p-1)\:\:[\bs{F}_p]\) という定数である。つまり、\(\bs{F}_p\) 上の多項式として、
 \(x^n-1\) と \(nx^{n-1}\) は互いに素
である。これは明らかに矛盾している。この矛盾の発端は \(f(x)=0\) と \(g(x^p)=0\) が \(\zeta\) という共通の解をもつとしたことにあり、つまり \(g(\zeta^p)=0\) としたことにある。

従って、そもそもの仮定である \(f(\zeta^p)\neq0\) は間違っている。つまり \(f(\zeta^p)=0\) である。[第1ステップの証明終]

第2ステップ(\(k\) は \(\bs{n}\) と素な数

\(k\) を \(n\) とは素な(しかし素数ではない)数とし、\(k\) の素因数分解を、
 \(k=p_1p_2\cd p_m\)
とする。この形での素因数分解は、素因数が重複することもありうる。\(k\) は \(n\) と素だから、\(p_1,\:p_2,\:\cd\:,p_m\) のすべての素数は \(n\) と素である。

\(1\) の原始\(n\)乗根の一つを \(\zeta\) とし、第1ステップの \(p=p_1\) とする。\(p_1\) は \(n\) と素だから、原始\(\bs{n}\)乗根の累乗の定理(63B)により、\(\zeta^{p_1}\) も \(1\) の原始\(n\)乗根である。また、第1ステップの証明により、\(f(\zeta^{p_1})=0\) である。

次に、その \(\zeta^{p_1}\) を原始\(n\)乗根としてとりあげ、\(p=p_2\) とする。\(p_2\) は \(n\) と素だから、\((\zeta^{p_1})^{p_2}=\zeta^{p_1p_2}\) もまた原始\(n\)乗根になる(63B)。従って、第1ステップでの証明を適用して \(f(\zeta^{p_1p_2})=0\) である。

このプロセスは次々と続けることができる。結局 \(\zeta^{p_1p_2\:\cd\:p_m}=\zeta^k\) は \(1\) の原始\(n\)乗根であると同時に、\(f(\zeta^k)=0\) を満たす。\(k\) につけた条件は「\(n\) と互いに素」だけである。

原始\(\bs{n}\)乗根の累乗の定理(63B)により、\(k\) が \(n\) と素という条件で、\(\zeta^k\) は原始\(n\)乗根のすべてを表す。従って、\(f(x)=0\) は原始\(n\)乗根のすべてを解とする方程式である。[証明終]


この原始\(\bs{n}\)乗根の最小多項式の定理(63C)より、次の定理がすぐに導けます。


円分多項式:63D)

\(1\) の原始\(n\)乗根の一つを \(\zeta\) とし、\(\zeta\) の最小多項式を \(f(x)\) とすると、\(f(x)\) は円分多項式である。円分多項式とは、方程式 \(f(x)=0\) が \(\varphi(n)\) 個の解をもち、それらすべてが原始\(n\)乗根である多項式である。

従って、原始\(\bs{n}\)乗根は互いに共役である。最小多項式は既約多項式なので(31I)、円分多項式は既約多項式である。

\(\bs{Q}\) に \(\zeta\) を添加した単拡大体 \(\bs{Q}(\zeta)\) は円分多項式の最小分解体であり、\(\bs{\bs{Q}(\zeta)/\bs{Q}}\) はガロア拡大である。


\(\bs{Q}(\zeta)\)のガロア群
Q(ζ)のガロア群:63E)

\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、

 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/n\bs{Z})^{*}\)

である。つまり \(1\) の原始\(n\)乗根の一つを \(\bs{Q}\) に添加した拡大体のガロア群は、既約剰余類群に同型である。


[証明]

\(1\) の原始\(n\)乗根の一つを \(\zeta\) とし、最小多項式を \(f(x)\) とすると、円分多項式の定理(63D)により、\(f(x)=0\) の解は \(\varphi(n)=m\) 個の原始\(n\)乗根である。

原始\(n\)乗根を
 \(\zeta^{k_i}\:(\:1\leq i\leq m,\:1\leq k_i\leq n\) かつ \(\mr{gcd}(k_i,n)=1\:)\)
と表すと、それらは互いに共役である。また、\(f(x)\) の最小分解体は、
 \(\bs{Q}(\zeta^{k_1},\zeta^{k_2},\cd,\zeta^{k_m})=\bs{Q}(\zeta)\)
である。

\(\zeta\) に作用する同型写像 \(\sg\) を考えると、\(\sg\) は \(\zeta\) を共役な元に移すから、
 \(\sg_{k_i}(\zeta)=\zeta^{k_i}\)
で \(m\) 個の同型写像が定義できる。この \(\sg\) による移り先はすべて \(\bs{Q}(\zeta)\) の元だから、\(\sg\) は \(\bs{Q}(\zeta)\) の自己同型写像である。また、\(\sg_{k_i}\) と \(\sg_{k_j}\) の積は、
\(\begin{eqnarray}
&&\:\:\sg_{k_i}(\sg_{k_j})&=\sg_{k_i}(\zeta^{k_j})\\
&&&=(\zeta^{k_j})^{k_i}\\
&&&=\zeta^{k_ik_j}\\
\end{eqnarray}\)
と計算できる。そこで \(\sg\) の演算規則を、
 \(\sg_{k_i}\sg_{k_j}=\sg_{k_ik_j}\)
と定める。

ここで \(k_ik_j\) は、\(1\leq k_i,\:k_j\leq n\) かつ \(\mr{gcd}(k_i,n)=1\) かつ \(\mr{gcd}(k_j,n)=1\) だから、既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) の元であり、乗算で閉じている。すなわち \(\sg_{k_ik_j}\) は \(\sg\) のどれかである。つまり、自己同型写像である \(\sg\) は上の演算規則で群になり、ガロア群 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) である。

\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) から \((\bs{Z}/n\bs{Z})^{*}\) への写像 \(f\) を、
 \(f\::\) \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) \(\longrightarrow\) \((\bs{Z}/n\bs{Z})^{*}\)
\(\sg_{k_i}\)\(\longmapsto\) \(k_i\)
で定めると、
 \(f(\sg_{k_i}\sg_{k_j})\)\(=f(\sg_{k_ik_j})\)
\(=k_ik_j\)
 \(f(\sg_{k_i})f(\sg_{k_j})\)\(=k_ik_j\)
が成り立つから、\(f\) は群の同型写像になる。従って、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) と \((\bs{Z}/n\bs{Z})^{*}\) は同型である。[証明終]


既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) は巡回群の直積と同型です(25G)。従って次の定理が得られます。


Q(ζ)のガロア群は巡回群:63F)

\(1\) の原始\(n\)乗根の一つを \(\zeta\) とすると、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は巡回群の直積と同型である。

従って、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は可解群であり(61B)、累巡回拡大である(62C)。


累巡回拡大は、可解性の必要条件を証明する重要ポイントです。そこで次に、\(\bs{Q}(\zeta)/\bs{Q}\) が累巡回拡大になる様子を、ガロア群の計算で示します。

円分拡大は累巡回拡大
\(1\) の原始\(n\)乗根 \(\zeta\) を \(\bs{Q}\) に添加する拡大、\(\bs{Q}(\zeta)/\bs{Q}\) を円分拡大と言います。\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は巡回群の直積と同型で、従って 円分拡大 \(\bs{Q}(\zeta)/\bs{Q}\) は累巡回拡大です。

\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) が巡回群の直積と同型になる理由は、既約剰余類群と同型であること、つまり、
 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/n\bs{Z})^{*}\)
でした(63E)。その \((\bs{Z}/n\bs{Z})^{*}\) について振り返ってみると、次の通りです。\(\varphi\) はオイラー関数です。

 \(\bs{n}\) が奇素数 \(\bs{p}\) 、ないしは奇素数 のべき乗のとき
       (\(n=p^k,\:1\leq k\))(25D)(25E
  \((\bs{Z}/p^k\bs{Z})^{*}\) は生成元をもつ巡回群
  群位数:\(\varphi(p^k)=p^{k-1}(p-1)\)

 \(\bs{n}\) が2のべき乗のとき
       (\(n=2^k,\:2\leq k\))(25F
  \((\bs{Z}/2^k\bs{Z})^{*}\cong(\bs{Z}/2\bs{Z})\times(\bs{Z}/2^{k-2}\bs{Z})\)
  群位数:\(\varphi(2^k)=2^{k-1}\)

 \(\bs{n=p^a\cdot q^b\cdot r^c}\)のとき
       (\(p,\:q,\:r\) は素数)(25G
  \((\bs{Z}/n\bs{Z})^{*}\cong(\bs{Z}/p^a\bs{Z})^{*}\times(\bs{Z}/q^b\bs{Z})^{*}\times(\bs{Z}/r^c\bs{Z})^{*}\)
  群位数:\(\varphi(n)=\varphi(p^a)\varphi(q^b)\varphi(r^c)\)

もちろん最後の式は、素因数が4個以上でも同様に成り立ちます。以下、それぞれの例をあげます。

 \(\zeta\) が 原始\(25\)乗根のとき 

\(\zeta\) が 原始\(25\)乗根の(一つ)のとき、原始\(25\)乗根の全体は \(\zeta^k\:\:(\mr{gcd}(k,25)=1)\) で表され(63B)、その数は \(25\) と互いに素な自然数の数、\(\varphi(25)=20\) です。\(\bs{Q}(\zeta)\) のガロア群は、
 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/5^2\bs{Z})^{*}\)
でした(63E)。\((\bs{Z}/5\bs{Z})^{*}\) の最小の生成元は \(2\) ですが(25D)、ほどんどの場合、\((\bs{Z}/p\bs{Z})^{*}\) の生成元は同時に \((\bs{Z}/p^2\bs{Z})^{*}\) の生成元です(25E)。実際、\(2\) は \((\bs{Z}/25\bs{Z})^{*}\) の生成元であることが確認できます。

そこで、\(\bs{Q}(\zeta)\) の自己同型写像 \(\sg\) を、
 \(\sg(\zeta)=\zeta^2\)
と定義すると、\(\sg^k(\zeta)\:\:(1\leq k\leq20)\) は、

 \(\zeta^2,\:\zeta^4,\:\zeta^8,\:\zeta^{16},\:\zeta^7,\:\zeta^{14},\:\zeta^3,\:\zeta^6,\:\zeta^{12},\:\zeta^{24},\)
 \(\zeta^{23},\:\zeta^{21},\:\zeta^{17},\:\zeta^9,\:\zeta^{18},\:\zeta^{11},\:\zeta^{22},\:\zeta^{19},\:\zeta^{13},\:\zeta\)

となって、原始\(25\)乗根の全部を尽くします。つまり、
 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})=\{e,\:\sg,\:\sg^2,\:\cd,\:\sg^{19}\}\)
  \(\sg(\zeta)=\zeta^2\)
であり、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は位数 \(20\) の巡回群で、
 \(\bs{Q}\:\subset\:\bs{Q}(\zeta)\)
は巡回拡大です。

 \(\zeta\) が 原始\(16\)乗根のとき 

原始\(16\)乗根は、自然数 \(k\) を \(16\) 以下の奇数として \(\zeta^k\) で表され、次の8個です。
 \(\zeta,\:\zeta^3,\:\zeta^5,\:\zeta^7,\:\zeta^9,\:\zeta^{11},\:\zeta^{13},\:\zeta^{15}\)
ここで、\(n\) が2のべき乗のときの同型は、
 \((\bs{Z}/16\bs{Z})^{*}\cong(\bs{Z}/2\bs{Z})\times(\bs{Z}/4\bs{Z})\)
でした(25F)。つまり、\((\bs{Z}/16\bs{Z})^{*}\) は巡回群ではありませんが、位数 \(2\) の巡回群と位数 \(4\) の巡回群の直積に同型です。このことの証明(25F)を振り返ってみると、\(\mr{mod}\:16\) でみて \(5^k\:\:(0\leq k\leq3)\) は、
 \(1,\:5,\:9,\:13\)
であり、\((\bs{Z}/16\bs{Z})^{*}\) の元のうちの「4で割って1余る数」が全部現れるのでした。そこで、\(\bs{Q}(\zeta)\) の自己同型写像 \(\sg\) を、
 \(\sg(\zeta)=\zeta^5\)
と定義すると、\(\sg^k(\zeta)\:\:(0\leq k\leq3)\) は、
 \(\zeta,\:\zeta^5,\:\zeta^9,\:\zeta^{13}\)
で、原始\(16\)乗根の半数を表現します。
 \(G=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\)
 \(H=\{e,\:\sg,\:\sg^2,\:\sg^3\}\)
と書くと、\(H\) は \(G\) の部分群で、\(H\) の位数 \(4\) は \(G\) の位数 \(8\) の半分です。

\(H\) の固定体を \(\bs{K}\) とします。
 \(\sg(\zeta^4)=\sg(\zeta)^4=(\zeta^5)^4=\zeta^{20}\)
ですが、\(\zeta^{16}=1\) なので、
 \(\sg(\zeta^4)=\zeta^4\)
です。\(\zeta^4\) は \(\sg\) で不変であり、従って \(\zeta^4\) は \(H\) のすべての元で不変です。\(\zeta^4\) は4乗して初めて \(1\) になる数で、\(1\) の原始4乗根、つまり \(i\)(または \(-i\)。\(i\) は虚数単位)です。つまり \(i\) は固定体 \(\bs{K}\) の元であり、
 \(\bs{Q}(i)\:\subset\:\bs{K}\)
です。\(\bs{K}\) が \(H\) の固定体なので、ガロア対応は、
 \(G\:\sp\:H\:\sp\:\{\:e\:\}\)
 \(\bs{Q}\:\subset\:\bs{K}\:\subset\:\bs{Q}(\zeta)\)
です。ガロア対応の定理(53B)により、
 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{K})=H\)
であり、次数と位数の同一性52B)により、体の拡大次数はガロア群の位数と等しいので、
 \([\:\bs{Q}(\zeta):\bs{K}\:]=|H|=4\)
です。また、
 \([\:\bs{Q}(\zeta):\bs{Q}\:]=\varphi(16)=8\)
なので、拡大次数の連鎖律33H)により、
 \([\:\bs{K}:\bs{Q}\:]=2\)
です。一方、\(i\) は既約な2次方程式 \(x^2+1=0\) の根なので、\([\:\bs{Q}(i):\bs{Q}\:]=2\) です。つまり \(\bs{K}\) と \(\bs{Q}(i)\) は次元(\(=\:2\))が一致し、かつ \(\bs{Q}(i)\:\subset\:\bs{K}\) なので、体の一致の定理(33I)によって、
 \(\bs{K}=\bs{Q}(i)\)
です。まとめると、\(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q}(i))\) は位数 \(4\) の巡回群であり、\(\bs{Q}(\zeta)/\bs{Q}(i)\) は巡回拡大です。

また、
 \(\tau(i)=-i\)
と定義すると、\(\tau\) は \(\bs{Q}(i)\) の自己同型写像です。従って、
 \(\mr{Gal}(\bs{Q}(i)/\bs{Q})=\{e,\:\tau\}\)
であり、\(\mr{Gal}(\bs{Q}(i)/\bs{Q})\) は位数 \(2\) の巡回群で、\(\bs{Q}(i)/\bs{Q}\) は巡回拡大です。

以上で、
 \(\bs{Q}\:\subset\:\bs{Q}(i)\:\subset\:\bs{Q}(\zeta)\)
は2つの巡回拡大を連鎖させた累巡回拡大です。

 \(\zeta\) が 原始\(360\)乗根のとき 

\(n\) が複数の素因数をもつ一般的な場合を確認します。分かりやすいように \(n=360\) とします。\(360=2^3\cdot3^2\cdot5\) なので、既約剰余類群の構造の定理(25G)によって、
 \((\bs{Z}/360\bs{Z})^{*}\cong(\bs{Z}/8\bs{Z})^{*}\times(\bs{Z}/9\bs{Z})^{*}\times(\bs{Z}/5\bs{Z})^{*}\)
です。右辺の群位数はそれぞれ、
 \(|(\bs{Z}/8\bs{Z})^{*}|=\varphi(8)=4\)
 \(|(\bs{Z}/9\bs{Z})^{*}|=\varphi(9)=6\)
 \(|(\bs{Z}/5\bs{Z})^{*}|=\varphi(5)=4\)
なので、
 \(|(\bs{Z}/360\bs{Z})^{*}|=4\cdot6\cdot4=96=\varphi(360)\)
です。ここで、
 \(1\) の原始\(8\)乗根 \(:\:\zeta^{45}\)
 \(1\) の原始\(9\)乗根 \(:\:\zeta^{40}\)
 \(1\) の原始\(5\)乗根 \(:\:\zeta^{72}\)
ですが、これらを用いると、
 \(\bs{Q}(\zeta)=\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
が成り立ちます。その理由ですが、
 \(\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\subset\bs{Q}(\zeta)\)
であるのは当然として、その逆である、
 \(\bs{Q}(\zeta)\subset\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
も成り立つからです。なぜなら、
 \(45x+40y+72z=1\)
の1次不定方程式を考えると、\(\mr{gcd}(45,40,72)=1\) なので不定方程式の解の存在の定理(21C)により必ず整数解があります。具体的には、
 \(x=5,\:\:y=7,\:\:z=-7\)
が解(の一つ)です。従って、
 \(\zeta=(\zeta^{45})^5\cdot(\zeta^{40})^7\cdot(\zeta^{72})^{-7}\)
であり、\(\zeta\) が \(\zeta^{45},\:\zeta^{40},\:\zeta^{72}\) の四則演算で表現できるので、
 \(\bs{Q}(\zeta)\subset\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
です。この結果、
 \(\bs{Q}(\zeta)=\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
となります。

以上を踏まえると、\(\bs{Q}\) から \(\bs{Q}(\zeta)\) への体の拡大は、
\(\begin{eqnarray}
&&\:\:\bs{Q}&\subset\bs{Q}(\zeta^{45})\\
&&&\subset\bs{Q}(\zeta^{45},\zeta^{40})\\
&&&\subset\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})=\bs{Q}(\zeta)\\
\end{eqnarray}\)
と、\(\bs{Q}\) からの単拡大を3回繰り返したものと言えます。以降で、それぞれの単拡大が巡回拡大になることを確認します。

 \(\bs{Q}\:\subset\:\bs{Q}(\zeta^{45})\) 

\(\zeta^{45}\) は原始\(8\)乗根なので、上で検討した原始\(16\)乗根の結果がそのまま使えます。つまり、
 \(\bs{Q}\subset\bs{Q}(i)\subset\bs{Q}(\zeta^{45})\)
と表され、
 \([\:\bs{Q}(i):\bs{Q}\:]=2\)
 \([\:\bs{Q}(\zeta^{45}):\bs{Q}(i)\:]=2\)
 \([\:\bs{Q}(\zeta^{45}):\bs{Q}\:]=4\)
であり、\(\mr{Gal}(\bs{Q}(i)/\bs{Q}),\:\mr{Gal}(\bs{Q}(\zeta^{45})/\bs{Q}(i))\) は位数2の巡回群です。原始8乗根は簡単に計算できて、たとえばその一つは、
\(\begin{eqnarray}
&&\:\:\zeta^{45}&=\mr{cos}\dfrac{\pi}{4}+i\:\mr{sin}\dfrac{\pi}{4}\\
&&&=\dfrac{1}{2}(\sqrt{2}+\sqrt{2}\:i)\\
\end{eqnarray}\)
なので、
 \(\bs{Q}\subset\bs{Q}(i)\subset\bs{Q}(i,\sqrt{2})=\bs{Q}(\zeta^{45})\)
と表現することができます。この結果を使って、2つのガロア群 \(G_1\) と\(G_2\) の元を表現すると、
 \(G_1=\mr{Gal}(\bs{Q}(i)/\bs{Q})=\{e,\:\sg_1\}\)
  \(\sg_1(i)=-i\)
 \(G_2=\mr{Gal}(\bs{Q}(\zeta^{45})/\bs{Q}(i))=\{e,\:\sg_2\}\)
  \(\sg_2(\sqrt{2})=-\sqrt{2}\)
となります。

 \(\bs{Q}(\zeta^{45})\subset\bs{Q}(\zeta^{45},\zeta^{40})\) 

\(\zeta^{40}\) は原始\(9\)乗根です。原始\(9\)乗根の一つを \(\al\) と書くと、原始\(9\)乗根の全体は \(1\)~\(8\) の数で \(9\) と素なものを選んで、
 \(\al,\:\al^2,\:\al^4,\:\al^5,\:\al^7,\:\al^8\)
の6つになり、これらが共役な元です。\((\bs{Z}/9\bs{Z})^{*}\) の元は、
 \((\bs{Z}/9\bs{Z})^{*}=\{1,\:2,\:4,\:5,\:7,\:8\}\)
ですが、生成元は \(2\) か \(5\) です。生成元として \(2\) を採用すると、\(2^k\:(\mr{mod}\:9)\:(1\leq k\leq6)\) は、
 \(2,\:4,\:8,\:7,\:5,\:1\)
と、\((\bs{Z}/9\bs{Z})^{*}\) の元を巡回します。
 \(G_3=\mr{Gal}(\bs{Q}(\zeta^{45},\zeta^{40})/\bs{Q}(\zeta^{45}))\)
と書くことにし、ガロア群 \(G_3\) の元 \(\sg\) を、
 \(\sg(\al)=\al^2\)
と定義すると、
 \(G_3=\{e,\:\sg,\:\sg^2,\:\sg^3,\:\sg^4,\:\sg^5\}\)
となります。\(\al\) を \(\zeta\) で表すと、
 \(\sg(\zeta^{40})=\zeta^{80}\)
 \((\br{A})\)
です。

ただし、ガロア群の定義によって \(\sg\) は \(\zeta^{45}\) を不動にします。従って、
 \(\sg(\zeta^{45})=\zeta^{45}\)
 \((\br{B})\)
を満たさなければなりません。ここで、\(\sg\) が \(\zeta\) に作用したとき、
 \(\sg(\zeta)=\zeta^x\)
 \((\br{C})\)
であると仮定します。すると \((\br{A})\) 式と \((\br{C})\) 式から、
 \(40x\equiv80\:\:(\mr{mod}\:360)\)
 \(x\equiv2\:\:(\mr{mod}\:9)\)
 \((\br{D})\)
です。また、\((\br{B})\) 式と \((\br{C})\) 式から、
 \(45x\equiv45\:\:(\mr{mod}\:360)\)
 \(x\equiv1\:\:(\mr{mod}\:8)\)
 \((\br{E})\)
です。\(9\) と \(8\) は互いに素です。そうすると中国剰余定理21F)によって、\((\br{D})\) 式と \((\br{E})\) 式の連立合同方程式は \(0\leq x < 9\cdot8\) の範囲に唯一の解があります。それを求めると、
 \(x=65\)
です。当然ですが、\(65\)の累乗を \((\mr{mod}\:9)\) で計算してみると、
 \(65^{\phantom{1}}\equiv2\:\:(\mr{mod}\:9)\)
 \(65^2\equiv4\:\:(\mr{mod}\:9)\)
 \(65^3\equiv8\:\:(\mr{mod}\:9)\)
 \(65^4\equiv7\:\:(\mr{mod}\:9)\)
 \(65^5\equiv5\:\:(\mr{mod}\:9)\)
 \(65^6\equiv1\:\:(\mr{mod}\:9)\)
となって、\(2\) の累乗 \((\mr{mod}\:9)\) と一致します。\(\mr{mod}\:360\) に戻すと、
 \(40\cdot65^{\phantom{1}}\equiv40\cdot2\:\:(\mr{mod}\:360)\)
 \(40\cdot65^2\equiv40\cdot4\:\:(\mr{mod}\:360)\)
 \(40\cdot65^3\equiv40\cdot8\:\:(\mr{mod}\:360)\)
 \(40\cdot65^4\equiv40\cdot7\:\:(\mr{mod}\:360)\)
 \(40\cdot65^5\equiv40\cdot5\:\:(\mr{mod}\:360)\)
 \(40\cdot65^6\equiv40\phantom{\cdot5\:\:(}(\mr{mod}\:360)\)
です。この結果、
\(\sg_3(\zeta)=\zeta^{65}\)
と定義すると、\(\sg_3\) は \(\al=\zeta^{40}\) を、
 \(\sg_3^{\:\phantom{1}}(\al)=\al^2,\:\:\sg_3^{\:2}(\al)=\al^4,\:\:\sg_3^{\:3}(\al)=\al^8\)
 \(\sg_3^{\:4}(\al)=\al^7,\:\:\sg_3^{\:5}(\al)=\al^5,\:\:\sg_3^{\:6}(\al)=\al\)
と巡回させます \((\zeta^{360}=1)\)。また、
 \(65\cdot45=2925\equiv45\:\:(\mr{mod}\:360)\)
なので、
 \(\sg_3(\zeta^{45})=\zeta^{45}\)
です。結局、

\(\begin{eqnarray}
&&\:\:G_3&=\mr{Gal}(\bs{Q}(\zeta^{45},\zeta^{40})/\bs{Q}(\zeta^{45}))\\
&&&=\{e,\:\sg_3,\:\sg_3^{\:2},\:\sg_3^{\:3},\:\sg_3^{\:4},\:\sg_3^{\:5}\}\\
\end{eqnarray}\)
  \(\sg_3(\zeta)=\zeta^{65}\)

がガロア群です。

 \(\bs{Q}(\zeta^{45},\zeta^{40})\subset\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\) 

\(\zeta^{72}\) は原始\(5\)乗根で、\((\bs{Z}/5\bs{Z})^{*}\) の生成元は \(2\) か \(3\) です。生成元として \(2\) を採用すると、ガロア群の元 \(\sg\) は、先ほどと同じように考えて、
 \(\sg(\zeta^{72})=\zeta^{144}\)
 \((\br{A}\,')\)
です。また \(\sg\) は \(\zeta^{45}\) と \(\zeta^{40}\) を固定するので、
 \(\sg(\zeta^{45})=\zeta^{45},\:\:\:\sg(\zeta^{40})=\zeta^{40}\)
 \((\br{B}\,')\)
です。\(\sg\) が \(\zeta\) に作用したときに、
 \(\sg(\zeta)=\zeta^x\)
 \((\br{C})\)
だとすると、\((\br{A}\,')\:\:(\br{B}\,')\) と \((\br{C})\) により、
 \(72x\equiv144\) \((\mr{mod}\:360)\)
 \(45x\equiv45\) \((\mr{mod}\:360)\)
 \(40x\equiv40\) \((\mr{mod}\:360)\)
ですが、これを簡単にして、
 \(x\equiv2\) \((\mr{mod}\:5)\)
 \(x\equiv1\) \((\mr{mod}\:8)\)
 \(x\equiv1\) \((\mr{mod}\:9)\)
が得られます。この連立合同方程式も中国剰余定理\(\bs{\cdot}\)多連立21G)によって、\(0\leq x < 9\cdot8\cdot5=360\) の範囲に唯一の解があります。それを求めると、
 \(x=217\)
です。従って、
\(\sg_4(\zeta)=\zeta^{217}\)
と定義すると、
 \(G_4=\{e,\:\sg_4,\:\sg_4^{\:2},\:\sg_4^{\:3}\}\)
  \(\sg_4(\zeta)=\zeta^{217}\)
がガロア群になります。\(217^4\equiv1\:\:(\mr{mod}\:360)\) です。なお、
 \(\bs{Q}(\zeta^{45},\zeta^{40})=\bs{Q}(\zeta^5)\)
と簡略化できます。なぜなら、\(40\) と \(45\) の最大公約数は \(5\) なので、
 \(45x+40y=5\)
の1次不定方程式には整数解があり(21B)、具体的には、
 \(x=1,\:\:y=-1\)
が解(の一つ)で、
 \(\zeta^5=\zeta^{45}\cdot(\zeta^{40})^{-1}\)
と表せるからです。また、
 \(\bs{Q}(\zeta)=\bs{Q}(\zeta^{45},\zeta^{40},\zeta^{72})\)
だったので、
\(\begin{eqnarray}
&&\:\:G_4&=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q}(\zeta^5))\\
&&&=\{e,\:\sg_4,\:\sg_4^{\:2},\:\sg_4^{\:3}\}\\
\end{eqnarray}\)
  \(\sg_4(\zeta)=\zeta^{217}\)
と表記できます。\(G_4\) は位数 \(4\) の巡回群であり、\(\bs{Q}(\zeta)/\bs{Q}(\zeta^5)\) は巡回拡大です。さらに、
\(\begin{eqnarray}
&&\:\:\sg_4(\zeta^5)&=\zeta^{5\cdot217}=\zeta^{1085}\\
&&&=\zeta^{3\cdot360+5}=\zeta^5\\
\end{eqnarray}\)
なので、\(\sg_4\) が \(\zeta^5\) を固定することが確認できました。


以上の考察をまとめると、\(\zeta\) が \(1\) の原始\(360\)乗根のとき、

 \(\bs{Q}\subset\bs{Q}(i)\subset\bs{Q}(\zeta^{45})\subset\bs{Q}(\zeta^5)\subset\bs{Q}(\zeta)\)

という、4段階の巡回拡大が得られました。\(i\) は原始\(4\)乗根なので、\(\bs{Q}(i)\) は \(\bs{Q}(\zeta^{90})\) と同じ意味です。それそれの拡大のガロア群を \(G_1,\:G_2,\:G_3,\:G_4\) とすると、

 \(G_1=\{e,\:\sg_1\}\)
  \(\sg_1(i)=-i\)
 \(G_2=\{e,\:\sg_2\}\)
  \(\sg_2(\sqrt{2})=-\sqrt{2}\)
 \(G_3=\{e,\:\sg_3,\:\sg_3^{\:2},\:\sg_3^{\:3},\:\sg_3^{\:4},\:\sg_3^{\:5}\}\)
  \(\sg_3(\zeta)=\zeta^{65}\)
 \(G_4=\{e,\:\sg_4,\:\sg_4^{\:2},\:\sg_4^{\:3}\}\)
  \(\sg_4(\zeta)=\zeta^{217}\)

であり、これらすべてが巡回群です。また、体の拡大次数はガロア群の位数と一致し、順に \(2,\:2,\:6,\:4\) です。以上のことは、\(\zeta\) を \(1\) の\(360\)乗根とするとき、
 \(\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\cong(\bs{Z}/360\bs{Z})^{*}\)
\(\begin{eqnarray}
&&\:\:(\bs{Z}/360\bs{Z})^{*}&\cong(\bs{Z}/8\bs{Z})^{*}\times(\bs{Z}/9\bs{Z})^{*}\times(\bs{Z}/5\bs{Z})^{*}\\
&&&\cong(\bs{Z}/2\bs{Z})\times(\bs{Z}/2\bs{Z})\times(\bs{Z}/9\bs{Z})^{*}\times(\bs{Z}/5\bs{Z})^{*}\\
\end{eqnarray}\)
であることの必然的な結果です。

以上のガロア群の計算を通して、\(\bs{Q}(\zeta)/\bs{Q}\) は累巡回拡大であることが確認できました。

べき根拡大
べき根拡大の定義:63G)

\(\bs{K}\) 上の方程式 \(x^n-a=0\:(a\in\bs{K}\)、\(a\neq1)\) の解の一つで、\(\bs{K}\) に含まれないものを \(\sqrt[n]{a}\) とするとき、\(\bs{K}(\sqrt[n]{a})\) を \(\bs{K}\) のべき根拡大(radical extension)と呼ぶ。

また、\(\bs{K}\) からのべき根拡大を繰り返して拡大体 \(\bs{F}\) ができるとき、\(\bs{F}/\bs{K}\) を累べき根拡大と言う。


\(x^n-a\) は既約多項式とは限らないので、\(\bs{K}(\sqrt[n]{a})/\bs{K}\) の拡大次数は \(n\) とは限りません。

また一般に、べき根拡大はガロア拡大ではありません。しかし \(\bs{K}\) に特別の条件(= \(\bs{K}\) に \(1\) の原始\(n\)乗根 \(\zeta\) が含まれる)があるときは、べき根拡大がガロア拡大、かつ巡回拡大になります。この「原始\(\bs{n}\)乗根を含む体からのべき根拡大」を考えるのが、ガロア理論の巧妙なアイデアです。

\(1\) の原始\(n\)乗根を含むべき根拡大
原始n乗根を含むべき根拡大:63H)

\(1\) の原始\(n\)乗根を \(\zeta\) とし、\(\bs{K}\) に \(\zeta\) が含まれるとする。\(\bs{K}\) 上の方程式 \(x^n-a=0\:(a\in\bs{K}\)、\(a\neq1)\) の解の一つで、\(\bs{K}\) に含まれないものを \(\sqrt[n]{a}\) とし、\(\bs{L}=\bs{K}(\sqrt[n]{a})\) とすると、
\(\bs{L}/\bs{K}\) は巡回拡大である
\(\mr{Gal}(\bs{L}/\bs{K})\) の位数は \(n\) の約数である
が成り立つ。


[証明]

\(\bs{K}(\sqrt[n]{a})\) 上の同型写像を \(\tau\) とする。\(x^n-a=0\) の解は、
 \(\sqrt[n]{a},\:\sqrt[n]{a}\:\zeta,\:\sqrt[n]{a}\:\zeta^2,\:\cd\:,\:\sqrt[n]{a}\:\zeta^{n-1}\)
であり、\(\tau\) を \(\sqrt[n]{a}\) に作用させたときの移り先は、このうちのどれかである。もともと \(\bs{K}\) には \(1\) の原始\(n\)乗根 \(\zeta\) が 含まれているから、これらの移り先はすべて \(\bs{K}(\sqrt[n]{a})\) の元である。従って \(\tau\) は自己同型写像であり、\(\bs{K}(\sqrt[n]{a})/\bs{K}\) はガロア拡大である。

次にガロア群 \(\mr{Gal}(\bs{K}(\sqrt[n]{a})/\bs{K})\) の元と、\(\bs{K}(\sqrt[n]{a})/\bs{K}\) の拡大次数を求める。\(\sqrt[n]{a}\) の \(\bs{K}\) 上の最小多項式を \(f(x)\) とする。最小多項式は既約多項式31I)により \(f(x)\) は既約多項式であり、\(f(x)=0\) と \(x^n-a=0\) は共通の解 \(\sqrt[n]{a}\) を持つから、\(x^n-a=0\) は \(f(x)\) で割り切れる。従って \(f(x)=0\) の解は、\(x^n-a=0\) の解、\(\sqrt[n]{a},\:\sqrt[n]{a}\:\zeta,\:\sqrt[n]{a}\:\zeta^2,\:\cd\:,\:\sqrt[n]{a}\:\zeta^{n-1}\) の全部、またはその一部である。\(f(x)=0\) の解で、\(\sqrt[n]{a}\:\zeta^{t}\) の\(t\) が最小となる 正の数を \(d\:(1\leq d\leq n-1)\) とする。そして \(\bs{K}\) の元を固定する \(\bs{K}(\sqrt[n]{a})\) の同型写像、\(\sg\) を、
 \(\sg(\sqrt[n]{a})=\sqrt[n]{a}\:\zeta^{d}\)
と定義する。これは自己同型写像になるから、\(\mr{Gal}(\bs{K}(\sqrt[n]{a})/\bs{K})\) の元である。\(\sg\) は \(\bs{K}\) の元を固定するから \(\sg(\zeta)=\zeta\) である。これを用いて \(\sg^i(\sqrt[n]{a})\) を求めると、
\(\begin{eqnarray}
&&\:\:\sg^2(\sqrt[n]{a})&=\sg(\sg(\sqrt[n]{a}))=\sg(\sqrt[n]{a}\:\zeta^{d})=\sg(\sqrt[n]{a})\zeta^{d}\\
&&&=\sqrt[n]{a}\:\zeta^{d}\zeta^{d}=\sqrt[n]{a}\:\zeta^{2d}\\
&&\:\:\sg^3(\sqrt[n]{a})&=\sg(\sg^2(\sqrt[n]{a}))=\sg(\sqrt[n]{a}\:\zeta^{2d})=\sg(\sqrt[n]{a})\zeta^{2d}\\
&&&=\sqrt[n]{a}\:\zeta^{d}\zeta^{2}d=\sqrt[n]{a}\:\zeta^{3d}\\
\end{eqnarray}\)
となり、一般的には、
 \(\sg^i(\sqrt[n]{a})=\sqrt[n]{a}\:\zeta^{id}\:(1\leq i)\)
となる。\(i=n\) とおくと、
 \(\sg^n(\sqrt[n]{a})=\sqrt[n]{a}\:\zeta^{nd}=\sqrt[n]{a}\)
となるから、\(\sg^n=e\) である。

\(n\) を \(d\) で割ったときの商を \(s\)、余りを \(r\) とする。
 \(n=sd+r\:(1 < s\leq n,\:0\leq r < d)\)
である。ここで \(\sg^i(\sqrt[n]{a})\) の \(i\) を \(n-s\) とおくと、
\(\begin{eqnarray}
&&\:\:\sg^{n-s}(\sqrt[n]{a})&=\sqrt[n]{a}\:\zeta^{nd-sd}\\
&&&=\sqrt[n]{a}\:\zeta^{n(d-1)+n-sd}\\
\end{eqnarray}\)
となる。\(\zeta^n=e\) なので、\(\zeta^{n(d-1)}=e\) であることを用いると、
\(\begin{eqnarray}
&&\:\:\sg^{n-s}(\sqrt[n]{a})&=\sqrt[n]{a}\:\zeta^{n-sd}\\
&&&=\sqrt[n]{a}\:\zeta^{r}\\
\end{eqnarray}\)
と計算できる。\(\sg^{s}\) はガロア群の元なので、\(\sg^{n-s}=\sg^{-s}\) もガロア群の元である。従って \(\sg^{n-s}(\sqrt[n]{a})\) は \(f(x)=0\) の解である。

ここでもし \(r\) がゼロでないとすると、\(1\) 以上、\(d\) 未満の数である \(r\) があって、\(\sqrt[n]{a}\:\zeta^{r}\) が \(f(x)=0\) の解となってしまう。しかしこれは、\(f(x)=0\) の解である \(\sqrt[n]{a}\:\zeta^{t}\) の \(t\) の最小値が \(d\) との仮定に反する。従って \(r=0\) である。

\(n=sd\) なので、
 \(\sqrt[n]{a},\:\sqrt[n]{a}\:\zeta,\:\sqrt[n]{a}\:\zeta^2,\:\cd\:,\:\sqrt[n]{a}\:\zeta^{n-1}\)
の中に \(f(x)=0\) の解は \(s\) 個あり、
 \(\sqrt[n]{a},\:\sqrt[n]{a}\:\zeta^{d},\:\:\sqrt[n]{a}\:\zeta^{2d},\:\cd\:,\:\sqrt[n]{a}\:\zeta^{(s-1)d}\)
である。\(\mr{Gal}(\bs{K}(\sqrt[n]{a})/\bs{K})\) は位数 \(s\) の巡回群であり、位数は \(n\) の約数である。\(n\) が素数 \(p\) であれば、\(\mr{Gal}(\bs{K}(\sqrt[p]{a})/\bs{K})\) は \(p\)次の巡回群である。[証明終]


この定理から分かることは、あらかじめ必要な原始\(n\)乗根を "仕込んで" おけば、べき根拡大列は巡回拡大列になるということです。たとえば、べき根拡大の列、
 \(\bs{Q}\:\subset\:\bs{K}\:\subset\:\bs{L}\)
があり、\(\bs{K}/\bs{Q}\) の拡大次数を \(n_1\)、\(\bs{L}/\bs{K}\) の拡大次数を \(n_2\) とします。\(n_1,\:n_2\) の最小公倍数を \(n\)、\(1\) の原始\(n\)乗根を \(\zeta\) とします。そして、
 \(\bs{Q}\:\subset\:\bs{Q}(\zeta)\:\subset\:\bs{K}\:\subset\:\bs{L}\)
の拡大列を考えると、\(\bs{Q}(\zeta)\) には、
 \(1\) の原始\(n_1\)乗根 : \(\zeta^{\frac{n}{n_1}}\)
 \(1\) の原始\(n_2\)乗根 : \(\zeta^{\frac{n}{n_2}}\)
が含まれているので、
 \(\bs{Q}(\zeta)/\bs{Q}\) : 累巡回拡大(63F
 \(\bs{K}/\bs{Q}(\zeta)\) : 巡回拡大(63H
 \(\bs{L}/\bs{K}\) : 巡回拡大(63H
となり、合わせると
 \(\bs{L}/\bs{Q}\) : 累巡回拡大
になります。ここまでくると、可解性の必要条件の証明まであと一歩です。


6.4 可解性の必要条件


可解性の必要条件を証明する最終段階にきました。\(\bs{Q}\) 上の既約な方程式の解の一つを \(\al\) とし、\(\bs{K}=\bs{Q}(\al)\) の拡大体を考えます。\(\al\) が四則演算とべき根で表現できるということは、\(\bs{K}/\bs{Q}\) が累べき根拡大(63G)であるということです。ここが出発点です。そして証明の方針として、

① \(\bs{K}/\bs{Q}\) が累べき根拡大
② \(\bs{K}/\bs{Q}\) が累巡回拡大
③ ガロア拡大
④ ガロア群が可解群

の4つが密接に関係していることを示します。

まず、原始\(\bs{n}\)乗根を含むべき根拡大の定理(63H)により、累べき根拡大の拡大のステップに必要な原始\(n\)乗根の全種類をあらかじめ \(\bs{Q}\) に含めておけば、① 累べき根拡大は ② 累巡回拡大と同じことなります。

さらに、累巡回拡大ガロア群の可解性62C)の定理により、もし \(\bs{K}/\bs{Q}\) が ③ ガロア拡大であれば、累巡回拡大 \(\bs{K}/\bs{Q}\) のガロア群 \(\mr{Gal}(\bs{K}/\bs{Q})\) は ④ 可解群です。

しかし、累巡回拡大の定義62B)のところで書いたように、\(\bs{K}/\bs{Q}\) が累巡回拡大であってもガロア拡大であるとは限りません。そこで、
 \(\bs{Q}\:\subset\:\bs{K}\:\subset\:\bs{E}\)
となるような \(\bs{E}\) で、\(\bs{E}/\bs{Q}\) が累巡回拡大、かつガロア拡大である \(\bs{E}\) が必ず存在することを証明できれば、① \(\rightarrow\) ② \(\rightarrow\) ③ \(\rightarrow\) ④ が一気通貫でつながることになります。このような \(\bs{E}\)(そこには \(\al\) が含まれる)の存在を、累巡回拡大の定義62B)の説明で書いたシンプルな例で考察します。


代数的数 \(\al\) を、
 \(\al=\sqrt{\sqrt{2}+1}\)
とします。この \(\al\) は \(\bs{Q}\) 上の既約な方程式、
 \(f(x)=x^4-2x^2-1=0\)
の解の一つです。この \(f(x)\) は \(\al\) の最小多項式です。ちなみに \(f(x)\) は、
 \(f(x)=(x^2-(\sqrt{2}+1))(x^2+(\sqrt{2}-1))\)
と変形できるので、方程式 \(f(x)=0\) の解は
 \(x=\pm\sqrt{\sqrt{2}+1},\:\:\:\pm i\sqrt{\sqrt{2}-1}\)
の4つです。

\(\al\) を含む \(\bs{Q}\) の拡大体 \(\bs{Q}(\al)\) を考えます。\(\bs{Q}\:\subset\:\bs{Q}(\al)\) ですが、べき根拡大だけで表現すると、

 \(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\:\:\subset\:\bs{Q}(\sqrt{\sqrt{2}+1})\)

の累べき根拡大になります。つまり、\(\bs{Q}\) 上の方程式、
 \(x^2-2=0\)
の解の一つ \(\sqrt{2}\) を \(\bs{Q}\) に添加してべき根拡大をし、\(\bs{Q}(\sqrt{2})\) 上の方程式、
 \(x^2-(\sqrt{2}+1)=0\)
の解の一つ \(\sqrt{\sqrt{2}+1}\) を \(\bs{Q}(\sqrt{2})\) に添加したのが \(\bs{Q}(\sqrt{\sqrt{2}+1})\) です。2つのべき根拡大の拡大次数は2です。\(1\) の原始2乗根は \(-1\) なので、始めから \(\bs{Q}\) に含まれています。従って、
 \(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\) は
  ・べき根拡大
  ・巡回拡大
    \(\mr{Gal}(\bs{Q}(\sqrt{2})=\{\sg_1,\:\sg_2\}\)
     \(\sg_1=e\)
     \(\sg_2(\sqrt{2})=-\sqrt{2}\)
  ・\(\bs{Q}(\sqrt{2})\) は \(\bs{Q}\) 上の多項式 \(x^2-2\) の最小分解体
となります。まったく同様に、
 \(\bs{Q}(\sqrt{2})\:\subset\:\bs{Q}(\sqrt{\sqrt{2}+1})\) は
  ・べき根拡大
  ・巡回拡大
です。しかし、\(\bs{Q}(\sqrt{\sqrt{2}+1})/\bs{Q}\) がガロア拡大ではありません。というのも、\(\bs{Q}(\sqrt{\sqrt{2}+1})\) は \(\bs{Q}\) 上ではなく \(\bs{Q}(\sqrt{2})\) 上の方程式、
 \(x^2-(\sqrt{2}+1)=0\)
の解の一つ \(\sqrt{\sqrt{2}+1}\) を \(\bs{Q}(\sqrt{2})\) に添加したものだからです。

そこで、\(\bs{Q}(\sqrt{2})\) 上の2つの方程式、
 ・\(x^2-\sg_1(\sqrt{2}+1)=0\)
 ・\(x^2-\sg_2(\sqrt{2}+1)=0\)
の解を順に \(\bs{Q}(\sqrt{2})\) に追加することにします。つまり、
 ・\(\sqrt{\phantom{-}\sqrt{2}+1}\)
 ・\(\sqrt{-\sqrt{2}+1}\)
の2つを \(\bs{Q}(\sqrt{2})\) に追加します。ガロア群は必ず単位元 \(e\) を含むので、\(\sg_1(\sqrt{2}+1)\) と \(\sg_2(\sqrt{2}+1)\) のどちらかは \(\al=\sqrt{\sqrt{2}+1}\) になります。この追加は2つともべき根拡大であり、巡回拡大です。こうして出来上がった拡大体を \(\bs{E}\) とすると、
 \(\bs{E}=\bs{Q}(\sqrt{\sqrt{2}+1},\sqrt{-\sqrt{2}+1})\)
です。以上のことを別の観点で言うと、多項式 \(g(x)\) を、
 \(g(x)=(x^2-\sg_1(\sqrt{2}+1))(x^2-\sg_2(\sqrt{2}+1))\)
と定義するとき、
 \(g(x)=0\) の解を \(\bs{Q}(\sqrt{2})\) に追加したのが \(\bs{E}\)
ということになります。\(g(x)\) を計算すると、
\(\begin{eqnarray}
&&\:\:g(x)&=(x^2-\sg_1(\sqrt{2}+1))(x^2-\sg_2(\sqrt{2}+1))\\
&&&=(x^2-(\sqrt{2}+1))(x^2+(\sqrt{2}-1))\\
&&&=x^4-2x^2-1\\
\end{eqnarray}\)
となり、\(g(x)\) は \(\bs{Q}\) 上の多項式です。なぜそうなるかと言うと、\(g(x)\) の係数は \(\sg_1(\sqrt{2}+1)\) と \(\sg_2(\sqrt{2}+1)\) の対称式で表されるからで、従ってガロア群の元 \(\sg_1,\:\sg_2\) を作用させても不変であり、つまり係数が有理数だからです。ここから得られる結論は、
 \(\bs{E}\) は \(\bs{Q}\) 上の多項式 \(g(x)\) の最小分解体である
ということです。このことは、\(\al=\sqrt{\sqrt{2}+1}\) の最小多項式が \(x^4-2x^2-1=g(x)\) であったことからも確認できます。従ってガロア拡大の定義(52A)により、
 \(\bs{E}/\bs{Q}\) はガロア拡大
です。まとめると、
 \(\bs{Q}\:\subset\:\bs{Q}(\al)\:\subset\:\bs{E}\)
  \(\bs{E}/\bs{Q}\) は累巡回拡大、かつガロア拡大
である \(\bs{E}\) の存在が証明できました。


以上は "2段階の2次拡大" という非常にシンプルな例ですが、このことを一般的に(多段階の \(n\)次拡大で)述べると次のようになります。

ガロア閉包
ガロア閉包の存在:64A)

\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つである \(\al\) がべき根で表されているとする。このとき「\(\bs{Q}\) のガロア拡大 \(\bs{E}\) で、\(\al\) を含み、\(\bs{E}/\bs{Q}\) が累巡回拡大」であるような 代数拡大体 \(\bs{E}\) が存在する。


[証明]

\(\bs{Q}\)上の方程式 \(f(x)=0\) の解の一つ \(\al\) がべき根で表されているとき、

\(\bs{Q}=\bs{K}_0\subset\bs{K}_1\subset\cd\subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cd\subset\bs{K}_k=\bs{K}\)

・ \(\bs{K}_{i+1}=\bs{K}_i(\al_{i+1})\)
・ \(\al_{i+1}\) は \(x^{n_i}-a_i=0\:(a_i\in\bs{K}_i)\) の根の一つ
・ \([\bs{K}_{i+1}:\bs{K}_i]=n_i\)
・ \(\al_k=\al\:\in\:\bs{K}_k=\bs{K}\)

となる、べき根拡大列 \(\bs{K}_i\) が存在する(= \(\bs{K}/\bs{Q}\) が累べき根拡大)。このべき根拡大列を修正して、

\(\bs{Q}\subset\bs{F}_0\subset\bs{F}_1\subset\cd\subset\bs{F}_i\subset\bs{F}_{i+1}\subset\cd\subset\bs{F}_k=\bs{E}\)

・ \(\bs{K}_i\:\subset\:\bs{F}_i\)
・ \(\bs{F}_{i+1}/\bs{F}_i\) は累巡回拡大
・ \(\bs{E}/\bs{Q}\) はガロア拡大
・ \(\al_k=\al\:\in\:\bs{K}_k\:\subset\:\bs{F}_k=\bs{E}\)

とできることを以下に示す。まず、\(n_i\:(0\leq i < k)\) の最小公倍数を \(n\) とし、\(1\) の原始\(n\)乗根を \(\zeta\) とする。そして、
 \(\bs{F}_0=\bs{Q}(\zeta)\)
とおくと、\(\bs{K}_0(=\bs{Q})\:\subset\:\bs{F}_0\) であり、\(\bs{F}_0\) は \(1\) の原始\(n_i\)乗根 \((0\leq i < k)\) を全て含むことになる。

\(\bs{F}_0\) は \(\bs{Q}(\zeta)\) だから、\(\mr{Gal}(\bs{F}_0/\bs{Q})=\mr{Gal}(\bs{Q}(\zeta)/\bs{Q})\) は巡回群の直積に同型であり(63F)、従って可解群である(61B)。つまり、\(\bs{F}_0/\bs{Q}\) は累巡回拡大である(62C)。

次に、
 \(\bs{F}_1=\bs{F}_0(\al_1)\)
とおく。\(\al_1\) は \(\bs{K}_0=\bs{Q}\) 上の方程式 \(x^{n_0}-a_0=0\:(a_0\in\bs{K}_0\:\subset\:\bs{F}_0)\) の根の一つで、\(\al_1=\sqrt[n_0]{a_0}\) であるから、\(\bs{F}_1\) は \(\bs{F}_0\) のべき根拡大になる。

すると、\(\bs{F}_0\)は \(1\) の原始\(n_0\)乗根を含むから、原始\(\bs{n}\)乗根を含むべき根拡大の定理(63H)により、\(\bs{F}_1/\bs{F}_0\) は巡回拡大である。この拡大次数は \([\bs{F}_1:\bs{F}_0]=[\bs{K}_1:\bs{K}_0(=\bs{Q})]=n_0\) である。

また \(\bs{F}_1\)は、\(\bs{Q}\) 上の方程式 \(x^{n_0}-a_0=0\) の解 \(\al_1\eta^j\)(\(\eta\) は \(1\) の原始\(n_0\)乗根。\(0\leq j < n_0\))をすべて含むから、\(\bs{F}_1/\bs{Q}\) はガロア拡大である。


次に \(\bs{K}_2\) を修正した \(\bs{F}_2\) を考える。\(\mr{Gal}(\bs{F}_1/\bs{Q})\) の元を \(\sg_j\:(1\leq j\leq m,\:\sg_1=e)\) の \(m\)個とする。

\(\al_2\) は \(x^{n_1}-a_1=0\:\:(a_1\in\bs{K}_1\:\subset\:\bs{F}_1)\) の根の一つであった。そこで、
 \(\sg_j(a_1)\) \((1\leq j\leq m)\)
という \(m\)個の元をもとに、
 \(x^{n_1}-\sg_j(a_1)=0\:(a_1\in\bs{K}_1\:\subset\:\bs{F}_1,\:\:1\leq j\leq m)\)
という \(m\)個の方程式群を考える。\(\sg_j\) の中には単位元 \(e\) が含まれるため、\(x^{n_1}-a_1=0\) も方程式群の中の一つである。

この \(m\)個の方程式の \(m\)個の解、
 \(\sqrt[n_1]{\sg_j(a_1)}\) \((1\leq j\leq m)\)
を \(\bs{F}_1\) に順々に添加していき、最終的にできた体を \(\bs{F}_2\) とする。\(\bs{F}_1\) は \(1\) の原始 \(n_1\)乗根を含むから、\(\sqrt[n_1]{\sg_j(a_1)}\) \((1\leq j\leq m)\) の添加はすべて巡回拡大である(63H)。つまり、\(\bs{F}_2\) は \(\bs{F}_1\) の累巡回拡大である。\(\sg_j\) の中には単位元があるから、\(\bs{F}_2\) には \(\al_2=\sqrt[n_1]{a_1}\) を含む。

ここで多項式 \(g(x)\) を、
 \(g(x)=\displaystyle\prod_{j=1}^{m}(x^{n_1}-\sg_j(a_1))\)
と定義する。\(\bs{F}_1\) は \(1\) の原始 \(n_1\)乗根を含むから、\(\bs{F}_2\) は \(g(x)=0\) のすべての解を \(\bs{F}_1\) に添加した拡大体である。

多項式 \(g(x)\) の係数は、根と係数の関係から \(\sg_j(a_1)\:\:(1\leq j\leq m)\) の対称式であり、係数に任意の \(\sg_j\:(=\mr{Gal}(\bs{F}_1/\bs{Q})\) の元\()\) を作用させても不変である。つまり係数は有理数であり、\(g(x)\) は \(\bs{Q}\) 上の多項式である。結局、\(\bs{F}_2\) は \(\bs{Q}\) 上の多項式 \(g(x)\) の最小分解体であり、\(\bs{F}_2/\bs{Q}\) はガロア拡大である(52A)。

まとめると、
・ \(a_1\:\in\:\bs{K}_1\:\subset\:\bs{F}_1\)
・ \(\bs{F}_1\) には \(1\) の原始\(n_1\)乗根が含まれる
・ \(\al_2\) は \(x^{n_1}-a_1=0\) の根の一つ
・ \(\mr{Gal}(\bs{F}_1/\bs{Q})\) の元が \(\sg_j\:(1\leq j\leq m,\:\:\:\sg_1=e)\)
で、かつ、
  \(g(x)=\displaystyle\prod_{j=1}^{m}(x^{n_1}-\sg_j(a_1))\)
の条件で、\(g(x)=0\) のすべての解を \(\bs{F}_1\) に添加した拡大体を \(\bs{F}_2\) とすると、
・ \(\bs{F}_2/\bs{F}_1\) 累巡回拡大
・ \(\bs{F}_2/\bs{Q}\) はガロア拡大
・ \(\al_2\:\in\:\bs{K}_2\:\subset\:\bs{F}_2\)
となる。


この \(\bs{K}_i\) を \(\bs{F}_i\) に修正する操作は、\(\bs{K}_k\) を修正して \(\bs{F}_k\) にするまで続けることができる。従って、
\(\bs{Q}\subset\bs{F}_0\subset\bs{F}_1\subset\cd\subset\bs{F}_i\subset\bs{F}_{i+1}\subset\cd\subset\bs{F}_k=\bs{E}\)
の拡大列が存在し、
・ \(\bs{K}\:\subset\:\bs{F}_i\)
・ \(\bs{F}_{i+1}/\bs{F}_i\) は累巡回拡大
・ \(\bs{F}_k/\bs{Q}\) はガロア拡大
・ \(\al_k=\al\:\in\:\bs{F}_k(=\bs{E})\)
とすることができる。[証明終]

ガロア閉包.jpg

\(1\) の原始\(n\)乗根を含む \(\bs{Q}(\zeta)\) からのべき根拡大を考えることによって、体の拡大が巡回拡大(=ガロア群が巡回群であるガロア拡大)になり(63H)、その繰り返しは累巡回拡大になります。しかし累巡回拡大が "全体としてガロア拡大になる" とは限りません(62B)。

そこで、ひと工夫して、\(\bs{\bs{F}_i}\) が常に \(\bs{\bs{Q}}\) 上の方程式 \(\bs{g(x)}\) の最小分解体で、かつ \(\bs{\al_i}\) を含むようにすると、\(\bs{F}_i/\bs{Q}\) が常にガロア拡大になっているので、\(\bs{E}/\bs{Q}\) もガロア拡大になります。しかも最終到達点である \(\bs{F}_k=\bs{E}\) の中には、元々の方程式の解である \(\al\) がある。このような \(\bs{E}\) の存在が重要です。この \(\bs{Q}(\zeta)\:\rightarrow\:\bs{E}\) の拡大を考えることで、単なるべき根拡大列だった \(\bs{Q}\:\rightarrow\:\bs{K}\) をガロア理論の俎上に乗せることができます。

一方、\(\bs{\bs{Q}(\zeta)/\bs{Q}}\) が累巡回拡大になるのは、全く別のロジックによります。つまり、\(\bs{Q}(\zeta)/\bs{Q}\) がガロア拡大で(63D)かつ、ガロア群が巡回群の直積に同型(63F)であり、従ってガロア群が可解群(61B)だからです。そうすると累巡回拡大ガロア群の可解性62C)によって \(\bs{Q}(\zeta)/\bs{Q}\) は累巡回拡大です。

以上の2つの合わせ技で、\(\bs{Q}\) から \(\bs{E}\) に至る累巡回拡大の列ができ、しかも \(\bs{E}/\bs{Q}\) がガロア拡大になっていて、次の可解性の必要条件の証明につながります。

可解性の必要条件
可解性の必要条件:64B)

\(\bs{Q}\) 上の \(n\)次既約方程式 \(f(x)=0\) の解の一つ がべき根で表されているとする。\(f(x)\) の最小分解体を \(\bs{L}\) とするとき、\(\mr{Gal}(\bs{L}/\bs{Q})\) は可解群である。


[証明]

ガロア閉包の存在定理(64A)により、\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つがべき根で表されているとすると、
\(\bs{Q}=\bs{K}_0\subset\bs{K}_1\subset\cd\subset\bs{K}_i\subset\bs{K}_{i+1}\subset\cd\subset\bs{K}_k=\bs{E}\)
という拡大列で、
・ \(\bs{E}/\bs{Q}\) は累巡回拡大
・ \(\bs{E}/\bs{Q}\) はガロア拡大
・ \(\al\:\in\:\bs{E}\)
となるものが存在する。\(\bs{E}/\bs{Q}\) がガロア拡大なので、\(\mr{Gal}(\bs{E}/\bs{Q})\) による \(\al\) の移り先(\(f(x)=0\) の解)は \(\bs{E}\) に含まれる。最小分解体 \(\bs{L}\) は \(f(x)=0\) の \(n\)個の解を含む最小の体である。ゆえに \(\bs{E}\) は最小分解体 \(\bs{L}\) を含んでいる。

また、\(\bs{E}/\bs{Q}\) がガロア拡大ということは、中間体からのガロア拡大の定理(52C)により、\(\bs{E}/\bs{L}\) もガロア拡大である。従って、
 \(\mr{Gal}(\bs{E}/\bs{Q})=G\)
 \(\mr{Gal}(\bs{E}/\bs{L})=H\)
と書くと、
 \(G\) \(\sp\) \(H\) \(\sp\) \(\{\:e\:\}\)
 \(\bs{Q}\) \(\subset\) \(\bs{L}\) \(\subset\) \(\bs{E}\)
ガロア対応53B)が成り立つ。

\(\bs{L}\) は \(\bs{Q}\) 上の既約多項式 \(f(x)\) の最小分解体だから、\(\bs{L}/\bs{Q}\) はガロア拡大である(52A)。ゆえに正規性定理53C)により、\(H\) は \(G\) の正規部分群であり、
 \(\mr{Gal}(\bs{L}/\bs{Q})\:\cong\:G/H\)
が成り立つ。

\(\bs{E}/\bs{Q}\) はガロア拡大かつ累巡回拡大だから、累巡回拡大ガロア群の可解性62C)の定理によって \(G\) は可解群である。\(G\) が可解群なので、その剰余群である \(G/H\) も可解群である(61D)。従って、\(G/H\) と同型である \(\mr{Gal}(\bs{L}/\bs{Q})\) も可解群である。[証明終]


この定理の対偶をとると、

\(\bs{Q}\) 上の既約方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とするとき、\(\mr{Gal}(\bs{L}/\bs{Q})\) が可解群でなければ、\(f(x)=0\) の解のすべてはべき根で表されない(=非可解)

となります。これを用いて、非可解な5次方程式があることを証明できます。


6.5 5次方程式の解の公式はない


5次方程式には解の公式はないことをガロア理論で証明します。そのためにまず、対称群、交代群、置換の説明をします。

対称群 \(S_n\)
集合 \(\Omega_n=\{1,\:2,\:\cd\:n\}\) から \(\Omega_n\) への全単射写像(1対1写像)の全体を \(S_n\) と書き、\(n\)次の対称群(symmetric group)と言います。\(1,\:2,\:\cd\) は整数ではなく、集合の元を表す文字です。一般に集合 \(X\) から \(X\) への全単射写像を置換(permutation)と呼ぶので、\(S_n\) の元は \(n\) 個の文字の置換です。

\(S_n\) の元の一つを \(\sg\) とします。\(1\leq k\leq n\) とし、\(\sg\)による \(k\) の移り先を \(\sg(k)\) とすると、\(\sg\) は全単射写像なので、\(k\neq k\,'\) なら\(\sg(k)\neq\sg(k\,')\) です。従って、\((\sg(1),\sg(2),\cd,\sg(n))\) は、\((1,2,\cd n)\) の一つの順列になります。逆に、\((1,2,\cd n)\) の順列の一つを \((i_1,i_2,\cd i_n)\) とすると、\(\sg(k)=i_k\) で \(\Omega_n\) から \(\Omega_n\) への全単射写像が得られます。つまり \(S_n\) は \((1,2,\cd n)\) のすべての順列と同一視できます。

\(S_n\) の元の2つを \(\sg\)、\(\tau\) とし、\(\sg\) と \(\tau\) の合成写像 \(\sg\tau\) を、
 \(\sg\tau(k)=\sg(\tau(k))\:\:(1\leq k\leq n)\)
で定義すると、\(\sg\tau\) も全単射写像なので \(S_n\) の元であり、\(S_n\) は群になります。単位元 \(e\) は \(e(k)=k\:(1\leq k\leq n)\) である恒等写像です。また、\(\sg\) は全単射写像なので逆写像 \(\sg^{-1}\) があり、群の定義を満たしています。

\(S_n\) は \((1,2,\cd n)\) のすべての順列と同一視できるので、その位数は
 \(|S_n|=n\:!\)
です。\(S_n\) の元 \(\sg\) を、
 \(\sg=\left(\begin{array}{c}1&2&\cd&n\\\sg(1)&\sg(2)&\cd&\sg(n)\end{array}\right)\)
と表します。この表記では縦の列が合っていればよく、並び順に意味はありません。これを使うと \(\sg\) の逆元は、
 \(\sg^{-1}=\left(\begin{array}{c}\sg(1)&\sg(2)&\cd&\sg(n)\\1&2&\cd&n\end{array}\right)\)
です。

\(S_3\) の元を \(\sg_1,\sg_2,\:\cd\:\sg_6\) とし、具体的に書いてみると、
 \(\sg_1=\left(\begin{array}{c}1&2&3\\1&2&3\end{array}\right)\) \(\sg_2=\left(\begin{array}{c}1&2&3\\2&3&1\end{array}\right)\)
 \(\sg_3=\left(\begin{array}{c}1&2&3\\3&1&2\end{array}\right)\) \(\sg_4=\left(\begin{array}{c}1&2&3\\1&3&2\end{array}\right)\)
 \(\sg_5=\left(\begin{array}{c}1&2&3\\3&2&1\end{array}\right)\) \(\sg_6=\left(\begin{array}{c}1&2&3\\2&1&3\end{array}\right)\)
となります。\(\sg_1\) は恒等置換 \(e\) です。なお \(S_3\) は、1.3節に出てきた3次の2面体群と同じものです。

 巡回置換 

\(S_n\) に現れる \(n\)文字からその一部を取り出します。例えば3つ取り出して、\(i,\:j,\:k\) とします。そして、
 \(i\rightarrow j,\:\:j\rightarrow k,\:\:k\rightarrow i\)
と文字を循環させ、その他の文字は不動にする置換 \(\sg\) を考えます。これが巡回置換(cyclic permutation)です。
 \(\sg=\left(\begin{array}{c}\cd&i&\cd&j&\cd&k&\cd\\\cd&j&\cd&k&\cd&i&\cd\end{array}\right)\)
と表せて、\(\cd\) の部分は不動です。これを簡略化して、
 \(\sg=(i,\:j,\:k)\)
と表記します。\(\sg\) の逆元は、
 \(\sg^{-1}\)\(=(i,\:j,\:k)^{-1}\)
\(=\left(\begin{array}{c}\cd&i&\cd&j&\cd&k&\cd\\\cd&j&\cd&k&\cd&i&\cd\end{array}\right)^{-1}\)
\(=\left(\begin{array}{c}\cd&j&\cd&k&\cd&i&\cd\\\cd&i&\cd&j&\cd&k&\cd\end{array}\right)\)
\(=\left(\begin{array}{c}\cd&i&\cd&j&\cd&k&\cd\\\cd&k&\cd&i&\cd&j&\cd\end{array}\right)\)
\(=(k,\:j,\:i)\)
です。一般に \(m\)文字の巡回置換 \((1\leq m\leq n)\) は、
 \(\sg=(i_1,\:i_2,\:\cd\:,i_m)\)
です。長さ \(m\) の巡回置換、とも言います。逆元は文字の順序を逆順にした、
 \(\sg^{-1}=(i_m,\:i_{m-1},\:\cd\:,i_1)\)
です。\(m\)文字の巡回置換を群としてとらえたとき、 \(C_m\) で表します。\(C_m\) は位数 \(m\) の巡回群で、可換群です。

特に、2文字の巡回置換を互換(transposition)と言います。巡回置換と互換について、次の定理が成り立ちます。


置換は巡回置換の積:65A)

すべての置換は共通文字を含まない巡回置換の積で表せる。


[証明]

\(n\)次対称群 \(S_n\) の任意の元を \(\sg\) とすると、\(\sg\) は \(n\)文字の任意の置換である。\(n\)文字の中から \(\sg(a)\neq a\) である文字 \(a\) を選ぶ。そして \(\sg(a),\:\sg^2(a),\:\sg^3(a),\:\cd\) という、\(\sg\) による \(a\) の写像を繰り返す列を考える。\(\sg\)による \(a\) の移り先は最大 \(n\)個なので、列の中には、
 \(\sg^j(a)=\sg^i(a)\:\:(i < j)\)
となる \(i,\:j\) が必ず出てくる。つまり、
 \(\sg^{j-i}(a)=a\)
となる \(i,\:j\) が存在する。\(k_a\) を \(\sg^{k_a}(a)=a\) となる最小の数とすると、
 \(\sg(a),\:\sg^2(a),\:\cd\:,\sg^{k_a}(a)=a,\:\sg(a),\:\cd\)
 \((\br{A})\)
となり、\(k_a+1\)番目で \(\sg(a)\) に戻って以降は巡回する。\(\sg_1\) を、
 \(\sg_1=(\sg(a),\:\sg^2(a),\:\cd\:,\sg^{k_a}(a))\)
の巡回置換と定義する。

もし仮に列 \((\br{A})\) が、\(\sg\) で変化する文字全部を尽くしているなら、題意は正しい。そうでないとき、列 \((\br{A})\) に現れない文字で \(\sg(b)\neq b\) である \(b\) を選ぶ。上と同様にして、
 \(\sg(b),\:\sg^2(b),\:\cd\:,\sg^{k_b}(b)=b\)
 \((\br{B})\)
の列が作れる。\((\br{B})\) 列に \((\br{A})\) 列と同じ文字は現れない。なぜなら、もし列 \((\br{B})\) の \(\sg^i(b)\) が \((\br{A})\) 列に現れるとすると、\(\sg^i(b)\) に \(\sg\) による置換を繰り返すといずれは \(b\) になるから、\(b\) が \((\br{A})\) 列に現れることになってしまい、「列 \((\br{A})\) に現れない文字 \(b\)」ではなくなるからである。従って、
 \(\sg_2=(\sg(b),\:\sg^2(b),\:\cd\:,\sg^{k_b}(b)=b)\)
という、2つ目の巡回置換が定義できる。列 \((\br{A})\) と \((\br{B})\) が \(\sg\) で変化する文字全部を尽くすなら、\(\sg=\sg_2\sg_1\) である。\(\sg_1\) と \(\sg_2\) に共通の文字は現れないので、\(\sg=\sg_1\sg_2\) と書いてもよい。

以上の操作は、\(\sg\) で変化する文字全部を尽くすまで繰り返すことができる。その繰り返し回数を \(m\) とすると、
 \(\sg=\sg_1\sg_2\:\cd\:\sg_m\)
であり、任意の置換 \(\sg\) は巡回置換の積で表せることになる。なお、恒等置換 \(e\) は、
 \(e=(i,\:j)^2\)
 \(e=(i,\:j,\:k)^3\)
などであり、巡回置換の積で表せることに変わりはない。[証明終]


置換を巡回置換の積で表すと、例えば、
 \(\sg\)\(=\left(\begin{array}{c}1&2&3&4&5&6\\1&4&5&6&3&2\end{array}\right)\)
\(=(2,\:4,\:6)(3,\:5)\)
となります。


置換は互換の積:65B)

すべての置換は互換の積で表せる。


[証明]

巡回置換 \((1,\:2,\:3)\) は
 \((1,\:2,\:3)=(1,\:3)(1,\:2)\)
と表せる(積は右から読む)。また、巡回置換 \((1,\:2,\:3\). \(4)\) は、
 \((1,\:2,\:3,\:4)=(1,\:4)(1,\:3)(1,\:2)\)
である。一般に、
 \((i_1,\:i_2,\:\cd\:,i_m)=(i_1,\:i_m)\:\cd\:(i_1,\:i_2)\)
である。このように巡回置換は互換の積で表せる。すべての置換は巡回置換の積で表せる(65A)ので、題意は正しい。[証明終]

交代群 \(A_n\)
一つの置換を互換の積で表す方法が一意に決まるわけではありません。たとえば、
 \((1,\:2,\:3)\)\(=(1,\:3)(1,\:2)\)
\(=(1,\:3)(2,\:3)(1,\:2)(1,\:3)\)
です(積は右から読む)。ただし、積に現れる互換の数が偶数か奇数かは一意に決まります。


置換の偶奇性:65C)

一つの置換を互換の積で表したとき、その互換の数は奇数か偶数かのどちらかに決まる。


[証明]

\(n\)変数の多項式 \(f(x_1,x_2,\cd,x_n)\) を、
 \(f(x_1,x_2,\cd,x_n)=\displaystyle\prod_{1\leq i < j\leq n}^{}(x_i-x_j)\)
と定義する(差積と呼ばれる)。\(S_n\) の一つの元を \(\sg\) とし、\(\sg\) を \(f(x_1,x_2,\cd,x_n)\) に作用させることを、
 \(\sg\cdot f(x_1,x_2,\cd,x_n)=f(x_{\sg(1)},x_{\sg(2)},\cd,x_{\sg(n)})\)
と定義する。\(\sg\) が互換、つまり \(\sg=(i,\:j)\) であれば、
 \((i,\:j)\cdot f(x_1,x_2,\cd,x_n)=-f(x_1,x_2,\cd,x_n)\)
となる。これはすべての互換で成り立つ。

\(\sg\) が \(k\)個の互換の積で表されていると、
 \(\sg\cdot f(x_1,x_2,\cd,x_n)=(-1)^kf(x_1,x_2,\cd,x_n)\)
である。もし、\(m\neq k\) として \(\sg\) が \(m\)個の互換の積で表せたとしたら、
 \(\sg\cdot f(x_1,x_2,\cd,x_n)=(-1)^mf(x_1,x_2,\cd,x_n)\)
である。従って、
 \((-1)^k=(-1)^m\)
であり、\(k\) と \(m\) の偶奇は等しい。[証明終]


置換の偶奇性65C)により、置換は2つのタイプに分けることができます。偶数個の互換の積で表す置換を偶置換(even permutaion)、奇数個の互換の積で表す置換を奇置換(odd permutaion)と言います。

偶置換の積は偶置換です。従って、\(S_n\) の偶置換の元を集めた集合は群になります。これを \(n\)次交代群(alternating group)といい、\(A_n\) で表します。


交代群は正規部分群:65D)

\(S_n\) の元は同数の偶置換と奇置換から成る。従って、
 \([\:S_n\::\:A_n\:]=2\)
である。

\(A_n\) は \(S_n\) の正規部分群であり、\(S_n/A_n\) は巡回群である。


[証明]

\(B_n\) を \(S_n\) に含まれる奇置換の集合とする。\(S_n\) の任意の互換を \(\sg\) とすると、集合 \(\sg A_n\) のすべての元は奇置換だから、
 \(\sg A_n\subset B_n\)
が成り立つ。それとは逆に、集合 \(\sg B_n\) のすべての元は偶置換だから、
 \(\sg B_n\subset A_n\)
も成り立つ。この式に左から \(\sg\) を作用させると、
 \(\sg^2B_n\subset\sg A_n\)
 \(B_n\subset\sg A_n\)
となる。\(\sg A_n\subset B_n\) かつ \(B_n\subset\sg A_n\) なので、
 \(B_n=\sg A_n\)
となり、\(B_n\) と \(A_n\) の元の数は等しい。\(S_n=A_n\cup B_n\) なので、
 \([\:S_n\::\:A_n\:]=2\)
である。

\(S_n\) の部分群 \(A_n\) の元の数は \(S_n\) の元の数の半分なので、\(S_n\) は \(A_n\) の2つの左剰余類(または右剰余類)の和集合である。従って、\(B_n\) の 任意の元を \(b\) とすると、
 (\(A_n\) の左剰余類) \(S_n=A_n\cup bA_n\:\:(A_n\cap bA_n=\phi)\)
 (\(A_n\) の右剰余類) \(S_n=A_n\cup A_nb\:\:(A_n\cap A_nb=\phi)\)
となり、\(bA_n=A_nb\) である。また \(A_n\) の元 \(a\) については、\(A_n\) が群なので \(aA_n=A_n,\:A_na=A_n\) である。従って \(S_n\) の任意の元 \(\sg\) について \(\sg A_n=A_n\sg\) が成り立ち、\(A_n\) は \(S_n\) の正規部分群である。

\(A_n\) が正規部分群なので、\(S_n/A_n\) は剰余群である。\(S_n\) の任意の元を \(\sg\) とし、\(S_n/A_n\) の元を \(\sg A_n\) とすると、
 \((\sg A_n)^2=\sg A_n\sg A_n=\sg\sg A_nA_n=\sg^2A_n\)
となるが、\(\sg A_n=B_n\) であり \(\sg B_n=A_n\) だから、\(\sg^2A_n=A_n\) である。つまり、
 \((\sg A_n)^2=A_n\)
を満たす。\(A_n\) は 剰余群 \(S_n/A_n\) の単位元だから、\(S_n/A_n\) は巡回群でである。[証明終]


交代群は3文字巡回置換の積:65E)

交代群 \(A_n\) の任意の元は、3文字の巡回置換の積で表せる。


[証明]

\(A_n\) の任意の元は偶数個の互換の積で表せる。この互換の積を2つずつ右から(ないしは左から)取り出すことを考える。2つの互換の積には4つの文字があるが、それには次の2つパターンがある。
 異なる4文字
  \((i,\:j)(k,\:m)\)
 異なる3文字
  \((i,\:j)(i,\:k)\)
異なる3文字のうち、\((i,\:j)(j,\:k)\) のパターンは、\(i\) を \(j\) と読み替え、\(j\) を \(i\) と読み替えると \((j,\:i)(i,\:k)\) となり、\((i,\:j)(i,\:k)\) と同じである。また、\((i,\:j)(k,\:i)\) や \((i,\:j)(k,\:j)\) も \((i,\:j)(i,\:k)\) と同じである。

異なる2文字から成る \((i,\:j)(i,\:j)\) は恒等互換なので無視してよい。

2つの互換の積の2パターンは、いずれも3文字の巡回置換の積で表せる。つまり、
 \(\left(\begin{array}{c}i&j&k&m\\k&i&j&m\end{array}\right)=(i,\:k,\:j)\)
 \(\left(\begin{array}{c}k&i&j&m\\j&i&m&k\end{array}\right)=(j,\:m,\:k)\)
 \(\left(\begin{array}{c}i&j&k&m\\j&i&m&k\end{array}\right)=(i,\:j)(k,\:m)\)
なので、
 \((i,\:j)(k,\:m)=(j,\:m,\:k)(i,\:k,\:j)\)
である。また、巡回置換を互換の積で表す標準的な方法(65B)から、
 \((i,\:j)(i,\:k)=(i,\:k,\:j)\)
である。

\(A_n\) は「2つの互換の積」の積、で表現でき、「2つの互換の積」は「3文字の巡回置換の積」で表せるので、題意は正しい。[証明終]


なお、上の交代群は正規部分群65D)の証明では、「交代群 \(A_n\) の元の数が、対称群 \(S_n\) の元の数の半分である」ことしか使っていません。従って次の定理が成り立ちます。


半分の部分群は正規部分群:65F)

群 \(G\) の部分群を \(N\) とする。
 \(|G|=2|N|\)
のとき(つまり 群の指数 \([G:N]=2\) のとき)、\(N\) は \(G\) の正規部分群である。


対称群の可解性
対称群の可解性:65G)

5次以上の対称群、\(S_n\:\:(n\geq5)\) は可解群ではない。


[証明]

\(S_n\) の交代群を \(A_n\) とする。\(A_n\) は \(S_n\) の部分群なので、もし \(A_n\) が可解群でなければ、可解群の部分群は可解群の定理(61C)の対偶により、\(S_n\) は可解群ではない。以下、\(A_n\) が可解群でないことを背理法で証明する。

\(A_n\) が可解群と仮定して矛盾を導く。\(A_n\) が可解群とすると、定義により \(A_n\) には正規部分群 \(N\:(N\neq A_n)\) があり、\(A_n/N\) が巡回群である。

\(A_n\) の任意の2つの元を \(x,\:y\) とし、剰余類 \(xN\) と \(yN\) を考える。\(A_n/N\) は巡回群なので可換群であり、\(xNyN=yNxN\) である。\(N\) は正規部分群なので、\(Ny=yN\)、\(Nx=xN\) であり、これを用いて \(xNyN=yNxN\) を変形していくと、
 \(xNyN=yNxN\)
 \(xyNN=yxNN\)
 \(xyN=yxN\)
となる。この式に左から \(x^{-1}y^{-1}\) をかけると、
 \(x^{-1}y^{-1}xyN=x^{-1}y^{-1}yxN\)
 \(x^{-1}y^{-1}xyN=N\)
となる。部分群の元の条件の定理(41C)より、\(aN=N\) と \(a\in N\) は同値である。従って、
 \(x^{-1}y^{-1}xy\in N\)
である。

一般に \(x^{-1}y^{-1}xy\) を \(x\) と \(y\) の交換子と呼ぶ。上の式の変形プロセスから言えることは、\(A_n\) の任意の2つの元(\(N\) の元である必要はない)の交換子は \(N\) の元になるということである。

\(S_n\:\:(n\geq5)\) の任意の3文字巡回置換を \((i,\:j,\:k)\) とする。
 \((i,\:j,\:k)=(i,\:k)(i,\:j)\)
なので、\((i,\:j,\:k)\) は偶置換であり、
 \((i,\:j,\:k)\in A_n\)
である。ここで、\(\bs{i,\:j,\:k}\) とは違う2つの文字 \(\bs{l,\:m}\) を選ぶ。\(\bs{n\geq5}\) ならこれは常に可能である。そして、
 \(x=(i,\:m,\:j)\)
 \(y=(i,\:l,\:k)\)
とし、\(x,\:y\) の交換子を作ってみる。計算すると以下のようになる。

 \(x^{-1}y^{-1}xy\)
  \(=(i,\:m,\:j)^{-1}(i,\:l,\:k)^{-1}(i,\:m,\:j)(i,\:l,\:k)\)
  \(=(j,\:m,\:i)(k,\:l,\:i)(i,\:m,\:j)(i,\:l,\:k)\)

 \((i,\:l,\:k)\)\(=\left(\begin{array}{c}i&j&k&l&m\\l&j&i&k&m\end{array}\right)\)
 \((i,\:m,\:j)\)\(=\left(\begin{array}{c}l&j&i&k&m\\l&i&m&k&j\end{array}\right)\)
 \((k,\:l,\:i)\)\(=\left(\begin{array}{c}l&i&m&k&j\\i&k&m&l&j\end{array}\right)\)
 \((j,\:m,\:i)\)\(=\left(\begin{array}{c}i&k&m&l&j\\j&k&i&l&m\end{array}\right)\)

 \(x^{-1}y^{-1}xy\)
  \(=(j,\:m,\:i)(k,\:l,\:i)(i,\:m,\:j)(i,\:l,\:k)\)
  \(=\left(\begin{array}{c}i&j&k&l&m\\j&k&i&l&m\end{array}\right)\)
  \(=(i,\:j,\:k)\)

\(x^{-1}y^{-1}xy\in N\) なので、
 \((i,\:j,\:k)\in N\)
である。つまり任意の3文字巡回置換は \(N\) に含まれる。

\(A_n\) のすべての元は3文字巡回置換の積で表される(65E)から、\(A_n\) は \(N\) の元の積で表せることになる。つまり、
 \(A_n\subset N\)
だが、もともと \(N\) は \(A_n\) の部分集合だから、
 \(A_n=N\)
である。これは \(N\neq A_n\) という仮定と矛盾する。従って、\(A_n\) の正規部分群 \(N\:(N\neq A_n)\) で、\(A_n/N\) が巡回群であるようなものはなく、\(A_n\) は可解群ではない。

\(S_n\:\:(n\geq5)\) は可解群ではない部分群 \(A_n\) をもつから、可解群の部分群は可解群の定理(61C)の対偶によって、\(S_n\) は可解群ではない。[証明終]


\(S_5\)(位数 \(120\)) や、その部分群 \(A_5\)(位数 \(60\))は可解群ではありません。しかし、「\(S_5\) のすべての部分群が可解群ではない」というわけではありません。\(S_5\) の部分群では、\(F_{20}\)(位数 \(20\))、\(D_{10}\)(位数 \(10\))、\(C_5\)(位数 \(5\))が可解群であることが知られています。これについては第7章で述べます。

一般5次方程式
5次方程式には代数的に解けるものと解けないものがあります。従って、全ての5次方程式に適用可能な根の公式はありません。5次方程式に根の公式がないことはガロア以前に証明されていたのですが、なぜ根の公式がないのか、その理由を明らかにしたのがガロア理論です。

係数が変数の方程式を「一般方程式」と言います。根の公式があるということは一般方程式が解けることを意味します。以下は、一般5次方程式が代数的に解けないことの証明ですが、この証明では係数が変数ではなく、解を変数としています。


5次方程式の解の公式はない:65H)

\(\bs{Q}\) の代数拡大体を \(\bs{K}\) とする。\(\bs{K}\) の任意の元である5つの変数 \(b_1,b_2,b_3,b_4,b_5\) を根とする多項式を、
\(\begin{eqnarray}
&&\:\:f(x)&=(x-b_1)(x-b_2)(x-b_3)(x-b_4)(x-b_5)\:\:(b_i\in\bs{K})\\
&&&=x^5-a_4x^4+a_3x^3-a_2x^2+a_1x-a_0\\
\end{eqnarray}\)
とし、\(\bs{Q}\) に \(a_0,a_1,a_2,a_3,a_4,\)を添加した代数拡大体を \(\bs{F}\) とする。つまり、
 \(\bs{F}=\bs{Q}(a_0,\:a_1,\:a_2,\:a_3,\:a_4)\)
である。

このとき、\(\bs{K}\) の \(\bs{F}\) 上の ガロア群 \(G\) は5次対称群 \(S_5\) である。\(S_5\) は可解群ではないので(65G)、従って \(b_i\) を \(a_i\) のべき根で表すことはできない。


[証明]

代数拡大体 \(\bs{F}\) の作り方から、\(\bs{K}\) は \(\bs{F}\) 上の多項式 \(f(x)\) の最小分解体である。従って \(\bs{K}/\bs{F}\) はガロア拡大である。\(G=\mr{Gal}(\bs{K}/\bs{F})\) とおくと、\(G\) は \(\bs{F}\) の元を固定する自己同型写像が作る群である。

対称群 \(S_5\) の元の一つを \(s\) とし、
 \(s=\left(\begin{array}{c}1&2&3&4&5\\s(1)&s(2)&s(3)&s(4)&s(5)\end{array}\right)\)
とする。このとき、
 \(\sg(b_i)=b_{s(i)}\:\:(i=1,2,3,4,5)\)
で、\(b_i\) に作用する写像 \(\sg\) を定義する。そうすると \(\sg\) は \(f(x)=0\) の解 \(b_i\) を共役な解に移す写像だから、自己同型写像である。また、
\(\begin{eqnarray}
&&\:\:f(x)&=(x-b_1)(x-b_2)(x-b_3)(x-b_4)(x-b_5)\:\:(b_i\in\bs{K})\\
&&&=x^5-a_4x^4+a_3x^3-a_2x^2+a_1x-a_0\\
\end{eqnarray}\)
の根と係数の関係から、
 \(a_4\)\(\overset{\text{ }}{=}\)\(b_1+b_2+b_3+b_4+b_5\)
\(a_3\)\(\overset{\text{ }}{=}\)\(b_1b_2+b_1b_3+b_1b_4+b_1b_5+b_2b_3+b_2b_4+b_2b_5+b_3b_4+b_3b_5+b_4b_5\)
\(a_2\)\(\overset{\text{ }}{=}\)\(b_1b_2b_3+\)\(b_1b_2b_4+\)\(b_1b_2b_5+\)\(b_1b_3b_4+\)\(b_1b_3b_5+\)\(b_1b_4b_5+\)\(b_2b_3b_4+\)\(b_2b_3b_5+\)\(b_2b_4b_5+\)\(b_3b_4b_5\)
\(a_1\)\(\overset{\text{ }}{=}\)\(b_1b_2b_3b_4+b_1b_2b_3b_5+b_1b_2b_4b_5+b_1b_3b_4b_5+b_2b_3b_4b_5\)
\(a_0\)\(\overset{\text{ }}{=}\)\(b_1b_2b_3b_4b_5\)
である。つまり \(a_i\:(0\leq i\leq4)\) は \(b_i\:(1\leq i\leq5)\) の対称式で表される。

従って、\(\sg(a_0)=a_0\)、\(\sg(a_1)=a_1\)、\(\sg(a_2)=a_2\)、\(\sg(a_3)=a_3\)、\(\sg(a_4)=a_4\) である。つまり \(\sg\) は \(\bs{F}=\bs{Q}(a_0,\:a_1,\:a_2,\:a_3,\:a_4)\) の元を固定する。従って \(\sg\) は \(\bs{F}\) の元を固定する \(\bs{K}\) の自己同型写像であり、\(G\) の元である。以上のことは \(S_5\) の任意の元 \(s\) について言えるから \(S_5\subset G\) である。

これを踏まえて \(\bs{F}\) 上の \(\bs{K}\) の拡大次数 \([\:\bs{K}\::\:\bs{F}\:]\) を考えると、\([\:\bs{K}\::\:\bs{F}\:]\) は \(\mr{Gal}(\bs{K}/\bs{F})\) の位数に等しいから、
 \([\:\bs{K}\::\:\bs{F}\:]=|G|\geq|S_5|=5!=120\)
である。

次に、
 \(\bs{F}\subset\)\( \bs{F}(b_1)\subset\)\( \bs{F}(b_1,b_2)\subset\)\( \cd\subset\)\( \bs{F}(b_1,b_2,b_3,b_4,b_5)=\bs{K}\)
という体の拡大列を考える。最初の拡大 \(\bs{F}\subset\bs{F}(b_1)\) をみると、\(b_1\) は \(\bs{F}\) 上の 5次方程式 \(f(x)=0\) の根だから、
 \([\:\bs{F}(b_1)\::\:\bs{F}\:]\leq\mr{deg}\:f(x)\:=5\)
である。等号は \(f(x)\) が既約多項式のときである。さらに、\(b_2\) は
4次方程式 \(f(x)/(x-b_1)\) の根だから、
 \([\:\bs{F}(b_1,b_2)\::\:\bs{F}(b_1)\:]\leq4\)
である。以上を順に続けると、体の拡大次数の連鎖律33H)により、
 \([\:\bs{K}\::\:\bs{F}\:]\)
  \(=\)\([\:\bs{F}(b_1,b_2,b_3,b_4,b_5)\::\:\bs{F}\:]\)
\(=\)\([\:\bs{F}(b_1,b_2,b_3,b_4,b_5)\::\:\bs{F}(b_1,b_2,b_3,b_4)\:]\cdot\)
 \([\:\bs{F}(b_1,b_2,b_3,b_4)\::\:\bs{F}(b_1,b_2,b_3)\:]\cdot\)
 \([\:\bs{F}(b_1,b_2,b_3)\::\:\bs{F}(b_1,b_2)\:]\cdot\)
 \([\:\bs{F}(b_1,b_2)\::\:\bs{F}(b_1)\:]\cdot\)
 \([\:\bs{F}(b_1)\::\:\bs{F}\:]\)
\(\leq\)\(5\cdot4\cdot3\cdot2\cdot1=5!=120\)

である。従って、\([\:\bs{K}\::\:\bs{F}\:]\geq5!\) と合わせると \([\:\bs{K}\::\:\bs{F}\:]=5!\) であり、
 \(|G|=|S_5|\)
となって、
 \(G\cong S_5\)
である。つまり、一般5次方程式のガロア群は \(S_5\) と同型であることが証明できた。\(S_5\) は可解群ではないので(65G)、それと同型である \(G\) も可解群ではない。従って \(b_i\) を \(a_i\) のべき根で表すことはできず、一般5次方程式に解の公式はない。[証明終]


6.6 可解ではない5次方程式


5次方程式の全てに適用できる解の公式がないことは、ガロア以前に証明されていました(アーベル・ルフィニの定理)。しかしガロア理論によって、解の公式がないことの「原理」が明確になりました。つまり係数が変数である一般5次方程式は、解が四則演算とべき根で表現できる(=可解である)ための必要条件を満たさないから公式は作れないのです(65H)。

ということは、この「原理」を用いて、可解ではない、係数が数値の方程式を具体的に構成できることになります。それを以下で行います。そのためにまず、コーシーの定理を証明します。なお、コーシー(19世紀フランスの数学者)の名がついた定理はいくつかありますが、これは「群論のコーシーの定理」です。

コーシーの定理
コーシーの定理:66A)

群 \(G\) の位数 \(|G|\) が素数 \(p\) を約数にもつとき、\(g^p=e\:\:(g\neq e)\) となる \(G\) の元 \(g\) が存在する。つまり、\(G\) は位数 \(p\) の巡回群を部分群としてもつ。


[証明]

本論に入る前に、証明に使う定義を行う。\(X\) を、元の数が \(N\) の集合とし、そこから重複を許して \(n\)個の元を取り出して1列に並べた順列を考える。このような順列の集合を \(P\) とする。つまり、
 \(P=\{\:(x_1,x_2,\cd,x_n)\:|\:x_i\in X\:\}\)
である。\((x_1,x_2,\cd,x_n)\) は並べる順序に意味がある、いわゆる重複順列で、集合 \(P\) の元の数は、
 \(|P|=N^n\)
である。

\(P\) から自分自身 \(P\) への写像 \(\sg\) を、
 \(\sg\::\:(x_1,x_2,\cd,x_n)\longmapsto(x_n,x_1,x_2,\cd,x_{n-1})\)
と定義する。最後尾の元を先頭に持ってくる "循環写像" である(ここだけの用語)。そうすると、集合 \(P\) の任意の元、\(\bs{a}\) について、
 \(\sg^n(\bs{a})=\bs{a}\)
となり、\(\sg^n=e\) (\(e\::\) 恒等写像)である。

次に、集合 \(P\) のある元を \(\bs{a}\) としたとき、
 \(\sg^d(\bs{a})=\bs{a}\)
となる最小の \(d\:\:(1\leq d\leq n)\) を、"\(\bs{a}\) の循環位数" と定義する(ここだけの用語)。そうすると、循環位数 \(\bs{d}\)\(\bs{n}\) の約数になる。なぜなら、もし
 \(n=kd+r\:\:(1\leq r < d)\)
だとすると、
\(\begin{eqnarray}
&&\:\:\sg^n(\bs{a})&=\sg^{kd+r}(\bs{a})\\
&&&=\sg^r((\sg^d)^k(\bs{a}))\\
&&&=\sg^r(\bs{a})\\
&&\:\:\sg^r(\bs{a})&=\bs{a}\\
\end{eqnarray}\)
となって、\(d\) が \(\sg^d(\bs{a})=\bs{a}\) となる最小の数ではなくなるからである。

循環位数の例をあげると、
\(\begin{eqnarray}
&&\:\:N&=6\\
&&\:\:X&=\{\:1,\:2,\:3,\:4,\:5,\:6\:\}\\
&&\:\:n&=6\\
\end{eqnarray}\)
の場合、
 \(\bs{a}=(1,\:2,\:3,\:4,\:5,\:6)\:\:\rightarrow\:\:d=6\)
 \(\bs{a}=(1,\:2,\:2,\:2,\:2,\:2)\:\:\rightarrow\:\:d=6\)
 \(\bs{a}=(1,\:2,\:3,\:1,\:2,\:3)\:\:\rightarrow\:\:d=3\)
 \(\bs{a}=(1,\:2,\:1,\:2,\:1,\:2)\:\:\rightarrow\:\:d=2\)
 \(\bs{a}=(1,\:1,\:1,\:1,\:1,\:1)\:\:\rightarrow\:\:d=1\)
などである。以上を踏まえて本論に入る。


積が単位元になるような \(G\) の \(p\)個(\(p\):素数)の元の組の集合、
 \(S\:=\:\{\:(x_1,x_2,\cd,x_p)\:\:|\:\:x_i\in G,\:x_1x_2\cd x_p=e\:\}\)
を考える。まず、\(S\) の元の数 \(|S|\) を求める。\(S\) の始めから \(p-1\) 個までの \(x_i\:(1\leq i\leq p-1)\) は、全く任意に選ぶことができる。なぜなら、そうしておいて
 \(x_p=(x_1x_2\cd x_{p-1})^{-1}\)
とすれば、
 \(x_1x_2\cd x_{p-1}x_p\)
  \(=x_1x_2\cd x_{p-1}(x_1x_2\cd x_{p-1})^{-1}\)
  \(=e\)
となり、\(S\) の元になるからである。\(x_i\:(1\leq i\leq p-1)\) の選び方はそのすべてについて \(|G|\) 通りあるから、
 \(|S|=|G|^{p-1}\)
である。

次に、\(S\) の任意の元を \(\bs{a}\) とすると、\(\sg(\bs{a})\) もまた \(S\) の元になる。なぜなら、
 \(\bs{a}=(x_1,x_2,\cd,x_p)\:\:\:(x_i\in G)\)
とおくと、
 \(x_1x_2\cd x_{p-1}x_p=e\)
だが、この式に左から \(x_p\) をかけ、右から \(x_p^{-1}\) をかけると、
 \(x_px_1x_2\cd x_{p-1}x_px_p^{-1}=x_pex_p^{-1}\)
 \(x_px_1x_2\cd x_{p-1}=e\)
となり、これは \(\sg(\bs{a})\in S\) を意味しているからである。

\(S\) のすべての元に循環位数を割り振ると、\(\bs{p}\) が素数なので、循環位数は \(\bs{1}\)\(\bs{p}\) のどちらかである。循環位数が \(1\) である \(S\) の元とは、
 \((\overbrace{x,\:x,\:\cd\:,\:x}^{p\:個})\:\:(x\in G)\)
のように、\(G\) の同じ元を \(p\) 個並べたものである。また、循環位数が \(p\) の元とは、\(p\)個の \(G\) の元に1つでも違うものがあるような \(S\) の元である。

そこで、循環位数 \(p\) の \(S\) の元に着目する。その一つを \(\bs{a}_1\) とすると、
 \(S_1=\{\bs{a}_1,\:\sg(\bs{a}_1),\:\sg^2(\bs{a}_1),\:\cd\:,\sg^{p-1}(\bs{a}_1)\}\)
は、すべて相異なる \(p\) 個 の \(S\) の元である。さらに、\(S_1\) に含まれない循環位数 \(p\) の元を \(\bs{a}_2\) とすると、
 \(S_2=\{\bs{a}_2,\:\sg(\bs{a}_2),\:\sg^2(\bs{a}_2),\:\cd\:,\sg^{p-1}(\bs{a}_2)\}\)
も、すべて相異なる \(p\) 個 の \(S\) の元であり、しかも \(S_1\) とは重複しない。この操作は順々に繰り返せるから、いずれ循環位数 \(p\) の元は \(S_1,\:S_2,\:\cd\) でカバーできることとなる。循環位数 \(p\) の \(S\) の元の全部が、
 \(S_1\:\cup\:S_2\:\cup\:\cd\:\cup\:S_q\)
と表現できたとしたら、その元の数は \(pq\) である。

循環位数 \(1\) の \(S\) の元の数は、\(S\) の元の数から循環位数 \(p\) の元の数を引いたものである。
 \(|S|=|G|^{p-1}\)
だったから、\(p\) が \(|G|\) の約数である、つまり \(|G|\) が \(p\) の倍数であることに注意すると、
 循環位数 \(1\) の元の数
  \(=|G|^{p-1}-pq\equiv0\:\:(\mr{mod}\:p)\)
となる。この、循環位数 \(1\) の元の数は \(0\) ではない。なぜなら、
 \((\overbrace{e,\:e,\:\cd\:,\:e}^{p\:個})\)
は 循環位数が \(1\) の元だからである。つまり、循環位数 \(1\) の元の数は \(p\) 以上の \(p\) の倍数である。従って、\(S\) には \((e,\:e,\:\cd\:,\:e)\) 以外に、
 \((\overbrace{g,\:g,\:\cd\:,\:g}^{p\:個})\:\:\:\:(g\neq e,\:g\in G)\)
が必ず存在する。従って、
 \(g^p=e\:\:(g\neq e)\)
である \(g\) が存在する。この式が成立するということは、\(g\) の位数は \(p\) の約数であるが、\(p\) が素数なので、\(g\) の位数は \(p\) である。従って、
 \(\{\:g,\:g^2,\:\cd\:,g^{p-1},\:g^p=e\:\}\)
は位数 \(p\) の巡回群である。[証明終]

実数解3つの5次方程式は可解ではない
実数解が3つの5次方程式:66B)

\(f(x)\) を既約な5次多項式とする。方程式 \(f(x)=0\) が複素数解を2つ、実数解を3つもつなら、方程式は可解ではない。


[証明]

\(f(x)=0\) の複素数解を \(\al_1,\:\al_2\)、実数解を \(\al_3,\:\al_4,\:\al_5\) とする。また、それらを \(\bs{Q}\) に付加した体を \(\bs{L}=\bs{Q}(\al_1,\al_2,\al_3,\al_4,\al_5)\) とする。また、ガロア群 \(\mr{Gal}(\bs{L}/\bs{Q})\) を \(G\) と書く。

一般に、複素数 \(z=r+is\) が有理数係数の方程式の解なら、\(\ol{\,z\,}=r-is\) も解である。つまり \(z\) と \(\ol{\,z\,}\) は共役(同じ方程式の解同士)である(=共役複素数)。その理由は以下である。

まず、\(z_1\) と \(z_2\) を2つの複素数とすると、
 \(\ol{z_1+z_2}=\ol{z_1}+\ol{z_2}\)
が成り立つ。また、
 \(z_1=r+is\)
 \(z_2=u+iv\)
とすると、
\(\begin{eqnarray}
&&\:\:z_1z_2&=ru-sv+i(su+rv)\\
&&\:\:\ol{z_1}\cdot\ol{z_2}&=(r-is)(u-iv)\\
&&&=ru-sv-i(su+rv)\\
\end{eqnarray}\)
なので、
 \(\ol{z_1z_2}=\ol{z_1}\cdot\ol{z_2}\)
である。有理数係数の方程式を、3次方程式の例で、
 \(x^3+ax^2+bx+c=0\)
とし、\(z\) をこの方程式の解だとすると、
 \(z^3+az^2+bz+c=0\)
 \(\ol{z^3+az^2+bz+c}=\ol{\,0\,}\)
 \(\ol{z^3}+\ol{az^2}+\ol{bz}+\ol{\,c\,}=0\)
 \(\ol{\,z\,}^3+\ol{\,a\,}\ol{\,z\,}^2+\ol{\,b\,}\ol{\,z\,}+c=0\)
 \(\ol{\,z\,}^3+a\ol{\,z\,}^2+b\ol{\,z\,}+c=0\)
となって、\(\ol{\,z\,}\) も方程式の解である。もちろんこれは \(n\)次方程式でも成り立つ。

そこで、\(f(x)=0\) の複素数解 \(\al_1,\:\al_2\) を、
 \(\al_1=a+ib\)
 \(\al_2=a-ib\)
とする。ここで、複素数 \(r+is\) に作用する \(\bs{L}\) の写像を \(\tau\) を、
 \(\tau(r+is)=r-is\)
と定める。そうすると、
 \(\tau(\al_1)=\al_2,\:\tau(\al_2)=\al_1,\)
 \(\tau(\al_3)=\al_3,\:\tau(\al_4)=\al_4,\:\tau(\al_5)=\al_5\)
となり(\(\al_3,\:\al_4,\:\al_5\) は実数なので \(\tau\) で不変)、\(\tau\) は \(f(x)=0\) の2つの解を入れ替えるから \(\bs{L}\) の自己同型写像になり(51E)、すなわち \(G\) の元である。\(\al_1\) を \(1\)、\(\al_2\) を \(2\) と書き、巡回置換の記法を使うと、
 \(\tau=(1,\:2)\)
である。

一方、\(f(x)\) は既約多項式なので単拡大体の基底の定理(33F)により、\(\bs{Q}(\al_1)\) の次元は \(5\)、つまり \([\bs{Q}(\al_1)\::\:\bs{Q}]=5\) である。そうすると、拡大次数の連鎖律33H)により、
 \([\:\bs{L}\::\:\bs{Q}\:]=[\:\bs{L}\::\:\bs{Q}(\al_1)\:][\bs{Q}(\al_1)\::\:\bs{Q}]\)
が成り立つので、\([\:\bs{L}\::\:\bs{Q}\:]\) は \(5\) の倍数である。\(|G|=[\:\bs{L}\::\:\bs{Q}\:]\) なので(52B)、ガロア群 \(G\) の位数は \(5\) を約数にもつ。

そうするとコーシーの定理66A)より、\(G\) の部分群には位数 \(5\) の巡回群がある。それを、
 \(H=\{\:\sg,\:\sg^2,\:\sg^3,\:\sg^4,\:\sg^5=e\:\}\)
とする。5つの解の置換の中で、位数 \(5\) の巡回群を生成する \(\sg\) は、巡回置換の記法で書くと、
 \(\sg_1=(1,\:2\:,3,\:4,\:5)\)
 \(\sg_2=(1,\:3\:,5,\:2,\:4)\)
 \(\sg_3=(1,\:4\:,2,\:5,\:3)\)
 \(\sg_4=(1,\:5\:,4,\:3,\:2)\)
の4つである。これらには、
 \(\sg_1^{\:2}=\sg_2\)
 \(\sg_1^{\:3}=\sg_3\)
 \(\sg_1^{\:4}=\sg_4\)
の関係がある。そこで、\(G\) の中にある位数 \(5\) の巡回群は、
 \(\sg=(1,\:2\:,3,\:4,\:5)\)
だとして一般性を失わない。そうすると、\(G\) の中には、
 \(\tau=(1,\:2)\)
 \(\sg=(1,\:2\:,3,\:4,\:5)\)
の2つの元があることになる。実は、

\(\tau,\:\sg\) から出発して、この2つの元とその逆元の演算を繰り返すことによって、5次対称群 \(\bs{S_5}\) の元が全部作り出せる

のである。それを証明する。

\(G\) は群なので \(\sg^{-1}\) も \(G\) に含まれる(\(\sg\) は位数 \(5\) の巡回群の元なので \(\sg^{-1}=\sg^4\))。まず、\(\sg\tau\sg^{-1}\) を計算してみると、
 \(\sg\tau\sg^{-1}=(1,2,3,4,5)(1,2)(5,4,3,2,1)\)
 \((5,4,3,2,1)\)\(=\left(\begin{array}{c}1&2&3&4&5\\5&1&2&3&4\end{array}\right)\)
 \((1\:2)\)\(=\left(\begin{array}{c}5&1&2&3&4\\5&2&1&3&4\end{array}\right)\)
 \((1,2,3,4,5)\)\(=\left(\begin{array}{c}5&2&1&3&4\\1&3&2&4&5\end{array}\right)\)
なので、
\(\begin{eqnarray}
&&\:\:\sg\tau\sg^{-1}&=\left(\begin{array}{c}1&2&3&4&5\\1&3&2&4&5\end{array}\right)\\
&&&=(2,\:3)\\
\end{eqnarray}\)
となる。同様にして、
 \((5,4,3,2,1)\)\(=\left(\begin{array}{c}1&2&3&4&5\\5&1&2&3&4\end{array}\right)\)
 \((2,\:3)\)\(=\left(\begin{array}{c}5&1&2&3&4\\5&1&3&2&4\end{array}\right)\)
 \((1,2,3,4,5)\)\(=\left(\begin{array}{c}5&1&3&2&4\\1&2&4&3&5\end{array}\right)\)
なので、
\(\begin{eqnarray}
&&\:\:\sg^2\tau\sg^{-2}&=\sg(\sg\tau\sg^{-1})\sg^{-1}\\
&&&=\sg\cdot(2,3)\cdot\sg^{-1}\\
&&&=\left(\begin{array}{c}1&2&3&4&5\\1&2&4&3&5\end{array}\right)\\
&&&=(3,\:4)\\
\end{eqnarray}\)
である。以下、
 \((5,4,3,2,1)\)\(=\left(\begin{array}{c}1&2&3&4&5\\5&1&2&3&4\end{array}\right)\)
 \((3,\:4)\)\(=\left(\begin{array}{c}5&1&2&3&4\\5&1&2&4&3\end{array}\right)\)
 \((1,2,3,4,5)\)\(=\left(\begin{array}{c}5&1&2&4&3\\1&2&3&5&4\end{array}\right)\)
 \(\rightarrow\:\sg^3\tau\sg^{-3}\)\(=\left(\begin{array}{c}1&2&3&4&5\\1&2&3&5&4\end{array}\right)\)
\(=(4,\:5)\)

 \((5,4,3,2,1)\)\(=\left(\begin{array}{c}1&2&3&4&5\\5&1&2&3&4\end{array}\right)\)
 \((4,\:5)\)\(=\left(\begin{array}{c}5&1&2&3&4\\4&1&2&3&5\end{array}\right)\)
 \((1,2,3,4,5)\)\(=\left(\begin{array}{c}4&1&2&3&5\\5&2&3&4&1\end{array}\right)\)
 \(\rightarrow\:\sg^4\tau\sg^{-4}\)\(=\left(\begin{array}{c}1&2&3&4&5\\5&2&3&4&1\end{array}\right)\)
\(=(1,\:5)\)
となる。つまり、
 \((1,\:2)\)、\((2,\:3)\)、\((3,\:4)\)、\((1,\:5)\)
は \(G\) の元である。

一般に、
 \((i,\:j)=(1,\:i)(1,\:j)(1,\:i)\)
である。なぜなら、
\(\begin{eqnarray}
&&\:\:(1,\:i)(1,\:j)(1,\:i)\cdot1&=(1,\:i)(1,\:j)\cdot i\\
&&&=(1,\:i)\cdot i=1\\
&&\:\:(1,\:i)(1,\:j)(1,\:i)\cdot i&=(1,\:i)(1,\:j)\cdot1\\
&&&=(1,\:i)\cdot j=j\\
&&\:\:(1,\:i)(1,\:j)(1,\:i)\cdot j&=(1,\:i)(1,\:j)\cdot j\\
&&&=(1,\:i)\cdot1=i\\
\end{eqnarray}\)
が成り立つからである。従って、
 \((2,\:3)=(1,\:2)(1,\:3)(1,\:2)\)
である。この両辺に左と右から \((1,\:2)\) をかけると、
 \((1,\:2)(2,\:3)(1,\:2)=(1,\:3)\)
となり、\((2,\:3),\:(1,\:2)\) が \(G\) の元なので \((1,\:3)\) も \(G\) の元である。同様に、
 \((3,\:4)=(1,\:3)(1,\:4)(1,\:3)\)
であるが、\((3,\:4),\:(1,\:3)\) が \(G\) の元なので、\((1,\:4)\) も \(G\) の元である。結局、
 \((1,\:2)\)、\((1,\:3)\)、\((1,\:4)\)、\((1,\:5)\)
が \(G\) の元であることが分かった。

\(S_5\) は5文字の置換をすべて集めた集合である。すべての置換は互換の積で表せて(65B)、かつ任意の互換 \((i,\:j)\) は、
 \((i,\:j)=(1,\:i)(1,\:j)(1,\:i)\)
と表せるから、5文字の置換はすべて、
 \((1,\:2)\)、\((1,\:3)\)、\((1,\:4)\)、\((1,\:5)\)
という4つの互換の積で表現できる。つまり、\(S_5\) はこの4つの互換で生成できる。以上をまとめると、

 \((1,\:2)\)、\((1,\:2\:,3,\:4,\:5)\)
  \(\Downarrow\)
 \((1,\:2)\)、\((2,\:3)\)、\((3,\:4)\)、\((1,\:5)\)
  \(\Downarrow\)
 \((1,\:2)\)、\((1,\:3)\)、\((1,\:4)\)、\((1,\:5)\)
  \(\Downarrow\)
 \(S_5\) のすべての元

という、"\(S_5\)を生成する連鎖" の存在が証明できた。従って \(G\cong S_5\) である。\(S_5\) は可解群ではない(65G)。従って、複素数解を2つ、実数解を3つもつ既約な5次方程式は可解ではない。[証明終]


この、実数解が3つの5次方程式の定理(66B)から、可解ではない5次方程式の実例を簡単に構成できます。たとえば、
 \(f(x)=x^5-5x+a\)
とおき、\(f(x)=0\) の方程式を考えます。
 \(f\,'(x)=5x^4-5\)
なので、\(f\,'(x)=0\) の実数解は \(1,\:-1\) の2つです。
 \(f(\phantom{-}1)=a-4\)
 \(f(-1)=a+4\)
なので、
 \(a-4 < 0 < a+4\)
なら、\(f(x)=0\) には3つの実数解があります。この条件は、
 \(-4 < a < 4\)
ですが、\(a=0\) のときは \(f(x)\) は既約多項式ではありません。また \(a=3,\:-3\) のときも、
 \(x^5-5x+3=(x^2+x-1)(x^3-x^2+2x-3)\)
 \(x^5-5x-3=(x^2-x-1)(x^3+x^2+2x+3)\)
と因数分解できるので、既約多項式ではありません。従って、
 \(x^5-5x+2=0\)
 \(x^5-5x+1=0\)
 \(x^5-5x-1=0\)
 \(x^5-5x-2=0\)
が可解ではない5次方程式の例(\(G\cong S_5\))であり、これらの方程式の解を四則演算とべき根で表すのは不可能です。

x^5-5x+1=0.jpg
\(\bs{y=x^5-5x+1}\) のグラフ

方程式 \(x^5-5x+1=0\) の3つの実数解を小さい方から \(\al,\beta,\gamma\) とし、数式処理ソフトそので近似解を求めると、
 \(\al\fallingdotseq-1.5416516841045247594\)
 \(\beta\fallingdotseq\phantom{-}0.2000641026299753912\)
 \(\gamma\fallingdotseq\phantom{-}1.4405003973415600893\)
である。近似解の精度を上げるのはいくらでも可能であり、方程式の形もシンプルだが、これらの解を四則演算とべき根で表すことはできない。グラフと近似解は WolframAlpha による。

「6.可解性の必要条件」終わり 
次回に続く


nice!(0) 

No.356 - 高校数学で理解するガロア理論(3) [科学]

\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{#1}} \newcommand{\ol}[1]{\overline{#1}} \newcommand{\sb}{\subset} \newcommand{\sp}{\supset} \newcommand{\al}{\alpha} \newcommand{\sg}{\sigma}\newcommand{\cd}{\cdots} \newcommand{\fz}{0^{\tiny F}} \newcommand{\kz}{0^{\tiny K}} \newcommand{\fo}{1^{\tiny F}} \newcommand{\ko}{1^{\tiny K}}\)
 
3.多項式と体(続き) 
 


3.3 線形空間


ガロア理論の一つの柱は、代数拡大体を線形空間(ベクトル空間)としてとらえることで、線形空間の「次元」や「基底」を使って理論が組み立てられています。線形空間には精緻な理論体系がありますが、ここではガロア理論に必要な事項の説明をします。

線形空間の定義
線形空間の定義:33A)

集合 \(V\) と 体 \(\bs{K}\) が次を満たすとき、\(V\) を \(\bs{\bs{K}}\) 上の線形空間(=ベクトル空間。linear space / vector space)と言う。

加算の定義

\(V\) の任意の元 \(\br{u},\:\br{v}\) に対して \((\br{u}+\br{v})\in V\) が定義されていて、この加算(\(+)\) の定義に関して \(V\) は可換群である。すなわち、

\((1)\) 単位元の存在
\(\br{u}+\br{x}=\br{x}\) となる \(\br{x}\) が存在する。これを \(0\) と書く。
\((2)\) 逆元の存在
\(\br{u}+\br{x}=0\) となる \(\br{x}\) が存在する。これを \(-\br{u}\) と書く。
\((3)\) 結合則が成り立つ
任意の元 \(\br{u},\:\br{v}\:,\br{w}\) について、\((\br{u}+\br{v})+\br{w}=\br{u}+(\br{v}+\br{w})\)
\((4)\) 交換則が成り立つ
\(\br{u}+\br{v}=\br{v}+\br{u}\)

スカラー倍の定義

\(V\) の任意の元 \(\br{u}\) と \(\bs{K}\) の任意の元 \(k\) に対して、スカラー倍 \(k\br{u}\in V\) が定義されていて、加算との間に次の性質がある。\(\br{u},\:\br{v}\) を \(V\) の元、\(k,\:m\) を \(\bs{K}\) の元とし、\(\bs{K}\) の乗法の単位元を \(1\) とする。

\((1)\:\:k(m\br{u})=(km)\br{u}\)
\((2)\:\:(k+m)\br{u}=k\br{u}+m\br{u}\)
\((3)\:\:k(\br{u}+\br{v})=k\br{u}+k\br{v}\)
\((4)\:\:1\br{v}=\br{v}\)


高校数学に出てくる "2次元ベクトル" とは、上記の定義の \(\bs{K}\) を \(\bs{R}\)(実数の体)とし、\(V\) を2つの実数のペアの集合 \(\{\:(x,y)\:|\:x,y\in\bs{R}\:\}\) とするベクトル空間(の要素)のことです。

上の定義の \(0\) は線形空間 \(V\) の元です。以下、\(V\) の単位元 \(0\)(= \(0\) ベクトル)と、体 \(\bs{K}\) の加法の単位元 \(0\) が混在しますが、文脈や式から明らかなので、同じ \(0\) で記述します。

1次独立と1次従属
1次独立と1次従属:33B)

1次独立

線形空間 \(V\) の元の組、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) に対して、
 \(a_1\br{v}_1+a_2\br{v}_2+\)..\(+a_n\br{v}_n=0\)
を満たす \(\bs{K}\) の元 \(a_1,a_2,\cd,a_n\) が、\(a_1=a_2=\cd=a_n=0\) しかないとき、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) は1次独立であるという。

1次従属

1次独立でないときが1次従属である。つまり、線形空間 \(V\) の元の組、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) に対して、
 \(a_1\br{v}_1+a_2\br{v}_2+\)..\(+a_n\br{v}_n=0\)
を満たす、少なくとも一つは \(0\) でない \(\bs{K}\) の元 \(a_1,a_2,\cd,a_n\) があるとき、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) は1次従属であるという。


基底
基底の定義:33C)

線形空間 \(V\) の元の組、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) に対して、次の2つが満たされるとき、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) を基底という。

・ \({\br{v}_1,\br{v}_2,\cd,\br{v}_n}\) は1次独立である。
・ \(V\) の任意の元 \(\br{v}\) は、\(\bs{K}\) の元 \(a_1,a_2,\cd,a_n\) を選んで、
\(\br{v}=a_1\br{v}_1+a_2\br{v}_2+\)..\(+a_n\br{v}_n\)
と表せる。

基底から1つの元を除外したものは基底ではなくなる。また基底に1つの元を加えたものも基底ではない。


\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) が基底だと、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_{n-1}\}\) は基底ではありません。なぜなら、もし \(\{\br{v}_1,\br{v}_2,\cd,\br{v}_{n-1}\}\) が基底だとすると、
 \(\br{v}_n=a_1\br{v}_1+a_2\br{v}_2+\)..\(+a_{n-1}\br{v}_{n-1}\)
と表せますが、これは、
 \(a_1\br{v}_1+a_2\br{v}_2+\)..\(+a_{n-1}\br{v}_{n-1}-\br{v}_n=0\)
ということであり、\(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) が1次従属となってしまって、基底の要件を満たさなくなるからです。基底に、別の1つの元を加えるケースも同じことです。


基底の数の不変性:33D)

\(\{\br{u}_1,\br{u}_2,\cd,\br{u}_m\}\) と \(\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) がともに線形空間 \(V\) の基底であるとき、\(m=n\) である。


[証明]

この定理の証明のために、まず次の補題を証明する。

[補題]

線形空間 \(V\) の任意の \(n\) 個の元を \(\{\br{u}_1,\br{u}_2,\cd,\br{u}_n\}\) とする(基底でなくてもよい)。線形空間 \(V\) の \(n+1\) 個の元 \(\{\br{w}_1,\br{w}_2,\cd,\br{w}_n,\br{w}_{n+1}\}\) がすべて \(\{\br{u}_1,\br{u}_2,\cd,\br{u}_n\}\) の1次結合で表されるなら、\(\{\br{w}_1,\br{w}_2,\cd,\br{w}_n,\br{w}_{n+1}\}\) は1次従属である。


数学的帰納法を使う。まず、\(n=1\) のとき、この定理は成り立つ。つまり、
 \(\br{w}_1=k_1\br{u}_1\)
 \(\br{w}_2=k_2\br{u}_1\)
と表されるなら、
 \(k_2\br{w}_1-k_1\br{w}_2=0\)
であり、\(\br{w}_1\) と \(\br{w}_2\) は1次従属である。そこで、\(n\) が \(k\:\:(\geq1)\) のときに成り立つとし、\(n=k+1\) でも成り立つことを証明する。

以降、表記を見やすくするため、\(k=3\) の場合で記述する。ただし、一般性を失うことがないように記述する。\(\br{w}_1,\br{w}_2,\br{w}_3,\br{w}_4\) が、
 \(\br{w}_1=a_{11}\br{u}_1+a_{12}\br{u}_2+a_{13}\br{u}_3\)
 \(\br{w}_2=a_{21}\br{u}_1+a_{22}\br{u}_2+a_{23}\br{u}_3\)
 \(\br{w}_3=a_{31}\br{u}_1+a_{32}\br{u}_2+a_{33}\br{u}_3\)
 \(\br{w}_4=a_{41}\br{u}_1+a_{42}\br{u}_2+a_{43}\br{u}_3\)
と表せたとする。ここで \(\br{w}_4\) の係数に注目する。もし、
 \(a_{41}=a_{42}=a_{43}=0\)
であれば、\(\br{w}_1,\br{w}_2,\br{w}_3,\br{w}_4\) は1次従属である。なぜなら、
 \(b_1\br{w}_1+b_2\br{w}_2+b_3\br{w}_3+b_4\br{w}_4=0\)
の式を満たす \(b_1,b_2,b_3,b_4\) は、
 \(b_1=b_2=b_3=0\)
 \(b_4\neq0\)
として実現でき、\(\br{w}_1,\br{w}_2,\br{w}_3,\br{w}_4\) は1次従属の定義を満たすからである。そこで、\(a_{41},a_{42},a_{43}\) のうち \(0\) でないものが少なくとも一つあるとする。それを \(a_{43}\) とし、
 \(a_{43}\neq0\)
とする。この仮定で一般性を失うことはない。ここで、
 \(\br{x}_i=\br{w}_i-\dfrac{a_{i3}}{a_{43}}\br{w}_4\:\:(i=1,2,3)\)
とおいて \(\br{u}_3\) の項を消去する。計算すると、
\(\begin{eqnarray}
&&\:\:\br{x}_1=&\left(a_{11}-\dfrac{a_{13}a_{41}}{a_{43}}\right)\br{u}_1+\left(a_{12}-\dfrac{a_{13}a_{42}}{a_{43}}\right)\br{u}_2\\
&&\:\:\br{x}_2=&\left(a_{21}-\dfrac{a_{23}a_{41}}{a_{43}}\right)\br{u}_1+\left(a_{22}-\dfrac{a_{23}a_{42}}{a_{43}}\right)\br{u}_2\\
&&\:\:\br{x}_3=&\left(a_{31}-\dfrac{a_{33}a_{41}}{a_{43}}\right)\br{u}_1+\left(a_{32}-\dfrac{a_{33}a_{42}}{a_{43}}\right)\br{u}_2\\
\end{eqnarray}\)
となる。そうすると、\(\br{x}_1,\:\br{x}_2,\:\br{x}_3\) は「線形空間 \(V\) の2つの元 \(\br{u}_1,\br{u}_2\) の1次結合で表された3つの元」である。従って、帰納法の仮定により、\(\br{x}_1,\:\br{x}_2,\:\br{x}_3\) は1次従属である。1次従属だから、
 \(b_1\br{x}_1+b_2\br{x}_2+b_3\br{x}_3=0\)
 \((\br{A})\)
となる少なくとも一つは \(0\) ではない \(b_1,\:b_2,\:b_3\) がある。
 \(\br{x}_1=\br{w}_1-\dfrac{a_{13}}{a_{43}}\br{w}_4\)
 \(\br{x}_2=\br{w}_2-\dfrac{a_{23}}{a_{43}}\br{w}_4\)
 \(\br{x}_3=\br{w}_3-\dfrac{a_{33}}{a_{43}}\br{w}_4\)
だったから、これを \((\br{A})\) 式に代入すると、
 \(b_1\br{w}_1+b_2\br{w}_2+b_3\br{w}_3-\)
  \(\dfrac{1}{a_{43}}(b_1a_{13}+b_2a_{23}+b_3a_{33})\br{w}_4=0\)
となる。この式における \(\br{w}_1,\:\br{w}_2,\:\br{w}_3,\:\br{w}_4\) の係数の少なくとも一つは \(0\) ではない。従って、\(a_{41},a_{42},a_{43}\) のうち \(0\) でないものが少なくとも一つある場合にも \(\br{w}_1,\:\br{w}_2,\:\br{w}_3,\:\br{w}_4\) は1次従属である。

以上で、線形空間 \(V\) の \(k=3\) 個の元(\(\br{u}_1,\br{u}_2,\br{u}_3\))の1次結合で、\(k+1=4\) 個の元(\(\br{w}_1,\br{w}_2,\br{w}_3,\br{w}_4\))のすべてが表されば、その4個の元は1次従属であることが証明できた。\(k=3\) としたのは表記を見やすくするためであり、\(k=3\) であることの特殊性は使っていない。つまり、\(k\geq1\) のすべてで成り立つ。従って数学的帰納法により補題が正しいことが証明できた。[補題の証明終]


以上を踏まえて、\(A=\{\br{u}_1,\br{u}_2,\cd,\br{u}_m\}\) と \(B=\{\br{v}_1,\br{v}_2,\cd,\br{v}_n\}\) がともに線形空間 \(V\) の基底であるとき、\(m=n\) となることを証明する。

もし仮に \(m < n\) だとすると、\(B\) の中から \((m+1)\) 個の元を選べる。それを \(B\:'=\{\br{v}_1,\br{v}_2,\cd,\br{v}_{m+1}\}\) とすると、\(A\) は 線形空間 \(V\) の基底だから、\(B\:'\) の元は \(A\) の元の1次結合で表現できる。つまり \(B\:'\) の \((m+1)\)個の元のすべては \(m\)個の元の1次結合で表されるから、[補題]によって \(B\:'\) は1次従属である。\(B\) は \(B\:'\) と同じものか、または \(B\:'\) に数個の元を付け加えたものだから、\(B\:'\) が1次従属なら \(B\) も1次従属である。しかし、\(B\) は線形空間 \(V\) の基底だから1次独立であり、矛盾が生じる。従って、\(m\geq n\) である。

もし仮に \(m > n\) だとしても、全く同様の考察により矛盾が生じる。従って、\(m\leq n\) である。この結果、\(m=n\) であることが証明できた。[証明終]


この基底の数の不変性の定理(33D)により、線形空間には次のように「次元」が定義できることになります。

次元
次元の不変性:33E)

線形空間の基底に含まれる元の数が有限個のとき、その個数を線形空間の次元と言う。次元は基底の取り方によらない。


線形空間の次元や基底と、代数拡大体を結びつけるのが次の定理です。

単拡大体の基底
単拡大体の基底:33F)

\(\bs{Q}\) 上の \(n\)次既約多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の解の一つを \(\al\) とする。単拡大体である \(\bs{Q}(\al)\) は \(\bs{Q}\) 上の \(n\)次元線形空間であり、\(\{1,\:\al,\:\al^2,\:\cd\:,\al^{n-1}\}\) は \(\bs{Q}(\al)\) の基底である。


[証明]

\(\bs{Q}(\al)\) の基底であるための条件は、

① \(\{1,\:\al,\:\al^2,\:\cd\:,\al^{n-1}\}\) が1次独立である
② \(\bs{Q}(\al)\) の任意の元が \(\{1,\:\al,\:\al^2,\:\cd\:,\al^{n-1}\}\) の1次結合で表される

の2つである。② は単拡大の体の定理(32C)で証明されているので、① を証明する。多項式 \(g(x)\) を、

 \(g(x)=a_0+a_1x+a_2x^2+\cd+a_{n-1}x^{n-1}\)

とおく。\(\{1,\:\al,\:\al^2,\:\cd\:,\al^{n-1}\}\) が1次独立であることを言うには、
 \(g(\al)=0\) であれば \(a_i\:\:(0\leq i\leq n-1)\) は全て \(0\)
を言えばよい。以降、背理法を使って証明する。\(g(\al)=0\) で、\(a_i\:\:(0\leq i\leq n-1)\) のうち、少なくとも1つはゼロでないと仮定する。

\(g(x)\) が定数(つまり \(a_0\) の項のみ)のときは、\(g(\al)=0\) なら \(a_0=0\) なので、「少なくとも1つはゼロでない」に反する。そこで \(g(x)\) は1次以上の多項式であるとする。

そうすると、2つの方程式 \(f(x)=0\) と \(g(x)=0\) は共通の解 \(\al\) をもつことになる。しかし、\(f(x)\) は \(n\)次の既約多項式であり、\(g(x)\) は1次以上で \(n\)次未満の多項式である。既約多項式の定理231F)により、このような2つの方程式は共通の解を持たない。ゆえに矛盾が生じる。従って、\(g(\al)=0\) のとき \(a_i\:\:(0\leq i\leq n-1)\) は全て \(0\) であり、① が証明された。

基底の数が線形空間の次元であり、\(\bs{Q}(\al)\) は \(\bs{Q}\) 上の \(n\)次元線形空間である。[証明終]


もし、\(f(x)\) が\(n\)次多項式だとしたら(既約多項式を含む)、\(\bs{Q}(\al)\) の次元は \(n\)以下になります。\(f(x)=0\) の解の一つ、\(\al\) の最小多項式(31H)を \(m\)次多項式である \(g(x)\) とすると、\(g(x)\) は既約多項式であり(31I)、\(\al\) は \(f(x)=0\) と \(g(x)=0\) の共通の解なので、既約多項式の定理131E)により \(f(x)\) は \(g(x)\) で割り切れます。つまり、
 \(f(x)=h(x)g(x)\)
と書けるので、
 \(\mr{deg}\:f(x)\:\geq\:\mr{deg}\:g(x)\)
 \(n\:\geq\:m\)
ですが、単拡大体の基底の定理(33F)により \(\bs{Q}(\al)\) の次元は \(m\) なので、\(n\)以下です。

拡大次数とその連鎖律
方程式の解になる数が代数的数で、\(\bs{Q}\) に代数的数を添加した体が代数拡大体です。「3.2 体」の「単拡大の体」でとりあげた \(\bs{Q}(\al)\) は代数拡大体であり、次元は \(n\) でした(32C)。この次元を「体の拡大」の視点で考えてみます。

「体 \(\bs{K}\) 上の線形空間 \(V\)」の定義において、\(\bs{K}=\bs{Q}\) とし \(V=\bs{Q}\) とすると、「有理数体 \(\bs{Q}\) は、\(\bs{Q}\) 上の線形空間」であると言えます。\(\bs{Q}\) では加算もスカラー倍(=乗算)も定義されていて、可換だからです。線形空間の定義にある各種の演算は、体の演算の一部です。

線形空間 \(\bs{Q}\) の基底は、\(0\) ではない \(\bs{Q}\) の元 \(v\) です。\(0\) を含む \(\bs{Q}\) の任意の元を \(a\) とすると、
 \(av=0\:\:\:(v\neq0)\)
が成り立つのは \(a=0\) しかないので \(v\) は1次独立であり、また \(av\) で全ての \(\bs{Q}\) の元が表されるからです。一方、\(0\) は、
 \(a\cdot0=0\)
が \(0\) ではない \(a\) について成り立つので1次従属です。以上から、線形空間 \(\bs{Q}\) の基底として \(1\) を選ぶことにします。次元は \(1\) です。

\(\bs{Q}\) に \(\sqrt{2}\) を添加した \(\bs{Q}(\sqrt{2})\) は \(\bs{Q}\) の代数拡大体で、\(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\) です。\(\bs{Q}(\sqrt{2})\) は \(\bs{\bs{Q}}\) 上の線形空間です。\(\bs{Q}(\sqrt{2})\) の基底としては、まず \(1\) を選ぶことができます。\(1\) を \(\bs{Q}\) の元でスカラー倍すると、\(\bs{Q}(\sqrt{2})\) の部分集合である \(\bs{Q}\) の元の全てが表せます。

\(\bs{Q}(\sqrt{2})\) の元の全てを表現するためには、さらに基底に \(\sqrt{2}\) を追加します。\(\sqrt{2}\) は \(\bs{Q}\) の元の1次結合では表せないので、\(1\) と \(\sqrt{2}\) は 1次独立です。\(1,\:\sqrt{2}\) が \(\bs{Q}(\sqrt{2})\) の基底で、次元は \(2\) です。

さらに \(\bs{Q}(\sqrt{2})\) に \(\sqrt{3}\) を添加した代数拡大体 \(\bs{Q}(\sqrt{2},\sqrt{3})\) を考えてみると、\(\bs{Q}(\sqrt{2},\sqrt{3})\) は \(\bs{\bs{Q}(\sqrt{2})}\) 上の線形空間であり、基底は \(1,\:\sqrt{3}\) です。\(1\) と \(\sqrt{3}\) は 1次独立であり、\(\bs{\bs{Q}(\sqrt{2},\sqrt{3})}\) の全ての元は、\(\bs{\bs{Q}(\sqrt{2})}\) の元を係数とする \(\bs{1}\)\(\bs{\sqrt{3}}\) の1次結合で表現できるからです。\(\bs{\bs{Q}(\sqrt{2})}\) 上の線形空間 \(\bs{\bs{Q}(\sqrt{2},\sqrt{3})}\) の次元は \(\bs{2}\) です。

ここで \(\bs{Q}(\sqrt{2},\sqrt{3})\) を \(\bs{\bs{Q}}\) 上の線形空間と考えると、その基底はまず、\(1,\:\sqrt{2},\:\sqrt{3}\) ですが、これだけでは不足で、\(\sqrt{6}\) を加える必要があります。\(\sqrt{6}\) は体としての演算(乗算)でできる数ですが、\(1,\:\sqrt{2},\:\sqrt{3}\) の1次結合では表現できないからです。\(\bs{Q}\) 上の線形空間 \(\bs{Q}(\sqrt{2},\sqrt{3})\) の基底は \(1,\:\sqrt{2},\:\sqrt{3},\:\sqrt{6}\) であり、次元は \(4\) です。

ここまでの基底の表現はあくまで一例ですが、どういう基底を選ぼうと基底の数=次元は不変量であるというのが「次元の不変性」でした。以上の考察を踏まえて、拡大次数を定義し、拡大次数の連鎖律を証明します。


拡大次数の定義:33G)

代数拡大体 \(\bs{F},\:\bs{K}\) が \(\bs{F}\:\subset\:\bs{K}\) であるとき、\(\bs{K}\) は \(\bs{F}\) 上の線形空間である。\(\bs{K}\) の次元を、\(\bs{K}\)の(\(\bs{F}\)からの)拡大次数といい、
 \([\:\bs{K}\::\:\bs{F}\:]\)
で表す。



拡大次数の連鎖律:33H)

代数拡大体 \(\bs{F},\:\bs{M},\:\bs{K}\) が \(\bs{F}\:\subset\:\bs{M}\:\subset\:\bs{K}\) であるとき、
 \([\:\bs{K}\::\:\bs{F}\:]=[\:\bs{K}\::\:\bs{M}\:][\:\bs{M}\::\:\bs{F}\:]\)
が成り立つ。


[証明]

\([\:\bs{M}\::\:\bs{F}\:]=m\)、\([\:\bs{K}\::\:\bs{M}\:]=n\) とする。以下、表記を見やすくするため、\(m=3,\:n=2\) の場合で記述する。もちろん一般性を失わないように記述する。

\(\bs{F}\) 上の線形空間 \(\bs{M}\) の基底を
 \(u_1,\:u_2,\:u_3\)
とすると、\(\bs{M}\) の任意の元 \(b\) は、
 \(b=a_1u_1+a_2u_2+a_3u_3\:\:(a_i\in\bs{F},\:u_i\in\bs{M},\:1\leq i\leq m)\)
と表せる。

\(\bs{M}\) 上の線形空間 \(\bs{K}\) の基底を
 \(v_1,\:v_2\)
とすると、\(\bs{K}\) の任意の元 \(x\) は、
 \(x=b_1v_1+b_2v_2\:\:(b_j\in\bs{M},\:v_j\in\bs{K},\:1\leq j\leq n)\)
と表せる。\(b_1,\:b_2\) を \(\bs{M}\) の基底 \(u_1,u_2,u_3\) で表すと、
 \(b_1=a_{11}u_1+a_{21}u_2+a_{31}u_3\)
 \(b_2=a_{12}u_1+a_{22}u_2+a_{32}u_3\)
  \((\:a_{ij}\in\bs{F}\:)\)
となるが、これを用いて \(x\) を表すと、
\(\begin{eqnarray}
&&\:\:x=&a_{11}u_1v_1+a_{21}u_2v_1+a_{31}u_3v_1+\\
&&&a_{12}u_1v_2+a_{22}u_2v_2+a_{32}u_3v_2\\
\end{eqnarray}\)
となる。つまり、\(\bs{K}\) の任意の元は \(\bs{F}\) の元を係数とする、\(u_1v_1\)、\(u_2v_1\)、\(u_3v_1\)、\(u_1v_2\)、\(u_2v_2\)、\(u_3v_2\) の1次結合で表現できる。

ここで \(x=0\) とすると、
 \((a_{11}u_1+a_{21}u_2+a_{31}u_3)v_1+\)
 \((a_{12}u_1+a_{22}u_2+a_{32}u_3)v_2=0\)
であるが、\(v_1,v_2\) は \(\bs{K}\) の基底なので1次独立であり、従って、
 \(a_{11}u_1+a_{21}u_2+a_{31}u_3=0\)
 \(a_{12}u_1+a_{22}u_2+a_{32}u_3=0\)
である。すると、\(u_1,u_2,u_3\) は \(\bs{M}\) の基底なので1次独立であり、
 \(a_{11}=a_{21}=a_{31}=a_{12}=a_{22}=a_{32}=0\)
である。従って、\(u_iv_j\:\:(1\leq i\leq m,\:1\leq j\leq n)\) は1次独立である。

\(u_iv_j\:\:(1\leq i\leq m,\:1\leq j\leq n)\) の \(mn\) 個の元は、
① 1次独立
②  \(\bs{F}\) の元を係数とする1次結合で \(\bs{K}\) の元のすべてを表せる
から、\(\bs{F}\) 上の線形空間 \(\bs{K}\) の基底であり、\(\bs{K}\) の次元は \(mn\) である。以上により、
 \([\:\bs{K}\::\:\bs{F}\:]=[\:\bs{K}\::\:\bs{M}\:][\:\bs{M}\::\:\bs{F}\:]\)
である。[証明終]

体の一致
2つの代数拡大体 \(\bs{F}\) と \(\bs{K}\) の次元が一致するとします。たとえば \(\bs{Q}(\sqrt{2})\) と \(\bs{Q}(\sqrt{3})\) の次元はいずれも \(2\) です。もちろん \(\bs{Q}(\sqrt{2})\) と \(\bs{Q}(\sqrt{3})\) は体として別物です。

それでは、\(\bs{F}\subset\bs{K}\) という関係があり、かつ \(\bs{F}\) と \(\bs{K}\) の次元が一致するとき、\(\bs{F}\) と \(\bs{K}\) は体として一致すると言えるのでしょうか。

これはイエスで、それを次に証明します。この定理は、ガロア理論の証明の過程において、2つの体が実は同じものであることを言うときに使われる論法です。証明の都合上、\(\bs{F}\) ではなく \(\bs{K}_0\) と書きます。


体の一致:33I)

体 \(\bs{K}_0\) と 体 \(\bs{K}\) があり、\(\bs{K}_0\:\subset\:\bs{K}\) を満たしている。\(\bs{K}_0\) と \(\bs{K}\) が有限次元であり、その次元が同じであれば、\(\bs{K}_0=\bs{K}\) である。


[証明]

体 \(\bs{K}_0\) と \(\bs{K}\) を、\(\bs{Q}\) 上の線形空間と見なし、その次元を \(n\) とする。\(\bs{K}_0\) の基底を \(\{a_1,\:a_2,\:\cd\:,a_n\}\) とする。\(\bs{K}_0\) が \(\bs{K}\) の真部分集合である、つまり \(\bs{K}_0\:\subsetneq\:\bs{K}\) と仮定して、背理法で証明する。

\(\bs{K}_0\:\subsetneq\:\bs{K}\) だと、\(a_{n+1}\notin\bs{K}_0,\:a_{n+1}\in\bs{K}\) である元 \(a_{n+1}\) が存在する。この \(a_{n+1}\) は \(\{a_1,\:a_2,\:\cd\:,a_n\}\) の1次結合では表せない。なぜなら、もし表せたとしたら、\(\bs{K}_0\) の全ての元は基底である \(\{a_1,\:a_2,\:\cd\:,a_n\}\) の1次結合で表されるので \(a_{n+1}\in\bs{K}_0\) になってしまうからである。

そこで、\(\{a_1,\:a_2,\:\cd\:,a_n,\:a_{n+1}\}\) を考えると、この元の並びは1次独立である。なぜなら、もし1次従属だとすると、
 \(a_1x_1+a_2x_2+\cd+a_nx_n+a_{n+1}x_{n+1}=0\)
となる \(x_i\in\bs{Q}\:\:(1\leq i\leq n+1)\) があって、そのうち少なくとも一つは \(0\) ではない。もし \(x_{n+1}\neq0\) だとすると、\(a_{n+1}\) が \(\{a_1,\:a_2,\:\cd\:,a_n\}\) の1次結合で表されることになり、\(a_{n+1}\in\bs{K}_0\) となって矛盾が生じる。また \(x_{n+1}=0\) だとすると、
 \(a_1x_1+a_2x_2+\cd+a_nx_n=0\)
であるが、この場合は \(x_i\:\:(1\leq i\leq n)\) の中に少なくとも一つは \(0\) でないものがあることになり、\(\{a_1,\:a_2,\:\cd\:,a_n\}\) が基底である(=1次独立である)ことに矛盾する。従って \(\{a_1,\:a_2,\:\cd\:,a_n,\:a_{n+1}\}\) は1次独立である。

\(\{a_1,\:a_2,\:\cd\:,a_n,\:a_{n+1}\}\) の1次結合で表される全ての元の集合を \(\bs{K}_1\) とする。\(\{a_1,\:a_2,\:\cd\:,a_n,\:a_{n+1}\}\) はすべて \(\bs{K}\) の元であるから、\(\bs{K}_1\:\subset\:\bs{K}\) である。また \(\bs{K}_1\) の任意の元は1次独立である \(\{a_1,\:a_2,\:\cd\:,a_n,\:a_{n+1}\}\) の1次結合で表されるから、\(\{a_1,\:a_2,\:\cd\:,a_n,\:a_{n+1}\}\) は \(\bs{K}_1\) の基底であり、すなわち \(\bs{K}_1\) の次元は \(n+1\) である。\(\bs{K}_1=\bs{K}\) なら \(\bs{K}\) の次元が \(n+1\) になって矛盾するから、\(\bs{K}_1\neq\bs{K}\) つまり \(\bs{K}_1\:\subsetneq\:\bs{K}\) である。

以上の論理を繰り返すと \(\bs{K}_2\:\subsetneq\:\bs{K}\) である \(n+2\) 次元の \(\bs{K}_2\) の存在を示せるが、この操作は無限に繰り返えせるから、\(\bs{K}\) は無限個の基底をもつ無限次元の体となる。これは \(\bs{K}\) の次元が有限次元の \(n\) であることに矛盾する。従って背理法の仮定は誤りであり、\(\bs{K}_0\:=\:\bs{K}\) である。[証明終]

代数拡大体の構造
多項式と代数拡大体の相互関係をまとめると次のようになります。


① 体 \(\bs{Q}\) 上の\(\bs{n}\)次多項式 \(f(x)\) が(複素数の範囲で)
 \(f(x)=(x-\al_1)(x-\al_2)\cd(x-\al_n)\)
と因数分解できるとき、
 \(\bs{Q}(\al_1,\:\:\al_2,\:\:\cd\:\:,\:\:\al_n)\)
を \(f(x)\) の最小分解体と言う(32A)。つまり、\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解のすべてを \(\bs{Q}\) に添加した体が最小分解体である。

② すべての代数拡大体は単拡大体である(32B)。従って最小分解体も単拡大体である。つまり原始元 \(\theta\) があって、\(\bs{Q}(\theta)\) と表せる。

③ \(\theta\) の最小多項式を \(\bs{m}\)多項式の \(g(x)\) とすると、\(g(x)\) は既約多項式である(31I)。

④ 方程式 \(g(x)=0\) の解の一つが \(\theta\) であるから、
 \(1,\:\:\theta,\:\:\theta^2,\:\:\cd,\:\:\theta^{m-1}\)
の \(m\)個の元は \(\bs{Q}(\theta)\) の基底である(33F)。つまり \(\bs{Q}(\theta)\) は \(m\)次元である。従って、\(\bs{Q}(\al_1,\:\al_2,\:\cd\:,\:\al_n)\) も \(m\)次元である。


以下、例をいくつかあげます。

 \(x^4-5x^2+6\) 

\(f(x)\) を4次多項式、
 \(f(x)=x^4-5x^2+6\)
とします。\(f(x)\) は、
 \(f(x)=(x^2-2)(x^2-3)\)
と因数分解できるので既約多項式ではありません。また、
 \(f(x)=(x-\sqrt{2})(x+\sqrt{2})(x-\sqrt{3})(x+\sqrt{3})\)
なので、\(f(x)\) の最小分解体は、
 \(\bs{Q}(\sqrt{2},\sqrt{3})\)
です。\(\bs{Q}(\sqrt{2},\:\sqrt{3})\) は、\(\bs{Q}\) 上の方程式 \(x^2-2=0\) の解 \(\sqrt{2}\) による拡大体を \(\bs{Q}(\sqrt{2})\) とし、\(\bs{Q}(\sqrt{2})\) 上の方程式 \(x^2-3=0\) の解 \(\sqrt{3}\) による拡大体が \(\bs{Q}(\sqrt{2},\:\sqrt{3})\) であると見なせます。つまり、
 \(\bs{Q}\:\subset\:\bs{Q}(\sqrt{2})\:\subset\:\bs{Q}(\sqrt{2},\sqrt{3})\)
です。拡大次数は
 \([\:\bs{Q}(\sqrt{2}):\bs{Q}\:]=2\)
 \([\:\bs{Q}(\sqrt{2},\sqrt{3}):\bs{Q}(\sqrt{2})\:]=2\)
 \([\:\bs{Q}(\sqrt{2},\sqrt{3}):\bs{Q}\:]=4\)
です。\(\bs{Q}\) 上の線形空間 \(\bs{Q}(\sqrt{2},\sqrt{3})\) の基底は、
\(\begin{eqnarray}
&&\:\:B_1&=(\:1,\:\sqrt{2},\:1\cdot\sqrt{3},\:\sqrt{2}\cdot\sqrt{3}\:)\\
&&&=(\:1,\:\sqrt{2},\:\sqrt{3},\:\sqrt{6}\:)\\
\end{eqnarray}\)
とすることができます。

一方、
 \(\theta=\sqrt{2}+\sqrt{3}\)
とおくと、
 \(\bs{Q}(\theta)=\bs{Q}(\sqrt{2},\sqrt{3})\)
となります。なぜなら、
 \(\sqrt{2}=\dfrac{1}{2}(\theta-\dfrac{1}{\theta})\)
 \(\sqrt{3}=\dfrac{1}{2}(\theta+\dfrac{1}{\theta})\)
であり、\(\sqrt{2}\) と \(\sqrt{3}\) が \(\theta\) と有理数の加減乗除で表現できるからです。\(\bs{Q}(\sqrt{2},\sqrt{3})\) は \(\bs{Q}(\sqrt{2}+\sqrt{3})\) という単拡大体です。

\(\theta=\sqrt{2}+\sqrt{3}\) から根号を消去すると、
 \(\theta^4-10\theta^2+1=0\)
となるので、\(\theta\)の最小多項式は、
 \(g(x)=x^4-10x^2+1\)
であり、この \(g(x)\) は既約多項式です。\(y=x^2-5\) とおくと、
\(\begin{eqnarray}
&&\:\:g(x)&=y^2-24\\
&&&=(y-2\sqrt{6})(y+2\sqrt{6})\\
\end{eqnarray}\)
なので、
\(\begin{eqnarray}
&&\:\:g(x)&=&(x^2-5-2\sqrt{6})(x^2-5+2\sqrt{6})\\
&&&=&(x-\sqrt{2}-\sqrt{3})(x+\sqrt{2}-\sqrt{3})\cdot\\
&&&& (x-\sqrt{2}+\sqrt{3})(x+\sqrt{2}+\sqrt{3})\\
\end{eqnarray}\)
となり、\(g(x)=0\) の解は、\(\sqrt{2}+\sqrt{3}\)、\(-\sqrt{2}+\sqrt{3}\)、\(\sqrt{2}-\sqrt{3}\)、\(-\sqrt{2}-\sqrt{3}\) の4つです。その \(g(x)=0\) の解の一つが \(\theta=\sqrt{2}+\sqrt{3}\) なので、単拡大体の基底の定理(33F)を適用して、\(\bs{Q}(\theta)\) の基底を、
 \(B_2=(\:1,\:\:\theta,\:\:\theta^2,\:\:\theta^3\:)\)
の4個に選ぶことができます。拡大次数は \([\:\bs{Q}(\theta):\bs{Q}\:]=4\) です。

\(B_1\) と \(B_2\) は、同じ体である \(\bs{Q}(\theta)=\bs{Q}(\sqrt{2},\sqrt{3})\) の基底なので、相互に1次結合で表現できます。\(B_2\) の1次結合で \(B_1\) を表現すると、
 \(\sqrt{2}=\dfrac{1}{2}(\phantom{-}\theta^3-9\theta)\)
 \(\sqrt{3}=\dfrac{1}{2}(-\theta^3+11\theta)\)
 \(\sqrt{6}=\dfrac{1}{2}(\phantom{-}\theta^2-5)\)
となります。

 \(x^3-2\) 

\(f(x)\) を3次多項式、
 \(f(x)=x^3-2\)
とします。これは既約多項式です。

\(x^3-1=0\) 解で \(1\) でないもの一つを \(\omega\) とします(= \(1\) の原始\(3\)乗根)。
 \(x^3-1=(x-1)(x^2+x+1)\)
なので \(\omega\) は、
 \(\omega^2+\omega+1=0\)
を満たします。この2次方程式の解は2つありますが、
 \(\omega=\dfrac{-1+\sqrt{3}\:i}{2}\)
とします。方程式 \(x^3-2=0\) の解は、
 \(\sqrt[3]{2},\:\:\sqrt[3]{2}\omega,\:\:\sqrt[3]{2}\omega^2\)
の3つです、従って、\(f(x)\) の最小分解体は、
 \(\bs{Q}(\sqrt[3]{2},\:\sqrt[3]{2}\omega,\:\sqrt[3]{2}\omega^2)=\bs{Q}(\sqrt[3]{2},\:\omega)\)
です。これは、
 \(\bs{Q}\:\subset\:\bs{Q}(\sqrt[3]{2})\:\subset\:\bs{Q}(\sqrt[3]{2},\:\omega)\)
という構造をしています。基底は、単拡大体の基底の定理(33F)を順次適用して、
 \(\bs{Q}(\sqrt[3]{2})\) の基底(\(\bs{Q}\) 上の線形空間)
  \(1,\:\sqrt[3]{2},\:(\sqrt[3]{2})^2\)
 \(\bs{Q}(\sqrt[3]{2},\:\omega)\) の基底(\(\bs{Q}(\sqrt[3]{2})\) 上の線形空間\()\)
  \(1,\:\omega\)
です。これらを総合すると、
 \(\bs{Q}(\sqrt[3]{2},\:\omega)\) の基底(\(\bs{Q}\) 上の線形空間\()\)
  \(1,\) \(\sqrt[3]{2},\) \((\sqrt[3]{2})^2,\)
  \(\omega,\) \(\sqrt[3]{2}\omega,\) \((\sqrt[3]{2})^2\omega\)
です。拡大次数は
 \([\:\bs{Q}(\sqrt[3]{2}):\bs{Q}\:]=3\)
 \([\:\bs{Q}(\sqrt[3]{2},\:\omega):\bs{Q}(\sqrt[3]{2})\:]=2\)
 \([\:\bs{Q}(\sqrt[3]{2},\:\omega):\bs{Q}\:]=6\)
となります。

\(\bs{Q}(\sqrt[3]{2},\:\omega)\) の原始元 \(\theta\) を、
 \(\theta=\sqrt[3]{2}+\omega\)
と選ぶことができます。なぜなら、計算は省きますが、
 \(\sqrt[3]{2}\)\(=\dfrac{1}{9}(\)\(2\theta^5+3\theta^4+6\theta^3-6\theta^2+9\theta\)\(+18)\)
 \(\omega\)\(=\dfrac{1}{9}(-\)\(2\theta^5-3\theta^4-6\theta^3+6\theta^2\)\(-18)\)
と表せるので、\(\bs{Q}\) に \(\sqrt[3]{2},\:\omega\) を添加した拡大体は \(\theta\) を添加した拡大体と同じものでからです。さらに、
 \(\theta=\sqrt[3]{2}+\dfrac{-1+\sqrt{3}\:i}{2}\)
の式を2乗や3乗して \(i\) と根号を消去すると、計算過程は省きますが、
 \(\theta^6+3\theta^5+6\theta^4+3\theta^3+9\theta+9=0\)
となります。従って、\(\theta\) の最小多項式を \(g(x)\) とすると、
 \(g(x)=x^6+3x^5+6x^4+3x^3+9x+9\)
という6次多項式です。\(\bs{Q}(\sqrt[3]{2},\:\omega)\) は 6次方程式 \(g(x)=0\) の根の一つである \(\theta\) を使って、
 \(\bs{Q}(\sqrt[3]{2},\:\omega)=\bs{Q}(\theta)\)
という単拡大体(次元は \(6\))と表現できます。

 \(x^3-3x+1\) 

1.3 ガロア群」の「ガロア群の例」で書いたように、\(x^3-3x+1=0\) の解を \(\al,\:\beta,\:\gamma\) とすると、
 \(\beta=\al^2-2\)
 \(\gamma=\beta^2-2\)
 \(\al=\gamma^2-2\)
の関係があり、\(\al,\:\beta,\:\gamma\) のどれか一つの加減乗除で他の2つが表現できます。これにより、\(f(x)=x^3-3x+1\) の最小分解体は、
 \(\bs{Q}(\al,\beta,\gamma)=\bs{Q}(\al)=\bs{Q}(\beta)=\bs{Q}(\gamma)\)
です。基底は、たとえば \(1,\:\al,\:\al^2\) であり、
 \([\:\bs{Q}(\al,\beta,\gamma):\bs{Q}\:]=3\)
です。\(\al\) の最小多項式は、3次多項式である \(f(x)=x^3-3x+1\) です。


ちなみに、3次多項式の最小分解体の次元が \(3\) になる条件を書いておきます。まず、2次方程式の例ですが、
 \(x^2+ax+b=0\)
の方程式の解を \(\al,\:\beta\) とすると、
 \(x^2+ax+b=(x-\al)(x-\beta)\)
です。そうすると、根と係数の関係から、
 \(a=-(\al+\beta)\)
 \(b=\al\beta\)
です。ここで、判別式 \(\bs{D}\) を、
 \(D=(\al-\beta)^2\)
と定義すると、
\(\begin{eqnarray}
&&\:\:D=&\al^2-2\al\beta+\beta^2\\
&&&=(\al+\beta)^2-4\al\beta\\
&&&=a^2-4b\\
\end{eqnarray}\)
となります。この判別式を使って解の状況がわかります。つまり、
\(\cdot D\:\geq\:0\) なら2つの実数解(重根は2と数える)
\(\cdot D\:\geq\:0\) で \(\sqrt{D}\) が有理数なら、2つの有理数解
をもちます。

以上を3次方程式に拡張できます。2乗の項がない既約な3次方程式を、
 \(x^3+ax+b=0\)
とし、3つの根を \(\al,\:\beta,\:\gamma\) とすると、
 \(x^3+ax+b=(x-\al)(x-\beta)(x-\gamma)\)
 \((\br{A})\)
  \(\al+\beta+\gamma=0\)
 \((\br{B})\)
  \(\al\beta+\beta\gamma+\gamma\al=a\)
  \(\al\beta\gamma=-b\)
となります。3次方程式の判別式 \(D\) は、
 \(D=(\al-\beta)^2(\beta-\gamma)^2(\gamma-\al)^2\)
で定義されます。計算すると、
 \(D=-4a^3-27b^2\)
となります。

ここで、\(D\) が、ある有理数 \(q\) の2乗の場合を考えます。つまり、
 \(D=q^2\)
です。そうすると、
 \(q=(\al-\beta)(\beta-\gamma)(\gamma-\al)\)
 \((\br{C})\)
です(\(-q\) でも成り立ちますが割愛します)。

\((\br{A})\) 式の両辺を \(x\) で微分して \(x=\al\) を代入すると、
 \(3\al^2+a=(\al-\beta)(\al-\gamma)\)
 \((\br{D})\)
が得られます。\((\br{C})\) 式と \((\br{D})\) 式の両辺同士を割り算すると、
 \(\dfrac{q}{3\al^2+a}=-(\beta-\gamma)\)
 \((\br{E})\)
となります。そうすると、\((\br{B})\) 式と \((\br{E})\) 式を用いて、\(\beta\) と \(\gamma\) を \(\al\) の式として表現できます。その結果は、
 \(\beta=\dfrac{2a\al+3b-q}{2(3\al^2+a)}\)
 \(\gamma=\dfrac{2a\al+3b+q}{2(3\al^2+a)}\)
です。式の形はともかく、要するに、
 \(\beta\) と \(\gamma\) が \(\al\) の加減乗除で表現できる
わけです。このことは、
 \(\bs{Q}(\al,\beta,\gamma)=\bs{Q}(\al)\)
であることを意味します。\(\bs{Q}(\al,\beta,\gamma)\) は、既約な3次方程式の根の一つである \(\al\) の単拡大体なので、その次元は \(3\) です。

まとめると、判別式 \(D\) が有理数の2乗であるとき、既約 \(3\)次多項式の最小分解体の次元が \(3\) になります。\(x^3-3x+1\) の場合、\(a=-3,\:b=1\) なので、
 \(D=-4a^3-27b^2=81=9^2\)
となり、次元が \(3\) です。


既約多項式ではない3次多項式の拡大次数はもっと小さくなります。たとえば \((x-1)(x^2+2)\) の最小分解体は \(\bs{Q}(\sqrt{2}\:i)\) であり、拡大次数は \(2\) です。また \((x-2)^3\) の最小分解体は \(\bs{Q}\) そのもので、拡大次数は \(1\) です。

まとめると、3次多項式 \(f(x)\) の最小分解体の拡大次数は、\(f(x)=0\) の解を \(\al,\:\beta,\:\gamma\) とすると、
 \([\:\bs{Q}(\al,\beta,\gamma):\bs{Q}\:]\:=\:6,\:3,\:2,\:1\)
の4種あることになります(この4種しかないことの理由は後の章にあります)。

 
4.一般の群 
 

ガロア理論の核心(第5章以降)に入る前の最後として、群についての各種の定義や定理を説明します。これらはいずれも第5章以降で必要になります。


4.1 部分群\(\cdot\)正規部分群、剰余類\(\cdot\)剰余群


部分集合の演算
以降の証明では集合の演算が多々出てきます。その定義は次の通りでです。これはあくまで群の "部分集合" に関するもので、それが部分群かどうかは別問題です。


部分集合の演算:41A)

群 \(G\) の2つの部分集合を \(H,\:N\) とする。\(H\) と \(N\) の演算結果である \(G\) の部分集合、\(HN\) を次の式で定義する。

 \(HN\:=\:\{\:hn\:|\:h\in H,\:n\in N,\:hn\) は群の演算定義による \(\}\)

群 \(G\) の元の演算では結合則が成り立つから、部分集合の演算でも結合則が成り立つ。つまり \(H_1,\:H_2,\:H_3\) をを3つの部分群とすると、
 
 \((H_1H_2)H_3=H_1(H_2H_3)\)

である。部分集合の元は \(1\)つでもよいから、\(x\) が \(G\) の元で \(x\) だけの部分集合を \(\{x\}\) とすると、
 \(H_1(\{x\}H_2)=(H_1\{x\})H_2\)
である。これを、
 \(H_1(xH_2)=(H_1x)H_2\)
と記述する。


部分群の定理
部分群に関する定理をいくつかあげます。これらはいずれも後の定理の証明の過程で使います。

 部分群の十分条件 

部分群の十分条件:41B)

群 \(G\) の部分集合を \(N\) とし、\(N\) の任意の2つの元を \(x,\:y\) とする。

 \(xy\in N,\:x^{-1}\in N\)

なら、\(N\) は \(G\) の部分群である。


[証明]

\(N\) の元 \(x,\:y\) は \(G\) の元でもあるので、\(xy,\:x^{-1},\:y^{-1}\) は \(G\) の演算として定義されている。

\(y=x^{-1}\) とおくと \(xy=xx^{-1}=e\in N\) なので、\(N\) は単位元を含む。つまり、\(N\) は演算で閉じていて、単位元が存在し、逆元が \(N\) の元である。また結合則は \(G\) の元として成り立っている。従って \(N\) は \(G\) の部分群である。[証明終]

 部分群の元の条件 

部分群の元の条件:41C)

群 \(G\) の部分群を \(N\) とし、\(G\) の 元を \(x\) とすると、次の2つは同値である。

 ① \(xN\:=\:N\)
 ② \(x\:\in\:N\)


[証明]

[① \(\bs{\Rightarrow}\) ②]
\(N\) には \(G\) の単位元 \(e\) が含まれるから、\(xe\) は \(xN\) に含まれる。
 \(x=xe\in xN=N\) \(\Rightarrow\) \(x\in N\)
である。

[② \(\bs{\Rightarrow}\) ①]
\(x\in N\) とし、\(N\) の任意の元を \(a\) とすると、\(N\) は群だから \(xa\in\:N\) である。\(N\) の異なる2つの元を \(a,\:b\:\:(a\neq b)\) とすると、\(xa\neq xb\) である。なぜなら、もし \(xa=xb\) だとすると、\(x\) の逆元 \(x^{-1}\) を左からかけて \(a=b\) となり、矛盾するからである。以上により、\(xH\) は \(H\) の全ての元を含むから \(xH=H\) である。[証明終]

 部分群の共通部分 

部分群の共通部分は部分群:41D)

\(G\) の部分群を \(H,\:N\) とすると、\(H\cap N\) は部分群である。


[証明]

\(G\) の部分群を \(H,\:N\) とし、\(H\cap N\) の任意の2つの元を \(x,\:y\) とすると、\(x,\:y\in H,\:\:x,\:y\in N\) なので、
 \(xy\in H,\:x^{-1}\in H\)
 \(xy\in N,\:x^{-1}\in N\)
であり、
 \(xy\in H\cap N,\:x^{-1}\in H\cap N\)
となって、部分群の十分条件の定理(41B)により \(H\cap N\) は部分群である。[証明終]

剰余類
剰余類の定義:41E)

有限群 \(G\) の位数を \(n\) とし( \(|G|=n\) )、\(H\) を \(G\) の部分群とする。\(H\) に左から \(G\) のすべての元、\(g_1,\:g_2,\:\cd\:,\:g_n\) かけて、集合、
 \(g_1H,\:g_2H,\:\cd\:,g_nH\)
を作る。

\(g_1H,\:g_2H,\:\cd\:,g_nH\) から、同じになる集合を集めたものを剰余類と呼ぶ。その同じになる集合から代表的なものを一つ取り出し、
 \(xH\:\:(x\in G)\)
の形で剰余類を表す。\(g_1H,\:g_2H,\:\cd\:,g_nH\) から剰余類が \(d\) 個できたとし、それらを、
 \(x_1H,\:x_2H,\:\cd\:,x_dH\)
とすると、
 \(i\neq j\) のとき \(x_iH\:\cap\:x_jH=\phi\)
 \(G=x_1H\:\cup\:x_2H\:\cup\:\cd\:\cup\:x_dH\)
である。剰余類は、群 \(G\) の元を部分群 \(H\) によって分類したものといえる。

\(x_1H,\:x_2H,\:\cd\:,x_dH\) を「左剰余類」という。同じことが \(G\) の元を右からかけたときにも成り立ち、\(Hx_1{}^{\prime},\:Hx_2{}^{\prime},\:\cd\:,Hx_d\,'\) を「右剰余類」という。

群 \(G\) の 部分群 \(H\) による剰余類の個数 \(d\) について、\(d\cdot|H|=|G|\) が成り立つ。この \(d\) を「\(G\) の \(H\) による指数」といい、\([\:G\::\:H\:]\) で表す。つまり、
 \(|G|=[\:G\::\:H\:]\cdot|H|\)
である(ラグランジュの定理)。


[証明]

\(|G|=[\:G\::\:H\:]\cdot|H|\) であることを証明する。2つの剰余類 \(x_1H\) と \(x_2H\) が共通の元をもつとする。その共通な元が、\(x_1H\) では \(x_1h_i\)、\(x_2H\) では \(x_2h_j\) と表されているものとする。
 \(x_1h_i=x_2h_j\)
左から \(x_2^{-1}\)、右から \(h_i^{-1}\) をかけると、
 \(x_2^{-1}x_1h_ih_i^{-1}=x_2^{-1}x_2h_jh_i^{-1}\)
 \(x_2^{-1}x_1=h_jh_i^{-1}\)
\(h_jh_i^{-1}\in H\) だから、
 \(x_2^{-1}x_1\in H\)
を得る。部分群の元の条件の定理(41C)により、\(xH=H\) と \(x\in H\) は同値だから、
 \(x_2^{-1}x_1H=H\)
となる。左から \(x_2\) をかけると、
 \(x_1H=x_2H\)
を得る。これは、「2つの剰余類 \(x_1H\) と \(x_2H\) が共通の元をもつとすると、2つの剰余類は一致する」ことを示している。従って、

2つの剰余類 \(x_1H\) と \(x_2H\) は、\(x_1H=x_2H\) か \(x_1H\cap x_2H=\phi\) のどちらか

である。\(H\) は 単位元 \(e\) を含むから、
 \(g_1H\:\cup\:g_2H\:\cup\:\cd\:\cup\:g_nH\)
という和集合を作ると、そこには \(G\) のすべての元が含まれる。従って、
 \(G=g_1H\:\cup\:g_2H\:\cup\:\cd\:\cup\:g_nH\)
である。剰余類 \(x_1H,\:x_2H,\:\cd\:x_dH\) は、\(g_1H,\:g_2H,\:\cd\:,g_nH\) を整理・分類したものだから、
 \(G=x_1H\:\cup\:x_2H\:\cup\:\cd\:\cup\:x_dH\)
である。この式の右辺の剰余類は共通の元がなく、それぞれの剰余類の元の数はすべて \(|H|\) だから、
 \(|G|=d\cdot|H|\)
である。従ってラグランジュの定理
 \(|G|=[\:G\::\:H\:]\cdot|H|\)
が成り立つ。[証明終]


ラグランジュの定理から、

群 \(G\) の元 \(g\) の位数(\(g^x=e\) となる最小の \(x\))を \(n\) とすると、\(n\) は群位数 \(|G|\) の約数である。

ことがわかります。なぜなら、

 \(H=\{e,\:g,\:g^2,\:\cd\:,\:g^{n-1}\}\)

とおくと、\(H\) は \(G\) の部分群(巡回群)になり、ラグランジュの定理によって \(|H|=n\) が \(|G|\) の約数になるからです。これは、位数の定理25A)の[補題5]

既約剰余類群 \((\bs{Z}/n\bs{Z})^{*}\) の元を \(a\) とし、\(a\) の位数を \(d\) とすると、\(d\) は 群位数 の約数である。

の一般化になっています。 \((\bs{Z}/n\bs{Z})^{*}\) の群位数は \(\varphi(n)\)(\(\varphi\)はオイラー関数)なので、ラグランジュの定理はオイラーの定理やフェルマの小定理(25B)の一般化であるとも言えます。さらに、

群位数が素数の群は巡回群である。

こともわかります。なぜなら、群 \(G\) の位数を \(p\)(素数)とすると、単位元ではない \(G\) の任意の元 \(g\:(\neq e)\) の位数は \(p\) であり、つまり \(G\) は \(g\) を生成元とする位数 \(p\) の巡回群(\(C_p\))だからです。


次の「正規部分群」はガロア理論のキモといえる概念です。これは純粋に群の属性として定義できるのでここにあげますが、ガロア理論の核心である第5章以降で展開される論証の多くは正規部分群に関係しています。

正規部分群
正規部分群の定義:41F)

有限群 \(G\) の部分群を \(H\) とする。\(G\) の全ての元 \(g\) について、

 \(gH=Hg\)

が成り立つとき、\(H\) を \(G\) の正規部分群(normal subgroup)という。正規部分群では左剰余類と右剰余類が一致する。

定義により、\(G\) および \(\{e\}\) は \(G\) の正規部分群である。また \(G\) が可換群であると、その部分群は正規部分群である。巡回群は可換群だから、巡回群の部分群は正規部分群である。


正規部分群 \(H\) の定義は、\(G\) の任意の元 \(g\) に対して、
 \(gHg^{-1}=H\)
となる \(H\)、としても同じです。また 任意の \(h\in H\) について、
 \(ghg^{-1}\in H\)
となる \(H\)、としても同じです。

剰余群
剰余群の定義:41G)

有限群 \(G\) の正規部分群を \(H\) とする。\(G\) の \(H\) による剰余類

 \(x_1H,\:x_2H,\:\cd\:,x_dH\:\:(\:x_i\in G,\:d=[\:G\::\:H\:]\:)\)

部分集合の演算の定義(41A)で群になる。この群を \(G\) の \(H\) による剰余群(quotient group)といい、\(G/H\) で表す。剰余群は商群とも言う。


[証明]

\(H\) が正規部分群のとき、剰余類が群になることを証明する。\(x_iH\) は \(G\) の剰余類なので、

 \(G=x_1H\cup x_2H\cup\cd\cup x_dH\)
   \((i\neq j\:のとき\:x_iH\cap x_jH=\phi)\)

と表されている。2つの剰余類、\(x_iH,\:x_jH\) の演算を行うと、
\(\begin{eqnarray}
&&\:\:(x_iH)(x_jH)&=x_iHx_jH=x_i(Hx_j)H\\
&&&=x_i(x_jH)H=x_ix_jHH\\
&&&=x_ix_j(HH)=x_ix_jH\\
\end{eqnarray}\)
つまり、
\(\begin{eqnarray}
&&\:\:(x_iH)(x_jH)&=x_ix_jH\\
\end{eqnarray}\)
となる。\(H\) は正規部分群なので \(Hx_j=x_jH\) であることと、\(H\) は部分群なので \(HH=H\) であることを用いた。

\(x_ix_j\) は \(G\) の元だから、\(x_ix_jH\) は \(G\) の剰余類のうちの一つである。従って \((x_iH)(x_jH)\) の演算は \(G\) の剰余類の中で閉じている。また、
 \((x_iH\cdot x_jH)\cdot x_kH=x_ix_jH\cdot x_kH=x_ix_jx_kH\)
 \(x_iH\cdot(x_jH\cdot x_kH)=x_iH\cdot x_jx_kH=x_ix_jx_kH\)
 \((x_iH\cdot x_jH)\cdot x_kH=x_iH\cdot(x_jH\cdot x_kH)\)
であるから、結合法則が成り立っている。さらに、
 \(H\cdot xh=eH\cdot xH=(ex)H=xH\)
 \(xH\cdot H=xH\cdot eH=(xe)H=xH\)
なので、剰余類 \(H\) が単位元になる。また、
 \(xH\cdot x^{-1}H=(xx^{-1})H=eH=H\)
 \(x^{-1}H\cdot xH=(x^{-1}x)H=eH=H\)
であり、\(xH\) に対する逆元は \(x^{-1}H\) である。従って剰余類 \(G/H\) は群である。[証明終]


群の位数、元の位数、ラグランジュの定理、巡回群は、いずれも有限群の概念や定理です。しかし、剰余類、正規部分群、剰余群は、元の数が無限であっても成り立つ概念です。たとえば、整数の加法群 \(\bs{Z}\) は可換群なので、すべての部分群は正規部分群です。従って、\(n\) の倍数から成る部分群を \(n\bs{Z}\) とすると、\(\bs{Z}/n\bs{Z}\) は剰余群です。\(\bs{Z}/n\bs{Z}\) という表記は \(n\bs{Z}\) が \(\bs{Z}\) の正規部分群であることが暗黙の前提なのでした。


巡回群の剰余群は巡回群:41H)

巡回群の部分群による剰余群は巡回群である。


[証明]

群 \(G\) を、位数 \(n\)、生成元 \(g\) の巡回群とし、その元を、

 \(G\:=\:\{g,\:g^2,\:g^3,\:\cd,\:g^n=e\:\}\)

とする。\(G\) の部分群を \(H\) とし、\(H\) の元のうち \(g\) の指数が一番小さいものを \(g^{d}\:\:(1\leq d\leq n)\) とする。\(d=1\) なら \(H=G\) であり、また \(d=n\) なら \(H=\{\:e\:\}\) である。

\(n\) を \(d\) で割った商を \(q\)、余りを \(r\) とする。つまり、
 \(n=qd+r\:\:(1\leq q\leq n,\:0\leq r < d)\)
とする。\(g^d\) は \(H\) の元だから その \(q\) 乗も \(H\) の元であり、
 \((g^d)^q=g^{dq}\in H\)
である。また \(g^{dq}\) の逆元も \(H\) に含まれるから
 \((g^{dq})^{-1}\in H\)
である。仮にもし \(1\leq r < d\) なら
 \(g^{dq}g^{r}=g^{qd+r}=g^n=e\)
となるので、この式に左から \((g^{dq})^{-1}\) をかけると、
 \(g^r=(g^{dq})^{-1}\in H\)
となり、\(d\) 未満の数 \(r\) が指数の \(g^r\) が \(H\) の元ということになるが、これは \(d\) が最小の指数であるという仮定に反する。従って \(r=0\) であり、\(qd=n\) である。つまり \(d\) と \(q\) は \(n\) の約数である。そうすると \(g^d\) を \(q\) 乗すると \(g^{dq}=g^n=e\) となるので、\(H\) は \(g^d\) を生成元とする位数 \(q\) の巡回群、
 \(H=\{\:g^{d},\:g^{2d},\:\cd,\:g^{qd}=g^n=e\:\}\)
 \((\br{A})\)
である。また、\(G\) は巡回群、つまり可換群だから、その部分群である \(H\) は \(G\) の正規部分群である。


次に、剰余類 \(g^kH\:\:(1\leq k\leq n)\) を考える。\(k\) を \(d\) で割った商を \(m\)、余りを \(i\) とする。\(qd=n\) なので \(m\) の最大値は \(q\) であり、
 \(k=md+i\) \((0\leq m\leq q,\:0\leq i < d)\)
と表現できる。以下、\(m,\:i\) の値によって3つに分ける。

\(k=i\:\:(m=0,\:1\leq i < d)\) のときは、\(H\) が単位元を含んでいるので、
 \(g^k=g^i\in g^iH\)
である。

\(m\neq0,\:1\leq i < d\) のときは、
 \(g^k=g^{md+i}=g^ig^{md}\)
となるが、\((\br{A})\) 式により、
 \(g^{md}\in H\:\:(1\leq m\leq q)\)
なので、
 \(g^ig^{md}\in g^iH\)
 \(g^k\in g^iH\:\:(1\leq i < d)\)
となる。

また、\(m\neq0,\:i=0\) のときは、
 \(g^k=g^{md}\in H\)
である。

結局、\(G\) の元 \(g^k\) は、\(\{\:H,\:g^iH\:\:(1\leq i < d)\:\}\) のどれかに含まれる。ここで、形式上 \(g^0H\:=\:H\) と定義すると、\(H,\:g^iH\) は、
 \(g^iH\:=\:\{\:g^{i+md}\:|\:0\leq i < d,\:\:0\leq m\leq q\:\}\)
と表記できる。\(0\leq i,j < d,\:\:0\leq m_i,m_j\leq q\) で、\(i\neq j\) なら、
 \(i+m_id\neq j+m_jd\)
なので、\(g^iH\) と \(g^jH\) に共通の元はなく、
 \(g^iH\:\cap\:g^jH=\phi\:\:(i\neq j)\)
である。

以上より、巡回群 \(G\) は剰余類によって、
 \(G=H\:\cup\:gH\:\cup\:g^2H\:\cup\:\cd\:\cup\:g^{d-1}\)
 \(g^iH\:\cap\:g^jH=\phi\) \((i\neq j)\)
と分解できる。

\(H\) は \(G\) の正規部分群であった。従って \(G\) の \(H\) による剰余類は剰余群になり、
 \(G/H=\{\:H,\:gH,\:g^2H,\:\cd\:,g^{d-1}H\:\}\)
である。ここで \(gH\) の累乗を調べると、
 \((gH)^2=gHgH=ggHH=g^2H\)
 \((gH)^3=gHgHgH=g^2HgH=g^2gHH=g^3H\)
のように計算でき、
 \((gH)^i=g^iH\) \((1\leq i\leq d-1)\)
である。また、同じ計算によって、
 \((gH)^d=g^dH\)
となるが、\(g^d\in H\) なので部分群の元の条件の定理(41C)により \(g^dH=H\) であり、つまり、
 \((gH)^d=H\)
である。

以上により 剰余群 \(G/H\) は、
 \(G/H=\{gH,\:(gH)^2,\:\cd\:,(gH)^{d-1},\:(gH)^{d}=H\}\)
と表され、生成元が \(gH\)、単位元が \(H\)、位数が \(d\) の巡回群である。[証明終]

部分群と正規部分群
部分群と正規部分群:41I)

\(G\) の正規部分群を \(H\)、部分群を \(N\) とする。このとき、

(a) \(NH\) は \(G\) の部分群である。
(b) \(G\:\sp\:N\:\sp\:H\) なら、\(H\) は \(N\) の正規部分群である。
(c) \(N\cap H\) は \(N\) の正規部分群である。

が成り立つ。


(a) の証明
\(G\) の正規部分群を \(H\)、 部分群を \(N\) とするとき、\(NH\) は部分群である。

\(NH\) の任意の2つの元を
 \(nx\:\:(n\in N,\:x\in H),\:\:my\:\:(m\in N,\:y\in H)\)
とすると、
 \(nx\in nH,\:my\in mH\)
である。\(H\) は正規部分群だから、\(mH=Hm\) であることを用いると、
 \((nx)(my)\in(nH)(mH)=nHmH=nmHH=nmH\)
となる。\(n,m\in N\) なので \(nm\in N\) であり、従って \(nmH\subset NH\) である。結局、
 \((nx)(my)\in NH\)
となって、\(NH\) の2つの元の演算は \(NH\) で閉じていることが分かる(=\(\:\br{①}\:\))。

また一般に、\((xy)^{-1}=y^{-1}x^{-1}\) である。なぜなら、
 \(xy(y^{-1}x^{-1})=x(yy^{-1})x^{-1}=xex^{-1}=xx^{-1}=e\)
 \((y^{-1}x^{-1})xy=y^{-1}(x^{-1}x)y=y^{-1}ey=y^{-1}y=e\)
が成り立つからである。

\(G\) の部分群 \(N\) と正規部分群 \(H\) において、\(n\in N,\:x\in H\) とすると、\(n^{-1}\in N,\:x^{-1}\in H\) なので、
 \((nx)^{-1}=x^{-1}n^{-1}\in Hn^{-1}\)
となるが、\(H\) が正規部分群なので、\(Hn^{-1}=n^{-1}H\)である。さらに、\(n^{-1}H\subset NH\) なので、結局、
 \((nx)^{-1}\subset NH\)
となり、\(NH\) の任意の元 \(nx\) について逆元 \((nx)^{-1}\) が \(NH\) に含まれる(=\(\:\br{②}\:\))。

\(\br{①}\:\:\br{②}\) が成り立つので、部分群の十分条件の定理(41B)によって \(NH\) は \(G\) の部分群である。[証明終]

(b) の証明
\(G\) の正規部分群を \(H\)、部分群を \(N\) とするとき、\(G\:\sp\:N\:\sp\:H\) なら、\(H\) は \(N\) の正規部分群である。

\(H\) は \(G\) の正規部分群だから、\(G\) の任意の元 \(x\) について
 \(xH=Hx\)
が成り立つ。\(N\) は \(G\) の 部分集合だから、\(N\) の任意の元 \(y\) についても、
 \(yH=Hy\)
が成り立つ。従って \(H\) は \(N\) の正規部分群である。[証明終]

(c) の証明
\(G\) の正規部分群を \(H\)、 部分群を \(N\) とするとき、\(N\cap H\) は \(N\) の正規部分群である。

\(H\) は \(G\) の正規部分群だから、\(G\) の任意の元 \(x\) について
 \(xH=Hx\)
が成り立つ。この式に右から \(x^{-1}\) をかけると、
 \(xHx^{-1}=H\)
となる。これは、\(H\) の任意の元 \(h\) を決めると、\(G\) の任意の元 \(x\) について、
 \(xhx^{-1}\in H\)
となることを意味する。これは \(H\) が正規部分群であることの定義と等価である。以降、この形で \(N\cap H\) が正規部分群であることを証明する。

部分群 \(N\) の任意の元を \(y\)、正規部分群 \(H\) の任意の元を \(h\)、\(N\cap H\) の任意の元を \(n\) とする。\(y,\:y^{-1},\:n\) は全て \(N\) の元だから、
 \(yny^{-1}\in N\)
である(=\(\:\br{①}\:\))。また \(H\) は \(G\) の正規部分群であるから、\(G\) の任意の元 \(x\) について、
 \(xhx^{-1}\in H\)
が成り立つ。ここで、\(G\:\sp\:N\) なので \(x=y\) とおくことができ、また \(H\:\sp\:N\cap H\) なので \(h=n\) とおくこともできる。従って、
 \(yny^{-1}\in H\)
である(=\(\:\br{②}\:\))。\(\br{①}\:\:\br{②}\) より、\(N\cap H\) の任意の元 \(n\) を決めると、\(N\) の全ての元 \(y\) について、
 \(yny^{-1}\in N\cap H\)
となる。つまり \(N\cap H\) は \(N\) の正規部分群である。[証明終]


4.2 準同型写像


この節の写像の説明には「全射」「単射」「全単射」などの用語ができてます。その用語の意味は次の図の通りです。

写像.jpg
全射:\(G\,'\)の任意の元 \(y\) について \(f(x)=y\) となる \(x\in G\) がある。 単射:\(x\neq y\:(x,y\in G)\) なら \(f(x)\neq f(y)\)。 全単射:全射かつ単射。

準同型写像と同型写像
準同型写像と同型写像:42A)

群 \(G\) から群 \(G\,'\) への写像 \(f\) がある。\(G\) の任意の2つの元、\(x,\:y\) について、

 \(f(xy)=f(x)f(y)\)

が成り立つとき、\(f\) を \(G\) から \(G\,'\) への準同型写像(homomorphism)という。右辺は群 \(G\,'\) の演算定義に従う。

また、\(f\) が全単射写像のとき、\(f\) を同型写像(isomorphism)という。群 \(G\) から \(G\,'\) への同型写像が存在するとき、\(G\) と \(G\,'\) は同型であるといい、
 \(G\:\cong\:G\,'\)
で表す。


準同型写像の像と核
準同型写像の像と核:42B)

群 \(G\) から群 \(G\,'\) への準同型写像 \(f\) がある。\(G\) の元を \(f\) で移した元の集合を「\(f\) の像(image)」といい、\(\mr{Im}\:f\) と書く。\(\mr{Im}\:f\) を \(f(G)\) と書くこともある。

\(\mr{Im}\:f\) は \(G\,'\) の部分群である。

\(G\) の単位元を \(e\)、\(G\,'\) の単位元を \(e\,'\) とする。準同型写像 \(f\) によって \(e\,'\) に移る \(G\) の元の集合を「\(f\) の核(kernel)」といい、\(\mr{Ker}\:f\) と書く。

\(\mr{Ker}\:f\) は \(G\) の部分群である。


準同型写像.jpg

[証明]

\(\mr{Im}\:f\) と \(\mr{Ker}\:f\) が群であることを証明する。

 \(\mr{Im}\:f\) は群 

\(\mr{Im}\:f\) の任意の2つの元を \(f(x),f(y)\:\:(x,y\in G)\) とすると、
 \(f(x)f(y)=f(xy)\:\in\mr{Im}\:f\)
である(=\(\:\br{①}\:\))。

\(\mr{Im}\:f\) の任意の元 \(f(x)\) について、
 \(f(e)f(x)=f(ex)=f(x)\)
 \(f(x)f(e)=f(xe)=f(x)\)
なので、
 \(f(e)=e\,'\)
である。\(G\) は群なので、任意の元 \(x\) について逆元 \(x^{-1}\) が存在する。
 \(f(x)f(x^{-1})=f(xx^{-1})=f(e)=e\,'\)
 \(f(x^{-1})f(x)=f(x^{-1}x)=f(e)=e\,'\)
であるから、
 \(f(x)^{-1}=f(x^{-1})\:\in\mr{Im}\:f\)
である(=\(\:\br{②}\:\))。\(\br{①}\:\:\br{②}\) より、部分群の十分条件の定理(41B)によって \(\mr{Im}\:f\) は \(G\,'\) の部分群である。

 \(\mr{Ker}\:f\) は群 

\(\mr{Ker}\:f\) の任意の元を \(x,\:y\) とすると、
 \(f(xy)=f(x)f(y)=e\,'e\,'=e\,'\)
なので、
 \(xy\:\in\mr{Ker}\:f\)
である(\(\:\br{③}\:\))。

また \(x\) は \(G\) の元だから \(x^{-1}\) が定義されている。
\(\begin{eqnarray}
&&\:\:f(x^{-1})&=f(x^{-1})e\,'=f(x^{-1})f(x)\\
&&&=f(x^{-1}x)=f(e)\\
&&&=e\,'\\
\end{eqnarray}\)
となるので、
 \(x^{-1}\:\in\mr{Ker}\:f\)
である(\(\:\br{④}\:\))。\(\br{③}\:\:\br{④}\) より、部分群の十分条件の定理(41B)によって \(\mr{Ker}\:f\) は \(G\) の部分群である。[証明終]

核が単位元なら単射
核が単位元なら単射:42C)

群 \(G\) から群 \(G\,'\) への準同型写像 \(f\) がある。このとき

 \(\mr{Im}\:f\) \(=\:G\,'\) なら \(f\) は全射
 \(\mr{Ker}\:f\) \(=\:\{e\}\) なら \(f\) は単射

である。


[証明]

"\(f\) は全射" については、全射の定義そのものである。

\(\mr{Ker}\:f\:=\:\{e\}\) とし、\(G\) の任意の2つの元を \(x,\:y\) とする。ここで、
 \(f(x)=f(y)\)
であったとする。\(\mr{Im}\:f\) は群だから \(f(y)^{-1}\in\:\mr{Im}\:f\) である。上の式に左から \(f(y)^{-1}\) をかけると、
 \(f(y)^{-1}f(x)=f(y)^{-1}f(y)\)
 \(f(y^{-1})f(x)=e\,'\)
 \(f(y^{-1}x)\in\:\mr{Ker}\:f\)
 \(y^{-1}x=e\)
 \(x=y\)
となる。\(f(x)=f(y)\) であれば \(x=y\) なので、\(f\) は単射である。[証明終]

核は正規部分群
核は正規部分群:42D)

群 \(G\) から群 \(G\,'\) への準同型写像を \(f\) とする。このとき \(\mr{Ker}\:f\) は \(G\) の正規部分群である。


[証明]

\(\mr{Ker}\:f\) を \(H\) と記述する。\(G\) の 任意の元を \(x\) とし、\(H\) の任意の元を \(y\) とする。すると、
\(\begin{eqnarray}
&&\:\:f(xyx^{-1})&=f(x)f(y)f(x^{-1})\\
&&&=f(x)e\,'f(x^{-1})=f(x)f(x^{-1})\\
&&&=f(xx^{-1})=f(e)=e\,'\\
\end{eqnarray}\)
と計算できるから、
 \(xyx^{-1}\in H\)
である。\(y\) は \(H\) の任意の元だから、
 \(xHx^{-1}\subset H\)
である。\(x\) は任意にとることができるので、\(x\) を \(x^{-1}\) に置き換えると、
 \(x^{-1}Hx\subset H\)
を得る。この式に左から \(x\)、右から \(x^{-1}\) をかけると、
 \(H\subset xHx^{-1}\)
となる。つまり
 \(H\subset xHx^{-1}\subset H\)
 \(xHx^{-1}=H\)
である。さらに右から \(x\) をかけると、
 \(xH=Hx\)
となり、\(x\) は任意の \(G\) の元だから、\(H\:\:(=\mr{Ker}\:f)\) は \(G\) の正規部分群である。[証明終]


4.3 同型定理


準同型定理=第1同型定理
準同型定理:43A)

群 \(G\) から群 \(G\,'\) への準同型写像 \(f\) がある。\(H=\mr{Ker}\:f\) とすると、\(G\) の \(H\) による剰余群は、\(G\) の \(f\) による像と同型である。つまり、

 \(G/H\:\cong\:\mr{Im}\:f\)

が成り立つ。


[証明]

\(H\:=\:\mr{Ker}\:f\) は、核は正規部分群の定理(42D)により、\(G\) の正規部分群である。従って剰余群 \(G/H\) が定義できる。\(G/H\) から \(\mr{Im}\:f\) への写像 \(\sg\) を、

\(\begin{eqnarray}
&&\:\:\sg\:: &G/H &\longrightarrow&\mr{Im}\:f\\
&&&xH &\longmapsto&f(x)\\
\end{eqnarray}\)

と定義する。まず、この写像が剰余類 \(xN\) の代表元 \(x\) のとりかたに依存しないこと、つまり \(xH=yH\) なら \(f(x)=f(y)\) であることを示す。\(xH=yH\) を変形すると、
 \(xH=yH\)
 \(y^{-1}xH=y^{-1}yH\)
 \(y^{-1}xH=H\)
ゆえに部分群の元の条件の定理(41C)から \(y^{-1}x\in H\) である。そうすると、\(H\) は \(\mr{Ker}\:f\) のことだから、\(f(y^{-1}x)=e\,'\) である。これを変形すると、
 \(f(y^{-1}x)=e\,'\)
 \(f(y^{-1})f(x)=e\,'\)
 \(f(y)^{-1}f(x)=e\,'\)
となる。最後の変形では、準同型写像の像と核の定理(42B)の「\(\mr{Im}\:f\) は群」の証明から、\(f(y^{-1})=f(y)^{-1}\) であることを用いた。ここから、
 \(f(y)^{-1}f(x)=e\,'\)
 \(f(y)f(y)^{-1}f(x)=f(y)e\,'\)
 \(f(x)=f(y)\)
となり、\(f(x)=f(y)\) が証明できた。

以上の変形は逆も辿れる。つまり、
 \(f(x)=f(y)\)
 \(f(y)f(y)^{-1}f(x)=f(y)e\,'\)
 \(f(y)^{-1}f(x)=e\,'\)
 \(f(y^{-1})f(x)=e\,'\)
 \(f(y^{-1}x)=e\,'\)
 \(f(y^{-1}x)\in H\)
 \(y^{-1}xH=H\)
 \(xH=yH\)
となる。これは \(f(x)=f(y)\) なら \(xH=yH\) であることを示していて、すなわち \(\sg\) は単射である。と同時に、\(\sg\) による写像の先は \(\mr{Im}\:f\) に限定しているので \(\sg\) は全射である。つまり \(\sg\) は 全単射である(=\(\:\br{①}\:\))。

さらに、
\(\begin{eqnarray}
&&\:\:\sg((xH)(yH))&=\sg(x(Hy)H)=\sg(x(yH)H)\\
&&&=\sg(xyH)=f(xy)=f(x)f(y)\\
&&&=\sg(xH)\sg(yH)\\
\end{eqnarray}\)
であり、つまり \(\sg((xH)(yH))=\sg(xH)\sg(yH)\) が成り立っている(=\(\:\br{②}\:\))。

\(\br{①}\:\:\br{②}\) により \(\sg\) は同型写像である。\(G/H\) から \(\mr{Im}\:f\) への同型写像が存在するから、
 \(G/H\:\cong\:\mr{Im}\:f\)
である。[証明終]

第2同型定理
第2同型定理:43B)

群 \(G\) の正規部分群を \(H\)、部分群を \(N\) とすると、

 \(N/(N\cap H)\:\cong\:NH/H\)

が成り立つ。


第2同型定理.jpg

[証明]

まず、部分群と正規部分群の定理(41I)により、\(G\) の正規部分群が \(H\)、部分群が \(N\) の場合、
・ \(N\cap H\) は \(N\) の正規部分群
・ \(NH\) は \(G\) の部分群
・ \(G\:\sp\:NH\:\sp\:H\) なので、\(H\) は \(NH\) の正規部分群
である。従って剰余群の定義(41G)により、\(N/(N\cap H)\) および \(NH/H\) は剰余群となる。

\(G\) の任意の元を \(x,\:y\) とし、\(G\) から \(G/H\) への写像 \(\sg\) を、
\(\begin{eqnarray}
&&\:\:\sg\:: &G &\longrightarrow&G/H\\
&&&x &\longmapsto&xH\\
\end{eqnarray}\)
と定義する。この写像は、
\(\begin{eqnarray}
&&\:\:\sg(xy)&=xyH=xyHH=xHyH=(xH)(yH)\\
&&&=\sg(x)\sg(y)\\
\end{eqnarray}\)
を満たすから準同型写像である(ちなみに \(G\) とその正規部分群 \(H\) があるとき、上記の定義による \(\sg\) を自然準同型と呼ぶ)。

\(\sg\) の定義域は \(G\) であるが、\(\sg\) の定義域を \(G\) の部分群である \(N\) に制限した写像 \(\tau\)(タウ) を考える。\(N\) の任意の元を \(z\) とすると、
\(\begin{eqnarray}
&&\:\:\tau\:: &N &\longrightarrow&G/H\\
&&&z &\longmapsto&zH\\
\end{eqnarray}\)
である。この \(\tau\) の像 \(\mr{Im}\:\tau\) を考えてみると、\(z\) が \(N\) の元のすべてを動くとき、\(\tau(z)=zH\) として出てくる \(G\) の元は \(NH\) の元である。つまり \(\tau\) は、
\(\begin{eqnarray}
&&\:\:\tau\:: &N &\longrightarrow&G/H\\
\end{eqnarray}\)
として定義したが、\(\tau(z)\) が \(G/H\) の全てを尽くすわけではなく、全射ではない。写像による移り先は、\(G\) の部分群 \(NH\) を \(H\) で分類した剰余群、\(NH/H\) である。つまり \(\tau(N)=NH/H\) であり、
 \(\mr{Im}\:\tau=NH/H\)
である。

次に準同型写像の核を考える。\(G/H\) の単位元は、
 \(xH\cdot H=xH\)
 \(H\cdot xH=HxH=xHH=xH\)
なので、\(H\) である。

\(G\) の元 \(x\) が \(\mr{Ker}\:\sg\) の元とする。つまり、
 \(x\in\mr{Ker}\:\sg\)
とする。これは \(\sg(x)\) が \(G/H\) の単位元になるということだから、
 \(\sg(x)=H\)
であり、\(\sg(x)=xH\) なので、
 \(xH=H\)
である。これは部分群の元の条件の定理(41C)によって、
 \(x\in H\)
と同値である。従って、
 \(x\in\mr{Ker}\:\sg\)
 \(x\in H\)
の2つは同値であり、つまり、
 \(\mr{Ker}\:\sg=H\)
である。

\(\tau\) は \(\sg\) の定義域を \(N\) に制限したものなので、\(\mr{Ker}\:\tau\) は「\(\mr{Ker}\:\sg=H\) のうちで \(N\) に含まれるもの」であり、すなわち、
 \(\mr{Ker}\:\tau=(N\cap H)\)
である。

ここで、\(\tau\) の定義である、
\(\begin{eqnarray}
&&\:\:\tau\:: &N &\longrightarrow&G/H\\
\end{eqnarray}\)
準同型定理43A)を適用すると、
\(\begin{eqnarray}
&&\:\:N/(\mr{Ker}\:\tau) &\cong\:\mr{Im}\:\tau\\
&&\:\:N/(N\cap H) &\cong\:NH/H\\
\end{eqnarray}\)
となって、題意が成り立つ。[証明終]


第2同型定理を整数の剰余群で確認してみます。上の定理における \(G,\:H,\:N\) を、
 \(G=\bs{Z}\)
 \(H=10\bs{Z}\) (\(10\) の倍数)
 \(N=\phantom{1}6\bs{Z}\) (\(\phantom{1}6\) の倍数)
の群とします。この群の演算は加算であり、可換群なので、\(\bs{Z}\) の部分群はすべて正規部分群です。

\(N\cap H\) は「\(10\) の倍数、かつ \(6\) の倍数」の集合なので、
 \(N\cap H=30\bs{Z}\)
です。また \(NH\) は、\(10\) の倍数と\(6\) の倍数の加算の結果の集合です。つまり、
 \(NH=\{\:10x+6y\:|\:x,y\in\bs{Z}\:\}\)
ですが、これが何を意味するかは不定方程式の解の存在の定理(21B)から分かります。定理を再掲すると、

2変数 \(x,\:y\) の1次不定方程式を、
 \(ax+by=c\)
  (\(a,\:b,\:c\) は整数。\(a\neq0,\:b\neq0\))
とし、\(a\) と \(b\) の最大公約数を \(d\) とする。このとき、
 \(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。

です。\(c=kd\) なら、式を満たす \(x,\:y\) が必ず存在します。また任意の \(x,\:y\) について \(ax+by\) を計算すると、その結果の \(c\) は必ず \(c=kd\) の形になります。そうでなければ、\(c\) が最大公約数の倍数でないにも関わらず不定方程式が解をもつことになって定理に矛盾します。従って、\(ax+by=c\) の \(x,\:y\) を任意の整数とすると、\(c\) は \(a,\:b\) の "最大公約数の整数倍のすべて" になります。
 \(NH=\{\:10x+6y\:|\:x,y\in\bs{Z}\:\}\)
とした場合、\(10\) と \(6\) の最大公約数は \(2\) なので、
 \(NH=2\bs{Z}\)
です。この結果、
 \(N/(N\cap H)\)
  \(=6\bs{Z}/30\bs{Z}\)
  \(=\{30\bs{Z},\:6+30\bs{Z},\:12+30\bs{Z},\:18+30\bs{Z},\:24+30\bs{Z}\}\)
 \(NH/H\)
  \(=2\bs{Z}/10\bs{Z}\)
  \(=\{10\bs{Z},\:2+10\bs{Z},\:4+10\bs{Z},\:6+10\bs{Z},\:4+10\bs{Z}\}\)
となります。この2つの剰余群は位数 \(5\) の巡回群( \(C_5\) )で、\(\bs{Z}/5\bs{Z}\) に同型です。つまり、
 \(N/(N\cap H)\) \(\cong\:\bs{Z}/5\bs{Z}\)
 \(NH/H\) \(\cong\:\bs{Z}/5\bs{Z}\)
であり、
 \(N/(N\cap H)\:\cong\:NH/H\)
となって、第2同型定理が確認できました。

第2同型定理(整数).jpg
第2同型定理 : \(\bs{6\bs{Z}/30\bs{Z}\:\cong\:2\bs{Z}/10\bs{Z}}\)

この図をみると、\(NH/H=2\bs{Z}/10\bs{Z}\) と \(N/(N\cap H)=6\bs{Z}/30\bs{Z}\) が同型であることがヴィジュアルにイメージできる。両方とも位数 \(5\) の巡回群である。

第2同型定理を数式で書くと何だか難しそうな感じがしますが、図にするといかにも自明なことという気がします。数学におけるイメージ図の威力が実感できます。

第2同型定理は、後ほど「可解群の部分群は可解群」という定理の証明に使います。「可解群の部分群は可解群」の定理は、5次方程式に可解でないものがあることを証明する際に鍵となる定理です。その第2同型定理は準同型定理を使って証明される、という構造になっているのでした。

 
5.ガロア群とガロア対応 
 

2章から4章までは、多項式、体、線形空間、剰余類、群、剰余群、既約剰余類群、正規部分群といった、ガロア理論の基礎となる概念の説明でした。この第5章から、理論の核心に入っていきます。


5.1 体の同型写像


同型写像の定義
体の同型写像:51A)

体 \(\bs{K}\) から 体 \(\bs{F}\) への写像 \(f\) が全単射であり、\(\bs{K}\) の任意の元、\(x,\:y\) に対して、
\(\begin{eqnarray}
&&\:\:f(x+y)&=f(x)+f(y)\\
&&\:\:f(xy)&=f(x)f(y)\\
\end{eqnarray}\)
が成り立つとき、\(f\) を体の同型写像という。この定義による同型写像は、加法と乗法のみならず、四則演算を保存する。

特に、\(\bs{K}\) から \(\bs{K}\) への同型写像を自己同型写像という。

\(\bs{K}\) から \(\bs{F}\) への同型写像が存在するとき、体 \(\bs{K}\) と 体 \(\bs{F}\) は同型であるといい、\(\bs{K}\:\cong\:\bs{F}\) で表す。

体 \(\bs{K}\) と \(\bs{F}\) がともに \(\bs{Q}\) を含むとき、\(a\in\bs{Q}\) に対して、
 \(f(a)=a\)
である。つまり有理数は同型写像で不変である。


[証明]

上の定義による同型写像が、減法と除法を保存することを証明する。\(\bs{K}\) と \(\bs{F}\) は体だから、加法と乗法について群になっている。\(\bs{K}\) の加法の単位元を \(\kz\)、\(\bs{F}\) の加法の単位元を \(\fz\) とする。また、乗法の単位元をそれぞれ \(\ko\) と \(\fo\) とする。まず、\(f(\ko)=\fo\) で \(f(\kz)=\fz\) であることを示す。

\(f(x+y)=f(x)+f(y)\) において \(x=\kz,\:y=\kz\) とすると、
 \(f(\kz+\kz)=f(\kz)+f(\kz)\)
 \(f(\kz)=f(\kz)+f(\kz)\)
両辺に \(\bs{F}\) における \(f(\kz)\) の逆元 \(-f(\kz)\) を加えると、
 \(f(\kz)+(-f(\kz))=f(\kz)\)
 \(\fz=f(\kz)\)
となり、\(f(\kz)=\fz\) である。

\(f(xy)=f(x)f(y)\) において \(x=\ko,\:y=\ko\) とすると、
 \(f(\ko\times\ko)=f(\ko)f(\ko)\)
 \(f(\ko)=f(\ko)f(\ko)\)
両辺に \(\bs{F}\) における \(f(\ko)\) の逆元 \(-f(\ko)\) を加えると、
 \(f(\ko)+(-f(\ko))=f(\ko)f(\ko)+(-f(\ko))\)
 \(\fz=f(\ko)f(\ko)+(-f(\ko))\)
この式に現れているのは全て \(\bs{F}\) の元だから、分配則を使って、
 \(f(\ko)(f(\ko)-\fo)=\fz\)
ここで \(f(\ko)=\fz\) と仮定すると、\(f(\kz)=\fz\)かつ \(f(\ko)=\fz\) となってしまい \(f\) が単射であることと矛盾する。従って \(f(\ko)\neq\fz\) である。上式の両辺を \(f(\ko)\) で割ると、
 \(f(\ko)-\fo=\fz\)
 \(f(\ko)=\fo\)
となる。

以上を踏まえると、同型写像が減法を保存することは次のようにしてわかる。\(\bs{K}\) は加法について群なので任意の元 \(x\in\bs{K}\) について逆元 \(-x\) がある。また \(\bs{F}\) も加法についても群だから \(f(x)\) の逆元 \(-f(x)\) がある。
 \(f(-x)+f(x)=f(-x+x)=f(\kz)=\fz\)
両辺に \(-f(x)\) を足すと、
 \(f(-x)+f(x)+(-f(x))=\fz+(-f(x))\)
 \(f(-x)+\fz=\fz+(-f(x))\)
 \(f(-x)=-f(x)\)
である。\(\bs{K}\) の任意の元を \(x,\:y\) とすると、
\(\begin{eqnarray}
&&\:\:f(x-y)&=f(x+(-y))\\
&&&=f(x)+f(-y)\\
&&&=f(x)+(-f(y))\\
&&&=f(x)-f(y)\\
\end{eqnarray}\)
となって、減法は保存されている。

除法を保存することは次のようにしてわかる。\(\bs{K}\) は乗法について群なので、任意の元 \(x\:\:(\neq\kz)\) について逆元 \(x^{-1}\) がある。\(\bs{F}\) も乗法についての群だから、\(f(x)\) の逆元である \(f(x)^{-1}\) がある。\(x\neq\kz\) なら \(f(x)\neq\fz\) なので逆元が定義できる。すると、
 \(f(x^{-1})f(x)=f(x^{-1}x)=f(\ko)=\fo\)
である。この式の両辺に \(f(x)^{-1}\) をかけると、
 \(f(x^{-1})f(x)f(x)^{-1}=\fo\times f(x)^{-1}\)
 \(f(x^{-1})\times\fo=\fo\times f(x)^{-1}\)
 \(f(x^{-1})=f(x)^{-1}\)
となる。\(\bs{K}\) の任意の元を \(x,\:y\:\:(y\neq\kz)\) とすると、
\(\begin{eqnarray}
&&\:\:f\left(\dfrac{x}{y}\right)&=f(xy^{-1})\\
&&&=f(x)f(y^{-1})\\
&&&=f(x)f(y)^{-1}\\
&&&=\dfrac{f(x)}{f(y)}\\
\end{eqnarray}\)
となり、除法が保存されていることが分かる。

有理数の同型写像を考える。\(n\) を整数とすると、
\(\begin{eqnarray}
&&\:\:f(n)&=f(\:\overbrace{1+1+\cd+1}^{1をn\:個加算}\:)\\
&&&=f(1)+f(1)+\cd+f(1)\\
&&&=nf(1)\\
&&&=n\\
\end{eqnarray}\)
なので、\(f(n)=n\) である。任意の有理数 \(a\) は、2つの整数 \(n\:(\neq0),\:m\) を用いて、
 \(a=\dfrac{m}{n}\)
と表されるから、
\(\begin{eqnarray}
&&\:\:f(a)&=f\left(\dfrac{m}{n}\right)=\dfrac{f(m)}{f(n)}=\dfrac{m}{n}\\
&&&=a\\
\end{eqnarray}\)
となり、有理数は同型写像で不変である。[証明終]

同型写像と有理式の順序交換
有理式の定義:51B)

変数 \(x\) の多項式(係数は \(\bs{Q}\) の元)を分母・分子とする分数式を、\(\bs{Q}\) 上の有理式という。


\(\bs{Q}\) 上の多項式は、有理数と \(x\) の加・減・乗算で作られる式です。一方、\(\bs{Q}\) 上の有理式とは、有理数と \(x\) の除算を含む四則演算で作られる式です。


同型写像と有理式の順序交換:51C)

体 \(\bs{K}\) と 体 \(\bs{F}\) は \(\bs{Q}\) を含むものとする。\(\sg\) を \(\bs{K}\) から \(\bs{F}\) への同型写像とし、\(a\) を \(\bs{K}\) の元とする。\(f(x)\) を \(\bs{Q}\) 上の有理式とすると、

 \(\sg(f(a))=f(\sg(a))\)

である。これは多変数の有理式でも成り立つ。\(a_1,a_2,\cd,a_n\) を \(\bs{K}\) の元、\(f(x_1,x_2,\cd,x_n)\) を \(\bs{Q}\) 上の有理式とすると、

 \(\sg(f(a_1,a_2,\cd,a_n))=f(\sg(a_1),\sg(a_1),\cd,\sg(a_n))\)

である。


[証明]

\(a\in\bs{K},\:b_i\in\bs{Q},\:c_i\in\bs{Q}\) とし、1変数 \((=a)\) の2次多項式の分数式の場合を例に書くと、

\(\sg\left(\dfrac{b_2a^2+b_1a+b_0}{c_2a^2+c_1a+c_0}\right)\)
  \(=\dfrac{\sg(b_2a^2+b_1a+b_0)}{\sg(c_2a^2+c_1a+c_0)}\)
  \(=\dfrac{b_2\sg(a^2)+b_1\sg(a)+b_0}{c_2\sg(a^2)+c_1\sg(a)+c_0}\)
  \(=\dfrac{b_2\sg(a)^2+b_1\sg(a)+b_0}{c_2\sg(a)^2+c_1\sg(a)+c_0}\)

であるから、題意は成り立つ。これは \(n\)次多項式の場合でも同じである。[証明終]


「同型写像と有理式は順序交換可能」は、\(\bs{Q}\) の拡大体の上の有理式でも成り立ちます。つまり、次が成り立ちます。


\(\bs{Q}\) を含む体を \(\bs{K}\) とし、\(\bs{K}\)の拡大体を \(\bs{F}\:,\bs{F}'\) とする。\(\sg\) を \(\bs{K}\) を不変にする \(\bs{F}\) から \(\bs{F}'\) への同型写像とし、\(a\) を \(\bs{F}\) の元とする。\(f(x)\) を \(\bs{K}\) 上の有理式とすると、
 \(\sg(f(a))=f(\sg(a))\)
である。


同型写像は解を共役な解に移す
同型写像での移り先:51D)

\(\sg\) を体 \(\bs{K}\) から 体 \(\bs{F}\) への同型写像とする。\(\bs{Q}\) 上の方程式 \(f(x)=0\) の解の一つを \(\al\) とし、\(\al\) は \(\bs{K}\) の元とする。すると \(\sg(\al)\) も \(f(x)=0\) の解である。


[証明]

\(\al\) は \(f(x)=0\) の解なので \(f(\al)=0\) が成り立つ。すると、
 \(f(\sg(\al))=\sg(f(\al))=\sg(0)=0\)
となり、\(\sg(\al)\) も \(f(x)=0\) の解である。[証明終]


同じ方程式の解同士を「共役な解」「共役である」と言います。この定理により、同型写像は解を共役な解に移すこと分かります。

同型写像は解を入れ替える
同型写像による解の置換:51E)

\(\sg\) を体 \(\bs{K}\) から 体 \(\bs{F}\) への同型写像とし、\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。方程式 \(f(x)=0\) の \(n\)個の解を \(\al_1,\al_2,\cd,\al_n\) とし、これらが全て \(\bs{K}\) に含まれるとする。

すると \(\sg(\al_1),\sg(\al_2),\cd,\sg(\al_n)\) は、\(\al_1,\al_2,\cd,\al_n\) を入れ替えたものである。


[証明]

\(f(x)\) は既約多項式なので、方程式 \(f(x)=0\) は \(n\)個の解をもち、それらは全て異なる(31G)。同型写像は解を共役な解に移す(51D)ので、\(\sg(\al_i)\) も \(f(x)=0\) の解である。\(\sg\) は同型写像なので全単射であり、\(i\neq j\) なら \(\sg(\al_i)\neq\sg(\al_j)\) である。従って \(\sg(\al_1),\sg(\al_2),\cd,\sg(\al_n)\) は、\(\al_1,\al_2,\cd,\al_n\) を入れ替えたものである。[証明終]


同型写像を定義してその性質を述べてきましたが、あたかも「同型写像はあるのが当然」のような話でした。しかし、同型写像があったとしたらこういう性質をもつというのが正しく、同型写像が必ずあるとは証明していません。

同型写像の存在を示すには、第1章でやったように、\(\bs{Q}(\sqrt{2})\)において
 \(\sg(\sqrt{2})=-\sqrt{2}\)
という写像を定義すると、体のすべての元について \(\sg\) は同型写像の定義を満たす、というような証明が必要です。それが次です。

単拡大体の同型写像の存在
同型写像の存在:51F)

\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。\(\al,\:\beta\) を方程式 \(f(x)=0\) の異なる解とする。

すると \(\sg(\al)=\beta\) を満たす \(\bs{Q}(\al)\) から \(\bs{Q}(\beta)\) への唯一の同型写像 \(\sg\) が存在する。


[証明]

\(\bs{Q}(\al)\) の任意の元を \(a\)、\(\bs{Q}(\beta)\) の任意の元を \(b\) とする。単拡大体の基底の定理(33F)により、\(a,\:b\) は、
\(a=a_{n-1}\al^{n-1}+\:\cd\:+a_2\al^2+a_1\al+a_0\:\:(a_i\in\bs{Q})\)
\(b=b_{n-1}\beta^{n-1}+\:\cd\:+b_2\beta^2+b_1\beta+b_0\:\:(b_i\in\bs{Q})\)
の形に一意に表される。ここで \(\bs{Q}(\al)\) から \(\bs{Q}(\beta)\) への同型写像 \(\sg\) を、
\(\begin{eqnarray}
&&\:\:\sg\:: &a_{n-1}\al^{n-1}+\:\cd\:+a_2\al^2+a_1\al+a_0\\
&&&\longmapsto\:a_{n-1}\beta^{n-1}+\:\cd\:+a_2\beta^2+a_1\beta+a_0\\
\end{eqnarray}\)
と定義する。\(a=\al\) の場合は、\(a_1=1,\:a_i=0\:\:(i=0,\:2\leq i\leq n-1)\) だから、\(\sg(\al)=\beta\) である。以下、この \(\sg\) が同型写像であることを証明する。定義により(51A)同型写像であることは加法と乗法を保存することを言えばよい。

\(\bs{Q}(\al)\) の任意の2つの元を \(s,\:t\) とし、
\(s=s_{n-1}\al^{n-1}+\:\cd\:+s_2\al^2+s_1\al+s_0\)
\(t=t_{n-1}\al^{n-1}+\:\cd\:+t_2\al^2+t_1\al+t_0\)
とする。また多項式 \(g(x)\) と \(h(x)\) を、
\(g(x)=s_{n-1}x^{n-1}+\:\cd\:+s_2x^2+s_1x+s_0\)
\(h(x)=t_{n-1}x^{n-1}+\:\cd\:+t_2x^2+t_1x+t_0\)
と定義する。\(s_i,t_i\in\bs{Q}\) であり、\(s=g(\al),\:t=h(\al)\) である。また \(\sg\) の定義により \(\sg(s)=g(\beta),\:\sg(t)=h(\beta)\) である。

\(p(x)=g(x)+h(x)\) とおくと、
 \(p(\al)=g(\al)+h(\al)=s+t\)
である。また \(\sg\)の定義により、
 \(\sg(p(\al))=p(\beta)\)
となる。従って、
\(\begin{eqnarray}
&&\:\:\sg(s+t)&=\sg(p(\al))\\
&&&=p(\beta)\\
&&&=g(\beta)+h(\beta)\\
&&&=\sg(s)+\sg(t)\\
\end{eqnarray}\)
となり、加法は保存される。

\(g(x)h(x)\) を \(f(x)\) で割ったときの商を \(q(x)\)、余りを \(r(x)\) とすると、
 \(g(x)h(x)=q(x)f(x)+r(x)\)
である。この式に \(x=\al,\:x=\beta\) のそれぞれを代入すると、\(f(\al)=0,\:f(\beta)=0\) なので、
 \(g(\al)h(\al)=r(\al)\)
 \(g(\beta)h(\beta)=r(\beta)\)
となる。すると、
\(\begin{eqnarray}
&&\:\:\sg(st)&=\sg(g(\al)h(\al))\\
&&&=\sg(r(\al))=r(\sg(\al))\\
&&&=r(\beta)\\
\end{eqnarray}\)

\(\begin{eqnarray}
&&\:\:\sg(s)\sg(t)&=\sg(g(\al))\sg(h(\al))\\
&&&=g(\sg(\al))h(\sg(\al))\\
&&&=g(\beta)h(\beta)\\
&&&=r(\beta)\\
\end{eqnarray}\)
であり、
 \(\sg(st)=\sg(s)\sg(t)\)
となって乗法も保存されている。従って \(\sg\) は同型写像である。

逆に、\(\bs{Q}(\al)\) に作用する同型写像 \(\tau\) があったとする。同型写像は \(\al\) を共役な元に移すので、その移り先の元を \(\beta\)、つまり \(\tau(\al)=\beta\) とする。\(\bs{Q}(\al)\) の任意の元 \(a\) に \(\tau\) を作用させると、
\(\begin{eqnarray}
&&\:\:\tau(a)&=\tau(a_{n-1}\al^{n-1}+\:\cd\:+a_2\al^2+a_1\al+a_0)\\
&&&=a_{n-1}\tau(\al^{n-1})+\:\cd\:+a_2\tau(\al^2)+a_1\tau(\al)+a_0\\
&&&=a_{n-1}\tau(\al)^{n-1}+\:\cd\:+a_2\tau(\al)^2+a_1\tau(\al)+a_0\\
&&&=a_{n-1}\beta^{n-1}+\:\cd\:+a_2\beta^2+a_1\beta+a_0\\
\end{eqnarray}\)
となるので、同型写像はこの式を満たさなければならない。従って、上で定義した \(\sg\) が \(\bs{Q}(\al)\) から \(\bs{Q}(\beta)\) の唯一の同型写像である。[証明終]


同型写像の存在51F)を一般化すると、次のことが言えます。

単拡大体の同型写像は \(n\) 個
単拡大体の同型写像:51G)

\(f(x)\) を \(\bs{Q}\) 上の \(n\)次既約多項式とする。\(f(x)=0\) の全ての解を \(\al_1=\al,\:\al_2,\:\cd\:,\al_n\) とする。このとき \(\bs{Q}(\al)\) に作用する同型写像は \(n\)個あり、それらは、
 \(\sg_i(\al)=\al_i\) \((1\leq i\leq n)\)
で定められ、\(\sg_i\) は \(\bs{Q}(\al)\) から \(\bs{Q}(\al_i)\) への同型写像となる。



同型写像を別の視点で考えます。\(\bs{Q}\:\subset\:\bs{F}\:\subset\:\bs{K}\) といった体の拡大列があったとき、\(\bs{F}\) の同型写像と \(\bs{K}\) の同型写像には密接な関係があります。それが次の同型写像の延長の定理です。単拡大定理32B)により、\(\bs{F}=\bs{Q}(\al)\)、\(\bs{K}=\bs{Q}(\al,\beta)\) としてよいので、その形を使います。

同型写像の延長
同型写像の延長:51H)

\(\bs{Q}\) 上の \(n\)次既約多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の解の一つを \(\al\) とする。

\(\bs{\bs{Q}(\al)}\) 上の \(m\)次既約多項式を \(g(x)\) とし、方程式 \(g(x)=0\) の解の一つを \(\beta\) とする。また、\(\bs{Q}(\al)\) の同型写像の一つを \(\tau\) とする。

このとき、\(\tau\) は \(\bs{Q}(\al,\beta)\) の同型写像 \(\sg_j\) に延長できる。延長とは、\(\sg_j\) の作用を \(\bs{Q}(\al)\) に限定した写像の作用が \(\tau\) と一致することを言う。\(\tau\) を延長した同型写像 \(\sg_j\) は \(m\)個ある(\(0\leq j < m\))。


[証明]

\(\bs{Q}(\al)\) 上の \(m\)次既約多項式 \(g(x)\) を、
 \(g(x)=x^m+a_1x^{m-1}+\cd+a_m\:\:(a_j\in\bs{Q}(\al))\)
とする。\(\beta\) は \(g(x)=0\) の解だから
 \(g(\beta)=\beta^m+a_1\beta^{m-1}+\cd+a_m=0\)
である。また、多項式 \(\tau(g(x))\) を、
 \(\tau(g(x))=x^m+\tau(a_1)x^{m-1}+\cd+\tau(a_{m-1})x+\tau(a_m)\)
と定義し、方程式
 \(\tau(g(x))=0\)
の解を \(t_j\:\:(0\leq j < m)\)とする。つまり \(\tau(g(t_j))=0\) である。

\(\bs{Q}(\al,\beta)\) は \(\bs{Q}(\al)\) 上の線形空間であり、単拡大体の基底の定理(33F)により、その基底を \(\{1,\:\beta,\:\beta^2,\:\cd\:\beta^{m-1}\}\) にとれるから、\(\bs{Q}(\al,\beta)\) の任意の元 \(k\) は、

\(k=b_0+b_1\beta+b_2\beta^2\:+\cd+\:b_{n-1}\beta^{m-1}\:\:(b_j\in\bs{Q}(\al))\)

と表せる。そこで、\(\bs{Q}(\al,\beta)\) の元に作用する写像 \(\sg_j\) を

\(\sg_j(k)=\tau(b_0)+\tau(b_1)t_j+\tau(b_2)t_j^2+\cd+\tau(b_{m-1})t_j^{m-1}\)

と定義する。この定義における \(\sg_j\) は \(\bs{Q}(\al,\beta)\) の同型写像になる。同型写像になることは体の加算と乗算で示せればよい(51A)。\(\bs{Q}(\al,\beta)\) の2つの元を、
 \(p=c_0+c_1\beta+c_2\beta^2\:+\cd+\:c_{m-1}\beta^{m-1}\:\:(c_j\in\:\bs{Q}(\al)\:)\)
 \(q=d_0+d_1\beta+d_2\beta^2\:+\cd+\:d_{m-1}\beta^{m-1}\:\:(d_j\in\:\bs{Q}(\al)\:)\)
とし、2つの多項式を、
 \(p(x)=c_0+c_1x+c_2x^2\:+\cd+\:c_{m-1}x^{m-1}\)
 \(q(x)=d_0+d_1x+d_2x^2\:+\cd+\:d_{m-1}x^{m-1}\)
と定義する。加算で同型写像になるのは明白なので、乗算で同型写像になることを示す。

\(p(x)q(x)\) を \(g(x)\) で割ったときの商を \(t(x)\)、余りを \(r(x)\) とすると、
\(p(x)q(x)=t(x)g(x)+r(x)\)
\(r(x)\)\(\overset{\text{ }}{=}\)\(s_0(c_j,d_j)+s_1(c_j,d_j)x+s_2(c_j,d_j)x^2+\cd+s_{m-1}(c_j,d_j)x^{m-1}\)
と書ける。ここで \(s_j()\) は \(c_j,\:d_j\:\:(0\leq j\leq m-1)\)の有理式である。\(()\) の中を全部書くと \(s_j(c_0,c_1,\cd,c_{m-1},d_0,d_1,\cd,d_{m-1})\) という \(2m\)個の \(\bs{Q}(\al)\) の元の有理式を表わしていて、それを簡略表記している。

すると \(g(\beta)=0\) だから、
\(pq\)\(\overset{\text{ }}{=}\)\(p(\beta)q(\beta)\)
\(\overset{\text{ }}{=}\)\(r(\beta)\)
\(\overset{\text{ }}{=}\)\(s_0(c_j,d_j)+\)\(s_1(c_j,d_j)\beta+\)\(s_2(c_j,d_j)\beta^2\:+\)\(\cd+\)\(s_{m-1}(c_j,d_j)\beta^{m-1}\)
である。そうすると、\(\sg_j(pq)\) は \(\sg_j\) の定義により、
\(\sg_j(pq)\)\(\overset{\text{ }}{=}\)\(\tau(s_0(c_j,d_j))+\)\(\tau(s_1(c_j,d_j))t_j+\)\(\tau(s_2(c_j,d_j))t_j^2+\)\(\cd+\)\(\tau(s_{m-1}(c_j,d_j))t_j^{m-1}\)
となる。

\(\tau\) は \(\bs{Q}(\al)\) の同型写像だから、\(\bs{Q}(\al)\) の元の有理式である \(s_j(c_j,d_j)\) に作用させると、同型写像と有理式の順序交換の定理(51C)により、
 \(\tau(s_j(c_j,d_j))=s_j(\tau(c_j),\tau(d_j))\)
となる。従って、
\(\sg_j(pq)\)\(\overset{\text{ }}{=}\)\(s_0(\tau(c_j),\tau(d_j))+\)\(s_1(\tau(c_j),\tau(d_j))t_j\:+\)\(s_2(\tau(c_j),\tau(d_j))t_j^2+\)\(\cd+\)\(s_{m-1}(\tau(c_j),\tau(d_j))t_j^{m-1}\)
である。

\(p(x)\) の係数 \(c_j\) を \(\tau(c_j)\) で置き換え、\(q(x)\) の係数 \(d_j\) を \(\tau(d_j)\) で置き換えた2つの多項式を、
 \(\tau(p(x))=\tau(c_0)+\tau(c_1)x+\tau(c_2)x^2+\cd+\tau(c_{m-1})x^{m-1}\)
 \(\tau(q(x))=\tau(d_0)+\tau(d_1)x+\tau(d_2)x^2+\cd+\tau(d_{m-1})x^{m-1}\)
とする。

\(\tau(p(x))\tau(q(x))\)を\(\tau(g(x))\)で割ったときの商を\(\tau(t(x))\)、余りを\(\tau(r(x))\)とする。つまり、
 \(\tau(p(x))\tau(q(x))=\tau(g(x))\tau(t(x))+\tau(r(x))\)
である。\(c_j\) と \(d_j\) の有理式、\(s_j(c_j,d_j)\) を使って \(\tau(r(x))\) を表すと、
\(\tau(r(x))\)\(\overset{\text{ }}{=}\)\(s_0(\tau(c_j),\tau(d_j))+\)\(s_1(\tau(c_j),\tau(d_j))x+\)\(s_2(\tau(c_j),\tau(d_j))x^2\:+\)\(\cd+\)\(s_{m-1}(\tau(c_j),\tau(d_j))x^{m-1}\)
となる。\(\sg_j\) の定義により、
\(\sg_j(p)\)\(\overset{\text{ }}{=}\)\(\tau(c_0)+\)\(\tau(c_1)t_j+\)\(\tau(c_2)t_j^2+\)\(\cd+\)\(\tau(c_{m-1})t_j^{m-1}\)
\(\overset{\text{ }}{=}\)\(\tau(p(t_j))\)
\(\sg_j(q)\)\(\overset{\text{ }}{=}\)\(\tau(d_0)+\)\(\tau(d_1)t_j+\)\(\tau(d_2)t_j^2+\)\(\cd+\)\(\tau(d_{m-1})t_j^{m-1}\)
\(\overset{\text{ }}{=}\)\(\tau(q(t_j))\)
である。従って、
\(\sg_j(p)\sg_j(q)\)
 \(\overset{\text{ }}{=}\)\(\tau(p(t_j))\tau(q(t_j))\)
\(\overset{\text{ }}{=}\)\(\tau(f(t_j))\tau(t(t_j))+\tau(r(t_j))\)
\(\overset{\text{ }}{=}\)\(\tau(r(t_j))\)
\(\overset{\text{ }}{=}\)\(s_0(\tau(c_j),\tau(d_j))+\)\(s_1(\tau(c_j),\tau(d_j))t_j+\)\(s_2(\tau(c_j),\tau(d_j))t_j^2+\)\(\cd+\)\(s_{n-1}(\tau(c_j),\tau(d_j))t_j^{m-1}\)
\(\overset{\text{ }}{=}\)\(\sg_j(pq)\)
となり、\(\sg_j\) は同型写像の定義を満たしている。

また、\(\bs{Q}(\al,\beta)\) の任意の元 \(k\) を、
 \(k=b_0+b_1\beta+b_2\beta^2\:+\cd+\:b_{n-1}\beta^{m-1}\:\:(b_j\in\bs{Q}(\al))\)
と表したとき、\(k\) が \(\bs{Q}(\al)\) の元だとすると \(k=b_0\:\:(b_0\in\bs{Q}(\al))\)、\(b_j=0\:\:(1\leq j < m)\) なので、
 \(\sg_j(k)=\tau(b_0)=\tau(k)\)
となり、\(\sg_j\) の \(\bs{Q}(\al)\) の元に対する作用は \(\tau\) と一致する。従って、
\(\sg_j\)は、その作用を \(\bs{Q}(\al)\) に限定したとき \(\tau\) と一致する \(\bs{Q}(\al,\beta)\) の同型写像
であり、\(\bs{Q}(\al)\) の同型写像 \(\tau\) の延長である。

\(\sg_j\) の定義式、
\(\sg_j(k)=\tau(b_0)+\tau(b_1)t_j+\tau(b_2)t_j^2+\cd+\tau(b_{m-1})t_j^{m-1}\)
における \(t_j\) は、 \(\bs{Q}(\al)\) 上の \(m\)次方程式、
\(x^m+\tau(a_1)x^{m-1}+\cd+\tau(a_m)=0\)
の解であった。従って \(t_j\) の選択肢は \(m\) 個あり、\(\bs{Q}(\al)\) の同型写像 \(\tau\) の延長は \(m\) 個ある。

一方、\(\al\) は \(\bs{Q}\) 上の \(n\)次既約多項式 \(f(x)\) の解の一つだから、\(\bs{Q}(\al)\) の同型写像 \(\tau\) は \(n\)個ある。これを \(\tau_i\:\:(0\leq i < n)\) と書くと、それぞれの \(\tau_i\) に対して同型写像の拡張 \(\sg_{ij}\:\:(0\leq i < n,\:0\leq j < m)\) がある。従って \(\bs{Q}(\al,\beta)\) の 同型写像 \(\sg_{ij}\) は \(nm\)個ある。[証明終]


5.2 ガロア拡大とガロア群


ガロア拡大
ガロア拡大:52A)

ガロア拡大は次のように定義される。この2つの定義は同値である。

① 最小分解体定義)体 \(\bs{F}\) 上の多項式を \(f(x)\) とし、方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\) とするとき、\(\bs{L}/\bs{F}\) をガロア拡大という。

② 自己同型定義)体 \(\bs{F}\) の代数拡大体 \(\bs{K}\) があったとき、\(\bs{F}\) の元を不動にする \(\bs{K}\) の同型写像がすべて自己同型写像になるとき、\(\bs{K}/\bs{F}\) をガロア拡大という。

\(\bs{K}/\bs{F}\) がガロア拡大のとき、\(\bs{\bs{F}}\) を不変にする \(\bs{K}\) の自己同型写像の集合は群になる。これをガロア群といい、\(\mr{Gal}(\bs{K}/\bs{F})\) で表す。


[① \(\bs{\Rightarrow}\) ②の証明]

単拡大定理32B)により、\(\bs{L}\) は、\(\bs{L}\) の元 \(\theta\) を用いて \(\bs{L}=\bs{F}(\theta)\) と表すことができる。\(\theta\) の \(\bs{F}\) 上の最小多項式を \(g(x)\) とし、その次数を \(m\) とする。最小多項式は既約多項式の定理(31I)により、\(g(x)\) は既約多項式である。また、既約多項式の定理331G)により、方程式 \(g(x)=0\) の \(m\)個の解は全て異なっている。その解の一つは \(\theta\) なので、\(m\)個の解を、

 \(\theta=\theta_1,\:\theta_2,\:\cd,\:\theta_m\)

とする。\(\theta_i\:\:(2\leq i\leq m)\) が \(\bs{L}\) の元かどうかは(この段階では)分からない。

\(\bs{F}\) の元を不変にする \(\bs{L}\) 上の同型写像の一つを \(\sg\) とする。\(\sg\) は \(\bs{F}\) の元を不変にするから、\(\bs{L}=\bs{F}(\theta)\) においては \(\sg(\theta)\) を決めることによって \(\sg\) が定義される。その同型写像は、方程式の解を共役な解に移す(51D)。そこで、\(m\)個の同型写像を、
 \(\sg_i(\theta)=\theta_i\)
と定義する(\(\sg_1=e\))。

一方、\(\bs{L}\) は \(\bs{F}\) 上の方程式 \(f(x)=0\) の最小分解体であった。\(f(x)=0\) の解を、
 \(\al_1,\:\al_2,\:\cd,\:\al_n\)
の \(n\)個とする。そうすると、
 \(\bs{L}=\bs{F}(\al_1,\:\al_2,\:\cd,\:\al_n)\)
である。\(\bs{L}\) の任意の元 は、\(\al_1,\:\al_2,\:\cd,\:\al_n\) の有理式(係数は \(\bs{F}\) の元)で表せる。\(\theta\) を有理式で表す式を、\(n\)変数の有理式 \(h(x_1,x_2,\cd,x_n)\) を使って、
 \(\theta=h(\al_1,\:\al_2,\:\cd,\:\al_n)\)
と表したとする。\(h(x_i)\)は、\(n\)変数の多項式(係数は \(\bs{F}\) の元)を \(s(x_i)\) と \(t(x_i)\) として、
 \(h(\al_1,\:\al_2,\:\cd,\:\al_n)=\dfrac{s(\al_1,\:\al_2,\:\cd,\:\al_n)}{t(\al_1,\:\al_2,\:\cd,\:\al_n)}\)
である。

\(\theta\) に同型写像 \(\sg_i\) を作用させる。\(\bs{F}\) 係数の有理式と \(\bs{F}\) を不変にする同型写像の演算順序は交換可能(51C)だから、
\(\begin{eqnarray}
&&\:\:\sg_i(\theta)&=\sg_i(h(\al_1,\:\al_2,\:\cd,\:\al_n))\\
&&&=h(\sg_i(\al_1),\:\sg_i(\al_2),\:\cd,\:\sg_i(\al_n))\\
\end{eqnarray}\)
となる。同型写像は方程式の解を共役な解に移す(51D)から、\(\sg_i(\al_1),\:\sg_i(\al_2),\:\cd,\:\sg_i(\al_n)\) は \(\al_1,\:\al_2,\:\cd,\:\al_n\) を入れ替えたものである(51E)。つまり \(\sg_i(\theta)\) は \(\al_1,\:\al_2,\:\cd,\:\al_n\) の有理式で表現される。従って、
 \(\sg_i(\theta)\:\in\:\bs{L}\)
である。\(\sg_i(\theta)=\theta_i\) と定義したので、
 \(\theta_i\:\in\:\bs{L}\)
である。つまり \(m\)個の同型写像 \(\sg_i\:\:(1\leq i\leq m)\) は全て \(\bs{L}\) の自己同型写像である。

[② \(\bs{\Rightarrow}\) ①の証明]

単拡大定理32B)により、\(\bs{K}\) は、\(\bs{K}\) の元 \(\theta\) を用いて \(\bs{K}=\bs{F}(\theta)\) と表すことができる。\(\theta\) の \(\bs{F}\) 上の最小多項式を \(f(x)\) とし、その次数を \(m\) とする。最小多項式は既約多項式の定理(31I)により、\(f(x)\) は既約多項式である。また既約多項式の定理331G)により、方程式 \(f(x)=0\) の \(m\)個の解は全て異なっている。解の一つは \(\theta\) なので、\(m\)個の解を、
 \(\theta=\theta_1,\:\theta_2,\:\cd,\:\theta_m\)
とする。

\(\bs{F}\) の元を不変にする \(\bs{K}\) 上の同型写像の一つを \(\sg\) とする。\(\sg\) は \(\bs{F}\) の元を不変にするから、\(\bs{L}=\bs{F}(\theta)\) においては \(\sg(\theta)\) を決めることによって \(\sg\) が定義される。その同型写像は、\(\bs{F}\) 上の方程式の解を共役な解に移す(51D)。そこで、\(m\)個の同型写像を、
 \(\sg_i(\theta)=\theta_i\)
と定義する。\(\bs{F}\) の元を不変にする \(\bs{K}\) 上の同型写像は自己同型写像なので、\(\sg_i(\theta)=\theta_i\) は全て \(\bs{K}\) の元である。従って \(\bs{K}\) は \(\bs{F}\) 上の既約多項式 \(f(x)\) の解 \(\theta_i\) を用いて、

\(\begin{eqnarray}
&&\:\:\bs{K}&=\bs{F}(\theta)\\
&&&=\bs{F}(\theta_1,\:\theta_2,\:\cd,\:\theta_m)\\
\end{eqnarray}\)

と表される。\(\bs{K}\) は \(\bs{F}\) 上の既約多項式の最小分解体である。[証明終]


① の定義は、方程式の解のありようを議論するガロア理論にとっては "ノーマルな" 定義のように見えます。しかし ② のように方程式という言葉を全く使わない定義もメリットがあります。たとえば「次数が違う2つの方程式の解によるガロア拡大が同じ」ということは、いくらでもありうるからです。

また、ガロア拡大は次のような定義もできます。

③ (正規拡大定義)体 \(\bs{F}\) の代数拡大体 \(\bs{K}\) があったとき、\(\bs{K}\) の任意の元の \(\bs{F}\) 上の最小多項式を \(f(x)\) とする。\(f(x)=0\) のすべての解が \(\bs{K}\) の元のとき、\(\bs{K}\) を \(\bs{F}\) の正規拡大と言う。ガロア拡大とは正規拡大のことである。

方程式という言葉は使っていますが、拡大体から始まる定義です。言い換えると、\(\bs{K}\) がガロア拡大体のとき \(\bs{K}\) の任意の元に共役な元は \(\bs{K}\) に含まれるということです。

このように、互いに同値である多種の定義ができることがガロア理論の分かりにくいところですが、逆に「それだけ豊かな数学的内容を含んだ理論」とも言えるでしょう。

最小分解体の次数=ガロア群の位数
次数と位数の同一性:52B)

\(\bs{Q}\) 上の方程式 \(f(x)=0\) の最小分解体を \(\bs{L}\)、ガロア群を \(G\) とするとき、\([\:\bs{L}\::\:\bs{Q}\:]=|G|\) である。


[証明]

単拡大定理32B)により、\(\bs{L}\) は、\(\bs{L}\) の元 \(\theta\) を用いて \(\bs{L}=\bs{Q}(\theta)\) と表すことができる。\(\theta\) の \(\bs{Q}\) 上の最小多項式を \(g(x)\) とし、その次数を \(m\) とする。最小多項式は既約多項式の定理(31I)により、\(g(x)\) は既約多項式である。また、既約多項式の定理331G)により、方程式 \(g(x)=0\) の \(m\)個の解は全て異なっている。解の一つは \(\theta\) なので、\(m\)個の解を、
 \(\theta=\theta_1,\:\theta_2,\:\cd,\:\theta_m\)
とする。ここで、\(\theta_i\:\:(2\leq i\leq m)\) が \(\bs{L}\) の元かどうかは(この段階では)分からない。

\(\bs{L}\) 上の同型写像の一つを \(\sg\) とする。\(\sg\) は \(\bs{Q}\) の元を不変にするから、\(\bs{L}=\bs{Q}(\theta)\) においては \(\sg(\theta)\) を決めることによって \(\sg\) が定義される。その同型写像は、方程式の解を共役な解に移す(51D)。そこで、\(m\)個の同型写像を、
 \(\sg_i(\theta)=\theta_i\)
と定義する(\(\sg_1=e\))。単拡大体 \(\bs{Q}(\theta)\) に作用する同型写像は \(m\)個だから(51G)、これが同型写像のすべてである。

一方、\(\bs{L}\) は \(\bs{Q}\) 上の方程式 \(f(x)=0\) の最小分解体であった。\(f(x)=0\) の解を、
 \(\al_1,\:\al_2,\:\cd,\:\al_n\)
の \(n\)個とする。そうすると、
 \(\bs{L}=\bs{Q}(\al_1,\:\al_2,\:\cd,\:\al_n)\)
である。\(\bs{L}\) の任意の元 は、\(\al_1,\:\al_2,\:\cd,\:\al_n\) の有理式で表せる。\(\theta\) を有理式で表す式を、\(n\)変数の有理式 \(h(x_1,x_2,\cd,x_n)\) を使って、
 \(\theta=h(\al_1,\:\al_2,\:\cd,\:\al_n)\)
と表したとする。\(h(x_i)\)は、\(n\)変数の多項式(係数は有理数)を \(s(x_i)\) と \(t(x_i)\) として、
 \(h(\al_1,\:\al_2,\:\cd,\:\al_n)=\dfrac{s(\al_1,\:\al_2,\:\cd,\:\al_n)}{t(\al_1,\:\al_2,\:\cd,\:\al_n)}\)
である。

\(\theta\) に同型写像 \(\sg_i\) を作用させると、有理式と同型写像の演算順序は交換可能(51C)だから、
\(\begin{eqnarray}
&&\:\:\sg_i(\theta)&=\sg_i(h(\al_1,\:\al_2,\:\cd,\:\al_n))\\
&&&=h(\sg_i(\al_1),\:\sg_i(\al_2),\:\cd,\:\sg_i(\al_n))\\
\end{eqnarray}\)
となる。同型写像は方程式の解を共役な解に移すから(51D)、\(\sg_i(\al_1),\:\sg_i(\al_2),\:\cd,\:\sg_i(\al_n)\) は \(\al_1,\:\al_2,\:\cd,\:\al_n\) を入れ替えたものである(51E)。つまり \(\sg_i(\theta)\) は \(\al_1,\:\al_2,\:\cd,\:\al_n\) の有理式で表現される。従って、
 \(\sg_i(\theta)\:\in\:\bs{L}\)
である。\(\sg_i(\theta)=\theta_i\) と定義したので、
 \(\theta_i\:\in\:\bs{L}\)
である。つまり \(m\)個の同型写像 \(\sg_i\:\:(1\leq i\leq m)\) は全て \(\bs{L}\) の自己同型写像である。以上により、
 \(\mr{Gal}(\bs{L}/\bs{Q})=\{\sg_1,\:\sg_2,\:\cd,\:\sg_m\}\)
であり、\(|G|=m\) である。

\(\theta\) の \(\bs{Q}\) 上の最小多項式(=既約多項式)の次数が \(m\) だから、単拡大体の基底の定理(33F)によって、最小分解体 \(\bs{L}=\bs{Q}(\theta)\) は \(\bs{Q}\) の \(m\)次拡大体であり、
 \([\:\bs{L}\::\:\bs{Q}\:]=|G|\)
である。[証明終]


この定理では \(\bs{Q}\) としましたが、任意の代数拡大体 \(\bs{F}\) としても成り立ちます。また、最小分解体はガロア拡大体です。従って、最も一般的に言うと次のようになります。


\(\bs{F}\) を代数拡大体とし、\(\bs{F}\) のガロア拡大を \(\bs{L}\) とする。\(\bs{L}\) のガロア群の位数は \(\bs{F}\) から \(\bs{L}\) への拡大次数に等しい。つまり、
 \([\:\bs{L}\::\:\bs{F}\:]=|\mr{Gal}(\bs{L}/\bs{F})|\)
である。


中間体
中間体からのガロア拡大:52C)

\(\bs{K}\) を \(\bs{F}\) のガロア拡大体とし、\(\bs{M}\) を \(\bs{F}\subset\bs{M}\subset\bs{K}\) である任意の体(=中間体)とするとき、\(\bs{K}\) は \(\bs{M}\) のガロア拡大体でもある。


[証明]

最小分解体定義による

\(\bs{K}\) が \(\bs{F}\) 上の方程式 \(f(x)=0\) の最小分解体であるとする。この方程式の解を \(\al_1,\:\al_2,\:\cd\:\al_n\) とすると、\(\bs{K}=\bs{F}(\al_1,\:\al_2,\:\cd\:\al_n)\) である。\(\bs{F}\subset\bs{M}\subset\bs{L}\) なので、
 \(\bs{F}(\al_1,\:\cd\:\al_n)\:\subset\:\bs{M}(\al_1,\:\cd\:\al_n)\:\subset\:\bs{K}(\al_1,\:\cd\:\al_n)=\bs{K}\)
となるが、すなわち、
 \(\bs{F}\:\subset\:\bs{M}(\al_1,\:\al_2,\:\cd\:\al_n)\:\subset\:\bs{K}\)
であり、\(\bs{K}=\bs{M}(\al_1,\:\al_2,\:\cd\:\al_n)\) である。\(f(x)=0\) は \(\bs{M}\) 上の方程式でもあるので、\(\bs{K}\) は \(\bs{M}\) 上の方程式の最小分解体であり、\(\bs{M}\) のガロア拡大体である。

自己同型定義による

\(\bs{L}\) の同型写像のうち、\(\bs{M}\) の元を固定する任意の同型写像を \(\sg\) とする。そうすると \(\sg\) は \(\bs{M}\) の部分集合である \(\bs{F}\) の元も固定する。\(\bs{L}\) は \(\bs{F}\) のガロア拡大体なので、\(\bs{F}\) の元を固定する \(\bs{L}\) の同型写像は自己同型写像である。従って \(\sg\) も自己同型写像であり、\(\bs{L}\) は \(\bs{M}\) のガロア拡大体である。[証明終]


\(\bs{F}\subset\bs{M}\subset\bs{K}\) という体の拡大列があったとき、\(\bs{F}\subset\bs{K}\) がガロア拡大だと上の定理(52C)によって \(\bs{M}\subset\bs{K}\) もガロア拡大です。しかし、\(\bs{F}\subset\bs{M}\) がガロア拡大になるとは限りません。\(\bs{F}\subset\bs{M}\) がガロア拡大になるためには条件が必要で、その条件が満たされば、\(\bs{F}\subset\bs{M}\subset\bs{K}\) は「ガロア拡大の連鎖」になり、そのことが方程式の可解性と結びつきます。それが次の節の大きな主題です。


5.3 ガロア対応


固定体と固定群
固定体と固定群:53A)

体 \(\bs{F}\) 上の方程式の最小分解体(=ガロア拡大体)を \(\bs{K}\) とし、ガロア群を \(G\) とする。\(G\) の部分群 \(H\) によって不変な \(\bs{K}\) の元の集合 \(\bs{M}\) は体になる。これを \(\bs{K}\) における \(H\) の固定体といい、\(\bs{K}(H)\) で表す(または \(\bs{K}^H\))。

また \(\bs{K}\) の中間体 \(\bs{M}\) のすべての元を不変にする \(G\) の部分集合 \(H\) は群になる。これを \(G\) における \(\bs{M}\) の固定群と呼び、\(G(\bs{M})\) で表す(または \(G^M\))。


[証明]

固定体と固定群の定義において、

① \(G\) の部分群 \(H\) によって不変な \(\bs{K}\) の元の集合 \(\bs{M}\) は体になる
② \(\bs{K}\) の中間体 \(\bs{M}\) のすべての元を不変にする \(G\) の部分集合 \(H\) は群になる

の2点を証明する。

 ① の証明 

\(\bs{M}\) が体であることを証明するには、四則演算で閉じていることを言えばよい(1.2 体)。\(\bs{M}\) の任意の2つの元を \(x,\:y\) とし、\(H\) の任意の元を \(\sg\) とする。\(x,\:y\) は \(\bs{K}\) の元でもあるから、
 \(x+y\in\bs{K}\)
である。\(H\) の元 \(\sg\) は \(G\) の元でもあるから \(\sg(x+y)\) が定義できる。\(x,\:y\) は \(\bs{M}\) の元だから、\(H\) の元である \(\sg\) を作用させても不変であり、
 \(\sg(x)=x\)
 \(\sg(y)=y\)
である。すると、
 \(\sg(x+y)=\sg(x)+\sg(y)=x+y\)
となって、\(x+y\) は \(\sg\) によって不変であり、
 \(x+y\in\bs{M}\)
である。以上のことが加減乗除のすべてで成り立つことは明白だから、\(\bs{M}\) は四則演算で閉じていて、体である。

 ② の証明 

\(\bs{M}\) の任意の元を \(x\)、\(H\) の2つの元を \(\sg,\:\tau\) とする。
 \(\sg(x)=x\)
 \(\tau(x)=x\)
である。すると、
 \(\sg\tau(x)=\sg(\tau(x))=\sg(x)=x\)
となり、\(\sg\tau\in H\) となって、\(H\) の元は群演算で閉じている。

また \(H\) の元はもともと \(G\) の元なので、結合法則も成り立つ。\(G\) の単位元を \(e\) とすると、\(e(x)=x\) なので \(e\in H\) である。

さらに \(\sg\) は \(G\) の元なので、\(G\) の中に \(\sg^{-1}\) が存在する。すると、\(\sg(x)=x\) の両辺に左から \(\sg^{-1}\) をかけると、
 \(\sg^{-1}\sg(x)=\sg^{-1}(x)\)
 \(x=\sg^{-1}(x)\)
となり、
 \(\sg^{-1}\in H\)
である。\(H\) は演算で閉じていて、結合法則が成り立ち、単位元と逆元が存在するので、群の定義22A)を満たしている。[証明終]


以上の固定体と固定群の概念を用いると、次のガロア対応の定理が成り立ちます。以降の論証の基礎となる定理です。

ガロア対応の定理
ガロア対応:53B)

\(\bs{F}\) のガロア拡大体を \(\bs{K}\) とし、ガロア群を \(G\) とする。\(G\) の任意の部分群を \(H\) とし、\(H\) による \(\bs{K}\) の固定体 \(\bs{K}(H)\) を \(\bs{M}\) とする(次式)。

\(\begin{eqnarray}
&&G\:\sp\:H &\sp\:\{e\}\\
&&\bs{F}\:\subset\:\bs{K}(H)=\bs{M} &\subset\:\bs{K}\\
\end{eqnarray}\)

\(\bs{M}\)の固定群を \(G(\bs{M})\) とする(次式)。ガロア群の定義により \(G(\bs{M})=\mr{Gal}(\bs{K}/\bs{M})\) である。

\(\begin{eqnarray}
&&\bs{F}\:\subset\:\bs{M} &\subset\:\bs{K}\\
&&G\:\sp\:G(\bs{M}) &\sp\:\{e\}\\
\end{eqnarray}\)

このとき、
 \(G(\bs{M})=H\)
つまり、
\(\begin{eqnarray}
&&\:\:\mr{Gal}(\bs{K}/\bs{M})&=H \\
&&\:\:\bs{K}(G(\bs{M}))&=\bs{M}\\
\end{eqnarray}\)
が成り立つ。


[証明]

\(G\) の任意の部分群である \(H\) は \(\bs{K}\) の部分集合 \(\bs{M}\) を固定する。一方、\(G(\bs{M})\) は \(\bs{M}\) を固定する \(G\) のすべての元の集合で、それが部分群になっている。従って、\(G(\bs{M})\) は \(H\) を含む。つまり
 \(H\:\subset\:G(\bs{M})\)
であり、群位数は、
 \(|H|\:\leq\:|G(\bs{M})|\)
 \((\br{A})\)
である。

\(\bs{K}/\bs{F}\) はガロア拡大であり、\(\bs{M}\) はその中間体だから、中間体からのガロア拡大の定理(52C)によって、\(\bs{K}/\bs{M}\) はガロア拡大である。また、すべての代数拡大体は単拡大体だから(32B)、\(\bs{K}\) の元 \(\theta\) があって \(\bs{K}=\bs{F}(\theta)\) と表せる。これは、\(\bs{K}=\bs{M}(\theta)\) ということでもある。

\(H\) の \(|H|\) 個の元を \(\sg_i\:\:(1\leq i\leq|H|)\) とし、多項式
 \(f(x)=\displaystyle\prod_{i=1}^{|H|}(x-\sg_i(\theta))\)
を考える。この多項式の次数は \(|H|\) である。\(\sg_i(\theta)\) は \(\theta\) の共役な元のどれかである。

\(f(x)\) を展開すると、その係数は \(\sg_i(\theta)\:\:(1\leq i\leq|H|)\) の対称式になる。また、\(\sg_i(\theta)\) に \(H\) の任意の元 \(\sg_k\) を作用させても、\(\sg_i\) は部分群だから演算で閉じており、\(\sg_i(\theta)\) を入れ替えるだけである(51E)。従って \(\sg_i(\theta)\) の対称式に \(\sg_k\) を作用させても不変である。つまり、\(H\) の任意の元は \(f(x)\) の係数を固定する。ということは、\(\bs{M}\) の定義(= \(H\) による \(\bs{K}\) の固定体が \(\bs{M}\))によって、\(f(x)\) の係数は \(\bs{M}\) の元である。

\(\sg_i\) は群だから単位元を含む。従って、
 \(f(\theta)=\displaystyle\prod_{i=1}^{|H|}(\theta-\sg_i(\theta))=0\)
となり、\(\bs{\theta}\)\(\bs{\bs{M}}\) 上の \(\bs{|H|}\) 次方程式 \(\bs{f(x)=0}\) の解の一つである。ゆえに \(\bs{M}\) から単拡大体 \(\bs{K}=\bs{M}(\theta)\) への拡大次数は、\(f(x)\) が \(\bs{M}\) 上の既約多項式なら単拡大体の基底の定理(33F)により \(|H|\) であり、一般には \(|H|\) 以下である。つまり、
 \([\:\bs{K}\::\:\bs{M}\:]\leq|H|\)
である。次数と位数の同一性52B)によると、拡大次数 \([\:\bs{K}\::\:\bs{M}\:]\) は、ガロア群 \(\mr{Gal}(\bs{K}/\bs{M})\) の位数に等しい。従って、
 \(|\mr{Gal}(\bs{K}/\bs{M})|\leq|H|\)
 \(|G(\bs{M})|\leq|H|\)
 \((\br{B})\)
となる。\((\br{A})\) と \((\br{B})\) により、
 \(|G(\bs{M})|=|H|\)
であり、\(G(\bs{M})\:\subset\:H\) と合わせると、
 \(G(\bs{M})=H\)
となる。従って、
\(\begin{eqnarray}
&&\:\:\mr{Gal}(\bs{K}/\bs{M})&=H \\
&&\:\:\bs{K}(G(\bs{M}))&=\bs{M}\\
\end{eqnarray}\)
である。[証明終]


証明の中に対称式という言葉が出てきます。対称式とは、
 変数の任意の入れ替えで不変な多項式
です。2変数 \(x,\:y\) だと、
 \(x+y,\:xy\)(ここまでが基本対称式)、\(x^2+y^2,\:\:(x-y)^2\)
などです。3変数 \(x,\:y\:,z\) だと、
 \(x+y+z,\:xy+yz+zx,\:xyz\)(基本対称式)、\(((x-y)(y-z)(z-x))^2\)
などです。

対称式でよく出てくるのは、方程式の根と係数の関係です。たとえば、\(\bs{Q}\) 上の既約な3次多項式を \(f(x)\) をとし、\(f(x)=0\) の解を \(\al,\beta,\gamma\) とします。
\(\begin{eqnarray}
&&\:\:f(x)&=x^3-ax^2+bx-c\\
&&&=(x-\al)(x-\beta)(x-\gamma)\\
\end{eqnarray}\)
と書くと、
 \(a=\al+\beta+\gamma\)
 \(b=\al\beta+\beta\gamma+\gamma\al\)
 \(c=\al\beta\gamma\)
と、係数が解の基本対称式で表現されます。

また ガロア群 \(\mr{Gal}(\bs{Q}(\al,\beta,\gamma)/\bs{Q})\) の任意の元 を \(\sg\) とします。\(\al,\beta,\gamma\) の任意の対称式を \(S(\al,\beta,\gamma)\in\bs{Q}(\al,\beta,\gamma)\) とすると、
 \(\sg(S(\al,\beta,\gamma))=S(\al,\beta,\gamma)\)
です。ガロア群の元は自己同型写像であり、方程式の解を解の一つに置き換えるので、これが成り立ちます。自己同型写像を作用させて不変なのは有理数です(51A)。従って、\(S(\al,\beta,\gamma)\) は有理数です。もちろん \(f(x)\) が \(n\)次多項式であっても成り立ちます。


\(\bs{F}\subset\bs{M}\subset\bs{K}\) という体の拡大列で \(\bs{F}\subset\bs{K}\) がガロア拡大のとき、\(\bs{M}\subset\bs{K}\) は自動的にガロア拡大ですが(52C)、ある条件があれば \(\bs{F}\subset\bs{M}\) もガロア拡大になって、\(\bs{F}\subset\bs{M}\subset\bs{K}\) が「ガロア拡大の連鎖」になります。その条件は「ガロア対応」と「正規部分群」の概念を用いて示されます。それが次の正規性定理です。次では \(\bs{Q}\) から始まる体の拡大列で記述しています。

正規性定理
正規性定理:53C)

\(\bs{Q}\) のガロア拡大を \(\bs{K}\) とし、\(\mr{Gal}(\bs{K}/\bs{Q})=G\) とする。\(\bs{K}\) の中間体 \(\bs{M}\) と \(G\) の部分群 \(H\) がガロア対応になっているとする。このとき

① \(\bs{M}/\bs{Q}\) がガロア拡大である
② \(H\)が\(G\)の正規部分群である

の2つは同値である。また、これが成り立つとき、
 \(\mr{Gal}(\bs{M}/\bs{Q})\:\cong\:G/H\)
という群の同型が成り立つ。


[① \(\bs{\Rightarrow}\) ②の証明]

\(G\) の任意の元を \(g\) とし、\(\bs{M}\) の任意の元を \(m\) とする。

\(\bs{M}\) が \(\bs{Q}\) のガロア拡大なので、\(m\) の共役な元は \(\bs{M}\) に含まれる。\(g\) は同型写像だから、\(\bs{K}\) の元を共役な元に移す(51D)。つまり、\(g\) を \(m\) に作用させると \(m\) と共役な元に移すことになり、 \(g(m)\in\bs{M}\) である。また \(g^{-1}\) も \(G\) の元だから \(g^{-1}(m)\in\bs{M}\) である。

\(H\) の任意の元を \(h\) とする。\(H\) は \(\bs{M}\) とガロア対応をしているから、\(h\) は \(\bs{M}\) の元を不動にする。ゆえに、
 \(hg^{-1}(m)=g^{-1}(m)\)
である。従って、
 \(ghg^{-1}(m)=gg^{-1}(m)=m\)
となり、\(ghg^{-1}\) は \(\bs{M}\) の元を不動にするから \(H\) の元である。そうすると、
 \(gHg^{-1}\:\subset\:H\)
 \(gH\:\subset\:Hg\)
 \((\br{C})\)
が成り立つ。

また、\(g(m)\) も \(\bs{M}\) の元なので、
 \(hg(m)=g(m)\)
である。従って、
 \(g^{-1}hg(m)=g^{-1}g(m)=m\)
となり、\(g^{-1}hg\) も \(\bs{M}\) の元を不動にするから \(H\) の元である。そうすると、
 \(g^{-1}Hg\:\subset\:H\)
 \(Hg\:\subset\:gH\)
 \((\br{D})\)
が成り立つ。\((\br{C})\) と \((\br{D})\) により、
 \(gH=Hg\)
となって、左剰余類と右剰余類が一致するから、\(H\) は \(G\) の正規部分群である。

[② \(\bs{\Rightarrow}\) ①の証明]

\(\bs{M}\) の任意の元を \(m\) とする。同型写像の延長の定理(51H)により、\(\bs{M}\) の同型写像 \(s\) は \(\bs{K}\) の同型写像 \(g\) に延長できる。つまり、\(g\) を \(\bs{M}\) の元に限定して作用させたとき \(g(m)=s(m)\) となる \(g\) がある。

\(H\) の任意の元を \(h\) とすると、\(h\) は正規部分群の元なので、
 \(g^{-1}hg\:\in\:H\)
である。従って、
 \(g^{-1}hg(m)=m\)
 \(hg(m)=g(m)\)
となり、\(g(m)\) は \(H\) の任意の元で不動である。
ガロア対応の原理により \(\bs{K}(H)=\bs{M}\) なので、
 \(g(m)\:\in\:\bs{M}\)
となり、\(g(m)\) は \(H\) の固定体 \(\bs{M}\) の元である。

\(\bs{M}\)の元に \(g\) を作用させるときは \(g(m)\) は \(s(m)\) そのものなので、
 \(s(m)\:\in\:\bs{M}\)
となる。

以上により、\(\bs{M}\) の同型写像による \(m\) の移り先(= \(m\) と共役な元)は \(\bs{M}\) に含まれることになり、\(\bs{M}/\bs{Q}\) はガロア拡大である。[証明終]

\(\bs{\mr{Gal}(\bs{M}/\bs{Q})\:\cong\:G/H}\) の証明]

同型写像の延長の定理(51H)の証明で示したように、\(\bs{M}\) の同型写像 \(s\) を \(\bs{K}\) の同型写像に延長する可能性は複数ある。\(g_1\) と \(g_2\) を \(s\) の2つの延長とし、\(\bs{M}\)の元を \(m\) とする。\(g_1,\:g_2\) は、\(\bs{M}\) に限定して適用すると \(s\) に等しいから、
 \(g_1(m)=s(m)\)
 \(g_2(m)=s(m)\)
が成り立つ。

\(g_1^{-1}g_2\) を \(m\) に作用させると
\(\begin{eqnarray}
&&\:\:g_1^{-1}g_2(m)&=g_1^{-1}(s(m))\\
&&&=g_1^{-1}(g_1(m))=m\\
\end{eqnarray}\)
となり、\(g_1^{-1}g_2\) は \(\bs{M}\) の元を不動にする。よって、
 \(g_1^{-1}g_2\in\:H\)
 \(g_2\in\:g_1H\)
である。

つまり、\(g_2\) は \(H\) の剰余類の一つの集合 \(g_1H\) に入る。以上で、\(\bs{M}\) の同型写像 \(s\) は、同型写像の延長を通して 剰余類 \(G/H\) の一つを定めることが分かる。

逆に \(g_1\) と \(g_2\) が 剰余類 \(G/H\) の同じ集合に属すると、
 \(g_2\in\:g_1H\)
 \(g_1^{-1}g_2\in\:H\)
 \(g_1^{-1}g_2(m)=m\)
 \(g_2(m)=g_1(m)\)
となり、\(g_1\) と \(g_2\) は \(\bs{M}\) 上で全く同じ作用をする。従って、\(\bs{M}\) 上で \(g_1,\:g_2\) と同じ作用をする \(\mr{Gal}(\bs{M}/\bs{Q})\) の元 \(s\) を定められる。つまり、剰余類 \(G/H\) の一つの集合が \(\mr{Gal}(\bs{M}/\bs{Q})\) の元を一つ定める。

従って、
 \(\mr{Gal}(\bs{M}/\bs{Q})\:\cong\:G/H\)
である。[証明終]

「5.ガロア群とガロア対応」終わり 
次回に続く


nice!(0) 

No.355 - 高校数学で理解するガロア理論(2) [科学]

\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{#1}} \newcommand{\ol}[1]{\overline{#1}} \newcommand{\sb}{\subset} \newcommand{\sp}{\supset} \newcommand{\al}{\alpha} \newcommand{\sg}{\sigma}\newcommand{\cd}{\cdots}\)
 
2.整数の群 
 

2.整数の群」「3.多項式と体」「4.一般の群」の3つの章は、第5章以下のガロア理論の核心に入るための準備です。

第2章の目的は2つあり、一つは整数を素材にして「群」と、それに関連した「剰余類」「剰余群」「既約剰余類」など、ガロア理論の理解に必要な概念を説明することです。

もう一つは、第2章の最後にある「既約剰余類群は巡回群の直積と同型である」という定理を証明することです。この定理はガロア理論の最終段階(6.可解性の必要条件)で必要なピースになります。

まず、"整数の群" に入る前に、整数論の基礎ともいえる「ユークリッドの互除法」「不定方程式」「法による演算」「中国剰余定理」から始めます。これらは後の定理の証明にしばしば使います。


2.1 整数


ユークリッドの互除法
互除法の原理:21A)

自然数 \(a\) と \(b\) の最大公約数を \(\mr{gcd}(a,\:b)\) で表す。自然数 \(a\) を \(b\) で割った余りを \(r\) とすると、

 \(\mr{gcd}(a,\:b)=\mr{gcd}(b,\:r)\)

である。


[証明]

記述を簡略化するため、最大公約数を、
 \(\mr{gcd}(a,\:b)=x\)
 \(\mr{gcd}(b,\:r)=y\)
で表す。\(a\) を \(b\) で割った商を \(p\)、余りを \(r\) とすると、
 \(a=pb+r\) \((0\leq r < b)\)
と書ける。\(a\) と \(pb\) は \(x\) で割り切れるから、\(r\) も \(x\) で割り切れる。つまり \(x\) は \(r\) の約数である。\(x\) は \(b\) の約数でもあるから、\(x\) は \(b\) と \(r\) の公約数である。公約数は \(b\) と \(r\) の最大公約数 \(y\) 以下だから、
 \(x\leq y\)
である。

一方、\(pb\) と \(r\) は \(y\) で割り切れるから、\(y\) は \(a\) の約数である。\(y\) は \(b\) の約数でもあるから、\(y\) は \(a\) と \(b\) の公約数である。公約数は \(a\) と \(b\) の最大公約数以下だから、
 \(y\leq x\)
である。\(x\leq y\) かつ \(y\leq x\) なので \(x=y\)、つまり、
 \(\mr{gcd}(a,\:b)=\mr{gcd}(b,\:r)\)
である。[証明終]


この原理を利用して \(\mr{gcd}(a,\:b)\) を求めることができます。もし \(a\) が \(b\) で割り切れるなら \(\mr{gcd}(a,\:b)=b\) です。そうでないなら、\(a\) を \(b\) で割った余り \(r\) を求め、
 新 \(a\:\longleftarrow\:b\)
 新 \(b\:\longleftarrow\:r\)
と定義し直して、\(a\) が \(b\) で割り切れるかどうかを見ます。こうして次々と \(a\) と \(b\) のペアを作っていけば(=互除法)、\(b\) は単調減少していくので、いずれ \(a\) が \(b\) で割り切れるときがきます。なかなか割り切れなくても、\(b\) が \(1\) までくると絶対に割り切れる。つまり、
 \(\mr{gcd}(a,\:b)=b\)
となるのが最終段階で、そのときの \(b\) が最大公約数です。\(b\) が \(1\) までになってしまったら、最大公約数は \(\bs{1}\)、つまり \(\bs{a}\)\(\bs{b}\) は互いに素です。


ちなみに、ユークリッドの互除法で a と b の最大公約数を求める関数 EUCLID を Python で記述すると次のようになります。

def EUCLID(a, b):
  if a % b == 0:
    return b
  else:
    return EUCLID(b, a % b)

% は Python の剰余演算子で、a % b は「a を b で割った余り」の意味です(定理の記述では \(r\))。つまり、このコードは、
 gcd( a, b )=gcd( b, a % b )
という互除法の原理21A)をストレートに書いたものです(a と b の大小に関係なく動作します)。こういったアルゴリズムはプログラミング言語で記述した方がシンプルでわかりやすくなります。


互除法は多項式の演算にも適用できます。多項式は整数と同じように割り算はできませんが余り算はできるからです。多項式の性質を理解するときに互除法は必須になります。

1次不定方程式
不定方程式の解の存在:21B)

2変数 \(x,\:y\) の1次不定方程式を、
 \(ax+by=c\)
  (\(a,\:b,\:c\) は整数。\(a\neq0,\:b\neq0\))
とし、\(a\) と \(b\) の最大公約数を \(d\) とする。このとき、
 \(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。


このことは1次不定方程式が3変数以上であっても成り立つ。つまり
 \(a_1x_1+a_2x_2+\:\cd\:+a_nx_n=c\)
  (\(a_i\) は \(0\) 以外の整数)
とし、
 \(d=\mr{gcd}(a_1,a_2,\:\cd\:,\:a_n)\)
とする。このとき、
 \(c=kd\) (\(k\) は整数)
なら方程式は整数解を持ち、そうでなければ整数解を持たない。


[証明]

1次不定方程式が整数解を持つとしたら、方程式の左辺は \(d\) で割り切れる、つまり \(d\) の倍数だから、右辺の \(c\) も \(d\) の倍数である。このことの対偶は「\(c\) が \(d\) の倍数でなければ方程式は整数解を持たない」なので、題意の「そうでなければ整数解を持たない」が証明されたことになる。従って以降は「\(c=kd\) (\(k\) は整数)と表せるなら方程式は整数解を持つ」ことを証明する。まず、変数