/
Author: Stewart I.
Tags: mathematik zahlentheorie zahlen exakte wissenschaften
ISBN: 978-3-644-56431-2
Year: 2016
Similar
Text
Unglaubliche Zahlen
Aus dem Englischen von Monika Niehaus und Bernd Schuh
In diesem Buch nimmt der britische Mathe-Guru seine Leser mit auf eine
Reise durch das Reich der Zahlen – reelle, rationale, irrationale, komplexe;
ganz, ganz kleine und unendlich große, Fraktale, Logarithmen, Hochzahlen,
Primzahlen, Kusszahlen und viele mehr. Jedes Kapitel konzentriert sich auf
eine Zahl oder Zahlengruppe und erläutert, warum sie so interessant ist.
«Jede Zahl hat ihre eigene Geschichte zu erzählen», heißt es im Vorwort.
Stewart erzählt sie mit Begeisterung und versteht es geschickt, diese
Geschichten miteinander zu verweben, ob es um die Zahl Pi geht oder zum
Schluss auch um Geheimcodes, den Rubikwürfel und Sudoku.
Darüber hinaus erfährt man viel über die Geschichte der Mathematik und
die Rolle, die sie für unsere Entwicklung spielt. Schließlich waren es die
Zahlen, so der Autor, «die es der Menschheit ermöglicht haben, sich aus
dem Schlamm zu ziehen und nach den Sternen zu greifen».
Ian Stewart, geboren 1945, ist der beliebteste Mathematik-Professor
Großbritanniens und hat längst auch in Deutschland eine treue
Fangemeinde. Seit Jahrzehnten bemüht er sich erfolgreich, seine
Wissenschaft zu popularisieren. Er studierte in Cambridge und promovierte
an der Universität Warwick. Dort ist er heute Professor für Mathematik und
Direktor des Mathematics Awareness Center. Seit 2001 ist Stewart zudem
Mitglied der Royal Society. Bei Rowohlt lieferbar: «Professor Stewarts
mathematische Detektivgeschichten» (2016); «Die letzten Rätsel der
Mathematik» (2015); «Weltformeln» (2014); «Professor Stewarts
mathematische Schätze» (2012/2013); «Professor Stewarts mathematisches
Sammelsurium» (2011).
Inhaltsübersicht
INHALT
Vorwort
Zahlen
KLEINE ZAHLEN
Die unteilbare Einheit
Ungerade und gerade
Kubische Gleichungen
Quadratzahlen
Die Hypotenuse des Pythagoras
Kusszahlen
Die vierte Primzahl
Fibonacci-Potenzen
Magische Quadrate
Das Dezimalsystem
NULL UND NEGATIVE ZAHLEN
Ist nichts eine Zahl?
Weniger als nichts
KOMPLEXE ZAHLEN
Imaginäre Zahlen
RATIONALE ZAHLEN
Das Unteilbare teilen
Näherungen für π
Die Türme von Hanoi
IRRATIONALE ZAHLEN
Die erste bekannte irrationale Zahl
Den Kreis vermessen
Der Goldene Schnitt
Natürliche Logarithmen
Fraktale
Kugelpackungen
Die Tonleiter
Die Apéry-Konstante
Die Euler-Konstante
SPEZIELLE KLEINE ZAHLEN
Die Stringtheorie
Pentominos
Vielecke und Tapetenmuster
Das Geburtstagsparadox
Geheime Botschaften
Die Wurst-Vermutung
Endliche Geometrie
GROSSE ZAHLEN
Fakultäten
Der Rubik-Würfel
Sudoku
Die größte bekannte Primzahl
UNENDLICHE ZAHLEN
Aleph-null: Die kleinste Unendlichkeit
Mächtiges Kontinuum
DAS LEBEN, DAS UNIVERSUM UND …
Kein bisschen langweilig
Weiterführende Literatur
Online-Quellen
Abbildungsnachweis
Vorwort
Zahlen
7
11
KLEINE ZAHLEN
29
1
Die unteilbare Einheit 31
2
Ungerade und gerade 36
3
Kubische Gleichungen
4
Quadratzahlen
5
Die Hypotenuse des Pythagoras 95
6
Kusszahlen 109
7
Die vierte Primzahl
8
Fibonacci-Potenzen 130
9
Magische Quadrate 138
10
63
74
116
Das Dezimalsystem
145
NULL UND NEGATIVE ZAHLEN
0
Ist nichts eine Zahl?
163
–1
Weniger als nichts
176
KOMPLEXE ZAHLEN
i
185
Imaginäre Zahlen 187
161
RATIONALE ZAHLEN
195
Das Unteilbare teilen 197
Eine Näherung für π 205
Die Türme von Hanoi 208
IRRATIONALE ZAHLEN
219
Die erste bekannte irrationale Zahl 221
π ~ 3,141592
Den Kreis vermessen
229
φ ~ 1,618034
Der Goldene Schnitt
246
e ~ 2,718281
Natürliche Logarithmen
Fraktale
257
273
Kugelpackungen
285
Die Tonleiter 294
ζ(3) ~ 1,202056
γ ~ 0,577215
Die Apéry-Konstante
309
Die Euler-Konstante 313
SPEZIELLE KLEINE ZAHLEN
315
11
Die Stringtheorie 317
12
Pentominos 327
17
Vielecke und Tapetenmuster
23
Das Geburtstagsparadox
26
Geheime Botschaften 358
349
335
56
168
Die Wurst-Vermutung
373
Endliche Geometrie 377
GROSSE ZAHLEN
395
26! = 403291461126605635584000000
43252003274489856000
Der Rubik-Würfel
6670903752021072936960
57885161
2
–1
Fakultäten 397
Sudoku
403
409
Die größte bekannte Primzahl (hat 17425170 Ziffern)
413
UNENDLICHE ZAHLEN
419
Aleph-null: Die kleinste Unendlichkeit
Mächtiges Kontinuum
421
431
DAS LEBEN, DAS UNIVERSUM UND … 437
42
Kein bisschen langweilig 439
WEITERFÜHRENDE LITERATUR
ABBILDUNGSNACHWEIS
449
446
Zahlen haben mich schon immer fasziniert. Schon lange vor Schulbeginn
brachte mir meine Mutter Lesen und Rechnen bei. Als ich schließlich nach
meinem ersten Schultag nach Hause kam, soll ich mich angeblich beklagt
haben, dass wir «gar nicht gelernt» hätten! Ich hege den Verdacht, dass
meine Eltern mich auf diesen schwierigen Tag vorbereitet hatten, indem sie
mir erzählten, dass ich in der Schule eine Menge interessanter Dinge lernen
würde, und ich hatte mir ihre Propaganda ein wenig zu sehr zu Herzen
genommen. Aber bald erfuhr ich vieles über Planeten und Dinosaurier und
den Bau von Gipstieren. Und mehr über Zahlen.
Zahlen üben noch immer einen Zauber auf mich aus, und noch immer
lerne ich mehr über sie. Nun weise ich stets darauf hin, dass es in der
Mathematik um vieles geht, nicht nur um Zahlen; beispielsweise geht es
auch um Formen, Muster und Wahrscheinlichkeiten – aber Zahlen ziehen
sich wie ein roter Faden durch das ganze Thema. Und jede Zahl ist
einzigartig, ein Individuum. Einige spezielle Zahlen ragen aus der Menge
der übrigen hervor und spielen offenbar in verschiedenen Gebieten der
Mathematik eine zentrale Rolle. Die bekannteste dieser Superzahlen ist
wohl π (Pi), auf die wir zunächst im Zusammenhang mit Kreisen stoßen,
doch sie zeigt eine bemerkenswerte Tendenz, plötzlich bei Problemen
aufzutauchen, die offenbar überhaupt nichts mit Kreisen zu tun haben.
Die meisten Zahlen können keine derartige Prominenz für sich
beanspruchen, doch selbst bei der bescheidensten Zahl lässt sich in der
Regel irgendein ungewöhnliches Merkmal finden. In Per Anhalter durch
die Galaxis ist die Zahl 42 die Antwort auf die große Frage «nach dem
Leben, dem Universum und dem ganzen Rest». Douglas Adams erklärte, er
habe diese Zahl gewählt, weil eine kurze Umfrage unter seinen Freunden
erbracht habe, dass sie total langweilig ist. Tatsächlich stimmt das nicht, wie
wir im letzten Kapitel noch sehen werden.
Die Gliederung des Buches richtet sich nach den Zahlen selbst, wenn
auch nicht immer in numerischer Reihenfolge. Ebenso wie die Kapitel [1],
[2], [3] und so weiter gibt es ein Kapitel [0], ein Kapitel [42], ein Kapitel [–
1] und ein Kapitel [
], ein Kapitel [π], ein
Kapitel [43252003274489856000] und ein Kapitel [
]. Ganz klar
schaffte eine ganze Menge potenzieller Kapitel nicht den Sprung vom
Zahlenstrahl ins Buch. Jedes Kapitel beginnt mit einer kurzen
Zusammenfassung der Hauptthemen, die darin behandelt werden. Machen
Sie sich keine Sorgen, wenn Ihnen die Zusammenfassung gelegentlich
kryptisch erscheint oder wenn darin pauschale Behauptungen ohne jeden
Beweis aufgestellt werden: All das wird sich klären, wenn Sie weiterlesen.
Der Aufbau ist einfach: Jedes Kapitel konzentriert sich auf eine
interessante Zahl und erklärt, warum sie interessant ist. So ist 2
beispielsweise interessant, weil sich die Unterscheidung zwischen gerade
und ungerade durch die ganze Mathematik und Naturwissenschaft zieht,
43252003274489856000 ist interessant, weil es genau so viele
Möglichkeiten gibt, Rubiks Würfel neu anzuordnen.
Da 42 ein eigenes Kapitel hat, muss sie ebenfalls interessant sein. Nun,
zumindest ein bisschen.
An dieser Stelle muss ich Arlo Guthries Song Alice’s Restaurant
Massacree erwähnen, eine skurrile musikalische Geschichte, die
ausführlich, mit vielen Wiederholungen und in voller Länge von illegaler
Müllentsorgung am Straßenrand erzählt. Nach zehn Minuten unterbricht
Guthrie sein Lied plötzlich und erklärt: «Aber darüber wollte ich eigentlich
gar nicht mit euch sprechen.» Schließlich stellt sich heraus, dass er eben
doch genau darüber sprechen wollte, der Müll jedoch Teil einer größeren
Geschichte ist. Es ist Zeit für meinen Arlo-Guthrie-Moment: In
Wirklichkeit geht es in diesem Buch gar nicht um Zahlen.
Die Zahlen dienen als Einstieg, ein Tor, durch das wir in die erstaunliche
Welt der Mathematik eintauchen können, die mit ihnen verknüpft ist. Jede
Zahl ist etwas Besonderes. Wenn man sie als Individuen schätzen lernt, sind
sie wie alte Freunde. Jede hat ihre eigene Geschichte zu erzählen. Oft führt
diese Geschichte zu einer Menge anderer Zahlen, doch was wirklich zählt,
ist die Mathematik, die sie miteinander verknüpft. Die Zahlen sind die
Schauspieler in einem Schauspiel, und das eigentlich Wichtige dabei ist das
Schauspiel selbst. Aber es gibt kein Drama ohne Schauspieler.
Um dem Buch eine gewisse Struktur zu geben, habe ich es je nach Art
der behandelten Zahlen in Abschnitte unterteilt: kleine ganze Zahlen,
Brüche, reelle Zahlen, komplexe Zahlen, Unendlichkeit … Von einigen
unvermeidlichen Ausnahmen abgesehen, folgt die Entwicklung des Stoffes
einer logischen Reihenfolge, sodass frühere Kapitel die Grundlage für
spätere bilden, selbst wenn es um ein völlig anderes Thema geht. Dieser
Aufbau beeinflusst die Reihenfolge, in der die Zahlen abgehandelt werden,
und erfordert ein paar Kompromisse. Das gilt in besonderem Maße für die
komplexen Zahlen. Sie kommen sehr früh ins Spiel, weil ich sie brauche,
um einige Eigenschaften besser vertrauter Zahlen zu diskutieren.
Desgleichen taucht gelegentlich irgendwo Mathematik für Fortgeschrittene
auf, weil es die einzig vernünftige Stelle ist, um ein solches Thema zu
erwähnen. Wenn Sie auf eine dieser Stellen stoßen und sie schwierig finden,
überspringen Sie sie und lesen Sie einfach weiter; Sie können später darauf
zurückkommen.
Zahlen sind wirklich unglaublich – nicht in dem Sinne, dass man nichts
von dem glauben könnte, was man über sie erfährt, sondern im positiven
Sinne: Sie haben definitiv einen Wow-Faktor. Und den kann man erleben,
ohne zu rechnen. Man kann verstehen, wie sich Zahlen historisch
entwickelt haben, die Schönheit ihrer Muster würdigen, herausfinden, wie
sie benutzt werden und über Überraschungen staunen: «Ich hätte nie
gedacht, dass 56 so interessant ist!» Aber das ist sie. Wirklich!
Und das gilt auch für all die anderen. Einschließlich 42.
Zahlen
1, 2, 3, 4, 5, 6, 7, … Was könnte einfacher sein als das? Und doch sind es
Zahlen, die der Menschheit vielleicht mehr als alles andere geholfen haben,
von den Bäumen herabzusteigen und nach den Sternen zu greifen.
Individuelle Zahlen weisen ihre eigenen typischen Merkmale auf und
eröffnen uns den Zugang zu einer Vielzahl mathematischer Themengebiete.
Bevor wir sie jedoch eine nach der unteren genauer unter die Lupe nehmen,
lohnt sich ein rascher Blick auf drei große Fragen: Wie sind Zahlen
entstanden? Wie hat sich das Zahlenkonzept entwickelt? Und was sind
Zahlen eigentlich?
Die Entstehung der Zahlen
Vor rund 35000 Jahren, in der Jungsteinzeit, ritzte ein unbekanntes
menschliches Wesen 29 Kerben in das Wadenbein (Fibula) eines Pavians.
Dieser Knochen wurde in einer Höhle in den Lebombo-Bergen in
Swasiland gefunden und wird dementsprechend als Lebombo-Knochen
bezeichnet. Vermutlich handelt es sich um einen Zählstab («Kerbholz»): ein
Artefakt, das Zahlen als eine Reihe von Einkerbungen festhält: |, ||, ||| und so
weiter. Ein Mondmonat umfasst 29,5 Tage, daher könnte es sich um einen
primitiven Mondkalender – oder um die Aufzeichnung des weiblichen
Menstruationszyklus – handeln. Oder um eine zufällige Sammlung von
Kerben, was das angeht. Eine Art Knochenkritzelei.
Im Jahr 1937 fand Karl Absolon in der damaligen Tschechoslowakei
einen weiteren Zählstab, einen Wolfsknochen mit 55 Kerben. Dieser
Knochen ist rund 30000 Jahre alt.
Nicht lange danach (1960) entdeckte der belgische Geologe Jean de
Heinzelin de Braucourt zwischen den Überresten einer winzigen
Fischersiedlung, die von einem Vulkanausbruch verschüttet worden war,
das eingekerbte Wadenbein eines Pavians. Die Siedlung befand sich dort,
wo sich heute Ishango befindet, an der kongolesisch-ugandischen Grenze.
Der Knochen ist rund 20000 Jahre alt.
Die einfachste Interpretation ist auch in diesem Fall, dass der IshangoKnochen als Zählstab gebraucht wurde. Einige Anthropologen gehen einen
Schritt weiter und meinen Elemente einer arithmetischen Struktur zu
erkennen, wie Multiplikation, Division und Primzahlen; andere glauben, es
handele sich um einen sechsmonatigen Mondkalender, und noch andere
sind überzeugt, die Kerben seien nur angebracht worden, um einen sicheren
Griff an einem Knochenwerkzeug zu garantieren und hätten keinerlei
mathematische Bedeutung.
Abbildung 1: Vorder- und Rückseite des Ishango-Knochens im belgischen Museum für
Naturwissenschaften in Brüssel.
Die ganze Sache bietet Stoff für reizvolle Spekulationen. Auf dem Knochen
finden sich drei Reihen von Kerben. Die Kerben in der mittleren Reihe sind
in Gruppen von 3, 6, 4, 8, 10, 5 und 7 Strichen angeordnet. Zweimal 3 ist 6,
zweimal 4 ist 8 und zweimal 5 ist 10; die Reihenfolge des letzten Paares ist
jedoch vertauscht, und 7 passt überhaupt nicht ins Muster. Die Reihe links
weist 11, 13, 17 und 19 Kerben auf: die Primzahlen zwischen 10 und 20.
Die Reihe rechts liefert die ungeraden Zahlen 11, 21, 19 und 9. Die Reihe
der Kerben auf der linken Seite addiert sich wie diejenige auf der rechten
Seite zu 60.
Ein Problem bei der Deutung derartiger Muster ist, dass es schwerfällt, in
einer beliebigen Reihe kleiner Zahlen kein Muster zu finden. Beispielsweise
sind in Tabelle 1 die Flächen von zehn Inseln auf den Bahamas aufgelistet,
nämlich Nummer 11 bis 20, was ihre Gesamtgröße angeht. Um die Liste zu
mischen, habe ich die Inseln alphabetisch sortiert. Ich versichere Ihnen: Das
war mein erster Versuch. Zugegeben, ich hätte diese Liste durch eine andere
ersetzt, wenn ich damit nicht hätte zeigen können, was ich zeigen wollte –
aber es funktionierte, und so bin ich dabei geblieben.
Name
Fläche in Quadratmeilen
Berry
12
Bimini
9
Crooked Island
93
Little Inagua
49
Mayaguana
110
New Providence
80
Ragged Island
14
Rum Cay
30
Samana Cay
15
San Salvador Island
63
Tabelle 1
Was fällt uns bei diesem «Zahlenmuster» auf? Es gibt eine ganze Menge
kurzer Folgen mit gemeinsamen Merkmalen:
Abbildung 2: Einige offensichtliche Muster in den Flächen der Bahama-Inseln.
Zunächst einmal ist die ganze Liste wundervoll symmetrisch. An beiden
Enden findet sich ein Tripel von Vielfachen von 3. In der Mitte steht ein
Paar Vielfache von 10, das zwei Vielfache von 7 trennt. Zudem treten zwei
2
2
Quadrate auf, 9 = 3 und 49 = 7 – beides Quadrate von Primzahlen. Ein
weiteres benachbartes Paar besteht aus 15 und 30, eine Zahl die
Verdopplung der anderen. In der Folge 9–93–49 weisen alle Zahlen die
Ziffer 9 auf. Die Zahlen werden abwechselnd größer und kleiner, mit
Ausnahme von 110–80–14. Oh, und ist Ihnen aufgefallen, dass keine dieser
zehn Zahlen eine Primzahl ist?
Genug gesagt. Ein weiteres Problem mit dem Ishango-Knochen ist, dass
praktisch keine Möglichkeit besteht, an zusätzliche Informationen zu
gelangen, die eine dieser Interpretationen stützen könnten. Die
Einkerbungen auf dem Knochen sind jedoch zweifellos faszinierend. Das
sind Zahlenrätsel immer. Daher wollen wir uns ein weniger umstrittenes
Beispiel ansehen.
Vor rund 10000 Jahren benutzten Menschen im Nahen Osten Tonfiguren,
sogenannte Tokens (Zählsteine), um Zahlen wiederzugeben, vielleicht zum
Zweck der Besteuerung oder als Eigentumsbeleg. Die ältesten Beispiele
stammen aus Tepe Asiab und Ganj-i-Dareh Tepe, zwei Örtlichkeiten im
iranischen Zagros-Gebirge. Die Tokens waren kleine, unterschiedlich
geformte Tonklumpen, von denen einige symbolische Markierungen trugen.
Eine mit + gekennzeichnete Kugel symbolisierte ein Schaf, sieben solche
Tokens sieben Schafe. Um nicht allzu viele Tokens herstellen zu müssen,
stand ein anderer Typ Token für 10 Schafe. Ein wiederum anderer Typ
repräsentierte 10 Ziegen, und so weiter. Die Archäologin Denise SchmandtBesserat erkannte, dass die Tokens für die Grundnahrungsmittel der
damaligen Zeit standen: Getreide, Tiere, Ölkrüge.
Um 4000 v. Chr. wurden die Tokens wie Perlen auf eine Schnur gezogen.
Da es jedoch leicht war, die Zahlen durch Hinzufügen oder Wegnehmen
von Tokens zu verändern, kam es zur Einführung von
Sicherheitsmaßnahmen. Die Tokens wurden in Ton gewickelt, der
anschließend gebacken wurde. Ein Streit über Zahlen ließ sich jederzeit
lösen, indem man die Tonhülle aufbrach. Um unnötige Scherben zu
vermeiden, schrieben die Bürokraten im alten Mesopotamien ab 3500
v. Chr. Symbole auf die Hülle, die die darin enthaltenen Tokens auflisteten.
Abbildung 3: Gesiegelte Tonbulle und Zählsteine, Uruk-Periode, aus Susa.
Irgendwann erkannte ein heller Kopf, dass die Symbole die Tokens
überflüssig machten. Das Ergebnis war ein System geschriebener
Zahlensymbole, das den Weg für alle folgenden Systeme zur
Zahlennotation und möglicherweise auch für die Schrift ebnete.
In diesem Buch geht es nicht primär um Geschichte, daher werde ich auf
spätere Notationssysteme zu sprechen kommen, wenn sie im
Zusammenhang mit speziellen Zahlen auftauchen. Beispielsweise
beschäftigt sich Kapitel 10 mit antiken und modernen
Dezimalschreibweisen. Wie der große Mathematiker Carl Friedrich Gauß
jedoch einmal bemerkte, zählen nicht Schreibweisen, sondern Ideen. Die
sich anschließenden Themen ergeben mehr Sinn, wenn man sie im Kontext
des sich wandelnden Zahlenkonzepts der Menschheit betrachtet. Daher
werden wir mit einem kurzen Ausflug durch die wichtigsten Zahlensysteme
und einige wichtige Fachbegriffe beginnen.
Das ständig wachsende Zahlensystem
Wir neigen dazu, Zahlen als etwas Festes und Unwandelbares anzusehen:
als ein Merkmal der natürlichen Welt. Tatsächlich handelt es sich jedoch um
menschliche Erfindungen – wenn auch zugegebenermaßen um sehr
nützliche, denn sie symbolisieren wichtige Aspekte der Natur. Zum
Beispiel, wie viele Schafe jemand besitzt oder wie alt das Universum ist.
Die Natur überrascht uns immer wieder, indem sie uns vor neue Fragen
stellt, deren Beantwortung manchmal neue mathematische Konzepte
verlangt. Manchmal gibt die innere Logik der Mathematik einen Hinweis
auf neue, potenziell nützliche Strukturen. Und von Zeit zu Zeit haben diese
Hinweise und Probleme Mathematiker dazu veranlasst, das Zahlensystem
zu erweitern und neue Arten von Zahlen zu erfinden.
Wir haben gesehen, dass Zahlen zunächst entwickelt und gebraucht
wurden, um Dinge zu zählen. In der Frühzeit der griechischen Antike
startete die Liste der Zahlen mit 2, 3, 4 und so weiter: 1 war etwas
Besonderes, keine «richtige» Zahl. Später, als diese Übereinkunft wirklich
dumm auszusehen begann, wurde auch 1 in den Rang einer echten Zahl
erhoben.
Der nächste große Schritt vorwärts bei der Erweiterung des
Zahlensystems bestand in der Einführung von Brüchen. Brüche sind von
Nutzen, wenn man eine Ware unter mehreren Leuten verteilen möchte.
Wenn drei Leute zwei Scheffel Getreide gleichmäßig unter sich aufteilen
wollen, erhält jeder
eines Scheffels.
Abbildung 4: Links: Ägyptische Hieroglyphen für
Davon abgeleitete Hieroglyphen für Brüche.
und
. Mitte: Wadjet-Auge. Rechts:
Die alten Ägypter stellten Brüche auf dreierlei Weise dar. Sie hatten
spezielle Hieroglyphen für
und . Zudem benutzten sie verschiedene
Teile des Horus- oder Wadjet-Auges, um 1, geteilt durch die ersten sechs
Potenzen von 2, darzustellen. Und schließlich entwickelten sie Symbole für
andere Stammbrüche, bei denen eine 1 im Zähler, aber eine beliebige
natürliche Zahl im Nenner steht, beispielsweise ,
,
,
und so weiter.
Alle anderen Brüche drückten sie als Summe verschiedener Stammbrüche
aus, zum Beispiel:
Wir wissen nicht, warum sie nicht
als
+
schrieben, aber sie taten es
einfach nicht.
Die Zahl null wurde erst viel später eingeführt, wahrscheinlich, weil man
sie zunächst einfach nicht brauchte. Wenn man keine Schafe hat, muss man
sie auch nicht zählen oder auflisten. Null wurde zunächst als Symbol
verwandt und nicht als richtige Zahl angesehen. Als aber (siehe Kapitel [–
1]) chinesische und hinduistische Mathematiker negative Zahlen einführten,
musste man auch 0 als Zahl betrachten. Beispielsweise ist 1 + (–1) = 0, und
die Summe von zwei Zahlen kann sicherlich nichts anderes als ebenfalls
eine Zahl sein.
Mathematiker bezeichnen das System der Zahlen
als natürliche Zahlen, und wenn wir negative Zahlen mit einbeziehen,
erhalten wir die ganzen Zahlen
Brüche, Null und negative Zahlen bilden gemeinsam die rationalen Zahlen.
Eine Zahl ist positiv, wenn sie größer ist als null, und negativ, wenn sie
kleiner ist als null. Daher fällt jede Zahl (sei es eine ganze Zahl oder eine
rationale Zahl) in genau eine dieser drei Kategorien: positiv, negativ oder
null.
Die Zählzahlen
sind die positiven ganzen Zahlen. Diese Übereinkunft führt zu einer recht
holprigen Terminologie: Die natürlichen Zahlen
werden häufig als nichtnegative ganze Zahlen bezeichnet. Tut mir leid.
Lange Zeit kam das Zahlenkonzept über Brüche nicht hinaus. Die alten
Griechen bewiesen jedoch, dass das Quadrat eines Bruches niemals genau
gleich 2 sein kann. Später wurde dies als «die Zahl
ausgedrückt, das heißt,
ist irrational»
ist nicht rational. Die Griechen formulierten
diesen Sachverhalt etwas umständlicher, aber sie wussten, dass
existieren musste: Dem Satz des Pythagoras zufolge entspricht sie der
Länge der Diagonalen eines Quadrats mit der Seite 1. Daher werden weitere
Zahlen gebraucht; mit rationalen allein kommen wir nicht aus. Die
Griechen fanden eine komplizierte geometrische Methode, um irrationale
Zahlen zu handhaben, doch diese Methode war nicht völlig
zufriedenstellend.
Der nächste Schritt in Richtung auf ein modernes Zahlenkonzept wurde
durch die Einführung des Dezimalkommas (,) bzw. im angelsächsischen
Raum des Dezimalpunktes (.) und die Dezimalschreibweise möglich.
Dadurch ließen sich irrationale Zahlen mit sehr hoher Genauigkeit
darstellen. Beispielsweise ist
auf zehn Dezimalstellen korrekt (hier und im übrigen Text bedeutet das
Proportionalzeichen ~ «ist annähernd gleich»). Dieser Ausdruck ist nicht
exakt: Sein Quadrat beträgt tatsächlich
Eine bessere Näherung, auf 20 Dezimalstellen korrekt, ist
aber auch sie ist nicht völlig exakt. Man kann eine unendlich lange
Dezimalentwicklung jedoch tatsächlich logisch exakt begründen. Natürlich
lassen sich solche Ausdrücke nie vollständig ausschreiben, aber man kann
die Idee dahinter skizzieren, sodass sie sinnvoll sind.
Dezimalzahlen mit unendlich vielen Stellen (einschließlich solcher, die
aufhören, die man sich aber durch unendlich viele Nullen fortgesetzt
vorstellen kann), werden als reelle Zahlen bezeichnet, teilweise deshalb,
weil sie direkt mit Messungen von Parametern in der realen Welt wie Länge
oder Gewicht korrespondieren. Je präziser die Messung, desto mehr
Dezimalstellen benötigt man; um einen exakten Wert zu erhalten, braucht
man unendlich viele. Es klingt vielleicht paradox, dass «reell» durch ein
unendliches Symbol definiert ist, das sich nicht vollständig ausschreiben
lässt. Negative reelle Zahlen sind ebenfalls erlaubt.
Bis zum Anbruch des 18. Jahrhunderts wurden keine weiteren
mathematischen Konzepte als echte Zahlen betrachtet. Doch schon im
15. Jahrhundert fragten sich einige Mathematiker, ob es womöglich einen
neuen Zahlentyp gab: die Quadratwurzel aus –1: Das heißt eine Zahl, die,
mit sich selbst multipliziert, –1 ergibt. Auf den ersten Blick scheint das eine
verrückte Idee zu sein, denn das Quadrat einer jeden reellen Zahl ist positiv
oder null. Wie sich herausstellte, handelte es sich jedoch um eine gute Idee,
die –1 mit einer Quadratwurzel zu versehen. Leonhard Euler führte dafür
schließlich das Symbol i ein. Das ist der Anfangsbuchstabe von «imaginär»
(englisch imaginary, französisch imaginaire, lateinisch imaginarius), und
diese Zahl wurde so benannt, um sie von den guten alten reellen Zahlen zu
unterscheiden. Leider führte dies zu einer Menge unnötigem Mystizismus –
Gottfried Leibniz bezeichnete i einst als «Amphibium zwischen Sein und
Nichtsein» –, was eine Schlüsseltatsache verschleierte, nämlich: Sowohl
reelle als auch imaginäre Zahlen haben genau denselben logischen Status.
Beide sind Kinder unseres Geistes, menschliche Konzepte, die die Realität
abbilden, aber nicht selbst real sind.
Die Existenz von i ist notwendig, um eine ganze Reihe anderer neuer
Zahlen einzuführen, die man braucht, um zu rechnen – Zahlen wie 2 + 3i.
Diese Zahlen heißen komplexe Zahlen, und sie haben sich in den letzten
Jahrhunderten in Mathematik und Naturwissenschaften als unverzichtbar
erwiesen. Diese seltsame, aber zutreffende Tatsache ist den meisten
Menschen neu, denn in der Schulmathematik trifft man nur selten auf
komplexe Zahlen. Nicht etwa, weil sie unwichtig wären, sondern weil die
dahinter stehenden Vorstellungen zu komplex und die Anwendungen für die
Schule zu fortgeschritten sind.
Für die wichtigsten Zahlensysteme benutzen Mathematiker
Phantasiesymbole. Ich werde diese Symbole nicht wieder benutzen, doch
Sie sollten sie zumindest einmal gesehen haben:
Diese Systeme passen ineinander wie russische Puppen:
wobei das mengentheoretische Symbol
⊂ bedeutet «ist enthalten in».
Machen Sie sich klar, dass jede ganze Zahl auch rational ist; zum Beispiel
entspricht die ganze Zahl 3 auch dem Bruch . Wir schreiben sie
gewöhnlich nicht so, aber beide Schreibweisen entsprechen derselben Zahl.
Ebenso ist jede rationale Zahl auch reell, und jede reelle Zahl ist auch
komplex. Ältere Systeme werden in neuere inkorporiert, nicht von ihnen
ersetzt.
Selbst die komplexen Zahlen stehen nicht am Ende der Erweiterung des
Zahlensystems, das Mathematiker im Laufe vieler Jahrhunderte aufgebaut
haben. So gibt es zum Beispiel Quaternionen
und Oktonionen
(siehe Kapitel [4]). Es ist jedoch nützlicher, diese Zahlen algebraisch statt
arithmetisch zu betrachten. Daher will ich mit der Erwähnung einer
paradoxeren Zahl schließen – Unendlich. Philosophisch unterscheidet sich
Unendlich von den konventionellen Zahlen und gehört nicht zu einem der
Standard-Zahlensysteme von den natürlichen bis zu den komplexen Zahlen.
Dennoch lungerte sie an den Rändern herum, zahlenartig, aber doch keine
Zahl im eigentlichen Sinn. Bis Georg Cantor unseren Ausgangspunkt,
Zählen, neu bestimmte und nicht nur zeigte, dass Unendlich eine Zahl im
Sinn von Zählen ist, sondern auch, dass es Unendlichkeiten
unterschiedlicher Größe gibt. Dazu gehören
, die «Anzahl» oder
«Mächtigkeit» der natürlichen Zahlen, und
, die Mächtigkeit der reellen
Zahlen. Welche größer ist. Um wie viel größer, darüber wird gestritten, denn
das hängt davon ab, welches Axiomensystem man zur Formalisierung der
Mathematik benutzt.
Aber lassen wir diese Probleme erst einmal beiseite, bis wir genügend
intuitives Verständnis für gewöhnlichere Zahlen gewonnen haben. Was
mich zu meiner dritten Frage bringt.
Was ist eigentlich eine Zahl?
Das klingt nach einer einfachen Frage, und das ist sie auch. Aber die
Antwort ist nicht so einfach.
Wir alle wissen, wie man Zahlen gebraucht. Wir alle wissen, wie sieben
Kühe oder sieben Schafe oder sieben Stühle aussehen. Wir alle können bis
sieben zählen. Aber was ist sieben?
Es ist nicht das Symbol 7. Das ist willkürlich gewählt und sieht je nach
Kultur anders aus. Im Arabischen sieht die Sieben so aus:
Chinesischen hingegen so:
, im
oder in formeller Schreibweise so:
.
Es ist auch nicht das deutsche Wort «sieben». Im Französischen heißt es
sept, im Englischen seven.
Um die Mitte des 19. Jahrhunderts erkannten ein paar logisch denkende
Mathematiker, dass zwar alle Welt seit Jahrtausenden unbekümmert mit
Zahlen hantiert, aber niemand wusste, um was es sich dabei eigentlich
handelt. Daher sprachen sie die Frage aus, die niemals hätte gestellt werden
dürfen: Was ist eine Zahl?
Die Frage ist schwieriger zu beantworten, als es auf den ersten Blick
scheinen mag. Eine Zahl ist kein Ding, das man jemand anderem in der
realen Welt zeigen kann. Es ist eine Abstraktion, ein geistiges Konzept, das
sich von der Realität ableitet, aber nicht wirklich real ist.
Das klingt vielleicht verwirrend, gilt aber nicht nur für Zahlen. Ein
vertrautes Beispiel ist «Geld». Wir alle wissen, wie man etwas bezahlt und
Wechselgeld zurückbekommt, und wir tun dies – das nehmen wir zumindest
an –, indem wir Geld austauschen. Daher stellen wir uns Geld als die
Münzen und Geldscheine in unserer Brieftasche oder unserem
Portemonnaie vor. Aber so einfach ist die Sache nicht. Wenn wir eine
Kreditkarte benutzen, wechseln weder Münzen noch Scheine von einer
Hand in die andere. Vielmehr wandern elektronische Signale durch das
Telefonsystem zur Kreditkartengesellschaft und weiter zu unserer Bank,
und die Zahlen auf mehreren Bankkonten – unserem, dem des Geschäfts,
des Kreditkartenunternehmens – verändern sich. Eine britische 5-PfundNote trug früher die Aufschrift «Ich verspreche, dem Besitzer bei Vorlage
die Summe von fünf Pfund zu zahlen». Es handelt sich also nicht um Geld,
sondern um ein Versprechen, Geld zu zahlen. Vor langer Zeit konnten Sie
mit einer solchen Banknote zur Bank gehen und sie gegen Gold
eintauschen, was als echtes Geld angesehen wurde. Heutzutage tut die Bank
nicht mehr, als sie gegen eine andere 5-Pfund-Note einzutauschen. Aber
auch Gold war eigentlich kein richtiges Geld, sondern lediglich dessen
physische Manifestation. Das wird schon dadurch bewiesen, dass der
Goldpreis schwankt.
Ist Geld also eine Zahl? Ja, aber innerhalb eines ganz bestimmten
juristischen Kontextes. Wenn Sie 1000000 Euro auf ein Stück Papier
schreiben, werden Sie dadurch noch lange nicht zum Millionär. Was Geld
zu Geld macht, ist eine Reihe von gesellschaftlichen Übereinkünften, was
Zahlen auf Zahlungsmitteln bedeuten und wie wir sie gegen Güter oder
andere Zahlungsmittel eintauschen. Wichtig ist, was wir mit
Zahlungsmitteln tun, nicht, was sie sind. Geld ist eine Abstraktion.
Dasselbe gilt für Zahlen. Aber das reicht als Antwort nicht aus, denn die
gesamte Mathematik besteht aus Abstraktionen. Daher fragten sich ein paar
Mathematiker, welche Art von Abstraktion den Begriff «Zahl» definieren
könne. Im Jahr 1884 veröffentlichte der deutsche Mathematiker Gottlob
Frege sein Buch Grundlagen der Arithmetik. Eine logisch-mathematische
Untersuchung über den Begriff der Zahl, in dem er die fundamentalen
Prinzipien formulierte, auf denen Zahlen basieren. Zehn Jahre später ging er
einen Schritt weiter und versuchte, diese Prinzipien aus noch
grundlegenderen Gesetzen der Logik abzuleiten. Sein Werk Grundgesetze
der Arithmetik wurde in zwei Bänden veröffentlicht, der erste 1893 und der
zweite 1903.
Frege begann mit dem Zählprozess und konzentrierte sich nicht auf die
Zahlen, die wir gebrauchen, sondern auf die Dinge, die wir zählen. Wenn
ich sieben Tassen auf einen Tisch stelle und sie «1, 2, 3, 4, 5, 6, 7» abzähle,
sieht es so aus, als seien die wichtigen Objekte die Zahlen. Frege war
anderer Meinung: Er konzentrierte sich auf die Tassen. Zählen funktioniert,
weil wir eine Sammlung von Tassen haben, die wir zählen wollen. Bei einer
anderen Sammlung könnten wir zu einem anderen Ergebnis kommen. Frege
nannte diese Sammlungen Klassen. Wenn wir zählen, wie viele Tassen
diese bestimmte Klasse enthält, stellen wir eine Übereinstimmung, eine
Korrespondenz zwischen der Klasse der Tassen und den Zahlensymbolen 1,
2, 3, 4, 5, 6 und 7 her.
Abbildung 5: Korrespondenz zwischen Tassen und Zahlensymbol.
Das Gleiche gilt für eine Klasse von Untertassen: Auch dort können wir
eine entsprechende Übereinstimmung herstellen:
Abbildung 6: Korrespondenz zwischen Untertassen und Zahlensymbol.
Wenn das der Fall ist, können wir daraus den Schluss ziehen, dass die
Klasse der Untertassen dieselbe Anzahl von Untertassen enthält, wie die
Klasse der Tassen Tassen enthält. Wir wissen sogar, wie viele: sieben.
Das mag so offensichtlich erscheinen, dass es schon ans Banale grenzt,
doch Frege erkannte, dass uns dies etwas durchaus Tiefgründiges und
Wichtiges sagt: Auf diese Weise können wir nämlich zeigen, dass die
Klasse der Untertassen dieselbe Anzahl Untertassen enthält, wie die Klasse
der Tassen Tassen enthält, ohne die Symbole 1, 2, 3, 4, 5, 6 und 7 zu
verwenden und ohne zu wissen, um wie viele Tassen oder Untertassen es
sich handelt. Es genügt, eine Korrespondenz zwischen der Klasse der
Tassen und der Klasse der Untertassen herzustellen:
Abbildung 7: Eine Korrespondenz zwischen Tassen und Untertassen benötigt keine
Zahlensymbole.
Fachsprachlich wird eine derartige Korrespondenz als eineindeutige
Zuordnung bezeichnet: Auf jede Tasse kommt genau eine Untertasse, auf
jede Untertasse genau eine Tasse. Zählen funktioniert nicht, wenn man
Tassen übersieht oder dieselbe Tasse mehrmals zählt. Nennen wir es einfach
eine Korrespondenz, während wir diese technische Bedingung im
Hinterkopf behalten.
Frege kam zu dem Schluss, die Zuordnung von Klassen mit Hilfe einer
Korrespondenz bilde den Kern dessen, was wir mit «Zahl» meinen. Indem
man zählt, wie viele Objekte eine Klasse enthält, ordnet man diese Klasse
einer Standardklasse zu, deren Vertreter durch konventionelle Symbole wie
1, 2, 3, 4, 5, 6, 7 und so weiter symbolisiert werden, je nachdem, welcher
Kultur Sie angehören. Frege war jedoch der Meinung, das Zahlenkonzept
sollte unabhängig von der Kultur sein, daher entwickelte er einen Weg, der
ihm erlaubte, ganz auf willkürliche Symbole zu verzichten. Genauer gesagt
erfand er ein universelles Supersymbol, das für jede Kultur identisch war.
Dabei handelte es sich jedoch nicht um etwas, das sich niederschreiben ließ:
Es war rein gedanklich.
Er begann mit dem Hinweis, dass die Mitglieder einer Klasse selbst
Klassen sein können. Sie müssen es nicht sein, aber es gibt nichts, was sie
davon abhält. Ein Karton mit Dosen voller gebackener Bohnen ist ein
alltägliches Beispiel: Die Mitglieder des Kartons sind Dosen, und die
Mitglieder der Dosen sind Bohnen. Daher hat es seine Richtigkeit, wenn
man Klassen als Mitglieder anderer Klassen verwendet.
Die Zahl «sieben» ist durch Korrespondenz mit jeder beliebigen Klasse
verknüpft, die sich unserer Klasse von Tassen oder den korrespondierenden
Untertassen oder der Klasse zuordnen lässt, die aus den Symbolen 1, 2, 3, 4,
5, 6 und 7 besteht. Eine bestimmte Klasse darunter auszuwählen und das
eine Zahl zu nennen, ist eine willkürliche Entscheidung, der es an Eleganz
mangelt und die unbefriedigend erscheint. Warum also nicht aufs Ganze
gehen und all diese Klassen verwenden? Dann kann «sieben» als die Klasse
aller Klassen definiert werden, die mit einer beliebigen (und somit mit
allen) dieser gerade erwähnten Klassen korrespondieren. Wenn wir das
getan haben, können wir sagen, ob eine bestimmte Klasse sieben Mitglieder
hat, indem wir nachprüfen, ob sie ein Mitglied dieser Klasse von Klassen
ist. Aus Gründen der Zweckdienlichkeit verpassen wir dieser Klasse von
Klassen das Etikett «sieben», aber die Klasse selbst ergibt auch dann Sinn,
wenn wir darauf verzichten. So gelang es Frege, eine Zahl von einem
willkürlich verliehenen Namen (oder Symbol) für eben diese Zahl
abzugrenzen.
Anschließend konnte er definieren, was eine Zahl ist: Es ist die Klasse
aller Klassen, die mit einer gegebenen Klasse korrespondieren (und daher
auch miteinander). Diese Art von Klasse meine ich, wenn ich von einem
«Supersymbol» spreche. Wenn man sich einmal auf diese Denkweise
eingelassen hat, ist es eine brillante Idee. Das Ganze läuft auf Folgendes
hinaus: Statt einen Namen für die Zahl zu wählen, werfen wir vom Konzept
her pauschal alle möglichen Namen zusammen, bilden daraus ein einziges
Objekt und benutzten stattdessen dieses Objekt.
Hat es funktioniert? Das können Sie später (in Kapitel [
herausfinden.
])
KLEINE ZAHLEN
Die uns am besten vertrauten Zahlen sind die ganzen Zahlen
von 1 bis 10.
Jede dieser Zahlen ist ein Individuum mit ungewöhnlichen
Merkmalen, die sie als etwas Besonderes auszeichnen.
Wenn man lernt, diese besonderen Merkmale zu schätzen,
werden Zahlen bald um ihrer selbst willen zu Vertrauten, zu
Freunden und zu interessanten Partnern.
Schon bald werden Sie ein Mathematiker sein.
Die unteilbare Einheit
Die kleinste positive ganze Zahl ist 1. Sie ist die unteilbare Einheit der
Arithmetik: die einzige positive Zahl, die sich nicht durch Addieren zweier
kleinerer positiver Zahlen erzeugen lässt.
Die Basis des Zahlenkonzepts
Mit der Zahl 1 beginnen wir zu zählen. Ganz gleich, von welcher Zahl wir
ausgehen, bilden wir die nächste Zahl, indem wir 1 hinzufügen:
und so weiter. Die Klammern zeigen, welche Operationen als erste
durchgeführt werden sollen. Sie werden im Allgemeinen weggelassen, weil
sich herausgestellt hat, dass die Reihenfolge in diesem Fall keine Rolle
spielt, doch man sollte am besten von Anfang an sorgfältig sein.
Ausgehend von diesen Definitionen und den Grundgesetzen der Algebra,
die bei einer formalen logischen Herleitung eindeutig angegeben werden
müssen, können wir sogar den berühmten Satz «2 + 2 = 4» beweisen. Der
Beweis passt in eine einzige Zeile:
Als einige Mathematiker im 20. Jahrhundert versuchten, die Grundlagen der
Mathematik auf eine feste logische Basis zu stellen, griffen sie auf dieselbe
Idee zurück, doch aus methodischen Gründen begannen sie mit 0 (siehe
Kapitel [0]).
Die Zahl 1 drückt eine wichtige mathematische Vorstellung aus: die der
Eindeutigkeit. Ein mathematisches Objekt mit einer bestimmten
Eigenschaft ist dann eindeutig, wenn nur ein einziges Objekt diese
Eigenschaft aufweist. Eindeutigkeit ist wichtig, weil sie uns erlaubt zu
beweisen, dass irgendein etwas rätselhaftes mathematisches Objekt
tatsächlich eines ist, das wir bereits kennen. Wenn wir zum Beispiel
beweisen können, dass eine unbekannte positive Zahl n sowohl gerade als
auch eine Primzahl ist, dann muss n gleich 2 sein. Was ein komplizierteres
Beispiel angeht: Das Dodekaeder ist der einzige regelmäßige Körper mit
fünfeckigen Seitenflächen (siehe Kapitel [5]). Wenn wir daher in
irgendeinem mathematischen Zusammenhang auf einen regelmäßigen
Körper mit fünfeckigen Seitenflächen stoßen, wissen wir sofort ohne
weitere Überprüfung, dass es sich um ein Dodekaeder handeln muss. Alle
anderen Eigenschaften des Dodekaeders erhalten wir dann kostenlos als
Zugabe.
Das kleine Einmaleins mit der Eins
Niemand hat sich jemals darüber beschwert, das kleine Einmaleins mit der
Eins lernen zu müssen. «Einmal eins ist eins, einmal zwei ist zwei, einmal
drei ist drei …» Wird eine Zahl mit 1 multipliziert oder durch 1 dividiert, so
bleibt sie unverändert:
Es ist die einzige Zahl, die sich so verhält.
Infolgedessen ist 1 gleich ihrem Quadrat, ihrem Kubus und allen höheren
Potenzen:
und so weiter. Die einzige andere Zahl mit dieser Eigenschaft ist 0.
Aus diesem Grund wird die Zahl 1 in der Algebra gewöhnlich
weggelassen, wenn sie als Koeffizient in einer Formel auftaucht. So
2
2
schreiben wir zum Beispiel statt 1x + 3x + 4 lediglich x + 3x + 4. Die
einzige andere Zahl, die ebenso behandelt wird, ist 0, wo etwas noch
2
Drastischeres passiert: statt 0x + 3x + 4 schreiben wir lediglich 3x + 4 und
2
lassen den Term 0x vollständig weg.
Ist 1 eine Primzahl?
Früher wurde sie als Primzahl betrachtet, heute jedoch nicht mehr. Die Zahl
an sich hat sich nicht verändert, die Definition von «Primzahl» hingegen
schon. Manche Zahlen lassen sich bilden, indem man zwei andere Zahlen
miteinander multipliziert: Zum Beispiel ist 6 = 2 × 3 und 25 = 5 × 5. Zahlen
dieser Art bezeichnet man als zusammengesetzt. Andere Zahlen lassen sich
nicht auf diese Weise erzeugen: Diese werden als Primzahlen oder prim
bezeichnet.
Dieser Definition zufolge ist 1 prim, und bis vor rund 150 Jahren war das
die übliche Konvention. Dann stellte es sich jedoch als praktischer heraus, 1
als Spezialfall zu betrachten. Heutzutage wird 1 weder als prim noch als
zusammengesetzt angesehen, sondern als eine Einheit. Ich werde gleich
erklären, warum, doch zunächst müssen wir uns mit einigen weiteren Ideen
beschäftigen.
Die Folge der Primzahlen beginnt
und sie erscheint höchst unregelmäßig, abgesehen von ein paar einfachen
Mustern. Alle Primzahlen mit Ausnahme von 2 sind ungerade, denn jede
gerade Zahl lässt sich durch 2 teilen. Nur 5 kann mit 5 enden, und keine
kann mit 0 enden, denn alle derartigen Zahlen sind durch 5 teilbar.
Jede ganze Zahl größer 1 lässt sich als Produkt von Primzahlen
ausdrücken. Der Prozess wird als Primfaktorzerlegung oder Faktorisierung
bezeichnet, und die betreffenden Primzahlen heißen die Primfaktoren der
Zahl. Zudem lässt sich diese Primfaktorzerlegung nur auf eine einzige
Weise durchführen, wenn man davon absieht, die Reihenfolge zu verändern,
in der die Primzahlen auftreten. Beispielsweise ist
und so weiter, doch die einzige Möglichkeit, 60 zu erhalten, besteht darin,
die erste Liste der Primzahlen neu anzuordnen. So gibt es zum Beispiel
keine Zerlegung in Primzahlen, die wie 60 = 7 × irgendetwas aussieht.
Diese Eigenschaft wird als die Eindeutigkeit der Primfaktorzerlegung
bezeichnet. Vermutlich erscheint Ihnen das offensichtlich, doch wenn Sie
nicht zufällig einen akademischen Abschluss in Mathematik haben, wäre
ich erstaunt, wenn Ihnen jemand schon einmal gezeigt hätte, wie man das
beweist. Euklid hinterließ einen Beweis in seinen Elementen, und er muss
erkannt haben, dass die ganze Sache weder offensichtlich noch einfach ist,
denn er nimmt sich Zeit, auf seinen Beweis hinzuführen. Für einige
allgemeinere zahlenartige Systeme trifft dies nicht einmal zu. Für
gewöhnliche Arithmetik hingegen schon, und es ist eine sehr effektive
Waffe im mathematischen Waffenarsenal.
Die Primzahlzerlegung der Zahlen von 2 bis 31 sieht folgendermaßen
aus:
2 (prim)
3 (prim)
7 (prim)
8=2
12 = 2 × 3
13 (prim)
17 (prim)
22 = 2 × 11
2
3
27 = 3
2
4=2
5 (prim)
6=2×3
9=3
10 = 2 × 5
11 (prim)
14 = 2 × 7
15 = 3 × 5
16 = 2
18 = 2 × 3
19 (prim)
20 = 2 × 5
23 (prim)
24 = 2 × 3
25 × 5
29 (prim)
30 = 2 × 3 × 5 31 (prim)
3
2
2
2
28 = 2 × 7
3
2
2
4
21 = 3 × 7
26 = 2 × 13
Würde man die 1 als Primzahl betrachten, wäre die Primfaktorenzerlegung
nicht eindeutig, und das ist der Hauptgrund dafür, 1 als Spezialfall zu
behandeln. Beispielsweise ist 6 = 2 × 3 = 1 × 2 × 3 = 1 × 1 × 2 × 3 und so
weiter. Eine offensichtlich unangenehme Konsequenz dieser Übereinkunft
ist, dass 1 keine Primfaktoren aufweist. Sie ist und bleibt jedoch ein
Produkt von Primzahlen, wenn auch in recht seltsamer Weise: 1 ist das
Produkt einer «leeren Menge» von Primzahlen. Das heißt, wenn man
überhaupt keine Primzahlen multipliziert, erhält man 1. Das hört sich
wahrscheinlich ziemlich verrückt an, doch für diese Konvention gibt es
durchaus vernünftige Gründe. Ebenso gilt: Wenn man nur eine Primzahl in
der Primfaktorzerlegung einer Zahl hat, dann ist es genau die Zahl.
Ungerade und gerade
Gerade Zahlen sind durch 2 teilbar, ungerade Zahlen sind es nicht. Daher
ist 2 die einzige gerade Primzahl. Sie ist die Summe zweier Quadratzahlen:
2
2
2 = 1 + 1 . Die anderen Primzahlen mit dieser Eigenschaft sind genau die,
die beim Teilen durch 4 einen Rest von 1 lassen. Die Zahlen, die gleich der
Summe zweier Quadratzahlen sind, lassen sich anhand ihrer Primfaktoren
charakterisieren.
Binäre Arithmetik, wie sie in Computern benutzt wird, basiert auf
Zweier- statt auf Zehnerpotenzen. Quadratische Gleichungen, bei denen es
um die zweite Potenz der unbekannten Zahl geht, lassen sich mit Hilfe von
Quadratwurzeln lösen.
Die Unterscheidung zwischen ungerade und gerade erstreckt sich sogar
auf Permutationen – Möglichkeiten, eine Menge von Objekten in einer
bestimmten Reihenfolge anzuordnen. Die eine Hälfte der Permutationen ist
gerade, die andere Hälfte ungerade. Ich werde Ihnen eine hübsche
Anwendung zeigen, einen einfachen Beweis, dass sich ein berühmtes Rätsel
nicht lösen lässt.
Parität (gerade/ungerade)
Eine der wichtigsten Unterscheidungen in der ganzen Mathematik ist
diejenige zwischen geraden und ungeraden Zahlen.
Lassen Sie uns mit ganzen Zahlen 0, 1, 2, 3, … beginnen. Die geraden
Zahlen darunter sind
und die ungeraden sind
Generell ist jede ganze Zahl, die ein Vielfaches von 2 ist, gerade, und jede
ganze Zahl, die kein Vielfaches von 2 ist, ungerade. Im Gegensatz zu dem,
was einige Lehrer anzunehmen scheinen, ist 0 gerade, weil sie ein
Vielfaches von 2 ist, nämlich 0 × 2.
Abbildung 8: Gerade und ungerade Zahlen.
Bei ungeraden Zahlen bleibt ein Rest von 1, wenn man sie durch 2 teilt.
(Der Rest ist ungleich null und kleiner als 2, sodass nur 1 als Möglichkeit
bleibt.) Daher haben gerade Zahlen algebraisch die Form 2n, wobei n eine
ganze Zahl ist, und ungerade Zahlen haben die Form 2n + 1. (Wiederum
zeigt sich, wenn man n = 0 setzt, dass 0 gerade ist.) Um die Konzepte
«gerade» und «ungerade» auf negative Zahlen zu erweitern, erlauben wir,
dass n negativ ist. Nun sind –2, –4, –6 und so weiter gerade, während –1, –
3, –5 und so weiter ungerade sind.
Auf dem Zahlenstrahl wechseln sich gerade und ungerade Zahlen ab.
Abbildung 9: Gerade und ungerade Zahlen wechseln sich auf dem Zahlenstrahl ab.
Eine angenehme Eigenschaft von geraden und ungeraden Zahlen ist, dass
sie einfachen arithmetischen Regeln gehorchen,
gerade + gerade = gerade
gerade × gerade = gerade
ungerade + ungerade = gerade ungerade × ungerade = ungerade
gerade + ungerade = ungerade gerade × ungerade = gerade
ungerade + gerade = ungerade ungerade × gerade = gerade
ganz gleich, um welche Zahlen es sich handelt. Wenn daher jemand
behauptet, 13 × 17 = 222, dann wissen wir ganz ohne Nachrechnen, dass er
sich irrt. Ungerade × ungerade = ungerade, aber 222 ist gerade.
Kleinste und einzige gerade Primzahl
Die Liste der Primzahlen beginnt mit 2, daher ist 2 die kleinste Primzahl. Es
ist zudem die einzige gerade Primzahl, denn definitionsgemäß sind alle
geraden Zahlen durch 2 teilbar. Wenn die Zahl, um die es geht, 4 oder
größer ist, so lässt sie sich als Produkt zweier kleinerer Zahlen ausdrücken,
daher handelt es sich um eine zusammengesetzte Zahl. Diese
Eigenschaften, so einfach und offensichtlich sie auch erscheinen mögen,
verleihen 2 eine einzigartige Stellung im Zahlengefüge.
Zwei Sätze über Quadratzahlen
Am Weihnachtstag 1640 schrieb der brillante Amateurmathematiker Pierre
de Fermat an den Mönch Marin Mersenne und stellte eine interessante
Frage. Welche Zahlen lassen sich als Summe zweier Quadratzahlen
schreiben?
Das Quadrat einer Zahl ist das, was man erhält, wenn man die Zahl mit
sich selbst malnimmt. Daher ist das Quadrat von 1 beispielsweise 1 × 1 = 1,
das Quadrat von 2 ist 2 × 2 = 4, das Quadrat von 3 ist 3 × 3 = 9 und so
2
2
2
2
2
2
weiter. Das Symbol für das Quadrat der Zahl n ist n . So ist 0 = 0, 1 = 1,
2
2
2 = 4, 3 = 9 und so weiter.
Die Quadrate der Zahlen 1 bis 10 sind:
Daher ist vier das erste perfekte Quadrat nach den weniger interessanten
Ergebnissen 0 und 1.
Der Begriff «Quadrat» bzw. «Quadratzahl» wird deshalb benutzt, weil
diese Zahlen auftreten, wenn man Punkte zu Quadraten anordnet:
Abbildung 10: Quadrate.
Wenn wir Quadratzahlen paarweise addieren, können wir als Ergebnis
offensichtlich die Quadratzahlen selbst erhalten: Man muss nur 0 zu einer
Quadratzahl addieren. Wir erhalten jedoch auch neue Zahlen wie
die keine Quadratzahlen sind. Dennoch tauchen viele Zahlen nicht auf, zum
Beispiel 3, 6, 7, 11.
Hier ist eine Tabelle, die alle Zahlen zwischen 0 und 100 zeigt, die die
Summe zweier Quadratzahlen sind. (Um die Zahl in einer bestimmten,
nicht fett gedruckten Zelle zu erhalten, addiert man die fett gedruckte,
oberste Zahl der entsprechenden Spalte zu der fett gedruckten Zahl am
linken Rand der entsprechenden Zeile. Beispielsweise ist 25 + 4 = 29.
Summen größer 100 sind weggelassen.)
0
1 4 9 16 25 36 49 64 81 100
0
0
1 4 9 16 25 36 49 64 81 100
1
1
2 5 10 17 26 37 50 65 82
4
4
5 8 13 20 29 40 53 68 85
9
9
10 13 18 25 34 45 58 73 90
16
16
17 20 25 32 41 52 65 80 97
25
25
26 29 34 41 50 61 74 89
36
36
37 40 45 52 61 72 83
49
49
50 53 58 65 74 98
64
64
65 68 73 80 89
81
81
82 85 90 97
100 100
Tabelle 2
Auf den ersten Blick fällt es schwer, irgendein Muster zu finden, aber es
gibt eines, und Fermat entdeckte es. Der Trick besteht darin, die
Primfaktoren der Zahlen in der Tabelle niederzuschreiben. Wenn wir 0 und
1, die Ausnahmen sind, auslassen, erhalten wir:
In dieser Tabelle habe ich die Primzahlen unterstrichen, denn sie bilden den
Schlüssel zum Problem.
Einige Primzahlen fehlen, nämlich: 3, 7, 11, 19, 23, 31, 43, 47, 59, 67,
71, 79 und 83. Können Sie es Fermat gleichtun und ihr gemeinsames
Merkmal herausfinden?
Jede dieser Primzahlen ist um 1 kleiner als ein Vielfaches von 4.
Beispielsweise ist 23 = 24 – 1 und 24 = 4 × 6. Die Primzahl 2 tritt in meiner
Tabelle auf, und das ist wiederum in gewisser Weise außerordentlich.
Sämtliche ungeraden Primzahlen in meiner Tabelle sind um 1 größer als ein
Vielfaches von 4. Beispielsweise ist 29 = 28 + 1, und 28 = 4 × 7. Zudem
tauchen die ersten Primzahlen dieser Form alle in meiner Liste auf, und
wenn man diese erweitert, scheint keine zu fehlen.
Jede ungerade Zahl ist entweder um 1 kleiner als ein Vielfaches von 4
oder um 1 größer als ein Vielfaches von 4; das heißt, sie hat die Form 4k – 1
oder 4k + 1 für ein ganzzahliges k. Die einzige gerade Primzahl ist 2. Daher
muss jede Primzahl in eine der folgenden drei Kategorien fallen:
Sie ist gleich 2
Sie hat die Form 4k – 1
Sie hat die Form 4k + 1
Die fehlenden Primzahlen in meiner Liste der Summen zweier
Quadratzahlen fallen alle in die Kategorie 4k – 1.
Diese Primzahlen können als Faktoren von Zahlen in der Liste auftreten.
Schauen Sie sich beispielsweise 3 an, die als Faktor von 9, 18, 36, 45, 72,
81 und 90 auftaucht. Tatsächlich sind all diese Zahlen jedoch Vielfache von
2
9, das heißt, von 3 .
Wenn man längere Listen unter demselben Aspekt betrachtet,
kristallisiert sich ein einfaches Muster heraus. In seinem Brief behauptetet
Fermat, bewiesen zu haben, die Zahlen ungleich null, die die Summe
zweier Quadratzahlen sind, seien genau diejenigen, für die jeder Primfaktor
der Form 4k – 1 in einer geraden Potenz auftritt. Der schwierigste Teil war
zu beweisen, dass jede Primzahl der Form 4k + 1 die Summe zweier
Quadratzahlen ist. Albert Girard hat dies bereits 1632 vermutet, aber er gab
keinen Beweis dafür an.
Die Tabelle enthält einige Beispiele, aber wir wollen Fermats
Behauptung anhand eines Beispiels überprüfen, das ein wenig
anspruchsvoller ist. Die Zahl 4001 hat eindeutig die Form 4k + 1; k ist in
diesem Fall gleich 1000. Zudem ist sie prim. Nach Fermats Theorem muss
sie die Summe zweier Quadratzahlen sein. Welcher?
In Ermangelung einer cleveren Methode können wir versuchen,
2
2
2
nacheinander 1 , 2 , 3 und so weiter zu subtrahieren und zu schauen, ob
wir eine Quadratzahl erhalten. Die Rechnung beginnt wie folgt:
und führt schließlich zum Erfolg:
Daher ist
und Fermats Satz hat sich bei diesem Beispiel bewahrheitet.
2
2
Das ist tatsächlich die einzige Lösung, abgesehen von 49 + 40 . Eine
Quadratzahl zu erhalten, indem man eine Quadratzahl von 4001 abzieht, ist
ein seltenes Ereignis; fast sieht es wie reiner Zufall aus. Fermat hat erklärt,
warum das nicht so ist. Er wusste auch, dass es dann, wenn 4k + 1 prim ist,
nur eine Möglichkeit gibt, diese Zahl in zwei Quadratzahlen zu zerlegen.
Es gibt keinen einfachen, praktischen Weg, generell die richtigen Zahlen
zu finden. Gauß lieferte eine Formel, aber die ist auch nicht besonders
praktisch. Darum muss der Beweis zeigen, dass die geforderten
Quadratzahlen tatsächlich existieren, ohne eine bequeme Möglichkeit zu
liefern, sie zu finden. Die ganze Sache ist mathematisch ein wenig
kompliziert und verlangt einiges an Vorbereitung, daher werde ich an dieser
Stelle nicht versuchen, den Beweis zu erklären. Einer der charmanten Züge
der Mathematik ist, dass einfache, wahre Aussagen nicht immer einfach zu
beweisen sind.
Das binäre System
Unser traditionelles Zahlensystem wird als «Dezimalsystem» bezeichnet,
weil es auf der Zahl 10 basiert und 10 auf Latein decem heißt. Daher gibt es
zehn Ziffern von 0 bis 9, und der Wert einer Ziffer steigt bei jedem Schritt
von rechts nach links um einen Faktor 10. Daher bedeutet 10 zehn, 100
hundert, 1000 tausend und so weiter (siehe Kapitel [10]).
Ähnliche Notationssysteme lassen sich auf jeder beliebigen anderen
Zahlenbasis aufbauen. Das wichtigste dieser alternativen Notationssysteme
benutzt 2 als Basis und wird dementsprechend als binäres System oder kurz
Binärsystem (auch Dualsystem) bezeichnet. In diesem Fall gibt es nur zwei
Ziffern, 0 und 1, und der Wert einer Ziffer verdoppelt sich bei jedem Schritt
von rechts nach links. Im Binärsystem steht 10 für 2 (in unserer üblichen
Dezimalschreibweise), 100 bedeutet 4, 1000 bedeutet 8, 10000 bedeutet 16
und so weiter.
Um Zahlen zu erhalten, die keine Potenz von 2 sind, addieren wir
bestimmte Potenzen von 2. Beispielsweise entspricht 23 in
Dezimalschreibweise
dabei wird eine 16, keine 8, eine 4, eine 2 und eine 1 benutzt. Daher wird
23 in Binärschreibweise zu
Die ersten Binärzahlen und ihre dezimalen Äquivalente sind:
dezimal
binär
dezimal
binär
0
0
11
1011
1
1
12
1100
2
10
13
1101
3
11
14
1110
4
100
15
1111
5
101
16
10000
6
110
17
10001
7
111
18
10010
8
1000
19
10011
9
1001
20
10100
10
1010
21
10101
Tabelle 3
Um beispielsweise die Symbole für die Zahl 20 zu decodieren, schreiben
wir sie als Potenzen von 2 auf:
Die Potenzen von 2, für die das Symbol 1 auftaucht, sind 16 und 4: Addiert
ergeben sie 20.
Geschichte
Irgendwann zwischen 500 und 100 v. Chr. schrieb der indische Gelehrte
Pingala ein Buch namens Chandahśāstra
über Reime in der Lyrik, und er
̣
listete verschiedene Kombinationen langer und kurzer Silben auf. Diese
Kombinationen klassifizierte er anhand einer Tabelle, die in moderner Form
0 für eine kurze Silbe und 1 für eine lange verwendet, zum Beispiel so:
Diese Muster entsprechen denjenigen der binären Notation, doch Pingala
führte mit seinen Symbolen keine Berechnungen durch.
Das alte chinesische Buch der Wandlungen, I Ging (Yi Jing), benutzt
64 Gruppen von je sechs durchgehenden (yang) oder unterbrochenen (yin)
Linien zur Vorhersage der Zukunft. Diese Gruppen werden als
Hexagramme bezeichnet. Jedes Hexagramm besteht aus zwei übereinander
angeordneten Trigrammen. Ursprünglich diente das Hexagramm dazu, die
Zukunft vorherzusagen, indem man die Stängel von Schafgarben auf den
Boden warf («Schafgarbenorakel») und bestimmte Regeln anwandte, um zu
entscheiden, welches Diagramm man zu Rate ziehen sollte. Später benutzte
man stattdessen drei Münzen.
Wenn wir 1 verwenden, um eine durchgehende Linie (yang) zu
repräsentieren, und 0, um eine unterbrochene Linie (yin) zu symbolisieren,
entspricht jedes Hexagramm einer sechsstelligen Binärzahl. So stellt das
Hexagramm in Abbildung 11 beispielsweise die Binärzahl 010011 dar.
Nach den Regeln der Weissagungsmethode bezeichnet dies das Hexagramm
60, und es steht für «Artikulation», «Beschränkung» oder «Mäßigung».
Eine typische Deutung beginnt so (fragen Sie mich nicht, was das soll, ich
habe keine Ahnung):
Beschränkung – oben: k’an das Abgründige, Wasser. Unten: tui das
Fröhliche, See.
Urteil – Beschränkung, Erfolg. Auf ärgerlicher Beschränkung muss nicht
beharrt werden.
Abbildung 11: Links: Ein Hexagramm. Rechts: Acht Trigramme.
Abbild – Wasser über See: Abbild der Beschränkung. Daher schafft der
überlegene Mensch Zahl und Maß und prüft die Natur von Tugend und
richtigem Verhalten.
Und wiederum sind zwar die Muster des Binärsystems im I Ging
vorhanden, doch die Arithmetik fehlt. Stärker ausgeprägt zeigt sich die
mathematische Struktur binärer Symbole in den Schriften von Thomas
Harriot (1560–1621), der viele tausend Seiten unveröffentlichter
Manuskripte hinterließ. Eins davon enthält eine Liste, die so beginnt:
und weitergeht bis
Es ist klar, dass Harriot das Grundprinzip der binären Notation verstanden
hatte. Der Kontext dieser Liste ist jedoch eine lange Reihe von Tabellen, die
aufzählen, wie man verschiedene Objekte auf unterschiedliche Weise
kombinieren kann; es geht nicht um Arithmetik.
Im Jahr 1605 erklärte Francis Bacon, wie man die Buchstaben des
Alphabets als Folge binärer Ziffern verschlüsseln kann, und kam ihrem
Gebrauch als Zahlen sehr nahe. Als arithmetische Darstellungsart traten
binäre Zahlen erstmals 1697 in Erscheinung, als Leibniz in einem Brief an
den Herzog Rudolf von Braunschweig-Wolfenbüttel eine «Gedenkmünze
oder -medaille» vorschlug.
Abbildung 12: Leibniz’ binäre Münze.
Darauf sind die Zahlen 1 bis 15 in Binärschreibweise dargestellt, zusammen
mit der Inschrift Omnibus ex nihilo ducendis sufficit unum (Um alles aus
dem Nichts zu entwickeln genügt eins). Mathematisch verwies Leibniz
darauf, dass man jede andere Zahl (alles) erhalten kann, wenn man über das
Symbol für nichts (0) verfügt und eins (1) dazugibt. Aber er machte damit
auch eine religiöse Aussage: Ein einziger Gott kann alles aus dem Nichts
erschaffen.
Die Münze wurde niemals realisiert, aber ihr Entwurf allein war ein
bedeutender Schritt. Ab 1703 beschäftigte sich Leibniz mit
Binärmathematik und veröffentlichte im selben Jahr einen Artikel
«Explication de l’Arithmétique Binaire» (Erklärung der binären Arithmetik)
in der Histoire de l’Académie Royale des Sciences. Dort schrieb er: «Statt in
Zehnerschritten [Dezimalsystem] fortzuschreiten, benutze ich seit vielen
Jahren das simpelste System von allen, das auf Zweien basiert.» Er verweist
darauf, dass die Rechenregeln im Binärsystem so einfach sind, dass
niemand sie vergessen kann, doch er betont gleichzeitig, dass die Methode
unpraktisch ist, weil die binäre Form einer Zahl etwa vier Mal so lang ist
wie die dezimale. Vorausschauend meint er aber: «Das Rechnen mit Zweien
ist wissenschaftlich grundlegender und ermöglicht neue Entdeckungen» und
«Diese Darstellungsweise von Zahlen erleichtert Rechenoperationen aller
Art beträchtlich.»
Hier ist, was er sich dabei gedacht hat. Um mit binären Zahlen zu
rechnen, muss man lediglich Folgendes wissen:
Wenn man diese einfachen Regeln einmal kennt, kann man zwei beliebige
Binärzahlen addieren und multiplizieren, indem man dieselben Verfahren
wie bei der normalen Arithmetik anwendet. Subtraktionen und Divisionen
sind ebenfalls möglich.
Digitales Rechnen
Wir wissen inzwischen, dass Leibniz auf der richtigen Spur war, als er
voraussagte, binäre Zahlen sollten einmal «für die Wissenschaft
grundlegend» werden. Das Binärsystem war ursprünglich eine
mathematische Kuriosität, doch die Erfindung des digitalen Computers hat
dies radikal geändert. Die Digitaltechnik basiert auf der simplen
Unterscheidung des Vorhandenseins oder Fehlens eines elektrischen
Signals. Wenn wir diese beiden Zustände durch 1 und 0 symbolisieren, wird
der Grund für ein Arbeiten im Binärsystem evident. Im Prinzip könnten wir
beim Computerbau das Dezimalsystem benutzen, beispielsweise dadurch,
dass wir die Ziffern 1 bis 9 mit Signalen von 0 Volt, 1 Volt, 2 Volt und so
weiter verknüpfen. Bei komplizierten Berechnungen würden jedoch
Ungenauigkeiten auftreten, und es wäre nicht klar, ob beispielsweise ein
Signal von 6,5 Volt als 6 Volt (mit überhöhter Spannung) oder als 7 Volt
(mit zu niedriger Spannung) gelesen werden sollte. Indem man nur zwei
weit getrennte Spannungsniveaus verwendet, lassen sich Mehrdeutigkeiten
dieser Art vermeiden, wenn man sicherstellt, dass der Fehler stets viel
kleiner ist als die Differenz zwischen den beiden Zuständen.
Mit den heutigen Herstellungstechniken wäre es möglich, zuverlässige
Computer zu bauen, die statt auf der Basis 2 auf der Basis 3 (ternär) oder
einer noch höheren Basis fußen. Doch inzwischen basiert ein Großteil
unserer Computertechnik auf dem Binärsystem, und es ist einfach, im
Rahmen der Berechnung vom Binär- zum Dezimalsystem überzuwechseln,
daher bieten andere Basen im Vergleich zum Standard-Binärsystem nicht
genügend Vorteile.
Signum einer Permutation
Der Unterschied zwischen geraden und ungeraden Zahlen spielt für die
Theorie der Permutationen eine besonders wichtige Rolle; unter
Permutation versteht man die Umordnung der Anordnung von Zahlen oder
Buchstaben oder anderen mathematischen Objekten in einer bestimmten
Reihenfolge. Wenn die Liste n Objekte enthält, dann ist die Gesamtzahl
aller möglichen Permutationen gleich der Fakultät:
weil wir für die Wahl der ersten Zahl n Möglichkeiten haben, für die Wahl
der zweiten n – 1, der dritten n – 2 und so weiter (siehe Kapitel [26!]).
Permutationen treten in zwei Formen auf: gerade und ungerade. Gerade
Permutationen vertauschen die Reihenfolge einer ungeraden Anzahl von
Objektpaaren. Darauf werde ich gleich noch ausführlicher zurückkommen.
«Gerade» und «ungerade» werden in diesem Zusammenhang als Signum
der Parität der Permutation bezeichnet.
Von den n! möglichen Permutationen ist genau die Hälfte gerade und die
andere Hälfte ungerade. (Es sei denn, n = 1: In diesem Fall gibt es nur eine
gerade und keine ungerade Permutation.) Für n ≥ 2 gibt es
gerade und
ungerade Permutationen.
Der Unterschied zwischen geraden und ungeraden Permutationen lässt
sich anhand von Diagrammen verstehen. Denken Sie beispielsweise an die
Permutation (nennen wir sie A), die aus der Liste
die neue Reihenfolge
macht. Die Zahlen in der Liste verschieben sich auf folgende Weise:
Abbildung 13: Diagramm für Permutation A.
Genauso gilt: Wenn wir mit einer Liste
beginnen und sie in der Reihenfolge
neu anordnen, dann verschieben sich die Symbole folgendermaßen:
Abbildung 14: Diagramm für Permutation B.
Diese Permutation wollen wir B nennen. Beachten Sie, dass die Liste, mit
der wir beginnen, nicht die normale numerische Reihenfolge aufweisen
muss. Was zählt, ist nicht die Reihenfolge als solche, sondern wie sie
verändert wird.
Permutationen kombinieren
Wir können zwei Permutationen kombinieren, um eine weitere zu schaffen.
Dazu arrangieren wir die Liste entsprechend der ersten Permutation um und
ordnen anschließend das Ergebnis entsprechend der zweiten neu. Der
Prozess lässt sich am besten verstehen, wenn man die beiden Diagramme
zusammenfügt:
Abbildung 15: Diagramm für Permutation A, gefolgt von B.
Die beiden Permutationen A und B werden durch die obere und die untere
Reihe von Pfeilen angezeigt. Um beide zu kombinieren (und eine
Permutation zu erhalten, die ich AB nennen möchte), folgen wir
nacheinander korrespondierenden Pfeilpaaren und entfernen die mittlere
Zahlenreihe. Das Ergebnis sieht so aus:
Abbildung 16: Diagramm für Permutation AB, vor dem Durchziehen der Pfeile.
Und schließlich ziehen wir die Pfeile durch und erhalten:
Abbildung 17: Diagramm für Permutation AB, nach dem Geraderichten der Pfeile.
Das ist die Permutation, die die Liste
in die Reihenfolge
bringt.
Kreuzungszahlen und Parität
Bei der Permutation A kreuzt der lange Pfeil die vier anderen Pfeile. Wir
sagen, diese Permutation hat die Kreuzungszahl (crossing number) 4 und
schreiben c(A) = 4. Permutation B hat die Kreuzungszahl 3, daher ist c(B) =
3. Ihre Kombination AB hat die Kreuzungszahl 5, dementsprechend ist
c(AB) = 5.
Bevor wir die Pfeile gerade gerichtet haben, hatte AB die Kreuzungszahl
7. Das ist die Summe der Kreuzungszahlen von A und B: 4 + 3 = 7. Wenn
wir die Pfeile gerade richten, verschwinden zwei Kreuzungen – die beiden
auf der rechten Seite. Diese beiden Pfeile kreuzen sich zunächst, kreuzen
dann aber wieder zurück. Daher «löscht» das zweite Überkreuzen das erste
aus.
Diese Beobachtung gilt ganz allgemein. Wenn wir zwei beliebige
Permutationen A und B zu AB kombinieren, dann ist die Anzahl der
Überkreuzungen für AB vor dem Geraderichten der Pfeile gleich der Anzahl
für A plus der Anzahl für B. Wenn wir die Pfeile gerade richten, bleibt die
Anzahl der Pfeile entweder dieselbe oder wir subtrahieren eine gerade Zahl.
Obwohl c(AB) nicht gleich c(A) + c(B) sein muss, ist ihre Differenz stets
gerade. Und das heißt, dass die Parität von c(AB) gleich der Summe der
Paritäten c(A) und c(B) ist.
Wir sagen, dass eine Permutation A dann gerade ist, wenn c(A) gerade ist,
und ungerade, wenn c(A) ungerade ist. Entsprechend ist die Parität der
Permutation A «gerade» oder «ungerade».
Eine gerade Permutation vertauscht die Reihenfolge einer geraden
Anzahl von Symbolpaaren.
Eine ungerade Permutation vertauscht die Reihenfolge einer ungeraden
Anzahl von Symbolpaaren.
Bei der Kombination von Permutationen ergibt sich daher folgendes
Bild:
Gerade kombiniert mit gerade ergibt gerade.
Ungerade kombiniert mit ungerade ergibt gerade.
Gerade kombiniert mit ungerade ergibt ungerade.
Ungerade kombiniert mit gerade ergibt ungerade.
Das ist genauso wie beim Addieren gerader und ungerader Zahlen. Diese
angenehmen Eigenschaften werden überall in der Mathematik verwendet.
Das Fünfzehnerspiel
Paritäten von Permutationen mögen sehr fachspezifisch erscheinen, doch
sie haben viele Anwendungen. Eine der amüsantesten findet sich bei einem
Puzzle, das von dem amerikanischen Postbeamten Noyes Chapman
erfunden wurde. Es wurde zu einer Welle, die über die USA, Kanada und
Europa schwappte. Der Geschäftsmann Matthias Rice produzierte es unter
dem Namen Gem Puzzle, und ein Zahnarzt namens Charles Pevey setzte
einen Preis für die Lösung aus. Das Fünfzehnerspiel ist auch unter der
Bezeichnung 15-Puzzle, 14-15-Puzzle, Schiebepuzzle, Schiebefax oder
Ohne-Fleiß-kein-Preis-Spiel bekannt.
Das Puzzle besteht aus 15 verschiebbaren Spielsteinen in einem 4×4Quadrat, die von 1 bis 15 durchnummeriert und ursprünglich so angeordnet
sind, dass 14 und 15 nicht vertauscht sind. Ein leeres Feld unten links im
Quadrat (Abbildung links) bleibt frei. Ziel des Geduldsspiels ist es,
sukzessiv Spielsteine in das leere Feld zu schieben – das sich bewegt, wenn
die Spielsteine verschoben werden –, um die Spielsteine in die richtige
Reihenfolge zu bringen (Abbildung rechts).
Abbildung 18a: Beginnen Sie so …
Abbildung 18b: … und enden Sie so.
Dieses Puzzle wird oft dem berühmten amerikanischen Puzzleexperten Sam
Loyd zugeschrieben, der das Interesse daran 1886 neu entfachte, als er
einen Preis von 1000 Dollar für die Lösung auslobte. Loyd war sich jedoch
sicher, dass er nicht würde zahlen müssen, denn 1879 hatten William
Johnson und William Story bewiesen, dass das Fünfzehner-Puzzle keine
Lösung hat.
Der Schlüsselpunkt ist, dass man sich jede Position in dem Puzzle als
eine Permutation der ursprünglichen Position vorstellen kann und das leere
Feld als einen 16. «virtuellen Spielstein». Die ursprüngliche Position, bei
der nur ein einziges Kachelpaar vertauscht ist (14 und 15), ist eine ungerade
Permutation der geforderten Endposition. Das Erfordernis, dass das leere
Feld wieder dort endet, wo es gestartet ist, besagt jedoch implizit, dass
zulässige Züge nur zu geraden Permutationen führen.
Daher können zulässige Züge, ganz unabhängig vom Ausgangszustand,
nur genau die Hälfte der 16! möglichen Neuanordnungen realisieren, was
auf 10461394944000 Anordnungen hinausläuft. Durch Versuch und Irrtum
kann man unmöglich mehr als einen Bruchteil dieser möglichen
Anordnungen durchprobieren, was die Spieler leicht zu der Überzeugung
verleiten kann, dass sie, wenn sie es nur lange genug weiter versuchen,
irgendwann auf die Lösung stoßen werden.
Quadratische Gleichungen
Mathematiker unterscheiden algebraische Gleichungen nach ihrem Grad,
worunter sie die höchste Potenz der auftretenden Unbekannten verstehen.
Die Gleichung
ist eine Gleichung ersten Grades, denn es tritt nur die erste Potenz von x
auf. Die Gleichung
ist eine Gleichung zweiten Grades, weil die zweite Potenz (das Quadrat)
von x auftritt, aber keine höhere Potenz. Die Gleichung
ist eine Gleichung dritten Grades, und so weiter.
Für die Gleichungen mit kleinen Potenzen gibt es spezielle Namen:
Wenn man eine Gleichung vorgelegt bekommt, besteht die Hauptaufgabe
darin, sie zu lösen. Das heißt, es geht darum, den Wert (oder die Werte) der
unbekannten Größe x zu finden, der die Gleichung löst. Die lineare
Gleichung 5x – 10 = 0 hat die Lösung x = 2, denn 5 × 2 – 10 = 0. Die
2
2
quadratische Gleichung x – 3x + 2 = 0 hat die Lösung x = 1, denn 1 – 3 +
2
2 = 0, aber sie hat auch noch eine zweite Lösung x = 2, denn 2 – 6 + 2 = 0
3
2
ist ebenfalls richtig. Die kubische Gleichung x – 6x + 11x – 6 = 0 hat
sogar drei Lösungen, x = 1, 2 und 3. Die Zahl der (reellen) Lösungen ist
stets kleiner oder gleich dem Grad der Gleichung.
Lineare Gleichungen sind leicht zu lösen, und allgemeine Methoden
dafür gibt es seit Jahrtausenden; sie reichen in eine Zeit vor Erfindung der
symbolischen Algebra zurück. Wie weit wissen wir nicht genau, denn es
gibt keine geeigneten Aufzeichnungen.
Quadratische Gleichungen, also solche vom Grad 2, stellen schon eine
härtere Nuss dar. Doch bereits die alten Babylonier vor 4000 Jahren
wussten, wie man sie lösen kann, und darüber wollen wir als Nächstes
sprechen. Kubische, quartische, quintische und sextische Gleichungen
werde ich in den Kapiteln über die Zahlen 3, 4 und 5 diskutieren.
Die babylonische Lösung
Abbildung 19: Zwei mathematische babylonische Tontafeln.
Im Jahr 1930 erkannte der Historiker Otto Neugebauer, dass Tontafeln aus
dem antiken Babylon erklärten, wie man quadratische Gleichungen löst.
Zunächst müssen wir uns ein wenig mit der babylonischen Schreibweise
für Zahlen beschäftigen. Die Babylonier benutzten nicht 10 als Basis,
sondern 60. Daher bedeutete 2015 in babylonischer Notation (sie benutzten
in Ton gedrückte keilförmige Markierungen anstelle unserer Ziffern):
was in Dezimalschreibweise
ergibt. Sie verfügten auch über eine Version unseres Dezimalkommas,
durch das Vielfache von
,
und so weiter addiert wurden.
Historiker schreiben babylonische Zahlensymbole so um:
und benutzen einen Strichpunkt (;) anstelle des Kommas. Beispielsweise ist
Abbildung 20: Babylonische Keilschriftsymbole für die Zahlen 1 bis 59.
Nun zu den quadratischen Gleichungen. Auf einer babylonischen Tontafel,
die rund 4000 Jahre zurückdatiert, wird verlangt: «Finde die Seiten eines
Quadrats, wenn die Fläche minus der Seite 14,30 ist.» Bei diesem Problem
geht es um das Quadrat der Unbekannten (die Fläche des Quadrats) wie
auch um die Unbekannte selbst, daher läuft das Ganze auf eine quadratische
Gleichung hinaus. Die Tontafel erklärt den Lösungsweg:
Babylonische
unsere Schreibweise
Anweisungen
Nimm die Hälfte von 1,
also 0;30
Multipliziere mit 0;30 mal
0;30, also mit 0;15
Addiere dies zu 14,30,
um 14,30;15 zu erhalten
Das ist das Quadrat von
29;30
Nun addiere 0;30 zu
29;30
Das Ergebnis ist 30, die
30
Seite des Quadrats.
Tabelle 4
Der komplizierteste Schritt ist der vierte, der eine Zahl findet (
deren Quadrat
ist. Die Zahl
),
ist die Quadratwurzel von
. Quadratwurzeln sind das wichtigste Werkzeug zur Lösung von
quadratischen Gleichungen.
Diese Art der Darstellung ist typisch für die babylonische Mathematik.
Bei der Beschreibung geht es um spezielle Zahlen, doch die Methode ist
allgemeiner zu verstehen. Wenn man die Zahlen systematisch verändert und
demselben Verfahren folgt, kann man auch andere quadratische
Gleichungen lösen. Wenn man die moderne algebraische Schreibweise
benutzt, die Zahlen durch Symbole ersetzt und mit einer allgemeinen
quadratischen Gleichung
beginnt, dann führt die babylonische Methode zu der Antwort
Diese Formel erkennen Sie vielleicht: Es ist genau dieselbe, die wir in der
Schule lernen.
Kubische Gleichungen
Die kleinste ungerade Primzahl ist 3. Die kubische Gleichung, bei der es
um die dritte Potenz (Kubus) der Unbekannten geht, lässt sich mit Hilfe von
Kubikwurzeln und Quadratwurzeln lösen. Der Raum hat 3 Dimensionen.
Einen Winkel allein mit Zirkel und Lineal in drei gleiche Teile zu teilen, ist
unmöglich. Genau 3 regelmäßige Vielecke kacheln die Ebene. Sieben
Achtel aller Zahlen sind die Summe dreier Quadratzahlen.
Die kleinste ungerade Primzahl
Die kleinste Primzahl ist 2, und sie ist gerade. Die nächste Primzahl ist 3,
und sie ist die kleinste ungerade Primzahl. Jede andere Primzahl hat
entweder die Form 3k + 1 oder 3k + 2 für ein ganzzahliges k, denn 3k ist
durch 3 teilbar. Aber über 3 lässt sich noch eine ganze Menge anderer
interessanter Dinge erzählen, und ich werde die Primzahlen ausführlich (in
Kapitel [7]) behandeln.
Kubische Gleichungen
Einer der großen Triumphe der Mathematik im Italien der Renaissance war
die Entdeckung, dass sich eine kubische Gleichung mit Hilfe einer
algebraischen Formel lösen lässt, in der Kubik- und Quadratwurzeln eine
entscheidende Rolle spielen.
Die Renaissance war eine Zeit des intellektuellen Umbruchs und der
Erneuerung. Die Mathematiker jener Tage bildeten da keine Ausnahme, und
sie waren entschlossen, die Grenzen und Beschränkungen der klassischen
Mathematik zu überwinden. Der erste große Durchbruch war ein Verfahren
zur Lösung kubischer Gleichungen. Verschiedene Mathematiker fanden
verschiedene Versionen dieses Verfahrens, hielten ihr Wissen aber geheim.
Schließlich veröffentlichte Girolamo Cardano, auch als Hieronymus
Cardanus bekannt, diese Methoden in einem der bedeutendsten
Algebrabücher der Welt, der Ars Magna («Die große Kunst»).
Anschließend beschuldigte ihn einer seiner Kollegen, sein Geheimnis
gestohlen zu haben. Das war nicht ganz unwahrscheinlich. Um 1520 war
Cardano nämlich bankrott. Um seine finanzielle Situation zu bessern,
wandte er sich dem Glücksspiel zu und nutzte seine mathematischen
Fähigkeiten, um seine Gewinnchancen zu verbessern. Cardano war ein
Genie, aber auch ein Halunke. Wie wir sehen werden, hatte er jedoch in
diesem Fall eine plausible Entschuldigung.
Hier seine Geschichte: Im Jahr 1535 lieferten sich Antonio Fior und
Niccolò Fontana (genannt Tartaglia, der «Stotterer») einen öffentlichen
Schlagabtausch. Sie stellten einander kubische Gleichungen, die es zu lösen
galt, und Tartaglia schlug Fior überzeugend. Damals wurden kubische
Gleichungen in drei eigenständige Typen unterteilt, denn man gebrauchte
noch keine negativen Zahlen. Fior wusste nur, wie man einen dieser
Gleichungstypen löste, und anfangs wusste Tartaglia lediglich, wie man
einen der beiden anderen Typen löste, doch kurz vor dem Wettstreit fand er
heraus, wie sich sämtliche Typen lösen ließen. Daher schickte er Fior nur
die Typen, von denen er wusste, dass sein Gegner daran scheitern würde,
und besiegte ihn somit auf der ganzen Linie.
Cardano, der an seinem Algebrabuch arbeitete, hörte von dem Wettstreit
und erkannte, dass Fior und Tartaglia wussten, wie man kubische
Gleichungen löst. Diese unvergleichliche Entdeckung würde den Wert
seines Buches stark erhöhen, darum bat er Tartaglia, ihm seine Methode zu
verraten. Schließlich ließ sich Tartaglia erweichen und eröffnete ihm sein
Geheimnis, wobei er später behauptete, dies sei unter dem Siegel der
Verschwiegenheit geschehen. Aber die Methode erschien in Cardanos Ars
Magna, und so beschuldigte Tartaglia den Autor des Plagiats.
Cardano hatte jedoch eine Entschuldigung und zudem guten Grund, sein
Versprechen, so er es denn gegeben haben sollte, zu umgehen. Sein Schüler
Lodovico Ferrari hatte herausgefunden, wie man Gleichungen 4. Grades
löst (siehe Kapitel [4]), und Cardano wollte diese Gleichungen ebenfalls in
sein Buch aufnehmen. Ferraris Methode erforderte jedoch die Lösung einer
damit verknüpften kubischen Gleichung, daher konnte Cardano Ferraris
Entdeckung nicht publizieren, ohne gleichzeitig Tartaglias zu
veröffentlichen. Es muss wirklich frustrierend gewesen sein.
Dann erfuhr er, dass Fior ein Schüler von Scipio del Ferro gewesen war,
von dem es hieß, er habe alle drei Typen kubischer Gleichungen gelöst und
lediglich die Lösung für einen Typ an Fior weitergegeben. Del Ferros
unveröffentlichte Notizen befanden sich im Besitz von Annibale del Nave.
Daher reisten Cardano und Ferrari 1543 nach Bologna, um del Nave
aufzusuchen, und in den Unterlagen stießen sie tatsächlich auf die
Lösungen aller drei Typen kubischer Gleichungen. So konnte sich Cardano
zu Recht darauf berufen, er habe del Ferros Methode publiziert und nicht
diejenige von Tartaglia.
Dennoch fühlte sich Tartaglia betrogen und veröffentlichte eine lange,
bittere Schmährede gegen Cardano. Daraufhin forderte ihn Ferrari zu einer
öffentlichen Debatte heraus, die er haushoch gewann. Tartaglia sollte es
nicht mehr gelingen, seinen Ruf wiederherzustellen.
Mit modernen Symbolen können wir Cardanos Lösung der kubischen
3
Gleichung für einen Spezialfall niederschreiben, nämlich wenn x + ax + b
2
= 0 ist und a und b bestimmte Zahlen sind. (Wenn x präsent ist, kann man
es mit einem raffinierten Trick loswerden, daher gilt diese Formel
tatsächlich allgemein.) Die Antwort lautet
und darin finden sich Kubik- und Quadratwurzeln. Ich will Ihnen die
schmutzigen Details ersparen. Sie sind clever und elegant, aber diese Art
von Algebra ist etwas für Kenner, und man findet sie leicht in einem
Lehrbuch oder im Internet.
Die Dimensionen des Raumes
Die euklidische Geometrie betrachtet zwei unterschiedliche Räume: die
Geometrie der Ebene, wo sich tatsächlich alles auf ein flaches Blatt Papier
beschränkt, und die Geometrie des dreidimensionalen Raumes. Die Ebene
ist zweidimensional: Die Lage eines Punktes lässt sich mit zwei
Koordinaten (x, y) bestimmen. Der Raum, in dem wir leben, ist
dreidimensional: Die Lage eines Punktes lässt sich mit drei Koordinaten (x,
y, z) festlegen.
Eine andere Möglichkeit, dasselbe zu sagen: Es gibt in der Ebene (die
nun senkrecht wie die Seite eines Buches oder ein Computerbildschirm
steht) zwei unabhängige Richtungen: links-rechts und oben-unten. Im Raum
gibt es hingegen drei unabhängige Richtungen: Nord-Süd, Ost-West und
oben-unten.
Mehr als 2000 Jahre lang haben Mathematiker (und alle übrigen
Menschen) angenommen, drei Dimensionen seien das Maximum. Sie
gingen davon aus, einen vierdimensionalen Raum könne es nicht geben
(siehe Kapitel [4]), weil kein Platz für eine vierte unabhängige Richtung da
war. Wenn Sie meinen, den gebe es doch, bewegen Sie sich doch bitte in
diese Richtung. Diese Überzeugung beruhte jedoch auf einer Vermengung
des realen physikalischen Raumes und abstrakten mathematischen
Möglichkeiten.
Aus der Perspektive der normalen menschlichen Wahrnehmung scheint
sich der Raum recht gut an die Vorgaben der dreidimensionalen
euklidischen Geometrie zu halten. Unsere Wahrnehmung beschränkt sich
jedoch auf unser nahes Umfeld, und nach Albert Einstein entspricht das
euklidische Bild der Welt nicht genau der Geometrie des Raumes, wenn
man größere Maßstäbe betrachtet. Sobald wir uns aus der physikalischen in
die abstrakte Welt mathematischer Konzepte bewegen, lässt sich der
«Raum» problemlos per definitionem mit so vielen Dimensionen ausstatten,
wie wir wollen. Wir erlauben in unserer Liste einfach weitere Koordinaten.
Im vierdimensionalen Raum werden Punkte beispielsweise mit Hilfe einer
Liste von vier Koordinaten (w, x, y, z) festgelegt. Eine bildliche Darstellung
ist nicht mehr möglich – zumindest nicht in der üblichen Weise –, aber das
ist eine Einschränkung des physikalischen Raumes und der menschlichen
Wahrnehmung, keine Einschränkung der Mathematik.
Wichtig ist dabei festzuhalten, dass wir eigentlich auch keine
dreidimensionalen Objekte zeichnen können, denn Papier und
Computerbildschirme sind zweidimensional. Unser Sehsystem ist jedoch
daran gewöhnt, in zweidimensionalen Projektionen dreidimensionale
Objekte zu erkennen, denn die einfallenden Lichtstrahlen werden von der
Netzhaut wahrgenommen, die ebenfalls annähernd zweidimensional ist.
Daher geben wir uns damit zufrieden, eine Projektion einer
dreidimensionalen Form auf einer Ebene abzubilden – was der Art und
Weise ganz ähnlich ist, wie jedes Auge die Welt sieht. Ähnliche Methoden
lassen sich entwickeln, um vierdimensionale Formen aufs Papier zu
bringen, aber sie bedürfen einer Menge Erklärungen und man braucht etwas
Übung, um sich visuell daran zu gewöhnen.
Schließlich erkannten Physiker, dass nicht drei, sondern vier Koordinaten
erforderlich sind, um ein Objekt in Raum und Zeit zu lokalisieren: die
üblichen drei für die Position im Raum und die vierte für den Zeitpunkt des
Auftretens. Die Schlacht von Hastings fand an einem Ort statt, der heute in
der Nähe der Kreuzung der A272 und der A2100 liegt, nordwestlich von
Hastings an der Südküste von Sussex. Geographische Länge und Breite
dieses Punktes liefern zwei Koordinaten. Die Schlacht fand aber auch auf
dem Boden statt, das heißt, einige Meter über dem Meeresspiegel. Das ist
die dritte räumliche Koordinate, und wir haben die Kampfesstätte nun
relativ zur Erde präzise lokalisiert. (Ich ignoriere die Bewegung der Erde
um die Sonne, die Drehung der Sonne mit der übrigen Galaxie, die
Bewegung der Galaxie Richtung M13 im Andromeda-System und dass die
ganze lokale Gruppe von Galaxien in Richtung des Großen Attraktors
gezogen wird.)
Wenn Sie jedoch heute an diesen Ort kommen, dann treffen Sie nicht auf
die Angelsachsen, die sich unter König Harold II. dem vordringenden
normannischen Heer von Herzog Wilhelm dem Eroberer entgegenstellten,
und zwar deshalb, weil Sie sich auf der falschen Zeitkoordinate befinden.
Sie benötigen eine vierte Zahl, den 14. Oktober 1066, um die Schlacht in
Raum und Zeit zu lokalisieren.
Obgleich der physische Raum also nur drei Dimensionen haben mag, hat
die Raumzeit definitiv vier.
Der Raum ist zudem möglicherweise nicht so, wie es scheint, wenn wir
über unsere normale sensorische Wahrnehmung hinausgehen. Einstein hat
gezeigt, dass der Raum dann, wenn wir ihn in sehr großem Maßstab
betrachten, zum Beispiel in der Größenordnung von Sonnensystemen oder
Galaxien, unter dem Einfluss der Schwerkraft gekrümmt ist. Die daraus
resultierende Geometrie weicht von der euklidischen Geometrie ab. Und im
Bereich des Allerkleinsten, auf der Ebene der subatomaren Teilchen, hat der
Raum, so vermuten Physiker inzwischen, sechs oder sieben zusätzliche
Dimensionen, die vielleicht so eng eingerollt sind, dass wir sie nicht
bemerken (siehe Kapitel [11]).
Warum es unmöglich ist, einen Winkel in drei gleiche Teile zu
teilen und einen Würfel zu verdoppeln
Euklids Elemente liefern Lösungen für eine ganze Reihe von geometrischen
Problemen, lassen jedoch mehrere Fragen unbeantwortet. Das Werk
beschreibt eine Methode zur Teilung eines Winkels in zwei gleich große
Teile, und zwar allein mit Hilfe traditioneller Werkzeuge, wie einem
unmarkierten Lineal und einem Zirkel (siehe Kapitel [ ], S. 198). Euklid
lieferte jedoch keine Methode, um einen Winkel mit diesen Werkzeugen in
drei gleiche Teile zu zerlegen. Er wusste, wie man das Volumen eines
gegebenen Würfels um das Achtfache vergrößert – man muss nur sämtliche
Seiten verdoppeln. Aber er lieferte keine Methode, das Volumen eines
Würfels zu verdoppeln, ein Problem, das als Würfelverdopplung bekannt
ist. Sein vielleicht größtes Versäumnis war die Quadratur des Kreises: eine
Methode zur Konstruktion eines Quadrats mit derselben Fläche wie ein
gegebener Kreis (siehe Kapitel [π]). Modern ausgedrückt, bedeutet dies,
eine geometrische Konstruktion für eine Strecke der Länge π zu finden,
wenn eine Strecke der Länge 1 gegeben ist.
Das sind die drei «geometrischen Probleme des Altertums». Die antiken
Mathematiker lösten sie, indem sie ihr Instrumentarium erweiterten, doch
sie ließen offen, ob diese neuen Methoden tatsächlich notwendig waren.
Ließen sich die drei Probleme vielleicht doch allein mit Zirkel und Lineal
lösen? Schließlich wurde nachgewiesen, dass alle drei Probleme mit Zirkel
und Lineal allein unlösbar waren. Die Quadratur des Kreises erwies sich als
besonders schwierig (siehe Kapitel [π]). Die beiden anderen hängen mit
einer bestimmten Eigenschaft der Zahl 3 zusammen: nämlich, dass sie keine
ganzzahlige Potenz von 2 ist.
Die Grundidee lässt sich leichter im Zusammenhang mit der Verdopplung
des Würfels verstehen. Das Volumen eines Würfels mit der Seitenlänge x ist
3
3
x . Also versuchen wir, die Gleichung x = 2 zu lösen. Das lässt sich
machen: Die Antwort ist die Kubikwurzel von 2:
Aber lässt sich das allein mit Zirkel und Lineal erreichen?
Gauß bemerkte in seinem Text zur Zahlentheorie Disquisitiones
Arithmeticae (Zahlentheoretische Untersuchungen), dass sich jede von der
Einheitslänge mittels einer Zirkel-und-Lineal-Konstruktion abgeleitete
Länge algebraisch durch die Lösung einer Folge von quadratischen
Gleichungen ausdrücken lässt. Ein wenig Algebra zeigt, dass die Länge
daher die Lösung einer Gleichung mit ganzzahligen Koeffizienten sein
muss, deren Grad eine Potenz von 2 ist. Vereinfacht gesagt, verdoppelt jede
zusätzliche Quadrierung den Grad.
3
Nun der Todesstoß. Die Gleichung für die Kubikwurzel von 2 ist x = 2,
also eine Gleichung dritten Grades. Das ist keine Potenz von 2, daher lässt
sich diese Länge nicht mit Zirkel und Lineal konstruieren. Pierre Wantzel
sortierte das Kleingedruckte, das Gauß der Erwähnung nicht für wert hielt,
und schrieb 1837 einen vollständigen Beweis nieder. Dabei ist ein
fachlicher Punkt wichtig: Die kubische Gleichung muss «irreduzibel» sein,
was in diesem Fall bedeutet, dass sie keine rationale Lösung hat. Da
irrational ist, ist dieser Punkt leicht zu erfüllen.
Wantzel wies zudem nach, dass die Dreiteilung eines Winkels aus
demselben Grund unmöglich ist. Wenn wir erwägen, einen Winkel von 60°
in drei gleiche Teile zu zerlegen, führen ein wenig Trigonometrie und
Algebra zu der kubischen Gleichung
Diese Gleichung ist ebenfalls irreduzibel, daher ist eine Konstruktion mit
Zirkel und Lineal auch in diesem Fall unmöglich.
Parkettierungen der Ebene mit regelmäßigen Vielecken
Nur drei regelmäßige Vielecke (Polyeder) parkettieren die Ebene: das
gleichseitige Dreieck, das Quadrat und das Sechseck (Hexagon).
Abbildung 21: Drei Möglichkeiten, eine Ebene zu kacheln: mit gleichseitigen Dreiecken,
Quadraten oder Sechsecken.
Der Beweis ist einfach. Der Winkel an der Ecke eines n-seitigen
regelmäßigen Vielecks ist
und die ersten Werte lauten:
n
Vieleck
3
60
gleichseitiges Dreieck
4
90
Quadrat
5
108
Fünfeck
6
120
Sechseck
7
128,57
Siebeneck
8
135
Achteck
Tabelle 5
Nun überlegen Sie, wie eine Parkettierung mit einem Typ einer dieser
Vielecke aussehen würde. In jeder Ecke treffen sich mehrere Kacheln.
Daher muss der Winkel an der Ecke des Vielecks gleich 360°, geteilt durch
eine ganze Zahl, sein. Die möglichen Winkel sind daher:
n
Vieleck
3
120
Sechseck
4
90
Quadrat
5
72
kein Winkel eines regelmäßigen Vielecks
6
60
gleichseitiges Dreieck
7
51,43
kein Winkel eines regelmäßigen Vielecks
Tabelle 6
Beachten Sie, dass die Winkelgrößen in der ersten Tabelle steigen, wenn die
Seitenzahl n steigt, während sie in der zweiten Tabelle sinken, wenn n
steigt. Von 7 Seiten an beträgt der Winkel in der zweiten Tabelle weniger
als 60°, während der Winkel in der ersten Tabelle stets größer oder gleich
60° ist. Daher führt eine Fortsetzung der Tabelle nicht zu weiteren
Parkettierungsmöglichkeiten.
Dies lässt sich auch so ausdrücken: Drei Fünfecke lassen eine Lücke,
aber vier überlappen einander; zwei Siebenecke (oder Vielecke mit mehr als
sieben Seiten) lassen eine Lücke, aber drei überlappen einander. Daher
passen nur das gleichseitige Dreieck, das Quadrat und das Sechseck so
genau zusammen, dass sie sich zur Parkettierung eignen.
Abbildung 22: Links: Drei Fünfecke lassen eine Lücke, vier überlappen. Rechts: Zwei
Siebenecke lassen eine Lücke, drei überlappen. Dasselbe gilt für Vielecke mit mehr als
7 Seiten.
Summen dreier Quadratzahlen
Da viele Zahlen keine Summen von zwei Quadratzahlen sind (siehe
Kapitel [2]), wie steht es mit den Summen von drei Quadratzahlen? Die
meisten, aber nicht alle Zahlen lassen sich als Summe von drei
Quadratzahlen schreiben. Die Liste derjenigen Zahlen, für die das nicht gilt,
beginnt mit:
Wiederum bilden die Zahlen ein Muster, und wiederum ist es schwer zu
entdecken. Es wurde 1798 von Adrien-Marie Legendre gefunden. Er stellte
fest, dass die Summen von drei Quadratzahlen genau diejenigen Zahlen
k
ergeben, die nicht die Form 4 (8n + 7) haben. Die Liste der Ausnahmen
oben enthält alle Zahlen dieser Form. Wenn n = 0 und k = 0 ist, erhalten wir
daher 7, wenn n = 1 und k = 0 ist, erhalten wir 15, und so weiter. Sein
Ergebnis ist korrekt, doch sein Beweis wies eine Lücke auf, die 1801 von
Gauß gefüllt wurde.
k
Es ist nicht allzu schwierig, zu beweisen, dass Zahlen der Form 4 (8n +
7) nicht die Summen von drei Quadratzahlen sind. Jede Quadratzahl lässt
als Rest 0, 1 oder 4, wenn sie durch 8 geteilt wird. Daher können die
Summen von drei Quadratzahlen jeden Rest lassen, der sich ergibt, wenn
man drei dieser Zahlen zusammenzählt; das führt zu Resten von 0, 1, 2, 3,
4, 5 und 6, aber nicht 7. Das wiederum sagt uns, dass Zahlen der Form 8n +
k
7 mehr als drei Quadratzahlen benötigen. Die Sache mit 4 ist nur wenig
schwieriger. Das Schwierigste ist, zu beweisen, dass alle anderen Zahlen
tatsächlich die Summe dreier Quadratzahlen sind.
Quadratzahlen
Die erste perfekte Quadratzahl (nach 0 und 1) ist 4. Jede Karte in der Ebene
lässt sich mit vier Farben so kolorieren, dass benachbarte Regionen
unterschiedliche Farben aufweisen. Jede positive ganze Zahl ist eine
Summe von 4 Quadratzahlen. Dasselbe wird für Kubikzahlen angenommen,
wenn man negative ganze Zahlen erlaubt. Gleichungen 4. Grades, in der die
Unbekannte in der 4. Potenz auftaucht, lassen sich mit Hilfe von Kubikund Quadratwurzeln lösen. (4. Wurzeln sind Quadratwurzeln aus
Quadratwurzeln.) Das Zahlensystem der Quaternionen, das auf 4
unabhängigen Größen beruht, gehorcht fast allen Standardgesetzen der
Algebra. Kann es sein, dass eine vierte Dimension existiert?
Eine perfekte Quadratzahl
Die Zahl 4 = 2 × 2 ist eine Quadratzahl (siehe Kapitel [2]). Für die gesamte
Mathematik sind Quadratzahlen von zentraler Bedeutung. Der Satz des
Pythagoras besagt, dass das Quadrat der längsten Seite eines rechtwinkligen
Dreiecks gleich der Summe der Quadrate der beiden anderen Seiten ist;
daher sind Quadratzahlen vor allem in der Geometrie von grundlegender
Bedeutung.
Quadratzahlen weisen zahlreiche verborgene Muster auf. Schauen Sie
sich beispielsweise die Differenzen zwischen aufeinanderfolgenden
Quadratzahlen an:
Was für Zahlen sind das? Die ungeraden Zahlen
Ein weiteres interessantes Muster ist eine direkte Folge:
Wenn wir all die ungeraden Zahlen bis zu einer bestimmten Zahl
zusammenzählen, ist das Ergebnis eine Quadratzahl.
Es gibt eine Möglichkeit, mit Hilfe von Punkten zu verstehen, warum
diese beiden Fakten wahr sind und wie sie zusammenhängen (siehe Abb.
23, Seite 76, oben). Natürlich lässt sich dies auch algebraisch beweisen.
Hier ist ein weiteres wunderbares Muster mit Quadratzahlen:
Abbildung 23: Links: 1 + 3 + 5 + 7 + 9.
Rechts: 1 + 2 + 3 + 4 + 5 + 4 + 3 + 2 + 1.
Das lässt sich anhand der Punkte in der Abbildung rechts leicht
nachvollziehen.
Das Vierfarbentheorem
Vor rund 150 Jahren begannen ein paar Mathematiker, über Landkarten
nachzudenken. Dabei ging es ihnen nicht um das traditionelle Problem,
möglichst präzise Weltkarten herzustellen und einen runden Globus auf
einem flachen Blatt Papier abzubilden, sondern um recht eigenartige Fragen
über Karten im Allgemeinen – vor allem darum, wie man sie so einfärben
kann, dass Regionen mit einer gemeinsamen Grenze unterschiedliche
Farben tragen.
Einige Karten brauchen nur wenige Farben. Die Quadrate eines
Schachbretts bilden eine sehr regelmäßige Art von Karte, für die man nur
zwei Farben benötigt: gewöhnlich schwarz und weiß. Karten, die aus
überlappenden Kreisen bestehen, benötigen ebenfalls nur zwei Farben
(siehe Professor Stewarts mathematische Detektivgeschichten). Wenn die
Regionen jedoch weniger regelmäßig werden, reichen zwei Farben nicht
aus.
Hier sehen Sie beispielsweise eine Karte der USA, wobei die Regionen
die einzelnen Bundesstaaten sind. Offensichtlich würden 50 Farben – eine
für jeden Bundesstaat – wunderbar funktionieren, aber wir können’s besser.
Versuchen Sie einmal, die Regionen zu kolorieren, und schauen Sie, wie
viele Farben Sie mindestens benötigen. Um ein technisches Detail
klarzustellen: Staaten, die sich an einem einzigen Punkt treffen, wie
Colorado und Arizona, können, falls gewünscht, gleich eingefärbt werden.
Sie haben keine gemeinsame Grenze.
Abbildung 24: Die 50 amerikanischen Bundesstaaten.
Die Karte der USA macht einige einfache allgemeine Prinzipien
exemplarisch klar. Alaska und Hawaii spielen eigentlich keine Rolle, weil
sie von allen anderen Staaten isoliert sind: Wir können sie beliebig
einfärben. Wichtiger ist, dass wir mindestens drei Farben brauchen.
Tatsächlich müssen Utah, Wyoming und Colorado jeweils anders koloriert
werden, weil jeweils zwei von ihnen eine gemeinsame Grenze haben.
Wir können drei Farben für diese Staaten wählen. Es spielt keine Rolle,
welche es sind, solange sie nur unterschiedlich sind. Also lassen Sie uns
Utah schwarz anmalen, Wyoming dunkelgrau und Colorado mittelgrau, wie
auf der Abbildung.
Abbildung 25: Warum wir mindestens drei Farben brauchen.
Nehmen wir um der Diskussion willen an, dass wir auch für den Rest der
Karten nur diese drei Farben benutzen wollen. Dann müsste Nebraska
wiederum schwarz sein, denn es hat eine gemeinsame Grenze mit einem
dunkelgrauen und einem mittelgrauen Staat. Das würde Mittelgrau für
South Dakota erzwingen. Wir können eine Weile lang auf diese Weise
fortfahren, wobei für jede neue Farbe nur eine einzige Möglichkeit bleibt,
wenn wir Montana, Idaho, Nevada, Oregon und Kalifornien anmalen. In
diesem Stadium ergibt sich der Stand von Abb. 26.
Abbildung 26: Wenn wir mit drei Farben weitermachen, geraten wir irgendwann in
Schwierigkeiten.
Arizona grenzt nun an Staaten, die wir mittelgrau, dunkelgrau und schwarz
eingefärbt haben. Da alle Einfärbungen bis zu diesem Punkt durch die Art
und Weise erzwungen wurden, wie die Staaten aneinandergrenzen,
funktionieren drei Farben für die ganze Karte offenbar nicht. Daher
brauchen wir eine vierte – sagen wir, hellgrau –, um fortzufahren (siehe
Abb. 27).
Abbildung 27: Eine vierte Farbe ist die Rettung.
Bei 38 weiteren Staaten – Alaska und Hawaii lassen wir aus – erscheint es
vorstellbar, dass wir irgendwo eine fünfte oder gar eine sechste Farbe
brauchen … wer weiß? Auf der anderen Seite verändert es die ganze
Situation, wenn wir über eine vierte Farbe verfügen. Vor allem könnte man
einige der vorher zugewiesenen Farben ändern (und Wyoming
beispielsweise hellgrau einfärben). Die Wahl der Farben ist nicht länger
zwangsläufig, daher wird es schwieriger, das Problem zu analysieren. Wir
können jedoch weiterhin vernünftige Vermutungen anstellen und die Farben
ändern, wenn wir in eine Sackgasse geraten. Bei einer Einfärbung gibt es
nur drei hellgraue Staaten: Arizona, West Virginia und New York. Obgleich
es 50 Staaten gibt, haben wir die ganze Karte mit nur vier Farben
eingefärbt.
Abbildung 28: Eine fünfte Farbe ist nicht nötig.
(Ein weiterer technischer Punkt: Michigan tritt in Form von zwei nicht
verbundenen Regionen auf, die durch den Lake Michigan getrennt sind.
Beide sind dunkelgrau eingefärbt, aber unverbundene Regionen führen
manchmal zu mehr Farben. Das muss man bei einer vollständigen
mathematischen Theorie berücksichtigen, es spielt in unserem
Zusammenhang aber keine entscheidende Rolle.)
Die Karte der USA ist nicht besonders kompliziert, und wir können uns
andere Karten mit Millionen von Regionen mit sehr unregelmäßigen
Grenzen vorstellen, die überall wie Finger in die Nachbarregionen
hineinragen. Vielleicht braucht man dafür deutlich mehr Farben. Dennoch
kamen die Mathematiker, die über diese Problematik nachdachten, zu der
festen Überzeugung, dass man niemals mehr als vier Farben braucht, um
eine Karte zu kolorieren, ganz gleich, wie kompliziert sie ist. Solange die
Karte auf eine Ebene oder eine Kugel gezeichnet ist und alle Regionen
miteinander verbunden sind, reichen vier Farben aus.
Kurze Geschichte des Vierfarbenproblems
Das Vierfarbenproblem stammt aus dem Jahr 1852, als Francis Guthrie, ein
junger südafrikanischer Mathematiker und Botaniker, versuchte, die
Landkreise auf einer Karte von England einzufärben. Vier Farben schienen
stets auszureichen, und so fragte er seinen Bruder Frederick, ob dies eine
allgemein bekannte Tatsache sei. Frederick gab die Frage an den
renommierten, wenn auch exzentrischen Mathematiker Augustus De
Morgan weiter; der hatte keine Ahnung und schrieb an einen noch
berühmteren Mathematiker, Sir William Rowan Hamilton. Hamilton konnte
die Frage ebenfalls nicht beantworten, und um ehrlich zu sein, scheint sie
ihn auch nicht besonders interessiert zu haben.
Im Jahr 1879 veröffentlichte der Anwalt Alfred Kempe einen Beweis, der
belegen sollte, dass vier Farben stets genügen, doch 1889 entdeckte Percy
Heawood, dass Kempe ein Fehler unterlaufen war. Er zeigte, dass Kempe
lediglich bewiesen hatte, dass fünf Farben stets ausreichen, und das blieb
mehr als ein Jahrhundert lang der Stand der Dinge. Die Antwort lautete
entweder vier oder fünf, aber niemand wusste, was denn nun richtig war.
Andere Mathematiker versuchten Strategien, wie sie Kempe verwendet
hatte, doch bald wurde deutlich, dass diese Methode eine ganze Menge
mühsamer Berechnungen erforderte. Schließlich knackten Wolfgang Haken
und Kenneth Appel das Problem 1976 mit Hilfe eines Computers. Vier
Farben reichen stets aus.
Seit dieser Pionierarbeit haben sich Mathematiker daran gewöhnt,
Computer zur Problemlösung heranzuziehen. Sie bevorzugen noch immer
Beweise, die sich allein auf menschliche Geisteskräfte stützen, aber die
meisten bestehen nicht mehr darauf. In den 1990er Jahren herrschte noch
ein gewisses Unbehagen gegenüber dem Appel-Haken-Beweis. Daher
entschlossen sich Neil Robertson, Daniel Sanders, Paul Seymour und Robin
Thomas 1994, den ganzen Beweis zu wiederholen, wobei sie dieselbe
Grundstrategie anwandten, aber den Aufbau vereinfachten. Die heutigen
Computer sind so schnell, dass sich der ganze Beweis inzwischen in ein
paar Stunden auf einem Heimcomputer nachvollziehen lässt.
Der Vier-Quadrate-Satz
In Kapitel 2 haben wir gesehen, wie man Summen von zwei Quadratzahlen,
und in Kapitel 3, wie man Summen von drei Quadratzahlen beschreibt.
Aber wenn es um die Summen von vier Quadratzahlen geht, muss man die
Zahlen, die funktionieren, nicht näher beschreiben. Es klappt nämlich
immer.
Jede zusätzliche Quadratzahl ermöglicht es, weitere Zahlen
einzuschließen, daher sollten die Summen von vier Quadratzahlen
zumindest ein paar Lücken füllen. Ein bisschen Herumprobieren lässt
vermuten, dass jede Zahl von 0 bis 100 auftritt. Beispielsweise lässt sich 7
nicht als Summe von drei Quadratzahlen schreiben, wohl aber von vier:
Dieser frühe Erfolg könnte darauf zurückzuführen sein, dass wir uns mit
recht kleinen Zahlen beschäftigen. Vielleicht braucht irgendeine größere
Zahl fünf oder gar sechs Quadratzahlen oder sogar noch mehr? Nein. Auch
größere Zahlen lassen sich als Summe von vier Quadratzahlen schreiben.
Mathematiker suchten lange nach einem Beweis, dass dies für alle positiven
Zahlen gilt, und im Jahr 1770 fand Joseph Louis Lagrange einen solchen
Beweis. Weswegen der Vier-Quadrate-Satz Mathematikern auch als Satz
von Lagrange bekannt ist.
Die Vier-Kubikzahlen-Vermutung
Es ist vermutet worden, dass ein ähnlicher Satz für vier Kubikzahlen gilt,
aber mit einer zusätzlichen Finesse: Sowohl positive als auch negative
Kubikzahlen sind erlaubt. Daher lautet die Vermutung: Jede ganze Zahl ist
eine Summe von vier ganzzahligen Kubikzahlen. Erinnern Sie sich daran,
dass eine ganze Zahl positiv, negativ oder null sein kann.
Der erste Versuch, den Vier-Quadrate-Satz auf Kubikzahlen zu
verallgemeinern, erschien 1770 in Edward Warings Meditationes
Algebraicae. Er behauptete ohne Beweis, dass jede ganze Zahl die Summe
von vier Quadratzahlen, neun Kubikzahlen, 19 vierten Potenzen und so
weiter ist. Dabei nahm er an, dass alle Zahlen, um die es ging, positiv oder
null waren. Diese Behauptung wurde als das Waring-Problem bekannt.
Die 3. Potenz einer negativen ganzen Zahl ist negativ, und das eröffnet
neue Möglichkeiten, zum Beispiel benötigt man für
neun positive Kubikzahlen, doch wenn wir negative Zahlen erlauben,
kommen wir mit fünf Kubikzahlen aus:
Tatsächlich lässt sich 23 mit nur vier Kubikzahlen ausdrücken:
Wenn wir negative Zahlen zulassen, kann eine große positive Zahl eine
große negative Zahl problemlos kompensieren. Daher können die
beteiligten Kubikzahlen im Prinzip viel größer sein als die Zahl, um die es
geht. Beispielweise können wir 30 in folgender Weise als Summe dreier
Kubikzahlen schreiben:
Anders als im positiven Fall können wir nicht systematisch eine Liste mit
einer begrenzten Zahl von Möglichkeiten abarbeiten.
Computerexperimente ließen Mathematiker vermuten, dass jede ganze
Zahl die Summe von vier ganzzahligen Kubikzahlen ist. Bisher gibt es
dafür zwar noch keinen Beweis, doch die Belege sind überzeugend, und es
sind einige Fortschritte erzielt worden. Es würde reichen, die Behauptung
für alle positiven ganzen Zahlen zu beweisen (wobei positive oder negative
3
3
Kubikzahlen weiterhin erlaubt sind), denn (–n) = –n . Jede Darstellung
einer positiven Zahl m als Summe von Kubikzahlen lässt sich in eine
Darstellung von –m umwandeln, indem man das Vorzeichen einer jeden
Kubikzahl ändert. Computerberechnungen haben verifiziert, dass jede
positive ganze Zahl bis zu 10 Millionen die Summe von vier Kubikzahlen
ist. Und 1966 bewies Wadim Demjanenko, dass jede Zahl, die nicht die
Form 9k ± 4 hat, die Summe von vier Kubikzahlen ist.
Es ist sogar möglich, dass bei einer endlichen Anzahl von Ausnahmen
jede positive ganze Zahl die Summe von vier Kubikzahlen ist, die positiv
oder null sind. Im Jahr 2000 vermuteten Jean-Marc Deshouillers, François
Hennecart, Bernard Landreau und I. Gusti Putu Purnaba, dass die größte
ganze Zahl, die sich nicht auf diese Weise ausdrücken lässt,
7373170279850 ist.
Gleichungen 4. Grades
In der Geschichte von Cardano und den kubischen Gleichungen (siehe
Kapitel [3]) geht es auch um quartische Gleichungen oder Gleichungen
4. Grades, in denen die Unbekannte zur vierten Potenz erhoben ist:
Cardanos Schüler Ferrari löste diese Gleichung. Eine ausführliche Formel
findet sich unter
http://de.wikipedia.org/wiki/Quartische_Gleichung
und wenn Sie sich diesen Eintrag anschauen, werden Sie verstehen, warum
ich die ganze Sache hier nicht niederschreibe.
Ferraris Methode verknüpfte die Lösungen der quartischen Gleichung
mit denjenigen einer korrespondierenden kubischen Gleichung. Das
bezeichnet man heute als Lagrange-Resolvente, weil Lagrange der erste
Mathematiker war, der erklärte, warum eine kubische Gleichung das
Problem löst.
Quaternionen
In der Einleitung haben wir gesehen, dass das Zahlensystem wiederholt
durch die Einführung neuer Zahlentypen erweitert worden ist, ein Trend,
der in den komplexen Zahlen kulminierte, bei denen –1 eine Quadratwurzel
hat (siehe Kapitel [i]). Komplexe Zahlen spielen in der Physik eine wichtige
Rolle. Aber es gibt eine schwerwiegende Einschränkung. Die Methoden
sind auf die beiden Dimensionen der Ebene beschränkt. Der Raum ist
jedoch dreidimensional. Im 19. Jahrhundert versuchten Mathematiker, ein
dreidimensionales Zahlensystem zu entwickeln und die komplexen Zahlen
zu erweitern. Damals erschien das wie eine gute Idee, aber es führte zu
keinem nützlichen Ergebnis.
William Rowan Hamilton, ein brillanter irischer Mathematiker, war
besonders daran interessiert, ein praktikables dreidimensionales
Zahlensystem zu erfinden, und 1843 hatte er einen Geistesblitz. Er erkannte
zwei unüberwindbare Hindernisse, die der Schaffung eines solchen Systems
entgegenstanden:
Drei Dimensionen funktionieren nicht.
Eine der Standardregeln der Arithmetik muss geopfert werden.
Nämlich das Kommutativgesetz der Multiplikation, das besagt ab =
ba.
Als Hamilton diesen Geistesblitz hatte, schlenderte er auf dem Treidelpfad
eines Kanals zu einem Treffen der Royal Irish Academy. Die ganze Zeit
hatte er sich mit dem kniffligen Problem eines dreidimensionalen Systems
herumgeschlagen, als er plötzlich erkannte, dass drei Dimensionen zwar
nicht funktionieren würden, wohl aber vier. Man musste jedoch bereit sein,
das Kommutativgesetz der Multiplikation zu streichen.
Es war ein wirklicher Heureka!-Moment. Ganz erfüllt von seiner
erstaunlichen Erkenntnis, hielt Hamilton inne und ritzte in das Mauerwerk
einer Brücke eine Formel für derartige Zahlen:
Er nannte dieses System Quaternionen, weil die Zahlen vier Komponenten
aufweisen. Drei davon sind i, j und k, und die vierte ist die reelle Zahl 1.
Eine typische Quaternione sieht so aus:
und hat vier beliebige reelle Zahlen (hier 3, –2, 5, 4) als Koeffizienten.
Solche «Zahlen» lassen sich problemlos addieren, und die Multiplikation ist
ebenso einfach, wenn man die Formel benutzt, die Hamilton in das
Mauerwerk der Brücke gekratzt hat. Alles, was man braucht, sind ein paar
Folgerungen aus diesen Gleichungen, nämlich:
zusammen mit der Regel, dass eine Multiplikation mit 1 das Ergebnis nicht
verändert.
Man beachte, dass ij und ji, beispielsweise, zu unterschiedlichen
Ergebnissen führen; daher gilt das Kommutativgesetz nicht.
Dieses Versagen mag auf den ersten Blick unangenehm erscheinen, doch
es bereitet keine ernsten Schwierigkeiten. Man muss lediglich auf die
Reihenfolge achten, wenn man beim Rechnen die Symbole hinschreibt. Zur
damaligen Zeit kamen in der Mathematik noch weitere Gebiete auf, in
denen das Kommutativgesetz nicht galt. Daher war eine solche Idee nicht
beispiellos, und sie war sicherlich nicht frevlerisch.
Hamilton hielt Quaternionen für wunderbar, doch anfangs sahen die
meisten seiner Kollegen diese Zahlen als eine Art Freaks an. Da half es
auch nicht, als sich herausstellte, dass Quaternionen nicht besonders
hilfreich sind, wenn es darum geht, physikalische Probleme im
dreidimensionalen Raum zu lösen – oder im vierdimensionalen, was das
angeht. Die neuen Zahlen waren kein völliger Fehlschlag, aber es fehlten
ihnen die Vielseitigkeit und Allgemeingültigkeit komplexer Zahlen im
zweidimensionalen Raum. Hamilton konnte i, j und k einigermaßen
erfolgreich einsetzen, um einen dreidimensionalen Raum zu schaffen, doch
diese Einsatzmöglichkeit wurde von der Vektoralgebra verdrängt, die in der
angewandten Mathematik zum Standard wurde. In der reinen Mathematik
bleiben Quaternionen jedoch ein wichtiges Werkzeug, und sie finden auch
in der Computergraphik Verwendung, wo sie eine einfache Möglichkeit
bieten, Objekte im Raum zu drehen. Zudem weisen sie interessante
Verbindungen zum Vier-Quadrate-Satz auf.
Hamilton bezeichnete Quaternionen nicht als «Zahlen», denn um diese
Zeit wurden viele verschiedene zahlenartige algebraische Systeme
entwickelt. Quaternionen sind ein Beispiel für etwas, das wir heute eine
Divisionsalgebra nennen: ein algebraisches System, in dem man addieren,
subtrahieren, multiplizieren und dividieren (außer durch 0) kann, wobei fast
alle Standardgesetze der Arithmetik gültig bleiben. Das Symbol für eine
Menge von Quaternionen ist
(für Hamilton, da
bereits für die
rationalen Zahlen vergeben war).
Die Dimensionen von reellen Zahlen, komplexen Zahlen und
Quaternionen sind 1, 2 und 4. Die nächste Zahl in dieser Folge sollte
sicherlich 8 lauten. Gibt es eine achtdimensionale Divisionsalgebra? Die
Antwort ist ein eindeutiges «Ja». Die Oktonionen, auch als Cayley-Zahlen
bekannt, bilden ein solches System. Ihr Symbol ist
. In diesem Fall muss
jedoch ein weiteres Gesetz der Arithmetik dran glauben: das
Assoziativgesetz a(bc) = (ab)c. Zudem bricht das Muster hier ab: Es gibt
keine 16-dimensionale Divisionsalgebra.
Quaternionen wie auch Oktonionen sind erst kürzlich aus ihrem
Dornröschenschlaf gerissen worden, denn sie weisen eine tief gehende
Verbindung zur Quantenmechanik und den Grundbausteinen der Materie,
den Elementarteilchen, auf. Der Schlüssel zu diesem Gebiet liegt in der
Symmetrie der physikalischen Gesetze, und diese beiden algebraischen
Systeme weisen wichtige und ungewöhnliche Symmetrieeigenschaften auf.
So bleiben die Regeln für Quaternionen zum Beispiel unverändert, wenn
man i, j und k als j, k und i neu anordnet. Wie ein näherer Blick zeigt, kann
man sie tatsächlich durch geeignete Kombinationen von i-, j- und kBuchstaben ersetzen. Die resultierenden Symmetrien sind sehr eng mit
Rotationen im dreidimensionalen Raum verknüpft; daher verwenden
Computerspiele Quaternionen häufig zu diesem Zweck in ihrer GraphikSoftware. Die Oktonionen werden ähnlich gedeutet, nämlich als Rotationen
in einem siebendimensionalen Raum.
Die vierte Dimension
Seit undenklichen Zeiten ist den Menschen bekannt, dass der Raum drei
Dimensionen hat (siehe Kapitel [3]). Lange Zeit schien die Vorstellung von
einem Raum mit vier oder gar noch mehr Dimensionen absurd. Ab dem
19. Jahrhundert wurde diese konventionelle Überzeugung jedoch immer
stärker in Frage gestellt, und viele Leute begannen sich zunehmend für die
Möglichkeit einer vierten Dimension zu interessieren. Und das waren nicht
nur Mathematiker oder Naturwissenschaftler, sondern auch Philosophen,
Theologen, Spiritisten, Geistergläubige und ein paar Schwindler. Eine vierte
Dimension bot eine plausible Heimstätte für Gott, die Geister der Toten
oder Gespenster. Nicht in diesem Universum, aber gleich nebenan mit
leichtem Zugang. Scharlatane und Betrüger benutzten Tricks, um
Leichtgläubigen zu «beweisen», dass sie Zutritt zu dieser neuen Dimension
hatten.
Die Vorstellung, dass «Räume» mit mehr als drei Dimensionen logisch
Sinn ergeben – ob sie nun eine physikalische Entsprechung hatten oder
nicht –, fasste dank neuer Entdeckungen wie Hamiltons Quaternionen
zuerst in der Mathematik Fuß. Ab Beginn des 19. Jahrhunderts erschien es
nicht länger offensichtlich, dass bei drei Dimensionen Schluss sein muss.
Denken Sie nur an Koordinaten. In der Ebene lässt sich die Lage eines
jeden Punktes präzise durch zwei reelle Zahlen x und y beschreiben, die ein
Koordinatenpaar (x, y) bilden.
Abbildung 29: Koordinaten in der Ebene.
Um die drei Dimensionen des Raumes zu repräsentieren, müssen wir in der
Vorne-hinten-Richtung lediglich eine dritte Koordinate z zufügen. Nun
haben wir ein Tripel reeller Zahlen (x, y, z) vorliegen.
Wenn wir geometrische Zeichnungen anfertigen, sieht es aus, als müssten
wir an diesem Punkt aufhören. Aber es fällt nicht schwer, Quadrupel von
Zahlen (w, x, y, z) zu schreiben. Oder Fünfergruppen. Oder Sechsergruppen.
Oder, wenn man genug Papier und Zeit hat, auch Millionengruppen.
Schließlich erkannten Mathematiker, dass sie mit Hilfe von Quadrupeln
einen abstrakten Raum definieren konnten, und als sie das taten, hatte er
vier Dimensionen. Mit fünf Koordinaten erhält man einen
fünfdimensionalen Raum, und so weiter. Es gab sogar eine vernünftige
Vorstellung von der Geometrie in solchen Räumen, die in Analogie zum
Satz des Pythagoras in zwei und drei Dimensionen definiert war. In zwei
Dimensionen sagt uns dieser Satz, dass die Entfernung zwischen zwei
Punkten (x, y) und (X, Y)
beträgt.
Die entsprechende Formel in drei Dimensionen sagt uns, dass die
Entfernung zwischen drei Punkten (x, y, z) und (X, Y, Z)
beträgt.
Daher erscheint die Annahme vernünftig, dass die Entfernung zwischen
zwei Quadrupeln (w, x, y, z) und (W, X, Y, Z)
beträgt.
Wie sich herausgestellt hat, ist die resultierende Geometrie in sich
widerspruchsfrei und der euklidischen Geometrie in vieler Hinsicht
entsprechend.
Bei diesem Thema werden die Grundkonzepte algebraisch mit Hilfe von
Quadrupeln definiert, was sicherstellt, dass sie logisch Sinn ergeben.
Anschließend werden sie in Analogie zu ähnlichen algebraischen Formeln
in zwei und drei Dimensionen interpretiert, was ihnen ein gewisses
geometrisches «Feeling» verleiht.
Beispielsweise lauten die Koordinaten der Ecken eines Einheitsquadrats
in der Ebene
was alle möglichen Zweierkombinationen von null und eins sind. Die
Koordinaten der Ecken eines Würfels im Raum lauten
was alle möglichen Dreierkombinationen von null und eins sind. Analog
definieren wir einen Hyperwürfel im vierdimensionalen Raum mit Hilfe der
16 möglichen Quadrupel von Nullen und Einsen.
Ein anderer üblicher Name für diese Form ist Tesserakt (siehe Kapitel [6]).
Ausgehend von dieser Definition können wir das resultierende Objekt
analysieren. Es erinnert stark an einen Würfel, nur ist es noch würfeliger.
Beispielsweise setzt sich ein Würfel aus sechs miteinander verbundenen
Quadraten zusammen; entsprechend setzt sich ein Hyperwürfel aus acht
miteinander verbundenen Würfeln zusammen.
Abbildung 30: Würfel. Links: Würfelprojektion in zwei Dimensionen. Rechts: Aufgefalteter
Würfel, sodass die sechs quadratischen Seiten zu sehen sind.
Weil der physikalische Raum jedoch dreidimensional ist, können wir leider
kein exaktes Modell eines Hyperwürfels herstellen. Auf dieses Problem
sind wir schon zuvor gestoßen: Wir können keinen exakten Würfel auf ein
Blatt Papier zeichnen. Vielmehr zeichnen wir eine Projektion, wie ein
Fotograf oder ein Maler, der ein dreidimensionales Objekt auf einem
flachen Stück Papier bzw. einer ebenen Leinwand abbildet. Im Übrigen
bleibt uns nur die Möglichkeit, einen Würfel entlang seiner Kanten
aufzuschneiden und auseinanderzufalten, sodass wir eine flache Form
erhalten, die aus sechs kreuzförmig angeordneten Quadraten besteht.
Abbildung 31: Hyperwürfel. Links: Hyperwürfelprojektion in zwei Dimensionen. Rechts:
Auseinandergefaltet, sodass die acht würfelförmigen «Seiten» zu sehen sind. Die Nullen
und Einsen bezeichnen die Koordinaten.
Mit einem Hyperwürfel können wir ähnlich verfahren. Wir können ihn als
Modell in den dreidimensionalen Raum projizieren oder als
Liniendiagramm in die Ebene. Oder wir können ihn «aufklappen», sodass
seine acht würfelförmigen «Seiten» zu sehen sind. Ich gestehe, dass es mir
schwerfällt, mir vorzustellen, wie die Würfel sich im vierdimensionalen
Raum «zusammenklappen»; die Liste der Koordinaten des Hyperwürfels
sagt jedoch, dass sie genau das tun.
Abbildung 32: Dalís Crucifixion (Corpus Hypercubus).
Der Altmeister der surrealen Malerei, Salvador Dalí, stellte in mehreren
seiner Werke einen ähnlichen aufgeklappten Hyperwürfel dar: Am
bekanntesten ist wohl sein Gemälde Crucifixion (Corpus Hypercubus), das
er 1954 schuf.
Die Hypotenuse des Pythagoras
Pythagoreische Dreiecke haben einen rechten Winkel und ganzzahlige
Seiten. Das einfachste hat als längste Seite 5, die anderen Seiten sind 4 und
3. Es gibt 5 regelmäßige Körper. Die Gleichung 5. Grades, in der die
Unbekannte in der 5. Potenz auftritt, lässt sich durch das Ziehen von fünften
Wurzeln – oder anderen Wurzeln – nicht lösen. Gitter in der Ebene und im
dreidimensionalen Raum haben keine fünffache Rotationssymmetrie, daher
kommen solche Symmetrien in Kristallen nicht vor. Sie können jedoch bei
Gittern in vier Dimensionen auftreten, in seltsamen Strukturen, die man als
Quasikristalle bezeichnet.
Die Hypotenuse des kleinsten pythagoreischen Tripels
Der Satz des Pythagoras besagt, dass die längste Seite eines rechtwinkligen
Dreiecks (die berüchtigte Hypotenuse) mit den beiden anderen Seiten in
einem wunderbar einfachen Zusammenhang steht: Das Quadrat der
Hypotenuse ist gleich der Summe der Quadrate der beiden anderen Seiten.
Traditionell wird dieser Satz nach Pythagoras benannt, doch seine
Geschichte ist undurchsichtig. Tontafeln sprechen dafür, dass die alten
Babylonier den Satz des Pythagoras schon lange vor Pythagoras kannten; er
streicht den Ruhm nur deshalb ein, weil er eine mathematische Sekte
gründete, die Pythagoreer, die glaubten, das Universum beruhe auf
mathematischen Mustern. Antike Schriftsteller schrieben den Pythagoreern
– und in Erweiterung Pythagoras – eine Vielzahl mathematischer Sätze zu,
aber wir wissen nicht genau, welche mathematischen Erkenntnisse auf
Pythagoras selbst zurückgehen. Wir wissen nicht einmal, ob die
Pythagoreer den «Satz des Pythagoras» tatsächlich beweisen konnten oder
einfach nur glaubten, er sei wahr. Oder ob sie – und das ist am
wahrscheinlichsten – überzeugende Belege für den Satz hatten, die dennoch
für einen Beweis, wie wir ihn heute verstehen, nicht ausreichten.
Der Satz des Pythagoras: Beweise
Der erste bekannte Beweis für den Satz des Pythagoras findet sich in
Euklids Elementen. Er ist ziemlich kompliziert und dreht sich um ein
Diagramm, das bei viktorianischen Schuljungen als die «Hosen des
Pythagoras» bekannt war, weil es an Unterwäsche, aufgehängt an einer
Wäscheleine, erinnerte. Inzwischen kennen wir buchstäblich hunderte
anderer Beweise, von denen die meisten den Satz viel klarer machen.
Abbildung 33: Die Hosen des Pythagoras.
Einer der einfachsten Beweise ist eine Art mathematisches Puzzle. Man
nehme ein beliebiges rechtwinkliges Dreieck, mache vier Kopien und ordne
sie innerhalb eines Quadrats an. In einer Anordnung sehen wir das Quadrat
über der Hypotenuse, in der anderen sehen wir beide Quadrate über den
anderen beiden Seiten. Die betreffenden Flächen sind zweifellos identisch.
Abbildung 34: Links: Das Quadrat über der Hypotenuse (plus vier Dreiecke). Rechts: Die
Quadrate über den beiden anderen Seiten (plus vier Dreiecke). Nun entfernen Sie die
Dreiecke.
Ein weiterer Puzzle-Beweis geht auf Henry Perigal zurück:
Abbildung 35: Die Perigal-Zerlegung
Es gibt auch einen Beweis, der auf einem Kachelmuster beruht. Durchaus
möglich, dass die Pythagoreer oder einer ihrer unbekannten Vorgänger das
Theorem entdeckten. Wenn man sich anschaut, wie ein schräges Quadrat
mit den beiden anderen überlappt, kann man erkennen, wie man das große
Quadrat so zerlegen kann, dass sich die Teile zu den beiden kleineren
Quadraten zusammenfügen lassen. Man kann auch rechtwinklige Dreiecke
erkennen, deren Seiten die drei Quadratgrößen ergeben.
Abbildung 36: Beweis durch Kachellegen.
Es gibt raffinierte Beweise, bei denen ähnliche Dreiecke und Trigonometrie
eingesetzt werden. Wir kennen mindestens 50 Beweise dieser Art.
Pythagoreische Tripel
Der Satz des Pythagoras war der Ausgangspunkt für eine fruchtbare Idee in
der Zahlentheorie: Man finde ganzzahlige Lösungen für algebraische
Gleichungen. Ein pythagoreisches Tripel ist eine Liste von drei ganzen
Zahlen a, b, c, für die gilt:
Geometrisch definiert das Tripel ein rechtwinkliges Dreieck, dessen Seiten
alle eine ganzzahlige Länge haben.
Die kleinste Hypotenuse in einem pythagoreischen Tripel ist 5. Die
beiden anderen Seiten haben die Länge 3 und 4. Hier gilt:
Die nächstkleinste Hypotenuse ist 10, denn
Dabei handelt es sich jedoch im Grunde um das gleiche Dreieck, nur dass
alle Seiten verdoppelt wurden. Die nächstkleinste, wirklich verschiedene
Hypotenuse ist 13, denn
Euklid wusste, dass es unendlich viele wirklich unterschiedliche
pythagoreische Tripel gibt, und er gab eine Art Formel an, um sie alle zu
finden. Später gab Diophant von Alexandria ein einfaches Rezept an, das
im Grunde auf Euklids Formel hinausläuft.
Man nehme zwei beliebige ganze Zahlen und bilde
das Doppelte ihres Produkts
die Differenz zwischen ihren Quadraten
die Summe ihrer Quadrate
Dann sind die resultierenden drei Zahlen die drei Seiten eines
pythagoreischen Dreiecks.
Nehmen wir beispielsweise die Zahlen 2 und 1. Dann beträgt
das Doppelte ihres Produkts = 2 × 2 × 1 = 4
2
2
die Differenz zwischen ihren Quadraten = 2 – 1 = 3
2
2
die Summe ihrer Quadrate = 2 + 1 = 5
und wir erhalten das berühmte 3-4-5-Dreieck. Wenn wir stattdessen die
Zahlen 2 und 3 wählen, erhalten wir
das Doppelte ihres Produkts = 2 × 3 × 2 = 12
2
2
die Differenz zwischen ihren Quadraten = 3 – 2 = 5
2
2
die Summe ihrer Quadrate = 3 + 2 = 13
und damit das nächstberühmte 5-12-13-Dreick. Sollten wir uns hingegen
für die Zahlen 42 und 23 entscheiden, erhalten wir
das Doppelte ihres Produkts = 2 × 42 × 23 = 1932
2
2
die Differenz zwischen ihren Quadraten = 42 – 23 = 1235
2
2
die Summe ihrer Quadrate = 42 + 23 = 2293
und niemand hat jemals von dem 1235-1932-2293-Dreieck gehört. Aber
diese Zahlen funktionieren tatsächlich:
Es gibt noch einen letzten Dreh bei Diophants Regel, auf den schon
hingewiesen wurde: Wenn wir diese drei Zahlen bestimmt haben, können
wir eine beliebige andere Zahl wählen und alle drei damit multiplizieren.
Daher lässt sich das 3-4-5-Dreieck durch Multiplikation aller drei Zahlen
mit 2 in ein 6-8-10-Dreieck umwandeln, oder durch Multiplikation aller
drei Zahlen mit 5 in ein 15-20-25-Dreieck.
Algebraisch ausgedrückt nimmt die Regel diese Form an: Seien u, v und
k ganze Zahlen. Dann hat das rechtwinklige Dreieck mit den Seiten
die Hypotenuse
Es gibt alternative Möglichkeiten, um die Grundidee auszudrücken, aber
alle laufen auf diese Darstellung hinaus. Sie ergibt sämtliche
pythagoreischen Tripel.
Regelmäßige Körper
Es gibt genau fünf regelmäßige Körper.
Ein regelmäßiger Körper (oder Polyeder) ist eine geometrische Form mit
endlich vielen flachen (das heißt planaren) Seitenflächen. Die Flächen
treffen sich an Linien, die man als Ränder oder Kanten bezeichnet; die
Kanten wiederum treffen sich in Punkten, die als Ecken bezeichnet werden.
Der Höhepunkt von Euklids Elementen ist ein Beweis, dass es genau fünf
regelmäßige Polyeder gibt, also solche, bei denen jede Seitenfläche ein
regelmäßiges Vieleck ist (gleiche Seiten, gleicher Winkel), alle
Seitenflächen identisch sind, und jeder Eckpunkt von genau derselben
Anordnung von Seitenflächen umgeben ist. Die fünf regelmäßigen Polyeder
(auch platonische Körper genannt) sind:
Das Tetraeder mit 4 dreieckigen Seitenflächen, 4 Ecken und
6 Kanten («Dreieckspyramide»)
Der Würfel oder das Hexaeder mit 6 quadratischen Seitenflächen,
8 Ecken und 12 Kanten
Das Oktaeder mit 8 dreieckigen Seitenflächen, 6 Ecken und
12 Kanten
Das Dodekaeder mit 12 fünfeckigen Seitenflächen, 20 Ecken und
30 Kanten
Das Ikosaeder mit 20 dreieckigen Seitenflächen, 12 Ecken und
30 Kanten
Abbildung 37: Die fünf regelmäßigen oder platonischen Körper.
Die regelmäßigen Körper tauchen auch in der Natur auf. Im Jahr 1904
veröffentlichte der deutsche Zoologe Ernst Haeckel Zeichnungen winziger
Einzeller, sogenannter Strahlentierchen oder Radiolarien, in deren
Schalenbau sich alle fünf regelmäßigen Körper wiederfinden ließen.
Vielleicht hat er die Natur dabei jedoch ein wenig «geschönt», sodass es
sich möglicherweise nicht um genuine Darstellungen lebender Geschöpfe
handelt. Die ersten drei dieser Körper tauchen auch in Kristallen auf. Das
Dodekaeder und das Ikosaeder tun dies nicht, auch wenn man gelegentlich
unregelmäßige Dodekaeder findet. Echte Dodekaeder können in
Quasikristallen auftreten, die Kristallen ähneln, wenn man davon absieht,
dass ihre Atome kein periodisches Gitter bilden.
Abbildung 38: Haeckels Zeichnungen von Radiolarien, die wie regelmäßige Körper geformt
sind.
Abbildung 39: Auffaltungen von regelmäßigen Körpern.
Es macht Spaß, Modelle der regelmäßigen Körper aus Karton zu basteln,
indem man einen verbundenen Satz von Seitenflächen ausschneidet, den
man als Auffaltung der Körper bezeichnet, die Flächen entsprechend faltet
und die Kanten zusammenklebt. Es hilft, wenn man eine Kante eines jeden
solchen Paares, wie in der Abbildung gezeigt, mit Laschen versieht, auf die
der Kleber aufgetragen werden kann. Man kann aber auch mit Tesafilm
arbeiten.
Gleichungen 5. Grades
Es gibt keine algebraische Formel, um Gleichungen 5. Grades (quintische
Gleichungen) zu lösen.
Die allgemeine Gleichung 5. Grades sieht so aus:
Das Problem besteht darin, eine Formel für die Lösungen (es können bis zu
fünf sein) zu finden. Erfahrungen mit quadratischen, kubischen, quartischen
und quintischen Gleichungen sprachen dafür, dass es eine Formel zur
Lösung quintischer Gleichungen geben sollte, und zwar wahrscheinlich
eine, bei der 5. Wurzeln, Kubikwurzeln und Quadratwurzeln eine Rolle
spielen. Und man konnte jede Wette eingehen, dass eine solche Formel in
der Tat sehr kompliziert sein würde.
Diese Erwartung stellte sich jedoch als falsch heraus. Tatsächlich gibt es
keinerlei Formel, zumindest keine, die aus den Koeffizienten a, b, c, d, e
und f unter Zuhilfenahme von Addition, Subtraktion, Multiplikation und
Division nebst Wurzelziehen gebildet wird. Daher ist an der Zahl 5 etwas
wirklich Besonderes. Die Gründe für dieses ungewöhnliche Verhalten sind
recht tiefgehend, und es hat lange gedauert, sie zu klären.
Das erste Anzeichen, dass es Schwierigkeiten gab, war, dass es
Mathematikern nicht gelang, eine solche Formel zu finden, ganz gleich, wie
sehr sie sich bemühten und wie clever sie vorgingen. Eine Zeit lang wurde
allgemein angenommen, dieses Versagen liege daran, dass die Formel so
ungemein kompliziert war, dass niemand die Algebra richtig handhaben
konnte. Aber schließlich begannen einige Mathematiker sich zu fragen, ob
eine solche Formel überhaupt existiert. Im Jahr 1823 gelang es Niels Henrik
Abel schließlich zu beweisen, dass dies nicht der Fall ist. Kurz darauf fand
Évariste Galois einen Weg, zu entscheiden, ob eine Gleichung gleich
welchen Grades – 5., 6., 7. oder was auch immer – lösbar ist, indem er diese
Art Untersuchung benutzte.
Das Fazit ist, dass die Zahl 5 besonders ist. Man kann algebraische
Gleichungen 1., 2., 3. und 4. Grades lösen (indem man n-te Wurzeln für
verschiedene Werte von n zieht), aber keine Gleichung 5. Grades. Das
scheinbare Muster kommt hier abrupt zum Stehen.
Nicht überraschend sind Gleichungen höheren Grades als 5 noch
schlimmer, und vor allem leiden sie unter demselben Problem: Es gibt keine
Lösungsformel. Das heißt nicht, dass keine Lösungen existieren, und es
bedeutet auch nicht, dass es unmöglich ist, sehr genaue numerische
Lösungen zu finden. Darin drückt sich lediglich eine Beschränkung des
traditionellen Instrumentariums der Algebra aus. Man kann die Sache mit
der Dreiteilung des Winkels vergleichen: Die ist durchaus möglich, gelingt
aber nicht mit Zirkel und Lineal. Die Antwort existiert zwar, doch die
gewählten Methoden sind unzureichend, um die Lösung zu finden.
Kristallographische Restriktion
Kristalle in zwei oder drei Dimensionen weisen keine fünffachen
Rotationssymmetrien auf.
Die Atome in einem Kristall bilden ein Gitter, also eine Struktur, die sich
periodisch in mehreren, voneinander unabhängigen Richtungen wiederholt.
Das Muster auf einer Tapete wiederholt sich zum Beispiel in der
Längsrichtung der Papierrolle, aber gewöhnlich wiederholt es sich auch
seitwärts, wobei es beim Übergang zum benachbarten Tapetenstück
manchmal zu einem «Sprung» kommt. Tapete ist tatsächlich eine Art
zweidimensionaler Kristall.
Es gibt in der Ebene 17 verschiedene Typen oder Gruppen von
Tapetenmustern (siehe Kapitel [17]). Sie unterscheiden sich durch ihre
Symmetrien, die verschiedene Möglichkeiten darstellen, das Muster starr zu
bewegen und dabei wieder mit sich zur Deckung zu bringen. Zu diesen
Symmetrien gehören Rotationssymmetrien, bei denen das Muster um einen
gewissen Punkt, das Rotationszentrum, und einen gewissen Winkel gedreht
wird.
Die Ordnung einer Rotationssymmetrie gibt an, wie oft man die jeweilige
Drehung durchführen muss, um zum Ausgangspunkt zurückzukehren. So
hat eine Rotation um 90° beispielsweise die Ordnung 4. Die Liste der
möglichen Symmetrietypen für Rotationen eines Kristallgitters zeigt eine
Kuriosität der Zahl 5: Eine solche Rotationssymmetrie gibt es nämlich
nicht. Es gibt Muster mit Rotationssymmetrien 2., 3., 4. und 6. Ordnung,
aber kein Tapetenmuster hat eine Rotationssymmetrie 5. Ordnung. Es gibt
auch keine Rotationssymmetrien oberhalb der 6. Ordnung, doch die erste
Lücke tritt bei 5 auf.
Dasselbe gilt für kristallographische Muster im dreidimensionalen Raum.
Nun wiederholt sich das Gitter in drei unabhängigen Richtungen. Es gibt
219 unterschiedliche Symmetrietypen oder 230, falls man das Spiegelbild
eines Musters als eigenständig betrachtet, wenn das betreffende Muster
keine Spiegelsymmetrie hat. Wiederum sind die möglichen Ordnungen der
Rotationssymmetrie 2, 3, 4 und 6, während 5 auch in diesem Fall wegfällt.
Diese Tatsache bezeichnet man als kristallographische Einschränkung oder
Restriktion.
In der vierten Dimension gibt es hingegen Gitter mit Symmetrien
5. Ordnung, und für Gitter in genügend hohen Dimensionen ist jede
beliebige Ordnung möglich.
Abbildung 40: Kristallgitter von Kochsalz. Dunkle Kugeln: Natriumatome. Helle Kugeln:
Chloratome.
Quasikristalle
Auch wenn es eine Rotationssymmetrie 5. Ordnung in zwei- oder
dreidimensionalen Gittern nicht gibt, kann sie in etwas weniger streng
geordneten Strukturen, sogenannten Quasikristallen, vorkommen. Angeregt
durch einige Skizzen des Astronomen Johannes Kepler, entdeckte der
Mathematiker Roger Penrose in der Ebene Muster mit einer erweiterten
Form einer fünffachen Symmetrie. Sie werden als Quasikristalle
bezeichnet.
Abbildung 41: Links: Eines der beiden Quasikristallmuster mit einer exakten fünffachen
Symmetrie. Rechts: Atomares Modell eines ikosaedrischen Aluminium-Palladium-ManganQuasikristalls.
Quasikristalle kommen in der Natur vor. Im Jahr 1984 entdeckte Daniel
Schechtman, dass eine Legierung von Mangan und Aluminium ein
Quasikristall bilden kann, und nach anfänglicher Skepsis unter
Kristallographen erhielt er, nachdem sich seine Entdeckung als korrekt
herausstellte, 2011 den Nobelpreis für Chemie. Im Jahr 2009 fand ein Team
unter der Leitung von Luca Bindi Quasikristalle in einem Mineral aus dem
russischen Korjakengebirge, eine Verbindung aus Aluminium, Kupfer und
Eisen. Das Mineral trägt inzwischen den Namen Icosahedrit. Mit Hilfe von
massenspektrometrischen Analysen konnten die Forscher die Anteile
verschiedener Sauerstoffisotope bestimmen und zeigen, dass das Mineral
nicht von der Erde stammt. Es hatte sich vor rund 4,5 Milliarden Jahren
gebildet, also zu einer Zeit, als unser Sonnensystem entstand, und war einen
Großteil der Zwischenzeit im Asteroidengürtel gekreist, bevor seine
Umlaufbahn gestört wurde und es schließlich als Meteorit zur Erde fiel.
Kusszahlen
Die kleinste Zahl, die gleich der Summe aller ihrer echten Teiler ist: 6 = 1 +
2 + 3. Die Kusszahl in der Ebene ist 6. Waben werden aus Sechsecken
gebildet – regelmäßigen sechsseitigen Polygonen. Es gibt 6 regelmäßige
vierdimensionale Polytope, analog den regelmäßigen platonischen Körpern.
Die kleinste vollkommene Zahl
Die alten Griechen unterschieden drei Typen von ganzen Zahlen aufgrund
ihrer Teiler:
Abundante Zahlen, bei denen die Summe der «echten» Teiler (das
heißt, unter Ausschluss der Zahl selbst) größer ist als die Zahl selbst.
Defiziente Zahlen, bei denen die Summe der echten Teiler kleiner ist
als die Zahl selbst.
Vollkommene oder perfekte Zahlen, bei denen die Summe der echten
Teiler ebenso groß ist wie die Zahl selbst.
Die ersten Zahlen sind in Tabelle 7 angegeben.
Diese Tabelle zeigt, dass alle drei Typen vorkommen, aber sie deutet auch
darauf hin, dass defiziente Zahlen häufiger sind als die beiden anderen
Typen. Im Jahr 1998 bewies Marc Deléglise eine präzise Form dieser
Behauptung: Wenn n beliebig groß wird, strebt der Anteil der defizienten
Zahlen zwischen 1 und n gegen eine Konstante zwischen 0,7526 und
0,7520, während der Anteil der abundanten Zahlen zwischen 0,2474 und
0,2480 liegt. 1955 hatte Hans-Joachim Kanold bereits bewiesen, dass der
Anteil der vollkommenen Zahlen gegen 0 strebt. Daher sind rund drei
Viertel aller Zahlen defizient, und ein Viertel ist abundant. Kaum eine Zahl
ist vollkommen.
Zahl
Summe der echten Teiler
Typ
1
0 [keine echten Teiler]
defizient
2
1
defizient
3
1
defizient
4
1+2=3
defizient
5
1
defizient
6
1+2+3=6
vollkommen
7
1
defizient
8
1+2+4=7
defizient
9
1+3=4
defizient
10
1+2+5=8
defizient
11
1
defizient
12
1 + 2 + 3 + 4 + 6 = 16
abundant
13
1
defizient
14
1+7=8
defizient
15
1+3+5=9
defizient
Tabelle 7
Die ersten beiden vollkommenen oder perfekten Zahlen sind
Daher ist 6 die kleinste vollkommene Zahl. Die kleinste abundante Zahl ist
12.
Die antiken Mathematiker fanden die nächsten beiden vollkommenen
Zahlen, 28 und 496. Um 100 n. Chr. hatte Nikomachus die vierte gefunden,
nämlich 8128. Um 1460 tauchte die fünfte, 33550336, in einem anonymen
Manuskript auf. Im Jahr 1588 entdeckte Pietro Cataldi die sechste und die
siebte vollkommene Zahl: 8589869056 und 137438691328.
Lange zuvor hatte Euklid bereits eine Regel angegeben, wie man
n
vollkommene Zahlen findet. In moderner Schreibweise besagt sie: Wenn 2
n–1
– 1 prim ist, dann ist 2
n
(2 – 1) vollkommen. Die Zahlen oben
n
korrespondieren mit n = 2, 3, 5, 7, 13, 17 und 19. Primzahlen der Form 2 –
1 werden nach dem Mönch Marin Mersenne als Mersenne-Primzahlen
57 885 161
bezeichnet (siehe Kapitel [2
– 1]).
Leonhard Euler bewies, dass jede gerade vollkommene Zahl diese Form
hat. Seit wenigstens 2500 Jahren ist es Mathematikern jedoch nicht
gelungen, eine ungerade vollkommene Zahl zu finden oder aber zu
beweisen, dass es eine solche Zahl nicht gibt. Falls eine solche Zahl
existiert, so muss sie mindestens 1500 Ziffern und mindestens
101 Primfaktoren haben, von denen mindestens neun verschieden sind. Ihr
größter Primfaktor muss neun oder mehr Ziffern haben.
Kusszahl
Die Kusszahl in der Ebene ist die größte Anzahl von Kreisen einer
gegebenen Größe, die einen Kreis derselben Größe berühren können. Sie ist
gleich 6.
Abbildung 42: Die Kusszahl in der Ebene beträgt 6.
Der Beweis erfordert lediglich ein wenig elementare Geometrie.
Die Kusszahl im dreidimensionalen Raum ist gleich der größten Anzahl
von Kugeln einer gegebenen Größe, die eine Kugel derselben Größe
berühren können. Sie ist gleich 12 (siehe Kapitel [12]). In diesem Fall ist
der Beweis viel komplizierter, und lange Zeit war nicht bekannt, ob
13 Kugeln funktionieren würden.
Waben
Waben werden aus sechseckigen «Kacheln» gebildet, die perfekt
zusammenpassen und eine Ebene auslegen («parkettieren») können (siehe
Kapitel [3]).
Der Honigwaben-Vermutung (Honeycomb Conjecture) zufolge bietet das
Wabenmuster die beste Möglichkeit, die Ebene in Gebiete mit jeweils
gleichem Flächeninhalt aufzuteilen, die den Gesamtumfang minimieren.
Diese Hypothese wurde bereits in der Antike aufgestellt, zum Beispiel von
dem römischen Gelehrten Marcus Terentius Varro 36 v. Chr. Sie könnte
sogar bis auf den griechischen Geometer Pappos von Alexandria rund 325
v. Chr. zurückdatieren.
Abbildung 43: Links: Parkettierung mit regelmäßigen Sechsecken. Rechts: Bienenwaben.
Die Honigwaben-Vermutung ist inzwischen ein Satz geworden: Thomas
Hale bewies sie 1999.
Zahl vierdimensionaler Polytope
Die alten Griechen bewiesen, dass es in drei Dimensionen genau fünf
regelmäßige Körper gibt (siehe Kapitel [5]). Wie sieht es mit Räumen aus,
die nicht dreidimensional sind? Erinnern Sie sich aus Kapitel 4 daran, dass
wir mit Hilfe von Koordinaten mathematische Räume mit beliebig vielen
Dimensionen definieren können. Insbesondere der vierdimensionale Raum
umfasst alle Quadrupel (x, y, z, w) reeller Zahlen. In diesen Räumen gilt ein
natürliches Entfernungskonzept, das auf der offensichtlichen Analogie zum
Satz des Pythagoras basiert, daher können wir problemlos Begriffe wie
Länge, Winkel, Kugel, Zylinder, Kegel und so weiter gebrauchen. Daher ist
die Frage sinnvoll, wie die Analoga der regelmäßigen Körper in der vierten
oder in noch höheren Dimensionen aussehen. Die Antwort ist überraschend.
In zwei Dimensionen gibt es unendlich viele regelmäßige Polygone:
eines für jede ganze Zahl von Seiten, von drei aufwärts. In fünf und mehr
Dimensionen existieren nur drei regelmäßige Polytope, wie sie genannt
werden; sie sind dem Tetraeder, dem Würfel und dem Oktaeder analog. Im
vierdimensionalen Raum gibt es jedoch sechs regelmäßige Polytope.
Die ersten drei Polytope in der Tabelle sind Analoga von Tetraeder,
Würfel und Oktaeder. Der 5-Zeller wird auch als 4-Simplex oder Pentatop
bezeichnet, der 8-Zeller ist ein 4-Hyperwürfel oder Tesserakt, und der 16Zeller ist ein 4-Orthoplex. Die anderen drei Polytope sind spezifisch für den
vierdimensionalen Raum. Den 24-Zeller findet man auch als Hyperdiamant
bezeichnet.
Name
Zellen
Flächen
Kanten
Ecken
5-Zeller
5 Tetraeder
10
10
5
8-Zeller
8 Würfel
24
32
16
16-Zeller
16 Tetraeder
32
24
8
24-Zeller
24 Oktaeder
96
96
24
120-Zeller
120 Dodekaeder 720
1200
600
600-Zeller
600 Tetraeder
720
120
1200
Tabelle 8
Da wir kein vierdimensionales Papier haben, werde ich mich damit
zufriedengeben müssen, Ihnen zu zeigen, wie diese Objekte aussehen, wenn
man sie in die Ebene projiziert.
Abbildung 44: Die sechs regelmäßigen Polytope, in die Ebene projiziert. Von links nach
rechts und von oben nach unten: 5-Zeller, 8-Zeller, 16-Zeller, 24-Zeller, 120-Zeller, 600Zeller.
Ludwig Schläfli klassifizierte die regelmäßigen Polytope. Einen Teil seiner
Ergebnisse publizierte er 1855 und 1858, und der Rest erschien 1901
posthum. Zwischen 1880 und 1900 kamen neun andere Mathematiker
unabhängig zu ähnlichen Ergebnissen. Zu ihnen gehörte Alicia Boole Stott,
eine der Töchter des Mathematikers und Logikers George Boole, der als
Erster den Begriff «Polytop» verwendete. Sie zeigte von früher Kindheit an
ein intuitives Verständnis für vierdimensionale Geometrie, vielleicht
deshalb, weil ihre ältere Schwester Mary den Mathematiker Charles
Howard Hinton heiratete, einen Exzentriker mit schillernder Persönlichkeit
(er wurde wegen Bigamie verurteilt), der eine Leidenschaft für die
Visualisierung des vierdimensionalen Raumes hatte. Alicia nutzte diese
Fähigkeit, um allein mit rein euklidischen Methoden zu zeigen, wie
Querschnitte der Polytope aussehen: Es handelt sich um komplexe, höchst
symmetrische regelmäßige Körper.
Die vierte Primzahl
Die Zahl 7 ist die vierte Primzahl und gut geeignet zu erklären, wozu
Primzahlen dienen können und warum sie so interessant sind. Primzahlen
tauchen bei den meisten Problemen auf, bei denen ganze Zahlen
miteinander multipliziert werden. Sie sind eine Art Bausteine für alle
ganzen Zahlen. Wie wir in Kapitel 1 gesehen haben, ist jede ganze Zahl
größer 1 entweder prim oder lässt sich durch die Multiplikation von zwei
oder mehr Primzahlen erhalten.
Die Zahl 7 ist auch mit einem altbekannten Problem über Fakultäten
verknüpft. Und es ist die kleinste Zahl von Farben, die nötig ist, um
sämtliche Karten auf einem Torus so einzufärben, dass benachbarte
Regionen unterschiedliche Farben tragen.
Faktoren finden
Im Jahr 1801 schrieb Carl Friedrich Gauß, der führende Zahlentheoretiker
seiner Tage und einer der herausragenden Mathematiker aller Zeiten, ein
fortschrittliches Lehrbuch über Zahlentheorie, die Disquisitiones
Arithmeticae. Zwischen all den ausgesuchten Themen wies er darauf hin,
dass zwei grundlegende Dinge von entscheidender Bedeutung sind: «Dass
das Problem, die Primzahlen von den zusammengesetzten zu unterscheiden
und Letztere in ihre Primfaktoren zu zerlegen, zu den wichtigsten und
nützlichsten der ganzen Arithmetik gehört und den Fleiß und die Weisheit
der Geometer der Antike und der Neuzeit beschäftigt hat, ist so bekannt,
dass es überflüssig ist, viel darüber zu sagen.»
Die offensichtlichste Methode, beide Probleme zu lösen, besteht darin,
alle möglichen Faktoren nacheinander durchzuprobieren. Um
beispielsweise zu sehen, ob 35 eine Primzahl ist, und ihre Faktoren zu
finden, wenn dies nicht der Fall ist, gehen wir folgendermaßen vor:
Daher ist 35 = 5 × 7, und da 7 eine Primzahl ist, vervollständigt dies die
Faktorisierung.
Dieses Verfahren lässt sich etwas effizienter gestalten. Wenn wir bereits
über eine Liste von Primzahlen verfügen, müssen wir nur Primteiler
durchprobieren. Nachdem wir zum Beispiel festgestellt haben, dass 2 die
Zahl 35 nicht ohne Rest teilt, wissen wir sofort, dass 4 sie ebenfalls nicht
ohne Rest teilt. Das ist so, weil 2 ein Teiler von 4 ist, daher teilt 2 alles, was
auch durch 4 teilbar ist. (Dasselbe gilt für 6, 8 und alle anderen geraden
Zahlen.)
Wir können zudem aufhören, nach weiteren Teilern zu suchen, wenn wir
die Quadratwurzel der betreffenden Zahl erreichen. Warum? Ein typischer
Fall ist die Zahl 4283, deren Quadratwurzel ungefähr gleich 65,44 ist. Wenn
wir zwei Zahlen multiplizieren, die größer sind als diese Zahl, muss das
Ergebnis größer als 65,44 × 65,44 sein, was 4283 ergibt. Ganz gleich, wie
wir 4283 daher in zwei (oder mehr) Faktoren zerlegen, zumindest einer von
ihnen ist kleiner oder gleich der betreffenden Quadratwurzel. Tatsächlich
muss er kleiner oder gleich 65 sein, die Zahl, die wir erhalten, wenn wir
alles nach dem Dezimalkomma in der Quadratwurzel einfach ignorieren.
Wir können daher alle Faktoren von 4283 finden, indem wir die
Primzahlen zwischen 2 und 65 testen. Wenn irgendeiner dieser Faktoren
4283 glatt teilte, würden wir nach Durchführung dieser Teilung fortfahren,
das Ergebnis in Faktoren zu zerlegen – aber das ist dann eine kleinere Zahl
als 4283. Wie sich herausstellt, gibt es keine Primzahl bis 65, die 4283 teilt.
4283 ist daher prim.
Wenn wir dasselbe Verfahren anwenden, um 4183 in Faktoren zu
zerlegen, wobei deren Quadratwurzel 64,67 ist, müssen wir alle Primzahlen
bis 64 durchprobieren. Nun teilt die Primzahl 47 die Zahl 4183 ohne Rest:
Wie sich herausstellt, ist 89 prim. Tatsächlich wissen wir das bereits, weil
4183 sich nicht durch 2, 3, 5 und 7 teilen lässt. Daher ist 89 nicht durch 2,
3, 5 und 7 teilbar, aber das sind die einzigen Primzahlen bis zu ihrer
Quadratwurzel, die 9,43 beträgt. Daher haben wir die Primfaktorisierung
4183 = 47 × 89 gefunden.
Dieses Verfahren ist zwar einfach, für große Zahlen jedoch kaum
geeignet. Um zum Beispiel die Faktoren von
zu finden, müssten wir alle Primzahlen bis zu ihrer Quadratwurzel
105409255,3 durchprobieren. Das sind ziemlich viele Primzahlen –
6054855, um genau zu sein. Schließlich werden wir auf einen Primfaktor
stoßen, nämlich 2071723, der zu der Faktorisierung
führt, aber das würde per Hand eine ganze Weile dauern.
Ein Computer kann das natürlich schneller erledigen, doch eine
Grundregel bei solchen Berechnungen lautet: Wenn sich etwas bei
mittelgroßen Zahlen per Hand nur schwer berechnen lässt, wird es bei
genügend großen Zahlen auch für einen Computer sehr schwierig. Selbst
ein Computer hat Probleme, eine systematische Suche wie diese
durchzuführen, wenn die Zahl, um die es geht, 50 Ziffern statt 17 hat.
Fermats kleiner Satz
Zum Glück gibt es bessere Methoden. Es gibt effiziente Verfahren, um zu
testen, ob eine Zahl prim ist, ohne sich die Faktoren anzuschauen. Generell
sind diese Verfahren für Zahlen mit rund hundert Ziffern geeignet, auch
wenn der Schwierigkeitsgrad stark von der betreffenden Zahl abhängt und
die Anzahl der Ziffern nur ein grober Richtwert ist. Im Gegensatz dazu
kennen Mathematiker bisher keine raschen Methoden, die mit Garantie die
Faktoren irgendeiner zusammengesetzten Zahl dieser Größe findet. Es
würde reichen, nur einen einzigen Faktor zu finden, weil dieser als Teiler
benutzt und der Prozess dann wiederholt werden kann, aber im schlimmsten
Fall nimmt dieser Prozess viel zu viel Zeit in Anspruch, um praktikabel zu
sein.
Primzahltests beweisen, dass eine Zahl zusammengesetzt ist, ohne
irgendeinen ihrer Faktoren zu finden. Ein solcher Test zeigt lediglich, dass
sie den Primzahltest nicht besteht. Primzahlen haben spezielle
Eigenschaften, und wir können überprüfen, ob eine bestimmte Zahl diese
Eigenschaften aufweist. Wenn nicht, kann sie keine Primzahl sein. Es
erinnert ein wenig daran, wie man eine undichte Stelle in einem Ballon
findet: Man bläst ihn auf und schaut, ob er seine Größe hält. Wenn nicht,
gibt es eine undichte Stelle – aber der Test sagt uns nicht, wo sie sich
befindet. Zu beweisen, dass es ein Leck gibt, ist einfacher, als zu sagen, wo
es sich befindet. Dasselbe gilt für Faktoren.
Der einfachste derartige Test ist Fermats kleiner Satz. Um ihn
darzulegen, werden wir uns zunächst mit modularer Arithmetik
beschäftigen, die manchmal auch als Modul- oder Uhren-Arithmetik
bezeichnet wird, weil die Zahlen kreisförmig angeordnet sind, wie auf dem
Zifferblatt einer Uhr. Man nehme eine Zahl – für die Analoguhr mit ihrer
Zifferblatteinteilung in 12 Stunden ist es die 12 – und nennt sie das Modul.
Bei jeder arithmetischen Berechnung mit ganzen Zahlen ist nun erlaubt,
sämtliche Vielfache von 12 durch 0 zu ersetzen. Beispielsweise ist 5 × 5 =
25, aber 24 ist das Doppelte von 12, wenn wir daher 24 abziehen, erhalten
wir 5 × 5 = 1 für den Modulus 12.
Gauß führte die Modul-Arithmetik in seinen Disquisitiones Arithmeticae
ein, und heutzutage findet sie in den Computerwissenschaften, der Physik
und im Ingenieurwesen breite Verwendung. Das ist eine hübsche Sache,
denn fast alle der üblichen Rechenregeln gelten auch in diesem Fall. Der
Hauptunterschied ist, dass man nicht immer eine Zahl durch eine andere
teilen kann, selbst wenn sie ungleich null ist. Diese Rechenweise ist zudem
nützlich, weil sie eine saubere Möglichkeit bietet, Fragen über Teilbarkeit
zu handhaben: Welche Zahlen lassen sich durch das gewählte Modul teilen,
und wie groß ist der Rest, wenn sie nicht glatt teilbar sind?
Fermats kleiner Satz besagt Folgendes: Wenn wir einen beliebigen
Modulus p wählen, der eine Primzahl ist, und eine beliebige Zahl a nehmen,
die kein Vielfaches von p ist, dann ist die (p – 1)-te Potenz von a in der
Modul-Arithmetik zum Modulus p stets gleich 1.
Setzen wir beispielsweise p = 17 und a = 3. Dann besagt der Satz, dass 1
16
als Rest bleibt, wenn wir 3 durch 17 teilen. Die Überprüfung erbringt:
Niemand, der bei klarem Verstand ist, würde solche Berechnungen bei sehr
großen Zahlen gern per Hand vornehmen. Zum Glück gibt es eine clevere
und rasche Möglichkeit, derartige Berechnungen durchzuführen, indem
man die Zahl wiederholt quadriert und geeignete Ergebnisse miteinander
multipliziert.
Der entscheidende Punkt ist: Wenn die Antwort nicht gleich 1 ist, dann
muss das Modul, von dem wir ausgegangen sind, eine zusammengesetzte
Zahl sein. Daher bildet Fermats kleiner Satz die Grundlage eines effizienten
Tests, der eine notwendige Bedingung darstellt, die erfüllt sein muss, wenn
eine Zahl eine Primzahl ist. Und das tut der Test, ohne einen Faktor zu
finden. Genau das könnte das der Grund dafür sein, dass er so praktikabel
ist.
Fermats kleiner Satz ist jedoch nicht narrensicher: Einige
zusammengesetzte Zahlen bestehen den Test. Die kleinste ist 561. Im Jahr
2003 bewiesen Red Alford, Andrew Granville und Carl Pomerance, dass es
unendlich viele Ausnahmen dieser Art gibt, die inzwischen als CarmichaelZahlen bekannt sind. Der effizienteste narrensichere Primzahltest, den wir
gegenwärtig kennen, wurde von Leonard Adleman, Pomerance und Robert
Rumely entwickelt. Dieser Test stützt sich auf Ideen aus der Zahlentheorie,
die raffinierter sind als Fermats kleiner Satz, aber in dieselbe Richtung
gehen.
Im Jahr 2002 entdeckten Manindra Agrawal und seine Studenten Neeraj
Kayal und Nitin Saxena einen Primzahltest, der im Prinzip schneller zum
Ziel führt als der Adleman-Pomerance-Rumely-Test, weil er eine
«polynomiale Laufzeit» hat. Wenn die Zahl n dezimale Ziffern aufweist, hat
12
der Algorithmus eine Laufzeit, die maximal zu n
proportional ist.
7,5
Inzwischen wissen wir, dass sich die Laufzeit auf n
reduzieren lässt. Der
Vorteil dieses Algorithmus wird jedoch erst deutlich, wenn die Anzahl der
1000
Ziffern in n rund 10
beträgt. Allerdings bietet das bekannte Universum
nicht genügend Platz, um eine Zahl derartiger Größe niederzuschreiben.
Primzahlen und Codes
Primzahlen sind zu wichtigen Instrumenten in der Kryptographie geworden,
der Wissenschaft von der Informationsverschlüsselung. Codes sind
militärisch wichtig (siehe Kapitel [26]), aber auch Wirtschaftsunternehmen
und Privatpersonen haben Geheimnisse. Wir wollen beispielsweise nicht,
dass Kriminelle Zugang zu unseren Bankkonten oder zu unseren
Kreditkartennummern erhalten, wenn wir das Internet benutzen.
Der übliche Weg, dieses Risiko zu senken, besteht im Verschlüsseln: Die
Information wird in einen Code umgesetzt. Das RSA-System, ein
berühmter Code, der 1978 von Ted Rivest, Adi Shamir und Leonard
Adleman entwickelt wurde, basiert auf Primzahlen – und zwar auf großen,
rund hundert Ziffern langen. Das System hat die bemerkenswerte
Eigenschaft, dass man die Art und Weise, wie eine Botschaft in einen Code
umgewandelt wird, problemlos öffentlich machen kann. Was man für sich
behält, ist, wie man den umgekehrten Weg findet – wie man die Botschaft
also entschlüsselt. Dazu bedarf es einer zusätzlichen Information, die
geheim gehalten wird.
Jede Botschaft lässt sich leicht in eine Zahl verwandeln – beispielsweise
dadurch, dass man jedem Buchstaben einen Code aus zwei Ziffern zuordnet
und all diese Codes aneinanderfügt. Nehmen wir an, wir verwenden die
Codes A = 01, B = 02 und so weiter, wobei Ziffern oberhalb von 27 für
Satzzeichen und Zwischenräume verwendet werden können. Dann ließe
sich das Wort BOTSCHAFT so verschlüsseln:
Ein Code ist eine Möglichkeit, eine gegebene Botschaft in eine andere
Botschaft zu konvertieren. Aber da jede Botschaft eine Zahl ist, kann man
sich einen Code als Weg vorstellen, eine gegebene Zahl in eine andere Zahl
umzuwandeln. An dieser Stelle kommen Mathematiker ins Spiel, und sie
können Ideen aus der Zahlentheorie einsetzen, um Codes zu schaffen.
Beim RSA-System werden zunächst zwei Primzahlen p und q
ausgewählt, jede mit, sagen wir, 100 Ziffern. Primzahlen dieser Größe
lassen sich mit einem Primzahltest per Computer rasch finden. Man
multipliziert beide und erhält pq. Die öffentlich bekannte Methode,
Botschaften in Codes zu verwandeln, konvertiert die Botschaft in eine Zahl
und führt dann eine Rechnung durch, die auf diesem Produkt pq basiert.
(Die technischen Einzelheiten finden sich weiter unten.) Um den Code aber
wieder in die eigentliche Botschaft zurückzuverwandeln, muss man p
kennen (sodass sich auch q leicht errechnen lässt).
Wenn man der Öffentlichkeit jedoch nicht erzählt, was p ist, dann kann
sie die Botschaft nicht decodieren, es sei denn, jemand findet heraus, was p
ist. Aber das erfordert die Faktorisierung von pq, einer Zahl mit
200 Ziffern, und wenn man p und q nicht wirklich schlecht gewählt hat,
scheint das selbst mit dem leistungsfähigsten Supercomputer unserer Tage
verlorene Liebesmüh zu sein. Wenn die Leute, die den Code entwickelt
haben, p und q verlieren, befinden sie sich in derselben Lage wie alle
übrigen: Sie stehen auf dem Schlauch.
Technische Einzelheiten
Man wähle zwei große Primzahlen p und q. Man berechne n = pq und s = (p
– 1)(q – 1). Man wähle eine Zahl e zwischen 1 und s, die teilerfremd mit s
ist. (Es gibt eine sehr effiziente Methode, die gemeinsamen Teiler zweier
Zahlen zu finden, den sogenannten euklidischen Algorithmus. Dieser datiert
ins alte Griechenland zurück und taucht in Euklids Elementen auf. Siehe
Professor Stewarts mathematische Detektivgeschichten. Man veröffentliche
p und e. Man nenne e den öffentlichen Schlüssel.
Die Modul-Arithmetik sagt uns nun, dass es eine eindeutige Zahl d
zwischen 1 und s gibt, für die ein Rest 1 bleibt, wenn man de durch s teilt.
Das heißt, de = 1(mod s). Man berechne diese Zahl d. Man halte p, q, s und
d geheim. Man nenne d den privaten Schlüssel.
Um eine Botschaft in einen Code umzuwandeln, stelle man sie, wie
beschrieben, als Zahl m dar. Falls notwendig, zerlegt man eine lange
Botschaft in Blöcke und verschickt alle Blöcke nacheinander. Anschließend
e
berechne man c = m (mod n). Das ist die codierte Botschaft, und sie kann
an den Empfänger geschickt werden. Diese Verschlüsselungsregel kann
man ohne Risiko publik machen. Und auf der Basis der binären
Erweiterung von e lässt sich c rasch berechnen.
Der Empfänger, der den privaten Schlüssel d kennt, kann die Botschaft
d
decodieren, indem er c (mod n) berechnet. Ein grundlegendes Theorem in
der Zahlentheorie – eine geringfügige Erweiterung von Fermats kleinem
Satz – besagt implizit, dass das Ergebnis mit der ursprünglichen Botschaft
m identisch ist.
Ein Spion, der versucht, die Botschaft zu entschlüsseln, muss d
herausfinden, ohne s zu kennen. Das lässt sich auf die Kenntnis von p – 1
und q – 1 bzw. p und q zurückführen. Um diese Zahlen zu finden, muss der
Spion n faktorisieren. Aber n ist so groß, dass dies nicht machbar ist.
Codes diesen Typs werden als Falltür-Codes (trapdoor codes)
bezeichnet, weil es leicht ist, durch eine Falltür zu fallen (die Botschaft in
einen Code zu konvertieren), aber schwierig, wieder aus der Falle
hinauszuklettern (die Botschaft zu decodieren), wenn man nicht spezielle
Hilfe hat (den privaten Schlüssel). Mathematiker können nicht mit
Sicherheit behaupten, dass dieser Code absolut unknackbar ist. Vielleicht
gibt es eine rasche Möglichkeit, große Zahlen zu faktorisieren, und wir
waren bisher nur noch nicht schlau genug, sie zu finden. (Möglicherweise
lässt sich d auch noch auf eine andere Weise berechnen, aber sobald man d
kennt, kann man p und q ausrechnen, daher würde dies auf eine effiziente
Methode zum Auffinden von Faktoren herauslaufen.)
Selbst wenn der Code theoretisch nicht knackbar ist, könnte ein Spion in
der Lage sein, p und q auf anderem Weg in die Hände zu bekommen, sei es
durch Einbruch oder Bestechung bzw. Erpressung einer Person, die das
Geheimnis kennt. Das ist ein Problem bei jedem Geheimcode. In der Praxis
wird das RSA-System für eine begrenzte Zahl wichtiger Botschaften
verwendet, zum Beispiel, um jemandem den geheimen Schlüssel für eine
einfachere Methode zur Verschlüsselung von Botschaften zu senden.
Das Brocard-Problem
Wenn man alle Zahlen von 1 bis n nimmt und sie miteinander multipliziert,
erhält man «n Fakultät», geschrieben n!. Fakultäten geben an, wie viele
Möglichkeiten es gibt, n Objekte anzuordnen (siehe Kapitel [26!]).
Die ersten Fakultäten sind:
Wenn wir zu diesen Zahlen 1 addieren, erhalten wir:
und wir erkennen drei dieser Zahlen als Quadratzahlen, nämlich
Wir kennen keine weiteren derartigen Zahlen, doch es ist bisher nicht
bewiesen, dass keine größere Zahl n in der Lage ist, n! + 1 zu einer
perfekten Quadratzahl zu machen. Die Frage, welche Fakultäten Vorgänger
zu Quadratzahlen sind, wird als das Brocard-Problem bezeichnet, weil sich
Henri Brocard 1876 fragte, ob 7 die größte Zahl mit dieser Eigenschaft sei.
Später vermutete Paul Erdős, die Antwort sei «nein». Im Jahr 2000
bewiesen Bruce Bernd und William Galway, dass es für n kleiner
1 Milliarde keine anderen Lösungen gibt. Und 1993 bewies Marius
Overholt, dass es nur endlich viele Lösungen gibt, aber nur unter der
Annahme, dass die sogenannte ABC-Vermutung richtig ist, ein wichtiges,
bisher ungelöstes Problem der Zahlentheorie. (Siehe Ian Stewart: Die
letzten Rätsel der Mathematik, S. 464)
Eine siebenfarbige Karte auf einem Torus
Percy Heawood arbeitete an einer Verallgemeinerung des Vierfarbensatzes
(siehe Kapitel [4]) bei Karten auf komplizierteren Oberflächen.
Die Frage, wie viele Farben man für eine Karte auf einer Kugel braucht,
führt zur selben Antwort wie für die Ebene. Stellen Sie sich eine Karte auf
einer Kugel vor und drehen Sie diese, bis der Nordpol irgendwo im Inneren
eines Gebiets liegt. Wenn man in den Nordpol ein Loch bohrt, kann man die
angestochene Kugel öffnen und auseinanderziehen und erhält so einen
Raum, der topologisch einer unendlichen Ebene äquivalent ist. Das Gebiet,
das den Pol enthielt, wird dann zu einem unendlich großen «Rand», der alle
anderen Länder umschließt.
Es gibt jedoch andere, interessantere Oberflächen, wie den Torus, der wie
ein Schwimmreifen oder ein Doughnut mit einem Loch geformt ist, sowie
Oberflächen mit mehreren derartigen Löchern.
Abbildung 45: Torus sowie ein Torus mit zwei bzw. mit drei Löchern.
Es gibt ein nützliches Verfahren zur bildlichen Darstellung eines Torus, das
das Leben oft einfacher macht. Wenn wir den Torus entlang zweier
geschlossener Kurven aufschneiden, können wir ihn zu einem Quadrat
öffnen.
Abbildung 46: Ein aufgeschnittener Torus lässt sich zu einem Quadrat ausrollen.
Diese Transformation verändert die Topologie des Torus, aber wir können
dieses Problem beseitigen, indem wir uns einigen, korrespondierende
Punkte auf gegenüberliegenden Seiten zu behandeln, als seien sie identisch
(was durch Pfeile angezeigt wird). Nun kommt der clevere Teil. Wir müssen
das Quadrat tatsächlich gar nicht ausrollen und die korrespondierenden
Ränder miteinander verbinden. Wir können geradewegs mit dem flachen
Quadrat arbeiten, vorausgesetzt, wir behalten die Regel im Hinterkopf, die
uns sagt, wie man die Ränder identifiziert. Für alles, was wir auf dem Torus
tun, beispielsweise Kurven zeichnen, existiert eine präzise
korrespondierende Konstruktion auf dem Quadrat.
Abbildung 47: Für eine Karte auf einem Torus benötigt man sieben Farben.
Heawood bewies, dass sieben Farben sowohl notwendig als auch
hinreichend sind, um jede beliebige Karte auf einem Torus einzufärben. Die
Abbildung zeigt, dass sieben «Farben» notwendig sind, wobei wir, wie
oben beschrieben, ein Quadrat benutzen, um den Torus zu repräsentieren.
Man beachte, dass die Regionen an den gegenüberliegenden Rändern
zusammenpassen, wie es diese Art der Darstellung verlangt.
Wir haben gesehen, dass es Oberflächen gibt, die wie ein Torus aussehen,
aber mehr Löcher aufweisen. Die Zahl der Löcher wird als das Geschlecht
(Genus) des Torus bezeichnet und mit dem Buchstaben g abgekürzt.
Heawood stellte entsprechend seiner Vermutung eine Gleichung für die
Anzahl von Farben auf, die man für einen Torus mit g Löchern braucht,
wenn g ≥ 1 ist: Es ist die größte ganze Zahl, die kleiner oder gleich
ist.
Wenn g von 1 bis 10 läuft, ergibt diese Formel die Zahlen
Heawood entwickelte seine Formel, indem er seinen Beweis des FünfFarben-Satzes in der Ebene verallgemeinerte. Er konnte zeigen, dass die
Zahl der Farben, die sich durch Anwendung seiner Formel ergibt, für jede
Oberfläche stets ausreichend ist. Lange Jahre stand die große Frage im
Raum, ob sich diese Zahl verringern ließ. Beispiele für kleine Werte des
Geschlechts ließen vermuten, dass Heawoods Schätzung die bestmögliche
ist. Nach längeren Untersuchungen ergänzten Gerhard Ringel und John
W. T. (Ted) Youngs 1968 die letzten Einzelheiten in einem Beweis, der
zeigt, dass Heawoods Vermutung richtig ist, wobei die beiden auf ihren
eigenen Arbeiten und denjenigen mehrerer Kollegen aufbauten. Ihre
Methoden basieren auf Netzwerken ganz spezieller Art und sind so
kompliziert, dass man ein eigenes Buch damit füllen könnte.
Fibonacci-Potenzen
Die erste nichttriviale Kubikzahl; auch eine Fibonacci-Zahl. Gibt es noch
weitere Fibonacci-Kubikzahlen? Das Nachdenken über Kubikzahlen führte
Fermat zur Formulierung seines berühmten letzten Satzes. Sophie Germain,
einer der großen Frauen in der Mathematik, gelang ein wichtiger Beitrag zu
einem Spezialfall. 350 Jahre nach Fermats ursprünglicher Vermutung fand
Andrew Wiles schließlich einen vollständigen Beweis.
Die erste Kubikzahl (nach 1)
Die Kubikzahl einer Zahl erhält man, indem man die Zahl mit sich selbst
multipliziert und das Ergebnis anschließend mit der ursprünglichen Zahl
multipliziert. Die Kubikzahl von 2, beispielsweise, ist 2 × 2 × 2 = 8. Die
3
Kubikzahl einer Zahl n wird n geschrieben, sie ist gleich der 3. Potenz von
n. Die ersten Kubikzahlen sind
Fermats letzter Satz
Kubikzahlen brachten einen Gedankengang ins Rollen, der die Köpfe von
Mathematikern mehr als 300 Jahre lang beschäftigte.
Um 1630 bemerkte Fermat, dass die Addition von zwei Kubikzahlen
ungleich null offenbar keine Kubikzahl ergab. (Wenn man null zulässt, dann
3
3
3
gilt 0 + n = n für alle n.) Er hatte begonnen, eine 1621er Ausgabe eines
berühmten antiken Algebrabuches zu lesen, die Arithmetica von Diophant.
Auf den Rand seines Exemplars schrieb er: «Es ist unmöglich, eine
Kubikzahl in die Summe von zwei Kubikzahlen zu zerlegen, eine vierte
Potenz in zwei vierte Potenzen oder ganz allgemein irgendeine Potenz
höher als die zweite Potenz in zwei Potenzen derselben Art. Ich habe
hierfür einen wahrhaft wunderbaren Beweis entdeckt, doch ist dieser Rand
hier zu schmal, um ihn zu fassen.»
Algebraisch ausgedrückt behauptete Fermat, er habe einen Beweis dafür
gefunden, dass die Gleichung
keine ganzzahligen Lösungen hat, wenn n eine ganze Zahl größer oder
gleich 3 ist.
Diese Aussage, die nun als «Fermats letzter Satz» bezeichnet wird,
wurde erstmals 1670 gedruckt, als Fermats Sohn Samuel eine Ausgabe der
Arithmetica mit den Randnotizen seines Vaters publizierte (siehe Abb. 48
auf Seite 132).
Abbildung 48: Fermats Randnotiz, publiziert in der Veröffentlichung der von Fermats Sohn
herausgegebenen Arithmetica von Diophant; Überschrift: «Beobachtung von Monsieur
Pierre de Fermat».
Vermutlich begann Fermat sich für diese Frage zu interessieren, weil er die
pythagoreischen Tripel kannte: zwei Quadrate (von ganzen Zahlen), die
2
2
sich zu einer Quadratzahl addieren. Ein wohlbekanntes Beispiel ist 3 + 4
2
= 5 . Es gibt unendlich viele derartige Tripel, und eine allgemeine Formel
dafür ist seit der Antike bekannt (siehe Kapitel [5]).
Wenn Fermat tatsächlich einen Beweis für seine Behauptung entdeckt
haben sollte, so hat ihn bisher niemand gefunden. Wir wissen, dass er einen
gültigen Beweis für vierte Potenzen entwickelt hatte, bei dem er die
Tatsache nutzte, dass eine vierte Potenz ein Quadrat besonderer Art ist –
nämlich das Quadrat eines Quadrats –, um diese Version des Problems mit
pythagoreischen Tripeln zu verknüpfen. Wie dieselbe Idee zeigt, kann man,
um Fermats letzten Satz zu beweisen, annehmen, dass die Potenz n
entweder 4 oder eine ungerade Primzahl ist. Im Lauf der nächsten beiden
Jahrhunderte wurde Fermats letzter Satz für genau drei ungerade
Primzahlen bewiesen: 3, 5 und 7. Euler beschäftigte sich 1770 mit
Kubikzahlen, Legendre und Peter Gustav Lejeune Dirichlet nahm sich um
1825 fünfte Potenzen vor, und Gabriel Lamé bewies 1839 den Satz für
siebte Potenzen.
Sophie Germain machte bedeutende Fortschritte bei einem Ansatz, der
später als der «erste Fall» von Fermats letztem Satz bekannt wurde. Dabei
nahm sie an, dass n prim ist und x, y oder z nicht teilt. Im Rahmen eines
ehrgeizigeren Programms, das niemals abgeschlossen wurde, bewies sie den
p
p
p
Sophie-Germain-Satz: Wenn x + y = z ist, wobei p prim und kleiner als
2
100 ist, dann ist xyz durch p teilbar. Tatsächlich bewies sie viel mehr als
das, aber die Aussage ist ziemlich fachspezifisch. Bei dem Beweis benutzte
sie Zahlen, die heute als Sophie-Germain-Primzahlen oder auch
Germain’sche Primzahlen bezeichnet werden: eine Primzahl p, für die gilt,
dass 2p + 1 ebenfalls prim ist. Die ersten Sophie-Germain-Primzahlen sind
und die größte bekannte ist
Sie wurde 2012 von Philipp Bliedung entdeckt. Man nimmt an, dass es
unendlich viele derartige Primzahlen gibt, doch das ist eine bisher
ungeklärte Frage. Sophie-Germain-Primzahlen finden in der Kryptographie
und bei Primzahltests Anwendung.
Fermats letzter Satz wurde schließlich 1995 von Andrew Wiles bewiesen,
mehr als 350 Jahre nachdem Fermat ihn formulierte. Die Methoden, die in
den Beweis einflossen, gingen weit über das hinaus, was zu Fermats Tagen
möglich war, oder was er hätte erfinden können.
Die Catalan’sche Vermutung
Im Jahr 1844 stellte der belgische Mathematiker Eugène Catalan eine
interessante Frage zu den Zahlen 8 und 9: «Ich bitte Sie, Monsieur, in Ihrer
Sammlung das folgende Theorem zu veröffentlichen, das ich für wahr halte,
wenngleich es mir noch nicht gelungen ist, es vollständig zu beweisen.
Andere mögen mehr Glück haben. Zwei aufeinanderfolgende ganze Zahlen
können, mit der Ausnahme von 8 und 9, keine exakten Potenzen sein;
m
n
anderes gesagt: Die Gleichung x – y = 1, in der die Unbekannten positive
ganze Zahlen sind, hat nur eine einzige Lösung.»
Diese Aussage wurde als die Catalan’sche Vermutung bekannt. Im Jahr
2002 gelang es Preda V. Mihăilescu schließlich, sie mit fortschrittlichen
Methoden aus der algebraischen Zahlentheorie zu beweisen.
Die sechste Fibonacci-Zahl und die einzige nichttriviale
Fibonacci-Kubikzahl
Im Jahr 1202 verfasste Leonardo da Pisa einen arithmetischen Text mit dem
Titel Liber Abbaci (Das Buch vom Rechnen), in dem er einem europäischen
Publikum die indo-arabischen Ziffern 0–9 erklärte. Das Buch enthielt eine
seltsame Frage zum Wachstum einer Kaninchenpopulation. Man beginne
mit einem Paar noch nicht geschlechtsreifer Kaninchen. Nach zwei
Monaten wird dieses Paar geschlechtsreif und setzt nun jeden Monat ein
weiteres Paar in die Welt, das sich genauso verhält. Kaninchen sind
unsterblich. Wie wächst die Population in Lauf der Jahre?
Abbildung 49: Die ersten Generationen in Fibonaccis Kaninchenmodell.
Leonardo zeigte, dass die Zahl der Paare dem Muster
folgt, bei dem jede Zahl nach den ersten beiden gleich der Summe der
beiden vorangegangenen Zahlen ist. Beispielsweise ist 2 = 1 + 1, 3 = 1 + 2,
5 = 2 + 3, 8 = 3 + 5, 13 = 5 + 8 und so weiter. Leonardo erhielt später den
Spitznamen Fibonacci (Sohn des Bonaccio), und seit 1877, als Lucas über
diese Folge schrieb, sind ihre Vertreter als Fibonacci-Zahlen bekannt. Oft
wird dieser Folge eine extra Null vorangestellt, die «nullte» Fibonacci-Zahl.
Die Regel zur Bildung gilt auch dann, denn 0 + 1 = 1.
Das Modell ist natürlich nicht realistisch und das war auch nicht
beabsichtigt. Es war nur ein interessantes numerisches Problem in seinem
Lehrbuch. Moderne Verallgemeinerungen, die als Leslie-Modelle bekannt
sind, sind jedoch wirklichkeitsnäher und lassen sich auf reale Populationen
praktisch anwenden.
Eigenschaften von Fibonacci-Zahlen
Seit langem sind Mathematiker von Fibonacci-Zahlen fasziniert. Es besteht
eine grundlegende Beziehung zur Goldenen Zahl (auch: Goldener Schnitt)
φ. Wenn man die grundlegende Eigenschaft verwendet, dass
= φ – 1 ist,
kann man beweisen, dass die n-te Fibonacci-Zahl Fn genau gleich
ist. Das ist die ganze Zahl, die
am nächsten kommt. Daher sind die
n
Fibonacci-Zahlen annähernd proportional zu φ , was darauf hinweist, dass
sie exponentiell wachsen – wie die Potenzen einer festen Zahl.
Die Fibonacci-Zahlen weisen viele Muster auf. Man nehme
beispielsweise drei aufeinanderfolgende Terme, wie 5, 8 und 13. Dann ist 5
2
× 13 = 65 und 8 = 64, sie unterscheiden sich also um 1. Allgemeiner
ausgedrückt:
Summen aufeinander folgender Fibonacci-Zahlen erfüllen die Gleichung:
Beispielweise ist
Es gibt keine bekannte Formel für die Summe der Kehrwerte der FibonacciZahlen ungleich null:
Numerisch beträgt diese «reziproke Fibonacci-Konstante» ungefähr
3,359885666243, und Richard André-Jeannin hat bewiesen, dass diese Zahl
irrational ist – kein glatter Bruch.
Viele Fibonacci-Zahlen sind prim. Die ersten Fibonacci-Primzahlen sind
2, 3, 5, 13, 89, 233, 1597, 28657 und 514229. Die größte bekannte
Fibonacci-Primzahl hat Tausende von Ziffern. Es ist nicht bekannt, ob es
unendlich viele Fibonacci-Primzahlen gibt.
Eine sehr schwierige Frage, die erst kürzlich gelöst wurde, lautet: Wann
ist eine Fibonacci-Zahl eine Potenz? Im Jahr 1951 bewies W. Ljunggren,
2
dass die zwölfte Fibonacci-Zahl 144 = 12 die einzige nichttriviale
Fibonacci-Zahl ist, die eine Quadratzahl ist. Harvey Cohn fand 1964 einen
weiteren Beweis. (0 und 1 sind n-te Potenzen für alle n, aber nicht
3
besonders interessant.) Die sechste Fibonacci-Zahl ist 8 = 2 , und 1969
bewiesen H. London und R. Finkelstein, dass es sich um die einzige
nichttriviale Fibonacci-Zahl handelt, die eine Kubikzahl ist. 2006 bewiesen
Y. Bugeaud, M. Mignotte und S. Siksek, dass die einzigen FibonacciZahlen, die perfekte Potenzen (höher als die erste Potenz) sind, 0, 1, 8 und
144 sind.
Magische Quadrate
Das kleinste nichttriviale magische Quadrat hat 9 Zellen. Es gibt
9 Kachelungen oder Parkettierungen der Ebene mittels regelmäßiger
Polygone, die an jeder Ecke in derselben Weise angeordnet sind. Ein
Rechteck mit den richtigen Abmessungen lässt sich in 9 Quadrate
unterschiedlicher Größe aufteilen.
Das kleinste magische Quadrat
Magische Quadrate sind quadratische Matrizen von Zahlen – gewöhnlich
der Zahlen 1, 2, 3, … bis zu einer Obergrenze –, die so angeordnet sind,
dass jede Zeile, Spalte und beide Diagonalen sich zur selben Summe
addieren. Sie haben keine große Bedeutung für die Mathematik, aber sie
machen Spaß. Das kleinste magische Quadrat (abgesehen vom trivialen 1 ×
1-Quadrat, das nur aus der Zahl 1 besteht) ist ein 3 × 3-Quadrat mit den
Ziffern 1 bis 9.
Abbildung 50: Links: Das Lo-Shu-Quadrat. Rechts: Moderne Version.
Das früheste bekannte magische Quadrat wird in einer alten chinesischen
Legende erwähnt, in der der Kaiser Yu dem Flussgott im Fluss Luo wegen
einer riesigen Überschwemmung Opfergaben darbringt. Daraufhin tauchte
eine magische Schildkröte aus dem Fluss auf, die auf ihrem Rückenpanzer
ein seltsames mathematisches Muster trug. Das war das Lo Shu, ein
magisches Quadrat der Größe 3 × 3, das Punkte anstelle von Zahlen
benutzt.
Abbildung 51: Links: Ein tibetisches Bild des Lo Shu. Rechts: Kaiser Yu.
Wenn das magische Quadrat die Ziffern 1–9 verwendet (die
Standardannahme, falls es keine guten Gründe gibt, etwas anderes
anzunehmen), und zwar jeweils nur einmal, ist das Lo Shu, abgesehen von
Drehungen und Spiegelungen, die einzig mögliche magische Anordnung.
Seine magische Konstante – die Summe der Zahlen in jeder Zeile, Spalte
oder Diagonalen – ist 15. Das Quadrat zeigt darüber hinaus noch andere
Muster. Die geraden Zahlen besetzen die vier Ecken. Zahlen, die sich
diametral gegenüberstehen, addieren sich stets zu 10.
Die Größe eines magischen Quadrats wird als seine Ordnung bezeichnet.
2
Das Lo Shu hat die Ordnung 3, ein magisches Quadrat n-ter Ordnung hat n
2
Zellen, die gewöhnlich die Zahlen 1 bis n enthalten.
Andere alte Hochkulturen, wie Persien und Indien, interessierten sich
ebenfalls für magische Quadrate. Im 10. Jahrhundert fand man in einem
Tempel im indischen Khajuraho ein magisches Quadrat 4. Ordnung. Seine
magische Konstante ist – wie die aller magischen Quadrate 4. Ordnung, die
die Zahlen 1–16 verwenden – 34.
Abbildung 52: Magisches Quadrat 4. Ordnung aus dem 10. Jahrhundert.
Es gibt viele unterschiedliche magische Quadrate 4. Ordnung; insgesamt
sind es 880, wenn man Drehungen und Spiegelungen nicht mitzählt. Die
Anzahl magischer Quadrate 5. Ordnung ist noch viel höher: 275305224.
Die genaue Anzahl der magischen Quadrate 6. Ordnung ist nicht bekannt,
19
doch man nimmt an, dass es rund 1,7745 × 10 sind.
Der Maler Albrecht Dürer verewigte ein magisches Quadrat in seinem
Kupferstich Melencolia I, das noch mehrere weitere mathematische Objekte
enthält. Das Quadrat wurde so gewählt, dass die Jahreszahl, 1514, in der
Mitte der unteren Zeile erscheint.
Abbildung 53: Links: Melencolia I. Rechts: Detail des magischen Quadrats. Man beachte
die Jahreszahl 1514 in der Mitte der unteren Zeile.
Magische Quadrate existieren für sämtliche Ordnungen größer oder gleich
3, und ein triviales für Ordnung 1, aber keins für Ordnung 2. Es gibt
allgemeine Methoden, um Beispiele zu konstruieren; sie sind davon
abhängig, ob n ungerade ist, doppelt so groß wie eine ungerade Zahl ist
oder ein Vielfaches von 4 ist.
Die magische Konstante für ein magisches Quadrat n-ter Ordnung ist
. Das ist so, weil die Summe aller Zellen 1 + 2 + 3 + … + n
ist, was gleich
2
ist. Weil sich das Quadrat in n Zeilen
aufspalten lässt, die alle dieselbe Summe aufweisen, lässt sich die magische
Konstante daraus gewinnen, indem man den Ausdruck durch n teilt.
Abbildung 54: Allgemeine Methode zur Konstruktion eines magischen Quadrats mit
ungerader Kantenlänge. Man schreibe 1 in die Mitte der obersten Zeile, anschließend
platziere man die aufeinanderfolgenden Zahlen 2, 3, 4, …, indem man den Pfeilen diagonal
folgt und immer eine Zeile weiter nach oben und eine Spalte weiter nach rechts sich
bewegt. Wann immer eine Zahl auf ein bereits besetztes Feld trifft, bewege man sich zu der
direkt darunter liegenden Zelle weiter.
Archimedische Parkettierung
Neun Parkettierungsmuster benutzen mehr als einen einzigen regelmäßigen
Polygontyp mit genau derselben Kachelanordnung in jeder Ecke. Diese
Muster sind als archimedische, semireguläre oder 1-uniforme
Parkettierungen der Ebene bekannt (siehe gegenüberliegende Seite).
Quadratische Rechtecke
Ein Quadrat lässt sich problemlos in neun kleinere Quadrate gleicher Größe
zerlegen, indem man es längs jeder Kante drittelt. Die kleinste Zahl von
ungleichen Quadraten, in die sich ein Rechteck mit ganzzahligen Seiten
zerlegen lässt, beträgt ebenfalls neun, aber die Anordnung ist viel
schwieriger herauszufinden.
Wir alle wissen, dass sich ein rechteckiger Boden mit quadratischen
Kacheln gleicher Größe auslegen lässt – vorausgesetzt, seine Kanten sind
ganzzahlige Vielfache der Kachelgröße. Aber was passiert, wenn wir
quadratische Kacheln benutzen müssen, die alle unterschiedliche Größen
haben? Das erste «quadratische Rechteck» wurde 1925 von Zbigniew
Morón veröffentlicht: Er verwendete zehn quadratische Kacheln der Größe
3, 5, 6, 11, 17, 19, 22, 23, 24 und 25. Bald darauf entdeckte er ein
quadratisches Rechteck, für das er neun quadratische Kacheln der Größe 1,
4, 7, 8, 9, 10, 14, 15 und 18 benötigte.
Abbildung 55: Die neun archimedischen Parkettierungen.
Wie steht es damit, ein Quadrat aus unterschiedlichen quadratischen
Kacheln zusammenzusetzen? Lange Zeit galt das als unmöglich, doch 1939
fand Roland Sprague 55 unterschiedlich große quadratische Kacheln, die
zusammengelegt ein Quadrat ergaben. Im Jahr 1940 veröffentlichten
Leonard Brooks, Cedric Smith, Arthur Stone und William Tutte, damals
Studenten am Trinity College in Cambridge, einen Artikel, der das Problem
mit elektrischen Netzwerken in Verbindung brachte – das Netzwerk codiert
für die Größe der Quadrate und die Art und Weise, wie sie
zusammenpassen. Diese Methode führte zu weiteren Lösungen.
Abbildung 56: Links: Moróns erstes in Quadrate unterteiltes Rechteck. Rechts: Seine
Verbesserung auf neun Kacheln.
Im Jahr 1948 fand Theophilus Willcock 24 Quadrate, die sich zu einem
Quadrat zusammenfügen ließen. Bis vor kurzem nahm man an, dass es
keine kleinere Menge gibt, die das schafft, aber 1962 zeigte Adrianus
Duijvestijn mit Hilfe eines Computers, dass man nur 21 Kacheln braucht
und dies die Minimalzahl ist. Ihre Größe ist 2, 4, 6, 7, 8, 9, 11, 15, 16, 17,
18, 19, 24, 25, 27, 29, 33, 35, 37, 42 und 50.
Abbildung 57: Links: Willcocks in Quadrate unterteiltes Quadrat mit 24 Kacheln. Rechts:
Duijvestijns Quadrat mit 21 Kacheln.
Im Jahr 1975 stellte sich Solomon Golomb die Frage: Kann man eine
unendliche Ebene lückenlos kacheln, wenn man genau eine Kachel von der
Größe jeder ganzen Zahl benutzt: 1, 2, 3, 4 und so weiter? Bis vor kurzem
war das Problem ungelöst, doch 2008 entwickelten James und Frederick
Henle einen einfallsreichen Beweis, der zeigte, dass die Antwort «ja» lautet.
Das Dezimalsystem
Das Dezimalsystem, das wir verwenden, um Zahlen zu schreiben, basiert
auf 10, wahrscheinlich, weil wir zehn Finger und Zehen haben – im
Englischen digits, dasselbe Wort, das auch für Ziffern gebraucht wird.
Andere Basen sind ebenfalls möglich, und einige von ihnen – vor allem 20
und 60 – sind in antiken Kulturen auch verwendet worden. 10 ist sowohl
eine Dreiecks- als auch eine Viereckszahl. Anders, als Euler annahm, gibt
es zwei orthogonale lateinische Quadrate der Abmessung 10 × 10.
In Zehnerschritten zählen
Unsere heutige Zahlenschreibweise wird als «dezimal» bezeichnet, weil sie
10 als Zahlenbasis benutzt. Decem ist lateinisch und steht für «zehn». In
diesem System werden dieselben zehn Symbole
benutzt, um Einer, Zehner, Hunderter, Tausender und so weiter darzustellen.
Was davon gemeint ist, wird durch die Position des Symbols in der Zahl
angezeigt. In der Zahl 2015 bedeuten die Symbole beispielsweise:
Die zentrale Rolle spielen hier die aufeinanderfolgenden Potenzen von 10:
Wir haben uns so sehr an diese Schreibweise gewöhnt, dass wir dazu
neigen, sie einfach als «Zahlen» anzusehen und anzunehmen, dass die Zahl
10 mathematisch eine Sonderstellung einnimmt. Sehr ähnliche
Notationssysteme lassen sich jedoch auf jeder beliebigen Zahlenbasis
errichten. Auch wenn 10 in der Tat etwas Besonderes ist – wir werden
später noch darauf zurückkommen –, ist sie in dieser Hinsicht nichts
Besonderes.
Computer benutzen mehrere Basen:
Das Duodezimalsystem auf der Basis 12 ist oft als Verbesserung des
Dezimalsystems vorgeschlagen worden, weil 12 durch 2, 3, 4 und 6 teilbar
ist, 10 hingegen nur durch 2 und 5. Die Mayas nutzten die 20 als Basis, die
alten Babylonier hingegen die 60 (siehe für beides Kapitel [0]).
Wir können 2015 im Dezimalsystem folgendermaßen schreiben:
oder wenn man die Potenzen ausschreibt:
Dieses System wird als Stellenwertsystem bezeichnet, weil die Bedeutung
eines Symbols von seiner Stellung abhängt.
Dieselben Symbole zur Basis 8 würden folgendermaßen aussehen:
In der uns vertrauteren Dezimalschreibweise wird daraus
Daher stellen dieselben Symbole, wenn sie auf unterschiedlichen Basen
interpretiert werden, unterschiedliche Zahlen dar.
Schauen wir uns noch eine weitere weniger vertraute Basis an: 7. Auf
Apellobetnees III haben die außerirdischen Bewohner alle sieben
Schwänze, und sie zählen mit Hilfe dieser Schwänze. Daher beschränkt sich
ihr Zahlensystem auf die Ziffern 0 bis 6. Dann schreiben sie 10, wo wir 7
schreiben würden, und machen weiter bis 66, was wir als 48 schreiben
würden. Für unsere 49 benutzen sie 100, und so weiter.
Das heißt, eine Zahl wie abcd in Apellobetneesisch lässt sich
folgendermaßen ins Dezimalsystem übersetzen:
Mit ein wenig Übung kann man mit diesem System außerirdische
Berechnungen ausführen, ohne sie ins Dezimalsystem und wieder zurück zu
konvertieren. Man braucht Regeln wie «4 + 5 = 2, 1 im Sinn» (weil 9 im
Dezimalsystem 12 im Siebenersystem entspricht), doch abgesehen davon
sieht alles sehr vertraut aus.
Geschichte der Zahlenschreibweise
Frühe Zivilisationen verwendeten völlig andere Systeme, um Zahlen zu
schreiben, als wir heutzutage. Die Babylonier benutzten eine Notation, die
auf der Zahl 60 basierte, und drückten die sechzig Ziffern mit
Keilschriftsymbolen aus (siehe Kapitel [0]). Die Ägypter besaßen spezielle
Symbole für die Potenzen von 10 und wiederholten sie, um neue Zahlen zu
schaffen. Die alten Griechen benutzten ihr Alphabet für die Zahlen 1–9, 10–
90 und 100–900.
Abbildung 58: Links: Ägyptische Zahlensymbole. Rechts: Die Zahl 5724 in ägyptischen
Hieroglyphen.
Unsere heutige Stellenwertschreibweise und unsere Symbole für die zehn
Ziffern 0–9 tauchten um 500 n. Chr. in Indien auf, doch es gab frühere
Vorläufer. Die Geschichte ist kompliziert, die Daten sind schwer zu belegen
und umstritten.
Abbildung 59: Links: Symbole aus dem Bakshali-Manuskript. Rechts: BrahmiZahlenzeichen.
Das Bakshali-Manuskript, das 1881 in der Nähe des Dorfes Bakshali im
heutigen Pakistan gefunden wurde, ist das älteste bekannte Dokument der
indischen Mathematik. Experten nehmen an, dass es aus der Zeit zwischen
dem 2. Jahrhundert v. Chr. und dem 3. Jahrhundert n. Chr. stammt;
vermutlich handelt es sich um eine Kopie eines früheren Manuskripts. Es
benutzt eigenständige Symbole für die Ziffern 0–9. Brahmi-Zahlenzeichen
gehen bis in die Zeit um 200–300 n. Chr. zurück, verwendeten aber keine
Stellenwertnotation. Vielmehr gab es zusätzliche Symbole für die
Multiplikation mit 10, 100 und 1000 und zugleich Regeln, die angaben, wie
man diese Symbole kombiniert, um beispielsweise eine Zahl wie 3000 zu
schreiben.
Später wurden von den Brahmi-Zeichen «hindische» Zahlenzeichen
abgeleitet. Sie wurden von dem indischen Mathematiker Aryabhata im
6. Jahrhundert in mehreren verschiedenen Formen verwendet. Brahmagupta
benutzte im 7. Jahrhundert 0 als eigenständige Zahl und fand Regeln, um
mit Null zu rechnen.
Abbildung 60: Beispiele für arabische und indische Zahlensymbole.
Die indische Erfindung breitete sich im Mittleren Osten aus, vor allem
durch den persischen Mathematiker Al-Chwarizmi (De numero Indorum –
Über die indische Zahlschrift, um 825) und den arabischen Mathematiker
Al-Kindi (Über den Gebrauch von indischen Zahlen, um 830). Durch die
lateinische Übersetzung von Al-Chwarizmis Buch gelangten diese
Zahlensymbole schließlich auch nach Europa.
Das erste Buch, das speziell geschrieben wurde, um dieses
Notationssystem in Europa zu verbreiten, war Fibonaccis Liber Abbaci
(1202). Er nannte die Notation modus Indorum (Methode der Inder), doch
die Verbindung mit Al-Chwarizmi war so stark, dass sich der Begriff
«arabische Zahlen» durchsetzte – trotz des Titels von Chwarizmis Buch.
Der Name bürgerte sich vermutlich auch deshalb ein, weil viele Europäer
durch arabisierte Berbervölker mit diesen Zahlen in Kontakt kamen.
Abbildung 61: Einige moderne Zahlensymbole. (* Japaner und Koreaner verwenden die
vereinfachten chinesischen Symbole.)
Es dauerte eine Weile, bis sich diese Symbole durchsetzten. Im
mittelalterlichen Europa wurden Dutzende von Varianten benutzt. Selbst
heutzutage verwenden unterschiedliche Kulturen unterschiedliche
Versionen der Symbole.
Das Dezimalkomma
Fibonaccis Liber Abbaci enthielt eine Schreibweise, die wir bis heute
gebrauchen: den waagerechten Strich in einem Bruch, wie in
für «drei
Viertel». Die Inder verwendeten eine ähnliche Notation, aber ohne
Querstrich; der Querstrich wurde offenbar von den Arabern eingeführt.
Fibonacci benutzt ihn häufig, doch derselbe Querstrich konnte Teil
mehrerer verschiedener Brüche sein.
Heutzutage benutzen wir Brüche aus praktischen Gründen nur selten.
Stattdessen verwenden wir ein Dezimalkomma und schreiben
beispielsweise π als 3,14159. Dezimalzahlen in diesem Sinne gehen auf das
Jahr 1585 zurück, als Simon Stevin Privatlehrer von Moritz von Nassau
wurde, dem Sohn von Wilhelm dem Schweigsamen. Stevin wurde
schließlich zum Finanzminister ernannt. Auf der Suche nach präzisen
Buchführungsmethoden stieß er auf die indo-arabische Schreibweise, fand
Brüche aber zu unhandlich.
Die stets praktischen Babylonier stellten Brüche in ihrem auf 60
basierenden System dar, indem sie geeignete Zahlen für Potenzen von
wählten, was zu unseren modernen Sekunden und Minuten führte, und zwar
sowohl auf die Zeit als auch auf Winkel bezogen. In einer modernisierten
Form der babylonischen Notation bedeutet 6:15 so viel wie 6 + 15 × (
was wir als
),
oder 6,25 schreiben würden. Stevin gefiel diese Idee,
abgesehen von der Benutzung der Basis 60, und er dachte sich ein System
aus, das das Beste aus beiden Systemen kombinierte: das Dezimalsystem.
Als er sein neues System veröffentlichte, betonte er seine praktischen
Vorteile und die Verwendungsfähigkeiten im Geschäftsleben: «Alle
geschäftsmäßigen Berechnungen lassen sich unter alleiniger Nutzung
ganzer Zahlen und ohne die Hilfe von Brüchen durchführen.»
Seine Notation enthielt noch kein Dezimalkomma an sich, doch sie führte
sehr rasch zu unserer heutigen Dezimalschreibweise. Wo wir beispielsweise
5,7731 schreiben würden, schrieb Stevin 5
Hier bedeutet das Symbol
7
eine ganze Zahl,
7
3
1
.
verweist auf ein
Zehntel,
auf ein Hundertstel, und so weiter. Die Nutzer entledigten sich
bald der
und der
und behielten nur die
bei, die immer weiter
schrumpfte und sich schließlich in den angelsächsischen Dezimalpunkt
bzw. das kontinentaleuropäische Dezimalkomma verwandelte.
Reelle Zahlen
Ein Haken zeigt sich allerdings, wenn man Dezimalzahlen für Brüche
benutzt: Sie sind nicht exakt. Beispielsweise liegt
sehr nah an 0,333 und
noch näher an 0,333333, aber keiner von beiden Werten ist exakt. Um das
festzustellen, muss man die Werte nur mit 3 multiplizieren: Als Ergebnis
sollte man 1 erhalten, aber es sind tatsächlich nur 0,999 bzw. 0,999999.
Knapp vorbei ist auch daneben. Mathematiker erkannten, dass eine
«korrekte» Dezimalentwicklung von
in gewissem Sinne unendlich lang
sein müsste:
Und so müsste es endlos weitergehen. Und das führte zu der Idee, dass eine
Zahl wie π ebenfalls endlos weitergeht, abgesehen davon, dass sich nicht
dieselben Ziffern unendlich oft wiederholen:
Es ist wichtig, sich an dieser Stelle klarzumachen, dass
tatsächlich gleich
0,333333… ist, solange die Zahl nicht aufhört. Hier ist der Beweis: Sei
Man multipliziere diese Zahl mit 10. Das führt auf der einen Seite des
Gleichheitszeichens zu 10x und verschiebt 0,333333… um eine Stelle nach
links, also
Daher ist
Die Aussage, dass 10x = 3 + x ist, basiert darauf, dass die Zahlen unendlich
weiterlaufen. Wenn sie irgendwann – selbst nach einer Billion
Wiederholungen – stoppen sollten, wäre die Aussage falsch.
Eine ähnliche Argumentation besagt, dass 0,999999…, wenn die Zahl
unendlich weiterläuft, gleich 1 ist. Man kann entweder denselben Trick
anwenden, der zu 10x = 9 + x führt, sodass x = 1 ist, oder man kann
0,333333… einfach mit 3 multiplizieren.
=
Viele Leute sind überzeugt, dass 0,999999…, unendlich weitergeführt,
nicht gleich 1 ist. Sie glauben, die Zahl müsse kleiner sein. Das stimmt,
wenn man irgendwann anhält, aber die Menge, durch die sie sich von 1
unterscheidet, wird auch immer kleiner:
und so weiter. Diese Differenz strebt gegen den Grenzwert 0. Sie wird
kleiner als jede positive Zahl, ganz gleich, wie winzig.
Mathematiker definieren den Wert einer unendlich langen Dezimalzahl
als Grenzwert der endlich langen Dezimalzahlen, die man erhält, wenn man
an irgendeiner Stelle abbricht, während die Zahl der Dezimalstellen bis
unendlich steigt. Für eine unendliche Folge von Neunen beträgt der
Grenzwert genau 1. Kein Wert kleiner 1 tut’s, denn eine ausreichend große
Anzahl von Neunen ergibt einen größeren Wert. Es gibt nichts wie
«unendlich viele Nullen, gefolgt von einer 1" – und selbst wenn es so etwas
gäbe, würde man nicht 1 erhalten, indem man es zu 0,999999… addiert.
Diese Definition ist es, die unendliche Dezimalzahlen zu einem
vernünftigen mathematischen Konzept macht. Die resultierenden Zahlen
werden als reelle Zahlen bezeichnet – nicht etwa, weil sie in der realen Welt
auftreten, sondern um sie von diesen vertrackten «imaginären» Zahlen wie i
zu unterscheiden (siehe Kapitel [i]). Der Preis, den wir für die Verwendung
des Grenzwerts zahlen, ist, dass einige Zahlen zwei unterschiedliche
dezimale Erweiterungen haben können wie 0,999999… und 1,000000…
Daran gewöhnt man sich jedoch rasch.
Die vierte Dreieckszahl
Abbildung 62: Die vierte Dreieckszahl
Die vierte Dreieckszahl (siehe Kapitel [3]) ist
Der alte Kult der Pythagoreer bezeichnete diese Anordnung als die
Tetraktys und betrachtete sie als heilig. Die Pythagoreer glaubten, das
Universum basiere auf Zahlen, und den ersten zehn Zahlen schrieben sie
besondere Eigenschaften zu. Diese Zuschreibungen sind stark umstritten; zu
Beispielen aus zahlreichen Quellen gehören:
Da 10 die Summe dieser vier bedeutenden Zahlen ist, galt sie als besonders
wichtig. Sie symbolisierte auch die vier «Elemente» – Erde, Wasser, Feuer,
Luft – und die vier Komponenten des Raums: Punkt, Linie, Ebene, Körper.
Abbildung 63: Bowling mit zehn Kegeln.
Die zehn Kegel auf einer Bowlingbahn werden in dieser Weise aufgestellt.
Die dritte Viereckszahl
Genauso, wie die Dreieckszahlen 1, 3, 6, 10 und so weiter die Summen
aufeinander folgender ganzer Zahlen sind, sind die Viereckszahlen die
Summen aufeinander folgender Dreieckszahlen:
Die n-te Viereckszahl ist gleich
.
Geometrisch lässt sich eine Viereckszahl von Kugeln zu einem Tetraeder
aufstapeln, einem Stapel immer kleiner werdender Dreiecke.
Abbildung 64: Viereckszahlen.
Zehn ist (neben 1) die kleinste Zahl, die sowohl eine Dreiecks- als auch
eine Viereckszahl ist. Die einzigen Zahlen, die sowohl Dreiecks- als auch
Viereckszahlen sind, sind: 1, 10, 120, 1540 und 7140.
Orthogonale lateinische Quadrate 10. Ordnung
Im Jahr 1873 dachte Euler über einen mathematischen Zeitvertreib nach,
magische Quadrate, bei denen Zahlen so in einem quadratischen Gitter
angeordnet werden, dass sich alle Zeilen und Spalten zum selben Ergebnis
addieren (siehe Kapitel [9]). Doch Eulers fruchtbare Phantasie strebte in
eine neue Richtung, und er veröffentlichte seine Ideen in einem Aufsatz
«Eine neue Art von magischen Quadraten». Hier ein Beispiel:
Die Zeilen und Spalten ergeben alle dieselbe Summe, nämlich 6, daher
handelt es sich, abgesehen von einer Diagonale, um ein magisches Quadrat;
zudem verletzt es aber auch die Standardbedingung, dass jede Zahl nur
einmal auftauchen darf. Stattdessen besteht jede Zeile und jede Reihe aus 1,
2 und 3 in unterschiedlicher Reihenfolge. Solche Quadrate sind als
lateinische Quadrate bekannt, weil die Symbole keine Zahlen zu sein
brauchen; vor allem können sie aus den lateinischen (das heißt römischen)
Buchstaben A, B, C bestehen.
Hier die Aufgabe, die Zarin Katharina ihrem Hofmathematiker Euler
stellte: Beim Divisionsball ordnet jedes der sechs teilnehmenden
Regimenter für jeden der 6 Dienstgrade je 1 Offizier für eine besondere
Aufgabe ab: Die 36 Offiziere sollten zur Feier des Tages so im Quadrat
aufgestellt werden, dass in jeder Zeile und jeder Spalte genau 1 Offizier
eines jeden Regiments und eines jeden Dienstgrades steht.
Wenn wir A, B, C, D, E und F für die Ränge benutzen und 1, 2, 3, 4, 5
und 6 für die Regimenter, geht es bei dem Problem um zwei lateinische 6 ×
6-Quadrate, eines für jede Symbolmenge. Zudem müssen sie orthogonal
sein, das heißt, dass beim Überlagern der Quadrate alle entstehenden
Symbolpaare verschieden sind. Es ist einfach, separate Anordnungen für
Ränge und Regimenter zu finden, aber beide so zusammenzuführen, dass
sich keine Kombination von Rang und Regiment wiederholt, ist deutlich
schwieriger. Beispielsweise könnten wir
versuchen. Aber wenn wir beide Anordnungen kombinieren, erhalten wir:
und da gibt es Wiederholungen. So taucht A1 beispielsweise zweimal auf
und B2 sogar vier Mal. Das ist also keine Lösung.
Wenn wir dasselbe Problem mit 16 Offizieren und 4 Rängen A, B, C, D
und für vier Regimenter 1, 2, 3, 4 versuchen, ist eine Lösung nicht allzu
schwer zu finden:
Diese Quadrate sind orthogonal. Bemerkenswerterweise gibt es ein drittes
lateinisches Quadrat, das orthogonal zu diesen beiden ist:
Um im Jargon zu bleiben, haben wir eine Menge von drei paarweise
orthogonalen lateinischen Quadraten 4. Ordnung gefunden.
Euler versuchte sein Bestes, um ein geeignetes Paar orthogonale
lateinische Quadrate 6. Ordnung zu finden, aber all seine Mühen waren
vergeblich. Das brachte ihn zu der Überzeugung, dass sein Rätsel um die
36 Offiziere keine Lösung hatte. Es gelang ihm jedoch, Paare orthogonaler
lateinischer n × n-Quadrate für alle ungeraden Zahlen n und alle Vielfachen
von 4 zu konstruieren, und es lässt sich leicht beweisen, dass kein solches
Quadrat 2. Ordnung existiert. Es blieben die Größen 6, 10, 14, 18 und so
weiter – jeweils das Doppelte einer ungeraden Zahl –, und Euler vermutete,
dass für diese Größen keine orthogonalen Paare existieren.
Abbildung 65: Parkers zwei orthogonale lateinische 10 × 10-Quadrate, bereits überlagert:
erste Ziffer das eine, zweite Ziffer das andere.
Es gibt 812 Millionen verschiedener lateinischer 6 × 6-Quadrate und selbst,
wenn man Abkürzungen nimmt, kann man nicht einfach alle möglichen
Kombinationen auflisten. Dennoch bewies Gaston Tarry 1901, dass Euler
recht hatte, was die 6 × 6-Quadrate anging. Bei allen anderen lag er
allerdings falsch. Im Jahr 1959 konstruierte Ernest Tilden Parker zwei
orthogonale lateinische 10 × 10-Quadrate. Und bis 1960 war es Parker, Raj
Chandra Bose und Sharadachandra Shankar Shrikhande gelungen zu
beweisen, dass Eulers Vermutung für alle Größen mit Ausnahme des 6 × 6Quadrats falsch ist.
NULL UND NEGATIVE ZAHLEN
Nachdem wir 1–10 abgehandelt haben, gehen wir einen
Schritt zurück und beschäftigen uns mit 0.
Dann gehen wir einen weiteren Schritt zurück
und gelangen zu –1.
Damit öffnet sich uns die ganz neue Welt der negativen
Zahlen. Dies eröffnet zugleich neue Möglichkeiten für den
Gebrauch von Zahlen.
Sie dienen nicht länger nur zum Zählen.
Ist nichts eine Zahl?
Die Null tauchte erstmals in Systemen zum Aufschreiben von Zahlen auf.
Erst später wurde sie als eigenständige Zahl akzeptiert und konnte ihren
Platz als grundlegendes Element des mathematischen Zahlensystems
einnehmen. Diese Zahl weist jedoch viele ungewöhnliche, manchmal
paradox erscheinende Merkmale auf. Vor allem kann man nicht vernünftig
durch 0 teilen. Grundsätzlich lassen sich in der Mathematik alle Zahlen von
0 ableiten.
Grundlage der Zahlennotation
In vielen alten Kulturen waren die Symbole für 1, 10 und 100 nicht
verknüpft. Die alten Griechen, beispielsweise, benutzten die Buchstaben
ihres Alphabets, um die Zahlen 1–9, 10–90 und 100–900 darzustellen. Das
ist potenziell recht verwirrend, auch wenn sich im Allgemeinen leicht aus
dem Kontext entscheiden lässt, ob ein Symbol für einen Buchstaben oder
für eine Zahl steht. Aber es macht das Rechnen auch schwierig.
Unsere Zahlenschreibweise, bei der dieselbe Ziffer je nach ihrer Stellung
für verschiedene Zahlen steht, wird als Stellenwertschreibweise bezeichnet
(siehe Kapitel [10]). Dieses System hat für das Rechnen mit Papier und
Bleistift große Vorteile, und dies war bis vor kurzem die Methode, mit der
die meisten Menschen auf der Welt rechneten. Bei der Stellenwertnotation
muss man ein paar Grundregeln zum Addieren und Multiplizieren der zehn
Symbole 0–9 kennen. Es gibt gemeinsame Muster, wenn dieselben
Symbole an verschiedenen Stellen auftauchen, zum Beispiel:
Abbildung 66: *vau, koppa und sampi sind verzichtbare Zeichen.
Wenn man jedoch die Notation der alten Griechen benutzt, sehen die beiden
ersten Gleichungen so aus:
wobei sich keine gemeinsame Struktur erkennen lässt.
Es gibt jedoch eine besondere Eigenschaft der Stellenwertschreibweise,
die sich bei 2015 zeigt: die Notwendigkeit eines Symbols für null. Es sagt
uns, dass es keine Hunderter gibt. Die griechische Notation braucht dies
nicht. Bei σπ, beispielsweise, bedeutet σ «200» und π «80». Wir können
erkennen, dass es keine Einer gibt, denn keines der Einersymbole α bis θ
taucht auf. Statt ein Symbol für null zu benutzen, schreiben wir einfach
keines der Einser-Symbole auf.
Wenn wir das im Dezimalsystem versuchen, wird aus 2015 215, aber es
lässt sich nicht sagen, ob 215, 2150, 2105, 2015 oder aber, um es noch
weiter zu treiben, 2000150 gemeint ist. Frühe Versionen der
Stellenwertschreibweise benutzten einen Zwischenraum, 2 15, aber einen
solchen Zwischenraum kann man leicht übersehen, und zwei benachbarte
Zwischenräume ergeben nur einen etwas längeren Zwischenraum. Daher ist
diese Art der Darstellung verwirrend und führt leicht zu Fehlern.
Eine kurze Geschichte der Null
Babylon
Die erste Kultur, die ein Symbol für die Aussage «hier steht keine Zahl»
einführte, war die der Babylonier. Erinnern Sie sich aus Kapitel 10 daran,
dass die babylonische Zahlennotation nicht auf der 10, sondern auf der 60
2
basierte. In frühen babylonischen Berechnungen wird das Fehlen eines 60 -
Terms durch einen Zwischenraum angezeigt, aber ab 300 v. Chr. hatten sie
ein spezielles Symbol
erfunden. Die Babylonier sahen dieses
Symbol jedoch offenbar nicht als eigenständige Zahl an. Zudem ließen sie
es weg, wenn es am Ende der Zahl stand, sodass man die Bedeutung aus
dem Zusammenhang erschließen musste.
Indien
Die Idee eines Stellenwertsystems zur Basis 10 taucht im Lokavibhaga auf,
einem Sanskrit-Text der Jaina über Kosmologie aus dem Jahr 458 n. Chr.,
der auch den Begriff shunya (leer) verwendet, wo wir «null» benutzen
würden. 498 n. Chr. beschrieb der berühmte indische Mathematiker und
Astronom Aryabhata die Stellenwertnotation als «eine Verzehnfachung des
Wertes von Stelle zu Stelle». Der erste unstrittige Gebrauch eines speziellen
Symbols für die Dezimalziffer 0 findet sich 876 v. Chr. in einer Inschrift im
Chaturbhuj-Tempel in Gwalior, und Sie werden es kaum glauben – es ist ein
kleiner Kreis.
Die Mayas
Die Maya-Zivilisation in Mittelamerika, die ihren kulturellen Höhepunkt
zwischen 250 und 900 n. Chr. erreichte, verwendete ein Zahlensystem, das
auf der 20 basierte, und sie hatten ein explizites Symbol für null. Diese
Schreibweise reicht offenbar viel weiter zurück, und man nimmt an, dass
sie von den Olmeken (1500–400 v. Chr.) erfunden wurde. Die Mayas
nutzten Zahlen vor allem in ihrem Kalendersystem, von dem ein Aspekt als
Lange Zählung bekannt ist. Dieses System ordnet jedem Tag ein Datum zu,
indem es abzählt, wie viele Tage seit einem mythischen Schöpfungsdatum
vergangen sind, das nach dem gegenwärtigen westlichen Kalender am
11. August 3114 v. Chr. stattgefunden haben soll. In diesem System ist ein
Symbol für null unverzichtbar, um Mehrdeutigkeiten zu vermeiden.
Abbildung 67: Links: Zahlenzeichen der Mayas. Rechts: Eine Steinstele in der
präkolumbianischen Stadt Quirigua trägt das Schöpfungsdatum der Mayas: 13 Baktun, 0
Katun, 0 Tun, 0 Uinal, 0 Kin, 4 Ahau, 8 Cumku. Das ist nach unserer Rechnung der
11. August 3114 v. Chr.
Ist null eine Zahl?
Vor dem 9. Jahrhundert n. Chr. wurde null als bequemes Symbol für
numerische Berechnungen angesehen, aber nicht als eigenständige Zahl
betrachtet – wahrscheinlich, weil es nichts zählte.
Wenn jemand Sie fragt, wie viele Kühe Sie besitzen und Sie einige Kühe
Ihr Eigen nennen, zeigen Sie nacheinander auf die Tiere und zählen «eins,
zwei, drei …». Wenn Sie jedoch keine Kühe besitzen, zeigen Sie nicht auf
eine Kuh und sagen «null», weil es keine Kuh gibt, auf die Sie zeigen
könnten. Da man nicht durch Zählen zu 0 gelangen kann, handelt es sich
offensichtlich nicht um eine Zahl.
Wenn Ihnen diese Sichtweise seltsam erscheint, sollten Sie sich daran
erinnern, dass noch früher «eins» nicht als Zahl galt. Wenn man eine Anzahl
Kühe hatte, dann war das sicherlich mehr als nur eine. Eine ähnliche
Unterscheidung kann man noch immer in modernen Sprachen finden: die
Unterscheidung zwischen Einzahl und Mehrzahl. Die alten Griechen
kannten ebenfalls eine «duale» Form, bei der spezielle Modifikationen von
Wörtern benutzt wurden, wenn von zwei Objekten die Rede war. In diesem
Sinne wurde «zwei» nicht als eine Zahl wie alle übrigen betrachtet. Für
mehrere andere klassische Sprachen galt dasselbe, und ein paar moderne
Sprachen, wie das schottische Gälisch und Slowenisch, tun es bis heute.
Spuren davon finden sich auch im Deutschen oder im Englischen: Wir
gebrauchen «beide» (both) für zwei Dinge, «alle» (all) hingegen für mehr.
Als sich der Gebrauch der Null als Symbol weiter verbreitete und Zahlen
für mehr als nur zum Zählen Verwendung fanden, wurde deutlich, dass sich
die Null in den meisten Fällen wie alle anderen Zahlen verhält. Seit dem
9. Jahrhundert betrachteten indische Mathematiker die Null als Zahl wie
jede andere, nicht nur als Symbol, das dazu diente, zwei andere Zahlen zu
trennen, um Mehrdeutigkeiten zu vermeiden. Sie benutzten die Null
uneingeschränkt bei alltäglichen Berechnungen.
Auf dem Zahlenstrahl, auf dem die Zahlen 1, 2, 3… von links nach rechts
angeordnet sind, ist klar, wohin 0 gehört: direkt auf die Position links von 1.
Der Grund liegt auf der Hand: Wenn man 1 zu einer Zahl addiert, so
verschiebt man sie damit um eine Stelle nach rechts. Die Addition von 1 zu
0 verschiebt das Ergebnis zu 1, daher muss 0 dorthin gehen, von wo auch
immer ein Schritt nach rechts zu 1 führt. Und das ist ein Schritt links von 1.
Abbildung 68: Der Zahlenstrahl.
Die Akzeptanz negativer Zahlen besiegelte den Platz der Null als echte
Zahl. Jedermann war damit einverstanden, dass 3 eine Zahl ist. Wenn man
akzeptiert, dass –3 ebenfalls eine Zahl ist und dass man, wenn man zwei
Zahlen addiert, als Ergebnis eine Zahl erhält, dann muss 3 + (–3) eine Zahl
sein. Und das ist 0.
Ungewöhnliche Eigenschaften
Ich habe gesagt, dass sich null in «fast jeder wichtigen Hinsicht» wie jede
beliebige andere Zahl verhält, denn unter außerordentlichen Umständen tut
sie es nicht. Null ist etwas Besonderes. Das muss so sein, denn es ist die
einzige Zahl, die zwischen den positiven und den negativen Zahlen
eingeklemmt ist.
Es ist klar, dass sich eine Zahl nicht verändert, wenn man 0 addiert.
Wenn ich drei Kühe habe und keine Kühe hinzufüge, bleibt es bei den drei
Kühen. Zugegebenermaßen gibt es seltsame Rechnungen wie diese:
Eine Katze hat einen Schwanz.
Keine Katze hat acht Schwänze.
Eine Addition ergibt:
Eine Katze hat neun Schwänze.
Aber diese kleine Nonsense-Rechnung beruht auf den beiden
verschiedenen Bedeutungen von «kein».
Diese spezielle Eigenschaft von 0 bringt es mit sich, dass 0 + 0 = 0 ist,
was uns sagt, dass –0 = 0 ist. Null ist ihre eigene Negierung. Es ist die
einzige derartige Zahl. Das ist genau deshalb so, weil null auf dem
Zahlenstrahl wie in einem Sandwich zwischen den positiven und den
negativen Zahlen eingeklemmt ist.
Wie sieht es mit der Multiplikation aus? Wenn wir die Multiplikation als
wiederholte Addition ansehen, gilt
und daher ist
für jede beliebige Zahl n. Das ergibt bei finanziellen Transaktionen Sinn:
Wenn ich dreimal kein Geld auf mein leeres Konto überweise, ist mein
Konto weiterhin so leer wie zuvor. Wiederum ist null die einzige Zahl mit
dieser Eigenschaft.
In der Arithmetik sind m × n und n × m für alle Zahlen m und n identisch.
Diese Übereinkunft besagt implizit, dass für alle n gilt:
obwohl wir nicht «keine Kopien» von n addieren können.
Und wie steht es mit der Division? Wenn man null durch eine Zahl
ungleich null teilt, ist die Antwort einfach: Man erhält null. Die Hälfte von
nichts oder ein Drittel von nichts ist nichts. Aber wenn es darum geht, eine
Zahl durch null zu teilen, kommt die ungewöhnliche Natur von 0 wieder
einmal zum Tragen: Was ist zum Beispiel 1:0? Wir definieren m:n als die
Zahl q, die q × n = m erfüllt. Daher ist 1:0 die Zahl q, die q × 0 = 1 erfüllt.
Eine solche Zahl gibt es jedoch nicht. Welche Zahl auch immer wir für q
wählen, wir erhalten q × 0 = 0. Wir erhalten niemals 1.
Die einfachste Weise, damit umzugehen, besteht darin, diese Tatsache
einfach zu akzeptieren. Teilung durch 0 ist verboten, weil das Ergebnis
keinen Sinn ergibt. Auf der anderen Seite dachten die Leute früher, 1:2
ergebe keinen Sinn, bis sie Brüche einführten, daher sollten wir vielleicht
nicht so schnell aufgeben. Wir könnten versuchen, eine neue Zahl
einzuführen, die uns erlaubt, durch 0 zu teilen. Das Problem ist, dass eine
solche Zahl Grundgesetze der Arithmetik verletzt. So wissen wir
beispielsweise, dass 1 × 0 = 2 × 0 ist, denn beide sind null. Teilt man beide
Seiten durch 0, so ergibt dies 1 = 2, was unsinnig ist. Daher erscheint es
vernünftig, Dividieren durch null zu verbieten.
Zahlen aus dem Nichts
Das Konzept, das demjenigen von «nichts» am nächsten kommt, findet sich
in der Mengenlehre. Eine Menge ist eine Ansammlung von mathematischen
Objekten: Zahlen, Formen, Funktionen, Netzwerken … Sie ist dadurch
definiert, dass man ihre Elemente auflistet oder charakterisiert. «Die Menge
mit den Elementen 2, 4, 6, 8» und «die Menge der geraden ganzen Zahlen
zwischen 1 und 9» definieren beide dieselbe Menge, die wir bilden können,
indem wir ihre Elemente auflisten:
wobei die Schweifklammern {} die Menge kennzeichnen, die von ihrem
Inhalt gebildet wird.
Um 1880 entwickelte der deutsche Mathematiker Georg Cantor eine
umfassende Theorie der Mengen. Er hatte versucht, einige fachspezifische
Probleme in der Analysis im Zusammenhang mit Unstetigkeiten zu lösen,
Stellen, wo eine Funktion plötzlich einen Sprung macht. In seiner Antwort
bezog er sich auf die Struktur der Menge der Unstetigkeiten. Es war nicht
die individuelle Unstetigkeit, die eine Rolle spielte: Es war das ganze Drum
und Dran. Was Cantor wegen der Verbindung zur Analysis wirklich
interessierte, waren unendlich große Mengen. Er machte die dramatische
Entdeckung, dass einige Unendlichkeiten größer sind als andere (siehe
Kapitel [
]).
Wie ich in dem Abschnitt «Was ist eigentlich eine Zahl?» (ab Seite 22)
erwähnte, griff ein anderer deutscher Mathematiker, Gottlob Frege, Cantors
Ideen auf, doch er interessierte sich viel mehr für endliche Mengen. Frege
glaubte, sie könnten das große philosophische Problem der Natur der
Zahlen lösen. Er dachte darüber nach, wie Mengen miteinander
korrespondieren: zum Beispiel zusammenpassende Tassen und Untertassen.
Die sieben Tage der Woche, die sieben Zwerge und die Zahlen von 1 bis 7,
sie alle passen perfekt zusammen, daher definieren sie alle dieselbe Zahl.
Welche dieser Mengen sollten wir wählen, um die Zahl 7 zu
repräsentieren? Freges Antwort war umfassend: sie alle. Er definierte eine
Zahl als die Menge aller Mengen, die mit einer gegebenen Menge
übereinstimmen. Auf diese Weise ist keine Menge privilegiert, und die
Wahl ist eindeutig, statt eine willkürliche Übereinkunft zu sein. Unsere
Zahlennamen und Symbole sind lediglich konventionelle Etiketten für diese
riesigen Mengen. Die Zahl «Sieben» ist die Menge aller Mengen, die mit
den Zwergen korrespondieren, und es ist dieselbe Menge wie die Menge
aller Mengen, die mit den Tagen der Woche oder der Liste {1, 2, 3, 4, 5, 6,
7} korrespondiert.
Vielleicht ist es überflüssig, darauf hinzuweisen, dass dies zwar eine
elegante Lösung des konzeptuellen Problems ist, aber keine vernünftige
Notation darstellt.
Als Frege seine Ideen in den Grundgesetzen der Arithmetik vorstellte,
einem zweibändigen Werk, das 1893 und 1903 erschien, sah es so aus, als
habe er das Problem gelöst. Nun wusste jedermann, was eine Zahl war.
Aber kurz bevor Band II in Druck ging, schrieb Bertrand Russell Frege
einen Brief, in dem es hieß (ich drücke es mit etwas anderen Worten aus):
«Lieber Gottlob, denk an die Menge aller Mengen, die sich nicht selbst als
Element enthalten.» Wie der Dorfbarbier, der alle Leute rasiert, die sich
nicht selbst rasieren, ist diese Menge in sich widersprüchlich. Russells
Paradox, wie wir es heute nennen, zeigten die Gefahr, die mit der Annahme
verbunden ist, dass es ausufernd große Mengen gibt (siehe Kapitel [
]).
Mathematische Logiker haben versucht, das Problem zu beheben. Die
Antwort stellte sich als das absolute Gegenteil von Freges «Think Big»Strategie heraus, alle möglichen Mengen zusammenzuwerfen. Vielmehr
bestand der Trick darin, nur eine einzige Menge herauszugreifen. Um die
Zahl 2 zu definieren, konstruiere man eine Standardmenge mit zwei
Elementen. Um 3 zu definieren, benutze man eine Standarmenge mit drei
Elementen, und so weiter. Die dahinterstehende Logik ist kein
Zirkelschluss, vorausgesetzt, dass man die Mengen zuerst konstruiert, ohne
ausdrücklich Zahlen zu verwenden, und ihnen erst anschließend
Zahlensymbole und Namen zuordnet.
Das Hauptproblem bestand darin, zu entscheiden, welche
Standardmengen man verwenden sollte. Sie mussten eindeutig definiert
sein, und ihr Aufbau sollte mit dem Zählvorgang korrespondieren. Die
Antwort brachte eine sehr spezielle Menge, die sogenannte leere Menge.
Null ist eine Zahl, die Basis des ganzen Zahlensystems. Daher sollte sie
die Elemente einer Menge zählen. Welcher Menge? Nun, es muss eine
Menge ohne Elemente sein. Sich eine solche Menge auszudenken, fällt
nicht schwer: «die Menge aller Mäuse, die mehr als 20 Tonnen wiegen».
Mathematisch handelt es sich um eine Menge ohne Elemente: die leere
Menge. Wiederum lassen sich leicht Beispiele finden: die Menge aller
Primzahlen, die durch 4 teilbar sind, oder die Menge aller Dreiecke mit vier
Ecken. Diese Mengen sehen verschieden aus – die eine wird von Zahlen,
die andere von Dreiecken gebildet –, aber tatsächlich handelt es sich um
dieselbe Menge, denn tatsächlich enthält sie weder Zahlen noch Dreiecke,
also lässt sich kein Unterschied erkennen. Sämtliche leeren Mengen haben
genau die gleiche Anzahl von Elementen, nämlich keines. Daher ist die
leere Menge eindeutig. Ihr Symbol, das von der anonymen Gruppe
Bourbaki 1939 eingeführt wurde, ist Ø. Die Mengentheorie braucht Ø aus
demselben Grund, wie die Arithmetik 0 braucht: Alles ist mit einem
solchen Symbol viel einfacher.
Tatsächlich können wir die Zahl 0 als die leere Menge definieren!
Wie steht es mit der Zahl 1? Intuitiv ist uns klar, dass wir eine Menge mit
genau einem Element brauchen. Etwas Eindeutiges. Nun … die leere
Menge ist eindeutig. Daher definieren wir 1 als die Menge, deren einziges
Element die leere Menge ist: als Symbol geschrieben {Ø}. Das ist nicht
dasselbe wie die leere Menge, denn sie enthält ein Element, die leere
Menge hingegen keines. Es stimmt schon, dieses Element ist
zufälligerweise die leere Menge, doch dabei handelt es sich zweifellos um
ein Element. Stellen Sie sich eine Menge wie eine leere Papiertüte vor. Die
Menge, deren einziges Element eine leere Menge ist, ist eine Papiertüte, die
eine leere Papiertüte enthält. Was etwas anderes ist – sie enthält eine Tüte.
Abbildung 69: Wie man aus leeren Mengen Zahlen macht. Tüten stellen Mengen dar; ihre
Elemente sind ihr Inhalt. Etikette geben den Namen der Menge an. Die Tüte selbst ist kein
Teil des Inhalts dieser Menge, aber sie kann gleichzeitig auch Teil des Inhalts einer anderen
Tüte sein.
Der entscheidende Schritt besteht darin, die Zahl 2 zu definieren. Wir
brauchen eine eindeutig definierte Menge mit zwei Elementen. Warum also
nicht die beiden einzigen zwei Mengen benutzen, die wir bisher erwähnt
haben: Ø und {Ø}? Daher definieren wir 2 als die Menge {Ø,{Ø}}. Was
dank unserer Definition dasselbe wie 0, 1 ist.
Nun kristallisiert sich ein allgemeines Muster heraus. Man definiere 3 =
0, 1, 2, eine Menge mit drei Elementen – die wir alle bereits definiert
haben. Dann 4 = 0, 1, 2, 3 und 5 = 0, 1, 2, 3, 4 und so weiter. Alles lässt sich
zu der leeren Menge zurückverfolgen, zum Beispiel
Sie wollen wahrscheinlich nicht wissen, wie die Zahl der Zwerge aussieht.
Die Baumaterialien hier sind Abstraktionen: die leere Menge und der
Akt, eine Menge zu bilden, indem man ihre Elemente auflistet. Doch die
Art und Weise, wie diese Mengen miteinander verknüpft sind, führen zu
einem wohl definierten Gerüst für das Zahlensystem – das intuitiv eben
diese Zahl von Elementen enthält. Und die Geschichte ist an dieser Stelle
noch nicht zu Ende. Sobald man die positiven ganzen Zahlen definiert hat,
definiert man mit einer ähnlichen mengentheoretischen Trickserei negative
Zahlen, Brüche, reelle Zahlen (unendliche Dezimalzahlen), komplexe
Zahlen und so weiter, den ganzen Weg bis hinauf zum neuesten und
ausgefallensten mathematischen Konzept in der Quantentheorie.
So, nun kennen Sie das schreckliche Geheimnis der Mathematik: Alles
basiert auf nichts.
Weniger als nichts
Kann eine Zahl kleiner als null sein? Das ist bei Kühen unmöglich, es sei
denn, man führt «virtuelle Kühe» ein, die man jemand anderem schuldet.
Dann erhält man eine natürliche Erweiterung des Zahlenkonzepts, was das
Leben für Mathematiker und Buchhalter wesentlich einfacher macht. Es
gibt ein paar Überraschungen: minus mal minus ergibt plus. Warum ist das
so?
Negative Zahlen
Nachdem wir in der Schule gelernt haben, wie man Zahlen addiert, bringt
man uns bei, wie man die umgekehrte Operation durchführt: Subtraktion.
Beispielsweise ist das Ergebnis von 4 – 3 diejenige Zahl, die 4 ergibt, wenn
man 3 addiert. Was natürlich 1 ist. Die Subtraktion ist nützlich, weil sie uns
zum Beispiel sagt, wie viel Geld uns bleibt, wenn wir mit 4 Euro starten
und 3 Euro ausgeben.
Eine kleinere Zahl von einer größeren Zahl abzuziehen, bereitet wenig
Probleme. Wenn wir weniger Geld ausgeben, als wir in der Tasche haben,
bleibt noch immer etwas übrig. Aber was passiert, wenn wir eine größere
Zahl von einer kleineren abziehen? Was ist 3 – 4?
Wenn Sie drei 1-Euro-Münzen in Ihrer Tasche haben, können Sie nicht
vier von ihnen herausnehmen und die dem Kassierer an der
Supermarktkasse aushändigen. Doch im Zeitalter der Kreditkarten kann
man problemlos Geld ausgeben, das man nicht hat – weder in der Tasche
noch auf der Bank. Wenn das geschieht, häuft man Schulden an. In diesem
Fall würden die Schulden 1 Euro betragen, ohne irgendwelche Zinsen zu
berücksichtigen. Daher ist 3 – 4 in gewissem Sinne gleich 1, aber eine
andere Art von 1: eine Schuld, kein Guthaben. Wenn 1 ein Gegenteil hat,
dann ist es das.
Um Schulden von Guthaben zu unterscheiden, setzen wir vor die Zahl
ein Minuszeichen. Damit können wir schreiben
und wir haben einen neuen Zahlentyp erfunden: eine negative Zahl.
Geschichte der negativen Zahlen
Historisch waren die erste Erweiterung des Zahlensystems die Brüche
(siehe Kapitel [ ]). Negative Zahlen waren die zweite. Ich werde diese
Zahlentypen jedoch in der umgekehrten Reihenfolge diskutieren. Nach
heutigem Wissensstand tauchten negative Zahlen erstmals in einem
chinesischen Dokument aus der Han-Dynastie (202 v. Chr.–220 n. Chr.) mit
dem Titel Jiu Zhang Suanshu (Neun Kapitel der Rechenkunst) auf.
Abbildung 70: Links: Eine Seite aus den Neun Kapitel der Rechenkunst. Rechts:
Chinesische Rechenstäbchen.
Dieses Buch benutzt Hilfsmittel zum Rechnen: Rechenstäbchen. Dabei
handelt es sich um Stäbchen aus Holz oder Knochen oder einem ähnlichen
Material. Diese Stäbchen wurden in einem bestimmten Muster ausgelegt,
um Zahlen darzustellen. Auf der «Einerstelle» einer Zahl stellt ein
waagerechtes Stäbchen «eins» dar, ein senkrechtes «fünf». Dasselbe gilt für
die «Hunderterstelle». Auf den Stellen für «Zehner» und «Hunderter» kehrt
sich die Richtung der Stäbchen um: Ein senkrechtes Stäbchen steht für
«eins» und ein waagerechtes für «fünf». Die Chinesen ließen eine Lücke,
wo wir eine 0 schreiben würden, aber eine solche Lücke übersieht man
leicht. Daher hilft die Regel zur Richtungsumkehr, Verwirrung zu
vermeiden, wenn zum Beispiel die Zehnerstelle leer ist. Die Methode ist
weniger effizient, wenn mehrere Nullen aufeinanderfolgen, aber das ist
selten.
Abbildung 71: Wie die Orientierung der Rechenstäbchen ermöglicht, zwischen 405 und 45
zu unterscheiden.
Die Neun Kapitel benutzten Stäbchen auch, um negative Zahlen
darzustellen, und stützten sich dabei auf eine sehr einfache Idee: Sie wurden
schwarz statt rot gefärbt. Daher ergeben
4 rote Stäbchen minus 3 rote Stäbchen 1 rotes Stäbchen
aber
3 rote Stäbchen minus 4 rote Stäbchen ergeben ein schwarzes
Stäbchen.
In dieser Weise stellt eine Anordnung von schwarzen Stäbchen eine Schuld
dar, und die Größe dieser Schuld ist gleich der entsprechenden Anzahl roter
Stäbchen.
Indische Mathematiker kannten ebenfalls negative Zahlen, und sie legten
widerspruchsfreie Regeln fest, um mit ihnen zu rechnen. Das BakhshaliManuskript, das ungefähr aus der Zeit von 300 n. Chr. stammt, enthält
Berechnungen mit negativen Zahlen, die durch ein +-Zeichen
gekennzeichnet sind, wo wir heute ein – gebrauchen. (Mathematische
Symbole haben sich im Lauf der Zeit wiederholt geändert, manchmal auch
in einer Weise, die uns verwirrend erscheint.) Die Idee wurde von
arabischen Mathematikern aufgegriffen und breitete sich schließlich bis
nach Europa aus. Bis ins 17. Jahrhundert deuteten europäische
Mathematiker ein negatives Ergebnis allgemein als Beweis, dass das
betreffende Problem unlösbar war, aber Fibonacci verstand, dass es sich bei
finanziellen Berechnungen als Schulden deuten ließ. Ab dem
19. Jahrhundert ließen sich Mathematiker durch negative Zahlen nicht mehr
aus dem Konzept bringen.
Darstellung negativer Zahlen
Geometrisch lassen sich Zahlen bequem dadurch darstellen, dass man sie
längs eines Strahls von links nach rechts unterbringt, wobei man bei 0
beginnt. Wir haben bereits gesehen, dass der Zahlenstrahl eine natürliche
Erweiterung besitzt, die negative Zahlen einbezieht und sich in die
entgegengesetzte Richtung erstreckt.
Abbildung 72: Zahlenstrahl: Positive Zahlen laufen nach rechts, negative nach links.
Addition und Subtraktion lassen sich auf dem Zahlenstrahl einfach
darstellen. Um beispielsweise 3 zu einer beliebigen Zahl zu addieren, muss
man sich lediglich um 3 Einheiten oder Schritte nach rechts bewegen. Um 3
von einer beliebigen Zahl zu subtrahieren, muss man sich um 3 Schritte
nach links bewegen. Diese Beschreibung ergibt das richtige Resultat für
positive wie auch für negative Zahlen; wenn wir beispielsweise mit –7
starten und 3 addieren, bewegen wir uns drei Schritte nach rechts und
erhalten –4. Die Regeln für das Rechnen mit negativen Zahlen zeigen auch,
dass das Addieren oder Subtrahieren einer negativen Zahl dasselbe bewirkt
wie die Subtraktion oder Addition der entsprechenden positiven Zahl. Um
daher –3 zu addieren, bewegen wir uns drei Schritte nach links. Um –3 von
einer beliebigen Zahl zu subtrahieren, bewegen wir uns 3 Schritte nach
rechts.
Die Multiplikation mit negativen Zahlen ist interessanter. Als wir uns das
erste Mal mit Multiplizieren beschäftigt haben, haben wir es uns als
wiederholtes Addieren vorgestellt. Beispielsweise ist
Derselbe Ansatz spricht dafür, dass wir 6 × –5 in entsprechender Weise
definieren sollten:
Nun besagt eine der Regeln der Mathematik, dass die Multiplikation zweier
positiver Zahlen dasselbe Resultat ergibt, ganz gleich, welche Reihenfolge
wir benutzen. Beispielsweise sollte 5 × 6 ebenfalls 30 ergeben. Tatsächlich
ist das auch der Fall, denn
Voilà! Daher erscheint es vernünftig, anzunehmen, dass dieselbe Regel für
negative Zahlen gilt; in diesem Fall ist auch –5 × 6 = –30.
Wie steht es mit –6 × –5? Das ist weniger eindeutig. Wir können nicht
minus sechs Fünfen niederschreiben und sie addieren. Daher müssen wir
uns an die Frage heranschleichen. Lassen Sie uns schauen, was wir bisher
wissen:
Es ist vernünftig, anzunehmen, dass die fehlende Zahl entweder 30 oder –
30 ist. Die Frage ist nur: Welche von beiden?
Auf den ersten Blick kommen viele Leute zu der Ansicht, es müsse –30
sein. Die Psychologie dahinter scheint zu sein, dass die Berechnung
sozusagen von Negativität durchdrungen ist und das Ergebnis daher
ebenfalls negativ sein sollte. Dieselbe Art von Annahme steckt in dem
Protest: «I didn’t do nothing» (wörtlich: Ich habe nicht nichts getan). Dabei
muss man jedoch darauf verweisen, dass man, wenn man nicht nichts getan
hat, dann doch eben etwas getan hat. Ob das ein fairer Kommentar ist,
hängt von den Grammatikregeln ab, die man benutzt. Das zusätzliche «not»
kann auch als Bestärkung angesehen werden.
In derselben Weise ist die Bedeutung von –6 × –5 eine Sache der
Übereinkunft. Wenn wir neue Zahlen erfinden, gibt es keine Garantie, dass
die alten Konzepte noch immer auf sie anwendbar sind. Daher hätten die
Mathematiker entscheiden können, dass –6 × –5 = –30 ist. Was das angeht,
hätten sie auch beschließen können, dass –6 × –5 ein rosa Flusspferd ist.
Es gibt jedoch mehrere Gründe, warum –30 eine unpraktische Wahl ist,
und sie alle weisen in die entgegengesetzte Richtung, 30.
Einer dieser Gründe ist: Wenn –6 × –5 = –30 ist, dann ist dies dasselbe
Ergebnis wie bei –6 × 5. Teilt man durch –6, erhält man –5 = 5, aber das
steht im Widerspruch zu dem, was wir bereits im Zusammenhang mit
negativen Zahlen entschieden haben.
Ein zweiter Grund ist, dass wir bereits wissen, dass 5 + –5 = 0 ist. Werfen
Sie einen Blick auf den Zahlenstrahl: Wo landet man von 5 ausgehend,
wenn man sich 5 Schritte nach links bewegt? Bei 0. Nun, die Multiplikation
einer beliebigen positiven Zahl mit 0 ergibt wieder 0, und es erscheint
vernünftig, dasselbe für negative Zahlen anzunehmen. Daher ist es sinnvoll,
davon auszugehen, dass –6 × 0 = 0 ist. Demnach gilt:
Nach den üblichen arithmetischen Regeln ist dies gleich
Wenn wir uns für –6 × –5 = –30 entscheiden, erhalten wir –30 + –30 = –60.
Das ergibt 0 = –60, was nicht sehr vernünftig klingt.
Wenn wir auf der anderen Seite jedoch –6 × –5 = 30 gewählt hätten,
erhalten wir
und alles ergäbe einen Sinn.
Ein dritter Grund ist die Struktur des Zahlenstrahls. Wenn wir eine
positive Zahl mit –1 multiplizieren, verwandeln wir sie in die entsprechende
negative Zahl, das ist so, als hätten wir die positive Hälfte des Zahlenstrahls
um 180° um die Null und damit von rechts nach links bewegt. Wohin soll
dann die negative Hälfte gehen? Wenn wir sie an Ort und Stelle lassen,
hätte wir dieselbe Art Problem, denn –1 × –1 wäre –1, was gleich –1 × 1 ist,
und wir kämen zu dem Schluss, dass –1 = 1 ist. Die einzig vernünftige
Alternative besteht darin, die negative Hälfte des Zahlenstrahls ebenfalls
um 180° zu drehen und ihn damit von links nach rechts zu bewegen. Das ist
eine hübsche Lösung, denn nun dreht eine Multiplikation mit –1 den
Zahlenstrahl und kehrt die Anordnung um. Daraus folgt ganz ohne Zweifel,
dass eine erneute Multiplikation mit –1 den Zahlenstrahl um weitere 180°
dreht. Das kehrt die Anordnung nochmals um, und alles endet dort, wo es
begonnen hat. Tatsächlich beträgt der Gesamtwinkel 180° + 180° = 360°,
ein vollständiger Kreis, und damit kehrt alles zum Ausgangspunkt zurück.
Daher ist –1 × –1 der Punkt, wohin –1 geht, wenn man den Strahl dreht,
und das ist 1. Und wenn man sich einmal dafür entschieden hat, dass –1 × –
1 = 1 ist, folgt daraus, dass –6 × –5 = 30 ist.
Abbildung 73: Eine Drehung des Zahlenstrahls um 180° entspricht einer Multiplikation jeder
Zahl mit –1.
Ein vierter Grund ist die Deutung eines negativen Geldbetrags als Schuld.
Bei dieser Interpretation ergibt die Multiplikation eines Geldbetrags mit
einer negativen Zahl dasselbe Resultat wie eine Multiplikation mit der
entsprechenden positiven Zahl, außer dass das Guthaben zur Schuld wird.
Nun, das Subtrahieren, also das «Wegnehmen» einer Schuld, ist dasselbe,
als ob die Bank den Betrag, den Sie ihr schulden, aus ihren Unterlagen
streicht, was darauf hinausläuft, dass sie Ihnen einen gewissen Betrag
zurückgibt. Eine Schuld von 10 Euro von Ihrem Konto abzuziehen, ist
dasselbe, wie 10 Euro Ihres eigenen Geldes darauf zu deponieren: Es erhöht
Ihr Guthaben um 10 Euro. Der Nettoeffekt von beiden Transaktionen führt
unter diesen Umständen dazu, dass Ihr Konto zurück auf null geht, also
wieder ausgeglichen ist. Daraus folgt, dass –6 × –5 denselben Effekt auf
Ihren Kontostand hat wie das Wegnehmen von sechs Verschuldungen à
5 Euro, und das heißt, Ihren Kontostand um 30 Euro zu erhöhen.
Um das Ergebnis unserer Diskussion kurz zusammenzufassen: Zwar steht
uns im Prinzip frei, –6 × –5 so zu definieren, wie es uns gefällt, doch es gibt
nur eine Wahl, die es erlaubt, die üblichen Rechenregeln auf negative
Zahlen anzuwenden. Zudem erscheint diese Wahl sehr einleuchtend, wenn
man sie auf die Interpretation negativer Zahlen als Schulden anwendet. Und
diese Wahl führt dazu, dass minus mal minus plus ergibt.
KOMPLEXE ZAHLEN
Als Mathematiker eine Zahl durch eine andere zu teilen
versuchten und diese Rechnung nicht glatt aufging, erfanden
sie die Brüche.
Als sie eine größere Zahl von einer kleineren Zahl abziehen
wollten, erfanden sie die negativen Zahlen.
Wenn sich eine Rechenoperation nicht durchführen lässt,
erfinden Mathematiker etwas Neues, das die ganze Sache
dennoch möglich macht.
Als es wirklich lästig wurde, dass sich aus negativen Zahlen
keine Quadratwurzeln ziehen ließen … nun, was denken Sie,
was dann geschah?
Imaginäre Zahlen
In dem Abschnitt «Das ständig wachsende Zahlensystem» (ab Seite 16)
habe ich gesagt, dass wir dazu neigen, Zahlen als starr und unveränderlich
anzusehen, aber tatsächlich handelt es sich um menschliche Erfindungen.
Zahlen erwuchsen aus dem Zählen, doch das Zahlenkonzept wurde
wiederholt erweitert: Null, negative Zahlen, rationale Zahlen (Brüche),
reelle Zahlen (unendliche Dezimalzahlen).
Trotz aller technischen Unterschiede fühlen sich all diese Systeme
ähnlich an. Man kann mit ihnen rechnen, und man kann zwei beliebige
Zahlen vergleichen, um zu entscheiden, welche größer ist. Das heißt, dem
Ganzen wohnt eine Vorstellung von Ordnung inne. Ab dem 15. Jahrhundert
fragten sich einige Mathematiker jedoch, ob es vielleicht einen neuen
Zahlentyp mit weniger vertrauten Eigenschaften geben könnte, für die die
übliche Beziehung «größer als» keine Bedeutung mehr hat.
Da minus mal minus gleich plus ist, ist die Quadratzahl einer jeden
reellen Zahl positiv. Daher haben negative Zahlen innerhalb des Systems
reeller Zahlen keine Quadratwurzeln. Das ist recht unbequem, vor allem in
der Algebra. Einige seltsame Ergebnisse in der Algebra, die Formeln für die
Lösung von Gleichungen liefern, sprachen jedoch dafür, dass es eine
Möglichkeit geben muss, Ausdrücke wie
sinnvoll zu machen. Daher
kamen Mathematiker nach vielem Nachdenken zu dem Entschluss, einen
neuen Zahlentyp zu erfinden, der diese fehlenden Quadratwurzeln liefert.
Der entscheidende Schritt ist, eine Quadratwurzel für –1 einzuführen.
Euler führte das Symbol i als Darstellung von
in einem Artikel ein,
den er 1777 in Französisch veröffentlichte. i wurde darin als imaginäre Zahl
bezeichnet, weil sie sich nicht wie eine traditionelle «reelle» Zahl verhielt.
Nachdem i etabliert worden war, musste man verwandte Zahlen wie 2 + 3i
erlauben, die man als komplexe Zahlen bezeichnet. Daher erhält man nicht
nur eine einzige Zahl, sondern ein ganz neues, erweitertes Zahlensystem.
Logisch basieren komplexe Zahlen auf reellen Zahlen. Die Logik wird
jedoch von dem übertroffen, was Terry Pratchett, Jack Cohen und ich in der
Reihe über die Wissenschaft der Scheibenwelt «Narrativium» nennen: Die
Macht des Erzählens. Die mathematischen Geschichten hinter den Zahlen
sind das wirklich Wichtige, und wir brauchen komplexe Zahlen, um einige
dieser Geschichten zu erzählen – selbst Geschichten von Zahlen, die uns
besser vertraut sind.
Komplexe Zahlen
Arithmetik und Algebra komplexer Zahlen sind recht simpel. Man benutzt
die normalen Regeln der Addition und der Multiplikation mit einer
2
Zusatzregel: Wann immer man i schreibt, ersetzt man es durch –1. Zum
Beispiel
Als die Pioniere diese Idee weiter erkundeten, erhielten sie etwas, das wie
ein logisch widerspruchsfreier Zahlentyp aussah und das System der reellen
Zahlen erweiterte.
Es gab Präzedenzfälle. Das Zahlensystem war seit seinen Ursprüngen –
dem Zählen mit ganzen Zahlen – bereits mehrfach erweitert worden. Doch
diesmal musste die Vorstellung von einem «größer als» geopfert werden.
Sie funktionierte prima für die bereits existierenden Zahlen, doch man kam
in Teufels Küche, wenn man annahm, sie ließen sich auch auf die neuen
Zahlen anwenden. Zahlen, die keine Größe haben! Höchst eigenartig! So
eigenartig, dass Mathematiker bei dieser Gelegenheit nicht umhinkonnten
festzustellen, dass sie das Zahlensystem erweiterten, und sich fragten, ob
das legitim sei. Diese Fragen hatten sie sich zuvor nicht wirklich gestellt,
weil Brüche und negative Zahlen einfache Pendants in der wirklichen Welt
haben. Aber i war lediglich ein Symbol, das sich in einer Weise verhielt, die
zuvor als unmöglich gegolten hatte.
Schließlich setzte sich der Pragmatismus durch. Die Schlüsselfrage war
nicht, ob die neue Art Zahlen «wirklich» existierte, sondern ob es nützlich
wäre, dies anzunehmen. Es war bekannt, dass reelle Zahlen in den
Naturwissenschaften von Nutzen sind, um Messungen physikalischer
Größen präzise wiederzugeben. Nicht bekannt war jedoch, ob die
Quadratwurzel einer negativen Zahl physikalisch sinnvoll war. Auf einem
Lineal konnte man sie jedenfalls nicht entdecken.
Zur Überraschung von Mathematikern, Physikern und Ingenieuren in
aller Welt stellten sich komplexe Zahlen jedoch als überaus nützlich heraus.
Sie schlossen eine eigenartige Lücke in der Mathematik. So lassen sich die
Lösungen von Gleichungen beispielsweise viel besser handhaben, wenn
man komplexe Zahlen erlaubt. Tatsächlich war das der Hauptgrund für die
Einführung komplexer Zahlen. Aber das war noch nicht alles. Komplexe
Zahlen ermöglichten die Lösung von Problemen auf ganz verschiedenen
Gebieten der mathematischen Physik: Magnetismus, Elektrizität,
Wärmelehre, Akustik, Schwerkraft und Hydrodynamik.
Was bei solchen Problemen eine entscheidende Rolle spielt, ist nicht der
Betrag irgendeiner physikalischen Größe, die sich mit einer bestimmten
Zahl angeben lässt, sondern die Richtung, in die sie weist. Da komplexe
Zahlen in der Ebene existieren (siehe unten), definieren sie eine Richtung:
die Gerade zwischen 0 und der betreffenden Zahl. Daher eignet sich jedes
Problem, bei dem es um Richtungen in der Ebene geht, potenziell für eine
Bearbeitung mit komplexen Zahlen, und die Physik war voller solcher
Fragen. Tatsächlich stellten sich auch weniger konkrete Deutungen
komplexer Zahlen als nützlich heraus. Vor allem erweisen sie sich als ideal
zur Beschreibung von Wellen.
Lange Zeit wurden komplexe Zahlen zu solchen Zwecken eingesetzt,
auch wenn niemand erklären konnte, was diese Zahlen eigentlich
bedeuteten. Sie waren einfach zu nützlich, um sie zu ignorieren, und da sie
offenbar immer funktionierten, gewöhnten sich alle an sie und vergaßen
fast, sich länger den Kopf über ihre Bedeutung zu zerbrechen. Schließlich
gelang es einigen Mathematikern, die Idee der komplexen Zahlen so
einzuführen, dass man ihre logische Stimmigkeit beweisen konnte: indem
sie diese Zahlen mit Hilfe von Koordinaten in der Ebene interpretierten.
Die komplexe Ebene (Gauß’sche Zahlenebene)
Geometrisch lassen sich reelle Zahlen als Punkte auf einer Geraden, dem
Zahlenstrahl, interpretieren, der eindimensional ist. Analog lassen sich
komplexe Zahlen als Punkte in einer Ebene darstellen, die zweidimensional
ist. Es gibt zwei «unabhängige» Grundzahlen, 1 und i, und jede komplexe
Zahl ist eine Kombination dieser beiden.
Die Ebene kommt ins Spiel, weil die Multiplikation von Zahlen mit –1
den Zahlenstrahl um 180° kreisen lässt (siehe Kapitel [–1]). Daher gilt: Was
auch immer die Quadratwurzel von –1 bedeutet, sie macht vermutlich etwas
mit dem Zahlenstrahl, und was auch immer sie macht, muss sie ihn, wenn
es zweimal hintereinander gemacht wird, um 180° drehen. Was also dreht
Dinge um einen Winkel von 180°, wenn man es zweimal macht?
Etwas, das Dinge um 90° dreht.
Wir dürfen daher vermuten, dass man die Quadratwurzel von –1 als eine
90°-Drehung des Zahlenstrahls interpretieren kann. Wenn wir ein Bild
zeichnen, stellen wir fest, dass dies den Zahlenstrahl nicht auf sich selbst
zurückführt. Vielmehr schafft es einen zweiten Zahlenstrahl im rechten
Winkel zum üblichen Zahlenstrahl. Der erste Strahl wird als Strahl der
reellen Zahlen bezeichnet. Der zweite Strahl ist derjenige, der von den
imaginären Zahlen, wie der Quadratwurzel von –1, bevölkert wird. Wenn
man beide als Koordinatenachsen in der Ebene kombiniert, erhalten wir die
komplexen Zahlen.
«Reell» und «imaginär» sind Namen, die Jahrhunderte weit
zurückdatieren, und sie spiegeln eine Sichtweise der Mathematik wider, die
wir nicht länger teilen. Heutzutage betrachten wir alle mathematischen
Konzepte als mentale Modelle der Realität, nicht als die Realität selbst.
Daher sind die reellen Zahlen nicht realer als ihre imaginären Pendants. Die
reellen Zahlen korrespondieren jedoch ziemlich direkt mit der Vorstellung
vom Messen einer Geraden in der wirklichen Welt, während sich die
imaginären Zahlen nicht direkt in dieser Art interpretieren lassen. Daher
haben diese Namen bis heute überdauert.
Abbildung 74: Wenn man den Zahlenstrahl um 90° (rechter Winkel) dreht, erhält man einen
zweiten Zahlenstrahl.
Wenn wir die üblichen reellen Zahlen nehmen und diese neue Zahl i
dazuwerfen, müssen wir auch in der Lage sein, Kombinationen wie 3 + 2i
darzustellen. Diese Zahlen korrespondieren mit dem Punkt in der Ebene,
der die Koordinaten (3, 2) hat. Das heißt, dieser Punkt liegt 3 Einheiten
entlang der Realachse, gefolgt von 2 Einheiten parallel zur Imaginärachse.
Allgemein gesprochen korrespondiert z = x + iy mit dem Punkt mit den
Koordinaten (x, y).
Diese geometrische Deutung komplexer Zahlen wird gelegentlich als
Argand-Diagramm bezeichnet, benannt nach dem französischen
Mathematiker Jean-Robert Argand, der es 1806 beschrieb. Die Idee geht
jedoch auf den norwegisch-dänischen Geodäten Caspar Wessel zurück, der
1797 eine Arbeit mit dem Titel Om Directiones analytiske betegning (Über
die analytische Repräsentation der Richtung) bei der Königlich Dänischen
Akademie der Wissenschaften einreichte, die 1799 veröffentlicht wurde.
Damals war Dänemark gerade zeitweilig mit Norwegen vereinigt. Sein
Artikel fand damals wenig Beachtung, weil kaum ein Wissenschaftler
Dänisch lesen konnte.
Gauß formulierte in seiner Doktorarbeit 1799 unabhängig von Wessel
dieselbe Idee und erkannte später, dass sich die Beschreibung vereinfachen
ließ, wenn man Koordinaten benutzte, um eine komplexe Zahl als ein Paar
(x, y) von reellen Zahlen zu betrachten. In den 1830er Jahren definierte
Hamilton komplexe Zahlen als «Paare von reellen Zahlen», wobei er damit
ein geordnetes Paar meinte. So definieren wir komplexe Zahlen heute. Ein
Punkt in der Ebene ist ein geordnetes Paar (x, y), und das Symbol x + iy ist
lediglich ein anderer Name für diesen Punkt oder dieses Paar. Der
geheimnisvolle Ausdruck i ist dann nichts anderes als das geordnete Paar
(0, 1). Der entscheidende Punkt ist, dass wir Addition und Multiplikation
für diese Paare folgendermaßen definieren müssen:
Woher kommen diese Gleichungen? Sie ergeben sich, wenn man x + iy und
u + iv addiert oder multipliziert, die Standardgesetze der Algebra
2
voraussetzt und i durch –1 ersetzt.
Diese Berechnungen motivieren die Definitionen, doch wir haben die
algebraischen Gesetze angenommen, um herauszufinden, wie die
Definitionen aussehen sollten. Diese Logik erscheint nicht länger als
Zirkelschluss, wenn wir die algebraischen Gesetze für diese Paare allein auf
der Basis der formalen Definitionen verifizieren. Es ist nicht überraschend,
dass das alles funktioniert, aber es muss überprüft werden. Die
Argumentation ist langwierig, aber nicht besonders kompliziert.
Einheitswurzeln
Das Wechselspiel zwischen Algebra und Geometrie bei komplexen Zahlen
ist wirklich verblüffend. Nirgendwo ist das offensichtlicher als für die
n
Einheitswurzeln: Lösungen der Gleichungen z = 1 für komplexes z und
ganzzahlige Zahlen n. Beispielsweise erfüllt die 5. Einheitswurzel die
5
Gleichung z = 1.
Eine offensichtliche Lösung ist z = 1, die einzige reelle Lösung. Bei
2
3
4
komplexen Zahlen gibt es jedoch vier weitere, und zwar ζ, ζ , ζ und ζ ,
wobei
ist. Hier ist 72° =
. Es gibt exakte Formeln:
Abbildung 75: Die fünf 5. Einheitswurzeln in der komplexen Ebene.
Diese fünf Punkte bilden die Ecken eines regelmäßigen Fünfecks, eine
Tatsache, die sich mit Hilfe der Trigonometrie beweisen lässt. Die
Grundidee ist, dass genauso, wie die Multiplikation mit i die komplexe
Ebene um 90° dreht, die Multiplikation mit ζ die komplexe Ebene um 72°
dreht. Wenn man diese Rotation fünf Mal wiederholt, erhält man eine
Drehung um 360°, was genauso ist wie gar keine Drehung oder eine
5
Multiplikation mit 1. Daher ist ζ = 1.
n
Allgemeiner ausgedrückt hat die Gleichung z = 1 genau n Lösungen: 1,
2
3
ζ, ζ , ζ … ζ
n–1
, wobei nun gilt:
Diese Ideen liefern eine algebraische Interpretation des regelmäßigen
Fünfecks, die eingesetzt wird, um Konstruktionen mit Zirkel und Lineal in
der euklidischen Geometrie zu untersuchen (siehe Kapitel [17]).
RATIONALE ZAHLEN
Nun schauen wir uns die Brüche an, die von Mathematikern
als rationale Zahlen bezeichnet werden.
Historisch gesehen traten Brüche auf, wenn Güter oder
Besitz unter mehreren Leuten geteilt werden mussten,
sodass jeder seinen Anteil bekam.
Alles begann mit
, ein Bruch, der auftritt, wenn zwei Leute
einen gleich großen Anteil erhalten.
Das Ergebnis war ein Zahlensystem, in dem eine Division
stets möglich ist, mit Ausnahme der Teilung durch null.
Das Unteilbare teilen
Nun kommen wir zu den Brüchen. Mathematiker bevorzugen einen
vornehmeren Ausdruck: rationale Zahlen. Dabei handelt es sich um Zahlen
wie ,
oder
, die entstehen, wenn man eine ganze Zahl durch eine
andere teilt. Versetzen Sie sich doch einmal zurück in die Tage, als man
unter «Zahl» eine ganze Zahl verstand. In dieser Welt erschien eine
Division durchaus vernünftig, solange eine Zahl genau in eine andere
passte, beispielsweise
= 4. Aber auf diese Weise erhält man nichts
Neues. Brüche werden gerade dann interessant, wenn die Division zu
keinem glatten Ergebnis führt. Genauer gesagt, wenn das Ergebnis keine
ganze Zahl ist. Denn dann brauchen wir eine neue Art von Zahl.
Der einfachste Bruch und derjenige, dem wir im Alltag am häufigsten
begegnen, ist eine Hälfte: . Das Oxford English Dictionary definiert sie
als «einer von zwei gleichen oder korrespondierenden Teilen, in die etwas
geteilt wird oder geteilt werden kann». Auf Hälften stößt man im Alltag
ständig: ein halber Liter Bier oder Milch, die beiden Hälften eines Fußballoder Rugbyspiels, Sonderangebote oder Tickets zum halben Preis, eine
halbe Stunde, ein halbes Leben. Halb voll oder halb leer? Frisch gewagt ist
halb gewonnen …
ist nicht nur der einfachste, sondern auch wohl der wichtigste Bruch.
Euklid wusste, wie man Geraden und Winkel halbiert, also in zwei gleiche
Teile teilt. Eine komplexere Eigenschaft spielt in der analytischen
Zahlentheorie eine wichtige Rolle: Man nimmt an, dass die nichttrivialen
Nullstellen der Riemann’schen Zeta-Funktion stets den Realteil von haben.
Diese Annahme zu beweisen, ist wahrscheinlich das wichtigste ungelöste
Problem in der ganzen Mathematik.
Einen Winkel teilen
Die Besonderheit von
taucht bereits früh in der euklidischen Geometrie
auf. In Buch I, These 9 der Elemente findet sich eine Konstruktion, «um
einen gegebenen Winkel in zwei gleich Teile zu teilen», das heißt, um einen
halb so großen Winkel zu produzieren. Und das geht so: Gegeben sei ein
Winkel BAC; mit Hilfe eines Zirkels konstruiert man auf den geraden AB
und AC in gleichem Abstand von A die Punkte D und E. Nun schlägt man
einen Kreis mit dem Radius DE um D und einen Kreis mit dem Radius ED
um E. Diese beiden Kreise schneiden sich in dem Punkt F, der den gleichen
Abstand von D und von E hat. Dementsprechend teilt die Gerade AF den
Winkel BAC in zwei gleich große Hälften. Tatsächlich beschreibt Euklid
den letzten Schritt etwas anders: Man konstruiere ein gleichseitiges Dreieck
DEF. Dies ist eine taktische Entscheidung, die auf dem basiert, was er
zuvor bewiesen hat, und führt zu genau dem gleichen Ergebnis, denn das
Dreieck DEF ist gleichseitig.
Abbildung 76: Wie man einen Winkel halbiert.
Der tiefere Grund, warum diese Konstruktion funktioniert, ist Symmetrie.
Die gesamte Zeichnung ist spiegelsymmetrisch zur AF-Achse. Die
Spiegelsymmetrie ist eine Symmetrie zweiter Ordnung; wenn man die
Operation zweimal durchführt, gelangt man wieder an den Ausgangspunkt.
Daher ist es nicht überraschend, dass sich ein Winkel in zwei gleiche Teile
teilen lässt.
Euklid zeigt uns nicht, wie man einen beliebigen Winkel drittelt, also in
drei gleiche Teile zerlegt, was dem Bruch
entsprechen würde. Wie wir in
Kapitel [3] gesehen haben, haben Mathematiker rund 2000 Jahre später
bewiesen, dass dies mit traditionellen Werkzeugen wie einem
(unmarkierten) Lineal und einem Zirkel unmöglich ist. Tatsächlich haben
die einzigen Brüche eines beliebigen Winkels, die sich auf diese Weise
konstruieren lassen, die Form
: Man teile k mal durch 2 und mache dann
p Kopien. Grundsätzlich ist das Einzige, was man tun kann, wiederholtes
Halbieren. Daher nimmt
in der Geometrie eine ganz besondere Stellung
ein.
Die Riemann-Hypothese
In der höheren Mathematik taucht
in dem wohl wichtigsten ungelösten
Problem des ganzen Fachgebiets auf: der Riemann-Hypothese. Dabei
handelt es sich um eine täuschend einfach scheinende Vermutung, die 1859
von Georg Bernhard Riemann aufgestellt wurde. Es handelt sich um eine
tiefgründige Eigenschaft eines cleveren technischen Hilfsmittels, der ZetaFunktion ζ(z). Hier ist z eine beliebige komplexe Zahl, und ζ ist der
griechische Buchstabe Zeta. Die Zeta-Funktion ist eng mit Primzahlen
verknüpft; daher können mächtige Techniken, die komplexe Zahlen
verwenden, diese Funktion einsetzen, um die Anordnung von Primzahlen
zu untersuchen.
Leider können wir solche Techniken jedoch nicht richtig nutzen, bis wir
einige Grundstrukturen der Zeta-Funktion herausgefunden haben, und an
dieser Stelle wird’s schwierig. Die entscheidenden Merkmale sind die
Nullstellen der Zeta-Funktion: diejenigen komplexen Zahlen z, für die ζ(z)
= 0 ist. Einige Nullstellen lassen sich leicht finden: sämtliche negativen
ganzen Zahlen, also z = –2, –4, –6, –8 … Riemann konnte jedoch beweisen,
dass es unendlich viele andere Nullen gibt, und er fand sechs davon:
(Die Nullstellen treten stets paarweise mit positiven oder negativen
Imaginärteilen auf.)
Man braucht kein großes mathematisches Einfühlungsvermögen, um
festzustellen, dass diese sechs Zahlen eine interessante Gemeinsamkeit
aufweisen: Sie alle haben die Form
+ iy. Das heißt, der Realteil ist gleich
. Riemann vermutete nun, dass dies für alle Nullstellen der Zeta-Funktion
mit Ausnahme der negativen geraden Zahlen zutrifft. Diese Vermutung
wurde als Riemann-Hypothese bekannt. Wenn sie richtig wäre – und alle
Hinweise deuten darauf hin –, so hätte dies zahlreiche weitreichende
Konsequenzen. Dasselbe gilt für eine ganze Reihe von
Verallgemeinerungen, die womöglich noch wichtiger sind.
Trotz 150 Jahren intensiver Suche ist bisher noch kein Beweis gefunden
worden. Die Riemann-Hypothese ist und bleibt eines der verblüffendsten
und irritierendsten Rätsel in der ganzen Mathematik. Ihre Lösung wäre
eines der dramatischsten Ereignisse in der Geschichte der Mathematik.
Der Weg zur Riemann-Hypothese begann mit der Entdeckung, dass
individuelle Primzahlen zwar verblüffend unregelmäßig erscheinen,
Primzahlen als Kollektiv jedoch klare statistische Verteilungsmuster
aufweisen. Im Jahr 1835 versetzte Adolphe Quetelet seine Zeitgenossen
dadurch in Erstaunen, dass er mathematische Regelmäßigkeiten bei
soziologischen Ereignissen entdeckte, die auf bewussten menschlichen
Entscheidungen oder Interventionen des Schicksals beruhten: Geburten,
Eheschließungen, natürliche Todesfälle und Selbsttötungen. Die Muster
waren statistischer Natur: Sie bezogen sich nicht auf Individuen, sondern
auf das durchschnittliche Verhalten einer großen Anzahl von Menschen.
Etwa um dieselbe Zeit begannen Mathematiker zu verstehen, dass derselbe
Trick auch bei Primzahlen funktioniert. Obwohl jede Primzahl ein
eingefleischter Individualist ist, zeigen sie, gemeinsam betrachtet,
verborgene Muster.
Als Gauß etwa 15 Jahre alt war, notierte er in seiner Logarithmentafel:
Wenn x groß ist, beträgt die Anzahl der Primzahlen kleiner oder gleich x
ungefähr
. Diese Erkenntnis wurde als «Primzahlsatz» bekannt, doch
anfangs fehlte ein Beweis, daher war es eigentlich eine PrimzahlenVermutung. 1848 und 1850 versuchte der russische Mathematiker Pafnuti
Lwowitsch Tschebyschow, den Primzahlensatz mittels Analysis zu
beweisen. Auf den ersten Blick besteht keinerlei offenkundige Verbindung;
man könnte genauso gut versuchen, diesen Satz per Hydrodynamik oder mit
Hilfe des Rubik-Würfels zu beweisen. Euler hatte jedoch bereits eine
seltsame Verknüpfung zwischen den beiden Gebieten festgestellt: die
Formel
bei der p sämtliche Primzahlen durchläuft und s jede beliebige reelle Zahl
größer 1 ist. Die Bedingung s > 1 ist erforderlich, damit die Reihe auf der
rechten Seite einen sinnvollen Wert ergibt. Der Hauptgedanke hinter der
Formel besteht darin, die Eindeutigkeit der Primfaktorisierung (oder
Primfaktorzerlegung) in der Sprache der Analysis auszudrücken. Die ZetaFunktion ζ(z) ist die Reihe auf der rechten Seite der Gleichung; ihr Wert
hängt von s ab.
Tschebyschow benutzte Eulers Formel, um zu beweisen, dass die Anzahl
der Primzahlen kleiner oder gleich x für große x recht nahe bei
liegt.
Tatsächlich liegt das Verhältnis zwischen zwei Konstanten, die eine etwas
größer als 1, die andere etwas kleiner. Das war nicht ganz so präzise wie der
Primzahlsatz, führte aber zu einem Beweis für eine andere bedeutende
Vermutung, dem Bertrand’schen Postulat von 1845: Wenn man eine
beliebige ganze Zahl nimmt und sie verdoppelt, dann liegt zwischen diesen
beiden Zahlen mindestens eine Primzahl.
Riemann fragte sich, ob man Eulers Idee durch die Anwendung neuer
Techniken mächtiger machen könne, und das führte ihn zu einer
ehrgeizigen Erweiterung der Zeta-Funktion: Er entschloss sich, sie nicht nur
für reelle Zahlen, sondern auch für komplexe Zahlen zu definieren. Eulers
Reihe ist ein guter Startpunkt dafür. Die Reihe ergibt für komplexe s
durchaus Sinn, vorausgesetzt, der Realteil von s ist größer als 1. (Das ist
eine technische Voraussetzung, die impliziert, dass die Reihe konvergiert:
Die Summe ergibt einen sinnvollen Wert, wenn sie unendlich viele Glieder
hat.) Riemanns erste große Erkenntnis war, dass er es besser konnte. Er
konnte ein Verfahren benutzen, das als analytische Fortsetzung bezeichnet
wird, um die Definition von ζ(s) auf alle komplexen Zahlen mit Ausnahme
von 1 zu erweitern. Dieser Wert wird ausgeschlossen, weil die ZetaFunktion unendlich wird, wenn s = 1 ist.
Diese sogenannte analytische Fortsetzung impliziert, dass alle negativen
geraden ganzen Zahlen Nullstellen sind. Das lässt sich anhand der Reihe
nicht sofort erkennen. Die Fortsetzung weist auch auf neue Eigenschaften
der Zeta-Funktion hin, die Riemann erforschte. 1859 stellte er seine Ideen
in einem Artikel Über die Anzahl der Primzahlen unter einer gegebenen
Größe vor. Darin gab er eine exakte Formel für die Anzahl der Primzahlen
unterhalb einer gegebenen reellen Zahl x an. Vereinfacht ausgedrückt besagt
sie, dass die Summe der Logarithmen dieser Primzahlen näherungsweise
beträgt. Hier zeigt ∑ eine Summe über sämtliche Zahlen ρ an, für die ζ(ρ)
null ist, wobei die negativen geraden ganzen Zahlen ausgeschlossen sind.
Wenn wir genug über die Nullstellen in der Zeta-Funktion wissen,
können wir aus der Riemann-Formel eine ganze Menge neuer
Informationen über Primzahlen erschließen. Insbesondere können wir
anhand der Realteile der Nullstellen auf statistische Eigenschaften von
Primzahlen rückschließen: Wie viele von ihnen es bis zu einem bestimmten
Wert gibt, wie sie zwischen den anderen ganzen Zahlen verteilt sind, und so
weiter. In diesem Zusammenhang zahlt sich die Riemann-Hypothese aus …
falls sie sich beweisen lässt.
Riemann hatte den Weitblick, diese Möglichkeit zu sehen, doch er führte
sein Programm niemals bis zu einer soliden Schlussfolgerung fort. Doch im
Jahr 1896 benutzten Jacques Hadamard und Charles Jean de la Valée
Poussin unabhängig voneinander Riemanns Vision, um den Primzahlsatz
abzuleiten. Das gelang ihnen, indem sie eine schwächere Eigenschaft der
nichttrivialen Nullstellen der Zeta-Funktion ableiteten: Der Realteil liegt
zwischen 0 und 1.
Im Jahr 1903 zeigte Jorgen Gram numerisch, dass die ersten zehn (±Paare von) Nullstellen auf der kritischen Geraden (das ist die Gerade, auf
der alle komplexen Zahlen mit Realteil
liegen) liegen. Bis 1935 hatte
E.C. Titchmarsh die Zahl auf 193 erhöht. 1936 bewiesen Titchmarsh und
Leslie Comrie, dass die ersten 1041 Nullstellenpaare auf der kritischen
Geraden liegen – das war das letzte Mal, dass irgendjemand solche
Berechnungen per Hand durchführte. 1953 entdeckte Alan Turing eine
effizientere Methode und zeigte per Computer, dass die ersten
1104 Nullenpaare auf der kritischen Geraden liegen. Der gegenwärtige
Rekord, der von Yannick Saouter und Patrick Demichel 2004 aufgestellt
13
wurde, besagt, dass die ersten 10 Billionen (10 ) nichttrivialen Nullstellen
auf der kritischen Geraden liegen. Mathematiker und
Computerwissenschaftler haben inzwischen andere Bereiche von
Nullstellen überprüft. Bis heute liegen sämtliche nichttrivialen Nullstellen,
die berechnet wurden, auf der kritischen Geraden.
Leider ist eine experimentelle Beweisführung dieser Art in diesem
Bereich der Zahlentheorie weniger aussagekräftig, als man erwarten sollte.
Viele andere Vermutungen, für die es anscheinend eine Menge Belege gab,
haben sich letztlich als falsch erwiesen. Es bedarf nur eines einzigen
Gegenbeispiels, um das ganze Gebäude zum Einsturz zu bringen, und
soweit wir wissen, könnte diese Ausnahme so groß sein, dass wir ihr mit
unseren Berechnungen bisher nicht einmal nahe gekommen sind. Aus
diesem Grund bestehen Mathematiker auf Beweisen – und das ist es, was
den Fortschritt auf diesem Gebiet seit mehr als 150 Jahren aufhält.
Näherungen für π
In der Schule wird den Schülern häufig geraten, mit π =
zu rechnen.
Aber können wir das tatsächlich tun, wenn wir das Gleichheitszeichen ernst
nehmen? Und selbst wenn uns eine kleine Abweichung nicht stört, woher
kommt dieser spezielle Bruch?
Die Rationalisierung von π
Die Zahl π kann nicht genau gleich
Kapitel [
sein, weil sie irrational ist (siehe
] und [π]); das heißt, π ist kein Bruch
, bei dem p und q
ganze Zahlen sind. Diese Tatsache, die von Mathematikern schon lang
vermutet worden war, wurde 1768 von Johann Lambert bewiesen. Seitdem
sind mehrere weitere Beweise gefunden worden. Insbesondere impliziert
dies, dass die Dezimalentwicklung von π unablässig weitergeht, ohne dass
sich dieselbe Ziffernfolge unablässig wiederholt. Das bedeutet jedoch nicht,
dass ein bestimmter Zahlenblock wie 12345 nicht mehrfach auftauchen
kann; tatsächlich wiederholt er sich sogar höchstwahrscheinlich unendlich
oft. Aber man kann π nicht darstellen, indem man eine bestimmte feste
Ziffernfolge unendlich oft wiederholt. Die Schulmathematik umgeht diese
Schwierigkeit, indem sie eine einfache Näherung für π benutzt, nämlich
oder
. Man muss nicht beweisen, dass π irrational ist, um zu
erkennen, dass dies nicht genau stimmt:
Zudem ist
wie jede rationale Zahl eine Dezimalzahl mit einer sich
wiederholenden Ziffernfolge, und ihre Dezimalstellen
wiederholen unablässig den Block 142857.
Die ganze Geschichte hindurch sind verschiedene rationale Zahlen
verwendet worden, um π näherungsweise zu beschreiben.
Um 1900 v. Chr. stellten babylonische Mathematiker Berechnungen an,
die der Näherung π ~
=
entsprachen.
Der mathematische Papyrus Rhind wurde von einem Schreiber namens
Ahmose in der Zweiten Zwischenzeit um 1650–1550 v. Chr. verfasst und
gilt in wesentlichen Teilen als Kopie eines über zwei Jahrhunderte älteren
Papyrus aus dem Mittleren Reich um 2055–1650 v. Chr. Darin findet sich
unter anderem eine näherungsweise Berechnung des Flächeninhalts eines
Kreises; in moderne Begriffe übersetzt, entspricht das Ergebnis einer
Näherung von π durch den Bruch
. Es ist jedoch nicht klar, ob die
alten Ägypter eine spezielle Konstante analog π verwendeten.
Etwa um 900 v. Chr. benutzte der indische Astronom Yajnavalkya in
seinem Werk Shatapatha Brahmana
als Näherung für π.
Um 250 v. Chr. bewies der antike griechische Gelehrte Archimedes, einer
der größten Mathematiker, die jemals gelebt haben, und zudem ein
ausgezeichneter Ingenieur, in voller logischer Strenge, dass π kleiner als
und größer als
ist.
Um 150 v. Chr. benutzte Ptolemäus für π die Näherung
.
Um 250 n. Chr. zeigte der chinesische Mathematiker Liu Hui, dass π ~
ist.
Wir können diese Näherungen vergleichen, indem wir sie auf fünf
Dezimalstellen berechnen:
Zahl
Auf 5 Stellen
π
3,14159
3,14285
Relativer Fehler
4% zu groß
Tabelle 9
3,12500
5% zu klein
3,16049
6% zu groß
3,13888
8% zu klein
3,14084
2% zu klein
3,14166
0,2% zu groß
3,14160
0,02% zu groß
Abbildung 77: Ausschnitt aus dem Papyrus Rhind
Die Türme von Hanoi
Auf den ersten Blick würde man kaum auf den Gedanken kommen, dass
etwas Besonderes ist. So ging es mir jedenfalls, selbst nachdem ich
einige Forschungen betrieben hatte, die genau zu dieser Zahl führten. Aber
wie sich herausgestellt hat, steht dieser Bruch in enger Beziehung zu einem
berühmten mathematischen Knobelspiel, den Türmen von Hanoi, und
zudem zu einer noch berühmteren Form, dem Sierpiński-Dreieck.
Tanz der Scheiben
Bei den Türmen von Hanoi handelt es sich um ein traditionelles
Knobelspiel, das vermutlich 1883 von dem französischen Mathematiker
Édouard Lucas erfunden wurde. Es besteht aus einer Reihe runder,
gelochter Scheiben unterschiedlicher Größe, die auf drei Stäben angeordnet
sind. An dieser Stelle wollen wir annehmen, dass die Größen der Scheiben
den positiven ganzen Zahlen 1, 2, 3, …, n entsprechen und bezeichnen das
Spiel als das n-Scheiben-Hanoi-Spiel. Bei der im Handel erhältlichen
Variante des Spiels ist n gewöhnlich 5 oder 6.
Anfangs sitzen alle Scheiben der Größe nach geordnet auf einem
einzigen Stab, die größte Scheibe unten und die kleinste oben. Ziel des
Spiels ist es, den kompletten Stapel an Scheiben auf einen anderen Stab zu
transferieren. Bei jedem Zug wird die oberste Scheibe eines Stapels auf
einen anderen Stab gelegt. Eine Scheibe darf jedoch nur dann in dieser
Weise versetzt werden, wenn
die Scheibe, auf die sie gelegt wird, größer ist, oder
der Stab zuvor leer war.
Die erste Regel stellt sicher, dass die Scheiben dann, wenn sie auf einen
neuen Stab umgesetzt worden sind, wieder ihrer Größe nach von oben
(kleinste) nach unten (größte) geordnet sind.
Bevor Sie weiterlesen, sollten Sie versuchen, das Knobelspiel zu lösen.
Beginnen Sie mit zwei Scheiben und arbeiten Sie sich zu fünf oder sechs
Scheiben hinauf, je nachdem, wie ehrgeizig (und hartnäckig) Sie sind.
Beispielsweise lässt sich ein 2-Scheiben-Hanoi-Spiel in nur drei Zügen
lösen:
Abbildung 78: Die Lösung eines 2-Scheiben-Hanoi-Spiels. Man platziere Scheibe 1 auf dem
mittleren Stab, dann Scheibe 2 auf dem rechten Stab und schließlich Scheibe 1 auf dem
rechten Stab.
Wie steht es mit einem 3-Scheiben-Hanoi-Spiel? Es beginnt so:
Abbildung 79: Ausgangsposition mit drei Scheiben.
Der erste Zug ist im Wesentlichen erzwungen: Die einzige Scheibe, die wir
bewegen dürfen, ist Scheibe 1. Man kann sie auf jeden der beiden freien
Stäbe legen, und welchen wir wählen, spielt eigentlich keine Rolle, denn
wir können die beiden Stäbe vom Konzept her austauschen, ohne das Spiel
dadurch zu beeinflussen. Daher können wir Scheibe 1 genauso gut auf den
mittleren Stab verschieben:
Abbildung 80: Der erste Zug.
In diesem Stadium können wir Scheibe 1 erneut verschieben, aber damit
können wir nichts erreichen: Entweder wandert sie dahin zurück, wo sie
begonnen hat, oder sie wandert zu dem anderen leeren Stab – wo wir sie
gleich von Anfang an hätten platzieren können. Daher sollten wir eine
andere Scheibe bewegen. Scheibe 3 ist nicht zugänglich, da sie unter
Scheibe 2 liegt, also bleibt uns Scheibe 2. Und diese Scheibe dürfen wir
nicht auf Scheibe 1 legen. Daher besteht die einzige Möglichkeit darin, sie
auf den Stab rechts zu bewegen:
Abbildung 81: Zweiter Zug.
Nun können wir Scheibe 3 nicht bewegen, und es ergibt keinen Sinn,
Scheibe 2 nochmals zu bewegen. Also bewegen wir Scheibe 1. Wenn wir
sie auf Scheibe 3 legen, haben wir uns festgefahren und müssen diesen
Schritt beim nächsten Zug rückgängig machen. Daher bleibt uns nur eine
Wahl:
Abbildung 82: Dritter Zug.
Wie geht’s nun weiter? Entweder machen wir diesen Zug rückgängig oder
wir legen Scheibe 1 auf Scheibe 3, was uns offenbar nicht viel weiter
bringt – oder aber wir versetzen Scheibe 3 auf den leeren Stab:
Abbildung 83: Vierter Zug.
In diesem Stadium sind wir der Lösung des Puzzles schon ein gutes Stück
näher gekommen, denn wir haben die schwierigste Scheibe, Scheibe 3, auf
einen neuen Stab verschoben. Offensichtlich müssen wir jetzt nur noch
Scheibe 1 und Scheibe 2 obendrauf legen. Und wir wissen bereits, wie das
geht. Wir haben bereits den Stapel aus Scheibe 1 und Scheibe 2 auf einen
neuen Stab versetzt. Daher müssen wir nur die Züge wiederholen und dabei
darauf achten, dass wir die richtigen Stäbe wählen, nämlich so:
Abbildung 84: Fünfter Zug.
Abbildung 85: Sechster Zug.
Abbildung 86: Siebter Zug.
Geschafft!
3
3
Für diese Lösung haben wir sieben Züge gebraucht, was 2 – 1
entspricht. Es lässt sich zeigen, dass es keine kürzere Lösung gibt. Die
Methode verweist auf eine raffinierte Lösung für eine beliebige Anzahl
Scheiben. Wir können die Situation so zusammenfassen:
Zuerst platziert man die obersten beiden Scheiben auf einem leeren
Stab.
Dann legt man die größte Scheibe auf den einzig verbliebenen leeren
Stab.
Anschließend versetzt man die beiden oberen Scheiben auf den Stab
mit der größten Scheibe.
Der erste und der letzte Schritt sind tatsächlich Lösungen des 2-ScheibenHanoi-Spiels. Der mittlere Schritt ist völlig unkompliziert.
Nach demselben Schema lässt sich auch das 4-Scheiben-Hanoi-Spiel
lösen:
Zuerst platziert man die obersten drei Scheiben auf einem leeren
Stab.
Dann legt man die größte Scheibe auf dem einzig verbliebenen
leeren Stab ab.
Anschließend versetzt man die drei oberen Scheiben auf den Stab
mit der größten Scheibe.
Der erste und der letzte Schritt sind Lösungen des 3-Scheiben-Hanoi-Spiels,
die wir gerade gefunden haben. Wiederum ist der mittlere Schritt völlig
unkompliziert.
Dasselbe Schema lässt sich nun auf das 5-Scheiben-Hanoi-Spiel, das 6Scheiben-Hanoi-Spiel und so weiter anwenden. Wir können das Puzzle für
jede beliebige Zahl von Scheiben lösen, und zwar mit einem «rekursiven»
Verfahren, bei dem wir die Lösung für eine gegebene Zahl von Scheiben
von der Lösung mit einer Scheibe weniger ableiten. Daher lässt sich die
Lösung des 5-Scheiben-Hanoi-Spiels auf die Lösung des 4-ScheibenHanoi-Spiels zurückführen, die sich wiederum auf die Lösung des 3Scheiben-Hanoi-Spiels reduzieren lässt, und diese wiederum auf die Lösung
des 2-Scheiben-Hanoi-Spiels, die man ihrerseits auf die Lösung des 1Scheiben-Hanoi-Spiels zurückführen kann. Aber das ist wirklich kein
Problem: Man nehme einfach die Scheibe und platziere sie auf einem
anderen Stab.
Es gibt eine allgemeine Lösung für das Problem, und die geht so: Um ein
n-Scheiben-Hanoi-Spiel zu lösen,
ignoriert man vorübergehend die größte Scheibe n,
benutzt die Lösung des (n – 1)-Scheiben-Hanoi-Spiels, um die
Scheiben 1, 2, … n – 1 auf einen neuen Stab zu schieben,
bewegt dann Scheibe n auf den verbliebenen leeren Stab,
und verwendet schließlich die Lösung des (n – 1)-Scheiben-HanoiSpiels erneut, um die Scheiben 1, 2, … n – 1 auf den Stab mit der
Scheibe n zu transferieren. (Man beachte, dass der Zielstab aufgrund
der Symmetrie beliebig aus den beiden Möglichkeiten ausgewählt
werden kann, wenn man sich auf die Lösung für das (n – 1)Scheiben-Hanoi-Spiel beruft.)
Der Spielbaum
Rekursive Verfahren können sehr kompliziert werden, wenn man ihnen
Schritt für Schritt folgt, und genau das geschieht bei den Türmen von
Hanoi. Diese Komplexität ist ein inhärentes Merkmal des Spiels und nicht
allein der Lösungsmethode. Um das einzusehen, werde ich das Spiel
geometrisch darstellen, indem ich seinen Spielbaum zeichne. Dieser besteht
aus Knoten, die mögliche Positionen der Scheiben darstellen, verbunden
durch Linien, die zulässige Züge darstellen. Für das 2-Scheiben-HanoiSpiel sieht der Spielbaum folgendermaßen aus:
Abbildung 87: Spielbaum des 2-Scheiben-Hanoi-Spiels.
Man kann dieses Diagramm als drei Kopien des korrespondierenden
Diagramms für das 1-Scheiben-Hanoi-Spiel ansehen, die an drei Stellen
miteinander verbunden sind. In jeder Kopie befindet sich die unterste
Scheibe auf einem der drei möglichen Stäbe in einer festgelegten Position.
Die Verbindungen treten auf, wenn ein leerer Stab eine Verschiebung der
untersten Scheibe ermöglicht. Mehrere Mathematiker haben unabhängig
voneinander festgestellt, dass sich die rekursive Lösung des Puzzles in der
Struktur des Spielbaums widerspiegelt. Die Ersten, denen dies auffiel,
waren R. S. Scorer, P. M. Grundy und Cedric A. B. Smith, die 1944
gemeinsam einen Artikel darüber schrieben.
Wir können rekursive Lösungen benutzen, um den Spielbaum für mehr
Scheiben vorherzusagen. Bei einem 3-Scheiben-Hanoi-Spiel macht man
drei Kopien des oben stehenden Diagramms, jede mit einer zusätzlichen
untersten Scheibe, und verbindet sie zu einem Dreieck. Und so weiter.
Abbildung 88 zeigt beispielsweise den Spielbaum für das 5-ScheibenHanoi-Spiel, wobei die Positionen der Scheiben weggelassen sind:
Abbildung 88: Spielbaum für ein 5-Scheiben-Hanoi-Spiel.
H.-T. Chan (1989) und Andreas Hinz (1992) haben die rekursive Struktur
des Spielbaums benutzt, um eine Formel für die durchschnittliche
Minimalzahl von Zügen zwischen zwei Spielstadien bei einem n-ScheibenHanoi-Spiel zu entwickeln. Die Gesamtzahl der Züge längs der kürzesten
Wege zwischen allen möglichen Positionspaaren lässt sich nach folgender
Formel berechnen:
Für große n ist sie näherungsweise gleich
denn alle anderen Terme in der Formel sind viel kleiner als der erste. Die
durchschnittliche Länge all dieser Wege ist näherungsweise gleich dem
-Fachen der Zahl der Züge längs einer Seite des Spielbaums. Nun
erkennen wir die Bedeutung des seltsamen Bruchs
.
Das Sierpiński-Dreieck
Derselbe Bruch taucht bei einem eng verwandten Problem auf. Andreas
Hinz und Andreas Schief haben die Formel für die durchschnittliche Zahl
von Zügen zwischen Spielstadien des Hanoi-Spiels benutzt, um die
durchschnittliche Entfernung zwischen zwei beliebigen Punkten in einer
berühmten Form zu berechnen, dem Sierpiński-Dreieck. Wenn die Seiten
des Dreiecks die Länge 1 haben, lautet die Antwort bemerkenswerterweise
genau
.
Das Sierpiński-Dreieck wird gebildet, indem man ein gleichseitiges
Dreieck in vier halb so große Dreiecke teilt (dasjenige in der Mitte ist
umgedreht) und das mittlere Dreieck entfernt. Dann wird derselbe Prozess
mit den drei verbleibenden Dreiecken wiederholt, und so weiter und so
weiter. Das Ergebnis ist ein frühes Beispiel für das, was wir heute als
Fraktal bezeichnen: eine Form, die eine komplexe Struktur besitzt, ganz
gleich, wie stark sie vergrößert wird (siehe Kapitel [
]).
Abbildung 89: Die ersten sechs Stufen bei der Bildung eines Sierpiński-Dreiecks.
Der polnische Mathematiker Wacław Sierpiński erfand diese faszinierende
Menge 1915, auch wenn ähnliche Formen schon seit Jahrhunderten zu
Dekorationszwecken eingesetzt wurden. Er beschrieb sein Dreieck als
«gleichzeitig Cantorisch und Jordanisch, wobei jeder Punkt gleichzeitig ein
Verzweigungspunkt ist». Mit «Cantorisch» meinte Sierpiński, dass seine
Figur eine zusammenhängende Punktmenge darstellte, aber mit einer
komplexen Feinstruktur. Mit «Jordanisch» meinte er, dass es sich
gleichzeitig um eine Kurve handelte. Und mit «jeder Punkt ist ein
Verzweigungspunkt» meinte er, dass die Kurve sich an jedem Punkt
verzweigte. Später taufte Benoît Mandelbrot die Form spielerisch
Sierpiński-Dichtung, weil sie der viellöchrigen Dichtung ähnelt, die den
Zylinderkopf eines Autos mit dem Rest des Motors verbindet.
IRRATIONALE ZAHLEN
Brüche eignen sich für jedes praktische Divisionsproblem,
und eine Weile lang waren die alten Griechen fest davon
überzeugt, dass Brüche alles im Universum beschrieben.
Dann setzte sich einer von ihnen mit dem Satz des
Pythagoras auseinander und fragte, in welcher Beziehung die
Diagonale eines Quadrats zu dessen Seiten steht.
Die Antwort machte ihnen klar, dass es Probleme gibt, die
sich mit Brüchen nicht lösen lassen.
Das war die Geburtsstunde der irrationalen Zahlen.
Zusammen bilden rationale und irrationale Zahlen das
System der reellen Zahlen.
Die erste bekannte irrationale Zahl
Rationale Zahlen – Brüche – reichen für die meisten praktischen Zwecke
völlig aus, doch einige Probleme haben keine rationale Lösung. So
entdeckten die griechischen Geometer beispielsweise, dass die Diagonale
eines Quadrats mit der Seitenlänge 1 keine rationale Zahl ist. Wenn die
Diagonale die Länge x hat, dann besagt der Satz des Pythagoras, dass
ist, sodass x =
ist. Und sie bewiesen zu ihrem Kummer, dass x nicht
rational ist.
Abbildung 90: Die Diagonale eines Einheitsquadrats.
Das brachte die griechischen Geometer dazu, sich auf geometrisch
definierte Längen zu konzentrieren und die Zahlen zu ignorieren. Die
Alternative, die sich als die bessere Idee herausstellte, bestand darin, das
Zahlensystem so aufzupeppen, dass es diese Art Probleme bewältigen kann.
Dezimalzahlen, Brüche und irrationale Zahlen
Heutzutage schreiben wir Zahlen gewöhnlich als Dezimalzahlen. Aus
praktischen Gründen verwenden Taschenrechner endliche Dezimalzahlen
mit einer begrenzten Anzahl von Ziffern nach dem Dezimalkomma. Im
Eingangskapitel haben wir gesehen, dass die Diagonale eines
Einheitsquadrats auf zehn Dezimalstellen folgendermaßen aussieht:
Eine Berechnung zeigt jedoch, dass der exakte Wert davon abweicht:
Auch wenn dieser Wert nahe bei 2 liegt, ist er nicht gleich 2.
Vielleicht haben wir zu früh mit dem Rechnen aufgehört. Vielleicht
erhalten wir einen exakten Wert für die Quadratwurzel von 2, wenn wir mit
einer Million Ziffern arbeiten. Tatsächlich lässt sich recht einfach zeigen,
dass das nicht funktioniert. Die zehnstellige Dezimal-Näherung endet mit
einer 3. Wenn wir sie quadrieren, erhalten wir eine 20-stellige Dezimalzahl,
2
die mit einer 9 endet, was 3 entspricht. Das ist kein Zufall, sondern folgt
aus der Art und Weise, wie wir Dezimalzahlen multiplizieren. Nun ist die
letzte wichtige Ziffer jeder Dezimalzahl, wenn es sich nicht um 0 selbst
handelt, ungleich null. Daher endet ihr Quadrat mit einer Ziffer ungleich
null. Da die Dezimalentwicklung von 2 gleich 2,000… mit ausschließlich
Nullen ist, kann keine derartige Quadratzahl genau gleich 2 sein.
Alle Dezimalzahlen auf einem Taschenrechner sind tatsächlich rational.
So ist der Wert von π auf zehn Dezimalstellen genau gleich 3,141592653,
und das entspricht exakt dem Bruch
Dezimalzahlen fester Länge repräsentieren nur eine sehr begrenzte Menge
von Brüchen genau: diejenigen, bei denen der Nenner (die unter dem
Bruchstrich stehende Zahl) eine Potenz von 10 ist. Andere Brüche sind in
dieser Hinsicht komplizierter. Wenn ich
in meinen Taschenrechner
eingebe, spuckt er 0,333333333 aus. Tatsächlich ist das nicht ganz richtig:
Wenn man diese Zahl mit 3 multipliziert, erhält man 0,999999999. Der
Unterschied beträgt 0,0000000001. Aber wen kümmert schon 1 Teil auf
10 Milliarden?
Die Antwort hängt davon ab, was man tun möchte. Wenn man ein
Bücherregal baut und ein 1 m langes Holzbrett in drei gleich lange Teile
schneidet, dann sind 0,333 Meter (333 Millimeter) präzise genug. Wenn
man jedoch einen mathematischen Satz beweisen will und wünscht, dass 3
mal
gleich 1 ist, wie es sein sollte, dann kann selbst ein kleiner Fehler
fatal sein. Wenn man
auf eine völlig korrekte Dezimalzahl erweitern
möchte, so müssen die Dreien endlos fortgeschrieben werden.
Die Ziffern von
können ebenfalls endlos weiterlaufen, doch da
gibt es kein offensichtliches Muster. Dasselbe gilt für die Ziffern von π.
Wenn man jedoch die Längen, die in der Geometrie auftreten, mit Zahlen
darstellen will, muss man eine numerische Darstellung für mathematische
Elemente wie
und π finden. Das Ergebnis war das System, das wir
heute als reelle Zahlen bezeichnen. Sie lassen sich durch unendlich lange
Dezimalentwicklungen darstellen. In der höheren Mathematik werden
jedoch abstraktere Methoden angewandt.
Das Adjektiv «reell» bürgerte sich ein, weil diese Zahlen mit unserer
intuitiven Vorstellung von Messungen korrespondieren. Jede zusätzliche
Dezimalstelle macht die Messung präziser. Die wirkliche Welt wird jedoch
auf der Ebene der Elementarteilchen ein wenig unschärfer, daher verlieren
Dezimalzahlen um die 50. Dezimalstelle herum ihren Kontakt zur Realität.
Nun haben wir die Büchse der Pandora geöffnet. Mathematische Objekte
und Strukturen sind (bestenfalls) Modelle der realen Welt, nicht die Realität
selbst. Wenn wir Dezimalzahlen betrachten, die unendlich weiterlaufen, ist
das System der reellen Zahl hübsch und ordentlich. Deshalb können wir
damit Mathematik betreiben und die Ergebnisse dann mit der Realität
vergleichen, wenn das unser Hauptziel ist. Wenn wir versuchen, dafür zu
sorgen, dass Dezimalzahlen nach 50 Stellen stoppen oder dass sie
unbestimmt werden, geraten wir in einen komplizierten Schlamassel. Es
gibt immer einen Tauschhandel zwischen Nutzerfreundlichkeit und
physikalischer Genauigkeit.
Jede rationale Zahl ist reell. Tatsächlich (ich will die Sache nicht
beweisen, auch wenn das nicht allzu schwierig ist) sind die
Dezimalentwicklungen von rationalen Zahlen genau diejenigen, die
periodisch wiederkehren (rekurrieren). Das heißt, sie wiederholen ständig
denselben endlichen Ziffernblock, vielleicht mit ein paar anderen Ziffern
vorneweg. Zum Beispiel ist
wobei der Anfangsblock 3,2 aus dem Rahmen fällt, der Block 619047 aber
anschließend unendlich oft wiederholt wird.
Viele reelle Zahlen sind jedoch nicht rational. Jede Dezimalzahl, die
solche Wiederholungen vermeidet, ist dafür ein Beispiel. Daher kann ich
sicher sein, dass beispielsweise
mit ihren zunehmend längeren 0-Strecken nicht rational ist. Solche Zahlen
bezeichnet man als irrational. Jede reelle Zahl ist entweder rational oder
irrational.
Beweis, dass
irrational ist
Alle endlichen Dezimalzahlen sind Brüche, aber viele Brüche sind keine
endlichen Dezimalzahlen. Könnte einer von ihnen
exakt
wiedergeben? Hätte die Antwort «ja» gelautet, wäre all das, was die
Griechen über Längen und Flächen herausgefunden haben, viel einfacher
gewesen. Die Griechen stellten jedoch fest, dass die Antwort «nein» war,
und zwar nicht mit Hilfe von Dezimalzahlen, sondern geometrisch.
Wir sehen dies heute als bedeutende Revolution an, die uns große
Gebiete voll neuer und nützlicher Mathematik eröffnete, aber damals war
die ganze Sache den Mathematikern eher peinlich. Die Entdeckung geht auf
die Pythagoreer zurück, die glaubten, das Universum sei auf Zahlen
gegründet. Damit meinten sie ganze Zahlen und Brüche. Leider entdeckte
einer aus ihrem Kreis – dem Vernehmen nach Hippasos von Metapont –,
dass die Diagonale eines Einheitsquadrats irrational ist. Angeblich
verkündete er diese ärgerliche Tatsache, während er sich mit einigen seiner
pythagoreischen Kollegen auf See befand, und die anderen waren darüber
so erzürnt, dass sie ihn über Bord warfen und er ertrank. Diese Geschichte
ist historisch nicht belegt, doch die anderen Pythagoreer wären über diese
Entdeckung sicher nicht besonders erfreut gewesen, denn sie brachte ihre
Grundüberzeugungen ins Wanken.
Der Beweis der Griechen basiert auf einem geometrischen Verfahren, das
wir heute als euklidischen Algorithmus bezeichnen. Dabei handelt es sich
um ein systematisches Verfahren, um herauszufinden, ob zwei gegebene
Längen a und b kommensurabel sind – ob sie beide ganzzahlige Vielfache
einer gemeinsamen Länge c sind. Wenn das der Fall ist, sagt uns das
Verfahren die Länge von c. Aus unserer heutigen numerischen Sicht sind a
und b dann und nur dann kommensurabel, wenn
rational ist, daher ist der
euklidische Algorithmus «in Wirklichkeit» ein Test, um zu entscheiden, ob
eine gegebene Zahl rational ist.
Der geometrische Blickwinkel der Griechen führte sie zu einer ganz
anderen Art der Argumentation, und zwar in folgender Richtung: Nehmen
wir an, a und b seien ganzzahlige Vielfache von c. Beispielsweise können
wir a = 17c und b = 5 c wählen. Nun zeichnen wir ein 17×5-Netz von
Quadraten, die alle die Seitenlänge c haben. Man beachte, dass a in der
obersten waagerechten Zeile aus 17 Kopien von c besteht, in der
senkrechten Spalte besteht b aus 5 Kopien von c. Daher sind a und b
kommensurabel.
Abbildung 91: 17×5-Gitter.
Als Nächstes schneidet man so viele 5×5-Quadrate ab wie möglich:
Abbildung 92: Man schneidet drei 5×5-Quadrate ab.
Am Ende bleibt schließlich ein 2×5-Rechteck zurück. Man wiederholt den
Prozess bei diesem kleineren Rechteck und schneidet nun 2×2-Quadrate ab:
Abbildung 93: Dann schneidet man zwei 2×2-Quadrate ab.
Nun ist nur noch ein 2×1-Rechteck übrig. Dies zerlegt man in zwei 1×1Quadrate, und kein kleines Rechteck bleibt übrig – die ganze Sache geht
glatt auf.
Abbildung 94: Schließlich schneidet man zwei 1×1-Quadrate ab.
Wenn die ursprünglichen Längen a und b ganzzahlige Vielfache einer
gemeinsamen Länge c sind, muss der Prozess schließlich zu einem Ende
kommen, weil alle Linien auf dem Gitter liegen und die Rechtecke immer
kleiner werden. Wenn umgekehrt der Prozess jedoch stoppt, dann sind,
wenn man rückwärts arbeitet, a und b ganzzahlige Vielfache von c. Kurz
gesagt: Zwei Längen sind dann und nur dann kommensurabel, wenn der
euklidische Algorithmus, angewandt auf das korrespondierende Rechteck,
nach endlich vielen Schritten zu einem Ende führt.
Wenn wir beweisen wollen, dass ein beliebiges Paar Längen nicht
kommensurabel ist, müssen wir lediglich ein Rechteck konstruieren, für das
der Prozess offensichtlich zu keinem Ende führt. Was
angeht, besteht
der Trick darin, mit einem Rechteck zu beginnen, dessen Form so gewählt
ist, dass sichergestellt ist, dass nach dem Abschneiden zweier großer
Quadrate ein Stück übrig bleibt, das genau dieselbe Form hat wie das
Original. Wenn das der Fall ist, kann man mit dem euklidischen
Algorithmus unendlich oft zwei Stücke abschneiden, und die ganze Sache
kann nie zu einem Ende führen.
Abbildung 95: Das schattierte Rechteck muss dieselbe Form wie das ursprüngliche haben.
Die Griechen konstruierten ein solches Rechteck geometrisch, aber wir
können stattdessen Algebra verwenden. Angenommen, die Seiten sind a
und 1. Dann ist die erforderliche Bedingung
2
2
Daher ist a – 2a = 1, wenn (a – 1) = 2 ist, daher ist a = 1 +
.
Zusammenfassend kann man sagen: Der euklidische Algorithmus besagt
implizit, dass die Längen 1 +
1+
und 1 inkommensurabel sind; daher ist
irrational.
Und daher ist auch
nehmen wir an, dass
irrational. Um zu verstehen, warum das so ist,
rational ist, gleich
. Dann ist
, was wiederum rational ist. Aber das ist
nicht der Fall, daher sind wir auf einen Widerspruch gestoßen, und unsere
Annahme ist falsch.
Den Kreis vermessen
Die Zahlen, die wir zum raschen Zählen benutzen, werden uns mit der Zeit
vertraut, doch einige Zahlen sind weitaus seltsamer. Die erste wirklich
ungewöhnliche Zahl, auf die wir im Mathematikunterricht in der Schule
treffen, ist π. Diese Kreiszahl taucht in vielen Gebieten der Mathematik auf,
von denen nicht alle eine offensichtliche Beziehung zu Kreisen aufweisen.
Mathematiker haben π auf mehr als 12 Billionen Dezimalstellen berechnet.
Wie machen sie das? Wer weiß, welche Art von Zahl π ist, kann die
klassische Frage beantworten: Ist es möglich, aus einem Kreis allein mit
Zirkel und Lineal ein Quadrat mit demselben Flächeninhalt zu
konstruieren?
Verhältnis von Umfang und Durchmesser eines Kreises
π ist uns zum ersten Mal begegnet, als wir den Umfang und den
Durchmesser eines Kreises berechnet haben. Wenn r der Radius ist, beträgt
2
der Umfang 2πr und die Fläche πr . Geometrisch sind diese beiden Größen
nicht direkt korreliert, daher ist es eigentlich wirklich bemerkenswert, dass
dieselbe Zahl π in beiden auftritt. Es gibt einen intuitiven Weg zu verstehen,
warum das so ist. Schneiden Sie einen Kreis in viele Teile wie eine Pizza
und ordnen Sie diese Teile neu an, sodass sie näherungsweise ein Rechteck
bilden. Die Länge dieses Rechtecks entspricht näherungsweise der Hälfte
des Kreisumfangs, der gleich πr ist. Seine Höhe ist näherungsweise gleich
2
r. Daher beträgt die Fläche des Rechtecks näherungsweise πr × r = πr .
Abbildung 96: Annäherung an die Fläche eines Kreises.
Das ist jedoch lediglich eine Näherung. Vielleicht sind die Zahlen, die im
Zusammenhang mit dem Durchmesser und der Fläche eines Kreises
auftreten, sehr ähnlich, aber nicht identisch. Das ist jedoch
unwahrscheinlich, denn die Argumentation funktioniert, ganz gleich, in wie
viele Teile wir die Pizza zerlegen. Wenn wir eine große Zahl sehr dünner
Teile wählen, kommt die Näherung dem tatsächlichen Wert sehr nahe.
Dadurch, dass wir die Pizza so fein zerlegen, wie wir es wünschen, können
wir die Differenz zwischen der aktuellen Form und einem wirklichen
Rechteck beliebig klein werden lassen. Wenn man eine
Grenzwertbetrachtung anstellt, liefert diese Beobachtung einen Beweis,
dass die Formel für die Kreisfläche korrekt und exakt ist. Aus diesem
Grund tritt dieselbe Zahl beim Umfang wie auch bei der Fläche eines
Kreises auf.
Das Grenzwertverfahren definiert zudem, was wir in diesem
Zusammenhang mit «Fläche» meinen. Flächen sind nicht so eindeutig
bestimmt, wie man vielleicht meinen möchte. Man kann die Fläche von
Vielecken definieren, indem man sie in Dreiecke zerlegt, doch diese
Methode funktioniert bei Formen mit gerundeten Kanten nicht. Selbst der
Flächeninhalt eines Rechtecks ist nicht so eindeutig bestimmt, wenn dessen
Seiten nicht kommensurabel sind. Das Problem besteht nicht darin, zu
sagen, was der Flächeninhalt ist: Dazu muss man nur die beiden Seiten
multiplizieren. Der schwierige Teil besteht darin zu beweisen, dass sich das
Ergebnis so verhält, wie sich ein Flächeninhalt verhalten sollte –
beispielsweise, dass sich der Flächeninhalt von Formen, die man
zusammenfügt, addiert. Die Schulmathematik übergeht dieses Problem
möglichst rasch und hofft, dass niemand diese Schwierigkeit bemerkt.
Warum benutzen Mathematiker ein obskures Symbol für eine Zahl?
Warum nicht einfach die Zahl hinschreiben? In der Schule haben viele von
uns gelernt, dass
ist, aber gewissenhafte Lehrer fügen hinzu,
dass es sich dabei lediglich um eine Näherung handelt (siehe Kapitel [
Warum benutzen wir also nicht stattdessen einen exakten Bruch für π?
Weil es so etwas nicht gibt!
]).
Die Zahl π ist das bekannteste Beispiel für eine irrationale Zahl. Wie
lässt sie sich nicht exakt durch irgendeinen noch so komplizierten
Bruch darstellen. Das ist wirklich nicht einfach zu beweisen, aber
Mathematiker wissen, wie man es anstellt, und es stimmt. Daher brauchen
wir definitiv ein neues Symbol, denn diese spezielle Zahl lässt sich mit
Hilfe der gewöhnlichen Zahlensymbole nicht exakt hinschreiben. Da π eine
der wichtigsten Zahlen in der gesamten Mathematik ist, brauchen wir eine
eindeutige Möglichkeit, sie darzustellen. Die Wahl fiel auf das griechische
«p» (pi), den ersten Buchstaben in «Perimeter» (Umfang).
In dieser Hinsicht hat uns das Universum wirklich einen üblen Streich
gespielt: eine wirklich wichtige Zahl, die wir nicht niederschreiben können,
es sei denn mit einer komplizierten Formel. Das ist vielleicht ein Ärgernis,
aber auch faszinierend und trägt zum Geheimnis von π bei.
π und Kreise
Wir sind π erstmals im Zusammenhang mit Kreisen begegnet. Kreise sind
sehr grundlegende mathematische Formen, daher muss alles, was uns etwas
über Kreise sagt, sehr interessant sein. Kreise haben eine Menge nützlicher
Anwendungen. Im Jahr 2011 betrug die Zahl der Kreise, die eine
entscheidende Rolle bei einem einzigen Aspekt unseres Alltags spielten,
mehr als 5 Milliarden, denn die Anzahl der Personenkraftwagen überschritt
die Marke von 1 Milliarde, und damals hatte ein typisches Auto fünf
Räder – vier auf der Straße und eins als Ersatz im Kofferraum. Natürlich
gibt es noch eine ganze Menge anderer Räder in einem Auto, das reicht von
den Unterlegscheiben bis zum Steuerrad. Und denken Sie nur an all die
Räder in Fahrrädern, Lastern, Bussen, Zügen, Flugzeugen …
Abbildung 97: Kreisförmige Wellen.
Räder sind nur eine Anwendung der Geometrie des Kreises. Sie
funktionieren, weil jeder Punkt eines Kreises gleich weit vom Kreiszentrum
entfernt ist. Wenn man ein kreisförmiges Rad um sein Zentrum dreht,
bewegt es sich glatt und gleichförmig über eine ebene Straße. Aber Kreise
zeigen sich noch auf vielerlei andere Weise. Die Wellenringe auf einem
Teich sind rund, ebenso die farbigen Bögen des Regenbogens. Die
Umlaufbahnen der Planeten sind in erster Näherung Kreise. Bei einer
korrekteren Näherung sind die Umlaufbahnen Ellipsen, also Kreise, die in
einer Richtung zusammengedrückt sind.
Abbildung 98: Ein Regenbogen bildet einen Kreisausschnitt.
Ingenieure können jedoch problemlos Räder konstruieren, ohne π zu
kennen. Die wahre Bedeutung dieser Zahl ist theoretisch und reicht viel
tiefer. Erstmals stießen Mathematiker bei einer grundsätzlichen Frage über
Kreise auf π. Die Größe eines Kreises lässt sich durch drei eng miteinander
verknüpfte Zahlen beschreiben:
seinen Radius – die Strecke zwischen dem Mittelpunkt des Kreises
und einem beliebigen Punkt auf dem Kreis.
seinen Durchmesser – die maximale Breite des Kreises.
seinen Umfang – die Länge der Begrenzungslinie des Kreises,
rundum gemessen.
Radius und Durchmesser stehen in einer ganz einfachen Beziehung
zueinander: Der Durchmesser beträgt das Doppelte des Radius, und der
Radius ist halb so lang wie der Durchmesser.
Die Beziehung zwischen Umfang und Durchmesser ist nicht so einfach.
Wenn man in den Kreis ein Sechseck zeichnet, kann man sehen, dass der
Umfang etwas größer ist als das Dreifache des Durchmessers. Die
Abbildung zeigt sechs Radien, die paarweise gemeinsam drei Durchmesser
ergeben. Das Sechseck hat dieselbe Länge wie die sechs Radien – das heißt,
drei Durchmesser. Und der Kreis ist eindeutig etwas länger als das
Sechseck.
Abbildung 99: Warum π größer als 3 ist.
Die Kreiszahl π ist definiert als der Umfang eines beliebigen Kreises, geteilt
durch seinen Durchmesser. Ganz gleich, wie groß der Kreis ist, wir
erwarten, dass diese Zahl stets denselben Wert hat, denn ob der Kreis nun
weiter wird oder schrumpft, das Verhältnis von Umfang zu Durchmesser
bleibt immer dasselbe. Vor rund 2200 Jahren entwickelte Archimedes einen
völlig logischen Beweis, der zeigte, dass diese Zahl bei jedem Kreis
funktioniert.
Archimedes machte sich nicht nur über Sechsecke in einem Kreis
Gedanken, sondern verdoppelte die Zahl der Seiten auch von 6 auf 12, dann
24, dann 48 und schließlich 96 Seiten und erhielt so einen recht genauen
Wert für π. Er bewies zudem, dass π größer als
und kleiner als
ist – in Dezimalzahlen ausgedrückt, größer als 3,141 und kleiner als 3,143.
(Archimedes arbeitete mit geometrischen Figuren, nicht mit Zahlen, und er
veranschaulichte sich das, was wir heute π nennen, geometrisch, daher ist
dies eine moderne Neuinterpretation dessen, was er tatsächlich tat. Die
Griechen hatten kein Dezimalsystem.)
Archimedes’ Methode zur Berechnung von π lässt sich so genau machen,
wie wir es wünschen, indem man die Zahl der Seiten des eingeschriebenen
Vielecks, das zur Approximierung des Kreises dienen soll, genügend oft
verdoppelt. Spätere Mathematiker fanden bessere Methoden – einigen
davon werde ich im Folgenden diskutieren. Auf 1000 Dezimalstellen genau
sieht π so aus:
Wenn man sich diese Ziffern ansieht, ist das auffälligste Merkmal das
vollständige Fehlen eines Musters. Die Ziffern sehen zufällig verteilt aus.
Aber das kann nicht sein, weil es sich um die Ziffern von π handelt, und das
ist eine ganz bestimmte Zahl. Das Fehlen eines jeden Musters ist ein
gewichtiger Hinweis darauf, dass π in der Tat eine höchst seltsame Zahl ist.
Mathematiker hegen den starken Verdacht, dass jede endliche Folge von
Ziffern irgendwo in der dezimalen Erweiterung von π auftaucht, und das
auch noch unendlich oft. Tatsächlich wird angenommen, dass π eine
normale Zahl ist, das heißt, dass alle Ziffernblöcke einer gegebenen Länge
gleich häufig auftreten. Diese Vermutungen sind bislang weder bewiesen
noch widerlegt worden.
Wo π sonst noch auftaucht
Die Kreiszahl π taucht in vielen anderen Gebieten der Mathematik auf, die
oft keine offensichtlichen Verbindungen mit Kreisen aufweisen. Es gibt
stets eine indirekte Verbindung, denn π ist ihrem Ursprung nach eine
Kreiszahl, und Kreise sind eine Möglichkeit, um π zu definieren. Jede
andere Definition muss dieselbe Zahl ergeben, daher muss irgendwo längs
des Weges eine Verbindung zum Kreis hergestellt und bewiesen werden.
Die Verbindung kann jedoch sehr indirekt sein.
So bemerkte Euler beispielsweise 1748 eine Verbindung zwischen den
Zahlen π, e und i, der Quadratwurzel aus –1 (siehe Kapitel [e]). Er fand die
elegante Formel
Zudem stellte Euler fest, dass π als Wert gewisser unendlicher Reihen
erscheint. Im Jahr 1735 löste er das Basler Problem und damit eine Frage,
die 1644 von Pietro Mengoli gestellt worden war: Wie groß ist die Summe
sämtlicher reziproker Quadratzahlen? Dabei handelt es sich um eine
unendliche Summe, denn es gibt unendlich viele Quadratzahlen. Viele der
großen Mathematiker jener Tage versuchten, dieses Problem zu lösen, doch
es gelang ihnen nicht. Euler entdeckte 1735 die wunderbar simple Antwort:
Diese Entdeckung machte ihn unter seinen Kollegen mit einem Schlag
berühmt. Erkennen Sie die Verbindung zu Kreisen? Nein, ich auch nicht.
Diese Verbindung kann auch nicht gerade auf der Hand liegen, denn eine
ganze Reihe von Spitzenmathematikern konnte das Basler Problem nicht
lösen. Die Lösung bedient sich tatsächlich der Sinusfunktion, die auf den
ersten Blick keinerlei Verbindung mit dem Problem zu haben scheint.
Eulers Methode führte zu ähnlichen Ergebnissen für die vierte Potenz,
die sechste Potenz und ganz allgemein für jede Potenz, zum Beispiel:
Es ist auch möglich, ausschließlich ungerade oder gerade Zahlen zu
benutzen:
Ähnliche Formeln für ungerade Potenzen, wie die 3. (kubische) oder die
5. Potenz sind jedoch bisher nicht bewiesen worden, und man vermutet,
dass keine derartigen Formeln existieren (siehe Kapitel [ζ(3)]).
Bemerkenswerterweise zeigen diese und verwandte Reihen tief greifende
Verbindungen mit Primzahlen und der Zahlentheorie. Wenn man zum
Beispiel zwei ganze Zahlen nach dem Zufallsprinzip wählt, dann ist die
Wahrscheinlichkeit, dass sie keinen gemeinsamen Teiler (größer 1) haben,
~ 0,6089, entspricht also dem Kehrwert der Summe der Euler’schen
Reihen.
Auch in der Statistik taucht π ganz unerwartet auf. Die Fläche unter der
–x2
berühmten Glockenkurve, die die Gleichung y = e
.
hat, ist genau gleich
Abbildung 100: Die Glockenkurve.
Die Kreiszahl π erscheint auch in vielen Formeln der mathematischen
Physik. Mathematiker haben eine Vielzahl von Gleichungen entdeckt, in
denen π eine wichtige Rolle spielt; einige davon werden wir im Folgenden
diskutieren.
Wie man π berechnet
Im Jahr 2013 berechnete Shigeru Kondo im Lauf von 94 Tagen π mit Hilfe
eines Computers auf 12100000000050 Dezimalstellen genau – mehr als
12 Billionen. Wenn man π zu praktischen Zwecken einsetzt, benötigt man
nicht annähernd ein derartiges Maß an Präzision. Und man kann diese
Präzision nicht erreichen, indem man reale Kreise vermisst. Im Lauf der
Jahrtausende sind verschiedene Methoden entwickelt worden, die alle auf
Formeln für π oder Verfahren basierten, die wir heute durch Formeln
ausdrücken.
Vernünftige Gründe für die Durchführung solcher Berechnungen sind
zum Beispiel, zu prüfen, wie gut sich diese Formeln «schlagen» oder wie
gut ein neuer Computer funktioniert. Einige Mathematiker sind auch
einfach fasziniert davon, immer weitere Stellen von π zu berechnen – ihnen
geht es da wie Bergsteigern, die einen Gipfel besteigen, einfach, «weil er da
ist». Aktivitäten wie diese, die allein dazu dienen, einen neuen Rekord
aufzustellen, sind sicherlich nicht typisch für den Großteil der
mathematischen Forschung und haben, für sich genommen, weder
besondere Bedeutung noch praktischen Wert, doch sie haben zu ganz neuen
und faszinierenden Formeln geführt und unerwartete Verbindungen
zwischen verschiedenen Gebieten der Mathematik enthüllt.
Bei Formeln für π spielen in der Regel unendliche Prozesse eine Rolle,
die – wenn sie genügend häufig durchgeführt werden – gute Annäherungen
an π liefern. Die ersten Fortschritte gegenüber Archimedes’ Berechnungen
gelangen im 15. Jahrhundert, als indische Mathematiker π als die Summe
einer Reihe darstellten – einer Summe unendlich vieler Glieder
(Summanden). Wenn sich der Wert einer Summe bei Hinzufügen weiterer
Glieder einer wohldefinierten Zahl, ihrem Grenzwert, immer stärker nähert,
wie es bei diesen Formeln der Fall war, dann kann man die Reihe dazu
benutzen, um zunehmend genauere Näherungen zu berechnen. Sobald das
erforderliche Niveau an Genauigkeit erreicht ist, stoppt man die
Berechnung.
Um 1400 n. Chr. benutzte Madhava von Sangamagramma eine solche
Reihe, um π auf die 11. Dezimalstelle genau zu berechnen. Im Jahr 1424
verbesserte der Perser Dschamschid Mas῾ud al-Kaschi dieses Ergebnis,
indem er Näherungen mittels Vielecken mit zunehmend vielen Kanten
benutzte, ganz ähnlich, wie es Archimedes getan hatte. Er erhielt die ersten
28
16 Nachkommastellen, indem er ein Vieleck mit 3 × 2 Seiten
berücksichtigte. Archimedes’ Methode zur Approximation von π inspirierte
François Viète dazu, 1593 eine Formel neuer Art zu entwickeln, nämlich:
(Hier zeigen die Punkte Multiplikationen an.) Um 1630 hatte Christoph
Grienberger die Vieleckmethode auf 38 Nachkommastellen ausgeweitet.
Im Jahr 1665 entwickelte John Wallis eine andere Formel:
wobei er einen recht komplizierten Ansatz wählte, um die Fläche eines
Halbkreises zu finden.
Um 1641 entdeckte James Gregory eine von Madhavas Reihen für π
wieder. Die Idee besteht darin, sich einer trigonometrischen Funktion
namens Tangens zu bedienen, die als tan x geschrieben wird. Im Bogenmaß
ist ein Winkel von 45° gleich
und in diesem Fall a = b, sodass tan
ist.
Abbildung 101: Links: Der Tangens tan x ist . Rechts: Wenn x = ist, ist der Tangens = 1.
Nun wollen wir die inverse Funktion betrachten, die gewöhnlich als
Arkustangens, kurz arctan, bezeichnet wird. Diese Funktion kehrt die
Tangensfunktion um, das heißt, wenn y = tan x ist, dann ist x = arctan y.
Insbesondere ist arctan
unendliche Reihe für arctan:
. Madhava und Gregory entdeckten eine
Wenn man y = 1 setzt, erhält man
Im Jahr 1699 benutzte Abraham Sharp diese Formel, um π auf
71 Nachkommastellen zu bestimmen, doch die Reihe konvergiert sehr
langsam, das heißt, man muss eine Menge Terme berechnen, um eine gute
Näherung zu erhalten. 1706 verwendete John Machin eine trigonometrische
Formel für tan(x + y), um zu zeigen, dass
ist, und setzte dann
und
in der Reihe für arctan ein. Da diese
Zahlen deutlich kleiner als 1 sind, konvergieren die Reihen rascher, was
ihre Verwendung praktischer macht. Machin berechnete mit seiner Formel
100 Dezimalstellen von π. Bis 1946 hatte Daniel Ferguson diese allgemeine
Idee wohl so weit vorangetrieben wie überhaupt möglich, und mit
ähnlichen, wenn auch abgewandelten Formeln 620 Nachkommastellen
erreicht.
Es gibt eine Menge raffinierter Varianten von Machins Formel, ja sogar
eine ganze Theorie aller derartigen Formeln. 1896 wusste Fredrik Störmer,
dass
ist, und es gibt viele noch eindrucksvollere moderne Formeln dieser Art, die
dank der großen Nenner, die auftreten, zu weitaus schneller
konvergierenden Reihen führen.
Niemand ist bei Berechnungen mit Papier und Bleistift weiter
gekommen, doch mechanische Rechner und elektronische Computer haben
die Berechnungen deutlich beschleunigt und Fehler eliminiert. Die
Aufmerksamkeit wandte sich Formeln zu, die mit nur wenigen Termen zu
sehr guten Näherungen führten. Der Chudnovsky-Algorithmus
der von den Brüdern David und Gregory Chudnovsky entdeckt wurde,
produziert pro Term 14 neue Dezimalstellen. Hier bedeutet das
Summenzeichen ∑: Man addiere die Werte des angegebenen Ausdrucks,
während k sämtliche natürlichen Zahlen durchläuft, angefangen mit 0 und
fortlaufend bis unendlich.
Es gibt noch viele weitere Methoden zur Berechnung von π, und es
kommen immer noch neue hinzu. 1997 verkündete Fabrice Bellard, die
billionste Ziffer von π in binärer Notation sei 1. Erstaunlicherweise kam er
zu diesem Ergebnis, ohne eine der vorangehenden Ziffern berechnet zu
haben. 1996 hatten David Bailey, Peter Borwein und Simon Plouffe eine
sehr eigenartige Formel entdeckt:
Bellard benutzte eine ähnliche Formel, mit der sich die Nachkommastellen
von π leichter berechnen ließen:
Bei geschickt eingesetzter Analysis erhält man mit dieser Methode Ziffern
von π in Binärdarstellung. Das Schlüsselmerkmal in dieser Gleichung ist,
4n
10n
dass viele der darin auftretenden Zahlen wie 4, 32, 64, 256, 2 und 2
Potenzen von 2 sind, mit denen sich im Binärsystem, wie es Computer für
ihre Berechnungen verwenden, sehr bequem rechnen lässt. Der Rekord für
das Auffinden einer einzelnen Binärziffer von π wird regelmäßig
gebrochen: 2010 berechnete der Yahoo-Mitarbeiter Nicholas Sze die
15
zweibilliardste (2 × 10 -te) Binärziffer von π, die sich als 0 herausstellte.
Dieselbe Gleichung kann man benutzen, um isolierte Ziffern von π zur
Basis 4, 8 und 16 zu finden. Für andere Basen ist nichts Derartiges bekannt;
insbesondere können wir keine isolierten dezimalen Ziffern berechnen. Gibt
es überhaupt Formeln, die so etwas ermöglichen? Bis die Bailey-Borwein-
Plouffe-Formel entdeckt wurde, konnte sich niemand vorstellen, dass es bei
binären Zahlen funktionieren könnte.
Die Quadratur des Kreises
Die alten Griechen suchten nach einer geometrischen Konstruktion für die
Quadratur des Kreises: Es ging darum, die Seite eines Quadrats zu finden,
das dieselbe Fläche wie ein gegebener Kreis hat. Schließlich wurde wie für
die Dreiteilung eines Winkels und die Verdopplung eines Würfels bewiesen,
dass keine Konstruktion mit Zirkel und Lineal existierte (siehe Kapitel [3]).
Der Beweis basiert auf der Kenntnis des Zahlentyps, zu dem π gehört.
Wir haben gesehen, dass π keine rationale Zahl ist. Der nächste Schritt
von den rationalen Zahlen aufwärts führt uns zu den algebraischen Zahlen,
die einer polynomialen Gleichung mit ganzzahligen Koeffizienten genügen.
Beispielsweise ist
2
algebraisch, da es die Gleichung x – 2 = 0 erfüllt.
Eine Zahl, die nicht algebraisch ist, wird als transzendent bezeichnet, und
1761 vermutete Lambert, der bewiesen hatte, dass π irrational ist, dass diese
Zahl tatsächlich transzendent ist.
Es sollte 112 Jahre dauern, bis Charles Hermite 1873 der erste große
Durchbruch gelang: Er konnte beweisen, dass die andere berühmte seltsame
Zahl in der Mathematik, die Basis e der natürlichen Logarithmen (siehe
Kapitel [e]), transzendent ist. 1882 verbesserte Ferdinand von Lindemann
Hermites Methode und zeigte, dass e, wenn es mit einer algebraischen Zahl
ungleich null potenziert wird, transzendent ist. Dann machte er sich Eulers
iπ
Formel e = –1 zunutze, und zwar so: Man nehme an, π sei algebraisch.
Dann gilt das auch für iπ. Daher besagt Lindemanns Satz implizit, dass –1
transzendent ist. Es erfüllt jedoch eine polynomiale Gleichung, nämlich x +
1 = 0, ist also algebraisch. Der einzige Ausweg aus diesem logischen
Widerspruch ist, dass π eine algebraische Gleichung nicht erfüllt, was
bedeutet, dass π transzendent ist.
Eine wichtige Konsequenz dieses Satzes ist die Antwort auf das
klassische geometrische Problem der Quadratur des Kreises. Dies ist der
Konstruktion einer Geraden der Länge π äquivalent, wobei man von einer
Geraden der Länge 1 ausgeht. Wie die Koordinatengeometrie zeigt, muss
jede Zahl, die sich auf diese Weise konstruieren lässt, algebraisch sein. Da π
nicht algebraisch ist, kann es keine derartige Konstruktion geben.
Das hält einige Leute jedoch nicht davon ab, selbst heute noch weiter
nach einer Zirkel-und-Lineal-Lösung zu suchen. Sie verstehen offenbar
nicht, was «unmöglich» in der Mathematik meint. Es ist ein altes
Verwirrspiel. Im Jahr 1872 verfasste De Morgan ein Buch mit dem Titel A
Budget of Paradoxes (etwa: Ein Bündel Paradoxien), in dem er die Irrtümer
zahlreicher Möchtegern-Kreisquadrierer entlarvte und sie mit einem
Tausend Fliegen verglich, die um einen Elefanten herumsummten, wobei
jede von sich behauptete, «größer als der Dickhäuter» zu sein. 1992 setzte
Underwood Dudley die Arbeit seines Vorgängers in Mathematical Cranks
(deutsch: Mathematik zwischen Wahn und Witz) fort. Lassen Sie sich nicht
davon abhalten, geometrische Näherungen für π und Konstruktionen mit
Hilfe anderer Instrumente zu versuchen. Aber glauben Sie mir bitte, dass
Konstruktionen mit Zirkel und Lineal im strengen klassischen Sinne nicht
möglich sind.
Der Goldene Schnitt
Diese Zahl war schon den alten Griechen im Zusammenhang mit
regelmäßigen Fünfecken und dem Dodekaeder in der euklidischen
Geometrie geläufig. Sie ist eng mit der Folge der Fibonacci-Zahlen (siehe
Kapitel [8]) verknüpft, und sie erklärt einige auffällige Merkmale beim
Aufbau von Pflanzen im Allgemeinen und Blüten im Speziellen.
Gewöhnlich wird sie als Goldene Zahl oder Goldener Schnitt bezeichnet,
ein Name, der zwischen 1826 und 1835 geprägt wurde. Über die
mystischen und ästhetischen Eigenschaften dieser Zahl wird seit langem
spekuliert, doch die meisten dieser Spekulationen sind übertrieben, einige
basieren auf zweifelhaften Statistiken, und viele haben auch gar keine
Basis. Der Goldene Schnitt hat jedoch tatsächlich einige bemerkenswerte
mathematische Eigenschaften; er ist mit den Fibonacci-Zahlen verknüpft
und weist zudem echte Verbindungen mit der natürlichen Welt auf – vor
allem mit der Numerologie und der Geometrie der Pflanzen.
Die griechische Geometrie
Die Zahl φ (griechisch ‹Phi› – manchmal in einer anderen Notation τ für
griechisch ‹Tau› geschrieben) tauchte in der Geometrie erstmals im
Zusammenhang mit dem regelmäßigen Fünfeck in Euklids Elementen auf.
So, wie es in jener Zeit üblich war, wurde sie geometrisch, nicht numerisch
interpretiert.
Es gibt eine exakte Formel für φ, zu der wir gleich kommen werden. Auf
sechs Dezimalstellen genau ist
und auf 100 Dezimalstellen ist
Ein typisches Merkmal von φ wird deutlich, wenn wir den Kehrwert
ausrechnen. Wiederum auf sechs Dezimalstellen genau ist
Das spricht dafür, dass
ist. Diese Beziehung lässt sich
2
als quadratische Gleichung φ = φ + 1 oder in Standardform
schreiben. Die Algebra quadratischer Gleichungen zeigt, dass diese
Gleichung zwei Lösungen hat:
Numerisch ergibt das 1,618034 und –0,618034. Wir nehmen die positive
Lösung als Definition für φ. Daher ist
und es stimmt tatsächlich, dass
ist.
Zusammenhang mit Fünfecken
Der Goldene Schnitt taucht in der Geometrie der regelmäßigen Fünfecke
auf. Man beginne mit einem regelmäßigen Fünfeck, dessen Seiten die
Länge 1 haben. Man zeichne die fünf Diagonalen ein, um einen
fünfzackigen Stern (Pentagramm) zu erhalten. Euklid bewies, dass die
Länge jeder Diagonale dem Goldenen Schnitt entspricht.
Genauer gesagt arbeitete Euklid mit der «Teilung einer Strecke im
inneren und äußeren Verhältnis». Das ist ein Verfahren, eine Strecke so in
zwei Teile zu teilen, dass das Verhältnis des größeren Teilstücks zum
kleineren dem Verhältnis der ganzen Strecke zum größeren Teilstück
entspricht.
Abbildung 102: Ein regelmäßiges Fünfeck oder Pentagon und seine Diagonalen.
Abbildung 103: Teilung einer Strecke im inneren und äußeren Verhältnis: Das Verhältnis der
dunkelgrauen Strecke der Länge 1 zu der hellgrauen Strecke (x – 1) entspricht dem
Verhältnis der schwarzen Strecke der Länge x zu der dunkelgrauen Strecke (1).
Zu welcher Zahl führt dieses Verfahren? In Symbolen ausgedrückt, nehmen
wir an, die schwarze Strecke habe die Länge x, die dunkelgraue die Länge x
– 1. Daher lässt sich die Bedingung für eine Teilung im inneren und äußeren
Verhältnis auf die Gleichung
zurückführen, was sich zu
umordnen lässt. Das ist die Gleichung, die den Goldenen Schnitt definiert,
und uns interessiert diejenige Lösung, die größer 1 ist, nämlich φ.
Euklid stellte fest, dass die Seiten in der Abbildung des Fünfecks die
Diagonalen in einem inneren und äußeren Verhältnis teilen. Das erlaubte
ihm, ein regelmäßiges Fünfeck mit den traditionellen Instrumenten Zirkel
und Lineal zu konstruieren (siehe Kapitel [17]). Und das Fünfeck war für
die Griechen von großer Bedeutung, denn es bildet die Seiten eines der fünf
regelmäßigen Körper, des Dodekaeders (Zwölfflächners). Der Höhepunkt
der Elemente ist ein Beweis, dass es genau fünf regelmäßige Körper gibt
(siehe Kapitel [5]).
Fibonacci-Zahlen
Der Goldene Schnitt ist eng mit den Fibonacci-Zahlen verknüpft, die 1202
von Leonardo da Pisa eingeführt wurden (siehe Kapitel [8]). Erinnern Sie
sich daran, dass diese Zahlenfolge so beginnt:
Nach den beiden ersten Zahlen ergibt sich jede Folgezahl aus der Addition
der beiden vorangegangenen Zahlen: 1 + 1 = 2, 1 + 2 = 3, 2 + 3 = 5, 3 + 5 =
8, und so weiter.
Die Verhältnisse aufeinander folgender Fibonacci-Zahlen rückt immer
näher an den Goldenen Schnitt heran:
und diese Eigenschaft lässt sich anhand der Regel für die Bildung der Folge
und der quadratischen Gleichung für φ beweisen.
Umgekehrt können wir die Fibonacci-Zahlen mittels des Goldenen
Schnitts (siehe Kapitel [8])
ausdrücken.
Auftreten bei Pflanzen
Schon vor mehr als 2000 Jahren ist Beobachtern aufgefallen, dass
Fibonacci-Zahlen im Pflanzenreich sehr häufig auftreten. So haben zum
Beispiel viele Blütenpflanzen – vor allem in der Familie der Korbblütler, zu
der auch das Gänseblümchen gehört – eine Fibonacci-Zahl an
Blütenblättern. Ringelblumen haben in der Regel 13 Blütenblätter, Astern
21. Viele Vertreter der Gänseblümchengattung haben 34 Blütenblätter;
wenn nicht, sind es gewöhnlich 55 oder 89. Sonnenblumen haben in der
Regel 55, 89 oder 144 Blütenblätter.
Andere Zahlen tauchen ebenfalls auf, wenn auch seltener: So haben
Fuchsien beispielsweise 4 Blütenblätter. Bei diesen Ausnahmen kommt
häufig die Lucas-Folge 4, 7, 11, 18 und 29 ins Spiel, deren Glieder genauso
wie die der Fibonacci-Folge gebildet werden, die aber mit 1 und 3 startet.
Auf einige Beispiele werden wir später noch zurückkommen.
Dieselben Zahlen tauchen auch bei einer ganzen Reihe anderer
Pflanzenmerkmale auf. Eine Ananasfrucht weist auf ihrer Oberfläche ein
annähernd hexagonales Muster auf; diese Sechsecke sind individuelle
Früchte, die beim Heranwachsen miteinander verschmelzen. Gemeinsam
bilden sie zwei ineinandergreifende Spiralenfamilien. Eine Familie verläuft,
von oben gesehen, gegen den Uhrzeigersinn und enthält 8 Spiralen, die
andere Familie im Uhrzeigersinn und enthält 13 Spiralen. Es ist auch
möglich, eine dritte Familie mit 5 Spiralen auszumachen, die in einem
flacheren Winkel im Uhrzeigersinn verläuft.
Abbildung 104: Links: Drei Familien von Spiralen auf einer Ananasfrucht. Rechts: Familie
von 13 gegen den Uhrzeigersinn verlaufenden Spiralen auf einem Kieferzapfen.
Der Schlüssel zur Geometrie der Sonnenblumenspiralen ist der Goldene
Schnitt, der seinerseits wiederum das Auftreten der Fibonacci-Zahlen
erklärt. Man teile einen Vollkreis (360°) in zwei Kreisbögen, die im
Verhältnis des Goldenen Schnitts zueinander stehen, sodass der vom
größeren Bogen bestimmte Winkel φ-mal so groß ist wie der vom kleineren
Bogen bestimmte Winkel. Dann ist der kleinere Bogen
-mal
kleiner als ein Vollkreis. Dieser Winkel, der als Goldener Winkel bezeichnet
wird, hat ungefähr eine Größe von 137,5°.
Im Jahr 1868 beobachtete der deutsche Botaniker Wilhelm Hofmeister,
wie sich die Schösslinge einer jungen Pflanze im Lauf ihres Wachstums
verändern, und legte die Grundlagen für alle weiteren Forschungen auf
diesem Gebiet. Das Grundmuster der Entwicklung wird davon bestimmt,
was in dem sich teilenden Gewebe an der Spitze der Pflanze passiert. Dabei
handelt es sich um Zellansammlungen, sogenannten Organanlagen
(Primordien), aus denen sich zum Beispiel die Samen entwickeln.
Hofmeister entdeckte nun, dass aufeinanderfolgende Primordien auf einer
Spirale liegen. Jede dieser Anlagen ist von der davor liegenden Anlage
durch den Goldenen Winkel A getrennt, daher ist der n-te Samen gegenüber
dem ersten um einen Winkel nA verschoben. Die Entfernung vom Zentrum
ist der Quadratwurzel von n proportional.
Abbildung 105: Fibonacci-Spiralen auf dem Blütenboden einer Sonnenblume. Links:
Anordnung der Samen («Sonnenblumenkerne»). Rechts: Vertreter zweier Familien von
Spiralen: im Uhrzeigersinn (hell) und gegen den Uhrzeigersinn (dunkel).
Diese Beobachtung erklärt das Muster der Sonnenblumenkerne auf dem
Blütenboden einer Sonnenblume. Man erhält es, wenn man die
aufeinanderfolgenden Kerne so gegeneinander versetzt, dass die Winkel
ganzzahlige Vielfache des Goldenen Winkels bilden. Die Entfernung vom
Mittelpunkt sollte dann proportional zur Quadratwurzel des betreffenden
Vielfachen sein. Wenn wir den Goldenen Winkel A nennen, dann folgen die
Kerne im Winkel von
aufeinander, und die Entfernung zum Zentrum ist proportional zu
Bei Blüten von Korbblütlern wie Gänseblümchen bilden sich die
Blütenblätter am äußeren Ende einer der Familien von Spiralen. Daher zieht
eine Fibonacci-Zahl von Spiralen eine Fibonacci-Zahl an Blütenblättern
nach sich. Aber warum entspricht die Anzahl der Spiralen einer FibonacciZahl?
Das liegt am Goldenen Winkel.
Abbildung 106: Platzierung aufeinanderfolgender Kerne bei Winkeln von 137°, 137,5° und
138°. Nur beim Goldenen Winkel liegen die Kerne dicht gepackt.
Im Jahr 1979 benutzte Helmut Vogel die geometrische Anordnung von
Sonnenblumenkernen, um zu erklären, warum dabei der Goldene Winkel
auftritt. Er zeigte, was mit den Sonnenblumensamen passieren würde, wenn
man dieselbe Spiralanordnung zugrunde legt, den Goldenen Winkel von
137,5° jedoch leicht verändert. Nur der Goldene Winkel führt zu eng
gepackten Kernen, die weder Lücken lassen noch einander überlappen.
Selbst eine Veränderung des Winkels um nur ein Zehntelgrad führt dazu,
dass das Muster in einzelne Spiralfamilien aufbricht und zwischen den
Kernen Lücken bleiben. Das erklärt, warum der Goldene Winkel eine
Sonderstellung einnimmt und es sich nicht nur um einen numerischen
Zufall handelt.
Eine umfassende Erklärung geht jedoch noch tiefer. Wenn die Zellen
wachsen und sich bewegen, entstehen Kräfte, die sich auf die
Nachbarzellen auswirken. Im Jahr 1992 untersuchten die Physiker Stéphane
Douady und Yves Couder die Mechanismen solcher Systeme experimentell
und anhand von Computersimulationen. Sie fanden, dass sich die Winkel
zwischen aufeinanderfolgenden Samen dem Goldenen Winkel annähern wie
das Verhältnis aufeinanderfolgender Fibonacci-Zahlen dem Goldenen
Schnitt.
Ihre Theorie erklärt auch das sonderbare Auftreten von Nicht-FibonacciZahlen, wie die vier Blütenblätter der Fuchsie. Diese Ausnahmen basieren
auf einer Folge, die der Fibonacci-Folge sehr ähnlich ist und als LucasFolge bezeichnet wird:
Die Formel für diese Gleichung lautet
was stark an die Formel für die Fibonacci-Folge erinnert, die wir ein paar
Seiten zuvor besprochen haben.
Die vier Blütenblätter der Fuchsie sind ein Beispiel für eine Lucas-Zahl
von Blütenblättern. Einige Kakteen zeigen ein Muster von 4 Spiralen in der
einen und 7 Spiralen in der anderen Richtung, oder auch 11 in der einen und
18 in der anderen. Eine Art der Kakteengattung Echinocactus weist
29 Rippen auf. Bei Sonnenblumen hat man Gruppen von 47 und
76 Spiralen gefunden.
Eine der wichtigsten Gebiete der angewandten Mathematik ist die
Elastizitätstheorie, die untersucht, wie sich Materialien verformen, wenn sie
Kräften ausgesetzt sind. Diese Theorie erklärt zum Beispiel, wie sich
Metallträger oder -platten in Gebäuden und Brücken verhalten. Im Jahr
2004 wendeten Patrick Shipman und Alan Newell die Elastizitätstheorie an,
um das Heranwachsen eines Pflanzenschösslings zu simulieren, wobei sie
sich vor allem auf Wachstum und Anordnung der Höcker konzentrierten,
aus denen später die Kakteenstacheln hervorgehen. Sie stellten die Bildung
von Organanlagen im Modell als Faltenbildung an der Wachstumsspitze des
Schösslings dar und zeigten, dass dies zu einander überlagernden Mustern
paralleler Wellen führt. Diese Muster werden von zwei Faktoren bestimmt:
Wellenzahl und Wellenrichtung. Für die wichtigsten Muster spielen die
Wechselbeziehungen zwischen drei solcher Wellen eine entscheidende
Rolle, und die Wellenzahl für eine dieser Wellen muss gleich der Summe
der beiden anderen Wellenzahlen sein. Die Spiralen auf der
Ananasoberfläche sind ein gutes Beispiel; ihre Wellenzahlen betragen 5, 8
und 13. Mit ihrer Theorie können die beiden Physiker die Fibonacci-Zahlen
unmittelbar auf die Arithmetik von Wellenmustern zurückführen.
Wie steht es mit der dahinter steckenden Biochemie? Die Bildung von
Organanlagen (Primordien) wird von einem pflanzlichen
Wachstumshormon namens Auxin vorangetrieben. Und ähnliche
Wellenmuster wie oben beschrieben treten bei der Auxinverteilung auf.
Daher steckt hinter einer vollständigen Erklärung von Fibonacci-Zahlen
und Goldenem Schnitt ein Wechselspiel zwischen Biochemie,
mechanischen Kräften, die zwischen Zellen wirken, und Geometrie. Auxin
stimuliert das Wachstum von Primordien. Diese Primordien üben
mechanische Kräfte aufeinander aus. Und diese Kräfte schaffen die
Geometrie. Entscheidend ist, dass die Geometrie wiederum die Biochemie
beeinflusst, indem sie an bestimmten Stellen die Produktion von
zusätzlichem Auxin anregt. Daher existiert an dieser Stelle ein komplexes
Geflecht von Rückkopplungsschleifen zwischen Biochemie, Mechanik und
Geometrie.
Natürliche Logarithmen
Nach π ist die nächste wirklich eigentümliche Zahl, auf die wir –
gewöhnlich in der Differenzial- und Integralrechnung – stoßen, die Zahl e,
wobei e für «exponentiell» steht. Erstmals wurde e 1683 von Jacob
Bernoulli diskutiert. Diese Zahl tritt bei Zinseszinsproblemen auf, führte zu
Logarithmen und sagt uns, in welcher Weise Variablen wie Temperatur,
Radioaktivität oder die Weltbevölkerung zunehmen oder abnehmen. Euler
verknüpfte e mit π und i.
Zinsen
Falls wir uns Geld leihen oder es anlegen, müssen wir in der Regel Zinsen
auf die Kreditsumme zahlen bzw. erhalten Zinsen auf unser Kapital. Wenn
wir beispielsweise 100 Euro mit einem Zinssatz von 10 Prozent pro Jahr
anlegen, erhalten wir nach einem Jahr 110 Euro zurück. Natürlich
erscheinen 10 Prozent Kapitalzinsen in der gegenwärtigen Finanzkrise
unrealistisch hoch, doch gleichzeitig unrealistisch niedrig, wenn es sich um
Kreditzinsen handelt, vor allem um solche für Überbrückungskredite mit
astronomisch hohem Effektivzins. Aber sei es, wie es wolle, es ist ein
praktischer Prozentsatz, um diese Art von Rechnung zu illustrieren.
Oft geht es bei Krediten oder Kapitalanlagen nicht um einfache
Zinsrechnung, sondern um Zinseszinsrechnung. Das heißt, die Zinsen
werden zu der ursprünglichen Summe dazuaddiert und die Zinsen dann auf
die so entstandene neue Gesamtsumme gezahlt. Bei einem Zinseszinssatz
von 10 Prozent und einer Zinseszinsrechnung betragen die Zinsen auf diese
100 Euro im Verlauf des zweiten Jahres 11 Euro, während die Zinsen für
die ursprüngliche Summe nur 10 Euro betrügen. Daher hätten wir nach
zwei Jahren Zinseszins 121 Euro. Im dritten Jahr Zinseszins kämen
12,10 Euro hinzu, insgesamt wären es also 133,10 Euro, und im vierten Jahr
würde die Summe auf insgesamt 146,41 Euro steigen.
Die mathematische Konstante, die als e bekannt ist, taucht auf, wenn wir
uns einen Zinssatz von 100 Prozent vorstellen, sodass sich unser Kapital
nach einem bestimmten festgelegten Zeitraum (sagen wir, nach einem
Jahrhundert) verdoppelt. Für jeden Euro, den wir investieren, erhalten wir
nach dieser Zeitspanne 2 Euro zurück.
Angenommen, statt eines Zinssatzes von 100 Prozent über ein
Jahrhundert wenden wir einen Zinssatz von 50 Prozent (halb so viel) auf ein
halbes Jahrhundert (zweimal so oft) an und zinsen dies auf. Nach einem
halben Jahrhundert beträgt unser Vermögen in Euro
Nach der zweiten Hälfte besitzen wir
Daher wächst unser Vermögen schneller. Wenn wir das Jahrhundert in drei
gleich lange Zeiträume teilen und den Zinssatz durch 3 teilen, würde unser
einer Euro, auf zehn Dezimalstellen genau, so wachsen:
Das ist ein noch schnelleres Wachstum als zuvor.
Die obigen Zahlen bilden ein Muster:
Mathematiker fragten sich, was wohl geschehen würde, wenn man den
Zinssatz kontinuierlich anwenden würde – das heißt, über immer kleinere
Teile der Gesamtperiode. Nun lässt sich das Muster so beschreiben: Wenn
wir den Zeitraum in n gleiche Teile teilen und unser Zinssatz
beträgt,
dann besäßen wir am Ende des Verzinsungszeitraums einen Betrag von
Ein kontinuierlicher Zinseszins entspricht einem Verfahren, bei dem n
außerordentlich groß wird. Lassen Sie uns daher einige Berechnungen
durchführen, wiederum auf zehn Dezimalstellen genau:
n
2
2,500000000
3
2,3703703704
4
2,4414062500
5
2,4883200000
10
2,5937424601
100
2,7048138294
1000
2,7169239322
10 000
2,7181459268
100 000
2,7182682372
1 000 000
2,7182816925
10 000 000
2,7182816925
Tabelle 10
Wir müssen sehr große Werte für n nehmen, um das Muster zu erkennen,
doch es sieht so aus, als würde der Ausdruck
einem
Grenzwert zustreben und bei sehr stark wachsendem n letztlich immer
näher an eine feste Zahl heranrücken, die annähernd gleich 2,171828 ist.
Das ist auch tatsächlich der Fall, und Mathematiker definieren eine
spezielle Zahl namens e als diesen Grenzwert:
wobei das Symbol lim (von lateinisch limes, Grenze) so viel bedeutet wie
«Lassen wir n unendlich groß werden und schauen wir, auf welchen Wert
der Ausdruck zustrebt». Auf 100 Dezimalstellen genau gilt
Bei e handelt es sich um eine weitere dieser eigenartigen Zahlen, die wie π
eine Dezimalentwicklung haben, welche ewig weiterläuft, aber niemals
denselben Ziffernblock unablässig wiederholt. Das heißt, e ist irrational
(siehe Kapitel [
], [π]). Im Gegensatz zu π ist leicht zu beweisen, dass
e irrational ist; Euler entdeckte den Beweis 1737, veröffentlichte ihn jedoch
erst sieben Jahre später.
Im Jahr 1748 berechnete Euler die ersten 23 Nachkommastellen von e,
und eine Reihe späterer Mathematiker verbesserten sein Ergebnis. Bis 2010
war es Shigeru Kondo und Alexander Yee schließlich gelungen, mit Hilfe
eines schnellen Computers und eines verbesserten Verfahrens die erste
Billion Dezimalstellen von e zu bestimmen.
Natürliche Logarithmen
Im Jahr 1614 schrieb John Napier, achter Laird of Merchistoun (heute
Merchiston, Teil der schottischen Stadt Edinburgh) ein Buch mit dem Titel
Mirifici Logarithmorum Canonis Descriptio (Beschreibung des
wundervollen Grundprinzips der Logarithmen). Offenbar hat er den Begriff
«Logarithmus» selbst geprägt, abgeleitet vom griechischen logos
«Verständnis, Lehre, Verhältnis» und arithmos, «Zahl». Seine Idee stellte er
so vor:
«Nichts, meine werten Kollegen, ist beim Ausüben der Mathematik
so lästig wie jene Eintönigkeit, die sich einstellt bei der
Multiplikation und Division von großen Zahlen, beim Ziehen von
Quadrat- und Kubikwurzeln. Nicht nur den damit verbundenen
Zeitaufwand möge man bedenken, sondern auch das Ärgernis
durch die vielen kleinen Flüchtigkeitsfehler, die hierbei entstehen
können. Daher habe ich darüber nachgedacht, wie ich auf
schnellem und sicherem Wege hinsichtlich besagter Misslichkeiten
für eine Verbesserung sorgen könnte. Schließlich habe ich nach
langem Grübeln einen erstaunlichen Weg gefunden, um dieses
Prozedere abzukürzen … Es ist mir eine angenehme Aufgabe,
Mathematikern diese Methode für den allgemeinen Gebrauch zu
erläutern.»
Napier wusste aus eigener Erfahrung, dass viele wissenschaftliche
Probleme, vor allem in der Astronomie, das Multiplizieren komplizierter
großer Zahlen oder auch das Ziehen von Quadrat- und Kubikwurzeln
erforderten. In einer Zeit, in der es keine Elektrizität gab, geschweige denn
Computer, mussten sämtliche Berechnungen per Hand vorgenommen
werden. Zwei Dezimalzahlen zu addieren, war noch einigermaßen simpel,
aber sie zu multiplizieren, war schon deutlich zeitaufwendiger. Daher
erfand Napier eine Methode, um Multiplikationen in Additionen zu
verwandeln. Der Trick bestand darin, mit den Potenzen einer festen Zahl zu
arbeiten.
In der Algebra werden die Potenzen einer unbekannten Größe x durch
2
3
eine kleine hochgestellte Zahl angezeigt. Das heißt, xx = x , xxx = x , xxxx =
4
x und so weiter, wobei das Nebeneinanderstellen zweier Buchstaben
bedeutet, dass beide miteinander multipliziert werden sollen. Beispielsweise
3
4
ist 10 = 10 × 10 × 10 = 1000, und 10 = 10 × 10 × 10 × 10 = 10000.
Zwei derartige Ausdrücke miteinander zu multiplizieren, ist einfach.
4
3
Stellen Sie sich zum Beispiel vor, wir wollten das Ergebnis von 10 × 10
finden. Wir schreiben
Die Zahl der Nullen in der Antwort beträgt 7, was gleich 4 + 3 ist. Der erste
Schritt in der Berechnung zeigt, warum das so ist: Wir platzieren vier
Zehner und 3 Zehner nebeneinander. Daher ist
In derselben Weise gilt: Welchen Wert auch immer x annimmt, wenn wir
seine a-te Potenz mit seiner b-ten Potenz multiplizieren, wobei a und b
ganze Zahlen sind, erhalten wir die (a + b)-te Potenz:
Das ist interessanter, als es auf den ersten Blick scheinen mag, denn
während auf der linken Seite zwei Größen miteinander multipliziert
werden, werden auf der rechten Seite lediglich a und b addiert werden, was
deutlich einfacher ist.
In der Lage zu sein, ganzzahlige Potenzen von 10 zu multiplizieren, ist
kein besonders großer Fortschritt. Dasselbe Prinzip lässt sich jedoch auch
auf schwierigere Berechnungen ausdehnen.
Angenommen, wir wollen 1,484 mit 1683 multiplizieren. Durch
Ausmultiplizieren erhält man 2,497572, was, auf drei Nachkommastellen
a b
a+b
gerundet, 2,498 ergibt. Stattdessen können wir auch die Formel x x = x
benutzen, indem wir x geeignet wählen. Wenn wir x gleich 1,001 setzen,
dann zeigt ein wenig Arithmetik, dass
ist, jeweils korrekt auf drei Nachkommastellen. Dann sagt uns die Formel,
dass 1,484 × 1,683 gleich
ist, was, auf drei Nachkommastellen genau, 2,498 ergibt. Nicht schlecht!
Das Kernstück der Berechnung ist eine einfache Addition: 395 + 521 =
916. Auf den ersten Blick scheint es jedoch so, als verkompliziere diese
395
Methode das Problem. Um das Ergebnis von 1001
herauszufinden, muss
man 1001 zunächst 395 Mal mit sich selbst multiplizieren, und dasselbe gilt
für die beiden anderen Potenzen. Daher scheint das Ganze wirklich
verlorene Liebesmüh zu sein. Napiers Geistesblitz war zu erkennen, dass
dieser Einwand nicht sticht. Aber um ihn aus dem Weg zu räumen, muss
irgendjemand eine wahre Sisyphusarbeit erledigen und eine ganze Menge
2
Potenzen von 1001 berechnen, beginnend mit 1001 und fortlaufend bis zu,
10 000
sagen wir, 1001
. Wenn man eine Tabelle mit diesen Potenzen
veröffentlicht, steckt die ganze Arbeit da schon drin. Dann muss man nur
noch mit dem Finger die Reihen mit den sukzessiven Potenzen
entlangfahren, bis man 1,484 neben 395 und auf dieselbe Weise 1,683
neben 521 findet. Anschließend addiert man diese beiden Zahlen und erhält
921. Die korrespondierende Reihe der Tabelle sagt uns dann, dass diese
Potenz von 1001 gleich 2,498 ist. Aufgabe gelöst.
Im Kontext dieses Beispiels sagen wir, dass die Potenz 395 der
Logarithmus der Zahl 1,484 und 521 der Logarithmus der Zahl 1,683 ist.
Entsprechend ist 916 der Logarithmus ihres Produkts 2,498. Wenn wir ‹log›
als Abkürzung für Logarithmus benutzen, führt uns das, was wir gerade
gemacht haben, zu der Gleichung
was für alle beliebigen Zahlen a und b gilt. Die recht willkürlich gewählte
Zahl 1001 wird als Basis bezeichnet. Wenn wir eine andere Basis benutzen,
sind die Logarithmen, die wir berechnen, ebenfalls andere, aber für jede
feste Basis funktioniert alles in der gleichen Weise.
Briggs’ Verbesserung
Das ist es, was Napier hätte tun sollen, doch aus unerfindlichen Gründen
wählte er einen etwas anderen und nicht ganz so bequemen Weg. Ein
Mathematiker namens Henry Briggs war begeistert von dem Durchbruch,
der Napier gelungen war. Aber als typischer Vertreter seiner Zunft war die
Tinte auf dem Papier kaum getrocknet, als er sich schon zu fragen begann,
ob es nicht eine Möglichkeit gäbe, die ganze Sache zu vereinfachen. Und
die gab es tatsächlich. Als Erstes schrieb er Napiers Idee so um, dass sie in
der Weise funktionierte, die ich gerade beschrieben habe. Anschließend
stellte er fest, dass die Benutzung von Potenzen einer Zahl wie 1001 darauf
hinausläuft, Potenzen dieser speziellen Zahl e (bzw. einer Näherung an e)
zu verwenden.
1000
Die 1000. Potenz 1001
ist gleich
, und das
muss aufgrund der Definition von e nahe an e liegen. Setzen Sie nur einmal
n = 1000 in die Formel
können wir schreiben:
1000
ein. Statt daher zu schreiben
1000
Nun liegt 1,001
sehr nahe bei e, daher kann man in vernünftiger
Näherung schreiben:
Um genauere Ergebnisse zu erzielen, benutzen wir Potenzen einer Zahl, die
1000000
deutlich näher an 1 liegt, zum Beispiel 1,000001. Nun liegt 1,000001
noch näher an e. Das macht die Tafel mit rund einer Million Potenzen
natürlich beträchtlich größer. Diese Tafel zu berechnen, ist eine
Mordsarbeit – aber diese Arbeit muss nur ein einziges Mal durchgeführt
werden. Wenn jemand diese Mühe auf sich nimmt, spart er damit
nachfolgenden Generationen eine gigantische Menge an Rechnerei. Und es
ist nicht besonders schwierig, eine Zahl mit 1,000001 zu multiplizieren.
Man muss nur wie ein Luchs aufpassen, um keinen Fehler zu machen.
Diese Version von Briggs’ Verbesserung lief darauf hinaus, den
natürlichen Logarithmus einer Zahl als die Potenz zu definieren, zu der e
erhoben werden muss, um diese Zahl zu ergeben. Das heißt,
für jedes beliebige x. Nun ist
und eine Tafel mit natürlichen Logarithmen reduziert, einmal berechnet,
jedes beliebige Multiplikationsproblem auf ein Additionsproblem.
Das Verfahren lässt sich für praktische Berechnungen sogar noch stärker
vereinfachen, wenn wir e durch 10 ersetzen, sodass 10
log x
= x wird. Nun
erhalten wir Logarithmen zur Basis 10, geschrieben log10x. Der
entscheidende Punkt ist, dass nun log10 10 = 1 ist, log10 100 = 2, und so
weiter. Sobald man einmal die Logarithmen zur Basis 10 der Zahlen
zwischen 1 und 10 kennt, lassen sich alle anderen Logarithmen leicht
finden. Zum Beispiel:
und so weiter.
Logarithmen zur Basis 10 (auch kurz Zehnerlogarithmen genannt) sind
für normale arithmetische Berechnungen praktischer, weil wir im
Allgemeinen das Zehnersystem benutzen. In der höheren Mathematik gilt
die 10 jedoch nicht als etwas so Besonderes. Wir könnten auch jede andere
Zahl als Basis für unsere Notation gebrauchen. Wie sich herausgestellt hat,
spielen Briggs’ natürliche Logarithmen zur Basis e für die höhere
Mathematik eine wichtigere Rolle als Zehnerlogarithmen.
Von den vielen Eigenschaften von e möchte ich an dieser Stelle nur eine
erwähnen: Die Zahl taucht in der Stirling-Formel zur näherungsweisen
Berechnung von Fakultäten auf, die sehr nützlich ist, wenn n groß wird:
Exponentielles Wachstum und exponentielles Abklingen
Die Zahl e taucht überall in den Naturwissenschaften auf, denn sie bildet
die Grundlage sämtlicher natürlicher Prozesse, bei denen die Wachstumsoder Abklingrate einer Größe zu jedem beliebigen Zeitpunkt proportional
zur Menge der Größe zu diesem Zeitpunkt ist. Wenn man die Rate, mit der
sich die Größe x verändert, x' nennt, lässt sich ein solcher Prozess durch
eine Differenzialgleichung beschreiben:
wobei k eine Konstante ist. Nach den Regeln der Differentialrechnung
lautet die Lösung
zum Zeitpunkt t, wobei x0 der Anfangswert zum Zeitpunkt t = 0 ist.
kt
Abbildung 107: Links: Exponentielles Wachstum e für k = 0,1 (unterste Kurve); 0,2; …, 1
–kt
(obere Kurve). Rechts: Exponentielles Abklingen e
(unterste Kurve).
Exponentielles Wachstum
k
für k = 0,1 (obere Kurve); 0,2; …, 1
kt
Wenn k positiv ist, wächst x0e mit steigendem t immer schneller: Das
nennt man exponentielles Wachstum.
Nehmen wir zum Beispiel an, x sei die Größe einer tierischen Population.
Wenn die Tiere über unbegrenzte Ressourcen verfügen, wächst die
Population mit einer Rate, die proportional zu ihrer Größe ist, daher ist das
exponentielle Modell anwendbar. Schließlich wächst die Population auf
eine unrealistische Größe an. In der Praxis ist es jedoch so, dass den Tieren
die Nahrung, der Lebensraum oder irgendeine andere Ressource ausgeht,
sodass die Größe der Population begrenzt wird, und man muss ein
komplexeres Modell benutzen. Dieses einfache Modell hat jedoch den
Vorteil zu zeigen, dass uneingeschränktes Wachstum mit konstanter
Zuwachsrate im Endeffekt unrealistisch ist.
Die menschliche Bevölkerung ist im größten Teil der aufgezeichneten
Geschichte mehr oder minder exponentiell gewachsen, doch es gibt
Anzeichen, die dafür sprechen, dass diese Wachstumsrate seit etwa 1980
abgenommen hat. Wenn nicht, stehen uns große Schwierigkeiten bevor.
Vorhersagen über die zukünftige Populationsentwicklung gehen davon aus,
dass sich dieser Trend fortsetzen wird, doch selbst dann ist die Unsicherheit
beträchtlich. Schätzungen der Vereinten Nationen für das Jahr 2100
schwanken zwischen 6 Milliarden (weniger als die gegenwärtige
Weltbevölkerung von 7,2 Milliarden) und 16 Milliarden (mehr als das
Doppelte der gegenwärtigen Weltbevölkerung).
Abbildung 108: Wachstum der Weltbevölkerung.
Exponentielles Abklingen
kt
Wenn k negativ ist, geht x0e mit steigendem t immer schneller zurück: Das
bezeichnet man als exponentielles Abklingen oder als exponentiellen Abfall.
Zu den bekannten Beispielen gehören das Abkühlen eines heißen
Körpers und der radioaktive Zerfall. Radioaktive Elemente wandeln sich
durch Vorgänge im Atomkern in andere Elemente um, wobei Kernteilchen
in Form von Strahlung frei werden. Das Niveau der Radioaktivität geht mit
der Zeit exponentiell zurück. Daher folgt der Radioaktivitätspegel x(t) zum
Zeitpunkt t der Gleichung
wobei x0 das Anfangsniveau und k eine positive Konstante ist, die von dem
betreffenden Element abhängt.
Ein praktisches Maß für einen Zeitraum, in dem die Radioaktivität
anhält, ist die sogenannte Halbwertszeit, ein Konzept, das 1907 eingeführt
wurde. Das ist die Zeit, in der die Radioaktivität von einem Anfangswert x0
auf die Hälfte zurückgeht. Angenommen, die Halbwertszeit beträgt
beispielsweise 1 Woche. Dann halbiert sich die ursprüngliche Radioaktivität
und auch die Rate, mit der das Material radioaktive Strahlung emittiert,
nach 1 Woche, ist nach 2 Wochen auf ein Viertel gesunken, nach 3 Wochen
auf ein Achtel, und so weiter. Die Radioaktivität benötigt 10 Wochen, um
auf ein Tausendstel des ursprünglichen Niveaus abzufallen (genauer ), und
20 Wochen, um auf ein Millionstel zurückzugehen.
Um die Halbwertszeit zu berechnen, lösen wir die Gleichung
indem wir beide Seiten logarithmieren. Das Ergebnis ist
Die Konstante k lässt sich experimentell bestimmen.
Die wichtigsten radioaktiven Produkte, die bei Unfällen aus modernen
Kernreaktoren freigesetzt werden, sind Jod-131 und Caesium-137. Ersteres
kann zu Schilddrüsenkrebs führen, weil sich in der Schilddrüse radioaktives
Jod ansammelt. Die Halbwertszeit von Jod-131 beträgt nur 8 Tage, daher
richtet es nur wenig Schaden an, wenn die richtige Medikation
(hauptsächlich Jodtabletten) zur Verfügung steht. Caesium-137 hat eine
Halbwertszeit von 30 Jahren, daher dauert es fast 200 Jahre, bis das
Radioaktivitätsniveau auf ein Hundertstel des Anfangswertes fällt. Aus
diesem Grund bleibt radioaktives Caesium, wenn es nicht beseitigt werden
kann, sehr lange Zeit ein Gesundheitsrisiko.
Verbindung zwischen e und π (Euler’sche Formel)
Im Jahr 1748 stieß Leonhard Euler auf eine bemerkenswerte Beziehung
zwischen e und π, von der man oft sagt, sie habe zur wunderbarsten
Gleichung in der gesamten Mathematik geführt. Mit von der Partie ist auch
die imaginäre Zahl i. Die Formel lautet:
Diese Formel lässt sich anhand einer überraschenden Verbindung zwischen
komplexen Exponentialfunktionen und trigonometrischen Funktionen
erklären, nämlich
was sich am einfachsten mit Methoden der Differenzial- und
Integralrechnung beweisen lässt. In diesem Fall wird der Winkel θ im
Bogenmaß gemessen, einer Einheit, bei der die vollen 360° eines Kreises
gleich 2π rad gesetzt werden – rad steht dabei für Radiant, den Umfang
eines Kreises vom Radius 1. Das Bogenmaß ist Standard in der höheren
Mathematik, denn es vereinfacht sämtliche Formeln. Um die Euler’sche
Formel herzuleiten, setzen wir θ = π. Dann ist cos π = –1, sin π = 0, und
iπ
daraus folgt, dass e = cos π + i sin π = –1 + i × 0 = –1 ist.
Ein alternativer Beweis, der die Theorie der Differenzialgleichungen
benutzt, führt die Gleichung auf die Geometrie der komplexen Ebene
zurück und hat den Vorteil, dass er erklärt, wie π in die ganze Sache
hineinkommt. Hier ein Kurzabriss: Eulers Formel funktioniert, weil eine
Multiplikation komplexer Zahlen mit i die komplexe Ebene um einen
rechten Winkel dreht.
Im Bogenmaß, das Mathematiker für theoretische Untersuchungen
benutzen – hauptsächlich deshalb, weil es Differenzial- und
Integralgleichungen vereinfacht –, ist ein Winkel durch die Länge des
korrespondierenden Kreisbogens eines Einheitskreises definiert. Da der
Einheitshalbkreis die Länge π hat, ist ein rechter Winkel gleich
rad. Mit
Hilfe von Differenzialgleichungen lässt sich nun zeigen, dass für jede reelle
ix
Zahl x eine Multiplikation mit der komplexen Zahl e die komplexe Ebene
um x rad rotieren lässt. Insbesondere wird die komplexe Ebene durch eine
Multiplikation mit
um einen rechten Winkel gedreht. Aber genau diese
Drehung ist es, die i bewirkt, und deshalb ist
Durch Quadrieren beider Seiten erhalten wir die Euler’sche Formel.
Fraktale
ist wirklich ein seltsamer Bruch, aber er definiert eine
Grundeigenschaft des Sierpiński-Dreiecks (auch Sierpiński-Fläche oder
Sierpiński-Dichtung genannt) und legt fest, wie stark geschlängelt oder rau
Sierpińskis berühmte pathologische Kurve ist. Themen wie diese tauchen in
der fraktalen Geometrie auf, eine neue Möglichkeit, komplexe Formen in
der Natur nachzubilden. In diesem Zusammenhang verallgemeinert die
fraktale Geometrie das Konzept der Dimension. Eines der berühmtesten
Fraktale, die Mandelbrot-Menge, ist eine unendlich komplexe Form, die
durch einen sehr einfachen Prozess definiert wird.
Fraktale
Das Sierpiński-Dreieck (siehe Kapitel [
]) gehört zu einer kleinen
Palette von Beispielen, die Anfang des 20. Jahrhunderts entdeckt wurden
und damals den recht negativen Beinamen «pathologische Kurven»
erhielten. Dazu gehören die Schneeflockenkurve von Helge von Koch wie
auch die raumfüllenden Kurven von Giuseppe Peano und David Hilbert.
Abbildung 109: Links: Schneeflockenkurve. Rechts: Aufeinander folgende Stadien bei der
Konstruktion von Hilberts raumfüllender Kurve.
Damals waren solche Kurven etwas für Kenner: Gegenbeispiele für mehr
oder weniger plausible mathematische Behauptungen, die tatsächlich falsch
waren. Die Schneeflockenkurve ist stetig, aber nirgendwo differenzierbar,
das heißt, sie weist keine Sprünge auf, ist aber überall gezackt. Sie hat eine
unendliche Länge, schließt aber eine endliche Fläche ein. Die
raumfüllenden Kurven sind nicht nur sehr dicht, sondern sie füllen
tatsächlich den Raum. Wenn man die Konstruktion unendlich oft
durchführt, laufen die resultierenden Kurven buchstäblich durch jeden
Punkt im Inneren eines quadratischen Körpers.
Einige stärker konservativ geprägte Mathematiker verspotteten solche
Kurven als intellektuell unergiebig. Hilbert gehörte zu den wenigen
führenden Wissenschaftlern seiner Zeit, die die Bedeutung dieser Kurven
erkannten, da sie dazu beitrugen, die Mathematik präzise zu machen und
ihre logische Basis zu beleuchten. Daher setzte er sich nachdrücklich dafür
ein, ihre seltsamen Eigenschaften ernst zu nehmen.
Heute sehen wir diese Kurven in einem positiveren Licht: Es waren die
ersten Schritte, die auf ein neues Gebiet der Mathematik führten: die
fraktale Geometrie, deren Pionier Benoît Mandelbrot in den 1970er Jahren
wurde. Pathologische Kurven wurden aus rein mathematischen Gründen
entwickelt, doch Mandelbrot erkannte, dass ähnliche Formen Licht auf
unregelmäßige Strukturen in der natürlichen Welt werfen können. Er wies
darauf hin, dass Dreiecke, Quadrate, Kreise, Kegel, Kugeln und andere
traditionelle Formen der euklidischen Geometrie keine Feinstruktur
aufweisen. Wenn man einen Kreis genügend vergrößert, sieht das Ergebnis
wie eine merkmalslose Gerade aus. Viele Formen in der Natur weisen
jedoch bei starker Vergrößerung ein höchst komplexes «Innenleben» auf.
Mandelbrot schrieb: «Wolken sind keine Kugeln, Berge keine Kegel,
Küstenlinien keine Kreise. Baumrinde ist nicht glatt – und auch der Blitz
bahnt sich seinen Weg nicht gerade.» Das war jedermann bekannt, doch
Mandelbrot verstand als Erster die Bedeutung dieser Erkenntnis.
Er wollte damit nicht sagen, dass die euklidischen Formen nutzlos sind.
Sie spielen in den Naturwissenschaften eine herausragende Rolle. So sind
Planeten beispielsweise annähernd kugelförmig, und frühe Astronomen
benutzten dies als nützliche Näherung. Eine bessere Näherung erhält man,
wenn die Kugel zu einem Ellipsoid zusammengedrückt wird – wiederum
eine einfache euklidische Form. Für manche Zwecke sind einfache Formen
jedoch nicht besonders hilfreich. Die Äste von Bäumen verzweigen sich in
immer dünnere Triebe, Wolken sind unregelmäßig geformte rundliche
Gebilde, Berge sind gezackt und Küstenlinien geschlängelt. Um diese
Formen mathematisch zu verstehen und wissenschaftliche Probleme zu
lösen, die damit in Zusammenhang stehen, brauchen wir einen völlig neuen
Ansatz.
Als Mandelbrot über Küstenlinien nachdachte, fiel ihm auf, dass sie auf
Landkarten immer ziemlich ähnlich aussahen, ganz gleich, welchen
Kartenmaßstab man wählt. Eine Karte mit einem großen Maßstab zeigt
mehr Details mit zusätzlichen Schlängelungen, doch das Ergebnis erinnert
stark an eine Küstenlinie auf einer Karte mit einem kleineren Maßstab. Die
genaue Form der Küstenlinie verändert sich, aber die «Beschaffenheit»
bleibt annähernd die gleiche. Tatsächlich verändern sich die meisten
Merkmale einer Küstenlinie – zum Beispiel, welcher Anteil an Buchten
eine bestimmte relative Größe hat – ganz unabhängig vom Maßstab der
Karte, die man benutzt, so gut wie nicht.
Mandelbrot führte den Begriff «Fraktal» ein, um jede beliebige Form zu
beschreiben, die eine komplexe Struktur aufweist, ganz gleich, wie stark
man sie vergrößert. Wenn die Struktur bei schwacher Vergrößerung dieselbe
ist wie bei stärkerer Vergrößerung, bezeichnet man das Fraktal als
selbstähnlich. Wenn sich nur die statistischen Merkmale bei Vergrößerung
so verhalten, spricht man von einer statischen Selbstähnlichkeit. Die
Fraktale, die sich am einfachsten verstehen lassen, sind die selbstähnlichen.
Das Sierpiński-Dreieck (siehe Kapitel [
]) ist ein gutes Beispiel. Es
besteht aus drei Kopien seiner selbst, jede halb so groß wie die
Ausgangsform.
Abbildung 110: Das Sierpiński-Dreieck.
Ein weiteres Beispiel ist die Schneeflockenkurve. Sie lässt sich aus drei
Kopien der Kurve rechts in Abbildung 111 zusammensetzen. Diese
Komponente (wenn auch nicht die ganze Schneeflocke) ist exakt
selbstähnlich. Iterative Stadien in der Konstruktion fügen vier Kopien der
vorangegangenen Stadien zusammen, jede ein Drittel so groß wie die
Ausgangsform. Wenn man diese Iteration unendlich oft wiederholt, erhält
man eine unendlich komplexe Kurve, die sich aus vier Kopien ihrer selbst
aufbaut, von denen jede ein Drittel der jeweils vorhergehenden Größe
aufweist.
Abbildung 111: Die Schneeflockenkurve und iterative Stadien ihrer Konstruktion.
Abbildung 112: Jeder Teil der Kurve, auf das Dreifache der Ausgangsgröße aufgeblasen,
sieht wie die ursprüngliche Kurve aus.
Diese Form ist zu regelmäßig, um eine wirkliche Küstenlinie darzustellen,
doch sie weist annähernd das richtige Maß an «Schlängelung» auf, und
unregelmäßige Kurven, die auf ähnliche Weise erzeugt wurden, jedoch mit
zufälligen Variationen, schauen tatsächlich wie natürliche Küstenlinien aus.
Abbildung 113: Romanesco.
Fraktale sind in der natürlichen Welt weit verbreitet. Oder präziser
ausgedrückt: Auf Formen, die sich durch Fraktale recht gut nachbilden
lassen, trifft man häufig. In der natürlichen Welt gibt es keinerlei
mathematische Objekte; es handelt sich stets lediglich um Konzepte. Eine
Blumenkohlsorte, Romanesco genannt, besteht aus kleinen Röschen, die
alle dieselbe Form haben wie der ganze Blumenkohl. Der
Anwendungsbereich von Fraktalen reicht von der Feinstruktur von
Mineralien bis zur Verteilung der Materie im Universum. Fraktale sind
schon als Antennen für Mobiltelefone, zur Komprimierung riesiger
Datenmengen auf CDs und DVDs und zum Aufspüren von Krebszellen
benutzt worden. Und regelmäßig finden sich neue
Anwendungsmöglichkeiten.
Die fraktale Dimension
Wie stark geschlängelt ein Fraktal ist oder wie effizient es einen Raum füllt,
lässt sich anhand einer Zahl angeben, der sogenannten fraktalen Dimension.
Um diese Größe zu verstehen, wollen wir uns zunächst mit einigen
einfacheren, nicht-fraktalen Formen beschäftigen.
Wenn wir eine Strecke in 5 gleich lange Teile teilen, brauchen wir 5
davon, um die ursprüngliche Strecke wiederherzustellen. Um dasselbe mit
2
einem Quadrat zu tun, brauchen wir 25 Teile, also 5 . Bei Würfeln sind es
3
dann 125 Teile, also 5 .
Abbildung 114: Effekt einer Skalierung auf «Würfel» in 1, 2 und 3 Dimensionen.
Die Potenz von 5, die auftritt, entspricht der Dimension der Form: 1 für eine
Gerade, 2 für ein Quadrat, 3 für einen Würfel. Wenn man die Dimension als
d bezeichnet und wir k Teile der Größe
zusammenfügen müssen, um die
d
ursprüngliche Form wiederherzustellen, dann ist k = n . Wenn man
Logarithmen benutzt (siehe Kapitel [e]) und die Formel nach d auflöst,
erhält man
Diese Formel wollen wir auf das Sierpiński-Dreieck anwenden. Um ein
Dreieck aus kleineren Kopien zusammenzusetzen, brauchen wir k =
3 Teildreiecke, jedes halb so groß wie das Ausgangsdreieck. Daher ist n = 2,
und die Formel lautet
was ungefähr gleich 1,5849 ist. Daher ist die Dimension des SierpińskiDreiecks in diesem speziellen Sinne keine ganze Zahl.
Wenn wir uns Dimensionen in konventioneller Weise als die Zahl der
verfügbaren, voneinander unabhängigen Richtungen im Raum vorstellen,
dann muss eine Dimension eine ganze Zahl sein. Doch wenn es um Fraktale
geht, versuchen wir zu bestimmen, wie unregelmäßig sie sind, wie komplex
sie sind oder wie gut sie den umgebenden Raum füllen – nicht, in wie viele
unabhängige Richtungen sie weisen. Das Sierpiński-Dreieck ist sichtlich
dichter als eine Linie, aber weniger dicht als ein ausgefülltes Quadrat.
Daher sollte die Größe, die wir suchen, irgendwo zwischen 1 (der
Dimension einer Linie) und 2 (der Dimension eines Quadrats) liegen. Und
zweifellos kann es sich nicht um eine ganze Zahl handeln.
Auf dieselbe Weise können wir die fraktale Dimension einer
Schneeflockenkurve bestimmen. Wie zuvor ist es einfacher, mit einem
Drittel der Schneeflockenkurve, mit einer ihrer drei identischen «Kanten»,
zu arbeiten, denn diese ist selbstähnlich. Um eine Kante einer
Schneeflockenkurve aus kleineren Kopien dieser Kante zusammenzufügen,
benötigen wir k = 4 Teile, jedes Teil
so groß, daher ist n = 3. Deshalb
lautet die Formel
was ungefähr 1,2618 ergibt. Wiederum ist die fraktale Dimension keine
ganze Zahl, und wiederum ergibt dies durchaus Sinn. Eine Kurve der
Dimension 1,2618 ist stärker geschlängelt als eine Kurve der Dimension 1,
wie eine Gerade, doch sie ist weniger geschlängelt als eine Kurve der
Dimension 1,5849, wie das Sierpiński-Dreieck. Die fraktalen Dimensionen
der meisten natürlichen Küstenlinien liegen nahe bei 1,25 – das kommt der
Schneeflockenkurve näher als dem Dreieck. Daher stimmen die
Dimensionen mit unserer intuitiven Vermutung überein, welches dieser
Fraktale den Raum besser füllt.
Zudem ermöglicht eine Dimensionsbetrachtung experimentell
arbeitenden Wissenschaftlern, Theorien, die auf Fraktalen basieren,
quantitativ zu überprüfen. So hat Ruß beispielsweise eine fraktale
Dimension von etwa 1,8; daher lassen sich fraktale Modelle von
Rußablagerungen, von denen es eine Vielzahl gibt, testen, indem man
schaut, ob die Modelle diese Zahl ergeben.
Es gibt viele verschiedene Möglichkeiten, die Dimension eines Fraktals
zu definieren, wenn das Fraktal nicht selbstähnlich ist. Mathematiker
benutzen die Hausdorff-Besicovitch-Dimension, die ziemlich schwierig zu
definieren ist. Physiker verwenden hingegen häufig eine einfachere
Definition, die sogenannte Box-Dimension. In vielen, wenn auch nicht in
allen Fällen decken sich diese beiden Auffassungen von Dimension. In
diesem Fall spricht man von fraktaler Dimension und meint mit diesem
Begriff sowohl die eine wie die andere Dimension. Die ersten Fraktale
waren Kurven, doch Fraktale können auch Oberflächen, Körper oder
höherdimensionale Formen sein. In diesem Fall gibt die fraktale Dimension
an, wie groß die Rauheit des Fraktals ist oder wie effizient es den Raum
füllt.
Beide dieser fraktalen Dimensionen sind irrational. Denn nehmen wir an,
dass
ist, wobei p und q ganze Zahlen sein sollen, dann ist q
q
p
q
p
log 3 = p log 2, also log 3 = log 2 und damit 3 = 2 . Das widerspricht
jedoch der eindeutigen Primfaktorenzerlegung. Eine ähnliche
Argumentation funktioniert bei
. Ist es nicht wirklich
bemerkenswert, wie Grundtatsachen wie diese plötzlich an ganz
unerwarteten Stellen auftauchen?
Die Mandelbrot-Menge
Das wohl berühmteste aller Fraktale ist die Mandelbrot-Menge. Sie zeigt,
was mit einer komplexen Zahl geschieht, wenn man sie wiederholt
quadriert und gleichzeitig eine Konstante addiert. Das heißt, man wählt eine
2
2
2
2
2
komplexe Konstante c, bildet dann c + c, dann (c + c) + c, dann [(c + c)
2
+ c] + c, und so weiter. (Man kann die Menge auch noch auf andere Weise
definieren, aber dies ist die einfachste.) Geometrisch gesehen existieren
komplexe Zahlen in einer Ebene, die den gewöhnlichen Zahlenstrahl für
reelle Zahlen erweitert. Es gibt im Wesentlichen zwei Möglichkeiten:
Entweder sämtliche komplexen Zahlen in der obigen Folge bleiben in
irgendeiner endlichen Region der komplexen Ebene, oder sie tun es nicht.
Färben wir diejenigen c, für die die Folge in einer endlichen Region bleibt,
schwarz, und diejenigen, die daraus entkommen, weiß. Dann ist die Menge
aller schwarzen Punkte die Mandelbrot-Menge. Und das sieht so aus:
Abbildung 115: Mandelbrot-Menge, auch «Apfelmännchen» genannt.
Die Grenze der Mandelbrot-Menge – die Punkte auf dem Rand, die so eng
an den schwarzen bzw. den weißen Punkten liegen, wie wir wollen – ist ein
Fraktal. Seine fraktale Dimension beträgt, wie sich herausgestellt hat, 2,
daher ist dieses Fraktal «beinahe raumfüllend».
Um mehr feine Details zu sehen, können wir die weißen Punkte mit
unterschiedlichen Farben versehen, je nachdem, wie rasch die Folge gegen
unendlich strebt.
Nun erhalten wir bemerkenswert komplexe Figuren voller Schnörkel und
Spiralen und anderen Formen. Wenn man das Bild vergrößert, so führt das
lediglich zu einem ständig detaillierteren Bild. Wenn man sich die richtigen
Stellen anschaut, kann man sogar komplette Baby-Mandelbrot-Mengen
entdecken.
Abbildung 116: Baby-Mandelbrot-Menge.
Die Mandelbrot-Menge als solche hat offenbar keine wichtigen
Anwendungen, doch es handelt sich um eines der einfachsten nichtlinearen
dynamischen Systeme, das auf komplexen Zahlen basiert. Daher hat es bei
Mathematikern viel Interesse geweckt, die nach allgemeinen,
möglicherweise weiter anwendbaren Prinzipien suchen. Zudem
demonstrieren diese Systeme eine «philosophische» Schlüsselerkenntnis:
Einfache Regeln können zu komplexen Ergebnissen führen: Das heißt,
einfache Ursachen können komplexe Wirkungen haben. Wenn man
versucht, ein sehr kompliziertes System zu verstehen, ist die Verlockung
groß, anzunehmen, dass die zugrunde liegenden Regeln ebenso kompliziert
sind. Die Mandelbrot-Menge beweist, dass eine solche Erwartung falsch
sein kann. Diese Erkenntnis bildet den Kern der sogenannten
Komplexitätswissenschaft: Die Forscher, die auf diesem neuen Gebiet
arbeiten, versuchen, mit offensichtlich komplexen Systemen
klarzukommen, indem sie nach den einfacheren Regeln suchen, denen diese
Systeme folgen.
Kugelpackungen
Die Zahl
ist in der Mathematik sowie in Chemie und Physik von
grundlegender Bedeutung. Es ist der Anteil am Rauminhalt, der gefüllt
wird, wenn wir gleich große Kugeln auf möglichst effiziente Weise so dicht
zusammenpacken, dass möglichst wenig Leerraum bleibt. Kepler
formulierte dieses Ergebnis 1611 als Vermutung, doch seine Vermutung
blieb unbewiesen, bis Thomas Hales 1998 einen computergestützten
Beweis lieferte. Ein Beweis, der sich direkt von einem Menschen
überprüfen lässt, ist bisher noch nicht gefunden worden.
Kreispackungen
Wir beginnen mit der einfacheren Frage nach der besten Packung von
identischen Kreisen in der Ebene. Wenn man mit ein paar Dutzend Münzen
mit demselben Nennwert experimentiert und sie zusammenschiebt, um so
viele wie möglich auf einer bestimmten Fläche unterzubringen, wird man
rasch feststellen, dass bei einer zufälligen Anordnung eine Menge
ungenutzter Raum bleibt. Wenn man versucht, diese Lücken zu schließen,
indem man die Münzen enger zusammenschiebt, entdeckt man bald, dass
die effizienteste Packung offenbar darin besteht, sie zu einem Wabenmuster
zusammenzufügen.
Es ist jedoch zumindest denkbar, dass sich die Münzen mittels
irgendeiner anderen geschickten Anordnung noch dichter packen lassen. So
etwas ist nicht besonders wahrscheinlich, aber das ist kein Beweis. Es gibt
unendlich viele Möglichkeiten, identische Münzen anzuordnen, also lässt
sich die Frage experimentell nicht klären.
Das Bienenwabenmuster ist im Gegensatz zu zufälligen Anordnungen
sehr regelmäßig und symmetrisch. Es ist zudem starr: Man kann keine der
Münzen bewegen, denn ihre Nachbarn halten sie an Ort und Stelle fest. Auf
den ersten Blick sollte eine starre Anordnung einen Raum am effizientesten
füllen, denn es gibt keine Möglichkeit, sie zugunsten einer raumsparenderen
Anordnung zu verändern, indem man Münzen nacheinander verschiebt.
Abbildung 117: Links: Eine Zufallsanordnung lässt eine Menge Lücken. Rechts: Bei einem
Wabenmuster verschwindet ein Großteil der Lücken.
Es gibt jedoch andere starre Anordnungen, die weniger «sparsam» sind.
Schauen wir uns zunächst einmal die beiden auf der Hand liegenden
Möglichkeiten an, Kreise zu einem regelmäßigen Muster
zusammenzufügen:
Das Wabengitter oder hexagonale Gitter, so genannt, weil die
Mittelpunkte der Kreise Sechsecke bilden.
Das quadratische Gitter, in dem die Kreise wie die Quadrate auf
einem Schachbrett angeordnet sind.
Abbildung 118: Links: Sechs Kreismittelpunkte bilden ein regelmäßiges Sechseck
(Hexagon). Rechts: Eine quadratische Gitterpackung.
Das quadratische Gitter ist ebenfalls starr, doch die Kreise sind darin
weniger dicht gepackt. Wenn man eine sehr große Fläche auslegt, bedeckt
das hexagonale Gitter einen größeren Anteil der verfügbaren Fläche.
Um all dies zu präzisieren, definieren Mathematiker die Dichte einer
Kreispackung als den Anteil einer gegebenen Fläche, der von Kreisen
abgedeckt wird, wenn man die Fläche unendlich groß werden lässt. Einfach
gesagt geht es darum, die gesamte Ebene mit Kreisen zu überdecken und
herauszufinden, wie groß der Anteil der bedeckten Fläche ist. Wörtlich
genommen ist dieser Anteil
, was keinen Sinn ergibt, daher bedecken wir
immer größer werdende Quadrate und bilden den Grenzwert.
Wir wollen einmal die Dichte der quadratischen Gitterpackung
berechnen. Wenn jedes Quadrat eine Einheitsfläche ist, haben die Kreise
alle den Radius , daher beträgt ihre Fläche
. Der
bedeckte Anteil der Fläche ändert sich nicht, auch wenn man viele Quadrate
und viele Kreise betrachtet. Deshalb erhalten wir im Grenzwert eine
Packungsdichte von
, was ungefähr 0,785 entspricht.
Eine etwas kompliziertere Berechnung für das hexagonale Gitter führt zu
einer Packungsdichte von
, was ungefähr 0,906 entspricht. Das ist
eine höhere Dichte als diejenige für das quadratische Gitter.
Im Jahr 1773 bewies Lagrange, dass das hexagonale Gitter die dichteste
Gitterpackung von Kreisen in der Ebene ergibt. Dies ließ jedoch die
Möglichkeit offen, dass sich mit einer weniger regelmäßigen Packung
bessere Ergebnisse erzielen lassen. Es sollte mehr als 150 Jahre dauern, bis
es Mathematikern gelang, diese unwahrscheinliche Möglichkeit
auszuschließen. 1892 hielt Axel Thue einen Vortrag, in dem er einen
Beweis skizzierte, dem zufolge keine Kreispackung in der Ebene dichter
sein kann als die hexagonale Gitterpackung, doch die veröffentlichten
Details sind zu vage, um nachzuvollziehen, wie der vorgeschlagene Beweis
aussehen sollte, geschweige denn, um zu prüfen, ob er richtig war. 1910
veröffentlichte Thue einen neuen Beweis, doch dieser Beweis wies noch
immer einige logische Lücken auf. Der erste vollständige Beweis wurde
1940 von Laszlo Fejes Tóth vorgestellt. Kurz darauf entdeckten Beniamino
Segre und Kurt Mahler einen alternativen Beweis. Im Jahr 2010 stellten
Hai-Chau Chang und Lih-Chung Wang einen einfacheren Beweis ins Netz.
Die Kepler-Vermutung
In der Kepler-Vermutung geht es um das analoge Problem der Packung
gleich großer Kugeln im dreidimensionalen Raum. Anfang des
17. Jahrhunderts stellte der große Mathematiker und Astronom Johannes
Kepler diese Vermutung auf – und zwar in einem Buch über Schneeflocken.
Abbildung 119: Diese Aufnahmen zeigen echte Schneekristalle, die in Northern Ontario, in
Alaska, in Vermont, auf der Oberen Halbinsel von Michigan und im Hochgebirge der
kalifornischen Sierra Nevada vom Himmel fielen. Aufgenommen wurden sie von Kenneth
G. Libbrecht mit Hilfe eines speziell konstruierten Schneeflocken-Fotomikroskops.
Kepler interessierte sich für Schneeflocken, weil sie häufig eine
Sechsersymmetrie aufweisen: Bei ihnen wiederholt sich fast genau dieselbe
Form sechs Mal, jeweils um einen Winkel von 60° versetzt. Er fragte sich
nach dem Grund und benutzte Logik, Phantasie und sein Wissen über
ähnliche Muster in der Natur, um eine Erklärung zu finden, die dem, was
wir heute wissen, bemerkenswert nahe kommt.
Kepler war Mathematiker am Hof von Rudolf II., Kaiser des Heiligen
Römischen Reiches, und seine Arbeit wurde von Johannes Wacker von
Wackenfels, einem wohlhabenden Diplomaten und Ratgeber des Kaisers,
finanziell unterstützt. 1611 überreichte Kepler seinem Förderer ein
Neujahrsgeschenk: eine speziell für ihn verfasste Schrift, De Nive
Sexangula (Vom sechseckigen Schnee). Er begann mit der Frage, warum
Schneeflocken sechseckig sind. Um eine Antwort zu erhalten, diskutiert er
natürliche Formen, die ebenfalls eine Sechsersymmetrie aufweisen, wie die
Honigwaben in einem Bienenstock und die dicht gepackten Samen im
Inneren eines Granatapfels. Wir haben gerade besprochen, wie das Packen
von Kreisen in der Ebene auf natürliche Weise zu einem Wabenmuster
führt. Kepler führte die symmetrische Form von Schneeflocken auf das
Problem zurück, Kugeln möglichst effizient im dreidimensionalen Raum
zusammenzupacken.
Dabei kam er der modernen Erklärung erstaunlich nahe. Eine
Schneeflocke ist ein Eiskristall, dessen atomare Struktur der einer
Honigwabe sehr ähnlich ist. Vor allem weist sie eine hexagonale Symmetrie
auf (tatsächlich ein wenig mehr Symmetrie als das). Die Vielfalt von
Schneeflockenformen, die alle dieselbe Symmetrie besitzen, ergibt sich aus
den wechselnden Bedingungen in Wetterwolken, in denen die
Schneeflocken heranwachsen.
Auf dem Weg zu seiner Antwort machte Kepler eine recht beiläufige
Bemerkung, die ein mathematisches Rätsel aufwarf, das erst 387 Jahre
später gelöst werden sollte. Wie packt man identische Kugeln auf die
effizienteste Weise im dreidimensionalen Raum? Er nahm an, die Antwort
sei das, was wir heute als kubisch-flächenzentrierte Packung bezeichnen.
Auf diese Weise stapeln Obsthändler gewöhnlich ihre Orangen. Zuunterst
legt man eine flache Lage von Kugeln in einem quadratischen Gittermuster
aus (siehe Abbildung 120, links). Dann platziert man eine ähnliche Schicht
obendrauf, wobei man jede Kugel in die Vertiefung zwischen vier
benachbarten Kugeln in der Lage darunter legt (Mitte). Auf diese Weise
fährt man fort (rechts), bis man den ganzen verfügbaren Raum gefüllt hat.
Das erfordert, jede Lage seitwärts zu verschieben, um eine ganze Ebene zu
füllen, und Lagen sowohl unter der ersten Lage als auch obenauf zu
platzieren. Die Dichte dieser Packung lässt sich berechnen und ergibt
~ 0,740480. Kepler zufolge ist dies die «bestmögliche Packung», das heißt,
sie hat die höchste Dichte, die sich erzielen lässt.
Abbildung 120: Kubisch-flächenzentriertes Gitter. Links: Die erste Lage. Mitte: Die ersten
beiden Lagen. Rechts: Die ersten vier Lagen.
Obsthändler beginnen mit einer Kiste oder einer Palette und arbeiten sich
Lage um Lage nach oben, und das ist eine Möglichkeit, um eine kubischflächenzentrierte Packung zu definieren. Die Kepler-Vermutung fragt
jedoch nach allen möglichen Packungen; daher können wir nicht annehmen,
dass flache Lagen die einzige Möglichkeit sind. Die Obsthändlermethode
löst tatsächlich ein anderes Problem. Die Frage ist: Ändert das die Antwort?
Auf den ersten Blick sieht die Verpackungsmethode, die die Obsthändler
wählen, wie die falsche Antwort aus, denn sie stützt sich auf eine
quadratische Gitteranordnung, und eine hexagonale Gitteranordnung ist
dichter. Obsthändler benutzen Gitteranordnungen mit quadratischen Lagen,
weil sie ihre Orangen in rechteckigen Kisten unterbringen müssen, nicht,
weil sie die dichteste Packung finden wollen. Wäre es daher nicht besser,
wenn die erste Lage ein hexagonales Gitter bilden würde? Wiederum
würden die folgenden Lagen in die Vertiefungen der Lage darunter zu
liegen kommen, jede angeordnet im selben hexagonalen Gittermuster.
Kepler erkannte, dass dies keinen Unterschied macht. Eine Schrägseite
der Abbildung rechts bildet ein hexagonales Muster. Lagen, die zu dieser
Lage parallel verlaufen, bilden ebenfalls hexagonale Lagen, die in die
Vertiefungen der benachbarten Lagen passen. Daher ist die alternative
Anordnung, welche hexagonale Lagen benutzt, nichts anderes als eine
gekippte Version der kubisch-flächenzentrierten Gitteranordnung.
Das sagt uns jedoch etwas Wichtiges: Unendlich viele verschiedene
Packungen, fast alle davon keine Gitter, haben dieselbe Dichte wie das
kubisch-flächenzentrierte Gitter. Es gibt zwei unterschiedliche
Möglichkeiten, ein hexagonales Gitter in der Vertiefung eines anderen zu
platzieren, und für jede sukzessive Lage können wir die eine oder die
andere Alternative wählen. Bei nur zwei Lagen ist die eine Anordnung eine
Spiegelung der anderen, aber ab drei Lagen ist das nicht mehr der Fall.
Daher gibt es 2 tatsächlich unterschiedliche Anordnungen für 3 Lagen, 4 für
4 Lagen, 8 für 5 Lagen und so weiter. Bei entsprechend vielen Lagen an Ort
und Stelle ist die Zahl der Anordnungsmöglichkeiten unendlich groß. Jede
Lage hat jedoch dieselbe Packungsdichte, und ganz unabhängig von der
Wahl der Vertiefungen ist die Dichte der Lagen immer gleich groß. Daher
beträgt die Packungsdichte, ganz gleich, welche Abfolge von
Entscheidungen man trifft, stets
.
Bis 1998 blieb die Kepler’sche Vermutung unbewiesen; in diesem Jahr
vervollständigten Thomas Hales und sein Student Samuel Ferguson einen
computergestützten Beweis. Hales sandte diesen Beweis 1999 an die
renommierte Fachzeitschrift Annals of Mathematics. Ein Gremium von
Experten brauchte vier Jahre, um Hales’ Beweis zu prüfen, aber die
Berechnungen waren so kompliziert und die Datenmenge war so riesig,
dass die Experten sich außerstande sahen, die völlige Korrektheit des
Beweises zu bestätigen. Schließlich wurde der Beweis veröffentlicht,
jedoch mit einer Anmerkung, die auf diese Schwierigkeit hinwies.
Ironischerweise lässt sich das Problem wahrscheinlich dadurch
umschiffen, dass man den Beweis in eine Form umschreibt, deren
Richtigkeit sich verifizieren lässt – und zwar von einem Computer. Der
entscheidende Punkt ist, dass das Prüfprogramm vermutlich einfacher ist als
Hales’ Beweis; daher lässt sich die Logik der Prüfsoftware möglicherweise
per Hand überprüfen. Dann können wir darauf vertrauen, dass die Software
tatsächlich hält, was sie verspricht, nämlich den weitaus komplizierteren
Beweis der Kepler’schen Vermutung zu verifizieren.
Man darf also gespannt sein.
Die Tonleiter
Die zwölfte Wurzel aus 2 ist das Verhältnis der Frequenzen
aufeinanderfolgender Töne in der gleichstufigen Tonleiter. Sie ist ein
Kompromiss, ein bisschen wie π durch
zu approximieren – nur dass
dieses Mal die natürlichen musikalischen Intervalle einfache rationale
Zahlen sind und die Potenzen von
irrationale Näherungen dafür. Sie
tauchen aufgrund der Art auf, wie menschliche Ohren Schall wahrnehmen.
Schallwellen
Physikalisch ist ein Ton eine Schallwelle, die durch ein Musikinstrument
erzeugt und vom Ohr wahrgenommen wird. Eine Welle ist eine Störung in
einem Festkörper, einer Flüssigkeit oder einem Gas, die, ohne ihre Gestalt
zu verändern, sich fortpflanzt oder dieselbe Bewegung immer und immer
wieder regelmäßig wiederholt. Wellen sind in der realen Welt etwas sehr
Übliches: Beispiele sind Lichtwellen, Schallwellen, Wasserwellen und
Vibrationen. Wellen im Erdkörper sind die Ursache für Erdbeben.
Abbildung 121: Sinuskurve.
Die einfachste und grundlegende Form einer Welle ist eine Sinuskurve. Die
Höhe der Kurve stellt die Amplitude der Welle dar, ein Maß für die Größe
der entsprechenden Störung. Bei Schallwellen entspricht die Amplitude der
Lautstärke des Tons: Eine größere Amplitude stellt eine größere Störung der
Luft dar, was wiederum das Ohr stärker stört, und das nimmt man als
Zuwachs an Lautstärke wahr.
Abbildung 122: Wellenlänge.
Ein weiteres wichtiges Merkmal einer Sinuskurve ist ihre Wellenlänge: Das
ist der Weg (oder die Zeit, die vergeht) zwischen aufeinanderfolgenden
Amplitudengipfeln. Die Wellenlänge bestimmt die Kurvenform der Welle.
Bei Schallwellen bestimmt sie die Tonhöhe. Kleinere Wellenlängen
bewirken, dass der Ton höher klingt, und größere Wellenlängen lassen ihn
tiefer klingen.
Eine weitere Möglichkeit, dasselbe Merkmal einer Welle zu messen, ist
die sogenannte Frequenz. Sie ist umgekehrt proportional zur Wellenlänge.
Sie entspricht der Zahl von Amplitudengipfeln, die auf einer bestimmten
Strecke oder in einem bestimmten Zeitraum auftreten. Frequenzen werden
in der Einheit Hertz (Hz) gemessen: Ein Hertz ist eine Schwingung pro
Sekunde. Zum Beispiel hat das eingestrichene c auf dem Klavier die
Frequenz 261,62556 Hz, also etwas mehr als 261 Schwingungen pro
Sekunde.
Abbildung 123: Der Standardnotensatz.
Das eine Oktave höhere c hat die Frequenz 523,25113 Hz: genau zweimal
so groß. Das eine Oktave tiefere c hat die Frequenz 130,81278 Hz: genau
halb so groß. Diese Beziehungen zeigen beispielhaft die Verwandtschaft
zwischen der Mathematik der Wellen und der Musik. Um das Thema weiter
auszuspielen, stellen Sie sich ein Streichinstrument vor, wie etwa eine
Violine oder eine Gitarre, und betrachten Sie zunächst einmal nur eine
einzige Saite.
Das Instrument liege auf der Seite und Sie schauen frontal darauf. Wenn
der Musiker die Saite anschlägt, schwingt sie relativ zum Instrument von
Seite zu Seite. Für uns bewegt sie sich auf und nieder. Das führt zu einer
Art Welle, die man stehende Welle nennt, bei der die Enden der Saite fixiert
sind, die Form sich jedoch periodisch wiederholt.
Die einfachste Schwingung tritt ein, wenn die Saite eine halbe Sinuswelle
formt. Die nächst einfache Schwingung ist eine komplette Sinuswelle.
Danach kommen die anderthalbfachen Sinuswellen, dann zwei Sinuswellen
usw. Halbwellen gibt es, weil eine ganze Sinuswelle die Horizontale einmal
in der Mitte sowie an jedem Ende kreuzt.
Abbildung 124: Von links nach rechts: Eine halbe Sinuswelle. Eine ganze Sinuswelle.
Eineinhalb Sinuswellen. Zwei Sinuswellen.
Hier betragen die Wellenlängen , 1, , 2 usw. Die halbzahligen Werte
treten auf, weil wir mit Halbwellen arbeiten. Würden wir Einheiten
benutzen, in denen die Saitenlänge
ist, dann wären die Wellenlängen
einfach ganze Zahlen 1, 2, 3, 4.
Die zugehörigen Frequenzen, wenn man dieselbe Saite unter derselben
Spannung hält, verhalten sich wie 1, ,
,
. Wenn zum Beispiel die
Halbwellenschwingung die Frequenz 261 Hz hat, also nah am
eingestrichenen c liegt, dann sind diese Frequenzen
Die zugrunde liegende einzelne Halbwelle nennt man Grundschwingung
oder 1. Harmonische, alle weiteren sind die höheren Oberschwingungen
oder Harmonischen.
Vor etwa 2500 Jahren glaubten die Pythagoreer, alles in der Welt sei
durch mathematische Formeln und zahlenmäßige Zusammenhänge
bestimmt. Sie entdeckten bemerkenswerte Beziehungen zwischen Zahlen
und Musikharmonien. Einer Legende zufolge kam Pythagoras an der
Werkstatt eines Schmieds vorbei und bemerkte, dass verschieden große
Schmiedehämmer in unterschiedlichen Tonhöhen erklangen, und dass
Hämmer, deren Größen in einem einfachen Zahlenverhältnis standen – zum
Beispiel einer doppelt so lang wie der andere –, harmonierende Töne
erzeugten. Wer das jedoch mit echten Hämmern versucht nachzuvollziehen,
wird feststellen, dass sie eine zu komplizierte Form haben, um harmonisch
zu schwingen. Doch im Großen und Ganzen trifft es zu, dass kleine Objekte
höhere Töne erzeugen als größere.
Ein plausibleres Experiment der Pythagoreer macht von einer gespannten
Saite Gebrauch, wie Ptolemäus in seiner «Harmonik» um 150 v. Chr.
berichtet. Die Pythagoreer entdeckten, dass zwei Saiten, die unter gleicher
Spannung stehen, aber ein einfaches Längenverhältnis, wie
oder
haben,
ungewöhnlich harmonische Töne erzeugen. Komplexere
Längenverhältnisse erzeugen Misstöne und sind unangenehm fürs Ohr.
Musikalische Intervalle
Musiker beschreiben Töne paarweise in Form von Intervallen zwischen
ihnen, ein Maß dafür, wie viele Stufen sie in einer bestimmten Tonart
trennen. Das grundlegende Intervall ist die Oktave: auf dem Klavier sieben
weiße Tasten nach oben. Töne, die eine Oktave voneinander entfernt liegen,
klingen erstaunlich ähnlich, außer dass der eine Ton höher als der andere ist,
und sie sind extrem harmonisch. So weit, so gut, aber tatsächlich klingen
Harmonien, die auf einer Oktave beruhen, ein wenig fade. Auf einer Geige
oder einer Gitarre spielt man den eine Oktave höheren Ton, indem man die
Mitte der Saite gegen das Griffbrett drückt. Eine Saite, die halb so lang ist,
erzeugt einen um eine Oktave höheren Ton. Also entspricht die Oktave dem
einfachen Zahlenverhältnis .
Weitere harmonische Intervalle hängen ebenfalls mit einfachen
Zahlenverhältnissen zusammen. Die für die westliche Musik bedeutsamsten
Intervalle sind die Quarte, die einem Verhältnis
entspricht, und die
Quinte mit dem Verhältnis . Die Namen ergeben Sinn, wenn man eine
Tonleiter mit ganzen Noten c d e f g a h c betrachtet. Mit c als Grundnote ist
f die Quarte, g die Quinte und c die Oktave. Würde man die Töne von der
Grundnote aus aufsteigend nummerieren, dann sind Quarte (lateinisch
quartus = der vierte), Quinte (lateinisch quintus = der fünfte) und Oktave
(lateinisch octavus = der achte) jeweils der vierte, fünfte und achte Ton der
Tonleiter.
Die Geometrie wird auf einem Instrument wie der Gitarre besonders klar,
weil sie Abschnitte hat, die man Bünde nennt, und die an den richtigen
Positionen eingefügt sind. Der Bund für die Quarte ist bei einem Viertel der
Gesamtlänge positioniert, der für die Quinte bei einem Drittel der Saite und
die Oktave ist die halbe Strecke entfernt. Man kann das mit einem Maßband
überprüfen.
Tonleitern
Diese Verhältniszahlen bilden die theoretische Grundlage für eine
musikalische Stimmung, und sie führten zu den Tonleitern, die heute in der
westlichen Musik überwiegend in Gebrauch sind. Es gibt sehr viele
verschiedene Tonleitern und wir beschreiben nur die einfachste. Man
beginne mit einer Grundnote und bekommt mit aufsteigenden Quinten
Saiten der Länge
ausmultipliziert ergeben diese Brüche
Außer den ersten beiden sind alle diese Töne zu hoch, um innerhalb einer
Oktave zu bleiben, doch wir können sie um ein oder zwei Oktaven
erniedrigen, indem wir die Brüche jeweils wiederholt durch 2 teilen, bis das
Ergebnis zwischen 1 und 2 liegt. Das ergibt die Brüche
Ordnet man diese in aufsteigender Reihenfolge, so erhält man
Diese Verhältniszahlen entsprechen ziemlich gut den Noten c d e g a b auf
einem Klavier.
Man beachte, dass f fehlt. Tatsächlich klingt die Lücke zwischen
größer als die anderen. Um diese Lücke zu füllen, fügen wir
und
ein, das
Verhältnis für die Quarte, die auf dem Klavier sehr nah bei f liegt.
Außerdem ist es nützlich, die Tonleiter mit einem zweiten c zu ergänzen,
das eine Oktave höher liegt, mit dem Verhältnis . Nun haben wir eine
Tonleiter, die vollständig auf Quarten, Quinten und Oktaven beruht, deren
Tonhöhen den Verhältnissen
entsprechen. Die Saitenlänge ist umgekehrt proportional zur Tonhöhe, also
müssten wir nur die Brüche umkehren, um die dazugehörigen Längen zu
bekommen.
Wir haben nun alle weißen Tasten auf dem Klavier erklärt, doch es gibt
auch schwarze Tasten. Die zugehörigen Töne treten auf, weil
aufeinanderfolgende Zahlen in der Tonleiter in unterschiedlichen
Verhältnissen zueinander stehen, nämlich
Sekunde» genannt) und
(Halbton oder «kleine Sekunde»). Zum
Beispiel ist das Verhältnis von 81/64 zu
ist
(Ganzton, auch «große
gleich
, doch das von
zu
. Die Bezeichnungen «Ganzton» und «Halbton» deuten einen
näherungsweisen Vergleich der Intervalle an. Numerisch liegen sie bei
1,125 und 1,05. Der erste Wert ist größer, also entspricht ein Ganzton einer
größeren Tonhöhenänderung als ein Halbton. Zwei Halbtöne ergeben ein
2
Verhältnis von 1,05 , was ungefähr bei 1,11 und damit nicht weit von 1,125
entfernt liegt. Damit entsprechen zwei Halbtöne etwa einem Ganzton.
Indem wir so weitermachen, können wir jeden Ganzton in zwei Intervalle
unterteilen, die beide einem Halbton nahekommen, und erhalten so eine
zwölfstufige Notenskala. Man kann das auf verschiedene Weise
bewerkstelligen und erhält etwas unterschiedliche Ergebnisse. Wie auch
immer man es macht, kann es zu sehr kleinen, aber hörbaren Problemen
beim Wechsel der Tonart kommen: Die Intervalle verändern sich leicht,
wenn wir zum Beispiel jeden Ton um einen Halbton erhöhen. Auf einigen
Musikinstrumenten, zum Beispiel der Klarinette, kann das ernsthafte
technische Probleme zur Folge haben, weil die Töne dadurch erzeugt
werden, dass Luft durch die Löcher im Instrument strömt, die sich an festen
Positionen befinden. Bei anderen Instrumenten, wie zum Beispiel der
Geige, kann man einen kontinuierlichen Tonbereich erzeugen, sodass der
Musiker die Tonhöhe anpassen kann.
Auf wieder anderen Instrumenten, wie zum Beispiel der Gitarre und dem
Klavier, kommt ein unterschiedliches mathematisches System zur
Anwendung. Es vermeidet das Problem des Tonartwechsels, verlangt aber
einige subtile Kompromisse. Die Idee ist, das Intervall zwischen zwei in der
Tonleiter aufeinanderfolgenden Tönen exakt gleichzumachen. Der Abstand
zwischen zwei Tönen hängt vom Verhältnis ihrer Frequenzen ab, also muss
man, um ein vorgegebenes Intervall zu erzeugen, die Frequenz des einen
Tons nehmen und sie mit einem festen Betrag multiplizieren, um die
Frequenz des anderen zu bekommen.
Wie sollte dieser Betrag für einen Halbton aussehen?
Zwölf Halbtöne bilden eine Oktave, also das Verhältnis 2. Um eine
Oktave zu bekommen, muss man mit der Grundfrequenz starten und sie mit
einem festen Betrag multiplizieren, der einem Halbton entspricht, und das
zwölf Mal in Folge. Das Resultat muss die ursprüngliche Frequenz
verdoppeln. Deswegen muss das Verhältnis für einen Halbton zur zwölften
Potenz erhoben gleich 2 sein. Das Verhältnis für einen Halbton muss daher
die zwölfte Wurzel von 2 sein. Dies schreibt man
, und diese Zahl
hat näherungsweise den Wert 1,059463.
Der große Vorteil dieser Idee besteht darin, dass nun viele musikalische
Beziehungen exakt aufeinander abgestimmt sind. Zwei Halbtöne bilden
exakt einen Ganzton, und zwölf Halbtöne bilden eine Oktave. Was noch
besser ist: Man kann die Tonart ändern, also den Anfang der Tonleiter,
indem man alle Noten um einen festen Betrag nach oben oder unten
verschiebt.
Diese Zahl, die zwölfte Wurzel aus 2, führt zur gleichstufigen (auch
gleichtemperierten oder gleichschwebenden) Stimmung. Sie stellt einen
Kompromiss dar. Zum Beispiel ist in der gleichstufigen Stimmung der
5
Bruch für eine Quarte nicht , sondern 1,0595 = 1,335. Ein geübter
Musiker kann den Unterschied hören, doch gewöhnt man sich leicht daran,
und die meisten Menschen bemerken den Unterschied nie.
Es handelt sich um eine irrationale Zahl. Angenommen
12
wobei p und q natürliche Zahlen sind. Dann müsste p
,
12
= 2q
gelten. Nach
einer Primfaktorzerlegung hat aber die linke Seite eine gerade Anzahl von
Zweien (möglicherweise gar keine), während die rechte Seite eine ungerade
Anzahl hat. Das widerspricht der Eindeutigkeit der Primfaktorzerlegung.
Schwingende Saiten und Trommeln
Um zu erklären, warum einfache Zahlenverhältnisse mit musikalischer
Harmonie einhergehen, muss man sich die Physik einer schwingenden Saite
anschauen.
Im Jahr 1727 machte John Bernoulli den ersten großen Fortschritt bei der
Beschreibung eines einfachen mathematischen Modells für eine Violinsaite.
Im einfachsten Fall, so fand er heraus, ist die Form der schwingenden Saite
zu jedem Zeitpunkt eine Sinuskurve. Die Amplitude der Schwingung folgt
ebenfalls einer Sinuskurve, allerdings nicht räumlich, sondern im
Zeitverlauf.
Abbildung 125: Aufeinanderfolgende Momentaufnahmen einer schwingenden Saite. Zu
jedem Zeitpunkt hat sie die Form einer Sinuskurve. Auch die Amplitude variiert sinusförmig
in der Zeit.
Es gab jedoch auch andere Lösungen. Alle waren Sinuskurven, doch
beschrieben sie unterschiedliche «Schwingungsmodi», mit 1, 2, 3 oder
mehr Wellen auf der Saite. Wiederum stellte die Sinuskurve eine
Momentaufnahme der Form zu jedem Zeitpunkt dar, und ihre Amplitude
war um einen zeitabhängigen Faktor vervielfacht, der sich ebenfalls
sinusförmig veränderte.
Abbildung 126: Momentaufnahmen der Modi 1, 2, 3 einer schwingenden Saite. In jedem
Fall schwingt die Saite auf und ab, und ihre Amplitude verändert sich sinusförmig mit der
Zeit. Die Schwingung ist umso schneller, je mehr Wellen vorhanden sind.
An den festen Enden bewegt sich die Saite nie. In allen Modi außer dem
ersten hat die Saite auch zwischen ihren Enden Punkte, die nicht
schwingen: diejenigen Orte, an denen die Kurve die horizontale Achse
quert. Diese «Schwingungsknoten» erklären, warum in den pythagoreischen
Experimenten einfache Zahlenverhältnisse auftauchen. Weil zum Beispiel
in derselben Saite die Schwingungsmodi 2 und 3 auftreten können, ist die
Lücke zwischen aufeinanderfolgenden Knoten in der Modus‑2‑Kurve
eineinhalb Mal so groß wie die entsprechende Lücke in der Modus‑3‑Kurve.
Das erklärt, warum Verhältnisse wie
auf natürliche Weise aus der
Dynamik einer schwingenden Saite hervorgehen.
Im letzten Schritt müssen wir verstehen, warum diese Verhältnisse
harmonisch sind, andere dagegen nicht.
Im Jahre 1746 entdeckte Jean Le Rond d’Alembert, dass die
Schwingungen einer Saite einer mathematischen Gleichung gehorchen, die
Wellengleichung heißt. Sie beschreibt, wie die auf eine Saite wirkenden
Kräfte – ihre eigene Spannung und auch die Kräfte, die durch das
Anschlagen oder Streichen der Saite entstehen – ihre Bewegung
beeinflussen. D’Alembert bemerkte, dass er Bernoullis
Sinuskurvenlösungen kombinieren konnte. Zur Vereinfachung betrachten
wir nur eine Momentaufnahme und werden damit die Zeitabhängigkeit los.
Die Abbildung zeigt beispielhaft die Form von 5 sin x + 4 sin 2x – 2 cos 6x.
Sie ist weitaus komplexer als eine einfache Sinuskurve. Echte
Musikinstrumente erzeugen typischerweise komplexe Wellen mit vielen
verschiedenen Sinus- und Kosinus-Termen.
Der Einfachheit halber schauen wir uns sin 2x an, der die doppelte
Frequenz wie sin x hat. Wie klingt er? Es ist der eine Oktave höhere Ton.
Das ist der Ton, der besonders harmonisch klingt, wenn man ihn zusammen
mit dem Grundton spielt. Nun kreuzt die Form der Saite im zweiten Modus
(sin2x) die horizontale Achse im Mittelpunkt. An diesem
Schwingungsknoten bleibt sie fest. Setzt man einen Finger auf diesen
Punkt, können immer noch beide Hälften der Saite im sin2x-Muster
schwingen, im sin-x-Muster jedoch nicht mehr. Das erklärt die
pythagoreische Entdeckung, dass eine halb so lange Saite einen eine Oktave
höheren Ton erzeugt. Eine ähnliche Erklärung ist auf die anderen einfachen
Frequenzverhältnisse anwendbar, die sie entdeckt hatten: Sie gehören alle
zu Sinuskurven, deren Frequenzen diese Zahlenverhältnisse haben, und
solche Kurven passen gut auf einer Saite fester Länge zueinander, deren
Enden fest eingespannt sind.
Abbildung 127: Typische Überlagerung von Sinus- und Kosinuswellen unterschiedlicher
Amplituden und Frequenzen.
Warum klingen diese Verhältnisse harmonisch? Der Grund liegt einerseits
darin, dass Sinuswellen, deren Frequenzen nicht in einfachen Verhältnissen
stehen, sogenannte Schwebungen erzeugen, wenn sie überlagert werden.
Zum Beispiel entspricht ein Verhältnis wie
der Wellenform sin 7x + sin
8x.
Der entstehende Ton ist ein hohes Summen, das erst lauter und dann
wieder leiser wird. Das menschliche Ohr reagiert auf einfallenden Schall in
etwa auf dieselbe Weise wie eine Violinsaite. Bei einer Schwebung hört
sich das Resultat deshalb nicht harmonisch an.
Zum anderen gibt es einen weiteren Grund. Die Ohren von
Neugeborenen stimmen sich auf diejenigen Töne ein, die sie während der
Entwicklung des Gehirns am häufigsten hören. Tatsächlich gibt es mehr
Nervenverbindungen vom Gehirn zum Ohr als in die andere Richtung, und
das Gehirn kann diese nutzen, um die Reaktion des Ohrs auf einfallenden
Schall zu regulieren. Deshalb hat unsere Auffassung von Harmonie eine
kulturelle Dimension. Allerdings sind die einfachsten Verhältnisse von
Natur aus harmonisch, und die meisten Kulturen machen von ihnen
Gebrauch.
Eine Saite ist eindimensional, doch lassen sich ähnliche Ideen auch in
höheren Dimensionen anwenden. Um die Schwingungen einer Trommel zu
verstehen, betrachten wir eine schwingende Membran – eine
zweidimensionale Oberfläche –, die wie die Haut einer Trommel geformt
ist. Viele Trommeln sind kreisförmig, doch können wir genauso gut den
Klang einer quadratischen oder einer rechteckigen Trommel berechnen,
oder meinetwegen auch einer Trommel, die wie der Umriss einer Katze
geformt ist.
Abbildung 128: Schwebungen.
Abbildung 129: Links: Momentaufnahme der Schwingungsmodi 2 und 3 einer rechteckigen
Trommel. Rechts: Momentaufnahme einer schwingenden kreisförmigen Trommel.
Für jede feste Grundform gibt es Funktionen, die Bernoullis Sinus und
Kosinus entsprechen: die einfachsten Schwingungsmuster. Diese Muster
nennt man Modi oder Normalschwingungen, wenn man klarstellen will,
wovon die Rede ist. Alle anderen Wellen können durch Überlagerung von
Normalschwingungen erzeugt werden, wobei, falls nötig, auch unendliche
Summen benutzt werden.
Die Grundform kann auch dreidimensional sein: ein Körper. Ein
wichtiges Beispiel ist eine schwingende massive Kugel, die ein einfaches
Modell dafür darstellt, wie die Erde sich bei einem Erdbeben bewegt. Eine
genauere Form ist eine Ellipse, die an den Polen leicht abgeflacht ist.
Seismologen benutzen die Wellengleichung und weiterentwickelte
Versionen dieser Gleichung, welche die Physik der Erde naturgetreuer
modellieren, um die Signale deuten zu können, die durch Erdbeben
entstehen.
Wer Autos entwirft und unerwünschte Vibrationen eliminieren möchte,
muss sich die Wellengleichung für ein autoförmiges Objekt anschauen, oder
welchen Teil auch immer die Ingenieure verstehen wollen. Beim Entwurf
erdbebensicherer Gebäude geht man ähnlich vor.
Die Apéry-Konstante
Diese Konstante ist ein bemerkenswertes Beispiel für eine mathematische
Gesetzmäßigkeit, die bei allen geraden Zahlen funktioniert, bei ungeraden
aber wahrscheinlich nicht. Soweit man weiß. Der Beweis, dass diese Zahl
irrational ist, kam wie ein Blitz aus heiterem Himmel.
Zeta von drei
Erinnern Sie sich an die Zeta-Funktion (siehe Kapitel [ ])? Sie wird, mit
einigen technischen Einschränkungen hinsichtlich der analytischen
Fortsetzung, für jede komplexe Zahl z (siehe Kapitel [i]) durch folgende
Reihe definiert:
Die Mathematiker des 18. Jahrhunderts begegneten dieser unendlichen
Summe erstmals bei dem Spezialfall z = 2, als Euler das Baseler Problem
löste. Anders ausgedrückt, suchten sie nach einem Ausdruck für ζ(2), also
die Summe der reziproken Quadratzahlen. Euler fand 1735 die Antwort
(siehe Kapitel [π]):
Dieselbe Methode klappt auch für die vierte, sechste oder jede andere
geradzahlige Potenz:
und es geht weiter mit:
Anhand dieser Beispiele würde man annehmen, dass die Summe der
3
reziproken Kubikzahlen ein rationales Vielfaches von π , die Summe der
5
reziproken fünften Potenzen ein rationales Vielfaches von π , und so weiter
wäre. Numerische Rechnungen sprechen jedoch stark dagegen. Tatsächlich
sind überhaupt keine Formeln für diese Reihen, mit oder ohne π, bekannt.
Sie sind ein Rätsel.
Weil π irrational, ja sogar transzendent ist (siehe Kapitel [π]), haben alle
obigen Reihen irrationale Werte. Also ist ζ(n) für n = 2, 4, 6, 8, …
irrational. Man weiß jedoch nicht, ob das auch für ungerade n gilt. Es ist
zwar sehr wahrscheinlich, aber ζ(n) ist für ungerade n viel schwerer zu
überprüfen, weil Eulers Methode nur für gerade n funktioniert. Viele
Mathematiker haben sich schon mit dieser Frage abgegeben, aber alles in
allem sind sie nicht weitergekommen.
Für n = 3, die reziproken Kubikzahlen, ist die Zahl
als Apéry‑Konstante bekannt. Ihr Zahlenwert ist
3
Teilt man das durch π , wird daraus
eine Zahl, die keine Anzeichen für Wiederholungen liefert, zumindest also
sieht sie nicht rational aus. Mit Sicherheit ist sie kein Bruch mit kleinem
Zähler und Nenner. Im Jahr 2013 berechnete Robert Setti die
Apéry‑Konstante bis auf 200 Milliarden Stellen. Das Ergebnis sieht noch
3
weniger wie ein rationales Vielfaches von π aus, und es scheint keinerlei
Verwandtschaft mit anderen mathematischen Konstanten zu haben.
Daher war es eine riesige Überraschung, als Raoul Apéry 1978 einen
Beweis für die Irrationalität von ζ(3) veröffentlichte. Noch größer war die
Überraschung, als sich sein Beweis auch noch als richtig herausstellte.
Damit soll nichts Schlechtes über Apéry gesagt sein. Der Beweis machte
allerdings einige bemerkenswerte Behauptungen: Zum Beispiel, dass eine
Folge von offensichtlich rationalen Zahlen, die jedoch keineswegs wie
natürliche Zahlen aussehen, tatsächlich natürliche Zahlen sind. (Jede
natürliche Zahl ist rational, aber nicht umgekehrt.) Als
Computerberechnungen immer wieder natürliche Zahlen lieferten, wurde
das langsam plausibel, doch erst nach einiger Zeit gelang der Nachweis,
dass das immer so weiterging. Apérys Beweis ist sehr kompliziert, aber er
benutzt keine Techniken, die nicht auch schon Euler bekannt waren. Seither
sind auch einfachere Beweise gefunden worden.
Die Methoden sind auf ζ(3) zugeschnitten und lassen sich offenbar nicht
auf andere ungerade Zahlen übertragen. Jedoch konnten Wadim Zudilin und
Tanguy Rivoal im Jahr 2000 zeigen, dass unendlich viele ζ(2n+1) irrational
sein müssen. Ein Jahr später bewiesen sie, dass wenigstens eine der vier
Zahlen ζ(5), ζ(7), ζ(9) und ζ(11) irrational ist – aber gemeinerweise verrät
ihr Theorem nicht, welche der Zahlen irrational ist oder sind. Manchmal ist
Mathematik so.
Die Euler-Konstante
Diese Zahl taucht in vielen Gebieten der Analysis und der Zahlentheorie
auf. Sie ist sicherlich eine reelle Zahl, und mit ziemlicher Sicherheit auch
irrational, weswegen ich sie hier vorstelle. Sie hat mit der einfachsten
Näherung für die Summe der reziproken ganzen Zahlen bis zu einem
bestimmten Wert zu tun. Obwohl sie so häufig auftaucht und so einfach ist,
weiß man sehr wenig über sie. Insbesondere kann niemand beweisen, dass
sie irrational ist. Sollte sie jedoch rational sein, so viel ist bekannt, muss es
sich um einen höchst komplizierten Bruch handeln: Er würde absolut
gigantische Zahlen mit mehr als 240000 Stellen enthalten.
Harmonische Zahlen
Harmonische Zahlen sind Summen reziproker ganzer Zahlen:
Es ist keine einfache algebraische Formel für Hn bekannt, und mit
ziemlicher Sicherheit gibt es auch keine. Allerdings lässt sich mit Hilfe der
Analysis relativ leicht beweisen, dass Hn ungefähr gleich dem natürlichen
Logarithmus der Zahl n ist (siehe Kapitel [e]). Eine noch bessere Näherung
lautet:
mit einer Konstanten γ. Mit wachsendem n wird die Differenz der beiden
Seiten beliebig klein.
Die Dezimalentwicklung von γ beginnt mit
Alexander Yee berechnete sie 2013 bis zur 19377958182‑ten Dezimalstelle.
Sie heißt Euler‑Konstante, weil sie erstmals in einer Arbeit auftaucht, die
Euler 1734 schrieb. Er bezeichnete sie mit C und mit O und berechnete sie
auf 16 Dezimalstellen genau. Im Jahr 1790 veröffentlichte auch Lorenzo
Mascheroni einige Ergebnisse für diese Zahl, doch er nannte sie A und a. Er
versuchte, ihre ersten 32 Dezimalstellen zu berechnen, machte jedoch
Fehler an den Stellen 20 bis 22. Gelegentlich ist sie auch als
Euler‑Mascheroni‑Konstante bekannt, doch gebührt Euler im Großen und
Ganzen die größere Ehre. Um 1830 hatten Mathematiker die Bezeichnung
in die heutige Standardschreibweise γ umgewandelt.
Die Euler’sche Konstante erscheint in zahlreichen mathematischen
Formeln, insbesondere im Zusammenhang mit Reihen und bestimmten
γ
Integralen in der Analysis. Die Potenz e ist in der Zahlentheorie
gebräuchlich. Man vermutet, dass die Euler‑Konstante transzendent ist,
doch weiß man noch nicht einmal mit Sicherheit, ob sie irrational ist.
Berechnungen ihrer Kettenbruchentwicklung zeigen, dass ihr Nenner – falls
242080
sie als Bruch darstellbar, also rational ist – mindestens 10
sein muss.
Eine noch genauere Näherungsformel für die harmonischen Zahlen
lautet:
Dabei beträgt der Fehler höchstens
.
SPEZIELLE KLEINE ZAHLEN
Nun kehren wir zu ganzen Zahlen zurück, die ihren eigenen
Charme haben. Jede ist ein eigenes Individuum mit
speziellen Eigenschaften, die sie interessant machen.
Im Grunde sind alle Zahlen interessant. Beweis: Wenn nicht,
gäbe es eine kleinste uninteressante Zahl. Diese Eigenschaft
wiederum würde sie interessant machen: Widerspruch.
Die Stringtheorie
Gewöhnlich stellen wir uns den Raum dreidimensional vor. Die Zeit liefert
eine vierte Dimension für die Raumzeit, die Domäne der Relativität. Neuere
Forschungen an der Front der Physik, als Stringtheorie – genauer als
M‑Theorie – bekannt, behaupten dagegen, dass die Raumzeit eigentlich elf
Dimensionen hat. Sieben der elf Dimensionen sind unseren menschlichen
Sinnen nicht zugänglich. Tatsächlich sind sie noch nicht einmal in
irgendeinem Experiment sicher nachgewiesen.
Das mag ungeheuerlich erscheinen und es könnte auch nicht stimmen.
Doch hat die Physik uns verschiedentlich gelehrt, dass das Bild der Welt,
das uns unsere Sinne liefern, von der Realität beträchtlich abweichen kann.
Zum Beispiel bilden diskrete, kleine Bestandteile, die Atome,
zusammenhängende Materie. Nun glauben Physiker, dass der tatsächliche
Raum vom Raum, in dem wir zu leben glauben, sehr verschieden ist. Der
Grund für die elf Dimensionen ist keine Beobachtung in der wirklichen
Welt: Es ist die Zahl, die eine entscheidende mathematische Struktur
vernünftig funktionieren lässt. Die Stringtheorie ist sehr technisch, doch die
wesentlichen Ideen können relativ einfach skizziert werden.
Die Vereinigung von Relativität und Quantentheorie
Die zwei großen Triumphe der theoretischen Physik sind Relativität und
Quantenmechanik. Erstere, von Einstein eingeführt, erklärt die Gravitation
als Krümmung der Raumzeit. Nach der allgemeinen Relativitätstheorie –
die Einstein nach der speziellen Relativität, seiner Theorie von Raumzeit
und Materie, entwickelte – folgt ein Teilchen auf seinem Weg von einem
Ort zum anderen einer Geodäte: dem kürzesten Weg, der die beiden Orte
verbindet. In der Nähe eines massiven Körpers, wie zum Beispiel eines
Sterns, wird die Raumzeit verformt, und das scheint auch den Weg zu
verbiegen. Zum Beispiel bewegen sich die Planeten in elliptischen
Umlaufbahnen um die Sonne.
Die ursprüngliche Gravitationstheorie Newtons interpretierte diese
gekrümmten Bahnen als Ergebnis einer Kraft und lieferte eine
mathematische Formel für die Stärke dieser Kraft. Äußerst genaue
Messungen zeigten jedoch, dass Newtons Theorie nicht ganz zutrifft.
Einstein ersetzte die Gravitationskraft durch die Krümmung der Raumzeit,
und seine neue Theorie korrigierte die Fehler. Seitdem haben zahlreiche
unterschiedliche Beobachtungen, hauptsächlich an fernen astronomischen
Objekten, diese Theorie bestätigt.
Abbildung 130: Wie die Krümmung der Raumzeit sich als Kraft zeigen kann. Ein Teilchen,
das an einem schweren Körper, wie zum Beispiel einem Stern, vorbeifliegt, wird durch die
Krümmung abgelenkt – sie hat dieselbe Wirkung wie eine anziehende Kraft.
Der zweite große Triumph, die Quantenmechanik, wurde von
verschiedenen großen Physikern entwickelt – darunter Max Planck, Werner
Heisenberg, Louis de Broglie, Erwin Schrödinger und Paul Dirac. Die
Quantenmechanik erklärt, wie sich Materie im kleinsten Maßstab verhält:
bei der Größe von Atomen oder kleiner. Bei diesen Längenskalen verhält
sich Materie sowohl wie Teilchen als auch wie Wellen. Die
Quantenmechanik sagt viele fremdartige Effekte voraus, die sich sehr vom
Verhalten der Welt im Größenmaßstab des Menschen unterscheiden, doch
Tausende von Experimenten stimmen mit diesen Vorhersagen überein. Die
heutige Elektronik würde nicht funktionieren, wenn die Quantenmechanik
stark von der Realität abwiche.
Theoretische Physiker finden es sehr unbefriedigend, zwei verschiedene
Theorien zu haben, die in verschiedenen Kontexten angewendet werden,
insbesondere weil sie einander widersprechen, wenn diese Kontexte sich
überlappen, wie das in der Kosmologie der Fall ist – der Theorie des
Universums als Ganzem. Einstein selbst begann mit der Suche nach einer
einheitlichen Feldtheorie, die beide Bestandteile in einer logisch
konsistenten Weise verbindet. Diese Suche hat Teilerfolge erzielt, bislang
jedoch nur im Quantenregime.
Diese Erfolge vereinigen drei der vier grundlegenden physikalischen
Kräfte. Physiker unterscheiden vier Arten von Kräften in der Natur:
Gravitationskräfte, elektromagnetische Kräfte, die für Elektrizität und
Magnetismus verantwortlich sind, die schwache Kraft, die mit dem Zerfall
radioaktiver Teilchen zusammenhängt, und die starke Kraft, die Teilchen
wie Protonen und Neutronen zusammenhält. Genau genommen sind alle
diese Kräfte «Wechselwirkungen» zwischen den Teilchen der Materie. Die
Relativität beschreibt die Schwerkraft, und die Quantenmechanik ist für die
anderen drei grundlegenden Kräfte zuständig.
In den letzten Jahrzehnten haben Physiker eine einzige, allgemeine
Theorie gefunden, die die drei Kräfte der Quantenmechanik vereinigt. Sie
ist als Standardmodell bekannt und beschreibt die Struktur der Materie auf
subatomaren Skalen. Nach diesem Standardmodell besteht alle Materie aus
nicht mehr als 17 Elementarteilchen.
Aufgrund verschiedener Beobachtungsprobleme – zum Beispiel
Galaxien, die auf eine Weise rotieren, welche nicht mit den Voraussagen der
allgemeinen Relativitätstheorie übereinstimmt, falls sie nur aus Materie
bestehen, die wir beobachten – glauben Kosmologen derzeit, dass der
Großteil des Universums aus «dunkler Materie» besteht, die vermutlich
weitere neue Teilchen über die 17 hinaus verlangt. Falls sie recht haben,
muss das Standardmodell abgeändert werden. Oder wir brauchen eine neue
Gravitationstheorie oder eine veränderte Auffassung, wie sich Körper unter
dem Einfluss einer Kraft bewegen.
Den theoretischen Physikern ist es jedoch bislang nicht gelungen,
Relativität und Quantenmechanik in einer einzelnen Theorie zu vereinigen,
die alle vier Kräfte in konsistenter Weise beschreibt, zugleich aber mit jeder
der Theorien in ihrem jeweiligen Anwendungsbereich übereinstimmt (im
Großen und im Kleinen). Die Suche nach dieser einheitlichen Feldtheorie,
oder Theorie von Allem, hat zu einigen wunderbaren mathematischen Ideen
geführt, die in der Stringtheorie kulminierten. Derzeit gibt es keinen klaren
experimentellen Beweis für diese Theorie, und verschiedene andere
Vorschläge werden ebenfalls aktiv erforscht. Ein typisches Beispiel ist die
Schleifenquantengravitation, in welcher der Raum durch ein Netzwerk
winziger Schleifen dargestellt wird, so ähnlich wie ein Kettenhemd.
Technisch gesprochen, handelt es sich um einen Spin‑Schaum.
Abbildung 131: Die 17 fundamentalen Teilchen.
Die Stringtheorie begann mit dem Vorschlag, Elementarteilchen nicht als
Punkte zu betrachten. Tatsächlich verbreitete sich die Auffassung, dass die
Natur in der Tat nicht mit Punktteilchen auskommt, was der Grund für die
Inkonsistenz einer Quantentheorie für Teilchen und einer Relativitätstheorie
sein könnte, welche nur mit glatten Kurven und Flächen arbeitet.
Stattdessen sollten Teilchen eher kleinen geschlossenen Schleifen ähneln,
die man Strings nennt. Schleifen kann man verbiegen, auf diese Weise
kommt Einsteins Vorstellung von Krümmung auf natürliche Weise ins
Spiel.
Außerdem können Schleifen schwingen, und diese Schwingungen
erklären sehr schön verschiedene Quanteneigenschaften wie elektrische
Ladung und Spin. Eine der verwirrenden Eigenheiten der Quantenmechanik
besteht darin, dass solche Eigenschaften in der Regel als ganzzahlige
Vielfache gewisser Naturkonstanten auftreten. Zum Beispiel hat das Proton
die Ladung +1 einer bestimmten Einheit, das Elektron die Ladung –1 und
das Neutron die Ladung 0. Quarks – noch fundamentalere Teilchen, aus
denen Protonen und Neutronen gebildet sind – haben die Ladung
und – .
Damit kommen nur Vielfache –3, –1, 0, 2, 3 einer grundlegenden Einheit
auf, die Ladung einer der Quarksorten. Aber warum ganzzahlige Vielfache?
Die Mathematik schwingender Strings verhält sich ganz ähnlich. Jede
Schwingung ist eine Welle mit einer bestimmten Wellenlänge (siehe
Kapitel [
]). Wellen auf einer geschlossenen Schleife müssen genau
aufeinander abgestimmt sein, deswegen muss eine ganze Zahl von
Wellenbergen auf die Schleife passen. Wenn die Wellen Quantenzustände
repräsentieren, erklärt das, warum alles in ganzzahligen Vielfachen
daherkommt.
Abbildung 132: Ganzzahlig viele Wellen passen auf einen Kreis.
Natürlich erwies sich die Geschichte als nicht ganz so einfach. Doch hat die
Idee, Teilchen als Schleifen zu betrachten, Physiker und Mathematiker zu
einigen bemerkenswerten und leistungsfähigen Ideen geführt.
Extra‑Dimensionen
Ein schwingender Quantenstring braucht eine Art Raum, in dem er
schwingen kann. Um die Mathematik sinnvoll zu machen, kann das nicht
der gewöhnliche Raum sein. Es muss eine zusätzliche Variable geben, eine
Extra-Dimension des Raums, weil diese Art Schwingung keine räumliche,
sondern eine Quanteneigenschaft ist. Als sich die Stringtheorie entwickelte,
wurde es den Theoretikern klar, dass sie einige Extra‑Dimensionen
benötigten, damit alles funktioniert. Ein neues Prinzip mit dem Namen
Supersymmetrie legte nahe, dass jedes Teilchen einen verwandten
«Partner» haben sollte, ein wesentlich schwereres Teilchen. Strings mussten
durch Superstrings ersetzt werden, die diese Art Symmetrie gestatteten.
Und Superstrings funktionierten nur, wenn der Raum sechs
Extra‑Dimensionen hatte.
Folglich konnte ein String nicht mehr einfach eine Schleife wie ein Kreis
sein, er musste eine kompliziertere Form in sechs Dimensionen haben.
Unter den Formen, die vielleicht in Frage kommen, sind sogenannte CalabiYau‑Mannigfaltigkeiten.
Abbildung 133: Projektion einer sechsdimensionalen Calabi‑Yau‑Mannigfaltigkeit auf den
gewöhnlichen Raum.
Dieser Vorschlag ist keineswegs so verrückt, wie er scheinen mag, weil
«Dimension» in der Mathematik lediglich «unabhängige Variable»
bedeutet. Der klassische Elektromagnetismus beschreibt Elektrizität durch
ein elektrisches und ein magnetisches Feld, die den gewöhnlichen Raum
durchdringen. Jedes Feld braucht drei neue Variablen: die drei
Feldkomponenten längs der drei Raumrichtungen, jeweils für das
elektrische und das magnetische Feld. Obwohl diese Komponenten längs
der Raumrichtungen zeigen, sind die Feldstärken in diesen Richtungen von
den Raumrichtungen selbst unabhängig. Also braucht schon der klassische
Elektromagnetismus sechs Extra‑Dimensionen: drei für die Elektrizität und
drei für den Magnetismus. In gewisser Weise erfordert also auch die
klassische elektromagnetische Theorie zehn Dimensionen: vier für die
Raumzeit plus sechs für den Elektromagnetismus.
In der Stringtheorie ist es ähnlich, doch braucht sie nicht diese sechs
Dimensionen. In gewissem Sinne verhalten sich die neuen Dimensionen der
Stringtheorie – die neuen Variablen – im Gegensatz zu Elektrizität oder
Magnetismus mehr wie normale räumliche Dimensionen. Eine von
Einsteins großen Errungenschaften bestand darin, den dreidimensionalen
Raum und die eindimensionale Zeit zu einer vierdimensionalen Raumzeit
vereinigt zu haben. Das war in der Tat notwendig, weil in der
Relativitätstheorie Raum- und Zeitvariablen vermischt werden, wenn
Objekte sich sehr schnell bewegen. Die Stringtheorie ist ähnlich, doch nutzt
sie jetzt eine zehndimensionale Raumzeit mit neun Dimensionen für den
Raum plus einer für die Zeit.
Diese Idee drängte sich den Theoretikern durch die Notwendigkeit einer
logisch konsistenten mathematischen Beschreibung auf. Falls wir
annehmen, dass die Zeit wie gewöhnlich eine Dimension beansprucht und
die Raumzeit d Dimensionen hat, führen die Rechnungen zu Termen in den
Gleichungen, die Anomalien heißen und im Allgemeinen unendlich sind.
Das bedeutet großes Ungemach, weil es in der wirklichen Welt keine
Unendlichkeiten gibt. Es zeigt sich jedoch, dass all diese Terme Vielfache
von d –10 sind. Das ist null genau dann, wenn d = 10, und die Anomalien
sind verschwunden. Deswegen braucht man zum Verschwinden der
Anomalien zehn Raumzeitdimensionen.
Der Faktor d –10 ist durch die Formulierung der Theorie vorgegeben. Mit
d = 10 umgeht man das gesamte Problem, handelt sich dafür jedoch ein
noch schlimmeres ein. Zieht man eine Dimension für die Zeit ab, so findet
man neun Raumdimensionen, keine drei. Doch würde das stimmen, hätten
wir es nicht längst bemerken müssen? Wo sind die zusätzlichen sechs
Dimensionen?
Eine sehr ansprechende Antwort besagt, dass die Extra‑Dimensionen
vorhanden sind, aber so stark eingerollt, dass wir sie nicht bemerken, sie
tatsächlich nicht bemerken können. Stellen Sie sich einen langen
Gartenschlauch vor. Aus großer Entfernung betrachtet, können Sie seine
Dicke nicht erkennen: Er sieht aus wie eine eindimensionale Linie. Die
beiden anderen Dimensionen, der kreisförmige Querschnitt des
Gartenschlauchs, sind in einem so kleinen Raumbereich aufgerollt, dass sie
nicht zu sehen sind. Ein String ist genauso, nur noch weitaus stärker
aufgerollt. Bei einem Gartenschlauch ist die Länge ungefähr 1000 Mal so
groß wie seine Dicke. Die «Länge» eines Strings (die sichtbare räumliche
40
Bewegung) ist mehr als 10 Mal so groß wie seine «Dicke» (die neun
Dimensionen, in denen er schwingt).
Eine weitere mögliche Antwort besagt, dass die neuen Dimensionen
eigentlich ganz groß sind, die meisten Zustände des Teilchens jedoch auf
einen festen Ort in diesen Dimensionen beschränkt sind – wie ein Boot, das
auf der Oberfläche des Ozeans schwimmt. Der Ozean selbst hat drei
Dimensionen: Länge, Breite und Tiefe. Doch das Boot muss auf der
Oberfläche bleiben und kann nur zwei der Dimensionen erkunden: Länge
und Breite. Ein paar wenige physikalische Gegebenheiten, wie etwa die
Schwerkraft, nutzen die Extra‑Dimensionen der Raumzeit aus – wie ein
Taucher, der aus dem Boot springt. Doch die meisten tun es nicht.
Etwa um 1990 hatten Theoretiker fünf verschiedene Typen von
Stringtheorien entworfen, die sich hauptsächlich in den Symmetrien ihrer
Extra‑Dimensionen unterscheiden. Diese Typen heißen I, IIA, IIB, HO und
HE. Edward Witten entdeckte eine elegante mathematische Vereinigung all
dieser fünf, die er M‑Theorie nannte. In dieser Theorie muss die Raumzeit
elf Dimensionen haben: zehn für den Raum und eine für die Zeit.
Verschiedene mathematische Tricks, die von einer der fünf StringtheorieTypen zur anderen führen, kann man als physikalische Eigenschaften der
vollen elfdimensionalen Raumzeit ansehen. Indem man bestimmte
«Gegenden» in dieser elfdimensionalen Raumzeit auswählt, kommt man zu
den fünf Typen der Stringtheorie.
Selbst wenn die Stringtheorie sich nicht als die richtige Beschreibung des
Universums erweisen sollte, hat sie doch größere Beiträge zur Mathematik
geliefert, die unglücklicherweise zu technisch sind, um sie hier
vorzustellen. Die Mathematiker werden die Stringtheorie also weiter
studieren und sie als wertvoll betrachten, selbst wenn die Physiker
beschließen, dass sie nicht auf die reale Welt passt.
Pentominos
Unter einem Pentomino versteht man eine ebene Form, die entsteht, wenn
man fünf identische Quadrate Kante an Kante aneinanderlegt. Es gibt dafür,
von Spiegelungen abgesehen, 12 Möglichkeiten. Üblicherweise bezeichnet
man sie mit den Buchstaben des Alphabets, die eine ähnliche Form haben.
12 ist auch die Kusszahl im dreidimensionalen Raum.
Abbildung 134: Die 12 Pentominos.
Polyominos
Allgemeiner ist ein n-omino eine Fläche aus n identischen Quadraten. Als
Oberbegriff dieser Formen hat man Polyomino gewählt. Es gibt
35 Hexominos (n = 6) und 108 Heptominos (n = 7).
Abbildung 135: Die 35 Hexominos.
Das allgemeine Konzept und der Name wurden von Solomon Colomb 1953
erfunden und von Martin Gardner im Scientific American populär gemacht.
Der Name ist eine Abwandlung des Wortes «Domino», ein Spielstein, der
aus zwei Quadraten besteht, wobei der Buchstabe D eine nette
Interpretation des lateinischen di oder des griechischen do mit der
Bedeutung «zwei» liefert. (Das Wort «Domino» kommt eigentlich vom
lateinischen dominus, «Herr».)
Abbildung 136: Die 108 Heptominos.
Vorläufer findet man in der Literatur zuhauf. Der englische Rätselspezialist
Henry Dudeney hatte ein Pentomino in seinen Canterbury Puzzles von
1907. Zwischen 1937 und 1957 druckte das Magazin Fairy Chess Review
viele Anordnungen bis hin zu Hexominos und nannte sie
«Zerlegungsrätsel».
Polyomino‑Rätsel
Polyominos im Allgemeinen und Pentominos im Besonderen bilden die
Grundlage für eine gewaltige Zahl unterhaltsamer Rätsel und Spiele. Zum
Beispiel können daraus interessante Formen gebildet werden.
Die zwölf Pentominos haben zusammen eine Fläche von 60, wenn jedes
Quadrat die Fläche 1 hat. Jede Art, 60 als Produkt von zwei ganzen Zahlen
zu schreiben, definiert ein Rechteck, und es ist eine amüsante und ziemlich
schwierige Aufgabe, die Pentominos so zusammenzusetzen, dass sie solch
ein Rechteck bilden. Man darf sie, wenn nötig, umdrehen, um das
Spiegelbild zu bekommen. Die möglichen Rechtecke sind 6 × 10, 5 × 12, 4
× 15 und 3 × 20. Man kann leicht erkennen, dass 2 × 30 und 1 × 60 nicht
möglich sind.
Abbildung 137: Die möglichen Rechtecke aus den 12 Pentominos.
Die Anzahl der Möglichkeiten, diese Rechtecke zusammenzulegen (wobei
Drehungen und Spiegelungen des gesamten Rechtecks nicht als verschieden
gezählt werden, man aber kleinere Rechtecke drehen und spiegeln darf,
solange alles andere unverändert bleibt) ist bekannt:
Eine weitere typische Knobelaufgabe geht von der Gleichung 8 × 8 – 2 × 2
= 60 aus und fragt, ob ein 8 × 8-Quadrat mit einem zentralen 2 × 2‑Loch in
der Mitte mit den zwölf Pentominos gelegt werden kann. Die Antwort
lautet «ja»:
Abbildung 138: Wie man ein gelochtes Quadrat aus Pentominos legt.
Ein ansprechender Weg, Hexominos zu einem Parallelogramm zu verlegen,
ist folgender:
Abbildung 139: Wie man ein Parallelogramm aus Hexominos bildet.
Die Anzahl der Polyominos
Mathematiker und Computerwissenschaftler haben für viele n berechnet,
wie viele n‑ominos es gibt. Falls Drehungen und Spiegelungen nicht als
verschieden angesehen werden, sind die Zahlen folgende:
n
Zahl der n-ominos
1
1
2
1
3
2
4
5
5
12
6
35
7
108
8
369
9
1285
10
4655
11
17 073
12
63 600
Tabelle 11
Kusszahl für Kugeln
Die Kusszahl für Kreise – die größte Anzahl von Kreisen, die einen
gegebenen Kreis berühren und alle die gleiche Größe haben – ist sechs
(siehe Kapitel [6]). Es gibt auch eine Kusszahl für Kugeln – die
größtmögliche Anzahl Kugeln, die eine gegebene Kugel berühren können
und alle die gleiche Größe haben. Diese Zahl ist 12.
Es ist relativ leicht nachzuweisen, dass 12 Kugeln eine weitere berühren
können. Tatsächlich kann man das so machen, dass die Kontaktpunkte die
zwölf Ecken eines regulären Ikosaeders bilden (siehe Kapitel [5]). Es
bleiben genug Zwischenräume, um Kugeln einzufügen, die einander
berühren.
In der Ebene lassen die sechs Kreise, die mit einem zentralen Kreis in
Kontakt sind, keinen freien Raum und die Anordnung ist starr. In drei
Dimensionen aber gibt es eine Menge freien Raum und die Kugeln können
bewegt werden. Lange Zeit wusste man nicht, ob nicht sogar Platz für eine
dreizehnte Kugel wäre, wenn man die anderen zwölf an die richtigen Plätze
rückte.
Zwei berühmte Mathematiker, Newton und David Gregory, haben lange
über diese Frage gestritten. Newton blieb dabei, dass die richtige Zahl 12
lautet, während Gregory überzeugt war, dass es 13 wäre. Anfang des
19. Jahrhunderts gab es Versuche, Newtons Ansicht zu beweisen, doch sie
hatten alle Lücken. Ein vollständiger Beweis, dass 12 die richtige Antwort
ist, erschien 1953.
Abbildung 140: Links: Wie zwölf Kugeln eine weitere berühren können. Rechts: Die
«Schatten» von zwölf Kugeln, die eine weitere in einer ikosaedrischen Anordnung berühren.
Vier und mehr Dimensionen
Ganz ähnlich ist die Lage im vierdimensionalen Raum, wo man relativ
leicht eine Anordnung von 24 3‑Sphären finden kann, die sich küssen; es
bleibt jedoch genug Platz, dass eine 25. hineinpassen könnte. Diese Lücke
wurde von Oleg Musin schließlich im Jahr 2003 ausgeschlossen: Wie
erwartet, ist die Antwort 24.
In den meisten übrigen Dimensionen wissen Mathematiker, dass
bestimmte Zahlen für sich küssende Sphären möglich sind, weil sie solche
Anordnungen angeben können und aus verschiedenen indirekten Gründen
eine größere Anzahl unmöglich ist. Diese Zahlen nennt man die untere
Schranke und obere Schranke für die Kusszahl. Diese muss irgendwo
dazwischen liegen, möglicherweise ist sie gleich einer der beiden.
Nur in zwei Fällen jenseits der vierten Dimension fallen untere und obere
Schranke zusammen, sodass ihr gemeinsamer Wert die Kusszahl ist.
Bemerkenswerterweise handelt es sich dabei um die Dimensionen 8 und 24,
in denen die jeweiligen Kusszahlen 240 und 196650 betragen. In diesen
Dimensionen gibt es zwei hochgradig symmetrische Gitter,
höherdimensionale Analoga von Quadratgittern oder allgemeiner von
Parallelogrammgittern. Diese speziellen Gitter bezeichnet man als E8 (oder
auch Gosset-Gitter) und Leech-Gitter, und die Kugeln können an
geeigneten Gitterpunkten platziert werden. Durch eine geradezu an Wunder
grenzende Koinzidenz sind die beweisbaren oberen Schranken für die
Kusszahl in diesen Dimensionen dieselben wie die unteren Schranken, die
man von diesen speziellen Gittern erhält. Den gegenwärtigen Stand dieser
Untersuchungen kann man in der Tabelle zusammenfassen, darin zeigt der
Fettdruck diejenigen Dimensionen, in denen eine exakte Antwort bekannt
ist:
Dimension
untere Schranke
obere Schranke
1
2
2
2
6
6
3
12
12
4
24
24
5
40
45
6
72
78
7
126
135
8
240
240
9
306
366
10
500
567
11
582
915
12
840
1416
13
1130
2233
14
1582
3492
15
2564
5431
16
4320
8313
17
5346
12 215
18
7398
17 877
19
10 688
25 901
20
17 400
37 974
21
27 720
56 852
22
49 896
86 537
23
93 150
128 096
24
196 560
196 560
Tabelle 12
Vielecke und Tapetenmuster
Schon in seiner Jugend entdeckte Gauß zu seiner und aller anderen
Überraschung, dass man ein 17-seitiges Viereck allein mit Zirkel und Lineal
konstruieren kann – etwas, das Euklid niemals geglaubt hätte. So ging es
auch allen anderen, und das mehr als 2000 Jahre lang.
Es gibt 17 verschiedene Symmetrietypen von Tapetenmustern. Das ist
eigentlich eine zweidimensionale Version von Kristallographie: der
Atomanordnung in Kristallen.
Im Standardmodell der Teilchenphysik gibt es 17 Typen fundamentaler
Teilchen (siehe Kapitel [11]).
Regelmäßige Vielecke
Ein Vieleck oder Polygon (griechisch für «viele Seiten») ist eine Form,
deren Kanten gerade Linien sind. Man nennt es regelmäßig, wenn jede
Kante dieselbe Länge hat und jeweils zwei Kanten sich unter demselben
Winkel treffen.
Regelmäßige Vielecke spielten in Euklids Geometrie eine zentrale Rolle
und haben sich seitdem für viele Gebiete der Mathematik als grundlegend
erwiesen. Eines der Hauptziele von Euklids Elementen bestand in dem
Nachweis, dass es genau fünf regelmäßige Polyeder gibt, Körper, deren
Begrenzungsflächen identische regelmäßige Vielecke sind, die an jeder
Ecke auf dieselbe Weise angeordnet sind (siehe Kapitel [5]). Zu diesem
Zweck musste er Flächen untersuchen, die regelmäßige Vielecke mit 3, 4,
und 5 Seiten waren. Größere Seitenzahlen kommen in den Flächen der
regelmäßigen Polyeder nicht vor.
Abbildung 141: Regelmäßige Vielecke mit 3, 4, 5, 7 und 8 Seiten. Sie heißen: gleichseitiges
Dreieck, Quadrat und regelmäßiges (oder reguläres) Fünfeck, Sechseck, Siebeneck und
Achteck.
Im Zuge des Beweises musste Euklid diese Formen konstruieren, indem er
die traditionellen Instrumente Zirkel und Lineal benutzte, weil seine
Geometrie auf diesen Voraussetzungen fußte. Die einfachsten
Konstruktionen ergeben das gleichseitige Dreieck und das regelmäßige
Sechseck. Ein Zirkel kann die Ecken festlegen. Für das Zeichnen der Seiten
braucht man ein Lineal, doch das ist nicht seine einzige Rolle.
Ein Quadrat zu konstruieren, ist ein bisschen schwieriger, doch es wird
ganz leicht, sobald man weiß, wie man einen rechten Winkel konstruiert.
Abbildung 142: Man zeichne einen Kreis und wähle einen Punkt auf ihm. Dann markiert
man aufeinanderfolgende Punkte rund um den Kreis mit dem Zirkel, der auf dieselbe
Entfernung eingestellt bleibt. Das führt zu den sechs Ecken eines regelmäßigen Sechsecks.
Jede zweite Ecke ergibt ein gleichseitiges Dreieck.
Abbildung 143: Auf einer Geraden sei ein Punkt gegeben. Man setze die Spitze des Zirkels
auf diesen Punkt und schlage einen Kreis, der die Gerade zweimal schneidet. Dann macht
man den Zirkel weiter und schlägt zwei Bögen, die sich schneiden. Die Gerade in der dritten
Abbildung steht dann senkrecht auf der ursprünglichen Geraden. Das wiederholt man für
die übrigen Seiten des Quadrats.
Das regelmäßige Fünfeck ist viel trickreicher. So hat Euklid es gemacht:
Drei verschiedene Ecken eines regelmäßigen Fünfecks bilden immer ein
Dreieck mit den Winkeln 36°, 72° und 72°. Man kann das auch umkehren
und ein regelmäßiges Fünfeck erhalten, indem man einen Kreis durch die
Ecken eines solchen Dreiecks schlägt und die beiden 72°-Winkel halbiert –
was Euklid in seinem Buch schon in einem früheren Kapitel gezeigt hatte
(siehe Kapitel [ ]).
Nun musste er nur noch ein Dreieck konstruieren, das diese spezielle
Form hatte, was sich wiederum als der schwierigste Teil der Konstruktion
erwies. Tatsächlich brauchte man dafür eine weitere trickreiche
Konstruktion, die ihrerseits auf der vorhergehenden beruhte. Wenig
überraschend stieß Euklid deshalb erst in Buch IV seines 13-teiligen
Buches zum regelmäßigen Fünfeck vor.
Abbildung 144: Links: Diese drei Ecken eines regulären Fünfecks bilden ein Dreieck mit den
Winkeln 36°, 72° und 72°. Rechts: Ist ein solches Dreieck vorgegeben, schlage man einen
Kreis durch seine Ecken (graue Linie) und halbiere die 72°‑Winkel (hellgrau). So erhält man
die restlichen beiden Ecken des Fünfecks.
Abbildung 145: Einfachere Konstruktion eines regelmäßigen Fünfecks.
Die Abbildung zeigt eine einfachere, zeitgemäßere Konstruktion. Sie
beginnt mit einem Kreis mit Mittelpunkt O und Durchmesser CM. Man
zeichne OS in rechtem Winkel zu CM und halbiere diese Strecke bei L.
Schlage einen Kreis um L durch O, der den ursprünglichen Kreis bei S
berührt. Die Strecke ML schneidet diesen Kreis bei N und P. Schlage
Kreisbögen (grau) um M durch N und P. Sie schneiden den großen Kreis
bei B, D, A und E. ABCDE (gestrichelt) ist ein regelmäßiges Fünfeck.
Mehr als sechs Seiten
Euklid wusste auch, wie man die Seitenzahl eines regulären Vielecks
verdoppelt, indem man die zentralen Winkel halbiert. Die Abbildung zeigt,
wie man aus einem regelmäßigen Sechseck ein regelmäßiges Zwölfeck
macht.
Abbildung 146: Links: Man beginnt mit einem Sechseck in einem Kreis. Zeichne seine
Diagonalen. Rechts: Halbiere die zentralen Winkel (gestrichelt). Die Winkelhalbierenden
schneiden den Kreis in den weiteren sechs Ecken eines regelmäßigen 12-Ecks.
Indem er die Konstruktionen für ein gleichseitiges Dreieck und ein
gleichseitiges Fünfeck kombinierte, erhielt Euklid ein gleichseitiges 15Eck. Das funktioniert, weil 3 × 5 = 15 und 3 und 5 teilerfremd sind.
Abbildung 147: Wie man ein 15-Eck konstruiert. Punkt A auf einem gleichseitigen Dreieck
und Punkt B auf einem regelmäßigen Fünfeck sind aufeinanderfolgende Ecken eines
regelmäßigen 15-Ecks. Mit einem Zirkel kann man die übrigen Ecken festlegen.
Durch Kombination all dieser Tricks konnte Euklid regelmäßige Vielecke
mit den folgenden Seitenzahlen konstruieren:
usw. – die Zahlen 3, 4, 5 und 15 und alle anderen, die man durch
wiederholtes Verdoppeln dieser Zahlen erhalten kann. Viele Zahlen fehlten
jedoch, als erste die 7.
Die Griechen waren nicht in der Lage, Konstruktionen mit Zirkel und
Lineal für die fehlenden regelmäßigen Vielecke zu finden. Was nicht hieß,
dass diese Vielecke nicht existierten; es legte nur nahe, dass die
Konstruktionsmethode mit Zirkel und Lineal dafür ungeeignet war.
Niemand hat offenbar angenommen, dass man irgendeines der fehlenden
Polygone möglicherweise doch mit Zirkel und Lineal konstruieren könnte,
oder auch nur die Frage aufgeworfen.
Das regelmäßige 17-Eck
Gauß, einer der größten Mathematiker, die jemals gelebt haben, wäre
beinah Linguist geworden. Aber im Jahr 1796 entdeckte er im Alter von
19 Jahren, dass die Zahl 17 zwei spezielle Eigenschaften hat, die in
Kombination dazu führen, dass es eine Konstruktion mit Zirkel und Lineal
für ein regelmäßiges 17-Eck gibt (auch Heptadekagon oder
Heptakaidekagon genannt).
Er machte diese erstaunliche Entdeckung nicht, als er sich mit Geometrie
befasste, sondern mit algebraischen Überlegungen. In den komplexen
17
Zahlen gibt es genau 17 Lösungen der Gleichung x = 1, und wie sich
herausstellt, bilden sie ein regelmäßiges 17-Eck in der komplexen Ebene:
siehe «Einheitswurzeln» in Kapitel [i]. Das war damals recht gut bekannt,
doch Gauß bemerkte etwas, das allen anderen entgangen war. Sie wussten
wie er, dass 17 eine Primzahl ist und dass sie um eins größer ist als eine
4
Potenz von 2, nämlich 16 + 1 und 16 = 2 . Gauß bewies jedoch, dass man
mit Hilfe der Kombination dieser beiden Eigenschaften die Gleichung mit
den üblichen Rechenoperationen der Algebra lösen kann – Addition,
Subtraktion, Multiplikation und Division –, wenn man zusätzlich noch das
Quadratwurzelziehen hinzunimmt. Und alle diese Operationen können
geometrisch mit Hilfe von Zirkel und Lineal vollzogen werden. Kurz und
gut, es musste eine Konstruktion mit Zirkel und Lineal für ein regelmäßiges
17-Eck geben. Und das war eine große Neuigkeit, da sich mehr als
2000 Jahre lang niemand so etwas hatte vorstellen können. Es kam aus
heiterem Himmel, vollkommen unerwartet. Gauß brachte es dazu, sich für
eine Karriere als Mathematiker zu entscheiden.
Er formulierte keine explizite Konstruktion, schrieb aber fünf Jahre
später in seinem Meisterwerk, den Disquisitiones Arithmeticae, folgende
Formel auf
und bewies, dass ein 17-Eck konstruiert werden kann, wenn man aus einer
Einheitsstrecke eine Gerade dieser Länge konstruieren kann. Da nur
Quadratwurzeln auftauchen, lässt sich die Formel in eine ziemlich
komplizierte geometrische Konstruktion umwandeln. Es gibt jedoch
leistungsfähigere Methoden, auf die verschiedene Leute kamen, als sie über
den Beweis von Gauß nachdachten.
Gauß war klar, dass dasselbe Argument griff, wenn man 17 durch
irgendeine andere Zahl mit denselben beiden Eigenschaften ersetzte: eine
Primzahl, die um 1 größer ist als ein n-te Potenz von 2. Diese Zahlen heißen
k
k
Fermat’sche Primzahlen. Algebraisch kann man beweisen, dass, falls 2 +1
eine Primzahl ist, dann auch k selbst entweder 0 oder eine Potenz von 2 sein
n
muss, also k = 0 oder 2 . Eine solche Zahl heißt dann Fermat-Zahl. Die
ersten paar Fermat-Zahlen zeigt Tab. 13:
Abbildung 148: Richmonds Methode, ein regelmäßiges 17-Eck zu konstruieren. Man nehme
zwei senkrechte Durchmesser AOP0 und BOC eines Kreises. Setze OJ =
OB
und den
Winkel OJE =
FP
0
OJP
. Bestimme F so, dass der Winkel EJF 45° ist. Schlage einen Kreis mit
0
als Durchmesser, der OB in K schneidet. Schlage um E einen Kreis durch K, der AP0 in
G und H schneidet. Zeichne HP3 und GP5 senkrecht zu AP0.
n
n
k
k=2
2 +1
Primzahl?
0
2
ja
0
1
3
ja
1
2
5
ja
2
4
17
ja
3
8
257
ja
4
16
65 537
ja
5
32
4 294 967 297 (das
nein
ist gleich 641 × 6 700
417)
Tabelle 13
Die ersten sechs Fermat-Zahlen sind Primzahlen. Die ersten drei, 2, 3 und
5, entsprechen Konstruktionen, die schon die Griechen kannten. Die
nächste, 17, ist Gauß’ Entdeckung. Es folgen zwei noch verblüffendere
Zahlen, 257 und 65537. Gauß’ Überlegung zeigt, dass regelmäßige
Vielecke mit diesen Seitenzahlen ebenfalls mit Zirkel und Lineal
konstruierbar sind. F. J. Richelt veröffentlichte 1832 eine Konstruktion für
das regelmäßige 257‑Eck. J. Hermes von der Universität Lingen widmete
zehn Jahre seines Lebens dem 65537-Eck. Seine unveröffentlichte Arbeit
kann man in der Universität Göttingen einsehen, doch halten Experten sie
für fehlerhaft. Es ist unklar, ob ihre Überprüfung der Mühe wert ist, weil
man ja weiß, dass eine Konstruktion existiert. Eine solche zu finden, ist
dann reine Routine, von dem gewaltigen Umfang der Rechnungen einmal
abgesehen. Ich schätze, das könnte ein guter Test für eine computergestützte
Beweisüberprüfung werden.
Eine Zeit lang glaubte man, dass alle Fermat-Zahlen Primzahlen seien,
jedoch bemerkte Euler 1732, dass die siebte Fermat-Zahl zusammengesetzt
ist, nämlich gleich 641 × 6700417. (Man muss bedenken, dass damals
Rechnungen per Hand ausgeführt werden mussten. Heute würde das ein
Computer in Sekundenbruchteilen herausbekommen.) Bis jetzt haben sich
keine weiteren Fermat-Zahlen als Primzahlen erwiesen. Sie sind für 5 ≤ n ≤
11 zusammengesetzt und die vollständige Primfaktorzerlegung ist in diesen
Fällen bekannt.
Die Fermat-Zahlen 12 ≤ n ≤ 32 sind zusammengesetzt, aber es sind nicht
alle Faktoren bekannt, und für n = 20 und 24 kennt man überhaupt keine
Faktoren. Es gibt einen indirekten Test, ob eine Fermat-Zahl prim ist, und
diese beiden Fälle bestehen den Test nicht. Die kleinste Fermat-Zahl mit
bekanntem Status ist n = 33, und sie hat 2585827973 Dezimalstellen. Nun
potenziere man 2 mit dieser Zahl und addiere 1… Gewaltig! Doch sollte
man angesichts der Größe nicht den Mut verlieren: Die größte bekannte
zusammengesetzte Fermat-Zahl ist F3329780, die durch
teilbar ist (Raymond Ottusch 2014).
Es erscheint plausibel, dass die bekannten Fermat’schen Primzahlen die
einzigen sind, es ist jedoch unbewiesen. Sollte diese Annahme falsch sein,
würde es ein konstruierbares regelmäßiges Vieleck mit einer absolut
gigantischen Primzahl-Anzahl von Seiten geben.
Tapetenmuster
Ein Tapetenmuster wiederholt dasselbe Motiv in zwei verschiedenen
Richtungen: die Wand abwärts und längs der Wand (möglicherweise
schräg). Die Abwärtswiederholung entsteht dadurch, dass das Papier als
fortlaufende Rolle gedruckt wird, wobei ein sich drehender Zylinder das
Muster erzeugt. Die Wiederholung längs der Wand ermöglicht es, das
Muster seitlich fortzuführen, um eine ganze Wand zu bedecken.
Die Anzahl möglicher Tapetendesigns ist gigantisch, aber viele
verschiedene Muster sind identisch angeordnet, sie benutzen nur
unterschiedliche Motive. Deswegen unterscheiden Mathematiker die
grundsätzlich verschiedenen Muster anhand ihrer Symmetrien. Welche
unterschiedlichen Möglichkeiten gibt es, ein Muster zu verschieben, zu
rotieren oder zu spiegeln, sodass am Ende dasselbe herauskommt?
Abbildung 149: Tapetenmuster wiederholen sich in zwei Richtungen.
Symmetrien der Ebene
Die Symmetriegruppe eines ebenen Designs enthält alle starren
Bewegungen der Ebene, die das Design auf sich selbst abbilden. Es gibt
vier wichtige Typen solcher Bewegungen:
Translation (Verschiebung ohne Rotation)
Rotation (Drehung um einen festen Punkt, das Rotationszentrum)
Reflexion (Spiegelung an einer Linie, der Spiegelachse)
Gleitspiegelung (Spiegelung und Verschiebung längs der
Spiegelachse)
Abbildung 150: Die vier Typen starrer Bewegungen.
Hat das Design endliche Ausdehnung, sind nur Rotations- und
Spiegelsymmetrien möglich. Pure Rotationen führen zu einer zyklischen
Gruppensymmetrie, während Rotationen plus Reflexionen dihedrale
Gruppensymmetrie ergeben.
Abbildung 151: Links: Zyklische Gruppensymmetrie (hier Drehungen um Vielfache eines
rechten Winkels). Rechts: Dihedrale Gruppensymmetrie (gepunktete Linien stellen
Spiegelachsen dar).
Tapetenmuster, die sich unentwegt wiederholen, können Translations- und
Gleitspiegelungssymmetrien haben. Zum Beispiel können wir das dihedrale
Schweinegruppendesign auf eine quadratische Kachel malen und diese
Kachel zum Bedecken der Ebene benutzen (Das Diagramm zeigt nur vier
dieser unendlich vielen Kachelanordnungen.) Nun gibt es
Translationssymmetrien (zum Beispiel die durchgezogenen Pfeile) sowie
auch Gleitspiegelungssymmetrien (zum Beispiel der gepunktete Pfeil).
Abbildung 152: Ein Feld quadratischer Kacheln mit Translations- (durchgezogene Pfeile)
und Gleitspiegelsymmetrien (gepunkteter Pfeil).
Die 17 Symmetrietypen von Tapeten
Für meine Tapete mit Blumenmuster sind die einzig möglichen Symmetrien
Verschiebung in den zwei Richtungen, in denen sich das Muster wiederholt,
oder verschiedene solche Verschiebungen, abwechselnd wiederholt. Das ist
der einfachste Typ von Tapetensymmetrie, und jedes Tapetendesign hat
diese Gittersymmetrien im mathematischen Sinne per Definition. Ich leugne
gar nicht, dass es Tapeten gibt, die im Grunde nur ein Wandbild darstellen
und keinerlei Symmetrien außer der trivialen «lass alles unverändert»
haben. Ich schließe solche Muster nur von dieser speziellen Betrachtung
aus.
Viele Arten von Tapeten haben zusätzliche Symmetrien, wie zum
Beispiel Rotationen und Spiegelungen. Im Jahr 1924 bewiesen George
Pólya und P. Niggli, dass es exakt 17 verschiedene Symmetrietypen für
Tapetenmuster gibt.
In drei Dimensionen besteht das entsprechende Problem darin, alle
möglichen Symmetriegruppen von kristallinen atomaren Gittern
aufzulisten. Dort sind es 230 Typen. Erstaunlicherweise wurde dieses
Problem gelöst, bevor irgendjemand das viel einfachere zweidimensionale
Tapetenproblem löste.
Abbildung 153: Die 17 Tapetenmuster-Typen und ihre internationale kristallographische
Bezeichnung. (Aus: MathWorld, a Wolfram web resource.)
Das Geburtstagsparadox
Während eines Fußballspiels sind gewöhnlich 23 Leute auf dem Spielfeld:
zwei Mannschaften mit jeweils 11 Spielern und der Schiedsrichter. (Es gibt
natürlich noch vier Assistenzschiedsrichter am Spielfeldrand, doch davon
werden wir absehen, genauso wie von Ambulanzhelfern, Fans, die das
Spielfeld stürmen, und wütenden Managern.) Wie groß ist die
Wahrscheinlichkeit, dass zwei oder mehr dieser 23 Leute denselben
Geburtstag haben?
Wahrscheinlicher als nicht
Die Antwort überrascht, es sei denn, Sie kennen sie schon.
Um die Berechnungen einfach zu halten, wollen wir annehmen, dass nur
365 unterschiedliche Geburtstage möglich sind (also kein 29. Februar für
Menschen, die in einem Schaltjahr geboren sind), und dass jedes dieser
Daten genau dieselbe Wahrscheinlichkeit hat:
. Die tatsächlichen
Zahlen zeigen eine kleine, aber signifikante Differenz, wobei einige Daten
oder Jahreszeiten wahrscheinlicher sind als andere; diese Differenzen sind
von Land zu Land unterschiedlich. Die gesuchte Wahrscheinlichkeit ändert
sich nicht viel, wenn man diese Faktoren berücksichtigt, und das Ergebnis
ist ohnehin genauso überraschend.
Wir nehmen weiterhin an, dass die Wahrscheinlichkeiten für jeden
Spieler unabhängig voneinander sind – was nicht der Fall wäre, wenn die
Spieler zum Beispiel bewusst so ausgewählt wären, dass sie
unterschiedliche Geburtstage haben. Oder wenn es zuginge wie in der
außerirdischen Eiswelt Gnux Prime. Hier schlüpft jede neue Generation
außerirdischer Monster zur gleichen Zeit aus dem unterirdischen
Winterquartier, und verschiedene Generationen spielen grundsätzlich nie im
selben Team – das wäre so wahrscheinlich wie eine Kreuzung zwischen
Menschen und Zikaden. Sobald zwei Gnuxoide auf dem Spielfeld sind,
wird die Wahrscheinlichkeit, dass sie denselben Geburtstag haben,
schlagartig 1.
Es ist einfacher, eine verwandte Wahrscheinlichkeit zu bestimmen: dass
alle 23 Geburtstage verschieden sind. Die Regeln für das Berechnen von
Wahrscheinlichkeiten besagen dann, dass wir diese von eins abziehen
müssen, um die gesuchte Antwort zu erhalten. Das heißt, die
Wahrscheinlichkeit, dass etwas nicht stattfindet, ist eins minus die
Wahrscheinlichkeit, dass das Ereignis stattfindet. Es vereinfacht die
Berechnung, wenn wir annehmen, dass die Spieler einer nach dem anderen
auf das Spielfeld kommen.
Wenn die erste Person das Spielfeld betritt, ist niemand sonst
zugegen. Die Wahrscheinlichkeit, dass ihr Geburtstag verschieden ist
von dem irgendeines anderen, ist also 1 (Gewissheit).
Mit dem Eintreffen der zweiten Person muss ihr Geburtstag
verschieden sein von dem der ersten, und dafür gibt es
364 Auswahlmöglichkeiten. Die Wahrscheinlichkeit, dass dem so ist,
ist
Sobald die dritte Person dazukommt, muss ihr Geburtstag sich von
denen der ersten beiden unterscheiden, dafür gibt es 363 von
365 Möglichkeiten. Die Regeln zum Berechnen von
Wahrscheinlichkeiten besagen, dass wir die einzelnen
Wahrscheinlichkeiten multiplizieren müssen, wenn wir die
Wahrscheinlichkeit dafür suchen, dass zwei unabhängige Ereignisse
eintreten. Also ist die Wahrscheinlichkeit dass keiner der
Geburtstage übereinstimmt, bis jetzt
Bei der vierten Person muss ihr Geburtstag sich von denen der ersten
drei unterscheiden, dafür gibt es 362 Möglichkeiten. Die
Wahrscheinlichkeit für Nichtübereinstimmung lautet bisher also
Die Gesetzmäßigkeit sollte jetzt klar sein. Nach k Personen auf dem
Spielfeld lautet die Wahrscheinlichkeit, dass alle k Geburtstage
verschieden sind
Für k = 23 ist das 0,492703, nur etwas weniger als . Die
Wahrscheinlichkeit, dass zumindest zwei Menschen denselben Geburtstag
haben, ist also 1 – 0,492703 und das ist
– also etwas größer als .
Mit anderen Worten: Bei 23 Personen auf dem Spielfeld ist es
wahrscheinlicher, dass zwei von ihnen am selben Tag Geburtstag haben, als
nicht.
Tatsächlich ist 23 die kleinste Zahl, für die diese Feststellung zutrifft. Bei
22 Menschen ist p(22) = 0,524305, etwas größer als . Also ist die
Wahrscheinlichkeit, dass wenigstens zwei Menschen denselben Geburtstag
haben, 1 – 0,524305
Das ist etwas kleiner als .
In der Abbildung sieht man, wie p(k) für k zwischen 1 und 50 von k
abhängt. Die waagerechte Linie steht für den Schwellenwert .
Abbildung 154: Wie p(k) von k abhängt.
Es überrascht, wie klein die Zahl 23 ist. Bei 365 Daten zur Auswahl könnte
man sich leicht vorstellen, dass eine Menge Leute zusammenkommen
müssen, bevor eine Übereinstimmung wahrscheinlicher wird als nicht.
Diese Intuition ist deswegen falsch, weil mit dem Hinzufügen weiterer
Menschen eine abnehmende Folge von Chancen miteinander multipliziert
wird. Deswegen nimmt das Ergebnis schneller ab, als man erwartet.
Am selben Tag wie Sie
Es könnte einen anderen Grund geben, warum man überrascht ist, wie klein
die Zahl ist, nämlich die Verwechslung mit einem anderen Problem: Wie
viele Menschen müssen zusammenkommen, damit die Wahrscheinlichkeit,
dass einer von ihnen denselben Geburtstag hat wie man selbst, größer ist als
?
Diese Frage ist etwas leichter zu beantworten. Wiederum berechnen wir
zunächst die Wahrscheinlichkeit, dass niemand denselben Geburtstag hat
wie man selbst. Die Wahrscheinlichkeit, dass irgendjemand am selben Tag
Geburtstag hat wie man selbst, ist immer dieselbe, nämlich
Damit ist die Wahrscheinlichkeit, dass bei k Personen alle ihre Geburtstage
vom eigenen verschieden sind
In diesem Ausdruck nehmen die Zahlen, die miteinander multipliziert
werden, nicht ab. Ihr Produkt nimmt zwar ab, je mehr wir dazunehmen,
weil
kleiner als 1 ist, aber die Abnahmerate ist geringer. Tatsächlich
braucht man k = 253, bevor diese Zahl unter
fällt.
Nun ist die Überraschung eher, dass diese Zahl so groß ist.
Geburtstage auf dem Jupiter
Wir haben 23 herausbekommen, weil es 365 Tage im Jahr gibt. Die Zahl
365 hat aber keine spezielle mathematische Relevanz: Sie taucht aus
astronomischen Gründen auf. Vom Standpunkt der Mathematik aus sollten
wir ein allgemeineres Problem lösen, bei dem die Zahl der Tage im Jahr
beliebig groß sein kann.
Beginnen wir mit dem Geburtstagsproblem für Bloons – ausgedachte
Aliens, die in Jupiters Wasserstoff‑Helium‑Atmosphäre schweben, weil ihre
Zellen mit Wasserstoff gefüllt sind. Jupiter ist weiter von der Sonne entfernt
als die Erde, also ist sein «Jahr» – die Zeit, die der Planet braucht, um die
Sonne zu umrunden – länger als unseres (das 4332,59-Fache). Außerdem
dreht er sich viel schneller, sodass sein «Tag» – die Zeit für eine
Umdrehung des Planeten um seine Achse – kürzer ist als unser Tag (9h
55min 30sec). Folglich hat Jupiters «Jahr» ungefähr 10477 «Jupitertage».
Auf ähnliche Weise kann man berechnen, dass immer dann, wenn
121 Bloons – drei Teams von jeweils 40 Bloons plus ein Schiedsrichter –
ein «Fließball-Spiel» austragen, die Wahrscheinlichkeit, dass wenigstens
zwei von ihnen denselben Geburtstag haben, etwas über
liegt. Genauer
wohingegen bei 120 Bloons die Wahrscheinlichkeit 0,495455 beträgt.
Die Jupiter-Mathematiker waren unzufrieden, immer wieder solche
Wahrscheinlichkeiten für unterschiedliche Zahlen von Jahrestagen zu
berechnen, und entwickelten deshalb eine allgemeine Formel. Sie ist nicht
ganz exakt, doch stellt sie eine sehr gute Näherung dar, und sie beantwortet
die allgemeine Frage: Wenn man n mögliche Tage zur Wahl hat, wie viele
Wesen müssen dann zusammenkommen, damit die Wahrscheinlichkeit, dass
wenigstens zwei von ihnen denselben Geburtstag haben, größer ist als ?
Ohne dass die Jupiteraner es ahnten, hatte eine unsichtbare Flotte von
außerirdischen Invasoren vom Nachbarplaneten Nebelbrücke den Jupiter
bereits länger als ein halbes Jupiterjahrhundert umrundet. Im Laufe der
Jahre haben sie viele 42er‑Gruppen von Jupiter-Mathematikern entführt,
weil sie hofften, ihnen ihr Geheimnis zu entreißen. Der Haken ist, dass ein
4
Nebelbrückenjahr exakt 42 = 3111696 Nebelbrückentage zählt, und
niemand es bisher geschafft hat, die zu 121 korrespondierende Zahl zu
errechnen.
Mit der Geheimformel vom Jupiter kann dieses Problem gelöst werden.
Sie besagt, dass bei n Jahrestagen und k Personen die Wahrscheinlichkeit,
dass mindestens zwei von ihnen denselben Geburtstag haben, erstmals
übersteigt, wenn k nahe
ist, wobei die Konstante die Quadratwurzel des Logarithmus von 4 zur
Basis e ist und den Wert 1,1774 hat.
Lassen Sie uns die Formel an drei Beispielen testen:
Erde: n = 365 und k ≈ 22,4944
Mars: n = 670 und k ≈ 30,4765
Jupiter: n = 10477 und k ≈ 120,516
Aufgerundet zur nächsten ganzen Zahl lauten die Schwellenwerte 23, 31
und 121. Das sind tatsächlich die exakten Zahlen. Allerdings ist die Formel
bei großen n nicht ganz so genau. Auf das Nebelbrückenjahr angewendet,
für das n = 3111696 gilt, ergibt die Formel
und aufgerundet 2077. Eine genaue Berechnung zeigt aber, dass
was etwas unterhalb
liegt. Die richtige Zahl stellt sich als 2078 heraus,
denn für sie ist
Die Näherungsformel erklärt, warum die Zahl der für eine
Geburtstagskoinzidenz nötigen Wesen so klein ist. Sie hat in etwa die Größe
der Quadratwurzel aus der Zahl der Tage im Jahr. Und das ist viel kleiner
als die Zahl der Tage. Zum Beispiel ist die Quadratwurzel für ein Jahr, das
1 Million Tage dauert, lediglich 1000.
Erwartungswert
Eine bekannte Variante des Problems lautet:
Wie groß ist bei n möglichen Geburtstagen die mittlere Anzahl von
Personen, die man braucht, damit wenigstens zwei denselben Geburtstag
haben?
Bei n = 365 ergibt sich als Antwort 23,9. Das liegt so nah bei 23, dass die
beiden Probleme häufig verwechselt werden. Wiederum gibt es eine gute
Näherungsformel:
und die Konstante ist
1,1774.
= 1,2533. Das ist etwas größer als
=
Frank Mathis hat eine genauere Formel für die Zahl von Personen
gefunden, die man braucht, damit eine Geburtstagskoinzidenz
wahrscheinlicher ist als nicht:
Srinivasa Ramanujan, ein indischer Autodidakt in Sachen Mathematik und
ein Genie für Formeln, fand eine genauere Formel für die mittlere Zahl von
Personen:
Geheime Botschaften
Bei der Erwähnung von Codes denken viele automatisch an James Bond
oder «Der Spion, der aus der Kälte kam». Doch fast jeder benutzt geheime
Codes im Alltag für ganz normale und legale Aktivitäten wie zum Beispiel
Internetbanking. Die Kommunikation mit der Bank ist verschlüsselt – in
einen Code übersetzt –, damit Kriminelle die Botschaften nicht lesen und
Zugriff auf unser Geld bekommen können. Zumindest nicht so einfach.
Es gibt 26 Buchstaben im deutschen Alphabet, und in der Praxis
benutzen Codes häufig die Zahl 26. Insbesondere Enigma, die Maschine,
die die Deutschen im Zweiten Weltkrieg benutzten, hatte Zahnräder mit
26 Stellungen, die den Buchstaben entsprachen. Deswegen bietet sich diese
Zahl als sinnvoller Einstieg in die Kryptographie an. Sie hat jedoch in
diesem Zusammenhang keine speziellen mathematischen Eigenschaften,
und ähnliche Prinzipien funktionieren mit anderen Zahlen.
Cäsars Geheimschrift
Die Geschichte der Codes geht zumindest bis ins alte Ägypten zurück, also
etwa bis 1900 v. Chr. Julius Cäsar benutzte einen einfachen Code für seine
private Korrespondenz und für militärische Geheimnisse. Sein Biograph
Suetonius schrieb: «Wenn er irgendetwas Vertrauliches mitteilen wollte,
schrieb er es chiffriert, d.h. indem er die Reihenfolge der Buchstaben des
Alphabets so abänderte, dass man kein Wort erkennen konnte. Falls
irgendjemand es entziffern und den Sinn herausbekommen will, muss er
den vierten Buchstaben des Alphabets, nämlich D, für A setzen und so
ähnlich mit anderen Buchstaben verfahren.»
Zu Cäsars Zeit enthielt das Alphabet nicht die Buchstaben J, Q und W,
wir machen aber mit dem heutigen Alphabet weiter, weil es uns vertrauter
ist. Cäsars Idee bestand darin, das Alphabet in seiner gewöhnlichen
Reihenfolge aufzuschreiben und dann eine verschobene Version darunter zu
schreiben – vielleicht etwa so:
ABCDEFGHIJKLMNOPQRSTUVWXYZ
FGHIJKLMNOPQRSTUVWXYZABCDE
Nun kann man eine Botschaft verschlüsseln, indem man jeden Buchstaben
im normalen Alphabet durch den Buchstaben an derselben Stelle im
verschobenen Alphabet ersetzt. Etwa A wird F, B wird G und so weiter.
Zum Beispiel so:
JULIUSCAESAR
OZQNZXHFJXFW
Um die Botschaft zu entschlüsseln, muss man die Entsprechung zwischen
den Alphabeten in der anderen Richtung lesen:
OZQNZXHFJXFW
JULIUSCAESAR
Um einen praktischen Apparat herzustellen, der automatisch das Alphabet
verschiebt, platzieren wir die Buchstaben auf einem Kreis oder auf einem
Zylinder:
Abbildung 155: Praktische Geräte zum Verdrehen.
Cäsars Schlüssel ist unsicher, weil er viel zu einfach ist, und die Gründe
erkläre ich gleich. Doch fußt er auf einigen grundlegenden Ideen, die allen
Schlüsseln, d.h. Geheimschriften, gemeinsam ist:
Klartext – die ursprüngliche Botschaft.
Chiffrierter Text – deren verschlüsselte Version.
Verschlüsselungsalgorithmus – die Methode, um den Klartext in
chiffrierten Text zu verwandeln.
Entschlüsselungsalgorithmus – die Methode, um verschlüsselten
Text in Klartext zu überführen.
Schlüssel – eine geheime Information, die man zum Chiffrieren und
Dechiffrieren von Text braucht.
In Cäsars Geheimschrift ist der Schlüssel die Anzahl von Stellen, um die
man das Alphabet verschiebt. Der Verschlüsselungsalgorithmus lautet
«Verschiebe das Alphabet um diesen Schlüssel». Der
Entschlüsselungsalgorithmus lautet «Verschiebe das Alphabet in der
umgekehrten Richtung um diesen Schlüssel», d.h. um minus Schlüssel in
dieselbe Richtung.
Abbildung 156: Allgemeine Merkmale von Verschlüsselungssystemen.
Bei diesem Verschlüsselungssystem sind Verschlüsselungs- und
Entschlüsselungsschlüssel eng verwandt: Einer ist das Negative des
anderen, d.h., dieselbe Verschiebung in entgegengesetzter Richtung. In
solchen Fällen kennt man mit dem Verschlüsselungsschlüssel automatisch
den Schlüssel zur Entschlüsselung. Ein solches System nennt man ein
symmetrisches Kryptosystem.
Cäsar benutzte wohl auch raffiniertere Geheimschriften, was auch
angebracht war.
Mathematische Beschreibung
Man kann Cäsars Geheimschrift mathematisch mit Hilfe der modularen
Arithmetik (siehe Kapitel [7]) beschreiben. In diesem Fall ist der Modulus
26 – die Zahl der Buchstaben im Alphabet. Gerechnet wird wie üblich, aber
mit einer zusätzlichen Bedingung: Jedes ganzzahlige Vielfache von 26 kann
durch null ersetzt werden. Genau das ist nötig, um das verschobene
Alphabet konsistent mit seinem Anfang zu verketten.
Auf diese Weise werden die Buchstaben A–Z durch die Zahlen 0–25
dargestellt, wobei A = 0, B = 1, C = 2 usw. bis Z = 25 ist. Der
Verschlüsselungsalgorithmus, der A (an der Stelle 0) nach F (an Position 5)
verschiebt, wird mathematisch durch die Regel
beschrieben. Man beachte, dass U (an Position 20) nach 20 + 5 = 25 (mod
26) wandert, was für Z steht, wohingegen V (an der Stelle 21) nach 21 + 5
= 26 = 0 (mod 26) geht, zum Buchstaben A. Damit stellt die mathematische
Formel sicher, dass das Alphabet sich richtig schließt.
Der Dechiffrierungsalgorithmus ist eine ähnliche Regel:
Da n + 5 – 5 = n (mod 26) ist, macht die Dechiffrierung die Verschlüsselung
rückgängig. Im Allgemeinen lautet für einen Schlüssel k, was «Verschiebe
um k Schritte nach rechts» bedeutet, die Regel für die Verschlüsselung
und die Dechiffrierung wird durch die Regel
beschrieben.
Die Verschlüsselung mathematisch zu formulieren, ist deswegen
gewinnbringend, weil wir nun die Chiffre präzise beschreiben und ihre
Eigenschaften analysieren können, ohne auf das jeweilige Alphabet achten
zu müssen. Nun geschieht alles mit Zahlen. Damit können wir auch
zusätzliche Symbole in den Blick nehmen – kleine Buchstaben a, b, c …;
Satzzeichen; Zahlen. Man muss nur statt 26 etwas Größeres nehmen und
ein für alle Mal entscheiden, wie man die Zahlen zuordnet.
Cäsars Geheimschrift entschlüsseln
Cäsars Geheimschrift ist hochgradig unsicher. Wie beschrieben, gibt es nur
26 Möglichkeiten; so könnte man alle ausprobieren, bis ein entschlüsseltes
Stück Text sinnvoll erscheint. Das klappt nicht für eine Abwandlung, die
man Substitution nennt. Dabei wird das Alphabet durcheinandergewürfelt
und nicht nur verschoben. Nun gibt es 26! Codes (siehe Kapitel [26!]), eine
gewaltige Anzahl. Doch gibt es eine einfache Methode, alle derartigen
Codes zu knacken. In jeder Sprache kommen einige Buchstaben häufiger
vor als andere.
Abbildung 157: Häufigkeit von Buchstaben in einem typischen deutschen Text.
Im Deutschen ergeben die sieben häufigsten Buchstaben hintereinander
gelesen ein Wort, das wie der Name eines Aufklärungssatelliten klingt:
ENIRSAT. E taucht in etwa 17,5 Prozent aller Texte auf, gefolgt von N mit
9,8 Prozent dann I mit 7,7 Prozent usw. Wenn Sie einen längeren
Geheimtext abfangen und den Verdacht haben, dass er mit Hilfe eines
durcheinandergewürfelten Alphabets erzeugt wurde, können Sie alle
Buchstabenhäufigkeiten ausrechnen. Sie werden wahrscheinlich nicht
genau das theoretische Ergebnis erhalten, denn Texte variieren. Wenn aber,
sagen wir, der Buchstabe Q öfter im Geheimtext erscheint als irgendetwas
sonst, kann man versuchen, E für Q einzusetzen. Falls der zweithäufigste
Buchstabe M ist, schaut man, was passiert, wenn man M durch N ersetzt
usw. Man kann die Reihenfolge auch ein bisschen verändern; selbst dann
muss man noch viel weniger Möglichkeiten ausprobieren.
Nehmen wir zum Beispiel an, dass ein Teil des Geheimtexts
folgendermaßen lautet
XJMNQXJMAB
und dass die sieben häufigsten Buchstaben im gesamten Geheimtext Q, U,
A, V, W, J und M sind, in dieser Reihenfolge. Nun ersetzt man E für Q, A
für J und T für M und lässt die übrigen Stellen frei:
–AT–E–ATI–
Es liegt nahe zu vermuten, dass die Botschaft eigentlich
MATHEMATIK
lauten sollte.
Hat man noch mehr chiffrierten Text, wird man feststellen können, ob
das sinnvoll ist, denn als Nächstes vermutet man, dass X für M steht, N für
H und B für K. Wenn der Geheimtext an einer anderen Stelle
XJFNMWGJWW
lautet, dann wird man ihn versuchsweise als
MA–HTS–ASS
entziffern, was vermutlich
MACHTSPASS
heißen soll. Dass W zweimal auftaucht, erweist sich dabei als nützliche
Bestätigung. Dieses Vorgehen geht sogar von Hand ganz flott und knackt
den Code schnell.
Es gibt Tausende verschiedene Verschlüsselungssysteme. Die Methode,
den Code zu knacken – also herauszufinden, wie man die Nachricht
entschlüsselt, ohne den Algorithmus oder den Schlüssel zu kennen –, hängt
vom Code ab. Es gibt ein paar praktikable Systeme, die praktisch
unmöglich zu knacken sind, weil der Schlüssel sich immer wieder
verändert, bevor die Kryptographen, die versuchen, den Code zu knacken,
über genug Informationen verfügen. Im Zweiten Weltkrieg bewerkstelligte
man das mit «Einmalschlüsseln»: Im Grunde war das eine Sammlung von
komplizierten Schlüsseln in einem Notizbuch, die jeweils nur einmal
benutzt und dann vernichtet wurden. Das Hauptproblem bei solchen
Methoden besteht darin, dass der Spion das Notizbuch mit sich führen muss
– oder heute eben ein elektronisches Gerät mit derselben Funktion – und
dass man es bei ihm finden konnte.
Enigma
Eines der bestbekannten Chiffriersysteme ist die deutsche EnigmaMaschine, die im Zweiten Weltkrieg benutzt wurde. Der Code wurde von
Mathematikern und Elektronikingenieuren geknackt, die in Bletchley Park
arbeiteten; der berühmteste unter ihnen war der Computerpionier Alan
Turing. Dass sie eine funktionierende Enigma-Maschine hatten, war ihnen
bei ihrer Aufgabe eine große Hilfe; die Maschine wurde ihnen 1939 von
einem Team polnischer Kryptographen zur Verfügung gestellt, die bereits
bedeutende Fortschritte beim Knacken des Enigma-Codes gemacht hatten.
Auch andere deutsche Codes wurden geknackt, einschließlich der noch
schwierigeren Lorenz-Geheimschrift, obwohl in diesem speziellen Falle
keine Maschine zur Verfügung stand. Stattdessen leitete ein Team von
Kryptoanalytikern unter Ralph Tester die wahrscheinliche Struktur der
Maschine aus den Botschaften her, die sie ausgab. Dann hatte Bill Tutte
einen Geistesblitz und machte beim Knacken des Codes einen Anfang, der
nützliche Information über die Funktionsweise der Maschine lieferte.
Danach ging alles sehr schnell. Die praktische Aufgabe, diesen Code zu
knacken, bedurfte eines elektronischen Rechners, Colossus, der von einem
Team unter Thomas Flowers entworfen und gebaut wurde. Colossus war
letztendlich einer der ersten elektronischen Computer, die für eine spezielle
Aufgabe entworfen wurden.
Abbildung 158: Eine Enigma.
Die Enigma bestand aus einer Tastatur zum Eingeben von Klartext und
einer Reihe von drehbaren Walzen, deren jeweils 26 Stellungen den
Buchstaben des Alphabets entsprachen. Frühe Maschinen hatten drei
Walzen; später wurden sie auf fünf aufgestockt – sogar acht für die deutsche
Marine –, von denen man jeden Tag jeweils drei neu auswählte. Der Zweck
der Walzen bestand darin, die Buchstaben des Klartextes auf eine Weise zu
verändern, die sich mit jedem neuen Buchstaben, der gedruckt wurde,
änderte. Wie das genau ging, ist kompliziert. Siehe
www.codesandciphers.org.uk/enigma/example1.htm
Grob vereinfacht funktioniert der Prozess folgendermaßen:
Jede Walze bringt das Alphabet wie in Cäsars Geheimschrift
durcheinander, wobei die Verschiebung durch ihre Position bestimmt wird.
Ein Buchstabe, der an die erste Walze kommt, wird verschoben, an die
zweite weitergegeben und abermals verschoben; dann wandert das Ergebnis
zur dritten Walze und wird ein drittes Mal verschoben. An diesem Punkt
erreicht das Signal einen Reflektor – einen Satz von 13 Drähten, die die
Buchstaben paarweise verbinden –, der den letzten Buchstaben in
denjenigen verwandelt, mit dem dieser Buchstabe per Draht verbunden ist.
Dann läuft das Ergebnis abermals durch die drei Walzen und ergibt
schließlich den endgültigen Codebuchstaben.
Der verschlüsselte Text wird dann von einem Lampenfeld abgelesen:
26 Birnen, jede hinter einem Buchstaben des Alphabets, die aufleuchten,
um den Buchstaben im Geheimtext anzuzeigen, der dem eingegebenen
Klartextbuchstaben entspricht.
Das einfallsreichste Merkmal der Maschine besteht darin, wie die
Entsprechung zwischen Klartextbuchstabe und dem zugehörigen
chiffrierten Buchstaben sich bei jedem Anschlag ändert. Mit jedem neuen
Buchstaben auf der Tastatur rotieren die Walzen zur nächsten Position
weiter und verändern das Alphabet damit auf unterschiedliche Weise. Die
Walze ganz rechts bewegt sich bei jedem Anschlag eine Position vorwärts.
Die mittlere dreht sich nur dann einen Schritt, wenn die rechte an Z
vorbeikommt und auf A zurückgeht. Ebenso macht es die linke Walze in
Bezug zur mittleren.
Abbildung 159: Drei Walzen in einer Reihe.
Die Walzen funktionieren also ganz ähnlich wie der Kilometerzähler in
einem Auto (bevor diese elektronisch wurden). Bei diesen dreht sich der
«Einerring» jeweils in einem Schritt von 0 bis 9 und dann weiter zurück auf
0. Der Zehnerring macht dasselbe, doch bewegt er sich nur, wenn er ein
«eins im Sinn»-Signal vom Einerring bekommt, sobald dieser sich von 9
auf 0 weiterdreht. Ganz ähnlich vergrößert sich die Hunderterstelle nur
dann um eins, wenn sie ein «eins im Sinn»‑Signal von der Zehnerposition
bekommt. So durchläuft die Reihe der drei Stellen die Zahlen 000 bis 999
in Einerschritten und kehrt dann wieder zu 000 zurück.
Die Enigma‑Motoren hatten jedoch nicht nur zehn, sondern 26
«Stellen» – die Buchstaben A bis Z. Außerdem konnten sie bei jeder
denkbaren Position starten, also an 26 × 26 × 26 = 17576 Positionen. Im
tatsächlichen praktischen Gebrauch wurde dieser Startpunkt zu Beginn des
Tages festgelegt und 24 Stunden lang benutzt, bevor er zurückgesetzt
wurde.
Ich habe den schrittweisen Prozess beschrieben, als liefe er von rechts
nach links, doch tatsächlich konnte man die Maschine so einstellen, dass sie
jede beliebige der sechs möglichen Stellringanordnungen realisieren
konnte. Das vervielfacht die möglichen Anfangseinstellungen um 6, was
105456 Möglichkeiten ergibt.
Für den militärischen Gebrauch wurde eine zusätzliche Sicherung durch
ein Steckerbrett gewährleistet, das Buchstaben paarweise vertauschte, je
nachdem, welcher Buchstabe per Kabel mit einem anderen verbunden war.
Bis zu zehn solcher Kabel wurden benutzt, was die Anzahl der
Anfangskonfigurationen auf 150738274937250 wachsen lässt. Und auch
hier wurden die Einstellungen am Steckerbrett jeden Tag geändert.
Dieses System hat für den Nutzer einen bedeutenden praktischen Vorteil:
Es ist symmetrisch. Man kann dieselbe Maschine auch zum Entschlüsseln
von Botschaften benutzen. Die Anfangseinstellungen eines Tages müssen
nur an alle Nutzer weitergegeben werden: Die Deutschen benutzten zu
diesem Zweck eine Variante des Einmal-Notizbuchs.
Wie der Enigma-Code geknackt wurde
Andererseits birgt die Methode auch Schwächen. Die auffälligste ist
folgende: Falls der Feind – in diesem Fall die Alliierten – die Einstellungen
herausbekam, konnte jede Botschaft entschlüsselt werden, die an diesem
Tag gesendet wurde. Es gab auch noch andere Schwächen. Insbesondere
war der Code immer dann unsicher, wenn dieselben Einstellungen an zwei
aufeinanderfolgenden Tagen benutzt wurden – wie es gelegentlich aus
Versehen vorkam.
Abbildung 160: Das Steckerbrett mit zwei Kabelverbindungen.
Indem sie diese Schwächen ausnutzten, knackte das Team in Bletchley Park
den Enigma-Code zum ersten Mal im Januar 1940. Ihre Arbeit stützte sich
stark auf Wissen und Ideen, die von einem polnischen KryptoanalytikerTeam unter der Leitung des Mathematikers Marian Rejewski stammten, das
seit 1932 versuchte, die Enigma-Codes zu knacken. Die Polen entdeckten
einen Fehler, der auf der Art und Weise beruhte, wie die täglichen
Einstellungen an Benutzer weitergegeben wurden. Das reduzierte
letztendlich die Anzahl der Einstellungen, die man untersuchen musste, von
10000 Billionen auf etwa 100000. Anhand einer Liste mit diesen
Einstellungsmustern konnten die Polen schnell herausfinden, welche
Einstellung an einem bestimmten Tag benutzt wurde. Sie erfanden eine
Maschine namens Zyklometer, die ihnen dabei half. Den Katalog
vorzubereiten dauerte ungefähr ein Jahr, doch sobald er komplett war,
brauchte man nur 15 Minuten, um die Einstellung des Tages abzuleiten und
den Code zu knacken.
Die Deutschen verbesserten ihr System 1937, und die Polen mussten von
vorn anfangen. Sie entwickelten verschiedene Methoden, deren
leistungsfähigste ein Gerät war, dass sie bomba kryptologiczna nannten.
Jede dieser Methoden erstellte eine Analyse der 17576 möglichen
Grundeinstellungen der drei Walzen inklusive der sechs möglichen
Anordnungen der Walzen.
Im Jahr 1939 führte Turing, kurz nachdem er in Bletchley Park
angekommen war, eine britische Version der bomba ein, die als Bombe
bekannt wurde. Auch ihre Funktion bestand darin, die
Anfangseinstellungen der Walzen und ihre Anordnung herauszubekommen.
Im Juni 1941 waren fünf Bomben in Gebrauch; am Ende des Krieges 1945
gab es 210. Als die deutsche Marine auf Maschinen mit vier Walzen
wechselte, führte man modifizierte Bomben ein.
Als das deutsche System verändert wurde, um seine Sicherheit zu
erhöhen, fanden die Codeknacker Wege, die Verbesserungen obsolet zu
machen. Etwa um 1945 konnten die Alliierten nahezu alle deutschen
Botschaften entschlüsseln, das deutsche Oberkommando jedoch glaubte
weiterhin, dass die gesamte Kommunikation vollkommen sicher sei. Ihre
Kryptographen dagegen machten sich keine derartigen Illusionen,
bezweifelten jedoch, dass irgendjemand den gewaltigen Aufwand treiben
würde, der nötig wäre, um den Code zu knacken. Die Alliierten hatten einen
gewaltigen Vorteil erlangt, doch sie mussten im Umgang damit sehr
vorsichtig sein, um ihre Fähigkeiten, die Botschaften zu entschlüsseln, nicht
preiszugeben.
Codes mit asymmetrischem Schlüssel
Eine der größten Ideen in der Kryptographie ist die Möglichkeit
asymmetrischer Schlüssel. Dabei sind Chiffrierschlüssel und
Dechiffrierschlüssel verschieden; und zwar so stark, dass es praktisch nicht
möglich ist, den Dechiffrierschlüssel aus dem Chiffrierschlüssel abzuleiten.
Das mag unwahrscheinlich erscheinen, da der eine Prozess die Umkehrung
des anderen darstellt, doch gibt es Methoden, die Schlüssel so einzustellen,
dass «den Verschlüsselungsweg umkehren» nicht machbar ist. Ein Beispiel
ist der RSA‑Code (siehe Kapitel [7]), der auf Eigenschaften von Primzahlen
in der modularen Arithmetik beruht. In diesem System können
Chiffrieralgorithmus, Dechiffrieralgorithmus und chiffrierter Schlüssel
öffentlich gemacht werden und selbst dann ist es nicht möglich, den
Dechiffrierschlüssel herauszubekommen. Nur legitimierte Empfänger
können das, weil sie außerdem über einen geheimen Schlüssel verfügen, der
ihnen sagt, wie man die Botschaft dechiffriert.
Die Wurst-Vermutung
Es ist bewiesen, dass diejenige Anordnung von Kugeln, deren konvexe
Hülle das kleinste Volumen hat, immer einer Wurst gleicht, solange es sich
um 56 oder weniger Kugeln handelt, aber ab 57 Kugeln gilt das nicht mehr.
Schrumpffolienverpackung
Um dieses Ergebnis zu verstehen, beginnen wir mit etwas Einfacherem:
Kreise verpacken. Stellen Sie sich vor, Sie wollten eine Menge identischer
Kreise in der Ebene in eine Schrumpffolie packen, indem Sie sie mit einer
möglichst kurzen Kurve umschließen. Technisch gesprochen nennt man
diese Kurve die konvexe Hülle der Menge von Kreisen. Bei sieben Kreisen
zum Beispiel könnte man es mit einer langen Wurst versuchen:
Abbildung 161: Wurstform und Umhüllung.
Stellen Sie sich nun jedoch vor, Sie wollten die Gesamtfläche innerhalb der
Kurve so klein wie möglich machen. Wenn alle Kreise den Radius 1 haben,
ist die Fläche der Wurst gegeben durch
Es gibt jedoch eine bessere Anordnung für die Kreise, nämlich ein
Sechseck mit einem Kreis in der Mitte, und nun ist die Fläche gegeben
durch
was kleiner ist.
Abbildung 162: Die umhüllte Sechseckanordnung ergibt eine kleinere Fläche als die Wurst.
Tatsächlich ist die Wurstform sogar mit nur drei Kreisen nicht die beste. Die
Fläche innerhalb der Kurve ist
für eine Wurst, jedoch
für ein Dreieck aus Kreisen.
Abbildung 163: Wurstform und Umhüllung mit drei Kreisen. Das Dreieck hat eine kleinere
Fläche.
Nimmt man nun jedoch anstelle von Kreisen identische Kugeln und
Schrumpffolie, die sie so umgibt, dass die Oberfläche möglichst klein ist,
dann führt die lange Wurstform für sieben Kugeln zu einem kleineren
Gesamtvolumen als das Sechseckarrangement. Tatsächlich ergibt die
Wurstform das kleinste Volumen innerhalb der Verpackung für bis zu
56 Kugeln einschließlich. Mit 57 oder mehr Kugeln ist die minimale
Anordnung jedoch rundlicher.
Was in Räumen mit vier und mehr Dimensionen passiert, ist noch
weniger einzusehen. Die Anordnung vierdimensionaler Kugeln, deren
Umhüllung das kleinste vierdimensionale «Volumen» ergibt, ist eine Wurst,
solange die Anzahl der Kugeln kleiner als 50000 ist. Bei mehr als
100000 Kugeln ist es jedoch keine Wurst mehr. Das heißt, um beim
Einpacken das kleinste Volumen zu bekommen, braucht man sehr lange,
dünne Kugelwürste, bis man unheimlich viele Kugeln nimmt. Niemand
weiß, bei welchem Wert genau die vierdimensionalen Würste nicht mehr
die besten Formen sind.
Der wirklich faszinierende Formenwechsel passiert wahrscheinlich in
fünf Dimensionen. Man könnte denken, dass in fünf Dimensionen Würste
die beste Lösung für, sagen wir, bis zu 50 Milliarden Kugeln sind, dass
dann aber irgendetwas Runderes ein kleineres fünfdimensionales Volumen
ergibt und für sechs Dimensionen dasselbe bis zu 29 Quadrillionen Kugeln
gilt usw. Im Jahr 1975 jedoch formulierte Laszlo Fejes Tóth die WurstVermutung, die besagt, dass in fünf und mehr Dimensionen die Anordnung
von Kugeln, deren konvexe Hülle minimales Volumen hat, immer eine
Wurst ist – ganz gleich, wie groß die Zahl der Kugeln auch sein mag.
Im Jahr 1998 bewiesen Ulrich Betke, Martin Henk und Jörg Wills, dass
Tóth in allen Dimensionen ab 42 recht hat. Das ist alles, was wir bis heute
mit Sicherheit sagen können.
Endliche Geometrie
Über etliche Jahrhunderte gab es nichts als Euklids Geometrie. Man
glaubte, sie sei die wahre Geometrie des Raums und hielt keine andere
Geometrie für möglich. Heute glauben wir weder das eine noch das andere.
Es gibt viele Arten nichteuklidischer Geometrie, die gekrümmten Flächen
entsprechen. Die allgemeine Relativitätstheorie hat gezeigt, dass die reale
Raumzeit in der Nähe massiver Körper, wie Sterne es sind (siehe
Kapitel [11]), nicht flach, sondern gekrümmt ist. Eine weitere Art von
Geometrie, die projektive Geometrie, entwickelte sich aus der Perspektive
in der Kunst. Es gibt sogar Geometrien mit nur endlich vielen Punkten. Die
einfachste hat sieben Punkte, sieben Strecken und 168 Symmetrien. Sie
führt zu der bemerkenswerten Geschichte der endlichen einfachen Gruppen
und findet ihre Krönung in der bizarren Gruppe, die man – ganz zu Recht –
das Monster nennt.
Nichteuklidische Geometrie
Als Menschen begannen, um die Erde zu reisen, wurde die sphärische
Geometrie – die natürliche Geometrie der Kugeloberfläche – bedeutsam,
weil eine Kugel ein ziemlich genaues Modell der Erde ist. Es war nicht
exakt – die Erde ähnelt mehr einem Sphäroid, sie ist an den Polen
abgeflacht. Doch die Kunst der Navigation war ihrerseits nicht exakt. Eine
Kugel ist jedoch eine Oberfläche im euklidischen Raum, deshalb sah man
die sphärische Geometrie nicht als eine neue Art von Geometrie an, sondern
lediglich als Spezialfall der euklidischen. Schließlich hält auch niemand die
Geometrie eines Dreiecks für eine radikale Abwendung von Euklid, auch
wenn ein Dreieck genau genommen keine Ebene ist.
All das änderte sich, als Mathematiker begannen, sich eine Eigenschaft
der euklidischen Geometrie genauer anzuschauen: die Existenz von
Parallelen. Das sind gerade Linien, die sich niemals treffen, ganz gleich,
wie weit sie sich erstrecken. Euklid muss klar gewesen sein, dass Parallelen
ihre Feinheiten haben, denn er war klug genug, ihre Existenz als eines der
grundlegenden Axiome bei der Entwicklung seiner Geometrie zugrunde zu
legen. Er muss wohl auch verstanden haben, dass das nicht
selbstverständlich war.
Die meisten seiner Axiome waren eingängig und intuitiv: «Je zwei rechte
Winkel gleichen sich», zum Beispiel. Im Gegensatz dazu war das
Parallelenaxiom geradezu geschwätzig. «Wenn eine Gerade zwei Geraden
trifft und mit ihnen auf derselben Seite innere Winkel bildet, die zusammen
kleiner sind als zwei rechte Winkel, dann treffen sich die beiden Geraden,
wenn man sie ins Unendliche verlängert, schließlich auf der Seite, auf der
die Winkel liegen, die kleiner als zwei rechte Winkel sind.» Mathematiker
fragten sich, ob eine derartige Komplexität notwendig war. Konnte man
vielleicht die Existenz von Parallelen aus den übrigen euklidischen
Axiomen beweisen?
Zumindest schafften sie es, Euklids umständliche Formulierung durch
einfachere und intuitivere Annahmen zu ersetzen. Die einfachste ist wohl
Playfairs Axiom: Ist eine Gerade gegeben und ein Punkt, der nicht auf ihr
liegt, dann existiert eine eindeutige Parallele zu der vorgegebenen Linie, die
durch den Punkt verläuft. Es ist nach John Playfair benannt, der es 1795 in
den Elements of Geometry konstatierte. Genau genommen forderte er, dass
es höchstens eine Parallele gab, weil andere Axiome ausreichten, um zu
beweisen, dass zumindest eine Parallele existiert. Es gab viele Versuche,
das Parallelenaxiom aus den übrigen euklidischen Aktionen herzuleiten,
doch sie schlugen alle fehl. Letztendlich wurde auch der Grund klar: Es
geht einfach nicht. Es gibt Modelle für Geometrien, die alle euklidischen
Axiome außer dem einen über Parallelen erfüllen. Würde ein Beweis des
Parallelenaxioms existieren, dann wäre das Axiom auch in solch einem
Modell gültig, was es jedoch nicht ist. Deswegen – kein Beweis.
Tatsächlich bildet die sphärische Geometrie solch ein Modell. «Linie»
wird darin neu als «Großkreis» interpretiert, ein Kreis, in dem eine Ebene
durch den Mittelpunkt der Kugel die Oberfläche schneidet. Zwei beliebige
Kreise schneiden sich immer, deswegen gibt es überhaupt keine Parallelen
in dieser Geometrie. Dieses Gegenbeispiel blieb jedoch unbeachtet, weil
sich zwei unterschiedliche Kreise in zwei Punkten treffen, die diametral
gegenüberliegen. Im Gegensatz dazu verlangt Euklid, dass sich zwei
beliebige Geraden in einem Punkt treffen, außer sie sind parallel und treffen
sich überhaupt nicht.
Aus heutiger Sicht liegt die Antwort auf der Hand: Man muss nur
«Punkt» durch «diametral gegenüberliegende Punkte» ersetzen. Das führt
zur sogenannten elliptischen Geometrie. Doch für damalige Geschmäcker
war das viel zu abstrakt und ließ ein Schlupfloch offen, das Playfair
ausnutzte, als er solche Geometrie ausschloss. Stattdessen entwickelten
Mathematiker die hyperbolische Geometrie, in der unendlich viele
Parallelen zu einer vorgegebenen Geraden durch einen gegebenen Punkt
verlaufen. Ein Standardmodell ist das Kreisscheibenmodell von Henrí
Poincaré, das das Innere eines Kreises darstellt. Als Gerade wird jeder
Kreisbogen definiert, dessen Enden unter rechten Winkeln auf den Rand
treffen. Es dauerte etwa ein Jahrhundert, bis diese Ideen sich festgesetzt
hatten und nicht mehr umstritten waren.
Abbildung 164: Das Poincaré’sche Scheibenmodell der hyperbolischen Ebene (schattiert).
Beide grauen Geraden sind parallel zu der schwarzen und verlaufen durch denselben
Punkt.
Projektive Geometrie
Derweil entwickelte sich eine weitere Variante der euklidischen Geometrie.
Sie kam aus Kunst und Architektur, als italienische Renaissancekünstler die
Perspektive entdeckten. Stellen Sie sich vor, Sie stünden auf einer flachen
euklidischen Ebene zwischen zwei Parallelen – wie jemand, der in der
Mitte einer unendlich langen, absolut geraden Straße steht. Was sehen Sie?
Was Sie nicht sehen, sind zwei Geraden, die sich niemals treffen.
Stattdessen sehen Sie zwei Geraden, die sich am Horizont treffen.
Wie kann das sein? Euklid sagt, dass sich Parallelen nicht treffen; Ihr
Auge sagt Ihnen, dass sie es doch tun. In Wirklichkeit gibt es keinen
logischen Widerspruch. Euklid behauptet ja nur, dass sich Parallelen nicht
in einem Punkt der Ebene treffen. Der Horizont ist aber nicht Teil der
Ebene. Wäre er es, dann wäre er der Rand der Ebene, aber eine Ebene hat
keinen Rand. Künstler benötigen keine euklidische Ebene, sondern eine
Ebene mit einem Extra: dem Horizont. Und den kann man sich als eine
«Gerade im Unendlichen» denken, zusammengesetzt aus «Punkten im
Unendlichen» – und zwar die, in denen sich Parallelen treffen.
Abbildung 165: Parallelen treffen sich am Horizont.
Diese Beschreibung wird sinnvoller, wenn man bedenkt, was ein Maler tut.
Der stellt eine Staffelei mit einer Leinwand auf und überträgt die Szene vor
sich auf die Leinwand, indem er sie projiziert. Er tut das mit dem Auge oder
mit Hilfe von mechanischen oder optischen Instrumenten. Mathematisch
gesprochen, projiziert man einen Punkt auf die Leinwand, indem man sich
eine Gerade von dem Punkt zum Auge des Künstlers denkt und dort einen
Punkt auf die Leinwand malt, wo diese Gerade die Leinwand trifft. Das ist
im Wesentlichen die Funktionsweise einer Kamera: Die Linse projiziert die
äußere Welt auf den Film oder bei Digitalkameras einen CCD-Chip. Unser
Auge projiziert ganz ähnlich eine Szene auf unsere Netzhaut.
Um zu verstehen, wo der Horizont herkommt, zeichnen wir das Bild der
Parallelen von der Seite (Abbildung nächste Seite). Punkte in der
euklidischen Ebene (grau) werden auf Punkte unterhalb des Horizonts
projiziert. Geraden vor dem Maler bilden sich auf Geraden am Ende des
Horizonts ab. Der Horizont selbst ist nicht die Projektion irgendeines
Punktes der Ebene.
Abbildung 166: Links: Dürers Stich aus dem Jahr 1525, der die Projektion illustriert. Rechts:
Wie Parallelen auf eine Leinwand projiziert werden.
Nehmen Sie an, Sie wollten einen solchen Punkt wiederfinden, indem sie
ihn zurückprojizieren, wie durch die Linie mit dem Pfeil angedeutet. Der
Horizont verläuft parallel zur Ebene, also trifft er sie nie. Er setzt sich ins
Unendliche fort, ohne die Ebene zu treffen. Folglich entspricht nichts auf
der Ebene dem Horizont.
Auf der Grundlage dieser Idee kann man eine logisch konsistente
Geometrie aufbauen. Man erweitert die euklidische Ebene durch eine
«Linie im Unendlichen», die aus «Punkten im Unendlichen» besteht. In
diesem Modell, das man projektive Geometrie nennt, gibt es keine
Parallelen. Je zwei Geraden schneiden sich in genau einem Punkt. Zudem
können, wie in der euklidischen Geometrie, zwei beliebige Punkte durch
eine Gerade verbunden werden. Nun gibt es also eine befriedigende
«Dualität»: Wenn man Punkte mit Geraden und Geraden mit Punkten
austauscht, bleiben alle Axiome gültig.
Die Fano-Ebene
Im Gefolge dieser Idee spekulierten Mathematiker, ob es vielleicht endliche
Analogien der projektiven Geometrie geben könnte, d.h. Konfigurationen
aus einer endlichen Zahl von Punkten und Geraden, für die galt:
Je zwei Punkte liegen auf exakt einer Geraden.
Je zwei Geraden treffen sich in exakt einem Punkt.
Tatsächlich gibt es solche Konfigurationen – wenn auch nicht unbedingt als
Diagramme in Ebene oder Raum darstellbar. Man kann sie algebraisch
definieren, indem man spezielle Koordinatensysteme für die projektive
Geometrie einführt. Statt eines Paars reeller Zahlen (x, y), wie wir sie
normalerweise für die euklidische Ebene benutzen, nimmt man ein Tripel
(x, y, z). Normalerweise definieren Tripel Koordinaten im
dreidimensionalen euklidischen Raum, wir fordern jedoch eine zusätzliche
Bedingung. Das Einzige, auf das es ankommt, sind die Verhältnisse der
Koordinaten. Zum Beispiel steht (1, 2, 3) für denselben Punkt wie (2, 4, 6,)
oder wie (3, 6, 9).
Nun kann man (x, y, z) fast durch das Paar ( ,
) ersetzen, was uns zu
den zwei Koordinaten und der euklidischen Ebene zurückführt. Allerdings
kann z in diesem Fall null sein. Wenn das der Fall ist, können wir uns
und
als «unendlich» vorstellen, wobei erfreulicherweise das Verhältnis
immer noch sinnvoll ist. Damit befinden sich Koordinaten (x, y, 0) «im
Unendlichen», und die Menge aller dieser Tripel bildet die Gerade im
Unendlichen – den Horizont. Nur ein einziges Tripel muss man bei all
diesen Überlegungen ausschließen: Wir einigen uns, dass (0, 0, 0) keinen
Punkt darstellt. Wäre es so, würde es alle Punkte repräsentieren, weil (x, y,
z) und (0x, 0y, 0z) dasselbe wären. Letzteres ist jedoch (0, 0, 0).
Hat man sich einmal an diese sogenannten homogenen Koordinaten
gewöhnt, kann man ein ähnliches Spiel in größerer Allgemeinheit spielen.
Insbesondere erhalten wir endliche Konfigurationen mit den gewünschten
Eigenschaften, indem wir die Koordinaten von reellen Zahlen zu ganzen
Zahlen modulo p verändern, wobei p eine Primzahl ist. Nehmen wir p = 2,
der einfachste Fall, sind die möglichen Koordinatenziffern 0 und 1. Es gibt
dann acht Tripel, wobei wiederum (0, 0, 0) nicht erlaubt ist, sodass sieben
Punkte übrig bleiben:
Die sich daraus ergebende «endliche projektive Geometrie» heißt FanoEbene nach dem italienischen Mathematiker Gino Fano, der diese Idee im
Jahr 1892 veröffentlichte. Tatsächlich beschrieb er eine endliche projektive
dreidimensionale Geometrie mit 15 Punkten, 35 Geraden und 15 Ebenen.
Er braucht dafür vier Koordinaten mit den Ziffern 0 oder 1, mit Ausnahme
von (0, 0, 0, 0). Jede Ebene hat dieselbe Geometrie wie die Fano-Ebene.
Abbildung 167: Die sieben Punkte und sieben Geraden der Fano-Ebene.
Die Fano-Ebene hat sieben Geraden, von denen jede drei Punkte enthält,
und sieben Punkte, die jeweils auf drei Geraden liegen. In der Zeichnung
sind alle Geraden außer der Geraden BCD, die kreisförmig ist, als gerade
Linien gezeichnet. Doch ist das darauf zurückzuführen, dass man versucht,
ganze Zahlen modulo 2 in der üblichen Ebene darzustellen. Tatsächlich
werden alle sieben Punkte symmetrisch behandelt. Die Koordinaten von je
drei Punkten, die eine Gerade bilden, addieren sich immer zu null: Zum
Beispiel entspricht die untere Gerade
denn 1 + 1 = 0 modulo 2.
Symmetrien der Fano-Ebene
Noch immer ist 168 nicht in Sicht, doch wir kommen langsam näher. Der
Schlüssel ist die Symmetrie.
Eine Symmetrie eines mathematischen Objekts oder Systems ist eine Art,
es zu verändern, die seine Struktur erhält. Die natürlichen Symmetrien der
euklidischen Geometrie sind starre Bewegungen, die weder Winkel noch
Abstände verändern. Beispiele sind Translationen, die die Ebene seitwärts
verschieben, Rotationen, die sie um einen festen Punkt drehen, und
Spiegelungen, die sie an einer festen Geraden spiegeln.
Die natürlichen Symmetrien der projektiven Geometrie sind nicht die
starren Bewegungen, denn Projektionen können Formen verzerren sowie
Längen und Winkel verkleinern oder vergrößern. Symmetrien sind die
Projektionen selbst: Transformationen, die die Beziehungen zwischen
Geraden und Punkten nicht verändern, d.h., ob ein Punkt auf einer Gerade
liegt oder nicht. Symmetrien sind heute als wichtige Eigenschaften aller
mathematischen Objekte anerkannt. Deswegen ist es nur natürlich, nach den
Symmetrien der Fano-Ebene zu fragen.
Ich spreche nicht von starren Bewegungssymmetrien der Zeichnung. So
wie ein gleichseitiges Dreieck hat sie sechs Bewegungssymmetrien. Was
ich meine, sind Permutationen der sieben Punkte, sodass immer dann, wenn
drei Punkte eine Gerade bilden, die permutierten Punkte das auch tun. Zum
Beispiel könnten wir die untere Gerade EDF in den Kreis CDB
transformieren. Bezeichnen wir das so:
sodass der Strich anzeigt, wie die drei Buchstaben zu transformieren sind.
Wir müssen entscheiden, was A', B', C' und G' sein sollen, sonst haben wir
keine Permutation. Sie müssen von C, D und B verschieden sein. Man
könnte
versuchen und schauen, was daraus wird. Da ADG eine Gerade ist, muss
A'D'G' auch eine Gerade sein. Doch haben wir soeben entschieden, dass A'
= E und D' = D ist. Was sollte dann G' sein? Um das herauszufinden,
beachte man, dass die einzige Gerade, die E und D enthält, EDF ist. Also
müssen wir G' = F wählen. Indem wir weitere Geraden auf diese Weise
vervollständigen, finden wir B' = G und C' = A. Meine Permutation bildet
also ABCDEFG auf A'B'C'D'E'F'G' ab, und das ist EGADCBF.
Es ist nicht so einfach, sich diese Transformationen vorzustellen, doch
man kann sie sich algebraisch auf diese Weise herleiten. Es gibt noch mehr,
wie Sie vielleicht schon vermutet haben. Tatsächlich sind es
bemerkenswerte 168.
Um das zu beweisen, benutzen wir die obige, typische Methode. Man
beginnt mit einem Punkt A. Wohin kann er wandern? Im Prinzip zu jedem
anderen Punkt, also gibt es sieben Wahlmöglichkeiten. Nehmen wir an, er
wandert nach A’. Dann schauen wir uns Punkt B an. Ihn kann man auf jede
der verbliebenen sechs Positionen bewegen, ohne mit den
Zusammenhangsbeziehungen in Konflikt zu geraten. Das macht 7 × 6 = 42
mögliche Symmetrien bislang. Hat man A und B auf A' und B' festgelegt,
bleibt für E, den dritten Punkt auf der Geraden AB, keine Wahl mehr. Er
muss sich auf den dritten Punkt von AB abbilden lassen, welcher auch
immer das ist – es gibt keine weiteren Möglichkeiten. Es gibt jedoch noch
vier Punkte, deren Endpositionen noch nicht entschieden sind. Nehmen wir
einen von ihnen: Er kann zu jedem dieser vier Punkte wandern. Doch
sobald man seine Position ausgewählt hat, ist alles durch die Geometrie
festgelegt.
Man kann nachprüfen, dass alle Kombinationen die Beziehungen
erfüllen: Entsprechende Geraden treffen sich immer in entsprechenden
Punkten. Also gibt es alles in allem 7 × 6 × 4 = 168 Symmetrien. Eine
elegante Beweisführung bedient sich der linearen Algebra über dem Körper
der ganzen Zahlen modulo 2. Die Transformationen, um die es geht, werden
dann durch 3 × 3 invertierbare Matrizen mit den Elementen 0 oder 1
dargestellt.
Die Klein-Quartik
Dieselbe Gruppe taucht auch in der komplexen Analysis auf. Im Jahr 1893
bewies Adolf Hurwitz, dass eine komplexe Fläche mit g Löchern höchstens
84(g – 1) Symmetrien hat. Bei drei Löchern ist diese Zahl 168. Felix Klein
konstruierte eine Fläche, bekannt als Klein-Quartik, mittels der Gleichung
in komplexen homogenen Koordinaten (x, y, z). Die Symmetriegruppe
dieser Fläche stellt sich als dieselbe wie die der Fano-Ebene heraus, also hat
sie die maximal mögliche Anzahl Symmetrien, die von Hurwitz’ Satz
vorausgesagt werden, 168. Die Fläche gehört zu einer Triangulation der
hyperbolischen Ebene, bei der sich sieben Dreiecke an jedem Knotenpunkt
treffen.
Abbildung 168: Drei reelle Schnitte der Klein-Quartik.
Abbildung 169: Zugehörige Parkettierung der hyperbolischen Ebene, dargestellt anhand der
Poincaré’schen Kreisscheibe.
Einfache Gruppen und das Monster
Die Symmetrien irgendeines mathematischen Systems oder Objekts bilden
eine Gruppe. In der Alltagssprache meint man damit einfach eine
Ansammlung oder eine Menge, doch in der Mathematik bezieht sich das
Wort auf eine Ansammlung mit einer Extraeigenschaft. Je zwei Elemente
der Menge können verknüpft werden, sodass ein anderes Element der
Menge herauskommt. Das ähnelt der Multiplikation: Zwei Elemente g, h
der Gruppe ergeben verknüpft das Produkt gh. Allerdings können die
Elemente und die Operation, die sie verknüpft, alles Mögliche sein. Es
müssen lediglich ein paar hübsche Eigenschaften erfüllt sein, die durch
Symmetrien begründet sind.
Symmetrien sind Transformationen, und die Art und Weise, zwei
Transformationen zu verknüpfen, besteht darin, zunächst die erste, dann die
zweite auszuführen. Diese besondere Auffassung von «Multiplikation»
gehorcht einigen einfachen algebraischen Gesetzen. Multiplikation ist
assoziativ: (gh)k = g(hk). Es gibt ein Einselement 1 (auch neutrales Element
–1
–1
genannt), sodass 1g = g1 = g. Jedes g hat ein inverses g , sodass gg
–
=g
1
g = 1. (Das Kommunikativgesetz gh = hg wird nicht verlangt, denn bei
vielen Symmetrien versagt es.) Jedes mathematische System, das mit einer
Verknüpfungsoperation ausgestattet ist, die diese drei Regeln erfüllt, nennt
man eine Gruppe.
Für Symmetrien ist das Assoziativgesetz automatisch erfüllt, weil wir
Transformationen verknüpfen; das Einselement ist die Transformation «Tu
gar nichts», und das Inverse einer Transformation ist «Mache sie
rückgängig». Deswegen bilden Symmetrien jedes Systems oder Objekts
eine Gruppe bezüglich der Verknüpfung. Insbesondere gilt das für die FanoEbene. Die Zahl der Transformationen in ihrer Symmetriegruppe (Ordnung
der Gruppe genannt) ist 168. Sie erweist sich als eine sehr ungewöhnliche
Gruppe.
Viele Gruppen kann man in kleinere Gruppen zerlegen – etwa so, wie
man Zahlen in Primzahlen faktorisiert, jedoch ist der Prozess bei Gruppen
komplizierter. Das Analoge der Primfaktoren nennt man einfache Gruppen.
Dabei handelt es sich um Gruppen, die nicht mehr weiter zerlegt werden
können. «Einfach» bedeutet nicht «leicht» – sondern lediglich «hat nur eine
Komponente».
Es gibt unendlich viele endliche Gruppen – Gruppen endlicher Ordnung,
d.h. solche, die nur endlich viele Elemente haben. Wählt man zufällig eine
aus, ist sie selten einfach – ganz so wie die Primzahlen verglichen mit den
zusammengesetzten Zahlen selten sind. Es gibt jedoch unendlich viele
einfache Gruppen, wiederum wie bei den Primzahlen. Tatsächlich stehen
einige sogar zu den Primzahlen in Beziehung. Wenn n irgendeine ganze
Zahl ist, dann bilden die ganzen Zahlen modulo n (siehe Kapitel [7]) eine
Gruppe, falls wir ihre Elemente durch Addition verknüpfen. Diese Gruppe
heißt zyklische Gruppe der Ordnung n. Sie ist genau dann einfach, wenn n
prim ist. Tatsächlich sind alle einfachen Gruppen, die Primzahlordnung
haben, zyklisch.
Gibt es auch noch andere? Galois fand in seiner Arbeit über die
Gleichungen fünfter Ordnung eine einfache Gruppe der Ordnung 60. Das ist
keine Primzahl, also ist die Gruppe nicht zyklisch. Sie besteht aus allen
geraden Permutationen (siehe Kapitel [2]) von fünf Objekten. Für Galois
waren diese Objekte die fünf Lösungen einer Gleichung fünfter Ordnung
(siehe Kapitel [5]), und die Symmetriegruppe der Gleichung bestand aus
allen 120 Permutationen dieser Lösungen. Darunter befand sich seine
Gruppe der Ordnung 60, und damit wusste Galois, dass es keine
algebraische Formel für die Lösungen gibt, weil die Gruppe einfach ist. Die
Gleichung hat die falsche Art Symmetrie, um durch eine algebraische
Formel gelöst zu werden.
Die nächstgrößere nichtzyklische einfache Gruppe hat die Ordnung 168,
und sie ist die Symmetriegruppe der Fano-Ebene. Zwischen 1995 und 2004
konnten so um die 100 Algebraiker alle endlichen einfachen Gruppen
klassifizieren, d.h., sie alle auflisten. Der wichtige Punkt dieser
monumentalen Arbeit – sie nahm mehr als 10000 Seiten in
wissenschaftlichen Zeitschriften ein – besteht darin, dass jede endliche
einfache Gruppe zu einer unendlichen Familie eng verwandter Gruppen
gehört, und dass es 18 verschiedene Familien gibt. Eine Familie, die
projektiven speziellen linearen Gruppen, beginnen mit der einfachen
Gruppe der Ordnung 168.
Nun gut, nicht ganz. Es gibt genau genommen 26 Ausnahmen, die
sogenannten sporadischen Gruppen. Diese Kreaturen sind ein
faszinierender Mischmasch – außergewöhnliche Individuen, die zuweilen
lose miteinander verwandt sind. Die folgende Tabelle listet alle 26 mit
Namen und Ordnung auf.
Die meisten dieser Gruppen werden nach demjenigen benannt, der sie
entdeckt hat, doch die größte nennt man das Monster, und zwar zu Recht,
weil seine Ordnung ungefähr 8 × 10
53
beträgt. Um genau zu sein:
Siehe die Tabelle für die Primzahlenfaktorisierung, die für
Gruppentheoretiker nützlicher ist. Ich war schon versucht, dieser Zahl ein
Kapitel zu widmen, habe mich aber schließlich entschlossen, sie bei der 168
anzusiedeln, statt den größeren Zusammenhang zu erörtern.
Das Monster wurde 1973 von Bernd Fischer und Robert Griess vermutet
und 1982 von Griess konstruiert. Es ist die Symmetriegruppe einer
merkwürdigen algebraischen Struktur, der Griess-Algebra. Das Monster hat
bemerkenswerte Beziehungen zu einem völlig anderen Gebiet der
Mathematik: den Modulformen in der komplexen Analysis. Einige
zahlenmäßige Übereinstimmungen wiesen auf diese Beziehung hin und
brachten John Conway und Simon Norton dazu, ihre
«Mondscheinvermutung» zu formulieren, die 1992 von Richard Borcherds
bewiesen wurde. Das ist zu technisch, um es hier zu erklären; es gibt
Beziehungen zur Stringtheorie der Quantenphysik (siehe Kapitel [11]).
Falls Sie Details wissen wollen, besuchen Sie
http://en.wikipedia.org/wiki/Monstrous‑moonshine
Bezeichnung
Gruppe
Ordnung
M11
Mathieu-Gruppe
2 × 3 × 5 × 11
M12
Mathieu-Gruppe
2 × 3 × 5 × 11
M22
Mathieu-Gruppe
2 × 3 × 5 × 7 × 11
M23
Mathieu-Gruppe
2 × 3 × 5 × 7 × 11 × 23
M24
Mathieu-Gruppe
2
J1
Janko-Gruppe
2 × 3 × 5 × 7 × 11 × 19
J2
Janko-Gruppe
2 ×3 ×5 ×7
J3
Janko-Gruppe
2 × 3 × 5 × 17 × 19
J4
Janko-Gruppe
2
4
2
6
3
7
2
7
2
10
3
× 3 × 5 × 7 × 11 × 23
3
7
3
7
5
21
2
3
3
× 3 × 5 × 7 × 11 × 23 ×
29 × 31 × 37 × 43
Co1
Conway-Gruppe
21
2
9
4
6
3
× 23
18
2
× 3 × 5 × 7 × 11 × 13
18
Co2
Conway-Gruppe
2
Co3
Conway-Gruppe
2
Fi22
Fischer-Gruppe
2
Fi23
Fischer-Gruppe
2
10
17
18
6
3
7
3
9
2
× 3 × 5 × 7 × 11 × 23
× 3 × 5 × 7 × 11 × 23
× 3 × 5 × 7 × 11 × 13
13
×3
2
× 5 × 7 × 11 × 13
× 17 × 23
Fi24
Fischer-Gruppe
21
2
16
×3
2
3
× 5 × 7 × 11 × 13
× 17 × 23 × 29
9
2
3
7
6
3
Hs
Higman-Sims-Gruppe
2 × 3 × 5 × 7 × 11
McL
McLaughlin-Gruppe
2 × 3 × 5 × 7 × 11
He
Held-Gruppe
2
Ru
Rudvalis-Gruppe
2
Suz
Suzuki-Gruppe
2
O’N
O’Nan-Gruppe
2 × 3 × 5 × 7 × 11 × 19 ×
10
14
13
3
2
3
3
7
2
3
× 3 × 5 × 7 × 17
× 3 × 5 × 7 × 13 × 29
× 3 × 5 × 7 × 11 × 13
9
4
3
31
14
6
6
HN
Harada-Norton-Gruppe
2
× 3 × 5 × 7 × 11 × 19
Ly
Lysons-Gruppe
2 × 3 × 5 × 7 × 11 × 31 ×
8
7
6
37 × 67
Th
Thompson-Gruppe
15
2
10
×3
3
2
6
2
× 5 × 7 × 13 × 19
× 31
B
Babymonster
41
2
13
×3
× 5 × 7 × 11 × 13
× 17 × 19 × 23 × 31 × 47
M
Monster
46
2
3
20
×3
9
6
2
× 5 × 7 × 11 ×
13 × 17 × 19 × 23 × 29 × 31
× 41 × 47 × 59 × 71
Tabelle 14: Die 26 sporadischen Gruppen.
GROSSE ZAHLEN
Die Reihe der ganzen Zahlen geht immer weiter. Es gibt keine
größte Zahl, weil man jede Zahl noch größer machen kann,
indem man 1 hinzuaddiert.
Infolgedessen sind die meisten ganzen Zahlen zum
Aufschreiben zu groß, ganz gleich, welches System man
benutzt.
Natürlich kann man immer mogeln und ein Symbol wie für
irgendeine große Zahl benutzen, die gerade interessiert.
Aber das ist kein System, nur ein Ex-und-Hopp-Zeichen.
Zum Glück braucht man die richtig großen Zahlen nur selten.
Dennoch üben sie eine besondere Faszination aus. Und ganz
gelegentlich wird eine von ihnen auch nützlich in der
Mathematik.
Fakultäten
Die Anzahl der Möglichkeiten, die Buchstaben des Alphabets anzuordnen.
Dinge umordnen
Auf wie viele Weisen kann man eine Liste umordnen? Falls die Liste zwei
Einträge hat, nennen wir sie A und B, gibt es zwei Möglichkeiten:
AB
BA
Hat die Liste drei Buchstaben A, B und C, gibt es sechs Möglichkeiten:
ABC
ACB
BAC
BCA
CAB
CBA
Aber wie sieht es bei vier Buchstaben A, B, C und D aus?
Man kann alle Möglichkeiten systematisch aufschreiben und erhält als
Ergebnis 24. Es gibt eine gute Möglichkeit, das einzusehen. Man überlege
sich, wo D auftauchen kann. Es muss entweder an der ersten, der zweiten,
dritten oder vierten Stelle stehen. Dann denkt man sich D weg, ganz gleich
wo es steht. Dann bleibt eine Liste, in der nur A, B und C vorkommen. Das
muss eine der sechs Möglichkeiten sein. Und alle sechs können
vorkommen: Man fügt nun D an der richtigen Stelle ein. Also kann man
alle Möglichkeiten für vier Buchstaben in Form von vier Listen mit jeweils
sechs Anordnungen wie folgt aufschreiben:
D an erster Stelle:
DABC
DACB
DBAC
DBCA
DCAB
DCBA
BDAC
BDCA
CDAB
CDBA
BADC
BCDA
CADB
CBDA
D an zweiter Stelle:
ADBC
ADCB
D an dritter Stelle:
ABDC
ACDB
D an vierter Stelle:
ABCD
ACBD
BACD
BCAD
CABD
CBAD
Alle Anordnungen sind verschieden, entweder weil sie D an einer anderen
Stelle haben, oder weil D an derselben Stelle in unterschiedlichen
Anordnungen von ABC steht. Überdies kommt jede Anordnung von ABCD
auch vor: Die Stellung von D verrät, in welcher der sechs Listen man
suchen muss. Und welche Ordnung von ABC aufzusuchen ist, zeigt sich,
wenn man D weglässt.
Da man vier Gruppen Anordnungen hat, von denen jede sechs enthält, ist
die Gesamtzahl der Anordnungen 4 × 6 = 24.
Wir hätten auch schon die sechs Anordnungen von ABC auf ähnliche
Weise bestimmen können: In diesem Fall sucht man C auf und entfernt es:
CAB
CBA ACB
BCA ABC
BAC
Man kann das sogar mit nur zwei Buchstaben durchführen:
BA
AB
Diese Art, die Anordnungen zu sortieren, legt ein gemeinsames Muster
nahe: Die Anzahl der Anordnungen ist bei
Auf wie viele Arten kann man also 5 Buchstaben anordnen? Das Muster
legt die Antwort
nahe. Tatsächlich kann man das bestätigen, indem man sich wieder die fünf
verschiedenen Positionen von E vergegenwärtigt, jede mit 24 Anordnungen
von ABCD, wenn man E weglässt. Die gesuchte Zahl muss demnach 5 ×
24, also 5 × 4 × 3 × 2 ×1 sein.
Mit derselben Überlegung kommt man darauf, dass die Anzahl der
verschiedenen Anordnungen von n Buchstaben durch
ist. Man nennt diesen Ausdruck «n Fakultät» und kürzt ihn mit n! ab. Man
nehme alle Zahlen von 1 bis n und multipliziere sie miteinander.
Die ersten Fakultäten lauten
Offensichtlich werden die Zahlen rapide größer, schneller und immer
schneller.
Die Anzahl der möglichen Anordnungen der 26 Buchstaben des
Alphabets ist also
Ein Kartendeck mit 52 Spielkarten kann man auf so viele Arten anordnen:
Die Gamma-Funktion
Man kann der Gleichung
einen Sinn geben. Dazu muss man die Gamma-Funktion einführen, die die
Definition der Fakultäten auf beliebige komplexe Zahlen erweitert, aber
ihre wesentlichen Merkmale erhält. Gewöhnlich definiert man sie durch ein
Integral:
Die Beziehung zu den Fakultäten besteht darin, dass für natürliche Zahlen n
gilt:
Mit Hilfe der sogenannten analytischen Fortsetzung kann man Γ(z) für alle
komplexen Zahlen definieren.
Abbildung 170: Der Graph von Γ(x) für reelle x.
Die Gamma-Funktion Γ(z) ist für negative ganzzahlige z unendlich, hat aber
für alle übrigen komplexen Zahlen endliche Werte. Sie hat wichtige
Anwendungen in der Statistik. Eine ihrer Schlüsseleigenschaften definiert
die Fakultäten:
Damit ist Γ(z) = (z–1)!, aber leider nicht z!. Um das loszuwerden, schlug
Gauß vor, eine Pi-Funktion mittels Γ(z) = Γ(z+1) einzuführen, die dann für z
= n mit n! übereinstimmt. Die Verwendung der Gamma-Funktion ist jedoch
heute gebräuchlicher.
Die Verdopplungsformel für die Gamma-Funktion lautet
Setzt man darin z = , erhält man
Also
In diesem Sinn ist
gültig.
Der Rubik-Würfel
Im Jahr 1974 erfand der ungarische Professor Ernő Rubik ein Geduldsspiel,
das aus beweglichen Würfeln besteht. Man kennt es als Rubik-Würfel oder
Zauberwürfel, und mittlerweile sind mehr als 350 Millionen dieser
Spielzeuge weltweit verkauft worden. Ich erinnere mich gut, wie die
Mathematics Society der Universität Warwick (eine Studentenvereinigung,
die sich der Mathematik verschrieben hat) diese Würfel kistenweise aus
Ungarn importierte, bis der Hype so verbreitet war, dass kommerzielle
Unternehmen den Vertrieb übernahmen. Die gewaltige Zahl sagt uns, wie
viele unterschiedliche Anordnungen es für einen Rubik-Würfel gibt.
Geometrie des Rubik-Würfels
Das Puzzle besteht aus einem Würfel, der in 27 kleinere Würfel von jeweils
einem Drittel der Kantenlänge unterteilt ist. Liebhaber nennen sie «cubies».
Jede Seitenfläche des Würfels hat eine bestimmte Farbe. Rubiks clevere
Idee bestand darin, sich einen Mechanismus auszudenken, mit dem man
jede Seite des Würfels verdrehen kann. Wiederholte Drehungen vermischen
die Farben auf den cubies. Die Aufgabe besteht darin, die cubies in ihre
ursprüngliche Position zurückzubringen, sodass jede Seitenfläche des
großen Würfels wieder eine einheitliche Farbe hat.
Abbildung 171: Der Rubik-Würfel.
Den cubie im Zentrum kann man nicht sehen, und tatsächlich ist er durch
den schlauen Mechanismus von Rubik ersetzt. Die cubies im Zentrum der
Flächen drehen sich, aber sie wandern nicht auf eine neue Fläche, ihre
Farbe ändert sich nicht. Von nun an werden wir also voraussetzen, dass
diese sechs Mittelsteine sich, von Drehungen abgesehen, nicht bewegen.
Das bedeutet, wenn man den ganzen Rubik-Würfel in eine unterschiedliche
Orientierung bringt, ohne tatsächlich irgendwelche Oberflächen zu
verdrehen, dann hat das keinen bedeutsamen Effekt. Es gibt zwei Sorten
cubies, die sich bewegen können: 8 Ecken und 12 Kanten, die jeweils
zwischen zwei Ecken sitzen. Wenn man die Farben auf diesen Kanten und
Ecken auf alle möglichen Arten verändert – zum Beispiel, indem man die
farbigen Aufkleber entfernt und sie in unterschiedlicher Anordnung wieder
aufbringt – ist die Zahl der möglichen Anordnungen gegeben durch
Allerdings ist das bei Rubiks Würfel ja gar nicht erlaubt: Das Einzige, was
man machen kann, ist, die Flächen des Würfels zu verdrehen. Somit erhebt
sich die Frage: Welche dieser Anordnungen kann man durch eine Abfolge
von Drehungen erreichen? Im Prinzip könnte das nur ein winziger Bruchteil
sein, doch Mathematiker konnten zeigen, dass man exakt ein Zwölftel der
obigen Anordnungen durch eine Abfolge erlaubter Bewegungen erhalten
kann, was ich weiter unten nachweise. Damit ergibt sich die Zahl der
erlaubten Anordnungen der Farben auf dem Rubik-Würfel als
Könnte jeder der 7 Milliarden Menschen in jeder Sekunde jeweils eine
dieser Anordnungen herstellen, würde es ungefähr 200 Jahre dauern, bis
man sie alle durchhätte.
Wie man diese Zahlen berechnet
Die acht Ecken kann man auf 8! Arten arrangieren. Erinnern Sie sich, dass
Diese Zahl taucht auf, weil es 8 Möglichkeiten für die erste Ecke gibt, die
wiederum mit jeder der 7 übrigen Möglichkeiten für die zweite Ecke und
die wiederum mit jeder der 6 verbleibenden Möglichkeiten für die dritte
kombiniert werden können, usw. (siehe Kapitel [26!]). Jede Ecke kann man
8
in drei verschiedene Richtungen drehen. Also gibt es 3 Möglichkeiten,
8
diese Richtungen auszuwählen. Alles in allem gibt es also 3 × 8! Arten, die
Ecken anzuordnen.
Ganz ähnlich kann man sich überlegen, dass auch die zwölf Kanten auf
12! Arten angeordnet werden können, wobei
Jede Kante hat zwei Orientierungsmöglichkeiten, diese kann man also auf
12
12
2 Arten wählen. Alles in allem gibt es 2 × 12! Arten, die Kanten
anzuordnen.
Die Anzahl der Möglichkeiten, diese Anordnungen miteinander zu
8
kombinieren, erhält man durch Multiplikation der beiden Zahlen, was 3 ×
12
8! × 2 × 12! ergibt. Und das wiederum ist 519024039293878272000.
Wie schon gesagt, können die meisten Anordnungen nicht durch eine
Abfolge von Verdrehungen des Würfels erreicht werden. Jede Rotation
beeinflusst verschiedene cubies zugleich. Und dabei können sich bestimmte
Merkmale der Gesamtmenge von cubies nicht ändern. Solche Merkmale
nennt man Invarianten. In diesem Fall gibt es ihrer drei:
Parität der cubies. Es gibt zwei Sorten Permutationen, gerade und
ungerade (siehe Kapitel [2]). Eine gerade Permutation verändert die
Reihenfolge einer geraden Zahl von Objektpaaren. Falls man zwei gerade
Permutationen kombiniert, indem man sie hintereinander ausführt, ist die
entstehende Permutation ebenfalls gerade. Nun ist aber jede Drehung des
Rubik-Würfels eine gerade Permutation der cubies. Deshalb ist auch jede
Kombination von Verdrehungen eine gerade Permutation. Diese
Einschränkung halbiert die Anzahl der möglichen Anordnungen.
Parität der Ecken. Jede Drehung ist auch eine gerade Permutation der
Eckflächen, also gilt das auch für eine Folge von Drehungen. Diese
Einschränkung halbiert ebenfalls die Anzahl möglicher Anordnungen.
Trialität an den Ecken. Man nummeriere die 24 Oberflächen der Ecken
mit den Zahlen 0, 1, 2, so, dass die Zahlen sich im Uhrzeigersinn in der
Reihenfolge 0, 1, 2 an jeder Ecke wiederfinden. Man mache das so, dass die
Zahlen an zwei gegenüberliegenden Flächen mit 0 bezeichnet sind, wie in
der Abbildung rechts. Die Summe all dieser Zahlen modulo 3 genommen –
d.h., dass man nur den Rest beim Teilen durch 3 nimmt – bleibt bei jeder
Drehung des Würfels unverändert. Diese Einschränkung reduziert die
Anzahl der möglichen Anordnungen auf ein Drittel.
Wenn man alle drei Bedingungen in Betracht zieht, muss die Anzahl der
möglichen Anordnungen durch 2 × 2 × 3 = 12 geteilt werden. D.h., die
Anzahl der Anordnungen, die durch eine Abfolge von Verdrehungen
erzeugt werden kann, ist gegeben durch
Abbildung 172: Invarianten der Rubik-Gruppe. Links: Auswirkung einer Vierteldrehung im
Uhrzeigersinn auf die cubies. Rechts: Bezeichnung der Ecken.
Die mathematischen Techniken, die man bei der Analyse des RubikWürfels braucht, führen auch zu systematischen Lösungsmöglichkeiten.
Diese Methoden sind jedoch zu kompliziert, um sie hier zu beschreiben.
Und sie zu verstehen, ist ein langwieriges und gelegentlich arg technisches
Unterfangen.
Gottes Zahl
Man definiere eine Bewegung als Drehung einer einzelnen Oberfläche um
beliebig viele rechte Winkel. Die kleinste Anzahl von Bewegungen, die die
Aufgabe unabhängig von der Ausgangsposition lösen, nennt man Gottes
Zahl – wahrscheinlich, weil die Antwort herauszubekommen weit jenseits
der Möglichkeiten von Sterblichen liegen sollte. Das stellte sich jedoch als
zu pessimistisch heraus. Im Jahr 2010 wandten Thomas Rokicki, Herbert
Kociemba, Morley Davidson und John Dethridge einige clevere
Mathematik sowie die rohe Kraft eines Computers an und zeigten, dass man
den Zauberwürfel aus jeder denkbaren Stellung immer in höchstens
20 Bewegungen lösen kann. Gottes Zahl beträgt also 20. Die Rechnung lief
zeitgleich auf einer großen Zahl von Computern und hätte mit einem
einzelnen Computer 350 Jahre gedauert.
Sudoku
Sudokus überschwemmten 2005 die Welt, doch ihre Vorgänger reichen viel
weiter zurück. Man spielt auf einem Quadratgitter, das in neun 3 × 3Unterquadrate unterteilt ist. In jeder Reihe, jeder Spalte und jedem
Unterquadrat müssen alle Ziffern von 1–9 vorkommen. Einige Ziffern
werden durch das Rätsel vorgegeben. Oben steht die Zahl der
unterschiedlichen Sudokugitter. Sie werden uns also nicht ausgehen.
Abbildung 173: Links: ein Sudoku-Rätsel. Rechts: seine Lösung.
Von lateinischen Quadraten zum Sudoku
Häufig wird die Geschichte des Sudoku auf Eulers Arbeit über lateinische
Quadrate zurückgeführt (siehe Kapitel [10]). Ein vollständiges Sudokugitter
ist ein spezielles lateinisches Quadrat: Die 3 × 3 Unterquadrate führen zu
zusätzlichen Bedingungen. Ein ähnliches Rätsel erschien 1892, als die
französische Zeitung Le Siècle ihre Leser aufforderte, ein magisches
Quadrat zu vervollständigen, in dem einige Zahlen fehlten. Bald darauf
benutzte La France magische Quadrate, die nur die Ziffern 1–9 enthielten.
In den Lösungen enthielten auch die 3 × 3 Unterquadrate alle neun Ziffern,
jedoch war das nicht explizit gefordert.
Die moderne Form des Sudoku ist wahrscheinlich Howard Garns
zuzuschreiben, der vermutlich eine Reihe von Rätseln erfunden hat, die
1979 von Dell Magazines unter der Rubrik «Zahlenecke» veröffentlicht
wurden. Im Jahr 1986 veröffentlichte Nicoli, ein japanisches Unternehmen,
Sudokurätsel in Japan. Zunächst lautete der Name sūji wa dokushin ni
kagiru («jede Ziffer darf nur einmal vorkommen»), doch wurden die Rätsel
schnell als sū doku bekannt. The Times begann 2004 mit der
Veröffentlichung von Sudokurätseln in Großbritannien, und 2005 wurden
sie weltweit der letzte Schrei.
Die große Zahl
die dieses Kapitel ziert, ist die Anzahl unterschiedlicher Sudokugitter. Die
Zahl aller 9 × 9 lateinischen Quadrate ist noch einmal ungefähr eine Million
Mal größer:
Die Anzahl von Sudokugittern wurde 2003 in der USENET Newsgruppe
rec.puzzle ohne Beweis gepostet. Im Jahr 2005 klärten Bertram
Felgenhauer und Frazer Jarvis mit Hilfe eines Computers die Details, wobei
sie sich auf einige wenige plausible, aber unbewiesene Voraussetzungen
stützten. Für die Methode muss man die Symmetrie von Sudokus verstehen.
Jedes einzelne vervollständigte Gitter hat seine eigene Symmetriegruppe,
die aus denjenigen Transformationen besteht (Vertauschen von Reihen und
Spalten, Umbenennung der Ziffern), die das Gitter unverändert lassen. Die
Schlüsselstruktur ist jedoch die Symmetriegruppe der Menge aller
möglichen Gitter: die Möglichkeiten, irgendein Gitter in ein anderes zu
überführen (möglicherweise dasselbe Gitter, jedoch nicht
notwendigerweise).
Die Symmetrietransformationen, um die es geht, sind von
unterschiedlicher Art. Die offensichtlichsten sind die 9! Permutationen der
neun Ziffern. Indem man systematisch die Ziffern eines Sudokugitters
vertauscht, erzeugt man scheinbar ein anderes Sudokugitter. Man kann
jedoch auch Reihen vertauschen, solange man die Dreierblockstruktur
erhält. Dasselbe kann man mit den Spalten tun. Man kann auch ein
gegebenes Gitter an seiner Hauptdiagonalen spiegeln. Die
4
4
Symmetriegruppe hat die Ordnung 2 × 6 × 6 = 3359232. Beim Abzählen
der möglichen Gitter müssen diese Symmetrien mit in Betracht gezogen
werden. Der Beweis ist kompliziert, daher die Benutzung von Computern.
Die Lücken im ursprünglichen Beweis sind seitdem geschlossen worden.
Details und weitere Informationen kann man
http://en.wikipedia.org/wiki/Mathematics_of_Sudoku
entnehmen.
Da symmetrische Varianten eines gegebenen Gitters im Wesentlichen
dasselbe Gitter in Verkleidung ergeben, können wir auch fragen: Wie viele
verschiedene Gitter gibt es, falls man symmetrische als äquivalent
betrachtet? Im Jahr 2006 berechneten Jarvis und Ed Russell diese Zahl als
Das ist nicht die Gesamtzahl dividiert durch 3359232, weil einige Gitter
ganz eigene Symmetrien haben.
Wie beim Rubik-Würfel eröffnen die mathematischen Techniken, die
man zur Analyse von Sudoku benutzt, auch systematische Lösungswege für
Sudokurätsel. Diese Methoden sind jedoch zu kompliziert, um sie hier zu
beschreiben, und können unter dem Stichwort systematischer Versuch und
Irrtum zusammengefasst werden.
Die größte bekannte Primzahl
Wie lautet die größte Primzahl? Schon um 300 v. Chr. bewies Euklid, dass
es diese Zahl nicht gibt. «Primzahlen sind häufiger als jede zugeordnete
Vielheit.» D.h., es gibt unendlich viele Primzahlen. Computer können die
Liste der Primzahlen beträchtlich verlängern; wenn sie nicht
weiterkommen, ist das hauptsächlich auf Mangel an Speicherplatz oder die
lächerlich langen Ausdrucke zurückzuführen. Oben steht der gegenwärtige
Rekordhalter.
Mersenne-Zahlen
Um die Suche nach der größten bekannten Primzahl ist eine kleine Industrie
entstanden. Die Suche ist hauptsächlich als Übung im Rekordbrechen
interessant und um neue Computer zu testen. Im April 2014 hieß die größte
57885161
bekannte Primzahl 2
– 1, eine riesige Zahl, die
17425170 Dezimalstellen hat.
Zahlen der Gestalt
nennt man Mersenne-Zahlen nach dem französischen Mönch Marin
Mersenne. Falls Sie darauf aus sein sollten, den Rekord für große
Primzahlen zu brechen, sollten Sie sich an Mersenne-Zahlen halten, weil
diese bestimmte Eigenschaften haben, die es selbst dann zu entscheiden
erlauben, ob sie prim sind, wenn sie für allgemeinere Methoden viel zu
groß werden.
11
Mit einfacher Algebra lässt sich beweisen, dass n prim ist, wenn 2 – 1
prim ist. Ursprünglich dachten Mathematiker, dass auch das Umgekehrte
gilt: Mn ist immer dann prim, wenn n prim ist. Hudalricus Regius stellte
jedoch 1536 fest, dass Mn = 2047 nicht prim ist, obwohl 11 eine Primzahl
ist. Tatsächlich gilt
Pietro Cataldi zeigte, dass M17 und M19 prim sind, was für heutige
Computer eine leichte Aufgabe ist, damals jedoch mussten alle Rechnungen
per Hand gemacht werden. Er behauptete auch, dass Mn prim sei, wenn n =
23, 29, 31 und 37 ist. Allerdings sind
diese drei Mersenne-Zahlen alle zusammengesetzt. Fermat entdeckte 1640
die Faktoren von M23 und M37, und Euler fand die Faktoren von M29 1738.
Später bewies Euler, dass Cataldi mit M31 recht hatte.
Im Jahr 1644 konstatierte Mersenne im Vorwort seines Buches Cogitata
physico-mathematica, dass Mn für n = 2, 3, 5, 7, 13, 17, 19, 31, 67, 127 und
257 prim ist. Diese Liste beschäftigte Mathematiker über 200 Jahre lang.
Wie konnte er Aussagen über derart große Zahlen machen? Schließlich
wurde klar: Er hatte lediglich gut geraten. Seine Liste enthält einige Fehler.
Im Jahr 1876 bewies Lucas, dass Mersenne mit
recht gehabt hatte, indem er einen selbst entwickelten genialen Primzahltest
für Mn verwendete. Derrick Lehmer erfand eine kleine Verbesserung für
Lucas’ Test im Jahr 1930. Man definiere eine Zahlenfolge Sn durch S2 = 4,
2
S3 = 14, S4 = 194, …, wobei Sn+1 = S n–2. Der Lucas‑Lehmer‑Test stellt
sicher, dass Mp genau dann prim ist, wenn Mp Teiler von Sp ist. Dieser Test
stellt heute das Mittel zum Testen von Mersenne-Zahlen auf Primalität dar.
Allmählich sickerte es durch, dass Mersenne in einigen Fällen falsch lag:
Zwei Zahlen aus seiner Liste sind zusammengesetzt (n = 67 und 257), und
er ließ n = 61, 89 und 107 aus, die auf Primzahlen führen. Zieht man die
Schwierigkeit von händischen Rechnungen in Betracht, war seine Arbeit
doch ziemlich ordentlich.
Im Jahr 1883 bewies Ivan Mikheevich Pervushin, dass M61 prim ist, einer
der Fälle, die Mersenne ausgelassen hatte. R.E. Powers zeigte daraufhin,
dass Mersenne auch M89 und M107 übersehen hatte, die beide prim sind. Bis
1947 waren die Mn für n von 2 bis 257 überprüft. In diesem Bereich treten
Mersenne-Primzahlen bei n = 2, 3, 5, 7, 13, 17, 19, 31, 61, 89, 107 und 127
auf. Die aktuelle Liste von Mersenne‑Primzahlen lautet:
n
Jahr
Entdecker
2
—
Antike
3
—
Antike
5
—
Antike
7
—
Antike
13
1456
unbekannt
17
1588
Cataldi
19
1588
Cataldi
31
1772
Euler
61
1883
Pervushin
89
1911
Powers
107
1914
Powers
127
1876
Lucas
521
1952
Robinson
607
1952
Robinson
1279
1952
Robinson
2203
1952
Robinson
2281
1952
Robinson
3217
1957
Riesel
4253
1961
Hurwitz
4423
1961
Hurwitz
9689
1963
Gillies
9941
1963
Gillies
11 213
1963
Gillies
19 937
1971
Tuckerman
21 701
1978
Noll & Nickel
23 209
1979
Noll
44 497
1979
Nelson & Slowinski
86 243
1982
Slowinski
110 503
1988
Colquitt & Welsh
132 049
1983
Slowinski
216 091
1985
Slowinski
756 839
1992
Slowinski, Gage et al.
859 433
1994
Slowinski & Gage
1 257 787
1996
Slowinski & Gage
1 398 269
1996
Armengaud, Woltman et al.
2 976 221
1997
Spence, Woltman et al.
3 021 377
1998
Clarkson, Woltman,
Kurowski et al.
6 972 593
1999
Hajratwala, Woltman,
Kurowski et al.
13 466 917
2001
Cameron, Woltman,
Kurowski et al.
20 996 011
2003
Shafer, Woltman, Kurowski
et al.
24 036 583
2004
Findley, Woltman, Kurowski
et al.
25 964 951
2005
Nowak, Woltman, Kurowski
et al.
30 402 457
2005
Cooper, Boone, Woltman,
Kurowski et al.
32 582 657
2006
Cooper, Boone, Woltman,
Kurowski et al.
37 156 667
2008
Elvenich, Woltman, Kurowski
et al.
42 643 801
2009
Strindmo, Woltman,
Kurowski et al.
43 112 609
2008
Smith, Woltman, Kurowski et
al.
57 885 161
2013
Cooper, Woltman, Kurowski
et al.
Tabelle 15
Die Suche nach richtig großen Primzahlen hat sich aus unterschiedlichen
Gründen hauptsächlich auf Mersenne-Zahlen konzentriert. In der
n
Binärschreibweise der Computer wird 2 durch eine 1, gefolgt von einer
Reihe von n Nullen dargestellt, und Mn ist eine Reihe von n Einsen. Das
macht einige Berechnungen schneller. Zudem ist der Lucas‑Lehmer‑Test
weitaus effizienter als allgemeine Methoden zum Testen auf Primalität,
deswegen ist er für große Zahlen viel praktischer. Dieser Test führt auf die
48 Mersenne-Primzahlen der Tabelle. Neueste Entwicklungen und weitere
Informationen findet man auf
http://primes.utm.edu/mersenne/
UNENDLICHE ZAHLEN
Wie schon gesagt, lassen Mathematiker nie von etwas ab,
nur weil es unmöglich ist.
Wenn es interessant genug ist, finden sie Wege, es möglich
zu machen.
Es gibt keine größte ganze Zahl.
Sie gehen immer weiter. Jeder wusste das.
Doch als Georg Cantor sich entschloss, die Frage zu stellen,
wie groß dieses ganz eigene Konzept von «für immer weiter»
genau war, fand er eine neue Methode, unendlich großen
Zahlen einen Sinn zu geben. Eine Konsequenz ist, dass
einige Unendlichkeiten größer sind als andere.
Viele seiner Zeitgenossen hielten ihn für verrückt. Doch
Cantors Wahnsinn hatte Methode, und seine transfiniten
Zahlen erwiesen sich als sinnvoll und wichtig.
Man musste sich nur an sie gewöhnen.
Was nicht einfach war.
Aleph-null: Die kleinste Unendlichkeit
Mathematiker machen freizügig und ausgiebig Gebrauch von dem Wort
«Unendlichkeit». Salopp gesprochen ist etwas unendlich, wenn man mit
gewöhnlichen ganzen Zahlen nicht zählen kann, wie groß es ist, oder seine
Größe in reellen Zahlen nicht angeben kann. Wenn es keine
konventionellen Zahlen mehr gibt, benutzen wir «Unendlich» als
Platzhalter. Unendlich ist keine Zahl im gewöhnlichen Sinne. Sie wäre
gewissermaßen die größtmögliche Zahl, wenn eine solche Ausdrucksweise
logisch sinnvoll wäre. Doch außer man ist sehr, sehr sorgfältig in Bezug auf
das, was man meint, ist das nicht logisch.
Cantor fand einen Weg, Unendlich zu einer echten Zahl zu machen,
indem er unendliche Mengen abzählte. Indem man seine Idee auf die
Menge aller ganzen Zahlen ausdehnt, stößt man auf eine unendliche Zahl,
die er
(Aleph-null) nannte. Sie ist größer als jede ganze Zahl. Also ist
sie unendlich, richtig? Nun ja, gewissermaßen. Sie ist eine Unendlichkeit,
das mit Sicherheit. Eigentlich die kleinste Unendlichkeit. Aber es gibt
andere, und die sind noch größer.
Unendlichkeit
Wenn Kinder zählen lernen und sich mit großen Zahlen wie 1000 oder
1 Million angefreundet haben, fragen sie oft, was die allergrößte Zahl ist.
Vielleicht, so meinen sie, ist es
Doch dann wird ihnen klar, dass sie eine größere Zahl machen können,
indem sie noch eine Null anhängen – oder einfach 1 addieren und so
erhalten. Keine spezielle ganze Zahl kann die größte sein, weil die Addition
von 1 jede Zahl größer macht. Die ganzen Zahlen gehen immer weiter.
Wenn man anfängt zu zählen und immer weitermacht, erreicht man keine
größtmögliche Zahl, weil es so etwas nicht gibt. Es gibt unendlich viele
Zahlen.
Über Hunderte von Jahren waren die Mathematiker sehr vorsichtig mit
dem Unendlichen. Als Euklid bewies, dass es unendlich viele Primzahlen
gibt, drückte er das keineswegs so aus. Er sagte nur: «Primzahlen sind
häufiger als jede zugeordnete Vielheit». Das heißt, es gibt keine größte
Primzahl.
Wirft man die Vorsicht über Bord, so ist das Naheliegende, historischen
Vorläufern zu folgen und eine neue Art von Zahl einzuführen, die größer ist
als irgend eine ganze Zahl. Man nenne sie Unendlich und führe ein Zeichen
für sie ein. Gewöhnlich ist das ∞, eine Art liegende Acht. Doch Unendlich
macht Ärger, weil diese Zahl sich gelegentlich paradox verhält.
Sicher ist ∞ doch die größtmögliche Zahl? Nun, sie ist zwar per
Definition größer als jede ganze Zahl, doch werden die Dinge weniger
einfach, wenn man mit der neuen Zahl rechnen will. Offensichtlich gibt es
folgendes Problem: Was ist ∞ + 1? Ist es größer als ∞, dann ist ∞ nicht die
größtmögliche Zahl. Ist es dasselbe wie ∞, dann gilt ∞ + 1 = ∞. Zieht man
auf beiden Seiten ∞ ab, erhält man 0 = 1. Und was ist mit ∞ + ∞? Wenn das
größer ist als ∞, haben wir dasselbe Problem. Wenn es jedoch das Gleiche
ist, dann wäre ∞ + ∞ = ∞. Zieht man wieder ∞ ab, erhält man ∞ = 0.
Die Erfahrung mit früheren Erweiterungen des Zahlensystems zeigt, dass
man einige Regeln der Arithmetik und Algebra opfern muss, wenn man
neue Arten von Zahlen einführt. Hier sieht es so aus, als müssten wir die
Subtraktion von ∞ verbieten. Aus ähnlichen Gründen dürfen wir nicht
annehmen, dass die Division durch ∞ so ähnlich funktioniert, wie wir
normalerweise annehmen würden. Andererseits wäre sie eine ziemlich
klägliche Zahl, wenn man sie nicht für Subtraktion und Division
gebrauchen könnte.
Das hätte schon das Ende der Geschichte sein können, andererseits
fanden Mathematiker es extrem nützlich, mit unendlichen Prozessen zu
arbeiten. Es gab nützliche Resultate, wenn man geometrische Formen
endlos in immer kleinere Stücke zerlegte. Die Begründung dafür, dass
dieselbe Zahl π sowohl im Umfang wie im Flächeninhalt des Kreises
auftaucht, ist ein Beispiel dafür (siehe Kapitel [π]). Archimedes nutzte diese
Idee um 200 v. Chr. in seiner Arbeit über Kreise, Kugeln und Zylinder. Er
fand einen komplizierten, aber logisch einwandfreien Beweis, dass die
Methode die richtigen Antworten liefert.
Seit dem 17. Jahrhundert wurde der Bedarf an einer sinnvollen Theorie
für diese Art Methode dringlich, ganz besonders für unendliche Summen,
durch die sich wichtige Zahlen und Funktionen mit beliebiger Genauigkeit
annähern ließen, indem man mehr und mehr kleinere Zahlen dazuaddierte.
Zum Beispiel haben wir in Kapitel [π] gesehen, dass
gilt, worin die Summe der reziproken Quadratzahlen sich durch π
ausdrücken lässt. Diese Feststellung stimmt nur dann, wenn man die
Summe ohne Ende fortsetzt. Hört man mit dem Summieren auf, ergibt sich
eine rationale Zahl, die eine Näherung für π darstellt, die aber nicht gleich π
sein kann, weil π irrational ist. Auf jeden Fall macht jeder zusätzliche Term
die Summe größer.
Die Schwierigkeit mit unendlichen Reihen wie dieser besteht darin, dass
sie zuweilen völlig sinnlos sind. Der klassische Fall ist
Schreibt man diese Reihe so
wird daraus
was natürlich null ergibt. Schreibt man die Reihe in anderer Form und
nimmt an, dass die üblichen Gesetze der Algebra anwendbar sind, wird sie
zu
Das ist aber
was, ebenso offensichtlich, 1 ergibt.
Hier, so stellte sich heraus, besteht das Problem darin, dass die Reihe
nicht konvergiert; d.h. sie nähert sich nicht einem bestimmten Wert an,
wenn man immer mehr Terme dazuaddiert. Stattdessen springt ihr Wert
zwischen 1 und 0 hin und her:
usw. Das ist nicht die einzige Quelle denkbarer Schwierigkeiten, doch weist
es den Weg für eine logische Theorie unendlicher Reihen. Die sinnvollen
unter ihnen sind diejenigen, die konvergieren. Die Reihe der reziproken
Quadratzahlen ist konvergent, und sie konvergiert exakt gegen
.
Philosophen unterscheiden zwischen potenzieller und aktualer
Unendlichkeit. Etwas ist potenziell unendlich, falls man es im Prinzip
unendlich fortsetzen kann – so wie das unaufhörliche Zufügen von Termen
zu einer Summe. Jede Summe für sich ist endlich, doch der gesamte
Prozess, der diese Summen erzeugt, hat keinen festen Endpunkt. Aktuale
Unendlichkeit tritt auf, wenn ein unendlicher Prozess oder unendliches
System als Ganzes behandelt wird. Mathematiker haben einen sinnvollen
Weg gefunden, die potenzielle Unendlichkeit unendlicher Summen zu
deuten. Sie benutzen unterschiedliche potenziell unendliche Prozesse, doch
in allen wird das Symbol interpretiert als «Mach weiter damit und du wirst
der richtigen Antwort so nahe kommen wie gewünscht».
Die aktuale Unendlichkeit war eine gänzlich andere Geschichte, und
Mathematiker gaben sich große Mühe, sie zu meiden.
Was ist eine unendliche Zahl?
Ich habe die Frage bereits (siehe Seite 22) für gewöhnliche ganze Zahlen 1,
2, 3,… gestellt und bin bis zu Freges Idee gekommen, der Klasse aller
Klassen in Entsprechung zu einer gegebenen Klasse, und ich habe dort mit
dem Hinweis aufgehört, dass es noch ein Problem geben könnte.
Hier kommt es.
Die Definition ist sehr elegant, wenn man sich erst einmal an diesen
Denkstil gewöhnt hat, und zudem hat sie den Vorteil, ein eindeutiges Objekt
zu definieren. Doch war die Tinte auf Freges Meisterwerk noch nicht
trocken, als Russell eine Entgegnung aufstellte. Nicht gegen die zugrunde
liegende Idee, über die er selbst schon nachgedacht hatte, sondern gegen die
Art von Klasse, die Frege benutzt hatte. Die Klasse aller Klassen ist im
Verhältnis zu unserer Klasse von Tassen gewaltig. Man nehme
irgendwelche drei Objekte, packe sie in einer Klasse zusammen, und schon
muss das Resultat ein Element von Freges alles umspannender Klasse aller
Klassen sein. Zum Beispiel muss auch die Klasse, deren Elemente der
Eiffelturm, ein bestimmtes Gänseblümchen auf einem Feld in Cambridge
und der Geist Oscar Wildes sind, darin inbegriffen sein.
Russells Paradox
Sind derart umfassende Klassen wirklich sinnvoll? Russell wurde klar, dass
sie es in voller Allgemeinheit nicht sind. Sein Beispiel war eine Version des
berühmten Barbierparadoxons. In einem bestimmten Ort gibt es einen
Barbier, der genau die Leute rasiert, die sich nicht selbst rasieren. Wer
rasiert jetzt den Barbier? Unter der Bedingung, dass jeder im Ort von
jemand rasiert wird, kann es einen solchen Barbier nicht geben. Denn falls
der Barbier sich nicht selbst rasiert, muss er sich per Definition selbst
rasieren. Wenn er sich jedoch selbst rasiert, verletzt er die Bedingung, dass
er ausschließlich diejenigen rasiert, die sich nicht selbst rasieren.
Wir nehmen hierbei an, dass der Barbier männlich ist, um das Problem
mit er/sie zu vermeiden. Aber natürlich ist mir klar, liebe Leserinnen, dass
viele von Ihnen sich heutzutage auch rasieren – nur in der Regel nicht die
Bärte. Folglich ist ein weiblicher Barbier keine zufriedenstellende Lösung
des Paradoxons, wie einige Leute sich gern vorstellten.
Russell fand eine Klasse, die derjenigen, die Frege gerne benutzt hätte,
nahe kam, die sich genau wie der Barbier verhält: die Klasse aller Klassen,
die sich nicht selbst enthalten. Enthält sich diese Klasse nun selbst oder
nicht? Beide Möglichkeiten sind ausgeschlossen. Falls sie sich tatsächlich
selbst enthält, dann muss sie tun, was alle ihre Elemente tun: sich nicht
selbst enthalten. Enthält sie sich dagegen selbst nicht, muss sie
bedingungsgemäß zu der Klasse gehören, folglich enthält sie sich selbst.
Obgleich dieses Russell-Paradox nicht beweist, dass Freges Definition
einer Zahl logisch widersprüchlich ist, zeigt es jedoch, dass man nicht
einfach ohne Beweis annehmen kann, dass irgendeine Wahr/falschBedingung eine Klasse definiert, insbesondere solche Objekte, für die die
Bedingung zutrifft. Und das beraubte Freges Ansatz seiner Substanz. Später
versuchten Russell und sein Mitarbeiter Alfred North Whitehead, die Lücke
zu schließen, indem sie eine komplexe Theorie über Klassen entwickelten,
die man in einem mathematischen Rahmen sinnvoll definieren kann. Das
Ergebnis war ein dreibändiges Werk, Principia Mathematica (Prinzipien der
Mathematik, eine bewusste Hommage an Isaac Newton), das die gesamte
Mathematik aus den logischen Eigenschaften von Klassen entwickelte. Es
braucht mehrere 100 Seiten, um die Zahl 1 zu definieren, und noch ein paar
mehr für + und um zu zeigen, dass 1 + 1 = 2 ist. Danach geht es sehr viel
schneller weiter.
Aleph-null: Die kleinste unendliche Zahl
Nur wenige Mathematiker benutzen den Russell-Whitehead-Ansatz über
Klassen heute noch, weil einfachere Methoden besser funktionieren. Eine
Schlüsselfigur in der heutigen Formulierung der logischen Grundlagen der
Mathematik ist Cantor. Er begann wie Frege, indem er die logischen
Grundlagen der ganzen Zahlen zu verstehen versuchte. Seine Forschung
führte jedoch in eine neue Richtung: Zahlen mit unendlichen Mengen zu
verbinden. Sie wurden als transfinite Zahlen bekannt. Ihre
bemerkenswerteste Eigenschaft besteht darin, dass es mehrere gibt.
Cantor arbeitete auch mit Ansammlungen von Dingen, die er «Mengen»
nannte statt Klassen, weil die Dinge in ihnen strengeren Bedingungen
unterlagen als die, die Frege verlangt hatte (nämlich gar keine). So wie
Frege begann er mit der intuitiven Idee, dass zwei Mengen genau dann
dieselbe Anzahl von Elementen haben, wenn sie in eine eineindeutige
Beziehung gesetzt werden können. Anders als Frege jedoch machte er dies
auch für unendliche Mengen. Mag sein, dass er sogar mit der Vorstellung
begann, auf diese Weise Unendlichkeit definieren zu können. Sicherlich
kann doch jede unendliche Menge zu einer beliebigen anderen in eine
eineindeutige Beziehung gesetzt werden? Wenn dem so ist, dann gäbe es
genau eine unendliche Zahl, und sie wäre größer als jede endliche – Ende
der Geschichte.
Stattdessen, so stellte sich heraus, war das erst der Anfang.
Die grundlegende unendliche Menge ist die Menge aller ganzen Zahlen.
Da man sie zum Zählen von Dingen benutzt, definierte Cantor eine Menge
als abzählbar, wenn man ihre Elemente in eine eineindeutige Beziehung zur
Menge der ganzen Zahlen setzen konnte. Man beachte, dass Cantor
dadurch, dass er die gesamte Menge betrachtete, von der aktualen
Unendlichkeit, nicht der potenziellen sprach.
Ganz offensichtlich ist die Menge der natürlichen Zahlen abzählbar –
man setzt einfach jede Zahl zu sich selbst in Beziehung:
Abbildung 174
Aber gibt es noch andere? Ja – und sie sind ziemlich schräg. Wie wär’s mit
folgender?
Abbildung 175
Man entfernt die Zahl 1 aus der Menge der ganzen Zahlen, und doch nimmt
die Zahl der Elemente in der Menge nicht um 1 ab: Sie bleibt exakt gleich.
Zugegeben, würden wir bei einer endlichen Zahl aufhören, hätten wir am
rechten Ende eine Zahl übrig, doch wenn wir alle ganzen Zahlen benutzen,
gibt es kein rechtes Ende. Jede Zahl n korrespondiert zu n + 1, und dies ist
die Beziehung zwischen der Menge aller ganzen Zahlen und derselben
Menge, aus der die 1 entfernt wurde. Der Teil hat dieselbe Größe wie das
Ganze.
Cantor nannte diese unendlichen Zahlen Kardinalzahlen, weil das ein
schicker Name für die natürlichen Zahlen in der gewöhnlichen Arithmetik
ist. Um es deutlicher zu machen, nennt man sie auch transfinite Zahlen. Als
Symbol für die Kardinalzahl der ganzen Zahlen wählte er ein Zeichen, den
ersten Buchstaben
(aleph) des hebräischen Alphabets, weil die ganze
Idee ungewöhnlich war. Dann fügte er noch einen Index 0 hinzu, sodass
entstand, und das aus Gründen, die wir im nächsten Kapitel erklären
werden.
Wenn jede unendliche Menge mit den natürlichen Zahlen in Beziehung
gesetzt werden konnte, wäre
lediglich ein schickes Zeichen für
«Unendlichkeit». Und am Anfang sah es auch tatsächlich so aus. Zum
Beispiel gibt es eine Menge rationale Zahlen, die nicht ganz sind, deswegen
erschien es vernünftig, dass auch die Kardinalzahl der rationalen Zahlen
größer sein könnte als
. Cantor bewies jedoch, dass man die rationalen
Zahlen eineindeutig auf die natürlichen Zahlen abbilden kann. Deswegen ist
auch ihre Kardinalzahl
.
Um grob zu verstehen, wie das funktioniert, lassen Sie uns bei den
rationalen Zahlen zwischen 0 und 1 bleiben. Der Trick besteht darin, sie in
der richtigen Reihenfolge anzuordnen, nämlich nicht ihrer numerischen
Reihenfolge. Stattdessen ordnen wir sie nach der Größe des Nenners, der
Zahl unter dem Bruchstrich. Für jeden Nenner ordnen wir sie dann nach
ihrem Zähler, der Zahl darüber. Also listen wir sie folgendermaßen auf:
wobei zum Beispiel
fehlt, weil es dasselbe ist wie . Nun können wir
diese rationalen Zahlen auf die natürlichen Zahlen abbilden, indem wir sie
in dieser bestimmten Ordnung nummerieren. Jede rationale Zahl zwischen
0 und 1 kommt irgendwo in der Liste vor, sodass wir keine auslassen.
Vorerst hat Cantors Theorie lediglich zu einer unendlichen Kardinalzahl
geführt. Doch werden wir im nächsten Kapitel sehen, dass es so einfach
nicht ist.
Mächtiges Kontinuum
Cantors brillanteste Einsicht ist, dass einige Unendlichkeiten größer sind
als andere. Er entdeckte etwas Bemerkenswertes über das «Kontinuum» –
ein schicker Name für die reellen Zahlen. Seine Mächtigkeit, die er
nannte, ist größer als
. Damit meine ich nicht einfach, dass einige reelle
Zahlen keine ganzen Zahlen sind. Einige rationale Zahlen (eigentlich die
meisten) sind ebenfalls keine ganzen Zahlen, und doch haben natürliche
und rationale Zahlen dieselbe Kardinalität oder Mächtigkeit,
. Für
unendliche Kardinalzahlen muss das Ganze nicht unbedingt größer sein als
seine Teile, wie schon Galileo feststellte. Es bedeutet einfach, dass man die
reellen Zahlen nicht alle eins zu eins auf die ganzen Zahlen abbilden kann,
ganz gleich, wie man sie sortiert.
Da
größer ist als
, überlegte Cantor, ob es noch andere unendliche
Mächtigkeiten dazwischen gäbe. Seine Kontinuumshypothese besagt, dass
dem nicht so ist. Er konnte diese Annahme weder beweisen noch
widerlegen. Die Antwort kann «ja und nein» lauten, wie Kurt Gödel 1940
und Paul Cohen 1963 bewiesen. Es hängt davon ab, wie man die logischen
Fundamente der Mathematik ansetzt.
Nicht abzählbare Unendlichkeit
Erinnern Sie sich, dass man reelle Zahlen als Dezimalzahlen schreiben
kann, die entweder nach endlich vielen Stellen enden, wie zum Beispiel
1,44, oder die ewig weitergehen, wie zum Beispiel π. Cantor stellte fest
(wenn auch anders ausgedrückt), dass die Unendlichkeit der reellen Zahlen
definitiv größer ist als die der natürlichen Zahlen,
.
Die Idee ist trügerisch einfach. Sie bedient sich eines Beweises mittels
Widerspruch. In der Hoffnung, einen logischen Widerspruch herleiten zu
können, nehmen wir an, dass die reellen Zahlen eins zu eins auf die
natürlichen Zahlen abgebildet werden können. Dann muss es eine Liste von
unendlich vielen Dezimalzahlen der Form
geben, wobei jede mögliche unendliche Dezimalzahl irgendwo auf der
rechten Seite auftaucht. Achten Sie vorerst nicht auf den Fettdruck; ich
komme darauf gleich zurück.
Cantors großartige Idee besteht darin, eine unendliche Dezimalzahl zu
konstruieren, die auf keinen Fall in der Liste auftauchen kann. Sie hat die
Form
wobei
usw. Das sind genau die Stellen, die ich fett gedruckt habe.
Wenn man in einer unendlichen Dezimalzahl nur eine ihrer Stellen
verändert, ganz gleich wo, verändert man ihren Wert – das ist hier der
Punkt. Man verändert nicht viel, aber das ist nicht wichtig. Wichtig ist, dass
sie sich überhaupt ändert. Wir erhalten die neue «fehlende» Zahl, indem wir
dieses Spiel mit jeder Zahl auf der angeblich kompletten Liste durchführen.
Die Bedingung für x1 bedeutet, dass die neue Zahl nicht die erste in der
Liste ist, weil sie die falsche Ziffer an erster Stelle nach dem
Dezimalkomma hat. Die Bedingung für x2 bedeutet, dass die Zahl auch
nicht die zweite auf der Liste ist, weil sie dann die falsche Ziffer an der
zweiten Stelle nach dem Dezimalkomma hätte. Und so weiter. Weil sowohl
die Dezimalstellen als auch die Liste unendlich weitergehen, ist die
Schlussfolgerung, dass die neue Zahl sich nirgends auf der Liste findet.
Unsere Annahme war aber: Sie befindet sich auf der Liste. Das ist ein
Widerspruch, folglich ist unsere Annahme falsch und keine solche Liste
kann existieren.
Eine technisches Detail bedarf unserer Aufmerksamkeit: Man vermeidet
entweder 0 oder 9 als Ziffern in der zu konstruierenden Zahl, weil die
Dezimaldarstellung mehrdeutig ist. Zum Beispiel ist 0,10000… exakt
dieselbe Zahl wie 0,09999… (Es handelt sich um zwei unterschiedliche
Arten,
als unendliche Dezimalzahl zu schreiben). Diese Mehrdeutigkeit
entsteht nur dann, wenn die Dezimalzahl in einer unendlichen Folge von
Nullen oder einer unendlichen Folge von Neunen aufhört.
Die ganze Idee nennt man Cantors Diagonalargument, weil die Ziffern
a1, b2, c3, d4, e5, usw., längs der Diagonalen auf der rechten Seite der Liste
stehen. (Halten Sie nach den fett gedruckten Stellen Ausschau.) Der Beweis
funktioniert genau deshalb, weil sowohl die Ziffern als auch die Liste sich
auf die natürlichen Zahlen abbilden lassen.
Es ist wichtig, die Logik dieses Beweises zu verstehen. Natürlich könnte
man mit der speziellen Zahl, die wir konstruiert haben, so umgehen, dass
man sie an die erste Stelle der Liste setzt und alle anderen eine Stelle nach
unten rückt. Doch die Logik des Beweises mittels Widerspruch besteht
darin, dass wir das bereits ausgeschlossen haben. Die Zahl, die wir
konstruiert haben, befindet sich laut Voraussetzung bereits in der Liste,
ohne irgendwelche weiteren Modifikationen. Doch sie ist nicht da.
Deswegen: Es kann keine solche Liste geben.
Da jede ganze Zahl auch eine reelle Zahl ist, hat das zur Folge, dass in
Cantors Modell die Unendlichkeit der reellen Zahlen größer ist als die
Unendlichkeit der ganzen Zahlen. Indem er Russells Paradox modifizierte,
ging er noch viel weiter; er zeigte, dass es keine größte unendliche Zahl
geben kann. Das führte ihn dazu, sich eine unendliche Reihe von immer
größer werdenden unendlichen Zahlen vorzustellen, die als transfinite
Kardinalzahlen bekannt sind.
Keine größte Unendlichkeit
Cantor glaubte, dass die Reihe seiner unendlichen Zahlen so beginnen
sollte:
wobei jede folgende unendliche Zahl in dem Sinne die «nächste» sein
sollte, dass es keine dazwischen gibt. Die ganzen Zahlen entsprechen
.
Ebenso die rationalen Zahlen. Reelle Zahlen aber müssen nicht rational
sein. Cantors Diagonalelement zeigt, dass
sollten die reellen Zahlen wohl zu
größer ist als
, folglich
korrespondieren. Aber tun sie das
auch?
Der Beweis sagt uns nicht, dass es so ist. Er besagt nur, dass
als
größer ist
, aber er schließt nicht die Möglichkeit aus, dass noch etwas
dazwischen liegt. Nach Cantors Wissensstand hätte
sagen wir
sein
können. Oder noch schlimmer.
Einiges konnte er beweisen. Transfinite Kardinalzahlen können
tatsächlich auf diese Weise geordnet werden. Mehr noch enden die Indizes
0, 1, 2, 3, 4… nicht mit den endlichen ganzen Zahlen. Es muss zum
Beispiel auch eine transfinite Zahl
geben: nämlich die kleinste
transfinite Zahl, die größer ist als alle
, wobei n eine ganze Zahl ist.
Und würde alles hier enden, wäre sein Theorem verletzt, dass es keine
größte transfinite Zahl geben kann, folglich endet die Reihe auch nicht.
Niemals.
Eines konnte er jedoch nicht beweisen: dass die reellen Zahlen zu
korrespondieren. Vielleicht gehörten sie zu
und irgendeine andere
Menge lag dazwischen, sodass deren Mächtigkeit
war. So sehr er sich
auch bemühte, er konnte keine solche Menge finden, konnte jedoch auch
nicht beweisen, dass sie nicht existiert. Wo standen die reellen Zahlen in der
Liste von Alephs? Er hatte keine Idee. Er vermutete, dass die reellen Zahlen
tatsächlich zu
gehörten, doch war dies nur eine Hypothese. Also
benutzte er ein anderes Symbol: das gotische
, das für «Kontinuum»
steht, der Name, der damals für die Menge aller reellen Zahlen benutzt
wurde.
n
Eine endliche Menge mit n Elementen hat 2 verschiedene Teilmengen.
A
Deswegen definierte Cantor 2 für eine beliebige Kardinalzahl A, indem er
A
eine Menge mit Mächtigkeit A hernahm und 2 als die Kardinalzahl der
A
Menge all ihrer Teilmengen setzte. Damit konnte er beweisen, dass 2
größer ist als A für jede transfinite Kardinalzahl A. Was übrigens auch zur
Folge hat, dass es keine größte transfinite Kardinalzahl gibt. Er konnte auch
beweisen, dass
gleich
ist. Es schien wahrscheinlich, dass allgemein
gilt. Das heißt, wenn man die Menge aller Teilmengen
nimmt, so führt das zur nächstgrößeren transfiniten Kardinalzahl. Doch
beweisen konnte er das nicht.
Cantor konnte noch nicht einmal den einfachsten Fall, n = 0, beweisen,
was so viel bedeutet wie die Feststellung
=
. Im Jahr 1878 stellte
Cantor die Vermutung auf, dass diese Gleichung stimmt und sie wurde als
Kontinuumshypothese bekannt. Gödel bewies 1940, dass das Zutreffen
dieser Hypothese mit den üblichen Annahmen der Mengentheorie logisch
verträglich ist, was die Mathematiker ermutigte. Im Jahr 1963 jedoch
konnte Cohen zeigen, dass auch das Nichtzutreffen der Hypothese logisch
verträglich ist.
Hoppla!
Das ist aber kein logischer Widerspruch in der Mathematik. Die
Bedeutung dieses Sachverhalts ist viel merkwürdiger und in gewisser Weise
auch verstörender: Die Antwort hängt davon ab, welche Version der
Mengenlehre man benutzt. Es gibt mehrere verschiedene Wege, die
logischen Grundlagen der Mathematik festzulegen, und während sie alle in
den Grundannahmen übereinstimmen, können sie bei weiter entwickelten
Konzepten auseinandergehen. Wie Walt Kellys Comicfigur Pogo zu sagen
pflegte: «Wir sind auf den Feind gestoßen – auf uns selbst.» Das Insistieren
auf axiomatischer Logik beißt sich in den Schwanz.
Heutzutage ist bekannt, dass auch viele andere Eigenschaften der
transfiniten Kardinalzahlen davon abhängen, welche Version der
Mengenlehre man benutzt. Darüber hinaus haben derartige Fragen enge
Verbindungen zu anderen Eigenschaften von Mengen, die nicht explizit mit
Kardinalzahlen zusammenhängen. Das Gebiet ist ein ergiebiger Jagdgrund
für mathematische Logiker, doch im Großen und Ganzen funktioniert der
Rest der Mathematik augenscheinlich ganz gut, egal welche Version der
Mengenlehre man benutzt.
DAS LEBEN, DAS UNIVERSUM UND …
Ist 42 wirklich die absolut langweiligste Zahl?
Kein bisschen langweilig
Nun, damit würde man sicherlich zu früh aufgeben.
Wie im Vorwort schon erwähnt, spielt diese Zahl eine prominente Rolle
in Douglas Adams’ Science-Fiction-Roman «Per Anhalter durch die
Galaxis», wo sie die Antwort auf «die große Frage nach dem Leben, dem
Universum und dem ganzen Rest» darstellt. Ihre Entdeckung warf sofort
eine neue Frage auf: Was denn das große Rätsel des Lebens, des
Universums und des ganzen Rests ist. Adams zufolge hat er diese Zahl
gewählt, weil eine kurz Umfrage bei seinen Freunden ergab, dass sie total
langweilig sei.
An dieser Stelle würde ich gerne die 42 gegen diese Verleumdung
verteidigen. Zugegeben, 42 steht hinsichtlich ihrer mathematischen
Bedeutung nicht auf einer Stufe mit 4 oder π oder sogar 17. Sie ist aber
auch nicht völlig uninteressant. Sie ist eine Rechteckzahl, eine Catalan’sche
Zahl und die magische Konstante des kleinsten magischen Würfels. Und
noch ein paar andere Dinge.
Rechteckzahl
Eine Rechteckzahl oder pronische Zahl ist das Produkt zweier
aufeinanderfolgender ganzer Zahlen. Sie hat daher die Form n(n+1). Falls n
= 6 ist, erhalten wir 6 × 7 = 42. Da die n-te Dreieckszahl
ist, ist eine pronische Zahl das Doppelte einer Dreieckszahl. Deshalb stellt
sie auch die Summe der ersten n geraden Zahlen dar. Eine pronische Zahl
von Punkten kann man rechteckförmig anordnen, wobei eine Seite des
Rechtecks um einen Punkt länger ist als die andere.
Abbildung 176: Die ersten sechs pronischen Zahlen. Die Schattierung illustriert, dass jede
das Doppelte einer Dreieckszahl darstellt.
Einer Legende zufolge wurde der junge Gauß als Schüler mit einem
Problem der Art
konfrontiert. Er bemerkte sofort Folgendes: Wenn man die Summe in
absteigender Reihenfolge darunter schreibt
addieren sich entsprechende Paare zu 101. Da es 100 solche Paare gibt, ist
die Gesamtsumme gleich 100 × 101 = 10100. Dies ist eine Rechteckzahl.
Die Antwort auf die Frage des Lehrers beträgt die Hälfte davon: 5050. Wir
wissen allerdings nicht, welche Zahlen Gauß’ Lehrer der Klasse tatsächlich
vorsetzte, möglicherweise waren sie unangenehmer als diese. Umso größer
wäre Gauß’ Genie gewesen.
Die sechste Catalan’sche Zahl
Catalan’sche Zahlen tauchen in vielen verschiedenen kombinatorischen
Problemen auf. Sie repräsentieren die Anzahl der Möglichkeiten, diverse
mathematische Aufgaben auszuführen, und sie gehen auf Euler zurück, der
abzählte, auf wie viele Arten einen Vieleck in Dreiecke aufgeteilt werden
kann, indem man seine Ecken verbindet. Später fand Eugène Catalan eine
Beziehung zur Algebra: auf wie viele Arten man Klammern in eine Summe
oder ein Produkt einfügen kann. Ich komme darauf in Kürze zurück, doch
lassen Sie mich erst die Zahlen einführen.
Die ersten paar Catalan’schen Zahlen Cn für n = 0, 1, 2, …, sind
Dafür gibt es eine Formel, die Fakultäten benutzt:
Eine recht gute Näherung für große n ist
was ein weiteres Beispiel dafür ist, dass π in Problemen auftaucht, die keine
Beziehung zu Kreisen oder Kugeln zu haben scheinen.
Cn ist die Anzahl verschiedener Möglichkeiten, ein regelmäßiges (n +
2)‑Eck in Dreiecke aufzuteilen.
Abbildung 177: Die 14 Triangulationen eines Sechsecks.
Cn ist auch die Anzahl von Binärbäumen mit n + 1 Blättern. Solche Bäume
erhält man, indem man mit einem einzelnen Punkt (oder Knoten) beginnt,
der Wurzel, und dann aus jedem Knoten zwei Äste sprießen lässt. Jeder Ast
endet entweder in einem Knoten oder einem Blatt. Jeder Knoten muss
seinerseits zwei Zweige hervorbringen.
Abbildung 178: Die fünf Binärbäume mit vier Blättern.
Falls Ihnen diese Konstruktion esoterisch vorkommt, sie steht in direkter
Beziehung zu einem algebraischen Problem: Sie stellt die Anzahl
verschiedener Möglichkeiten dar, Klammern in einem Produkt wie abcd zu
setzen, wo es C3 = 5 Möglichkeiten gibt:
Im Allgemeinen beträgt die Anzahl der möglichen Klammerungen bei n + 1
Symbolen Cn. Um die Beziehung herzustellen, schreibe man die Symbole
an die Blätter des Baumes und setze Klammern dort, wo zwei Äste in einem
Knoten münden. Genauer (siehe Abbildung) bezeichnen wir die vier Blätter
von links nach rechts mit a, b, c, d. Unten beginnend schreiben wir (bc)
neben den Knoten, der b und c verbindet. Dann verbindet der Knoten
darüber a mit dem Punkt, der (bc) markiert ist, daher entspricht der neue
Knoten (a(bc)). Schließlich verbindet der Punkt ganz oben das Ganze mit d,
sodass er das Etikett ((a(bc))d) erhält.
Abbildung 179: Wie man einen Binärbaum in einen algebraischen Ausdruck verwandelt.
Zahlreiche kombinatorische Probleme führen auf Catalan’sche Zahlen. Die
oben aufgeführten stellen nur einen kleinen Ausschnitt derjenigen dar, die
sich leicht beschreiben lassen.
Magische Würfel
Die magische Konstante eines 3 × 3 × 3 magischen Würfels ist 42. Solch
ein Würfel enthält alle Zahlen von 1 bis 27, und die Summe jeder zu einer
Kante parallelen Reihe und auch jeder Diagonalen, die durch das Zentrum
führt, ist dieselbe – die magische Konstante. Die Summe aller 27 Zahlen ist
1 + 2 +… + 27 = 378. Diese lässt sich aus neun sich nicht überschneidenden
Tripeln zusammensetzen. Die magische Konstante muss demnach
=
42 sein.
Solche Anordnungen gibt es; die Abbildung zeigt eine.
Abbildung 180: Benachbarte Schichten eines 3 × 3 × 3 magischen Würfels.
Weitere besondere Eigenschaften
42 ist die Anzahl der Partitionen von 10, d.h. der Möglichkeiten, die
10 als Summe ganzer Zahlen in natürlicher Reihenfolge zu
schreiben, wie zum Beispiel
42 ist die zweite sphenische Zahl – Zahlen, die das Produkt dreier
verschiedener Primzahlen sind. In diesem Fall 42 = 2 × 3 × 7. Die
ersten paar sphenischen Zahlen lauten
42 ist die dritte Fünfzehneckszahl – analog zu den Dreieckszahlen,
aber auf einem regelmäßigen 15‑Eck basierend.
42 ist eine super-multivollkommene Zahl, genauer die kleinste (2,6)perfekte Zahl: Bildet man die Summe der Teiler der Summe ihrer
Teiler, erhält man das 6-Fache der Zahl selbst.
Eine Zeit lang war 42 das bekannteste Irrationalitätsmaß für π – eine
präzise Art und Weise, zu quantifizieren, «wie irrational» π ist.
Insbesondere zeigte Kurt Mahler 1953, dass für beliebiges rationales
p/q gilt:
Im Jahr 2008 ersetzte V.Kh. Salikov die 42 jedoch durch
7,60630853, sodass 42 in diesem Zusammenhang wieder langweilig
wurde.
42 ist die dritte primär pseudovollkommene Zahl. Solche Zahlen
erfüllen die Bedingung:
wobei die pj die verschiedenen Primteiler der Zahl N sind.
Die ersten primär pseudovollkommenen Zahlen lauten
42 ist die Anzahl n von Mengen aus vier verschiedenen natürlichen
Zahlen a, b, c, d (alle < n), sodass ab – cd, ac – bd und ad – bc alle
durch n teilbar sind. Sie ist die einzige bekannte Zahl mit dieser
Eigenschaft, man weiß jedoch nicht, ob es noch andere gibt.
42 ist die kleinste Dimension, für die sich die Wurst-Vermutung hat
beweisen lassen (siehe Kapitel [56]). Man vermutet jedoch, dass sie
für alle Dimensionen größer oder gleich 5 gilt, sodass die Bedeutung
von 42 in dieser Frage vom gegenwärtigen Stand der Erkenntnis
abhängt.
Sehen Sie? Kein bisschen langweilig!
Weiterführende Literatur
Carl B. Boyer: A History of Mathematics, Wiley, New York 1968
John H. Conway und Richard K. Guy: The Book of Numbers,
Springer, New York 1996
John H. Conway und Derek A. Smith: On Quaternions and
Octonions, A. K. Peters, Natick MA 2003
John H. Conway, Heidi Burgiel und Chaim Goodman-Strauss: The
Symmetries of Things, A. K. Peters, Wellesley MA 2008
Tobias Dantzig: Number: The Language of Science, Pi Press, New
York 2005
Augustus De Morgan: A Budget of Paradoxes (2 Bände,
Nachdruck), Books for Libraries Press, New York 1969
Underwood Dudley: Mathematical Cranks, Mathematical
Association of America, New York 1992 (deutsch: Mathematik
zwischen Wahn und Witz: Trugschlüsse, falsche Beweise und
die Bedeutung der Zahl 57 für die amerikanische Geschichte,
Birkhäuser, Basel 1995)
Marcus Du Sautoy: The Music of the Primes, Harper Perennial,
New York 2004 (deutsch: Die Musik der Primzahlen: Auf den
Spuren des größten Rätsels der Mathematik. Deutscher
Taschenbuch-Verlag, München 2006)
Richard J. Gillings: Mathematics in the Time of the Pharaohs
(Nachdruck), Dover, New York 1982
Anton Glaser: History of Binary and Other Nondecimal
Numeration, Tomash, Los Angeles 1981
Jan Gullberg: Mathematics from the Birth of Numbers, Norton,
New York 1997
Richard K. Guy: Unsolved Problems in Number Theory, Springer,
New York 1994
G. H. Hardy und E. M. Wright: An Introduction to the Theory of
Numbers, Oxford University Press (4. Aufl.), Oxford 1960
(deutsch: Einführung in die Zahlentheorie. Oldenbourg,
München 1958)
Andreas M. Hinz, Sandi Klavzar, Uros Milutinovic und Ciril Petr:
The Tower of Hanoi – Myths and Maths, Birkhäuser, Basel 2013
Gareth A. Jones und J. Mary Jones: Elementary Number Theory,
Springer, Berlin 1998
George Gheverghese Joseph: The Crest of the Peacock: NonEuropean Roots of Mathematics, Penguin, London 1992
Viktor Klee und Stan Wagon: Old and New Unsolved Problems in
Plane Geometry and Number Theory, Mathematical Association
of America, New York 1991
Mario Livio: The Golden Ratio, Broadway, New York 2002
Mario Livio: The Equation That Couldn’t Be Solved, Simon &
Schuster, New York 2005
John McLeish: Number, Bloomsbury, London 1991
Otto Neugebauer: A History of Ancient Mathematical Astronomy
(3 Bände), Springer, Berlin 1975
Paulo Ribenboim: The Book of Prime Number Records, Springer,
New York 1984 (deutsch: Die Welt der Primzahlen:
Geheimnisse und Rekorde. Springer, Berlin/New York 2011)
Ernő Rubik, Támás Varga, Gerszon Kéri, György Marx und Támás
Vekerdy: Rubik’s Cubic Compendium, Oxford University Press,
Oxford 1987
Karl Sabbagh: Dr. Riemann’s Zeros, Atlantic Books, London 2022
Wacław Sierpiński: Elementary Theory of Numbers, North-Holland,
Amsterdam 1998
Simon Singh: Fermat’s Last Theorem, Fourth Estate, London 1997
(deutsch: Fermats letzter Satz: Die abenteuerliche Geschichte
eines mathematischen Rätsels, Deutscher Taschenbuch-Verlag,
München, 3. Aufl. 2000)
Ian Stewart: Professor Stewart’s Cabinet of Mathematical
Curiosities, Profile, London 2008 (deutsch: Professor Stewarts
mathematisches Kuriositätenkabinett, Rowohlt, Reinbek 2010)
Ian Stewart: Professor Stewart’s Hoard of Mathematical
Treasures, Profile, London 2009 (deutsch: Professor Stewarts
mathematische Schätze, Rowohlt, Reinbek, 2013)
Ian Stewart: Professor Stewart’s Casebook of Mathematical
Mysteries, Profile, London 2014 (deutsch: Professor Stewarts
mathematische Detektivgeschichten, Rowohlt, Reinbeck, 2016)
Frank J. Swetz: Legacy of the Luoshu, A. K. Peters, Wellesley MA
2008
Jean-Pierre Tignol: Galois’s Theory of Algebraic Equations,
Longman, London 1988
Matthew Watkins und Matt Tweed: The Mystery of the Prime
Numbers, Inamorata Press, Dursley 2010
Jeremy Webb (Hg.): Nothing, Profile, London 2013
Robin Wilson: Four Colors Suffice (2. Auflage), Princeton
University Press, Princeton 2014
Online-Quellen
Spezielle Internet-Quellen sind im Text genannt. Was alle anderen
mathematischen Informationen angeht, versuche man es zunächst mit
Wikipedia und mit Wolfram MathWorld (in Englisch).
Abbildungsnachweis
Autor und Verlag danken für die freundliche Abdruckgenehmigung
folgender Abbildungen:
Abb. 1: Wikimedia creative commons, Albert1ls; Abb. 3: Wikimedia
creative commons, Marie-Lan Nguyen; Abb. 31: Livio Zucca; Abb. 32:
Metropolitan Museum of Art, New York, Schenkung von Chester Dale;
Abb. 63: Wikimedia creative commons, Flagstaffotos; Abb. 77: Lessing
Archive; Abb. 108: Allianz SE; Abb. 119: Kenneth Libbrecht; Abb. 130:
thoughtyoumayask.com; Abb. 133: Jeff Bryant und Andrew Hanson;
Abb. 153: Wolfram MathWorld; Abb. 159: Wikimedia creative commons;
Abb. 160: Wikimedia creative commons, Matt Crypto; Abb. 168: Joe
Christy.
Trotz sorgfältiger Recherche konnten nicht alle Rechteinhaber der
verwendeten Abbildungen ermittelt werden. Autor und Verlag sind dankbar
für Informationen über Abbildungen, deren Rechteinhaber sie nicht
ermitteln konnten, und werden diese in weiteren Auflagen berücksichtigen.
Die englische Originalausgabe erschien 2015 unter dem Titel «Professor
Stewart’s Incredible Numbers» bei W.W. Profile Books Ltd., London.
Veröffentlicht im Rowohlt Taschenbuch Verlag, Reinbek bei Hamburg, Juli
2016
Copyright © 2016 by Rowohlt Verlag GmbH, Reinbek bei Hamburg
«Professor Stewart’s Incredible Numbers» Copyright © 2015 by Joat
Enterprises
Dieses Werk ist urheberrechtlich geschützt, jede Verwertung bedarf der
Genehmigung des Verlages
Redaktion Heiner Höfener
Umschlaggestaltung ZERO Werbeagentur, München, nach der
Originalausgabe von Profile Books, Gestaltung Steve Panton
Schrift DejaVu Copyright © 2003 by Bitstream, Inc. All Rights Reserved.
Bitstream Vera is a trademark of Bitstream, Inc.
ISBN Printausgabe 978-3-499-63153-5 (1. Auflage 2016)
ISBN E-Book 978-3-644-56431-2
www.rowohlt.de
Hinweis: Aus technischen Gründen können die Zahlen der kapitelführenden
Formeln nicht im ToC und in der «[Inhaltsübersicht]» angezeigt werden.
Aus diesem Grund wird das in dieser Hinsicht vollständige
Inhaltsverzeichnis der Printausgabe («INHALT») dargestellt; dieses ist aber
nicht interaktiv, im Gegensatz zu den aufgeführten und verlinkten
Überschriften der «[Inhaltsübersicht]», über die man direkt zur
entsprechenden Kapitelüberschrift springen kann.
Die Seitenverweise im Inhalt, im Text und im Abbildungsnachweis
beziehen sich auf die Seiten der Printausgabe.
Verbinden Sie sich mit uns!
Neues zu unseren Büchern und Autoren finden Sie auf www.rowohlt.de.
Werden Sie Fan auf Facebook und lernen Sie uns und unsere Autoren näher
kennen.
Folgen Sie uns auf Twitter und verpassen Sie keine wichtigen Neuigkeiten
mehr.
Unsere Buchtrailer und Autoren-Interviews finden Sie auf YouTube.
Abonnieren Sie unseren Instagram-Account.
Besuchen Sie unsere Buchboutique!
Die Buchboutique ist ein Treffpunkt für Buchliebhaberinnen. Hier gibt es
viel zu entdecken: wunderbare Liebesromane, spannende Krimis und
Ratgeber. Bei uns finden Sie jeden Monat neuen Lesestoff, und mit ein
bisschen Glück warten attraktive Gewinne auf Sie.
Tauschen Sie sich mit Ihren Mitleserinnen aus und schreiben Sie uns hier
Ihre Meinung.