Author: Stewart I.  

Tags: mathematik   zahlentheorie   zahlen   exakte wissenschaften  

ISBN: 978-3-644-56431-2

Year: 2016

Text
                    

Unglaubliche Zahlen Aus dem Englischen von Monika Niehaus und Bernd Schuh
In diesem Buch nimmt der britische Mathe-Guru seine Leser mit auf eine Reise durch das Reich der Zahlen – reelle, rationale, irrationale, komplexe; ganz, ganz kleine und unendlich große, Fraktale, Logarithmen, Hochzahlen, Primzahlen, Kusszahlen und viele mehr. Jedes Kapitel konzentriert sich auf eine Zahl oder Zahlengruppe und erläutert, warum sie so interessant ist. «Jede Zahl hat ihre eigene Geschichte zu erzählen», heißt es im Vorwort. Stewart erzählt sie mit Begeisterung und versteht es geschickt, diese Geschichten miteinander zu verweben, ob es um die Zahl Pi geht oder zum Schluss auch um Geheimcodes, den Rubikwürfel und Sudoku. Darüber hinaus erfährt man viel über die Geschichte der Mathematik und die Rolle, die sie für unsere Entwicklung spielt. Schließlich waren es die Zahlen, so der Autor, «die es der Menschheit ermöglicht haben, sich aus dem Schlamm zu ziehen und nach den Sternen zu greifen».
Ian Stewart, geboren 1945, ist der beliebteste Mathematik-Professor Großbritanniens und hat längst auch in Deutschland eine treue Fangemeinde. Seit Jahrzehnten bemüht er sich erfolgreich, seine Wissenschaft zu popularisieren. Er studierte in Cambridge und promovierte an der Universität Warwick. Dort ist er heute Professor für Mathematik und Direktor des Mathematics Awareness Center. Seit 2001 ist Stewart zudem Mitglied der Royal Society. Bei Rowohlt lieferbar: «Professor Stewarts mathematische Detektivgeschichten» (2016); «Die letzten Rätsel der Mathematik» (2015); «Weltformeln» (2014); «Professor Stewarts mathematische Schätze» (2012/2013); «Professor Stewarts mathematisches Sammelsurium» (2011).
Inhaltsübersicht INHALT Vorwort Zahlen KLEINE ZAHLEN Die unteilbare Einheit Ungerade und gerade Kubische Gleichungen Quadratzahlen Die Hypotenuse des Pythagoras Kusszahlen Die vierte Primzahl Fibonacci-Potenzen Magische Quadrate Das Dezimalsystem NULL UND NEGATIVE ZAHLEN Ist nichts eine Zahl? Weniger als nichts KOMPLEXE ZAHLEN Imaginäre Zahlen RATIONALE ZAHLEN Das Unteilbare teilen Näherungen für π Die Türme von Hanoi
IRRATIONALE ZAHLEN Die erste bekannte irrationale Zahl Den Kreis vermessen Der Goldene Schnitt Natürliche Logarithmen Fraktale Kugelpackungen Die Tonleiter Die Apéry-Konstante Die Euler-Konstante SPEZIELLE KLEINE ZAHLEN Die Stringtheorie Pentominos Vielecke und Tapetenmuster Das Geburtstagsparadox Geheime Botschaften Die Wurst-Vermutung Endliche Geometrie GROSSE ZAHLEN Fakultäten Der Rubik-Würfel Sudoku Die größte bekannte Primzahl UNENDLICHE ZAHLEN Aleph-null: Die kleinste Unendlichkeit Mächtiges Kontinuum DAS LEBEN, DAS UNIVERSUM UND …
Kein bisschen langweilig Weiterführende Literatur Online-Quellen Abbildungsnachweis
Vorwort Zahlen 7 11 KLEINE ZAHLEN 29 1 Die unteilbare Einheit 31 2 Ungerade und gerade 36 3 Kubische Gleichungen 4 Quadratzahlen 5 Die Hypotenuse des Pythagoras 95 6 Kusszahlen 109 7 Die vierte Primzahl 8 Fibonacci-Potenzen 130 9 Magische Quadrate 138 10 63 74 116 Das Dezimalsystem 145 NULL UND NEGATIVE ZAHLEN 0 Ist nichts eine Zahl? 163 –1 Weniger als nichts 176 KOMPLEXE ZAHLEN i 185 Imaginäre Zahlen 187 161
RATIONALE ZAHLEN 195 Das Unteilbare teilen 197 Eine Näherung für π 205 Die Türme von Hanoi 208 IRRATIONALE ZAHLEN 219 Die erste bekannte irrationale Zahl 221 π ~ 3,141592 Den Kreis vermessen 229 φ ~ 1,618034 Der Goldene Schnitt 246 e ~ 2,718281 Natürliche Logarithmen Fraktale 257 273 Kugelpackungen 285 Die Tonleiter 294 ζ(3) ~ 1,202056 γ ~ 0,577215 Die Apéry-Konstante 309 Die Euler-Konstante 313 SPEZIELLE KLEINE ZAHLEN 315 11 Die Stringtheorie 317 12 Pentominos 327 17 Vielecke und Tapetenmuster 23 Das Geburtstagsparadox 26 Geheime Botschaften 358 349 335
56 168 Die Wurst-Vermutung 373 Endliche Geometrie 377 GROSSE ZAHLEN 395 26! = 403291461126605635584000000 43252003274489856000 Der Rubik-Würfel 6670903752021072936960 57885161 2 –1 Fakultäten 397 Sudoku 403 409 Die größte bekannte Primzahl (hat 17425170 Ziffern) 413 UNENDLICHE ZAHLEN 419 Aleph-null: Die kleinste Unendlichkeit Mächtiges Kontinuum 421 431 DAS LEBEN, DAS UNIVERSUM UND … 437 42 Kein bisschen langweilig 439 WEITERFÜHRENDE LITERATUR ABBILDUNGSNACHWEIS 449 446
Zahlen haben mich schon immer fasziniert. Schon lange vor Schulbeginn brachte mir meine Mutter Lesen und Rechnen bei. Als ich schließlich nach meinem ersten Schultag nach Hause kam, soll ich mich angeblich beklagt haben, dass wir «gar nicht gelernt» hätten! Ich hege den Verdacht, dass meine Eltern mich auf diesen schwierigen Tag vorbereitet hatten, indem sie mir erzählten, dass ich in der Schule eine Menge interessanter Dinge lernen würde, und ich hatte mir ihre Propaganda ein wenig zu sehr zu Herzen genommen. Aber bald erfuhr ich vieles über Planeten und Dinosaurier und den Bau von Gipstieren. Und mehr über Zahlen. Zahlen üben noch immer einen Zauber auf mich aus, und noch immer lerne ich mehr über sie. Nun weise ich stets darauf hin, dass es in der Mathematik um vieles geht, nicht nur um Zahlen; beispielsweise geht es auch um Formen, Muster und Wahrscheinlichkeiten – aber Zahlen ziehen sich wie ein roter Faden durch das ganze Thema. Und jede Zahl ist einzigartig, ein Individuum. Einige spezielle Zahlen ragen aus der Menge der übrigen hervor und spielen offenbar in verschiedenen Gebieten der Mathematik eine zentrale Rolle. Die bekannteste dieser Superzahlen ist wohl π (Pi), auf die wir zunächst im Zusammenhang mit Kreisen stoßen, doch sie zeigt eine bemerkenswerte Tendenz, plötzlich bei Problemen aufzutauchen, die offenbar überhaupt nichts mit Kreisen zu tun haben.
Die meisten Zahlen können keine derartige Prominenz für sich beanspruchen, doch selbst bei der bescheidensten Zahl lässt sich in der Regel irgendein ungewöhnliches Merkmal finden. In Per Anhalter durch die Galaxis ist die Zahl 42 die Antwort auf die große Frage «nach dem Leben, dem Universum und dem ganzen Rest». Douglas Adams erklärte, er habe diese Zahl gewählt, weil eine kurze Umfrage unter seinen Freunden erbracht habe, dass sie total langweilig ist. Tatsächlich stimmt das nicht, wie wir im letzten Kapitel noch sehen werden. Die Gliederung des Buches richtet sich nach den Zahlen selbst, wenn auch nicht immer in numerischer Reihenfolge. Ebenso wie die Kapitel [1], [2], [3] und so weiter gibt es ein Kapitel [0], ein Kapitel [42], ein Kapitel [– 1] und ein Kapitel [ ], ein Kapitel [π], ein Kapitel [43252003274489856000] und ein Kapitel [ ]. Ganz klar schaffte eine ganze Menge potenzieller Kapitel nicht den Sprung vom Zahlenstrahl ins Buch. Jedes Kapitel beginnt mit einer kurzen Zusammenfassung der Hauptthemen, die darin behandelt werden. Machen Sie sich keine Sorgen, wenn Ihnen die Zusammenfassung gelegentlich kryptisch erscheint oder wenn darin pauschale Behauptungen ohne jeden Beweis aufgestellt werden: All das wird sich klären, wenn Sie weiterlesen. Der Aufbau ist einfach: Jedes Kapitel konzentriert sich auf eine interessante Zahl und erklärt, warum sie interessant ist. So ist 2 beispielsweise interessant, weil sich die Unterscheidung zwischen gerade und ungerade durch die ganze Mathematik und Naturwissenschaft zieht, 43252003274489856000 ist interessant, weil es genau so viele Möglichkeiten gibt, Rubiks Würfel neu anzuordnen.
Da 42 ein eigenes Kapitel hat, muss sie ebenfalls interessant sein. Nun, zumindest ein bisschen. An dieser Stelle muss ich Arlo Guthries Song Alice’s Restaurant Massacree erwähnen, eine skurrile musikalische Geschichte, die ausführlich, mit vielen Wiederholungen und in voller Länge von illegaler Müllentsorgung am Straßenrand erzählt. Nach zehn Minuten unterbricht Guthrie sein Lied plötzlich und erklärt: «Aber darüber wollte ich eigentlich gar nicht mit euch sprechen.» Schließlich stellt sich heraus, dass er eben doch genau darüber sprechen wollte, der Müll jedoch Teil einer größeren Geschichte ist. Es ist Zeit für meinen Arlo-Guthrie-Moment: In Wirklichkeit geht es in diesem Buch gar nicht um Zahlen. Die Zahlen dienen als Einstieg, ein Tor, durch das wir in die erstaunliche Welt der Mathematik eintauchen können, die mit ihnen verknüpft ist. Jede Zahl ist etwas Besonderes. Wenn man sie als Individuen schätzen lernt, sind sie wie alte Freunde. Jede hat ihre eigene Geschichte zu erzählen. Oft führt diese Geschichte zu einer Menge anderer Zahlen, doch was wirklich zählt, ist die Mathematik, die sie miteinander verknüpft. Die Zahlen sind die Schauspieler in einem Schauspiel, und das eigentlich Wichtige dabei ist das Schauspiel selbst. Aber es gibt kein Drama ohne Schauspieler. Um dem Buch eine gewisse Struktur zu geben, habe ich es je nach Art der behandelten Zahlen in Abschnitte unterteilt: kleine ganze Zahlen, Brüche, reelle Zahlen, komplexe Zahlen, Unendlichkeit … Von einigen unvermeidlichen Ausnahmen abgesehen, folgt die Entwicklung des Stoffes einer logischen Reihenfolge, sodass frühere Kapitel die Grundlage für spätere bilden, selbst wenn es um ein völlig anderes Thema geht. Dieser Aufbau beeinflusst die Reihenfolge, in der die Zahlen abgehandelt werden,
und erfordert ein paar Kompromisse. Das gilt in besonderem Maße für die komplexen Zahlen. Sie kommen sehr früh ins Spiel, weil ich sie brauche, um einige Eigenschaften besser vertrauter Zahlen zu diskutieren. Desgleichen taucht gelegentlich irgendwo Mathematik für Fortgeschrittene auf, weil es die einzig vernünftige Stelle ist, um ein solches Thema zu erwähnen. Wenn Sie auf eine dieser Stellen stoßen und sie schwierig finden, überspringen Sie sie und lesen Sie einfach weiter; Sie können später darauf zurückkommen. Zahlen sind wirklich unglaublich – nicht in dem Sinne, dass man nichts von dem glauben könnte, was man über sie erfährt, sondern im positiven Sinne: Sie haben definitiv einen Wow-Faktor. Und den kann man erleben, ohne zu rechnen. Man kann verstehen, wie sich Zahlen historisch entwickelt haben, die Schönheit ihrer Muster würdigen, herausfinden, wie sie benutzt werden und über Überraschungen staunen: «Ich hätte nie gedacht, dass 56 so interessant ist!» Aber das ist sie. Wirklich! Und das gilt auch für all die anderen. Einschließlich 42.
Zahlen 1, 2, 3, 4, 5, 6, 7, … Was könnte einfacher sein als das? Und doch sind es Zahlen, die der Menschheit vielleicht mehr als alles andere geholfen haben, von den Bäumen herabzusteigen und nach den Sternen zu greifen. Individuelle Zahlen weisen ihre eigenen typischen Merkmale auf und eröffnen uns den Zugang zu einer Vielzahl mathematischer Themengebiete. Bevor wir sie jedoch eine nach der unteren genauer unter die Lupe nehmen, lohnt sich ein rascher Blick auf drei große Fragen: Wie sind Zahlen entstanden? Wie hat sich das Zahlenkonzept entwickelt? Und was sind Zahlen eigentlich? Die Entstehung der Zahlen Vor rund 35000 Jahren, in der Jungsteinzeit, ritzte ein unbekanntes menschliches Wesen 29 Kerben in das Wadenbein (Fibula) eines Pavians. Dieser Knochen wurde in einer Höhle in den Lebombo-Bergen in Swasiland gefunden und wird dementsprechend als Lebombo-Knochen bezeichnet. Vermutlich handelt es sich um einen Zählstab («Kerbholz»): ein Artefakt, das Zahlen als eine Reihe von Einkerbungen festhält: |, ||, ||| und so weiter. Ein Mondmonat umfasst 29,5 Tage, daher könnte es sich um einen primitiven Mondkalender – oder um die Aufzeichnung des weiblichen
Menstruationszyklus – handeln. Oder um eine zufällige Sammlung von Kerben, was das angeht. Eine Art Knochenkritzelei. Im Jahr 1937 fand Karl Absolon in der damaligen Tschechoslowakei einen weiteren Zählstab, einen Wolfsknochen mit 55 Kerben. Dieser Knochen ist rund 30000 Jahre alt. Nicht lange danach (1960) entdeckte der belgische Geologe Jean de Heinzelin de Braucourt zwischen den Überresten einer winzigen Fischersiedlung, die von einem Vulkanausbruch verschüttet worden war, das eingekerbte Wadenbein eines Pavians. Die Siedlung befand sich dort, wo sich heute Ishango befindet, an der kongolesisch-ugandischen Grenze. Der Knochen ist rund 20000 Jahre alt. Die einfachste Interpretation ist auch in diesem Fall, dass der IshangoKnochen als Zählstab gebraucht wurde. Einige Anthropologen gehen einen Schritt weiter und meinen Elemente einer arithmetischen Struktur zu erkennen, wie Multiplikation, Division und Primzahlen; andere glauben, es handele sich um einen sechsmonatigen Mondkalender, und noch andere sind überzeugt, die Kerben seien nur angebracht worden, um einen sicheren Griff an einem Knochenwerkzeug zu garantieren und hätten keinerlei mathematische Bedeutung.
Abbildung 1: Vorder- und Rückseite des Ishango-Knochens im belgischen Museum für Naturwissenschaften in Brüssel. Die ganze Sache bietet Stoff für reizvolle Spekulationen. Auf dem Knochen finden sich drei Reihen von Kerben. Die Kerben in der mittleren Reihe sind in Gruppen von 3, 6, 4, 8, 10, 5 und 7 Strichen angeordnet. Zweimal 3 ist 6, zweimal 4 ist 8 und zweimal 5 ist 10; die Reihenfolge des letzten Paares ist jedoch vertauscht, und 7 passt überhaupt nicht ins Muster. Die Reihe links weist 11, 13, 17 und 19 Kerben auf: die Primzahlen zwischen 10 und 20. Die Reihe rechts liefert die ungeraden Zahlen 11, 21, 19 und 9. Die Reihe der Kerben auf der linken Seite addiert sich wie diejenige auf der rechten Seite zu 60. Ein Problem bei der Deutung derartiger Muster ist, dass es schwerfällt, in einer beliebigen Reihe kleiner Zahlen kein Muster zu finden. Beispielsweise sind in Tabelle 1 die Flächen von zehn Inseln auf den Bahamas aufgelistet, nämlich Nummer 11 bis 20, was ihre Gesamtgröße angeht. Um die Liste zu mischen, habe ich die Inseln alphabetisch sortiert. Ich versichere Ihnen: Das war mein erster Versuch. Zugegeben, ich hätte diese Liste durch eine andere
ersetzt, wenn ich damit nicht hätte zeigen können, was ich zeigen wollte – aber es funktionierte, und so bin ich dabei geblieben. Name Fläche in Quadratmeilen Berry 12 Bimini 9 Crooked Island 93 Little Inagua 49 Mayaguana 110 New Providence 80 Ragged Island 14 Rum Cay 30 Samana Cay 15 San Salvador Island 63 Tabelle 1 Was fällt uns bei diesem «Zahlenmuster» auf? Es gibt eine ganze Menge kurzer Folgen mit gemeinsamen Merkmalen: Abbildung 2: Einige offensichtliche Muster in den Flächen der Bahama-Inseln. Zunächst einmal ist die ganze Liste wundervoll symmetrisch. An beiden Enden findet sich ein Tripel von Vielfachen von 3. In der Mitte steht ein
Paar Vielfache von 10, das zwei Vielfache von 7 trennt. Zudem treten zwei 2 2 Quadrate auf, 9 = 3 und 49 = 7 – beides Quadrate von Primzahlen. Ein weiteres benachbartes Paar besteht aus 15 und 30, eine Zahl die Verdopplung der anderen. In der Folge 9–93–49 weisen alle Zahlen die Ziffer 9 auf. Die Zahlen werden abwechselnd größer und kleiner, mit Ausnahme von 110–80–14. Oh, und ist Ihnen aufgefallen, dass keine dieser zehn Zahlen eine Primzahl ist? Genug gesagt. Ein weiteres Problem mit dem Ishango-Knochen ist, dass praktisch keine Möglichkeit besteht, an zusätzliche Informationen zu gelangen, die eine dieser Interpretationen stützen könnten. Die Einkerbungen auf dem Knochen sind jedoch zweifellos faszinierend. Das sind Zahlenrätsel immer. Daher wollen wir uns ein weniger umstrittenes Beispiel ansehen. Vor rund 10000 Jahren benutzten Menschen im Nahen Osten Tonfiguren, sogenannte Tokens (Zählsteine), um Zahlen wiederzugeben, vielleicht zum Zweck der Besteuerung oder als Eigentumsbeleg. Die ältesten Beispiele stammen aus Tepe Asiab und Ganj-i-Dareh Tepe, zwei Örtlichkeiten im iranischen Zagros-Gebirge. Die Tokens waren kleine, unterschiedlich geformte Tonklumpen, von denen einige symbolische Markierungen trugen. Eine mit + gekennzeichnete Kugel symbolisierte ein Schaf, sieben solche Tokens sieben Schafe. Um nicht allzu viele Tokens herstellen zu müssen, stand ein anderer Typ Token für 10 Schafe. Ein wiederum anderer Typ repräsentierte 10 Ziegen, und so weiter. Die Archäologin Denise SchmandtBesserat erkannte, dass die Tokens für die Grundnahrungsmittel der damaligen Zeit standen: Getreide, Tiere, Ölkrüge.
Um 4000 v. Chr. wurden die Tokens wie Perlen auf eine Schnur gezogen. Da es jedoch leicht war, die Zahlen durch Hinzufügen oder Wegnehmen von Tokens zu verändern, kam es zur Einführung von Sicherheitsmaßnahmen. Die Tokens wurden in Ton gewickelt, der anschließend gebacken wurde. Ein Streit über Zahlen ließ sich jederzeit lösen, indem man die Tonhülle aufbrach. Um unnötige Scherben zu vermeiden, schrieben die Bürokraten im alten Mesopotamien ab 3500 v. Chr. Symbole auf die Hülle, die die darin enthaltenen Tokens auflisteten.
Abbildung 3: Gesiegelte Tonbulle und Zählsteine, Uruk-Periode, aus Susa.
Irgendwann erkannte ein heller Kopf, dass die Symbole die Tokens überflüssig machten. Das Ergebnis war ein System geschriebener Zahlensymbole, das den Weg für alle folgenden Systeme zur Zahlennotation und möglicherweise auch für die Schrift ebnete. In diesem Buch geht es nicht primär um Geschichte, daher werde ich auf spätere Notationssysteme zu sprechen kommen, wenn sie im Zusammenhang mit speziellen Zahlen auftauchen. Beispielsweise beschäftigt sich Kapitel 10 mit antiken und modernen Dezimalschreibweisen. Wie der große Mathematiker Carl Friedrich Gauß jedoch einmal bemerkte, zählen nicht Schreibweisen, sondern Ideen. Die sich anschließenden Themen ergeben mehr Sinn, wenn man sie im Kontext des sich wandelnden Zahlenkonzepts der Menschheit betrachtet. Daher werden wir mit einem kurzen Ausflug durch die wichtigsten Zahlensysteme und einige wichtige Fachbegriffe beginnen. Das ständig wachsende Zahlensystem Wir neigen dazu, Zahlen als etwas Festes und Unwandelbares anzusehen: als ein Merkmal der natürlichen Welt. Tatsächlich handelt es sich jedoch um menschliche Erfindungen – wenn auch zugegebenermaßen um sehr nützliche, denn sie symbolisieren wichtige Aspekte der Natur. Zum Beispiel, wie viele Schafe jemand besitzt oder wie alt das Universum ist. Die Natur überrascht uns immer wieder, indem sie uns vor neue Fragen stellt, deren Beantwortung manchmal neue mathematische Konzepte verlangt. Manchmal gibt die innere Logik der Mathematik einen Hinweis
auf neue, potenziell nützliche Strukturen. Und von Zeit zu Zeit haben diese Hinweise und Probleme Mathematiker dazu veranlasst, das Zahlensystem zu erweitern und neue Arten von Zahlen zu erfinden. Wir haben gesehen, dass Zahlen zunächst entwickelt und gebraucht wurden, um Dinge zu zählen. In der Frühzeit der griechischen Antike startete die Liste der Zahlen mit 2, 3, 4 und so weiter: 1 war etwas Besonderes, keine «richtige» Zahl. Später, als diese Übereinkunft wirklich dumm auszusehen begann, wurde auch 1 in den Rang einer echten Zahl erhoben. Der nächste große Schritt vorwärts bei der Erweiterung des Zahlensystems bestand in der Einführung von Brüchen. Brüche sind von Nutzen, wenn man eine Ware unter mehreren Leuten verteilen möchte. Wenn drei Leute zwei Scheffel Getreide gleichmäßig unter sich aufteilen wollen, erhält jeder eines Scheffels. Abbildung 4: Links: Ägyptische Hieroglyphen für Davon abgeleitete Hieroglyphen für Brüche. und . Mitte: Wadjet-Auge. Rechts:
Die alten Ägypter stellten Brüche auf dreierlei Weise dar. Sie hatten spezielle Hieroglyphen für und . Zudem benutzten sie verschiedene Teile des Horus- oder Wadjet-Auges, um 1, geteilt durch die ersten sechs Potenzen von 2, darzustellen. Und schließlich entwickelten sie Symbole für andere Stammbrüche, bei denen eine 1 im Zähler, aber eine beliebige natürliche Zahl im Nenner steht, beispielsweise , , , und so weiter. Alle anderen Brüche drückten sie als Summe verschiedener Stammbrüche aus, zum Beispiel: Wir wissen nicht, warum sie nicht als + schrieben, aber sie taten es einfach nicht. Die Zahl null wurde erst viel später eingeführt, wahrscheinlich, weil man sie zunächst einfach nicht brauchte. Wenn man keine Schafe hat, muss man sie auch nicht zählen oder auflisten. Null wurde zunächst als Symbol verwandt und nicht als richtige Zahl angesehen. Als aber (siehe Kapitel [– 1]) chinesische und hinduistische Mathematiker negative Zahlen einführten, musste man auch 0 als Zahl betrachten. Beispielsweise ist 1 + (–1) = 0, und die Summe von zwei Zahlen kann sicherlich nichts anderes als ebenfalls eine Zahl sein. Mathematiker bezeichnen das System der Zahlen
als natürliche Zahlen, und wenn wir negative Zahlen mit einbeziehen, erhalten wir die ganzen Zahlen Brüche, Null und negative Zahlen bilden gemeinsam die rationalen Zahlen. Eine Zahl ist positiv, wenn sie größer ist als null, und negativ, wenn sie kleiner ist als null. Daher fällt jede Zahl (sei es eine ganze Zahl oder eine rationale Zahl) in genau eine dieser drei Kategorien: positiv, negativ oder null. Die Zählzahlen sind die positiven ganzen Zahlen. Diese Übereinkunft führt zu einer recht holprigen Terminologie: Die natürlichen Zahlen werden häufig als nichtnegative ganze Zahlen bezeichnet. Tut mir leid. Lange Zeit kam das Zahlenkonzept über Brüche nicht hinaus. Die alten Griechen bewiesen jedoch, dass das Quadrat eines Bruches niemals genau gleich 2 sein kann. Später wurde dies als «die Zahl ausgedrückt, das heißt, ist irrational» ist nicht rational. Die Griechen formulierten diesen Sachverhalt etwas umständlicher, aber sie wussten, dass existieren musste: Dem Satz des Pythagoras zufolge entspricht sie der Länge der Diagonalen eines Quadrats mit der Seite 1. Daher werden weitere
Zahlen gebraucht; mit rationalen allein kommen wir nicht aus. Die Griechen fanden eine komplizierte geometrische Methode, um irrationale Zahlen zu handhaben, doch diese Methode war nicht völlig zufriedenstellend. Der nächste Schritt in Richtung auf ein modernes Zahlenkonzept wurde durch die Einführung des Dezimalkommas (,) bzw. im angelsächsischen Raum des Dezimalpunktes (.) und die Dezimalschreibweise möglich. Dadurch ließen sich irrationale Zahlen mit sehr hoher Genauigkeit darstellen. Beispielsweise ist auf zehn Dezimalstellen korrekt (hier und im übrigen Text bedeutet das Proportionalzeichen ~ «ist annähernd gleich»). Dieser Ausdruck ist nicht exakt: Sein Quadrat beträgt tatsächlich Eine bessere Näherung, auf 20 Dezimalstellen korrekt, ist aber auch sie ist nicht völlig exakt. Man kann eine unendlich lange Dezimalentwicklung jedoch tatsächlich logisch exakt begründen. Natürlich lassen sich solche Ausdrücke nie vollständig ausschreiben, aber man kann die Idee dahinter skizzieren, sodass sie sinnvoll sind. Dezimalzahlen mit unendlich vielen Stellen (einschließlich solcher, die aufhören, die man sich aber durch unendlich viele Nullen fortgesetzt
vorstellen kann), werden als reelle Zahlen bezeichnet, teilweise deshalb, weil sie direkt mit Messungen von Parametern in der realen Welt wie Länge oder Gewicht korrespondieren. Je präziser die Messung, desto mehr Dezimalstellen benötigt man; um einen exakten Wert zu erhalten, braucht man unendlich viele. Es klingt vielleicht paradox, dass «reell» durch ein unendliches Symbol definiert ist, das sich nicht vollständig ausschreiben lässt. Negative reelle Zahlen sind ebenfalls erlaubt. Bis zum Anbruch des 18. Jahrhunderts wurden keine weiteren mathematischen Konzepte als echte Zahlen betrachtet. Doch schon im 15. Jahrhundert fragten sich einige Mathematiker, ob es womöglich einen neuen Zahlentyp gab: die Quadratwurzel aus –1: Das heißt eine Zahl, die, mit sich selbst multipliziert, –1 ergibt. Auf den ersten Blick scheint das eine verrückte Idee zu sein, denn das Quadrat einer jeden reellen Zahl ist positiv oder null. Wie sich herausstellte, handelte es sich jedoch um eine gute Idee, die –1 mit einer Quadratwurzel zu versehen. Leonhard Euler führte dafür schließlich das Symbol i ein. Das ist der Anfangsbuchstabe von «imaginär» (englisch imaginary, französisch imaginaire, lateinisch imaginarius), und diese Zahl wurde so benannt, um sie von den guten alten reellen Zahlen zu unterscheiden. Leider führte dies zu einer Menge unnötigem Mystizismus – Gottfried Leibniz bezeichnete i einst als «Amphibium zwischen Sein und Nichtsein» –, was eine Schlüsseltatsache verschleierte, nämlich: Sowohl reelle als auch imaginäre Zahlen haben genau denselben logischen Status. Beide sind Kinder unseres Geistes, menschliche Konzepte, die die Realität abbilden, aber nicht selbst real sind. Die Existenz von i ist notwendig, um eine ganze Reihe anderer neuer Zahlen einzuführen, die man braucht, um zu rechnen – Zahlen wie 2 + 3i.
Diese Zahlen heißen komplexe Zahlen, und sie haben sich in den letzten Jahrhunderten in Mathematik und Naturwissenschaften als unverzichtbar erwiesen. Diese seltsame, aber zutreffende Tatsache ist den meisten Menschen neu, denn in der Schulmathematik trifft man nur selten auf komplexe Zahlen. Nicht etwa, weil sie unwichtig wären, sondern weil die dahinter stehenden Vorstellungen zu komplex und die Anwendungen für die Schule zu fortgeschritten sind. Für die wichtigsten Zahlensysteme benutzen Mathematiker Phantasiesymbole. Ich werde diese Symbole nicht wieder benutzen, doch Sie sollten sie zumindest einmal gesehen haben: Diese Systeme passen ineinander wie russische Puppen: wobei das mengentheoretische Symbol ⊂ bedeutet «ist enthalten in». Machen Sie sich klar, dass jede ganze Zahl auch rational ist; zum Beispiel entspricht die ganze Zahl 3 auch dem Bruch . Wir schreiben sie gewöhnlich nicht so, aber beide Schreibweisen entsprechen derselben Zahl. Ebenso ist jede rationale Zahl auch reell, und jede reelle Zahl ist auch
komplex. Ältere Systeme werden in neuere inkorporiert, nicht von ihnen ersetzt. Selbst die komplexen Zahlen stehen nicht am Ende der Erweiterung des Zahlensystems, das Mathematiker im Laufe vieler Jahrhunderte aufgebaut haben. So gibt es zum Beispiel Quaternionen und Oktonionen (siehe Kapitel [4]). Es ist jedoch nützlicher, diese Zahlen algebraisch statt arithmetisch zu betrachten. Daher will ich mit der Erwähnung einer paradoxeren Zahl schließen – Unendlich. Philosophisch unterscheidet sich Unendlich von den konventionellen Zahlen und gehört nicht zu einem der Standard-Zahlensysteme von den natürlichen bis zu den komplexen Zahlen. Dennoch lungerte sie an den Rändern herum, zahlenartig, aber doch keine Zahl im eigentlichen Sinn. Bis Georg Cantor unseren Ausgangspunkt, Zählen, neu bestimmte und nicht nur zeigte, dass Unendlich eine Zahl im Sinn von Zählen ist, sondern auch, dass es Unendlichkeiten unterschiedlicher Größe gibt. Dazu gehören , die «Anzahl» oder «Mächtigkeit» der natürlichen Zahlen, und , die Mächtigkeit der reellen Zahlen. Welche größer ist. Um wie viel größer, darüber wird gestritten, denn das hängt davon ab, welches Axiomensystem man zur Formalisierung der Mathematik benutzt. Aber lassen wir diese Probleme erst einmal beiseite, bis wir genügend intuitives Verständnis für gewöhnlichere Zahlen gewonnen haben. Was mich zu meiner dritten Frage bringt. Was ist eigentlich eine Zahl?
Das klingt nach einer einfachen Frage, und das ist sie auch. Aber die Antwort ist nicht so einfach. Wir alle wissen, wie man Zahlen gebraucht. Wir alle wissen, wie sieben Kühe oder sieben Schafe oder sieben Stühle aussehen. Wir alle können bis sieben zählen. Aber was ist sieben? Es ist nicht das Symbol 7. Das ist willkürlich gewählt und sieht je nach Kultur anders aus. Im Arabischen sieht die Sieben so aus: Chinesischen hingegen so: , im oder in formeller Schreibweise so: . Es ist auch nicht das deutsche Wort «sieben». Im Französischen heißt es sept, im Englischen seven. Um die Mitte des 19. Jahrhunderts erkannten ein paar logisch denkende Mathematiker, dass zwar alle Welt seit Jahrtausenden unbekümmert mit Zahlen hantiert, aber niemand wusste, um was es sich dabei eigentlich handelt. Daher sprachen sie die Frage aus, die niemals hätte gestellt werden dürfen: Was ist eine Zahl? Die Frage ist schwieriger zu beantworten, als es auf den ersten Blick scheinen mag. Eine Zahl ist kein Ding, das man jemand anderem in der realen Welt zeigen kann. Es ist eine Abstraktion, ein geistiges Konzept, das sich von der Realität ableitet, aber nicht wirklich real ist. Das klingt vielleicht verwirrend, gilt aber nicht nur für Zahlen. Ein vertrautes Beispiel ist «Geld». Wir alle wissen, wie man etwas bezahlt und Wechselgeld zurückbekommt, und wir tun dies – das nehmen wir zumindest an –, indem wir Geld austauschen. Daher stellen wir uns Geld als die Münzen und Geldscheine in unserer Brieftasche oder unserem Portemonnaie vor. Aber so einfach ist die Sache nicht. Wenn wir eine
Kreditkarte benutzen, wechseln weder Münzen noch Scheine von einer Hand in die andere. Vielmehr wandern elektronische Signale durch das Telefonsystem zur Kreditkartengesellschaft und weiter zu unserer Bank, und die Zahlen auf mehreren Bankkonten – unserem, dem des Geschäfts, des Kreditkartenunternehmens – verändern sich. Eine britische 5-PfundNote trug früher die Aufschrift «Ich verspreche, dem Besitzer bei Vorlage die Summe von fünf Pfund zu zahlen». Es handelt sich also nicht um Geld, sondern um ein Versprechen, Geld zu zahlen. Vor langer Zeit konnten Sie mit einer solchen Banknote zur Bank gehen und sie gegen Gold eintauschen, was als echtes Geld angesehen wurde. Heutzutage tut die Bank nicht mehr, als sie gegen eine andere 5-Pfund-Note einzutauschen. Aber auch Gold war eigentlich kein richtiges Geld, sondern lediglich dessen physische Manifestation. Das wird schon dadurch bewiesen, dass der Goldpreis schwankt. Ist Geld also eine Zahl? Ja, aber innerhalb eines ganz bestimmten juristischen Kontextes. Wenn Sie 1000000 Euro auf ein Stück Papier schreiben, werden Sie dadurch noch lange nicht zum Millionär. Was Geld zu Geld macht, ist eine Reihe von gesellschaftlichen Übereinkünften, was Zahlen auf Zahlungsmitteln bedeuten und wie wir sie gegen Güter oder andere Zahlungsmittel eintauschen. Wichtig ist, was wir mit Zahlungsmitteln tun, nicht, was sie sind. Geld ist eine Abstraktion. Dasselbe gilt für Zahlen. Aber das reicht als Antwort nicht aus, denn die gesamte Mathematik besteht aus Abstraktionen. Daher fragten sich ein paar Mathematiker, welche Art von Abstraktion den Begriff «Zahl» definieren könne. Im Jahr 1884 veröffentlichte der deutsche Mathematiker Gottlob Frege sein Buch Grundlagen der Arithmetik. Eine logisch-mathematische
Untersuchung über den Begriff der Zahl, in dem er die fundamentalen Prinzipien formulierte, auf denen Zahlen basieren. Zehn Jahre später ging er einen Schritt weiter und versuchte, diese Prinzipien aus noch grundlegenderen Gesetzen der Logik abzuleiten. Sein Werk Grundgesetze der Arithmetik wurde in zwei Bänden veröffentlicht, der erste 1893 und der zweite 1903. Frege begann mit dem Zählprozess und konzentrierte sich nicht auf die Zahlen, die wir gebrauchen, sondern auf die Dinge, die wir zählen. Wenn ich sieben Tassen auf einen Tisch stelle und sie «1, 2, 3, 4, 5, 6, 7» abzähle, sieht es so aus, als seien die wichtigen Objekte die Zahlen. Frege war anderer Meinung: Er konzentrierte sich auf die Tassen. Zählen funktioniert, weil wir eine Sammlung von Tassen haben, die wir zählen wollen. Bei einer anderen Sammlung könnten wir zu einem anderen Ergebnis kommen. Frege nannte diese Sammlungen Klassen. Wenn wir zählen, wie viele Tassen diese bestimmte Klasse enthält, stellen wir eine Übereinstimmung, eine Korrespondenz zwischen der Klasse der Tassen und den Zahlensymbolen 1, 2, 3, 4, 5, 6 und 7 her. Abbildung 5: Korrespondenz zwischen Tassen und Zahlensymbol. Das Gleiche gilt für eine Klasse von Untertassen: Auch dort können wir eine entsprechende Übereinstimmung herstellen:
Abbildung 6: Korrespondenz zwischen Untertassen und Zahlensymbol. Wenn das der Fall ist, können wir daraus den Schluss ziehen, dass die Klasse der Untertassen dieselbe Anzahl von Untertassen enthält, wie die Klasse der Tassen Tassen enthält. Wir wissen sogar, wie viele: sieben. Das mag so offensichtlich erscheinen, dass es schon ans Banale grenzt, doch Frege erkannte, dass uns dies etwas durchaus Tiefgründiges und Wichtiges sagt: Auf diese Weise können wir nämlich zeigen, dass die Klasse der Untertassen dieselbe Anzahl Untertassen enthält, wie die Klasse der Tassen Tassen enthält, ohne die Symbole 1, 2, 3, 4, 5, 6 und 7 zu verwenden und ohne zu wissen, um wie viele Tassen oder Untertassen es sich handelt. Es genügt, eine Korrespondenz zwischen der Klasse der Tassen und der Klasse der Untertassen herzustellen: Abbildung 7: Eine Korrespondenz zwischen Tassen und Untertassen benötigt keine Zahlensymbole. Fachsprachlich wird eine derartige Korrespondenz als eineindeutige Zuordnung bezeichnet: Auf jede Tasse kommt genau eine Untertasse, auf jede Untertasse genau eine Tasse. Zählen funktioniert nicht, wenn man Tassen übersieht oder dieselbe Tasse mehrmals zählt. Nennen wir es einfach
eine Korrespondenz, während wir diese technische Bedingung im Hinterkopf behalten. Frege kam zu dem Schluss, die Zuordnung von Klassen mit Hilfe einer Korrespondenz bilde den Kern dessen, was wir mit «Zahl» meinen. Indem man zählt, wie viele Objekte eine Klasse enthält, ordnet man diese Klasse einer Standardklasse zu, deren Vertreter durch konventionelle Symbole wie 1, 2, 3, 4, 5, 6, 7 und so weiter symbolisiert werden, je nachdem, welcher Kultur Sie angehören. Frege war jedoch der Meinung, das Zahlenkonzept sollte unabhängig von der Kultur sein, daher entwickelte er einen Weg, der ihm erlaubte, ganz auf willkürliche Symbole zu verzichten. Genauer gesagt erfand er ein universelles Supersymbol, das für jede Kultur identisch war. Dabei handelte es sich jedoch nicht um etwas, das sich niederschreiben ließ: Es war rein gedanklich. Er begann mit dem Hinweis, dass die Mitglieder einer Klasse selbst Klassen sein können. Sie müssen es nicht sein, aber es gibt nichts, was sie davon abhält. Ein Karton mit Dosen voller gebackener Bohnen ist ein alltägliches Beispiel: Die Mitglieder des Kartons sind Dosen, und die Mitglieder der Dosen sind Bohnen. Daher hat es seine Richtigkeit, wenn man Klassen als Mitglieder anderer Klassen verwendet. Die Zahl «sieben» ist durch Korrespondenz mit jeder beliebigen Klasse verknüpft, die sich unserer Klasse von Tassen oder den korrespondierenden Untertassen oder der Klasse zuordnen lässt, die aus den Symbolen 1, 2, 3, 4, 5, 6 und 7 besteht. Eine bestimmte Klasse darunter auszuwählen und das eine Zahl zu nennen, ist eine willkürliche Entscheidung, der es an Eleganz mangelt und die unbefriedigend erscheint. Warum also nicht aufs Ganze gehen und all diese Klassen verwenden? Dann kann «sieben» als die Klasse
aller Klassen definiert werden, die mit einer beliebigen (und somit mit allen) dieser gerade erwähnten Klassen korrespondieren. Wenn wir das getan haben, können wir sagen, ob eine bestimmte Klasse sieben Mitglieder hat, indem wir nachprüfen, ob sie ein Mitglied dieser Klasse von Klassen ist. Aus Gründen der Zweckdienlichkeit verpassen wir dieser Klasse von Klassen das Etikett «sieben», aber die Klasse selbst ergibt auch dann Sinn, wenn wir darauf verzichten. So gelang es Frege, eine Zahl von einem willkürlich verliehenen Namen (oder Symbol) für eben diese Zahl abzugrenzen. Anschließend konnte er definieren, was eine Zahl ist: Es ist die Klasse aller Klassen, die mit einer gegebenen Klasse korrespondieren (und daher auch miteinander). Diese Art von Klasse meine ich, wenn ich von einem «Supersymbol» spreche. Wenn man sich einmal auf diese Denkweise eingelassen hat, ist es eine brillante Idee. Das Ganze läuft auf Folgendes hinaus: Statt einen Namen für die Zahl zu wählen, werfen wir vom Konzept her pauschal alle möglichen Namen zusammen, bilden daraus ein einziges Objekt und benutzten stattdessen dieses Objekt. Hat es funktioniert? Das können Sie später (in Kapitel [ herausfinden. ])
KLEINE ZAHLEN Die uns am besten vertrauten Zahlen sind die ganzen Zahlen von 1 bis 10. Jede dieser Zahlen ist ein Individuum mit ungewöhnlichen Merkmalen, die sie als etwas Besonderes auszeichnen. Wenn man lernt, diese besonderen Merkmale zu schätzen, werden Zahlen bald um ihrer selbst willen zu Vertrauten, zu Freunden und zu interessanten Partnern. Schon bald werden Sie ein Mathematiker sein.
Die unteilbare Einheit Die kleinste positive ganze Zahl ist 1. Sie ist die unteilbare Einheit der Arithmetik: die einzige positive Zahl, die sich nicht durch Addieren zweier kleinerer positiver Zahlen erzeugen lässt. Die Basis des Zahlenkonzepts Mit der Zahl 1 beginnen wir zu zählen. Ganz gleich, von welcher Zahl wir ausgehen, bilden wir die nächste Zahl, indem wir 1 hinzufügen: und so weiter. Die Klammern zeigen, welche Operationen als erste durchgeführt werden sollen. Sie werden im Allgemeinen weggelassen, weil
sich herausgestellt hat, dass die Reihenfolge in diesem Fall keine Rolle spielt, doch man sollte am besten von Anfang an sorgfältig sein. Ausgehend von diesen Definitionen und den Grundgesetzen der Algebra, die bei einer formalen logischen Herleitung eindeutig angegeben werden müssen, können wir sogar den berühmten Satz «2 + 2 = 4» beweisen. Der Beweis passt in eine einzige Zeile: Als einige Mathematiker im 20. Jahrhundert versuchten, die Grundlagen der Mathematik auf eine feste logische Basis zu stellen, griffen sie auf dieselbe Idee zurück, doch aus methodischen Gründen begannen sie mit 0 (siehe Kapitel [0]). Die Zahl 1 drückt eine wichtige mathematische Vorstellung aus: die der Eindeutigkeit. Ein mathematisches Objekt mit einer bestimmten Eigenschaft ist dann eindeutig, wenn nur ein einziges Objekt diese Eigenschaft aufweist. Eindeutigkeit ist wichtig, weil sie uns erlaubt zu beweisen, dass irgendein etwas rätselhaftes mathematisches Objekt tatsächlich eines ist, das wir bereits kennen. Wenn wir zum Beispiel beweisen können, dass eine unbekannte positive Zahl n sowohl gerade als auch eine Primzahl ist, dann muss n gleich 2 sein. Was ein komplizierteres Beispiel angeht: Das Dodekaeder ist der einzige regelmäßige Körper mit fünfeckigen Seitenflächen (siehe Kapitel [5]). Wenn wir daher in irgendeinem mathematischen Zusammenhang auf einen regelmäßigen Körper mit fünfeckigen Seitenflächen stoßen, wissen wir sofort ohne weitere Überprüfung, dass es sich um ein Dodekaeder handeln muss. Alle
anderen Eigenschaften des Dodekaeders erhalten wir dann kostenlos als Zugabe. Das kleine Einmaleins mit der Eins Niemand hat sich jemals darüber beschwert, das kleine Einmaleins mit der Eins lernen zu müssen. «Einmal eins ist eins, einmal zwei ist zwei, einmal drei ist drei …» Wird eine Zahl mit 1 multipliziert oder durch 1 dividiert, so bleibt sie unverändert: Es ist die einzige Zahl, die sich so verhält. Infolgedessen ist 1 gleich ihrem Quadrat, ihrem Kubus und allen höheren Potenzen: und so weiter. Die einzige andere Zahl mit dieser Eigenschaft ist 0. Aus diesem Grund wird die Zahl 1 in der Algebra gewöhnlich weggelassen, wenn sie als Koeffizient in einer Formel auftaucht. So 2 2 schreiben wir zum Beispiel statt 1x + 3x + 4 lediglich x + 3x + 4. Die einzige andere Zahl, die ebenso behandelt wird, ist 0, wo etwas noch 2 Drastischeres passiert: statt 0x + 3x + 4 schreiben wir lediglich 3x + 4 und 2 lassen den Term 0x vollständig weg.
Ist 1 eine Primzahl? Früher wurde sie als Primzahl betrachtet, heute jedoch nicht mehr. Die Zahl an sich hat sich nicht verändert, die Definition von «Primzahl» hingegen schon. Manche Zahlen lassen sich bilden, indem man zwei andere Zahlen miteinander multipliziert: Zum Beispiel ist 6 = 2 × 3 und 25 = 5 × 5. Zahlen dieser Art bezeichnet man als zusammengesetzt. Andere Zahlen lassen sich nicht auf diese Weise erzeugen: Diese werden als Primzahlen oder prim bezeichnet. Dieser Definition zufolge ist 1 prim, und bis vor rund 150 Jahren war das die übliche Konvention. Dann stellte es sich jedoch als praktischer heraus, 1 als Spezialfall zu betrachten. Heutzutage wird 1 weder als prim noch als zusammengesetzt angesehen, sondern als eine Einheit. Ich werde gleich erklären, warum, doch zunächst müssen wir uns mit einigen weiteren Ideen beschäftigen. Die Folge der Primzahlen beginnt und sie erscheint höchst unregelmäßig, abgesehen von ein paar einfachen Mustern. Alle Primzahlen mit Ausnahme von 2 sind ungerade, denn jede gerade Zahl lässt sich durch 2 teilen. Nur 5 kann mit 5 enden, und keine kann mit 0 enden, denn alle derartigen Zahlen sind durch 5 teilbar. Jede ganze Zahl größer 1 lässt sich als Produkt von Primzahlen ausdrücken. Der Prozess wird als Primfaktorzerlegung oder Faktorisierung bezeichnet, und die betreffenden Primzahlen heißen die Primfaktoren der Zahl. Zudem lässt sich diese Primfaktorzerlegung nur auf eine einzige
Weise durchführen, wenn man davon absieht, die Reihenfolge zu verändern, in der die Primzahlen auftreten. Beispielsweise ist und so weiter, doch die einzige Möglichkeit, 60 zu erhalten, besteht darin, die erste Liste der Primzahlen neu anzuordnen. So gibt es zum Beispiel keine Zerlegung in Primzahlen, die wie 60 = 7 × irgendetwas aussieht. Diese Eigenschaft wird als die Eindeutigkeit der Primfaktorzerlegung bezeichnet. Vermutlich erscheint Ihnen das offensichtlich, doch wenn Sie nicht zufällig einen akademischen Abschluss in Mathematik haben, wäre ich erstaunt, wenn Ihnen jemand schon einmal gezeigt hätte, wie man das beweist. Euklid hinterließ einen Beweis in seinen Elementen, und er muss erkannt haben, dass die ganze Sache weder offensichtlich noch einfach ist, denn er nimmt sich Zeit, auf seinen Beweis hinzuführen. Für einige allgemeinere zahlenartige Systeme trifft dies nicht einmal zu. Für gewöhnliche Arithmetik hingegen schon, und es ist eine sehr effektive Waffe im mathematischen Waffenarsenal. Die Primzahlzerlegung der Zahlen von 2 bis 31 sieht folgendermaßen aus: 2 (prim) 3 (prim) 7 (prim) 8=2 12 = 2 × 3 13 (prim) 17 (prim) 22 = 2 × 11 2 3 27 = 3 2 4=2 5 (prim) 6=2×3 9=3 10 = 2 × 5 11 (prim) 14 = 2 × 7 15 = 3 × 5 16 = 2 18 = 2 × 3 19 (prim) 20 = 2 × 5 23 (prim) 24 = 2 × 3 25 × 5 29 (prim) 30 = 2 × 3 × 5 31 (prim) 3 2 2 2 28 = 2 × 7 3 2 2 4 21 = 3 × 7 26 = 2 × 13
Würde man die 1 als Primzahl betrachten, wäre die Primfaktorenzerlegung nicht eindeutig, und das ist der Hauptgrund dafür, 1 als Spezialfall zu behandeln. Beispielsweise ist 6 = 2 × 3 = 1 × 2 × 3 = 1 × 1 × 2 × 3 und so weiter. Eine offensichtlich unangenehme Konsequenz dieser Übereinkunft ist, dass 1 keine Primfaktoren aufweist. Sie ist und bleibt jedoch ein Produkt von Primzahlen, wenn auch in recht seltsamer Weise: 1 ist das Produkt einer «leeren Menge» von Primzahlen. Das heißt, wenn man überhaupt keine Primzahlen multipliziert, erhält man 1. Das hört sich wahrscheinlich ziemlich verrückt an, doch für diese Konvention gibt es durchaus vernünftige Gründe. Ebenso gilt: Wenn man nur eine Primzahl in der Primfaktorzerlegung einer Zahl hat, dann ist es genau die Zahl.
Ungerade und gerade Gerade Zahlen sind durch 2 teilbar, ungerade Zahlen sind es nicht. Daher ist 2 die einzige gerade Primzahl. Sie ist die Summe zweier Quadratzahlen: 2 2 2 = 1 + 1 . Die anderen Primzahlen mit dieser Eigenschaft sind genau die, die beim Teilen durch 4 einen Rest von 1 lassen. Die Zahlen, die gleich der Summe zweier Quadratzahlen sind, lassen sich anhand ihrer Primfaktoren charakterisieren. Binäre Arithmetik, wie sie in Computern benutzt wird, basiert auf Zweier- statt auf Zehnerpotenzen. Quadratische Gleichungen, bei denen es um die zweite Potenz der unbekannten Zahl geht, lassen sich mit Hilfe von Quadratwurzeln lösen. Die Unterscheidung zwischen ungerade und gerade erstreckt sich sogar auf Permutationen – Möglichkeiten, eine Menge von Objekten in einer bestimmten Reihenfolge anzuordnen. Die eine Hälfte der Permutationen ist gerade, die andere Hälfte ungerade. Ich werde Ihnen eine hübsche
Anwendung zeigen, einen einfachen Beweis, dass sich ein berühmtes Rätsel nicht lösen lässt. Parität (gerade/ungerade) Eine der wichtigsten Unterscheidungen in der ganzen Mathematik ist diejenige zwischen geraden und ungeraden Zahlen. Lassen Sie uns mit ganzen Zahlen 0, 1, 2, 3, … beginnen. Die geraden Zahlen darunter sind und die ungeraden sind Generell ist jede ganze Zahl, die ein Vielfaches von 2 ist, gerade, und jede ganze Zahl, die kein Vielfaches von 2 ist, ungerade. Im Gegensatz zu dem, was einige Lehrer anzunehmen scheinen, ist 0 gerade, weil sie ein Vielfaches von 2 ist, nämlich 0 × 2.
Abbildung 8: Gerade und ungerade Zahlen. Bei ungeraden Zahlen bleibt ein Rest von 1, wenn man sie durch 2 teilt. (Der Rest ist ungleich null und kleiner als 2, sodass nur 1 als Möglichkeit bleibt.) Daher haben gerade Zahlen algebraisch die Form 2n, wobei n eine ganze Zahl ist, und ungerade Zahlen haben die Form 2n + 1. (Wiederum zeigt sich, wenn man n = 0 setzt, dass 0 gerade ist.) Um die Konzepte «gerade» und «ungerade» auf negative Zahlen zu erweitern, erlauben wir, dass n negativ ist. Nun sind –2, –4, –6 und so weiter gerade, während –1, – 3, –5 und so weiter ungerade sind. Auf dem Zahlenstrahl wechseln sich gerade und ungerade Zahlen ab. Abbildung 9: Gerade und ungerade Zahlen wechseln sich auf dem Zahlenstrahl ab. Eine angenehme Eigenschaft von geraden und ungeraden Zahlen ist, dass sie einfachen arithmetischen Regeln gehorchen, gerade + gerade = gerade gerade × gerade = gerade ungerade + ungerade = gerade ungerade × ungerade = ungerade gerade + ungerade = ungerade gerade × ungerade = gerade ungerade + gerade = ungerade ungerade × gerade = gerade
ganz gleich, um welche Zahlen es sich handelt. Wenn daher jemand behauptet, 13 × 17 = 222, dann wissen wir ganz ohne Nachrechnen, dass er sich irrt. Ungerade × ungerade = ungerade, aber 222 ist gerade. Kleinste und einzige gerade Primzahl Die Liste der Primzahlen beginnt mit 2, daher ist 2 die kleinste Primzahl. Es ist zudem die einzige gerade Primzahl, denn definitionsgemäß sind alle geraden Zahlen durch 2 teilbar. Wenn die Zahl, um die es geht, 4 oder größer ist, so lässt sie sich als Produkt zweier kleinerer Zahlen ausdrücken, daher handelt es sich um eine zusammengesetzte Zahl. Diese Eigenschaften, so einfach und offensichtlich sie auch erscheinen mögen, verleihen 2 eine einzigartige Stellung im Zahlengefüge. Zwei Sätze über Quadratzahlen Am Weihnachtstag 1640 schrieb der brillante Amateurmathematiker Pierre de Fermat an den Mönch Marin Mersenne und stellte eine interessante Frage. Welche Zahlen lassen sich als Summe zweier Quadratzahlen schreiben? Das Quadrat einer Zahl ist das, was man erhält, wenn man die Zahl mit sich selbst malnimmt. Daher ist das Quadrat von 1 beispielsweise 1 × 1 = 1, das Quadrat von 2 ist 2 × 2 = 4, das Quadrat von 3 ist 3 × 3 = 9 und so 2 2 2
2 2 2 weiter. Das Symbol für das Quadrat der Zahl n ist n . So ist 0 = 0, 1 = 1, 2 2 2 = 4, 3 = 9 und so weiter. Die Quadrate der Zahlen 1 bis 10 sind: Daher ist vier das erste perfekte Quadrat nach den weniger interessanten Ergebnissen 0 und 1. Der Begriff «Quadrat» bzw. «Quadratzahl» wird deshalb benutzt, weil diese Zahlen auftreten, wenn man Punkte zu Quadraten anordnet: Abbildung 10: Quadrate. Wenn wir Quadratzahlen paarweise addieren, können wir als Ergebnis offensichtlich die Quadratzahlen selbst erhalten: Man muss nur 0 zu einer Quadratzahl addieren. Wir erhalten jedoch auch neue Zahlen wie die keine Quadratzahlen sind. Dennoch tauchen viele Zahlen nicht auf, zum Beispiel 3, 6, 7, 11.
Hier ist eine Tabelle, die alle Zahlen zwischen 0 und 100 zeigt, die die Summe zweier Quadratzahlen sind. (Um die Zahl in einer bestimmten, nicht fett gedruckten Zelle zu erhalten, addiert man die fett gedruckte, oberste Zahl der entsprechenden Spalte zu der fett gedruckten Zahl am linken Rand der entsprechenden Zeile. Beispielsweise ist 25 + 4 = 29. Summen größer 100 sind weggelassen.) 0 1 4 9 16 25 36 49 64 81 100 0 0 1 4 9 16 25 36 49 64 81 100 1 1 2 5 10 17 26 37 50 65 82 4 4 5 8 13 20 29 40 53 68 85 9 9 10 13 18 25 34 45 58 73 90 16 16 17 20 25 32 41 52 65 80 97 25 25 26 29 34 41 50 61 74 89 36 36 37 40 45 52 61 72 83 49 49 50 53 58 65 74 98 64 64 65 68 73 80 89 81 81 82 85 90 97 100 100 Tabelle 2 Auf den ersten Blick fällt es schwer, irgendein Muster zu finden, aber es gibt eines, und Fermat entdeckte es. Der Trick besteht darin, die Primfaktoren der Zahlen in der Tabelle niederzuschreiben. Wenn wir 0 und 1, die Ausnahmen sind, auslassen, erhalten wir:
In dieser Tabelle habe ich die Primzahlen unterstrichen, denn sie bilden den Schlüssel zum Problem. Einige Primzahlen fehlen, nämlich: 3, 7, 11, 19, 23, 31, 43, 47, 59, 67, 71, 79 und 83. Können Sie es Fermat gleichtun und ihr gemeinsames Merkmal herausfinden? Jede dieser Primzahlen ist um 1 kleiner als ein Vielfaches von 4. Beispielsweise ist 23 = 24 – 1 und 24 = 4 × 6. Die Primzahl 2 tritt in meiner Tabelle auf, und das ist wiederum in gewisser Weise außerordentlich. Sämtliche ungeraden Primzahlen in meiner Tabelle sind um 1 größer als ein Vielfaches von 4. Beispielsweise ist 29 = 28 + 1, und 28 = 4 × 7. Zudem tauchen die ersten Primzahlen dieser Form alle in meiner Liste auf, und wenn man diese erweitert, scheint keine zu fehlen. Jede ungerade Zahl ist entweder um 1 kleiner als ein Vielfaches von 4 oder um 1 größer als ein Vielfaches von 4; das heißt, sie hat die Form 4k – 1 oder 4k + 1 für ein ganzzahliges k. Die einzige gerade Primzahl ist 2. Daher muss jede Primzahl in eine der folgenden drei Kategorien fallen:
Sie ist gleich 2 Sie hat die Form 4k – 1 Sie hat die Form 4k + 1 Die fehlenden Primzahlen in meiner Liste der Summen zweier Quadratzahlen fallen alle in die Kategorie 4k – 1. Diese Primzahlen können als Faktoren von Zahlen in der Liste auftreten. Schauen Sie sich beispielsweise 3 an, die als Faktor von 9, 18, 36, 45, 72, 81 und 90 auftaucht. Tatsächlich sind all diese Zahlen jedoch Vielfache von 2 9, das heißt, von 3 . Wenn man längere Listen unter demselben Aspekt betrachtet, kristallisiert sich ein einfaches Muster heraus. In seinem Brief behauptetet Fermat, bewiesen zu haben, die Zahlen ungleich null, die die Summe zweier Quadratzahlen sind, seien genau diejenigen, für die jeder Primfaktor der Form 4k – 1 in einer geraden Potenz auftritt. Der schwierigste Teil war zu beweisen, dass jede Primzahl der Form 4k + 1 die Summe zweier Quadratzahlen ist. Albert Girard hat dies bereits 1632 vermutet, aber er gab keinen Beweis dafür an. Die Tabelle enthält einige Beispiele, aber wir wollen Fermats Behauptung anhand eines Beispiels überprüfen, das ein wenig anspruchsvoller ist. Die Zahl 4001 hat eindeutig die Form 4k + 1; k ist in diesem Fall gleich 1000. Zudem ist sie prim. Nach Fermats Theorem muss sie die Summe zweier Quadratzahlen sein. Welcher? In Ermangelung einer cleveren Methode können wir versuchen, 2 2 2 nacheinander 1 , 2 , 3 und so weiter zu subtrahieren und zu schauen, ob wir eine Quadratzahl erhalten. Die Rechnung beginnt wie folgt:
und führt schließlich zum Erfolg: Daher ist und Fermats Satz hat sich bei diesem Beispiel bewahrheitet. 2 2 Das ist tatsächlich die einzige Lösung, abgesehen von 49 + 40 . Eine Quadratzahl zu erhalten, indem man eine Quadratzahl von 4001 abzieht, ist ein seltenes Ereignis; fast sieht es wie reiner Zufall aus. Fermat hat erklärt, warum das nicht so ist. Er wusste auch, dass es dann, wenn 4k + 1 prim ist, nur eine Möglichkeit gibt, diese Zahl in zwei Quadratzahlen zu zerlegen. Es gibt keinen einfachen, praktischen Weg, generell die richtigen Zahlen zu finden. Gauß lieferte eine Formel, aber die ist auch nicht besonders praktisch. Darum muss der Beweis zeigen, dass die geforderten Quadratzahlen tatsächlich existieren, ohne eine bequeme Möglichkeit zu liefern, sie zu finden. Die ganze Sache ist mathematisch ein wenig kompliziert und verlangt einiges an Vorbereitung, daher werde ich an dieser Stelle nicht versuchen, den Beweis zu erklären. Einer der charmanten Züge der Mathematik ist, dass einfache, wahre Aussagen nicht immer einfach zu beweisen sind.
Das binäre System Unser traditionelles Zahlensystem wird als «Dezimalsystem» bezeichnet, weil es auf der Zahl 10 basiert und 10 auf Latein decem heißt. Daher gibt es zehn Ziffern von 0 bis 9, und der Wert einer Ziffer steigt bei jedem Schritt von rechts nach links um einen Faktor 10. Daher bedeutet 10 zehn, 100 hundert, 1000 tausend und so weiter (siehe Kapitel [10]). Ähnliche Notationssysteme lassen sich auf jeder beliebigen anderen Zahlenbasis aufbauen. Das wichtigste dieser alternativen Notationssysteme benutzt 2 als Basis und wird dementsprechend als binäres System oder kurz Binärsystem (auch Dualsystem) bezeichnet. In diesem Fall gibt es nur zwei Ziffern, 0 und 1, und der Wert einer Ziffer verdoppelt sich bei jedem Schritt von rechts nach links. Im Binärsystem steht 10 für 2 (in unserer üblichen Dezimalschreibweise), 100 bedeutet 4, 1000 bedeutet 8, 10000 bedeutet 16 und so weiter. Um Zahlen zu erhalten, die keine Potenz von 2 sind, addieren wir bestimmte Potenzen von 2. Beispielsweise entspricht 23 in Dezimalschreibweise dabei wird eine 16, keine 8, eine 4, eine 2 und eine 1 benutzt. Daher wird 23 in Binärschreibweise zu Die ersten Binärzahlen und ihre dezimalen Äquivalente sind:
dezimal binär dezimal binär 0 0 11 1011 1 1 12 1100 2 10 13 1101 3 11 14 1110 4 100 15 1111 5 101 16 10000 6 110 17 10001 7 111 18 10010 8 1000 19 10011 9 1001 20 10100 10 1010 21 10101 Tabelle 3 Um beispielsweise die Symbole für die Zahl 20 zu decodieren, schreiben wir sie als Potenzen von 2 auf: Die Potenzen von 2, für die das Symbol 1 auftaucht, sind 16 und 4: Addiert ergeben sie 20. Geschichte Irgendwann zwischen 500 und 100 v. Chr. schrieb der indische Gelehrte Pingala ein Buch namens Chandahśāstra über Reime in der Lyrik, und er ̣
listete verschiedene Kombinationen langer und kurzer Silben auf. Diese Kombinationen klassifizierte er anhand einer Tabelle, die in moderner Form 0 für eine kurze Silbe und 1 für eine lange verwendet, zum Beispiel so: Diese Muster entsprechen denjenigen der binären Notation, doch Pingala führte mit seinen Symbolen keine Berechnungen durch. Das alte chinesische Buch der Wandlungen, I Ging (Yi Jing), benutzt 64 Gruppen von je sechs durchgehenden (yang) oder unterbrochenen (yin) Linien zur Vorhersage der Zukunft. Diese Gruppen werden als Hexagramme bezeichnet. Jedes Hexagramm besteht aus zwei übereinander angeordneten Trigrammen. Ursprünglich diente das Hexagramm dazu, die Zukunft vorherzusagen, indem man die Stängel von Schafgarben auf den Boden warf («Schafgarbenorakel») und bestimmte Regeln anwandte, um zu entscheiden, welches Diagramm man zu Rate ziehen sollte. Später benutzte man stattdessen drei Münzen. Wenn wir 1 verwenden, um eine durchgehende Linie (yang) zu repräsentieren, und 0, um eine unterbrochene Linie (yin) zu symbolisieren, entspricht jedes Hexagramm einer sechsstelligen Binärzahl. So stellt das Hexagramm in Abbildung 11 beispielsweise die Binärzahl 010011 dar. Nach den Regeln der Weissagungsmethode bezeichnet dies das Hexagramm 60, und es steht für «Artikulation», «Beschränkung» oder «Mäßigung».
Eine typische Deutung beginnt so (fragen Sie mich nicht, was das soll, ich habe keine Ahnung): Beschränkung – oben: k’an das Abgründige, Wasser. Unten: tui das Fröhliche, See. Urteil – Beschränkung, Erfolg. Auf ärgerlicher Beschränkung muss nicht beharrt werden. Abbildung 11: Links: Ein Hexagramm. Rechts: Acht Trigramme. Abbild – Wasser über See: Abbild der Beschränkung. Daher schafft der überlegene Mensch Zahl und Maß und prüft die Natur von Tugend und richtigem Verhalten. Und wiederum sind zwar die Muster des Binärsystems im I Ging vorhanden, doch die Arithmetik fehlt. Stärker ausgeprägt zeigt sich die mathematische Struktur binärer Symbole in den Schriften von Thomas Harriot (1560–1621), der viele tausend Seiten unveröffentlichter Manuskripte hinterließ. Eins davon enthält eine Liste, die so beginnt:
und weitergeht bis Es ist klar, dass Harriot das Grundprinzip der binären Notation verstanden hatte. Der Kontext dieser Liste ist jedoch eine lange Reihe von Tabellen, die aufzählen, wie man verschiedene Objekte auf unterschiedliche Weise kombinieren kann; es geht nicht um Arithmetik. Im Jahr 1605 erklärte Francis Bacon, wie man die Buchstaben des Alphabets als Folge binärer Ziffern verschlüsseln kann, und kam ihrem Gebrauch als Zahlen sehr nahe. Als arithmetische Darstellungsart traten binäre Zahlen erstmals 1697 in Erscheinung, als Leibniz in einem Brief an den Herzog Rudolf von Braunschweig-Wolfenbüttel eine «Gedenkmünze oder -medaille» vorschlug.
Abbildung 12: Leibniz’ binäre Münze. Darauf sind die Zahlen 1 bis 15 in Binärschreibweise dargestellt, zusammen mit der Inschrift Omnibus ex nihilo ducendis sufficit unum (Um alles aus dem Nichts zu entwickeln genügt eins). Mathematisch verwies Leibniz darauf, dass man jede andere Zahl (alles) erhalten kann, wenn man über das Symbol für nichts (0) verfügt und eins (1) dazugibt. Aber er machte damit auch eine religiöse Aussage: Ein einziger Gott kann alles aus dem Nichts erschaffen.
Die Münze wurde niemals realisiert, aber ihr Entwurf allein war ein bedeutender Schritt. Ab 1703 beschäftigte sich Leibniz mit Binärmathematik und veröffentlichte im selben Jahr einen Artikel «Explication de l’Arithmétique Binaire» (Erklärung der binären Arithmetik) in der Histoire de l’Académie Royale des Sciences. Dort schrieb er: «Statt in Zehnerschritten [Dezimalsystem] fortzuschreiten, benutze ich seit vielen Jahren das simpelste System von allen, das auf Zweien basiert.» Er verweist darauf, dass die Rechenregeln im Binärsystem so einfach sind, dass niemand sie vergessen kann, doch er betont gleichzeitig, dass die Methode unpraktisch ist, weil die binäre Form einer Zahl etwa vier Mal so lang ist wie die dezimale. Vorausschauend meint er aber: «Das Rechnen mit Zweien ist wissenschaftlich grundlegender und ermöglicht neue Entdeckungen» und «Diese Darstellungsweise von Zahlen erleichtert Rechenoperationen aller Art beträchtlich.» Hier ist, was er sich dabei gedacht hat. Um mit binären Zahlen zu rechnen, muss man lediglich Folgendes wissen: Wenn man diese einfachen Regeln einmal kennt, kann man zwei beliebige Binärzahlen addieren und multiplizieren, indem man dieselben Verfahren wie bei der normalen Arithmetik anwendet. Subtraktionen und Divisionen sind ebenfalls möglich.
Digitales Rechnen Wir wissen inzwischen, dass Leibniz auf der richtigen Spur war, als er voraussagte, binäre Zahlen sollten einmal «für die Wissenschaft grundlegend» werden. Das Binärsystem war ursprünglich eine mathematische Kuriosität, doch die Erfindung des digitalen Computers hat dies radikal geändert. Die Digitaltechnik basiert auf der simplen Unterscheidung des Vorhandenseins oder Fehlens eines elektrischen Signals. Wenn wir diese beiden Zustände durch 1 und 0 symbolisieren, wird der Grund für ein Arbeiten im Binärsystem evident. Im Prinzip könnten wir beim Computerbau das Dezimalsystem benutzen, beispielsweise dadurch, dass wir die Ziffern 1 bis 9 mit Signalen von 0 Volt, 1 Volt, 2 Volt und so weiter verknüpfen. Bei komplizierten Berechnungen würden jedoch Ungenauigkeiten auftreten, und es wäre nicht klar, ob beispielsweise ein Signal von 6,5 Volt als 6 Volt (mit überhöhter Spannung) oder als 7 Volt (mit zu niedriger Spannung) gelesen werden sollte. Indem man nur zwei weit getrennte Spannungsniveaus verwendet, lassen sich Mehrdeutigkeiten dieser Art vermeiden, wenn man sicherstellt, dass der Fehler stets viel kleiner ist als die Differenz zwischen den beiden Zuständen. Mit den heutigen Herstellungstechniken wäre es möglich, zuverlässige Computer zu bauen, die statt auf der Basis 2 auf der Basis 3 (ternär) oder einer noch höheren Basis fußen. Doch inzwischen basiert ein Großteil unserer Computertechnik auf dem Binärsystem, und es ist einfach, im Rahmen der Berechnung vom Binär- zum Dezimalsystem überzuwechseln, daher bieten andere Basen im Vergleich zum Standard-Binärsystem nicht genügend Vorteile.
Signum einer Permutation Der Unterschied zwischen geraden und ungeraden Zahlen spielt für die Theorie der Permutationen eine besonders wichtige Rolle; unter Permutation versteht man die Umordnung der Anordnung von Zahlen oder Buchstaben oder anderen mathematischen Objekten in einer bestimmten Reihenfolge. Wenn die Liste n Objekte enthält, dann ist die Gesamtzahl aller möglichen Permutationen gleich der Fakultät: weil wir für die Wahl der ersten Zahl n Möglichkeiten haben, für die Wahl der zweiten n – 1, der dritten n – 2 und so weiter (siehe Kapitel [26!]). Permutationen treten in zwei Formen auf: gerade und ungerade. Gerade Permutationen vertauschen die Reihenfolge einer ungeraden Anzahl von Objektpaaren. Darauf werde ich gleich noch ausführlicher zurückkommen. «Gerade» und «ungerade» werden in diesem Zusammenhang als Signum der Parität der Permutation bezeichnet. Von den n! möglichen Permutationen ist genau die Hälfte gerade und die andere Hälfte ungerade. (Es sei denn, n = 1: In diesem Fall gibt es nur eine gerade und keine ungerade Permutation.) Für n ≥ 2 gibt es gerade und ungerade Permutationen. Der Unterschied zwischen geraden und ungeraden Permutationen lässt sich anhand von Diagrammen verstehen. Denken Sie beispielsweise an die Permutation (nennen wir sie A), die aus der Liste
die neue Reihenfolge macht. Die Zahlen in der Liste verschieben sich auf folgende Weise: Abbildung 13: Diagramm für Permutation A. Genauso gilt: Wenn wir mit einer Liste beginnen und sie in der Reihenfolge neu anordnen, dann verschieben sich die Symbole folgendermaßen:
Abbildung 14: Diagramm für Permutation B. Diese Permutation wollen wir B nennen. Beachten Sie, dass die Liste, mit der wir beginnen, nicht die normale numerische Reihenfolge aufweisen muss. Was zählt, ist nicht die Reihenfolge als solche, sondern wie sie verändert wird. Permutationen kombinieren Wir können zwei Permutationen kombinieren, um eine weitere zu schaffen. Dazu arrangieren wir die Liste entsprechend der ersten Permutation um und ordnen anschließend das Ergebnis entsprechend der zweiten neu. Der Prozess lässt sich am besten verstehen, wenn man die beiden Diagramme zusammenfügt:
Abbildung 15: Diagramm für Permutation A, gefolgt von B. Die beiden Permutationen A und B werden durch die obere und die untere Reihe von Pfeilen angezeigt. Um beide zu kombinieren (und eine Permutation zu erhalten, die ich AB nennen möchte), folgen wir nacheinander korrespondierenden Pfeilpaaren und entfernen die mittlere Zahlenreihe. Das Ergebnis sieht so aus:
Abbildung 16: Diagramm für Permutation AB, vor dem Durchziehen der Pfeile. Und schließlich ziehen wir die Pfeile durch und erhalten:
Abbildung 17: Diagramm für Permutation AB, nach dem Geraderichten der Pfeile. Das ist die Permutation, die die Liste in die Reihenfolge bringt. Kreuzungszahlen und Parität
Bei der Permutation A kreuzt der lange Pfeil die vier anderen Pfeile. Wir sagen, diese Permutation hat die Kreuzungszahl (crossing number) 4 und schreiben c(A) = 4. Permutation B hat die Kreuzungszahl 3, daher ist c(B) = 3. Ihre Kombination AB hat die Kreuzungszahl 5, dementsprechend ist c(AB) = 5. Bevor wir die Pfeile gerade gerichtet haben, hatte AB die Kreuzungszahl 7. Das ist die Summe der Kreuzungszahlen von A und B: 4 + 3 = 7. Wenn wir die Pfeile gerade richten, verschwinden zwei Kreuzungen – die beiden auf der rechten Seite. Diese beiden Pfeile kreuzen sich zunächst, kreuzen dann aber wieder zurück. Daher «löscht» das zweite Überkreuzen das erste aus. Diese Beobachtung gilt ganz allgemein. Wenn wir zwei beliebige Permutationen A und B zu AB kombinieren, dann ist die Anzahl der Überkreuzungen für AB vor dem Geraderichten der Pfeile gleich der Anzahl für A plus der Anzahl für B. Wenn wir die Pfeile gerade richten, bleibt die Anzahl der Pfeile entweder dieselbe oder wir subtrahieren eine gerade Zahl. Obwohl c(AB) nicht gleich c(A) + c(B) sein muss, ist ihre Differenz stets gerade. Und das heißt, dass die Parität von c(AB) gleich der Summe der Paritäten c(A) und c(B) ist. Wir sagen, dass eine Permutation A dann gerade ist, wenn c(A) gerade ist, und ungerade, wenn c(A) ungerade ist. Entsprechend ist die Parität der Permutation A «gerade» oder «ungerade». Eine gerade Permutation vertauscht die Reihenfolge einer geraden Anzahl von Symbolpaaren. Eine ungerade Permutation vertauscht die Reihenfolge einer ungeraden Anzahl von Symbolpaaren.
Bei der Kombination von Permutationen ergibt sich daher folgendes Bild: Gerade kombiniert mit gerade ergibt gerade. Ungerade kombiniert mit ungerade ergibt gerade. Gerade kombiniert mit ungerade ergibt ungerade. Ungerade kombiniert mit gerade ergibt ungerade. Das ist genauso wie beim Addieren gerader und ungerader Zahlen. Diese angenehmen Eigenschaften werden überall in der Mathematik verwendet. Das Fünfzehnerspiel Paritäten von Permutationen mögen sehr fachspezifisch erscheinen, doch sie haben viele Anwendungen. Eine der amüsantesten findet sich bei einem Puzzle, das von dem amerikanischen Postbeamten Noyes Chapman erfunden wurde. Es wurde zu einer Welle, die über die USA, Kanada und Europa schwappte. Der Geschäftsmann Matthias Rice produzierte es unter dem Namen Gem Puzzle, und ein Zahnarzt namens Charles Pevey setzte einen Preis für die Lösung aus. Das Fünfzehnerspiel ist auch unter der Bezeichnung 15-Puzzle, 14-15-Puzzle, Schiebepuzzle, Schiebefax oder Ohne-Fleiß-kein-Preis-Spiel bekannt. Das Puzzle besteht aus 15 verschiebbaren Spielsteinen in einem 4×4Quadrat, die von 1 bis 15 durchnummeriert und ursprünglich so angeordnet sind, dass 14 und 15 nicht vertauscht sind. Ein leeres Feld unten links im
Quadrat (Abbildung links) bleibt frei. Ziel des Geduldsspiels ist es, sukzessiv Spielsteine in das leere Feld zu schieben – das sich bewegt, wenn die Spielsteine verschoben werden –, um die Spielsteine in die richtige Reihenfolge zu bringen (Abbildung rechts). Abbildung 18a: Beginnen Sie so …
Abbildung 18b: … und enden Sie so. Dieses Puzzle wird oft dem berühmten amerikanischen Puzzleexperten Sam Loyd zugeschrieben, der das Interesse daran 1886 neu entfachte, als er einen Preis von 1000 Dollar für die Lösung auslobte. Loyd war sich jedoch sicher, dass er nicht würde zahlen müssen, denn 1879 hatten William Johnson und William Story bewiesen, dass das Fünfzehner-Puzzle keine Lösung hat. Der Schlüsselpunkt ist, dass man sich jede Position in dem Puzzle als eine Permutation der ursprünglichen Position vorstellen kann und das leere Feld als einen 16. «virtuellen Spielstein». Die ursprüngliche Position, bei der nur ein einziges Kachelpaar vertauscht ist (14 und 15), ist eine ungerade Permutation der geforderten Endposition. Das Erfordernis, dass das leere
Feld wieder dort endet, wo es gestartet ist, besagt jedoch implizit, dass zulässige Züge nur zu geraden Permutationen führen. Daher können zulässige Züge, ganz unabhängig vom Ausgangszustand, nur genau die Hälfte der 16! möglichen Neuanordnungen realisieren, was auf 10461394944000 Anordnungen hinausläuft. Durch Versuch und Irrtum kann man unmöglich mehr als einen Bruchteil dieser möglichen Anordnungen durchprobieren, was die Spieler leicht zu der Überzeugung verleiten kann, dass sie, wenn sie es nur lange genug weiter versuchen, irgendwann auf die Lösung stoßen werden. Quadratische Gleichungen Mathematiker unterscheiden algebraische Gleichungen nach ihrem Grad, worunter sie die höchste Potenz der auftretenden Unbekannten verstehen. Die Gleichung ist eine Gleichung ersten Grades, denn es tritt nur die erste Potenz von x auf. Die Gleichung ist eine Gleichung zweiten Grades, weil die zweite Potenz (das Quadrat) von x auftritt, aber keine höhere Potenz. Die Gleichung
ist eine Gleichung dritten Grades, und so weiter. Für die Gleichungen mit kleinen Potenzen gibt es spezielle Namen: Wenn man eine Gleichung vorgelegt bekommt, besteht die Hauptaufgabe darin, sie zu lösen. Das heißt, es geht darum, den Wert (oder die Werte) der unbekannten Größe x zu finden, der die Gleichung löst. Die lineare Gleichung 5x – 10 = 0 hat die Lösung x = 2, denn 5 × 2 – 10 = 0. Die 2 2 quadratische Gleichung x – 3x + 2 = 0 hat die Lösung x = 1, denn 1 – 3 + 2 2 = 0, aber sie hat auch noch eine zweite Lösung x = 2, denn 2 – 6 + 2 = 0 3 2 ist ebenfalls richtig. Die kubische Gleichung x – 6x + 11x – 6 = 0 hat sogar drei Lösungen, x = 1, 2 und 3. Die Zahl der (reellen) Lösungen ist stets kleiner oder gleich dem Grad der Gleichung. Lineare Gleichungen sind leicht zu lösen, und allgemeine Methoden dafür gibt es seit Jahrtausenden; sie reichen in eine Zeit vor Erfindung der symbolischen Algebra zurück. Wie weit wissen wir nicht genau, denn es gibt keine geeigneten Aufzeichnungen. Quadratische Gleichungen, also solche vom Grad 2, stellen schon eine härtere Nuss dar. Doch bereits die alten Babylonier vor 4000 Jahren wussten, wie man sie lösen kann, und darüber wollen wir als Nächstes
sprechen. Kubische, quartische, quintische und sextische Gleichungen werde ich in den Kapiteln über die Zahlen 3, 4 und 5 diskutieren. Die babylonische Lösung Abbildung 19: Zwei mathematische babylonische Tontafeln. Im Jahr 1930 erkannte der Historiker Otto Neugebauer, dass Tontafeln aus dem antiken Babylon erklärten, wie man quadratische Gleichungen löst. Zunächst müssen wir uns ein wenig mit der babylonischen Schreibweise für Zahlen beschäftigen. Die Babylonier benutzten nicht 10 als Basis, sondern 60. Daher bedeutete 2015 in babylonischer Notation (sie benutzten in Ton gedrückte keilförmige Markierungen anstelle unserer Ziffern):
was in Dezimalschreibweise ergibt. Sie verfügten auch über eine Version unseres Dezimalkommas, durch das Vielfache von , und so weiter addiert wurden. Historiker schreiben babylonische Zahlensymbole so um: und benutzen einen Strichpunkt (;) anstelle des Kommas. Beispielsweise ist Abbildung 20: Babylonische Keilschriftsymbole für die Zahlen 1 bis 59.
Nun zu den quadratischen Gleichungen. Auf einer babylonischen Tontafel, die rund 4000 Jahre zurückdatiert, wird verlangt: «Finde die Seiten eines Quadrats, wenn die Fläche minus der Seite 14,30 ist.» Bei diesem Problem geht es um das Quadrat der Unbekannten (die Fläche des Quadrats) wie auch um die Unbekannte selbst, daher läuft das Ganze auf eine quadratische Gleichung hinaus. Die Tontafel erklärt den Lösungsweg: Babylonische unsere Schreibweise Anweisungen Nimm die Hälfte von 1, also 0;30 Multipliziere mit 0;30 mal 0;30, also mit 0;15 Addiere dies zu 14,30, um 14,30;15 zu erhalten Das ist das Quadrat von 29;30 Nun addiere 0;30 zu 29;30 Das Ergebnis ist 30, die 30 Seite des Quadrats. Tabelle 4 Der komplizierteste Schritt ist der vierte, der eine Zahl findet ( deren Quadrat ist. Die Zahl ), ist die Quadratwurzel von
. Quadratwurzeln sind das wichtigste Werkzeug zur Lösung von quadratischen Gleichungen. Diese Art der Darstellung ist typisch für die babylonische Mathematik. Bei der Beschreibung geht es um spezielle Zahlen, doch die Methode ist allgemeiner zu verstehen. Wenn man die Zahlen systematisch verändert und demselben Verfahren folgt, kann man auch andere quadratische Gleichungen lösen. Wenn man die moderne algebraische Schreibweise benutzt, die Zahlen durch Symbole ersetzt und mit einer allgemeinen quadratischen Gleichung beginnt, dann führt die babylonische Methode zu der Antwort Diese Formel erkennen Sie vielleicht: Es ist genau dieselbe, die wir in der Schule lernen.
Kubische Gleichungen Die kleinste ungerade Primzahl ist 3. Die kubische Gleichung, bei der es um die dritte Potenz (Kubus) der Unbekannten geht, lässt sich mit Hilfe von Kubikwurzeln und Quadratwurzeln lösen. Der Raum hat 3 Dimensionen. Einen Winkel allein mit Zirkel und Lineal in drei gleiche Teile zu teilen, ist unmöglich. Genau 3 regelmäßige Vielecke kacheln die Ebene. Sieben Achtel aller Zahlen sind die Summe dreier Quadratzahlen. Die kleinste ungerade Primzahl Die kleinste Primzahl ist 2, und sie ist gerade. Die nächste Primzahl ist 3, und sie ist die kleinste ungerade Primzahl. Jede andere Primzahl hat entweder die Form 3k + 1 oder 3k + 2 für ein ganzzahliges k, denn 3k ist durch 3 teilbar. Aber über 3 lässt sich noch eine ganze Menge anderer
interessanter Dinge erzählen, und ich werde die Primzahlen ausführlich (in Kapitel [7]) behandeln. Kubische Gleichungen Einer der großen Triumphe der Mathematik im Italien der Renaissance war die Entdeckung, dass sich eine kubische Gleichung mit Hilfe einer algebraischen Formel lösen lässt, in der Kubik- und Quadratwurzeln eine entscheidende Rolle spielen. Die Renaissance war eine Zeit des intellektuellen Umbruchs und der Erneuerung. Die Mathematiker jener Tage bildeten da keine Ausnahme, und sie waren entschlossen, die Grenzen und Beschränkungen der klassischen Mathematik zu überwinden. Der erste große Durchbruch war ein Verfahren zur Lösung kubischer Gleichungen. Verschiedene Mathematiker fanden verschiedene Versionen dieses Verfahrens, hielten ihr Wissen aber geheim. Schließlich veröffentlichte Girolamo Cardano, auch als Hieronymus Cardanus bekannt, diese Methoden in einem der bedeutendsten Algebrabücher der Welt, der Ars Magna («Die große Kunst»). Anschließend beschuldigte ihn einer seiner Kollegen, sein Geheimnis gestohlen zu haben. Das war nicht ganz unwahrscheinlich. Um 1520 war Cardano nämlich bankrott. Um seine finanzielle Situation zu bessern, wandte er sich dem Glücksspiel zu und nutzte seine mathematischen Fähigkeiten, um seine Gewinnchancen zu verbessern. Cardano war ein Genie, aber auch ein Halunke. Wie wir sehen werden, hatte er jedoch in diesem Fall eine plausible Entschuldigung.
Hier seine Geschichte: Im Jahr 1535 lieferten sich Antonio Fior und Niccolò Fontana (genannt Tartaglia, der «Stotterer») einen öffentlichen Schlagabtausch. Sie stellten einander kubische Gleichungen, die es zu lösen galt, und Tartaglia schlug Fior überzeugend. Damals wurden kubische Gleichungen in drei eigenständige Typen unterteilt, denn man gebrauchte noch keine negativen Zahlen. Fior wusste nur, wie man einen dieser Gleichungstypen löste, und anfangs wusste Tartaglia lediglich, wie man einen der beiden anderen Typen löste, doch kurz vor dem Wettstreit fand er heraus, wie sich sämtliche Typen lösen ließen. Daher schickte er Fior nur die Typen, von denen er wusste, dass sein Gegner daran scheitern würde, und besiegte ihn somit auf der ganzen Linie. Cardano, der an seinem Algebrabuch arbeitete, hörte von dem Wettstreit und erkannte, dass Fior und Tartaglia wussten, wie man kubische Gleichungen löst. Diese unvergleichliche Entdeckung würde den Wert seines Buches stark erhöhen, darum bat er Tartaglia, ihm seine Methode zu verraten. Schließlich ließ sich Tartaglia erweichen und eröffnete ihm sein Geheimnis, wobei er später behauptete, dies sei unter dem Siegel der Verschwiegenheit geschehen. Aber die Methode erschien in Cardanos Ars Magna, und so beschuldigte Tartaglia den Autor des Plagiats. Cardano hatte jedoch eine Entschuldigung und zudem guten Grund, sein Versprechen, so er es denn gegeben haben sollte, zu umgehen. Sein Schüler Lodovico Ferrari hatte herausgefunden, wie man Gleichungen 4. Grades löst (siehe Kapitel [4]), und Cardano wollte diese Gleichungen ebenfalls in sein Buch aufnehmen. Ferraris Methode erforderte jedoch die Lösung einer damit verknüpften kubischen Gleichung, daher konnte Cardano Ferraris
Entdeckung nicht publizieren, ohne gleichzeitig Tartaglias zu veröffentlichen. Es muss wirklich frustrierend gewesen sein. Dann erfuhr er, dass Fior ein Schüler von Scipio del Ferro gewesen war, von dem es hieß, er habe alle drei Typen kubischer Gleichungen gelöst und lediglich die Lösung für einen Typ an Fior weitergegeben. Del Ferros unveröffentlichte Notizen befanden sich im Besitz von Annibale del Nave. Daher reisten Cardano und Ferrari 1543 nach Bologna, um del Nave aufzusuchen, und in den Unterlagen stießen sie tatsächlich auf die Lösungen aller drei Typen kubischer Gleichungen. So konnte sich Cardano zu Recht darauf berufen, er habe del Ferros Methode publiziert und nicht diejenige von Tartaglia. Dennoch fühlte sich Tartaglia betrogen und veröffentlichte eine lange, bittere Schmährede gegen Cardano. Daraufhin forderte ihn Ferrari zu einer öffentlichen Debatte heraus, die er haushoch gewann. Tartaglia sollte es nicht mehr gelingen, seinen Ruf wiederherzustellen. Mit modernen Symbolen können wir Cardanos Lösung der kubischen 3 Gleichung für einen Spezialfall niederschreiben, nämlich wenn x + ax + b 2 = 0 ist und a und b bestimmte Zahlen sind. (Wenn x präsent ist, kann man es mit einem raffinierten Trick loswerden, daher gilt diese Formel tatsächlich allgemein.) Die Antwort lautet und darin finden sich Kubik- und Quadratwurzeln. Ich will Ihnen die schmutzigen Details ersparen. Sie sind clever und elegant, aber diese Art
von Algebra ist etwas für Kenner, und man findet sie leicht in einem Lehrbuch oder im Internet. Die Dimensionen des Raumes Die euklidische Geometrie betrachtet zwei unterschiedliche Räume: die Geometrie der Ebene, wo sich tatsächlich alles auf ein flaches Blatt Papier beschränkt, und die Geometrie des dreidimensionalen Raumes. Die Ebene ist zweidimensional: Die Lage eines Punktes lässt sich mit zwei Koordinaten (x, y) bestimmen. Der Raum, in dem wir leben, ist dreidimensional: Die Lage eines Punktes lässt sich mit drei Koordinaten (x, y, z) festlegen. Eine andere Möglichkeit, dasselbe zu sagen: Es gibt in der Ebene (die nun senkrecht wie die Seite eines Buches oder ein Computerbildschirm steht) zwei unabhängige Richtungen: links-rechts und oben-unten. Im Raum gibt es hingegen drei unabhängige Richtungen: Nord-Süd, Ost-West und oben-unten. Mehr als 2000 Jahre lang haben Mathematiker (und alle übrigen Menschen) angenommen, drei Dimensionen seien das Maximum. Sie gingen davon aus, einen vierdimensionalen Raum könne es nicht geben (siehe Kapitel [4]), weil kein Platz für eine vierte unabhängige Richtung da war. Wenn Sie meinen, den gebe es doch, bewegen Sie sich doch bitte in diese Richtung. Diese Überzeugung beruhte jedoch auf einer Vermengung des realen physikalischen Raumes und abstrakten mathematischen Möglichkeiten.
Aus der Perspektive der normalen menschlichen Wahrnehmung scheint sich der Raum recht gut an die Vorgaben der dreidimensionalen euklidischen Geometrie zu halten. Unsere Wahrnehmung beschränkt sich jedoch auf unser nahes Umfeld, und nach Albert Einstein entspricht das euklidische Bild der Welt nicht genau der Geometrie des Raumes, wenn man größere Maßstäbe betrachtet. Sobald wir uns aus der physikalischen in die abstrakte Welt mathematischer Konzepte bewegen, lässt sich der «Raum» problemlos per definitionem mit so vielen Dimensionen ausstatten, wie wir wollen. Wir erlauben in unserer Liste einfach weitere Koordinaten. Im vierdimensionalen Raum werden Punkte beispielsweise mit Hilfe einer Liste von vier Koordinaten (w, x, y, z) festgelegt. Eine bildliche Darstellung ist nicht mehr möglich – zumindest nicht in der üblichen Weise –, aber das ist eine Einschränkung des physikalischen Raumes und der menschlichen Wahrnehmung, keine Einschränkung der Mathematik. Wichtig ist dabei festzuhalten, dass wir eigentlich auch keine dreidimensionalen Objekte zeichnen können, denn Papier und Computerbildschirme sind zweidimensional. Unser Sehsystem ist jedoch daran gewöhnt, in zweidimensionalen Projektionen dreidimensionale Objekte zu erkennen, denn die einfallenden Lichtstrahlen werden von der Netzhaut wahrgenommen, die ebenfalls annähernd zweidimensional ist. Daher geben wir uns damit zufrieden, eine Projektion einer dreidimensionalen Form auf einer Ebene abzubilden – was der Art und Weise ganz ähnlich ist, wie jedes Auge die Welt sieht. Ähnliche Methoden lassen sich entwickeln, um vierdimensionale Formen aufs Papier zu bringen, aber sie bedürfen einer Menge Erklärungen und man braucht etwas Übung, um sich visuell daran zu gewöhnen.
Schließlich erkannten Physiker, dass nicht drei, sondern vier Koordinaten erforderlich sind, um ein Objekt in Raum und Zeit zu lokalisieren: die üblichen drei für die Position im Raum und die vierte für den Zeitpunkt des Auftretens. Die Schlacht von Hastings fand an einem Ort statt, der heute in der Nähe der Kreuzung der A272 und der A2100 liegt, nordwestlich von Hastings an der Südküste von Sussex. Geographische Länge und Breite dieses Punktes liefern zwei Koordinaten. Die Schlacht fand aber auch auf dem Boden statt, das heißt, einige Meter über dem Meeresspiegel. Das ist die dritte räumliche Koordinate, und wir haben die Kampfesstätte nun relativ zur Erde präzise lokalisiert. (Ich ignoriere die Bewegung der Erde um die Sonne, die Drehung der Sonne mit der übrigen Galaxie, die Bewegung der Galaxie Richtung M13 im Andromeda-System und dass die ganze lokale Gruppe von Galaxien in Richtung des Großen Attraktors gezogen wird.) Wenn Sie jedoch heute an diesen Ort kommen, dann treffen Sie nicht auf die Angelsachsen, die sich unter König Harold II. dem vordringenden normannischen Heer von Herzog Wilhelm dem Eroberer entgegenstellten, und zwar deshalb, weil Sie sich auf der falschen Zeitkoordinate befinden. Sie benötigen eine vierte Zahl, den 14. Oktober 1066, um die Schlacht in Raum und Zeit zu lokalisieren. Obgleich der physische Raum also nur drei Dimensionen haben mag, hat die Raumzeit definitiv vier. Der Raum ist zudem möglicherweise nicht so, wie es scheint, wenn wir über unsere normale sensorische Wahrnehmung hinausgehen. Einstein hat gezeigt, dass der Raum dann, wenn wir ihn in sehr großem Maßstab betrachten, zum Beispiel in der Größenordnung von Sonnensystemen oder
Galaxien, unter dem Einfluss der Schwerkraft gekrümmt ist. Die daraus resultierende Geometrie weicht von der euklidischen Geometrie ab. Und im Bereich des Allerkleinsten, auf der Ebene der subatomaren Teilchen, hat der Raum, so vermuten Physiker inzwischen, sechs oder sieben zusätzliche Dimensionen, die vielleicht so eng eingerollt sind, dass wir sie nicht bemerken (siehe Kapitel [11]). Warum es unmöglich ist, einen Winkel in drei gleiche Teile zu teilen und einen Würfel zu verdoppeln Euklids Elemente liefern Lösungen für eine ganze Reihe von geometrischen Problemen, lassen jedoch mehrere Fragen unbeantwortet. Das Werk beschreibt eine Methode zur Teilung eines Winkels in zwei gleich große Teile, und zwar allein mit Hilfe traditioneller Werkzeuge, wie einem unmarkierten Lineal und einem Zirkel (siehe Kapitel [ ], S. 198). Euklid lieferte jedoch keine Methode, um einen Winkel mit diesen Werkzeugen in drei gleiche Teile zu zerlegen. Er wusste, wie man das Volumen eines gegebenen Würfels um das Achtfache vergrößert – man muss nur sämtliche Seiten verdoppeln. Aber er lieferte keine Methode, das Volumen eines Würfels zu verdoppeln, ein Problem, das als Würfelverdopplung bekannt ist. Sein vielleicht größtes Versäumnis war die Quadratur des Kreises: eine Methode zur Konstruktion eines Quadrats mit derselben Fläche wie ein gegebener Kreis (siehe Kapitel [π]). Modern ausgedrückt, bedeutet dies,
eine geometrische Konstruktion für eine Strecke der Länge π zu finden, wenn eine Strecke der Länge 1 gegeben ist. Das sind die drei «geometrischen Probleme des Altertums». Die antiken Mathematiker lösten sie, indem sie ihr Instrumentarium erweiterten, doch sie ließen offen, ob diese neuen Methoden tatsächlich notwendig waren. Ließen sich die drei Probleme vielleicht doch allein mit Zirkel und Lineal lösen? Schließlich wurde nachgewiesen, dass alle drei Probleme mit Zirkel und Lineal allein unlösbar waren. Die Quadratur des Kreises erwies sich als besonders schwierig (siehe Kapitel [π]). Die beiden anderen hängen mit einer bestimmten Eigenschaft der Zahl 3 zusammen: nämlich, dass sie keine ganzzahlige Potenz von 2 ist. Die Grundidee lässt sich leichter im Zusammenhang mit der Verdopplung des Würfels verstehen. Das Volumen eines Würfels mit der Seitenlänge x ist 3 3 x . Also versuchen wir, die Gleichung x = 2 zu lösen. Das lässt sich machen: Die Antwort ist die Kubikwurzel von 2: Aber lässt sich das allein mit Zirkel und Lineal erreichen? Gauß bemerkte in seinem Text zur Zahlentheorie Disquisitiones Arithmeticae (Zahlentheoretische Untersuchungen), dass sich jede von der Einheitslänge mittels einer Zirkel-und-Lineal-Konstruktion abgeleitete Länge algebraisch durch die Lösung einer Folge von quadratischen Gleichungen ausdrücken lässt. Ein wenig Algebra zeigt, dass die Länge daher die Lösung einer Gleichung mit ganzzahligen Koeffizienten sein
muss, deren Grad eine Potenz von 2 ist. Vereinfacht gesagt, verdoppelt jede zusätzliche Quadrierung den Grad. 3 Nun der Todesstoß. Die Gleichung für die Kubikwurzel von 2 ist x = 2, also eine Gleichung dritten Grades. Das ist keine Potenz von 2, daher lässt sich diese Länge nicht mit Zirkel und Lineal konstruieren. Pierre Wantzel sortierte das Kleingedruckte, das Gauß der Erwähnung nicht für wert hielt, und schrieb 1837 einen vollständigen Beweis nieder. Dabei ist ein fachlicher Punkt wichtig: Die kubische Gleichung muss «irreduzibel» sein, was in diesem Fall bedeutet, dass sie keine rationale Lösung hat. Da irrational ist, ist dieser Punkt leicht zu erfüllen. Wantzel wies zudem nach, dass die Dreiteilung eines Winkels aus demselben Grund unmöglich ist. Wenn wir erwägen, einen Winkel von 60° in drei gleiche Teile zu zerlegen, führen ein wenig Trigonometrie und Algebra zu der kubischen Gleichung Diese Gleichung ist ebenfalls irreduzibel, daher ist eine Konstruktion mit Zirkel und Lineal auch in diesem Fall unmöglich. Parkettierungen der Ebene mit regelmäßigen Vielecken Nur drei regelmäßige Vielecke (Polyeder) parkettieren die Ebene: das gleichseitige Dreieck, das Quadrat und das Sechseck (Hexagon).
Abbildung 21: Drei Möglichkeiten, eine Ebene zu kacheln: mit gleichseitigen Dreiecken, Quadraten oder Sechsecken. Der Beweis ist einfach. Der Winkel an der Ecke eines n-seitigen regelmäßigen Vielecks ist und die ersten Werte lauten: n Vieleck 3 60 gleichseitiges Dreieck 4 90 Quadrat 5 108 Fünfeck 6 120 Sechseck 7 128,57 Siebeneck 8 135 Achteck Tabelle 5 Nun überlegen Sie, wie eine Parkettierung mit einem Typ einer dieser Vielecke aussehen würde. In jeder Ecke treffen sich mehrere Kacheln.
Daher muss der Winkel an der Ecke des Vielecks gleich 360°, geteilt durch eine ganze Zahl, sein. Die möglichen Winkel sind daher: n Vieleck 3 120 Sechseck 4 90 Quadrat 5 72 kein Winkel eines regelmäßigen Vielecks 6 60 gleichseitiges Dreieck 7 51,43 kein Winkel eines regelmäßigen Vielecks Tabelle 6 Beachten Sie, dass die Winkelgrößen in der ersten Tabelle steigen, wenn die Seitenzahl n steigt, während sie in der zweiten Tabelle sinken, wenn n steigt. Von 7 Seiten an beträgt der Winkel in der zweiten Tabelle weniger als 60°, während der Winkel in der ersten Tabelle stets größer oder gleich 60° ist. Daher führt eine Fortsetzung der Tabelle nicht zu weiteren Parkettierungsmöglichkeiten. Dies lässt sich auch so ausdrücken: Drei Fünfecke lassen eine Lücke, aber vier überlappen einander; zwei Siebenecke (oder Vielecke mit mehr als sieben Seiten) lassen eine Lücke, aber drei überlappen einander. Daher passen nur das gleichseitige Dreieck, das Quadrat und das Sechseck so genau zusammen, dass sie sich zur Parkettierung eignen.
Abbildung 22: Links: Drei Fünfecke lassen eine Lücke, vier überlappen. Rechts: Zwei Siebenecke lassen eine Lücke, drei überlappen. Dasselbe gilt für Vielecke mit mehr als 7 Seiten. Summen dreier Quadratzahlen Da viele Zahlen keine Summen von zwei Quadratzahlen sind (siehe Kapitel [2]), wie steht es mit den Summen von drei Quadratzahlen? Die meisten, aber nicht alle Zahlen lassen sich als Summe von drei Quadratzahlen schreiben. Die Liste derjenigen Zahlen, für die das nicht gilt, beginnt mit: Wiederum bilden die Zahlen ein Muster, und wiederum ist es schwer zu entdecken. Es wurde 1798 von Adrien-Marie Legendre gefunden. Er stellte fest, dass die Summen von drei Quadratzahlen genau diejenigen Zahlen k ergeben, die nicht die Form 4 (8n + 7) haben. Die Liste der Ausnahmen oben enthält alle Zahlen dieser Form. Wenn n = 0 und k = 0 ist, erhalten wir daher 7, wenn n = 1 und k = 0 ist, erhalten wir 15, und so weiter. Sein
Ergebnis ist korrekt, doch sein Beweis wies eine Lücke auf, die 1801 von Gauß gefüllt wurde. k Es ist nicht allzu schwierig, zu beweisen, dass Zahlen der Form 4 (8n + 7) nicht die Summen von drei Quadratzahlen sind. Jede Quadratzahl lässt als Rest 0, 1 oder 4, wenn sie durch 8 geteilt wird. Daher können die Summen von drei Quadratzahlen jeden Rest lassen, der sich ergibt, wenn man drei dieser Zahlen zusammenzählt; das führt zu Resten von 0, 1, 2, 3, 4, 5 und 6, aber nicht 7. Das wiederum sagt uns, dass Zahlen der Form 8n + k 7 mehr als drei Quadratzahlen benötigen. Die Sache mit 4 ist nur wenig schwieriger. Das Schwierigste ist, zu beweisen, dass alle anderen Zahlen tatsächlich die Summe dreier Quadratzahlen sind.
Quadratzahlen Die erste perfekte Quadratzahl (nach 0 und 1) ist 4. Jede Karte in der Ebene lässt sich mit vier Farben so kolorieren, dass benachbarte Regionen unterschiedliche Farben aufweisen. Jede positive ganze Zahl ist eine Summe von 4 Quadratzahlen. Dasselbe wird für Kubikzahlen angenommen, wenn man negative ganze Zahlen erlaubt. Gleichungen 4. Grades, in der die Unbekannte in der 4. Potenz auftaucht, lassen sich mit Hilfe von Kubikund Quadratwurzeln lösen. (4. Wurzeln sind Quadratwurzeln aus Quadratwurzeln.) Das Zahlensystem der Quaternionen, das auf 4 unabhängigen Größen beruht, gehorcht fast allen Standardgesetzen der Algebra. Kann es sein, dass eine vierte Dimension existiert? Eine perfekte Quadratzahl
Die Zahl 4 = 2 × 2 ist eine Quadratzahl (siehe Kapitel [2]). Für die gesamte Mathematik sind Quadratzahlen von zentraler Bedeutung. Der Satz des Pythagoras besagt, dass das Quadrat der längsten Seite eines rechtwinkligen Dreiecks gleich der Summe der Quadrate der beiden anderen Seiten ist; daher sind Quadratzahlen vor allem in der Geometrie von grundlegender Bedeutung. Quadratzahlen weisen zahlreiche verborgene Muster auf. Schauen Sie sich beispielsweise die Differenzen zwischen aufeinanderfolgenden Quadratzahlen an: Was für Zahlen sind das? Die ungeraden Zahlen Ein weiteres interessantes Muster ist eine direkte Folge:
Wenn wir all die ungeraden Zahlen bis zu einer bestimmten Zahl zusammenzählen, ist das Ergebnis eine Quadratzahl. Es gibt eine Möglichkeit, mit Hilfe von Punkten zu verstehen, warum diese beiden Fakten wahr sind und wie sie zusammenhängen (siehe Abb. 23, Seite 76, oben). Natürlich lässt sich dies auch algebraisch beweisen. Hier ist ein weiteres wunderbares Muster mit Quadratzahlen: Abbildung 23: Links: 1 + 3 + 5 + 7 + 9. Rechts: 1 + 2 + 3 + 4 + 5 + 4 + 3 + 2 + 1. Das lässt sich anhand der Punkte in der Abbildung rechts leicht nachvollziehen.
Das Vierfarbentheorem Vor rund 150 Jahren begannen ein paar Mathematiker, über Landkarten nachzudenken. Dabei ging es ihnen nicht um das traditionelle Problem, möglichst präzise Weltkarten herzustellen und einen runden Globus auf einem flachen Blatt Papier abzubilden, sondern um recht eigenartige Fragen über Karten im Allgemeinen – vor allem darum, wie man sie so einfärben kann, dass Regionen mit einer gemeinsamen Grenze unterschiedliche Farben tragen. Einige Karten brauchen nur wenige Farben. Die Quadrate eines Schachbretts bilden eine sehr regelmäßige Art von Karte, für die man nur zwei Farben benötigt: gewöhnlich schwarz und weiß. Karten, die aus überlappenden Kreisen bestehen, benötigen ebenfalls nur zwei Farben (siehe Professor Stewarts mathematische Detektivgeschichten). Wenn die Regionen jedoch weniger regelmäßig werden, reichen zwei Farben nicht aus. Hier sehen Sie beispielsweise eine Karte der USA, wobei die Regionen die einzelnen Bundesstaaten sind. Offensichtlich würden 50 Farben – eine für jeden Bundesstaat – wunderbar funktionieren, aber wir können’s besser. Versuchen Sie einmal, die Regionen zu kolorieren, und schauen Sie, wie viele Farben Sie mindestens benötigen. Um ein technisches Detail klarzustellen: Staaten, die sich an einem einzigen Punkt treffen, wie Colorado und Arizona, können, falls gewünscht, gleich eingefärbt werden. Sie haben keine gemeinsame Grenze.
Abbildung 24: Die 50 amerikanischen Bundesstaaten. Die Karte der USA macht einige einfache allgemeine Prinzipien exemplarisch klar. Alaska und Hawaii spielen eigentlich keine Rolle, weil sie von allen anderen Staaten isoliert sind: Wir können sie beliebig einfärben. Wichtiger ist, dass wir mindestens drei Farben brauchen. Tatsächlich müssen Utah, Wyoming und Colorado jeweils anders koloriert werden, weil jeweils zwei von ihnen eine gemeinsame Grenze haben. Wir können drei Farben für diese Staaten wählen. Es spielt keine Rolle, welche es sind, solange sie nur unterschiedlich sind. Also lassen Sie uns Utah schwarz anmalen, Wyoming dunkelgrau und Colorado mittelgrau, wie auf der Abbildung.
Abbildung 25: Warum wir mindestens drei Farben brauchen. Nehmen wir um der Diskussion willen an, dass wir auch für den Rest der Karten nur diese drei Farben benutzen wollen. Dann müsste Nebraska wiederum schwarz sein, denn es hat eine gemeinsame Grenze mit einem dunkelgrauen und einem mittelgrauen Staat. Das würde Mittelgrau für South Dakota erzwingen. Wir können eine Weile lang auf diese Weise fortfahren, wobei für jede neue Farbe nur eine einzige Möglichkeit bleibt, wenn wir Montana, Idaho, Nevada, Oregon und Kalifornien anmalen. In diesem Stadium ergibt sich der Stand von Abb. 26.
Abbildung 26: Wenn wir mit drei Farben weitermachen, geraten wir irgendwann in Schwierigkeiten. Arizona grenzt nun an Staaten, die wir mittelgrau, dunkelgrau und schwarz eingefärbt haben. Da alle Einfärbungen bis zu diesem Punkt durch die Art und Weise erzwungen wurden, wie die Staaten aneinandergrenzen, funktionieren drei Farben für die ganze Karte offenbar nicht. Daher brauchen wir eine vierte – sagen wir, hellgrau –, um fortzufahren (siehe Abb. 27).
Abbildung 27: Eine vierte Farbe ist die Rettung. Bei 38 weiteren Staaten – Alaska und Hawaii lassen wir aus – erscheint es vorstellbar, dass wir irgendwo eine fünfte oder gar eine sechste Farbe brauchen … wer weiß? Auf der anderen Seite verändert es die ganze Situation, wenn wir über eine vierte Farbe verfügen. Vor allem könnte man einige der vorher zugewiesenen Farben ändern (und Wyoming beispielsweise hellgrau einfärben). Die Wahl der Farben ist nicht länger zwangsläufig, daher wird es schwieriger, das Problem zu analysieren. Wir können jedoch weiterhin vernünftige Vermutungen anstellen und die Farben ändern, wenn wir in eine Sackgasse geraten. Bei einer Einfärbung gibt es nur drei hellgraue Staaten: Arizona, West Virginia und New York. Obgleich es 50 Staaten gibt, haben wir die ganze Karte mit nur vier Farben eingefärbt.
Abbildung 28: Eine fünfte Farbe ist nicht nötig. (Ein weiterer technischer Punkt: Michigan tritt in Form von zwei nicht verbundenen Regionen auf, die durch den Lake Michigan getrennt sind. Beide sind dunkelgrau eingefärbt, aber unverbundene Regionen führen manchmal zu mehr Farben. Das muss man bei einer vollständigen mathematischen Theorie berücksichtigen, es spielt in unserem Zusammenhang aber keine entscheidende Rolle.) Die Karte der USA ist nicht besonders kompliziert, und wir können uns andere Karten mit Millionen von Regionen mit sehr unregelmäßigen Grenzen vorstellen, die überall wie Finger in die Nachbarregionen hineinragen. Vielleicht braucht man dafür deutlich mehr Farben. Dennoch kamen die Mathematiker, die über diese Problematik nachdachten, zu der festen Überzeugung, dass man niemals mehr als vier Farben braucht, um eine Karte zu kolorieren, ganz gleich, wie kompliziert sie ist. Solange die
Karte auf eine Ebene oder eine Kugel gezeichnet ist und alle Regionen miteinander verbunden sind, reichen vier Farben aus. Kurze Geschichte des Vierfarbenproblems Das Vierfarbenproblem stammt aus dem Jahr 1852, als Francis Guthrie, ein junger südafrikanischer Mathematiker und Botaniker, versuchte, die Landkreise auf einer Karte von England einzufärben. Vier Farben schienen stets auszureichen, und so fragte er seinen Bruder Frederick, ob dies eine allgemein bekannte Tatsache sei. Frederick gab die Frage an den renommierten, wenn auch exzentrischen Mathematiker Augustus De Morgan weiter; der hatte keine Ahnung und schrieb an einen noch berühmteren Mathematiker, Sir William Rowan Hamilton. Hamilton konnte die Frage ebenfalls nicht beantworten, und um ehrlich zu sein, scheint sie ihn auch nicht besonders interessiert zu haben. Im Jahr 1879 veröffentlichte der Anwalt Alfred Kempe einen Beweis, der belegen sollte, dass vier Farben stets genügen, doch 1889 entdeckte Percy Heawood, dass Kempe ein Fehler unterlaufen war. Er zeigte, dass Kempe lediglich bewiesen hatte, dass fünf Farben stets ausreichen, und das blieb mehr als ein Jahrhundert lang der Stand der Dinge. Die Antwort lautete entweder vier oder fünf, aber niemand wusste, was denn nun richtig war. Andere Mathematiker versuchten Strategien, wie sie Kempe verwendet hatte, doch bald wurde deutlich, dass diese Methode eine ganze Menge mühsamer Berechnungen erforderte. Schließlich knackten Wolfgang Haken und Kenneth Appel das Problem 1976 mit Hilfe eines Computers. Vier Farben reichen stets aus.
Seit dieser Pionierarbeit haben sich Mathematiker daran gewöhnt, Computer zur Problemlösung heranzuziehen. Sie bevorzugen noch immer Beweise, die sich allein auf menschliche Geisteskräfte stützen, aber die meisten bestehen nicht mehr darauf. In den 1990er Jahren herrschte noch ein gewisses Unbehagen gegenüber dem Appel-Haken-Beweis. Daher entschlossen sich Neil Robertson, Daniel Sanders, Paul Seymour und Robin Thomas 1994, den ganzen Beweis zu wiederholen, wobei sie dieselbe Grundstrategie anwandten, aber den Aufbau vereinfachten. Die heutigen Computer sind so schnell, dass sich der ganze Beweis inzwischen in ein paar Stunden auf einem Heimcomputer nachvollziehen lässt. Der Vier-Quadrate-Satz In Kapitel 2 haben wir gesehen, wie man Summen von zwei Quadratzahlen, und in Kapitel 3, wie man Summen von drei Quadratzahlen beschreibt. Aber wenn es um die Summen von vier Quadratzahlen geht, muss man die Zahlen, die funktionieren, nicht näher beschreiben. Es klappt nämlich immer. Jede zusätzliche Quadratzahl ermöglicht es, weitere Zahlen einzuschließen, daher sollten die Summen von vier Quadratzahlen zumindest ein paar Lücken füllen. Ein bisschen Herumprobieren lässt vermuten, dass jede Zahl von 0 bis 100 auftritt. Beispielsweise lässt sich 7 nicht als Summe von drei Quadratzahlen schreiben, wohl aber von vier:
Dieser frühe Erfolg könnte darauf zurückzuführen sein, dass wir uns mit recht kleinen Zahlen beschäftigen. Vielleicht braucht irgendeine größere Zahl fünf oder gar sechs Quadratzahlen oder sogar noch mehr? Nein. Auch größere Zahlen lassen sich als Summe von vier Quadratzahlen schreiben. Mathematiker suchten lange nach einem Beweis, dass dies für alle positiven Zahlen gilt, und im Jahr 1770 fand Joseph Louis Lagrange einen solchen Beweis. Weswegen der Vier-Quadrate-Satz Mathematikern auch als Satz von Lagrange bekannt ist. Die Vier-Kubikzahlen-Vermutung Es ist vermutet worden, dass ein ähnlicher Satz für vier Kubikzahlen gilt, aber mit einer zusätzlichen Finesse: Sowohl positive als auch negative Kubikzahlen sind erlaubt. Daher lautet die Vermutung: Jede ganze Zahl ist eine Summe von vier ganzzahligen Kubikzahlen. Erinnern Sie sich daran, dass eine ganze Zahl positiv, negativ oder null sein kann. Der erste Versuch, den Vier-Quadrate-Satz auf Kubikzahlen zu verallgemeinern, erschien 1770 in Edward Warings Meditationes Algebraicae. Er behauptete ohne Beweis, dass jede ganze Zahl die Summe von vier Quadratzahlen, neun Kubikzahlen, 19 vierten Potenzen und so weiter ist. Dabei nahm er an, dass alle Zahlen, um die es ging, positiv oder null waren. Diese Behauptung wurde als das Waring-Problem bekannt. Die 3. Potenz einer negativen ganzen Zahl ist negativ, und das eröffnet neue Möglichkeiten, zum Beispiel benötigt man für
neun positive Kubikzahlen, doch wenn wir negative Zahlen erlauben, kommen wir mit fünf Kubikzahlen aus: Tatsächlich lässt sich 23 mit nur vier Kubikzahlen ausdrücken: Wenn wir negative Zahlen zulassen, kann eine große positive Zahl eine große negative Zahl problemlos kompensieren. Daher können die beteiligten Kubikzahlen im Prinzip viel größer sein als die Zahl, um die es geht. Beispielweise können wir 30 in folgender Weise als Summe dreier Kubikzahlen schreiben: Anders als im positiven Fall können wir nicht systematisch eine Liste mit einer begrenzten Zahl von Möglichkeiten abarbeiten. Computerexperimente ließen Mathematiker vermuten, dass jede ganze Zahl die Summe von vier ganzzahligen Kubikzahlen ist. Bisher gibt es dafür zwar noch keinen Beweis, doch die Belege sind überzeugend, und es sind einige Fortschritte erzielt worden. Es würde reichen, die Behauptung für alle positiven ganzen Zahlen zu beweisen (wobei positive oder negative 3 3 Kubikzahlen weiterhin erlaubt sind), denn (–n) = –n . Jede Darstellung einer positiven Zahl m als Summe von Kubikzahlen lässt sich in eine
Darstellung von –m umwandeln, indem man das Vorzeichen einer jeden Kubikzahl ändert. Computerberechnungen haben verifiziert, dass jede positive ganze Zahl bis zu 10 Millionen die Summe von vier Kubikzahlen ist. Und 1966 bewies Wadim Demjanenko, dass jede Zahl, die nicht die Form 9k ± 4 hat, die Summe von vier Kubikzahlen ist. Es ist sogar möglich, dass bei einer endlichen Anzahl von Ausnahmen jede positive ganze Zahl die Summe von vier Kubikzahlen ist, die positiv oder null sind. Im Jahr 2000 vermuteten Jean-Marc Deshouillers, François Hennecart, Bernard Landreau und I. Gusti Putu Purnaba, dass die größte ganze Zahl, die sich nicht auf diese Weise ausdrücken lässt, 7373170279850 ist. Gleichungen 4. Grades In der Geschichte von Cardano und den kubischen Gleichungen (siehe Kapitel [3]) geht es auch um quartische Gleichungen oder Gleichungen 4. Grades, in denen die Unbekannte zur vierten Potenz erhoben ist: Cardanos Schüler Ferrari löste diese Gleichung. Eine ausführliche Formel findet sich unter http://de.wikipedia.org/wiki/Quartische_Gleichung
und wenn Sie sich diesen Eintrag anschauen, werden Sie verstehen, warum ich die ganze Sache hier nicht niederschreibe. Ferraris Methode verknüpfte die Lösungen der quartischen Gleichung mit denjenigen einer korrespondierenden kubischen Gleichung. Das bezeichnet man heute als Lagrange-Resolvente, weil Lagrange der erste Mathematiker war, der erklärte, warum eine kubische Gleichung das Problem löst. Quaternionen In der Einleitung haben wir gesehen, dass das Zahlensystem wiederholt durch die Einführung neuer Zahlentypen erweitert worden ist, ein Trend, der in den komplexen Zahlen kulminierte, bei denen –1 eine Quadratwurzel hat (siehe Kapitel [i]). Komplexe Zahlen spielen in der Physik eine wichtige Rolle. Aber es gibt eine schwerwiegende Einschränkung. Die Methoden sind auf die beiden Dimensionen der Ebene beschränkt. Der Raum ist jedoch dreidimensional. Im 19. Jahrhundert versuchten Mathematiker, ein dreidimensionales Zahlensystem zu entwickeln und die komplexen Zahlen zu erweitern. Damals erschien das wie eine gute Idee, aber es führte zu keinem nützlichen Ergebnis. William Rowan Hamilton, ein brillanter irischer Mathematiker, war besonders daran interessiert, ein praktikables dreidimensionales Zahlensystem zu erfinden, und 1843 hatte er einen Geistesblitz. Er erkannte zwei unüberwindbare Hindernisse, die der Schaffung eines solchen Systems entgegenstanden:
Drei Dimensionen funktionieren nicht. Eine der Standardregeln der Arithmetik muss geopfert werden. Nämlich das Kommutativgesetz der Multiplikation, das besagt ab = ba. Als Hamilton diesen Geistesblitz hatte, schlenderte er auf dem Treidelpfad eines Kanals zu einem Treffen der Royal Irish Academy. Die ganze Zeit hatte er sich mit dem kniffligen Problem eines dreidimensionalen Systems herumgeschlagen, als er plötzlich erkannte, dass drei Dimensionen zwar nicht funktionieren würden, wohl aber vier. Man musste jedoch bereit sein, das Kommutativgesetz der Multiplikation zu streichen. Es war ein wirklicher Heureka!-Moment. Ganz erfüllt von seiner erstaunlichen Erkenntnis, hielt Hamilton inne und ritzte in das Mauerwerk einer Brücke eine Formel für derartige Zahlen: Er nannte dieses System Quaternionen, weil die Zahlen vier Komponenten aufweisen. Drei davon sind i, j und k, und die vierte ist die reelle Zahl 1. Eine typische Quaternione sieht so aus: und hat vier beliebige reelle Zahlen (hier 3, –2, 5, 4) als Koeffizienten. Solche «Zahlen» lassen sich problemlos addieren, und die Multiplikation ist ebenso einfach, wenn man die Formel benutzt, die Hamilton in das
Mauerwerk der Brücke gekratzt hat. Alles, was man braucht, sind ein paar Folgerungen aus diesen Gleichungen, nämlich: zusammen mit der Regel, dass eine Multiplikation mit 1 das Ergebnis nicht verändert. Man beachte, dass ij und ji, beispielsweise, zu unterschiedlichen Ergebnissen führen; daher gilt das Kommutativgesetz nicht. Dieses Versagen mag auf den ersten Blick unangenehm erscheinen, doch es bereitet keine ernsten Schwierigkeiten. Man muss lediglich auf die Reihenfolge achten, wenn man beim Rechnen die Symbole hinschreibt. Zur damaligen Zeit kamen in der Mathematik noch weitere Gebiete auf, in denen das Kommutativgesetz nicht galt. Daher war eine solche Idee nicht beispiellos, und sie war sicherlich nicht frevlerisch. Hamilton hielt Quaternionen für wunderbar, doch anfangs sahen die meisten seiner Kollegen diese Zahlen als eine Art Freaks an. Da half es auch nicht, als sich herausstellte, dass Quaternionen nicht besonders hilfreich sind, wenn es darum geht, physikalische Probleme im dreidimensionalen Raum zu lösen – oder im vierdimensionalen, was das angeht. Die neuen Zahlen waren kein völliger Fehlschlag, aber es fehlten ihnen die Vielseitigkeit und Allgemeingültigkeit komplexer Zahlen im zweidimensionalen Raum. Hamilton konnte i, j und k einigermaßen erfolgreich einsetzen, um einen dreidimensionalen Raum zu schaffen, doch
diese Einsatzmöglichkeit wurde von der Vektoralgebra verdrängt, die in der angewandten Mathematik zum Standard wurde. In der reinen Mathematik bleiben Quaternionen jedoch ein wichtiges Werkzeug, und sie finden auch in der Computergraphik Verwendung, wo sie eine einfache Möglichkeit bieten, Objekte im Raum zu drehen. Zudem weisen sie interessante Verbindungen zum Vier-Quadrate-Satz auf. Hamilton bezeichnete Quaternionen nicht als «Zahlen», denn um diese Zeit wurden viele verschiedene zahlenartige algebraische Systeme entwickelt. Quaternionen sind ein Beispiel für etwas, das wir heute eine Divisionsalgebra nennen: ein algebraisches System, in dem man addieren, subtrahieren, multiplizieren und dividieren (außer durch 0) kann, wobei fast alle Standardgesetze der Arithmetik gültig bleiben. Das Symbol für eine Menge von Quaternionen ist (für Hamilton, da bereits für die rationalen Zahlen vergeben war). Die Dimensionen von reellen Zahlen, komplexen Zahlen und Quaternionen sind 1, 2 und 4. Die nächste Zahl in dieser Folge sollte sicherlich 8 lauten. Gibt es eine achtdimensionale Divisionsalgebra? Die Antwort ist ein eindeutiges «Ja». Die Oktonionen, auch als Cayley-Zahlen bekannt, bilden ein solches System. Ihr Symbol ist . In diesem Fall muss jedoch ein weiteres Gesetz der Arithmetik dran glauben: das Assoziativgesetz a(bc) = (ab)c. Zudem bricht das Muster hier ab: Es gibt keine 16-dimensionale Divisionsalgebra. Quaternionen wie auch Oktonionen sind erst kürzlich aus ihrem Dornröschenschlaf gerissen worden, denn sie weisen eine tief gehende Verbindung zur Quantenmechanik und den Grundbausteinen der Materie,
den Elementarteilchen, auf. Der Schlüssel zu diesem Gebiet liegt in der Symmetrie der physikalischen Gesetze, und diese beiden algebraischen Systeme weisen wichtige und ungewöhnliche Symmetrieeigenschaften auf. So bleiben die Regeln für Quaternionen zum Beispiel unverändert, wenn man i, j und k als j, k und i neu anordnet. Wie ein näherer Blick zeigt, kann man sie tatsächlich durch geeignete Kombinationen von i-, j- und kBuchstaben ersetzen. Die resultierenden Symmetrien sind sehr eng mit Rotationen im dreidimensionalen Raum verknüpft; daher verwenden Computerspiele Quaternionen häufig zu diesem Zweck in ihrer GraphikSoftware. Die Oktonionen werden ähnlich gedeutet, nämlich als Rotationen in einem siebendimensionalen Raum. Die vierte Dimension Seit undenklichen Zeiten ist den Menschen bekannt, dass der Raum drei Dimensionen hat (siehe Kapitel [3]). Lange Zeit schien die Vorstellung von einem Raum mit vier oder gar noch mehr Dimensionen absurd. Ab dem 19. Jahrhundert wurde diese konventionelle Überzeugung jedoch immer stärker in Frage gestellt, und viele Leute begannen sich zunehmend für die Möglichkeit einer vierten Dimension zu interessieren. Und das waren nicht nur Mathematiker oder Naturwissenschaftler, sondern auch Philosophen, Theologen, Spiritisten, Geistergläubige und ein paar Schwindler. Eine vierte Dimension bot eine plausible Heimstätte für Gott, die Geister der Toten oder Gespenster. Nicht in diesem Universum, aber gleich nebenan mit leichtem Zugang. Scharlatane und Betrüger benutzten Tricks, um
Leichtgläubigen zu «beweisen», dass sie Zutritt zu dieser neuen Dimension hatten. Die Vorstellung, dass «Räume» mit mehr als drei Dimensionen logisch Sinn ergeben – ob sie nun eine physikalische Entsprechung hatten oder nicht –, fasste dank neuer Entdeckungen wie Hamiltons Quaternionen zuerst in der Mathematik Fuß. Ab Beginn des 19. Jahrhunderts erschien es nicht länger offensichtlich, dass bei drei Dimensionen Schluss sein muss. Denken Sie nur an Koordinaten. In der Ebene lässt sich die Lage eines jeden Punktes präzise durch zwei reelle Zahlen x und y beschreiben, die ein Koordinatenpaar (x, y) bilden.
Abbildung 29: Koordinaten in der Ebene. Um die drei Dimensionen des Raumes zu repräsentieren, müssen wir in der Vorne-hinten-Richtung lediglich eine dritte Koordinate z zufügen. Nun haben wir ein Tripel reeller Zahlen (x, y, z) vorliegen. Wenn wir geometrische Zeichnungen anfertigen, sieht es aus, als müssten wir an diesem Punkt aufhören. Aber es fällt nicht schwer, Quadrupel von Zahlen (w, x, y, z) zu schreiben. Oder Fünfergruppen. Oder Sechsergruppen.
Oder, wenn man genug Papier und Zeit hat, auch Millionengruppen. Schließlich erkannten Mathematiker, dass sie mit Hilfe von Quadrupeln einen abstrakten Raum definieren konnten, und als sie das taten, hatte er vier Dimensionen. Mit fünf Koordinaten erhält man einen fünfdimensionalen Raum, und so weiter. Es gab sogar eine vernünftige Vorstellung von der Geometrie in solchen Räumen, die in Analogie zum Satz des Pythagoras in zwei und drei Dimensionen definiert war. In zwei Dimensionen sagt uns dieser Satz, dass die Entfernung zwischen zwei Punkten (x, y) und (X, Y) beträgt. Die entsprechende Formel in drei Dimensionen sagt uns, dass die Entfernung zwischen drei Punkten (x, y, z) und (X, Y, Z) beträgt. Daher erscheint die Annahme vernünftig, dass die Entfernung zwischen zwei Quadrupeln (w, x, y, z) und (W, X, Y, Z) beträgt.
Wie sich herausgestellt hat, ist die resultierende Geometrie in sich widerspruchsfrei und der euklidischen Geometrie in vieler Hinsicht entsprechend. Bei diesem Thema werden die Grundkonzepte algebraisch mit Hilfe von Quadrupeln definiert, was sicherstellt, dass sie logisch Sinn ergeben. Anschließend werden sie in Analogie zu ähnlichen algebraischen Formeln in zwei und drei Dimensionen interpretiert, was ihnen ein gewisses geometrisches «Feeling» verleiht. Beispielsweise lauten die Koordinaten der Ecken eines Einheitsquadrats in der Ebene was alle möglichen Zweierkombinationen von null und eins sind. Die Koordinaten der Ecken eines Würfels im Raum lauten was alle möglichen Dreierkombinationen von null und eins sind. Analog definieren wir einen Hyperwürfel im vierdimensionalen Raum mit Hilfe der 16 möglichen Quadrupel von Nullen und Einsen.
Ein anderer üblicher Name für diese Form ist Tesserakt (siehe Kapitel [6]). Ausgehend von dieser Definition können wir das resultierende Objekt analysieren. Es erinnert stark an einen Würfel, nur ist es noch würfeliger. Beispielsweise setzt sich ein Würfel aus sechs miteinander verbundenen Quadraten zusammen; entsprechend setzt sich ein Hyperwürfel aus acht miteinander verbundenen Würfeln zusammen. Abbildung 30: Würfel. Links: Würfelprojektion in zwei Dimensionen. Rechts: Aufgefalteter Würfel, sodass die sechs quadratischen Seiten zu sehen sind. Weil der physikalische Raum jedoch dreidimensional ist, können wir leider kein exaktes Modell eines Hyperwürfels herstellen. Auf dieses Problem sind wir schon zuvor gestoßen: Wir können keinen exakten Würfel auf ein Blatt Papier zeichnen. Vielmehr zeichnen wir eine Projektion, wie ein Fotograf oder ein Maler, der ein dreidimensionales Objekt auf einem flachen Stück Papier bzw. einer ebenen Leinwand abbildet. Im Übrigen bleibt uns nur die Möglichkeit, einen Würfel entlang seiner Kanten aufzuschneiden und auseinanderzufalten, sodass wir eine flache Form erhalten, die aus sechs kreuzförmig angeordneten Quadraten besteht.
Abbildung 31: Hyperwürfel. Links: Hyperwürfelprojektion in zwei Dimensionen. Rechts: Auseinandergefaltet, sodass die acht würfelförmigen «Seiten» zu sehen sind. Die Nullen und Einsen bezeichnen die Koordinaten. Mit einem Hyperwürfel können wir ähnlich verfahren. Wir können ihn als Modell in den dreidimensionalen Raum projizieren oder als Liniendiagramm in die Ebene. Oder wir können ihn «aufklappen», sodass seine acht würfelförmigen «Seiten» zu sehen sind. Ich gestehe, dass es mir schwerfällt, mir vorzustellen, wie die Würfel sich im vierdimensionalen Raum «zusammenklappen»; die Liste der Koordinaten des Hyperwürfels sagt jedoch, dass sie genau das tun.
Abbildung 32: Dalís Crucifixion (Corpus Hypercubus).
Der Altmeister der surrealen Malerei, Salvador Dalí, stellte in mehreren seiner Werke einen ähnlichen aufgeklappten Hyperwürfel dar: Am bekanntesten ist wohl sein Gemälde Crucifixion (Corpus Hypercubus), das er 1954 schuf.
Die Hypotenuse des Pythagoras Pythagoreische Dreiecke haben einen rechten Winkel und ganzzahlige Seiten. Das einfachste hat als längste Seite 5, die anderen Seiten sind 4 und 3. Es gibt 5 regelmäßige Körper. Die Gleichung 5. Grades, in der die Unbekannte in der 5. Potenz auftritt, lässt sich durch das Ziehen von fünften Wurzeln – oder anderen Wurzeln – nicht lösen. Gitter in der Ebene und im dreidimensionalen Raum haben keine fünffache Rotationssymmetrie, daher kommen solche Symmetrien in Kristallen nicht vor. Sie können jedoch bei Gittern in vier Dimensionen auftreten, in seltsamen Strukturen, die man als Quasikristalle bezeichnet. Die Hypotenuse des kleinsten pythagoreischen Tripels Der Satz des Pythagoras besagt, dass die längste Seite eines rechtwinkligen Dreiecks (die berüchtigte Hypotenuse) mit den beiden anderen Seiten in
einem wunderbar einfachen Zusammenhang steht: Das Quadrat der Hypotenuse ist gleich der Summe der Quadrate der beiden anderen Seiten. Traditionell wird dieser Satz nach Pythagoras benannt, doch seine Geschichte ist undurchsichtig. Tontafeln sprechen dafür, dass die alten Babylonier den Satz des Pythagoras schon lange vor Pythagoras kannten; er streicht den Ruhm nur deshalb ein, weil er eine mathematische Sekte gründete, die Pythagoreer, die glaubten, das Universum beruhe auf mathematischen Mustern. Antike Schriftsteller schrieben den Pythagoreern – und in Erweiterung Pythagoras – eine Vielzahl mathematischer Sätze zu, aber wir wissen nicht genau, welche mathematischen Erkenntnisse auf Pythagoras selbst zurückgehen. Wir wissen nicht einmal, ob die Pythagoreer den «Satz des Pythagoras» tatsächlich beweisen konnten oder einfach nur glaubten, er sei wahr. Oder ob sie – und das ist am wahrscheinlichsten – überzeugende Belege für den Satz hatten, die dennoch für einen Beweis, wie wir ihn heute verstehen, nicht ausreichten. Der Satz des Pythagoras: Beweise Der erste bekannte Beweis für den Satz des Pythagoras findet sich in Euklids Elementen. Er ist ziemlich kompliziert und dreht sich um ein Diagramm, das bei viktorianischen Schuljungen als die «Hosen des Pythagoras» bekannt war, weil es an Unterwäsche, aufgehängt an einer Wäscheleine, erinnerte. Inzwischen kennen wir buchstäblich hunderte anderer Beweise, von denen die meisten den Satz viel klarer machen.
Abbildung 33: Die Hosen des Pythagoras. Einer der einfachsten Beweise ist eine Art mathematisches Puzzle. Man nehme ein beliebiges rechtwinkliges Dreieck, mache vier Kopien und ordne sie innerhalb eines Quadrats an. In einer Anordnung sehen wir das Quadrat über der Hypotenuse, in der anderen sehen wir beide Quadrate über den anderen beiden Seiten. Die betreffenden Flächen sind zweifellos identisch.
Abbildung 34: Links: Das Quadrat über der Hypotenuse (plus vier Dreiecke). Rechts: Die Quadrate über den beiden anderen Seiten (plus vier Dreiecke). Nun entfernen Sie die Dreiecke. Ein weiterer Puzzle-Beweis geht auf Henry Perigal zurück:
Abbildung 35: Die Perigal-Zerlegung Es gibt auch einen Beweis, der auf einem Kachelmuster beruht. Durchaus möglich, dass die Pythagoreer oder einer ihrer unbekannten Vorgänger das Theorem entdeckten. Wenn man sich anschaut, wie ein schräges Quadrat mit den beiden anderen überlappt, kann man erkennen, wie man das große Quadrat so zerlegen kann, dass sich die Teile zu den beiden kleineren Quadraten zusammenfügen lassen. Man kann auch rechtwinklige Dreiecke erkennen, deren Seiten die drei Quadratgrößen ergeben.
Abbildung 36: Beweis durch Kachellegen. Es gibt raffinierte Beweise, bei denen ähnliche Dreiecke und Trigonometrie eingesetzt werden. Wir kennen mindestens 50 Beweise dieser Art. Pythagoreische Tripel Der Satz des Pythagoras war der Ausgangspunkt für eine fruchtbare Idee in der Zahlentheorie: Man finde ganzzahlige Lösungen für algebraische Gleichungen. Ein pythagoreisches Tripel ist eine Liste von drei ganzen Zahlen a, b, c, für die gilt:
Geometrisch definiert das Tripel ein rechtwinkliges Dreieck, dessen Seiten alle eine ganzzahlige Länge haben. Die kleinste Hypotenuse in einem pythagoreischen Tripel ist 5. Die beiden anderen Seiten haben die Länge 3 und 4. Hier gilt: Die nächstkleinste Hypotenuse ist 10, denn Dabei handelt es sich jedoch im Grunde um das gleiche Dreieck, nur dass alle Seiten verdoppelt wurden. Die nächstkleinste, wirklich verschiedene Hypotenuse ist 13, denn Euklid wusste, dass es unendlich viele wirklich unterschiedliche pythagoreische Tripel gibt, und er gab eine Art Formel an, um sie alle zu finden. Später gab Diophant von Alexandria ein einfaches Rezept an, das im Grunde auf Euklids Formel hinausläuft. Man nehme zwei beliebige ganze Zahlen und bilde das Doppelte ihres Produkts die Differenz zwischen ihren Quadraten die Summe ihrer Quadrate
Dann sind die resultierenden drei Zahlen die drei Seiten eines pythagoreischen Dreiecks. Nehmen wir beispielsweise die Zahlen 2 und 1. Dann beträgt das Doppelte ihres Produkts = 2 × 2 × 1 = 4 2 2 die Differenz zwischen ihren Quadraten = 2 – 1 = 3 2 2 die Summe ihrer Quadrate = 2 + 1 = 5 und wir erhalten das berühmte 3-4-5-Dreieck. Wenn wir stattdessen die Zahlen 2 und 3 wählen, erhalten wir das Doppelte ihres Produkts = 2 × 3 × 2 = 12 2 2 die Differenz zwischen ihren Quadraten = 3 – 2 = 5 2 2 die Summe ihrer Quadrate = 3 + 2 = 13 und damit das nächstberühmte 5-12-13-Dreick. Sollten wir uns hingegen für die Zahlen 42 und 23 entscheiden, erhalten wir das Doppelte ihres Produkts = 2 × 42 × 23 = 1932 2 2 die Differenz zwischen ihren Quadraten = 42 – 23 = 1235 2 2 die Summe ihrer Quadrate = 42 + 23 = 2293 und niemand hat jemals von dem 1235-1932-2293-Dreieck gehört. Aber diese Zahlen funktionieren tatsächlich: Es gibt noch einen letzten Dreh bei Diophants Regel, auf den schon hingewiesen wurde: Wenn wir diese drei Zahlen bestimmt haben, können
wir eine beliebige andere Zahl wählen und alle drei damit multiplizieren. Daher lässt sich das 3-4-5-Dreieck durch Multiplikation aller drei Zahlen mit 2 in ein 6-8-10-Dreieck umwandeln, oder durch Multiplikation aller drei Zahlen mit 5 in ein 15-20-25-Dreieck. Algebraisch ausgedrückt nimmt die Regel diese Form an: Seien u, v und k ganze Zahlen. Dann hat das rechtwinklige Dreieck mit den Seiten die Hypotenuse Es gibt alternative Möglichkeiten, um die Grundidee auszudrücken, aber alle laufen auf diese Darstellung hinaus. Sie ergibt sämtliche pythagoreischen Tripel. Regelmäßige Körper Es gibt genau fünf regelmäßige Körper. Ein regelmäßiger Körper (oder Polyeder) ist eine geometrische Form mit endlich vielen flachen (das heißt planaren) Seitenflächen. Die Flächen treffen sich an Linien, die man als Ränder oder Kanten bezeichnet; die Kanten wiederum treffen sich in Punkten, die als Ecken bezeichnet werden. Der Höhepunkt von Euklids Elementen ist ein Beweis, dass es genau fünf regelmäßige Polyeder gibt, also solche, bei denen jede Seitenfläche ein
regelmäßiges Vieleck ist (gleiche Seiten, gleicher Winkel), alle Seitenflächen identisch sind, und jeder Eckpunkt von genau derselben Anordnung von Seitenflächen umgeben ist. Die fünf regelmäßigen Polyeder (auch platonische Körper genannt) sind: Das Tetraeder mit 4 dreieckigen Seitenflächen, 4 Ecken und 6 Kanten («Dreieckspyramide») Der Würfel oder das Hexaeder mit 6 quadratischen Seitenflächen, 8 Ecken und 12 Kanten Das Oktaeder mit 8 dreieckigen Seitenflächen, 6 Ecken und 12 Kanten Das Dodekaeder mit 12 fünfeckigen Seitenflächen, 20 Ecken und 30 Kanten Das Ikosaeder mit 20 dreieckigen Seitenflächen, 12 Ecken und 30 Kanten Abbildung 37: Die fünf regelmäßigen oder platonischen Körper. Die regelmäßigen Körper tauchen auch in der Natur auf. Im Jahr 1904 veröffentlichte der deutsche Zoologe Ernst Haeckel Zeichnungen winziger Einzeller, sogenannter Strahlentierchen oder Radiolarien, in deren Schalenbau sich alle fünf regelmäßigen Körper wiederfinden ließen. Vielleicht hat er die Natur dabei jedoch ein wenig «geschönt», sodass es
sich möglicherweise nicht um genuine Darstellungen lebender Geschöpfe handelt. Die ersten drei dieser Körper tauchen auch in Kristallen auf. Das Dodekaeder und das Ikosaeder tun dies nicht, auch wenn man gelegentlich unregelmäßige Dodekaeder findet. Echte Dodekaeder können in Quasikristallen auftreten, die Kristallen ähneln, wenn man davon absieht, dass ihre Atome kein periodisches Gitter bilden.

Abbildung 38: Haeckels Zeichnungen von Radiolarien, die wie regelmäßige Körper geformt sind. Abbildung 39: Auffaltungen von regelmäßigen Körpern. Es macht Spaß, Modelle der regelmäßigen Körper aus Karton zu basteln, indem man einen verbundenen Satz von Seitenflächen ausschneidet, den man als Auffaltung der Körper bezeichnet, die Flächen entsprechend faltet und die Kanten zusammenklebt. Es hilft, wenn man eine Kante eines jeden solchen Paares, wie in der Abbildung gezeigt, mit Laschen versieht, auf die der Kleber aufgetragen werden kann. Man kann aber auch mit Tesafilm arbeiten. Gleichungen 5. Grades
Es gibt keine algebraische Formel, um Gleichungen 5. Grades (quintische Gleichungen) zu lösen. Die allgemeine Gleichung 5. Grades sieht so aus: Das Problem besteht darin, eine Formel für die Lösungen (es können bis zu fünf sein) zu finden. Erfahrungen mit quadratischen, kubischen, quartischen und quintischen Gleichungen sprachen dafür, dass es eine Formel zur Lösung quintischer Gleichungen geben sollte, und zwar wahrscheinlich eine, bei der 5. Wurzeln, Kubikwurzeln und Quadratwurzeln eine Rolle spielen. Und man konnte jede Wette eingehen, dass eine solche Formel in der Tat sehr kompliziert sein würde. Diese Erwartung stellte sich jedoch als falsch heraus. Tatsächlich gibt es keinerlei Formel, zumindest keine, die aus den Koeffizienten a, b, c, d, e und f unter Zuhilfenahme von Addition, Subtraktion, Multiplikation und Division nebst Wurzelziehen gebildet wird. Daher ist an der Zahl 5 etwas wirklich Besonderes. Die Gründe für dieses ungewöhnliche Verhalten sind recht tiefgehend, und es hat lange gedauert, sie zu klären. Das erste Anzeichen, dass es Schwierigkeiten gab, war, dass es Mathematikern nicht gelang, eine solche Formel zu finden, ganz gleich, wie sehr sie sich bemühten und wie clever sie vorgingen. Eine Zeit lang wurde allgemein angenommen, dieses Versagen liege daran, dass die Formel so ungemein kompliziert war, dass niemand die Algebra richtig handhaben konnte. Aber schließlich begannen einige Mathematiker sich zu fragen, ob eine solche Formel überhaupt existiert. Im Jahr 1823 gelang es Niels Henrik
Abel schließlich zu beweisen, dass dies nicht der Fall ist. Kurz darauf fand Évariste Galois einen Weg, zu entscheiden, ob eine Gleichung gleich welchen Grades – 5., 6., 7. oder was auch immer – lösbar ist, indem er diese Art Untersuchung benutzte. Das Fazit ist, dass die Zahl 5 besonders ist. Man kann algebraische Gleichungen 1., 2., 3. und 4. Grades lösen (indem man n-te Wurzeln für verschiedene Werte von n zieht), aber keine Gleichung 5. Grades. Das scheinbare Muster kommt hier abrupt zum Stehen. Nicht überraschend sind Gleichungen höheren Grades als 5 noch schlimmer, und vor allem leiden sie unter demselben Problem: Es gibt keine Lösungsformel. Das heißt nicht, dass keine Lösungen existieren, und es bedeutet auch nicht, dass es unmöglich ist, sehr genaue numerische Lösungen zu finden. Darin drückt sich lediglich eine Beschränkung des traditionellen Instrumentariums der Algebra aus. Man kann die Sache mit der Dreiteilung des Winkels vergleichen: Die ist durchaus möglich, gelingt aber nicht mit Zirkel und Lineal. Die Antwort existiert zwar, doch die gewählten Methoden sind unzureichend, um die Lösung zu finden. Kristallographische Restriktion Kristalle in zwei oder drei Dimensionen weisen keine fünffachen Rotationssymmetrien auf. Die Atome in einem Kristall bilden ein Gitter, also eine Struktur, die sich periodisch in mehreren, voneinander unabhängigen Richtungen wiederholt. Das Muster auf einer Tapete wiederholt sich zum Beispiel in der
Längsrichtung der Papierrolle, aber gewöhnlich wiederholt es sich auch seitwärts, wobei es beim Übergang zum benachbarten Tapetenstück manchmal zu einem «Sprung» kommt. Tapete ist tatsächlich eine Art zweidimensionaler Kristall. Es gibt in der Ebene 17 verschiedene Typen oder Gruppen von Tapetenmustern (siehe Kapitel [17]). Sie unterscheiden sich durch ihre Symmetrien, die verschiedene Möglichkeiten darstellen, das Muster starr zu bewegen und dabei wieder mit sich zur Deckung zu bringen. Zu diesen Symmetrien gehören Rotationssymmetrien, bei denen das Muster um einen gewissen Punkt, das Rotationszentrum, und einen gewissen Winkel gedreht wird. Die Ordnung einer Rotationssymmetrie gibt an, wie oft man die jeweilige Drehung durchführen muss, um zum Ausgangspunkt zurückzukehren. So hat eine Rotation um 90° beispielsweise die Ordnung 4. Die Liste der möglichen Symmetrietypen für Rotationen eines Kristallgitters zeigt eine Kuriosität der Zahl 5: Eine solche Rotationssymmetrie gibt es nämlich nicht. Es gibt Muster mit Rotationssymmetrien 2., 3., 4. und 6. Ordnung, aber kein Tapetenmuster hat eine Rotationssymmetrie 5. Ordnung. Es gibt auch keine Rotationssymmetrien oberhalb der 6. Ordnung, doch die erste Lücke tritt bei 5 auf. Dasselbe gilt für kristallographische Muster im dreidimensionalen Raum. Nun wiederholt sich das Gitter in drei unabhängigen Richtungen. Es gibt 219 unterschiedliche Symmetrietypen oder 230, falls man das Spiegelbild eines Musters als eigenständig betrachtet, wenn das betreffende Muster keine Spiegelsymmetrie hat. Wiederum sind die möglichen Ordnungen der Rotationssymmetrie 2, 3, 4 und 6, während 5 auch in diesem Fall wegfällt.
Diese Tatsache bezeichnet man als kristallographische Einschränkung oder Restriktion. In der vierten Dimension gibt es hingegen Gitter mit Symmetrien 5. Ordnung, und für Gitter in genügend hohen Dimensionen ist jede beliebige Ordnung möglich.
Abbildung 40: Kristallgitter von Kochsalz. Dunkle Kugeln: Natriumatome. Helle Kugeln: Chloratome. Quasikristalle Auch wenn es eine Rotationssymmetrie 5. Ordnung in zwei- oder dreidimensionalen Gittern nicht gibt, kann sie in etwas weniger streng geordneten Strukturen, sogenannten Quasikristallen, vorkommen. Angeregt durch einige Skizzen des Astronomen Johannes Kepler, entdeckte der Mathematiker Roger Penrose in der Ebene Muster mit einer erweiterten Form einer fünffachen Symmetrie. Sie werden als Quasikristalle bezeichnet. Abbildung 41: Links: Eines der beiden Quasikristallmuster mit einer exakten fünffachen Symmetrie. Rechts: Atomares Modell eines ikosaedrischen Aluminium-Palladium-ManganQuasikristalls.
Quasikristalle kommen in der Natur vor. Im Jahr 1984 entdeckte Daniel Schechtman, dass eine Legierung von Mangan und Aluminium ein Quasikristall bilden kann, und nach anfänglicher Skepsis unter Kristallographen erhielt er, nachdem sich seine Entdeckung als korrekt herausstellte, 2011 den Nobelpreis für Chemie. Im Jahr 2009 fand ein Team unter der Leitung von Luca Bindi Quasikristalle in einem Mineral aus dem russischen Korjakengebirge, eine Verbindung aus Aluminium, Kupfer und Eisen. Das Mineral trägt inzwischen den Namen Icosahedrit. Mit Hilfe von massenspektrometrischen Analysen konnten die Forscher die Anteile verschiedener Sauerstoffisotope bestimmen und zeigen, dass das Mineral nicht von der Erde stammt. Es hatte sich vor rund 4,5 Milliarden Jahren gebildet, also zu einer Zeit, als unser Sonnensystem entstand, und war einen Großteil der Zwischenzeit im Asteroidengürtel gekreist, bevor seine Umlaufbahn gestört wurde und es schließlich als Meteorit zur Erde fiel.
Kusszahlen Die kleinste Zahl, die gleich der Summe aller ihrer echten Teiler ist: 6 = 1 + 2 + 3. Die Kusszahl in der Ebene ist 6. Waben werden aus Sechsecken gebildet – regelmäßigen sechsseitigen Polygonen. Es gibt 6 regelmäßige vierdimensionale Polytope, analog den regelmäßigen platonischen Körpern. Die kleinste vollkommene Zahl Die alten Griechen unterschieden drei Typen von ganzen Zahlen aufgrund ihrer Teiler: Abundante Zahlen, bei denen die Summe der «echten» Teiler (das heißt, unter Ausschluss der Zahl selbst) größer ist als die Zahl selbst. Defiziente Zahlen, bei denen die Summe der echten Teiler kleiner ist als die Zahl selbst.
Vollkommene oder perfekte Zahlen, bei denen die Summe der echten Teiler ebenso groß ist wie die Zahl selbst. Die ersten Zahlen sind in Tabelle 7 angegeben. Diese Tabelle zeigt, dass alle drei Typen vorkommen, aber sie deutet auch darauf hin, dass defiziente Zahlen häufiger sind als die beiden anderen Typen. Im Jahr 1998 bewies Marc Deléglise eine präzise Form dieser Behauptung: Wenn n beliebig groß wird, strebt der Anteil der defizienten Zahlen zwischen 1 und n gegen eine Konstante zwischen 0,7526 und 0,7520, während der Anteil der abundanten Zahlen zwischen 0,2474 und 0,2480 liegt. 1955 hatte Hans-Joachim Kanold bereits bewiesen, dass der Anteil der vollkommenen Zahlen gegen 0 strebt. Daher sind rund drei Viertel aller Zahlen defizient, und ein Viertel ist abundant. Kaum eine Zahl ist vollkommen. Zahl Summe der echten Teiler Typ 1 0 [keine echten Teiler] defizient 2 1 defizient 3 1 defizient 4 1+2=3 defizient 5 1 defizient 6 1+2+3=6 vollkommen 7 1 defizient 8 1+2+4=7 defizient 9 1+3=4 defizient 10 1+2+5=8 defizient
11 1 defizient 12 1 + 2 + 3 + 4 + 6 = 16 abundant 13 1 defizient 14 1+7=8 defizient 15 1+3+5=9 defizient Tabelle 7 Die ersten beiden vollkommenen oder perfekten Zahlen sind Daher ist 6 die kleinste vollkommene Zahl. Die kleinste abundante Zahl ist 12. Die antiken Mathematiker fanden die nächsten beiden vollkommenen Zahlen, 28 und 496. Um 100 n. Chr. hatte Nikomachus die vierte gefunden, nämlich 8128. Um 1460 tauchte die fünfte, 33550336, in einem anonymen Manuskript auf. Im Jahr 1588 entdeckte Pietro Cataldi die sechste und die siebte vollkommene Zahl: 8589869056 und 137438691328. Lange zuvor hatte Euklid bereits eine Regel angegeben, wie man n vollkommene Zahlen findet. In moderner Schreibweise besagt sie: Wenn 2 n–1 – 1 prim ist, dann ist 2 n (2 – 1) vollkommen. Die Zahlen oben n korrespondieren mit n = 2, 3, 5, 7, 13, 17 und 19. Primzahlen der Form 2 – 1 werden nach dem Mönch Marin Mersenne als Mersenne-Primzahlen 57 885 161 bezeichnet (siehe Kapitel [2 – 1]).
Leonhard Euler bewies, dass jede gerade vollkommene Zahl diese Form hat. Seit wenigstens 2500 Jahren ist es Mathematikern jedoch nicht gelungen, eine ungerade vollkommene Zahl zu finden oder aber zu beweisen, dass es eine solche Zahl nicht gibt. Falls eine solche Zahl existiert, so muss sie mindestens 1500 Ziffern und mindestens 101 Primfaktoren haben, von denen mindestens neun verschieden sind. Ihr größter Primfaktor muss neun oder mehr Ziffern haben. Kusszahl Die Kusszahl in der Ebene ist die größte Anzahl von Kreisen einer gegebenen Größe, die einen Kreis derselben Größe berühren können. Sie ist gleich 6.
Abbildung 42: Die Kusszahl in der Ebene beträgt 6. Der Beweis erfordert lediglich ein wenig elementare Geometrie. Die Kusszahl im dreidimensionalen Raum ist gleich der größten Anzahl von Kugeln einer gegebenen Größe, die eine Kugel derselben Größe berühren können. Sie ist gleich 12 (siehe Kapitel [12]). In diesem Fall ist der Beweis viel komplizierter, und lange Zeit war nicht bekannt, ob 13 Kugeln funktionieren würden. Waben
Waben werden aus sechseckigen «Kacheln» gebildet, die perfekt zusammenpassen und eine Ebene auslegen («parkettieren») können (siehe Kapitel [3]). Der Honigwaben-Vermutung (Honeycomb Conjecture) zufolge bietet das Wabenmuster die beste Möglichkeit, die Ebene in Gebiete mit jeweils gleichem Flächeninhalt aufzuteilen, die den Gesamtumfang minimieren. Diese Hypothese wurde bereits in der Antike aufgestellt, zum Beispiel von dem römischen Gelehrten Marcus Terentius Varro 36 v. Chr. Sie könnte sogar bis auf den griechischen Geometer Pappos von Alexandria rund 325 v. Chr. zurückdatieren. Abbildung 43: Links: Parkettierung mit regelmäßigen Sechsecken. Rechts: Bienenwaben. Die Honigwaben-Vermutung ist inzwischen ein Satz geworden: Thomas Hale bewies sie 1999. Zahl vierdimensionaler Polytope
Die alten Griechen bewiesen, dass es in drei Dimensionen genau fünf regelmäßige Körper gibt (siehe Kapitel [5]). Wie sieht es mit Räumen aus, die nicht dreidimensional sind? Erinnern Sie sich aus Kapitel 4 daran, dass wir mit Hilfe von Koordinaten mathematische Räume mit beliebig vielen Dimensionen definieren können. Insbesondere der vierdimensionale Raum umfasst alle Quadrupel (x, y, z, w) reeller Zahlen. In diesen Räumen gilt ein natürliches Entfernungskonzept, das auf der offensichtlichen Analogie zum Satz des Pythagoras basiert, daher können wir problemlos Begriffe wie Länge, Winkel, Kugel, Zylinder, Kegel und so weiter gebrauchen. Daher ist die Frage sinnvoll, wie die Analoga der regelmäßigen Körper in der vierten oder in noch höheren Dimensionen aussehen. Die Antwort ist überraschend. In zwei Dimensionen gibt es unendlich viele regelmäßige Polygone: eines für jede ganze Zahl von Seiten, von drei aufwärts. In fünf und mehr Dimensionen existieren nur drei regelmäßige Polytope, wie sie genannt werden; sie sind dem Tetraeder, dem Würfel und dem Oktaeder analog. Im vierdimensionalen Raum gibt es jedoch sechs regelmäßige Polytope. Die ersten drei Polytope in der Tabelle sind Analoga von Tetraeder, Würfel und Oktaeder. Der 5-Zeller wird auch als 4-Simplex oder Pentatop bezeichnet, der 8-Zeller ist ein 4-Hyperwürfel oder Tesserakt, und der 16Zeller ist ein 4-Orthoplex. Die anderen drei Polytope sind spezifisch für den vierdimensionalen Raum. Den 24-Zeller findet man auch als Hyperdiamant bezeichnet. Name Zellen Flächen Kanten Ecken 5-Zeller 5 Tetraeder 10 10 5 8-Zeller 8 Würfel 24 32 16
16-Zeller 16 Tetraeder 32 24 8 24-Zeller 24 Oktaeder 96 96 24 120-Zeller 120 Dodekaeder 720 1200 600 600-Zeller 600 Tetraeder 720 120 1200 Tabelle 8 Da wir kein vierdimensionales Papier haben, werde ich mich damit zufriedengeben müssen, Ihnen zu zeigen, wie diese Objekte aussehen, wenn man sie in die Ebene projiziert. Abbildung 44: Die sechs regelmäßigen Polytope, in die Ebene projiziert. Von links nach rechts und von oben nach unten: 5-Zeller, 8-Zeller, 16-Zeller, 24-Zeller, 120-Zeller, 600Zeller.
Ludwig Schläfli klassifizierte die regelmäßigen Polytope. Einen Teil seiner Ergebnisse publizierte er 1855 und 1858, und der Rest erschien 1901 posthum. Zwischen 1880 und 1900 kamen neun andere Mathematiker unabhängig zu ähnlichen Ergebnissen. Zu ihnen gehörte Alicia Boole Stott, eine der Töchter des Mathematikers und Logikers George Boole, der als Erster den Begriff «Polytop» verwendete. Sie zeigte von früher Kindheit an ein intuitives Verständnis für vierdimensionale Geometrie, vielleicht deshalb, weil ihre ältere Schwester Mary den Mathematiker Charles Howard Hinton heiratete, einen Exzentriker mit schillernder Persönlichkeit (er wurde wegen Bigamie verurteilt), der eine Leidenschaft für die Visualisierung des vierdimensionalen Raumes hatte. Alicia nutzte diese Fähigkeit, um allein mit rein euklidischen Methoden zu zeigen, wie Querschnitte der Polytope aussehen: Es handelt sich um komplexe, höchst symmetrische regelmäßige Körper.
Die vierte Primzahl Die Zahl 7 ist die vierte Primzahl und gut geeignet zu erklären, wozu Primzahlen dienen können und warum sie so interessant sind. Primzahlen tauchen bei den meisten Problemen auf, bei denen ganze Zahlen miteinander multipliziert werden. Sie sind eine Art Bausteine für alle ganzen Zahlen. Wie wir in Kapitel 1 gesehen haben, ist jede ganze Zahl größer 1 entweder prim oder lässt sich durch die Multiplikation von zwei oder mehr Primzahlen erhalten. Die Zahl 7 ist auch mit einem altbekannten Problem über Fakultäten verknüpft. Und es ist die kleinste Zahl von Farben, die nötig ist, um sämtliche Karten auf einem Torus so einzufärben, dass benachbarte Regionen unterschiedliche Farben tragen. Faktoren finden
Im Jahr 1801 schrieb Carl Friedrich Gauß, der führende Zahlentheoretiker seiner Tage und einer der herausragenden Mathematiker aller Zeiten, ein fortschrittliches Lehrbuch über Zahlentheorie, die Disquisitiones Arithmeticae. Zwischen all den ausgesuchten Themen wies er darauf hin, dass zwei grundlegende Dinge von entscheidender Bedeutung sind: «Dass das Problem, die Primzahlen von den zusammengesetzten zu unterscheiden und Letztere in ihre Primfaktoren zu zerlegen, zu den wichtigsten und nützlichsten der ganzen Arithmetik gehört und den Fleiß und die Weisheit der Geometer der Antike und der Neuzeit beschäftigt hat, ist so bekannt, dass es überflüssig ist, viel darüber zu sagen.» Die offensichtlichste Methode, beide Probleme zu lösen, besteht darin, alle möglichen Faktoren nacheinander durchzuprobieren. Um beispielsweise zu sehen, ob 35 eine Primzahl ist, und ihre Faktoren zu finden, wenn dies nicht der Fall ist, gehen wir folgendermaßen vor: Daher ist 35 = 5 × 7, und da 7 eine Primzahl ist, vervollständigt dies die Faktorisierung. Dieses Verfahren lässt sich etwas effizienter gestalten. Wenn wir bereits über eine Liste von Primzahlen verfügen, müssen wir nur Primteiler durchprobieren. Nachdem wir zum Beispiel festgestellt haben, dass 2 die Zahl 35 nicht ohne Rest teilt, wissen wir sofort, dass 4 sie ebenfalls nicht
ohne Rest teilt. Das ist so, weil 2 ein Teiler von 4 ist, daher teilt 2 alles, was auch durch 4 teilbar ist. (Dasselbe gilt für 6, 8 und alle anderen geraden Zahlen.) Wir können zudem aufhören, nach weiteren Teilern zu suchen, wenn wir die Quadratwurzel der betreffenden Zahl erreichen. Warum? Ein typischer Fall ist die Zahl 4283, deren Quadratwurzel ungefähr gleich 65,44 ist. Wenn wir zwei Zahlen multiplizieren, die größer sind als diese Zahl, muss das Ergebnis größer als 65,44 × 65,44 sein, was 4283 ergibt. Ganz gleich, wie wir 4283 daher in zwei (oder mehr) Faktoren zerlegen, zumindest einer von ihnen ist kleiner oder gleich der betreffenden Quadratwurzel. Tatsächlich muss er kleiner oder gleich 65 sein, die Zahl, die wir erhalten, wenn wir alles nach dem Dezimalkomma in der Quadratwurzel einfach ignorieren. Wir können daher alle Faktoren von 4283 finden, indem wir die Primzahlen zwischen 2 und 65 testen. Wenn irgendeiner dieser Faktoren 4283 glatt teilte, würden wir nach Durchführung dieser Teilung fortfahren, das Ergebnis in Faktoren zu zerlegen – aber das ist dann eine kleinere Zahl als 4283. Wie sich herausstellt, gibt es keine Primzahl bis 65, die 4283 teilt. 4283 ist daher prim. Wenn wir dasselbe Verfahren anwenden, um 4183 in Faktoren zu zerlegen, wobei deren Quadratwurzel 64,67 ist, müssen wir alle Primzahlen bis 64 durchprobieren. Nun teilt die Primzahl 47 die Zahl 4183 ohne Rest: Wie sich herausstellt, ist 89 prim. Tatsächlich wissen wir das bereits, weil 4183 sich nicht durch 2, 3, 5 und 7 teilen lässt. Daher ist 89 nicht durch 2,
3, 5 und 7 teilbar, aber das sind die einzigen Primzahlen bis zu ihrer Quadratwurzel, die 9,43 beträgt. Daher haben wir die Primfaktorisierung 4183 = 47 × 89 gefunden. Dieses Verfahren ist zwar einfach, für große Zahlen jedoch kaum geeignet. Um zum Beispiel die Faktoren von zu finden, müssten wir alle Primzahlen bis zu ihrer Quadratwurzel 105409255,3 durchprobieren. Das sind ziemlich viele Primzahlen – 6054855, um genau zu sein. Schließlich werden wir auf einen Primfaktor stoßen, nämlich 2071723, der zu der Faktorisierung führt, aber das würde per Hand eine ganze Weile dauern. Ein Computer kann das natürlich schneller erledigen, doch eine Grundregel bei solchen Berechnungen lautet: Wenn sich etwas bei mittelgroßen Zahlen per Hand nur schwer berechnen lässt, wird es bei genügend großen Zahlen auch für einen Computer sehr schwierig. Selbst ein Computer hat Probleme, eine systematische Suche wie diese durchzuführen, wenn die Zahl, um die es geht, 50 Ziffern statt 17 hat. Fermats kleiner Satz Zum Glück gibt es bessere Methoden. Es gibt effiziente Verfahren, um zu testen, ob eine Zahl prim ist, ohne sich die Faktoren anzuschauen. Generell sind diese Verfahren für Zahlen mit rund hundert Ziffern geeignet, auch
wenn der Schwierigkeitsgrad stark von der betreffenden Zahl abhängt und die Anzahl der Ziffern nur ein grober Richtwert ist. Im Gegensatz dazu kennen Mathematiker bisher keine raschen Methoden, die mit Garantie die Faktoren irgendeiner zusammengesetzten Zahl dieser Größe findet. Es würde reichen, nur einen einzigen Faktor zu finden, weil dieser als Teiler benutzt und der Prozess dann wiederholt werden kann, aber im schlimmsten Fall nimmt dieser Prozess viel zu viel Zeit in Anspruch, um praktikabel zu sein. Primzahltests beweisen, dass eine Zahl zusammengesetzt ist, ohne irgendeinen ihrer Faktoren zu finden. Ein solcher Test zeigt lediglich, dass sie den Primzahltest nicht besteht. Primzahlen haben spezielle Eigenschaften, und wir können überprüfen, ob eine bestimmte Zahl diese Eigenschaften aufweist. Wenn nicht, kann sie keine Primzahl sein. Es erinnert ein wenig daran, wie man eine undichte Stelle in einem Ballon findet: Man bläst ihn auf und schaut, ob er seine Größe hält. Wenn nicht, gibt es eine undichte Stelle – aber der Test sagt uns nicht, wo sie sich befindet. Zu beweisen, dass es ein Leck gibt, ist einfacher, als zu sagen, wo es sich befindet. Dasselbe gilt für Faktoren. Der einfachste derartige Test ist Fermats kleiner Satz. Um ihn darzulegen, werden wir uns zunächst mit modularer Arithmetik beschäftigen, die manchmal auch als Modul- oder Uhren-Arithmetik bezeichnet wird, weil die Zahlen kreisförmig angeordnet sind, wie auf dem Zifferblatt einer Uhr. Man nehme eine Zahl – für die Analoguhr mit ihrer Zifferblatteinteilung in 12 Stunden ist es die 12 – und nennt sie das Modul. Bei jeder arithmetischen Berechnung mit ganzen Zahlen ist nun erlaubt, sämtliche Vielfache von 12 durch 0 zu ersetzen. Beispielsweise ist 5 × 5 =
25, aber 24 ist das Doppelte von 12, wenn wir daher 24 abziehen, erhalten wir 5 × 5 = 1 für den Modulus 12. Gauß führte die Modul-Arithmetik in seinen Disquisitiones Arithmeticae ein, und heutzutage findet sie in den Computerwissenschaften, der Physik und im Ingenieurwesen breite Verwendung. Das ist eine hübsche Sache, denn fast alle der üblichen Rechenregeln gelten auch in diesem Fall. Der Hauptunterschied ist, dass man nicht immer eine Zahl durch eine andere teilen kann, selbst wenn sie ungleich null ist. Diese Rechenweise ist zudem nützlich, weil sie eine saubere Möglichkeit bietet, Fragen über Teilbarkeit zu handhaben: Welche Zahlen lassen sich durch das gewählte Modul teilen, und wie groß ist der Rest, wenn sie nicht glatt teilbar sind? Fermats kleiner Satz besagt Folgendes: Wenn wir einen beliebigen Modulus p wählen, der eine Primzahl ist, und eine beliebige Zahl a nehmen, die kein Vielfaches von p ist, dann ist die (p – 1)-te Potenz von a in der Modul-Arithmetik zum Modulus p stets gleich 1. Setzen wir beispielsweise p = 17 und a = 3. Dann besagt der Satz, dass 1 16 als Rest bleibt, wenn wir 3 durch 17 teilen. Die Überprüfung erbringt: Niemand, der bei klarem Verstand ist, würde solche Berechnungen bei sehr großen Zahlen gern per Hand vornehmen. Zum Glück gibt es eine clevere und rasche Möglichkeit, derartige Berechnungen durchzuführen, indem man die Zahl wiederholt quadriert und geeignete Ergebnisse miteinander multipliziert.
Der entscheidende Punkt ist: Wenn die Antwort nicht gleich 1 ist, dann muss das Modul, von dem wir ausgegangen sind, eine zusammengesetzte Zahl sein. Daher bildet Fermats kleiner Satz die Grundlage eines effizienten Tests, der eine notwendige Bedingung darstellt, die erfüllt sein muss, wenn eine Zahl eine Primzahl ist. Und das tut der Test, ohne einen Faktor zu finden. Genau das könnte das der Grund dafür sein, dass er so praktikabel ist. Fermats kleiner Satz ist jedoch nicht narrensicher: Einige zusammengesetzte Zahlen bestehen den Test. Die kleinste ist 561. Im Jahr 2003 bewiesen Red Alford, Andrew Granville und Carl Pomerance, dass es unendlich viele Ausnahmen dieser Art gibt, die inzwischen als CarmichaelZahlen bekannt sind. Der effizienteste narrensichere Primzahltest, den wir gegenwärtig kennen, wurde von Leonard Adleman, Pomerance und Robert Rumely entwickelt. Dieser Test stützt sich auf Ideen aus der Zahlentheorie, die raffinierter sind als Fermats kleiner Satz, aber in dieselbe Richtung gehen. Im Jahr 2002 entdeckten Manindra Agrawal und seine Studenten Neeraj Kayal und Nitin Saxena einen Primzahltest, der im Prinzip schneller zum Ziel führt als der Adleman-Pomerance-Rumely-Test, weil er eine «polynomiale Laufzeit» hat. Wenn die Zahl n dezimale Ziffern aufweist, hat 12 der Algorithmus eine Laufzeit, die maximal zu n proportional ist. 7,5 Inzwischen wissen wir, dass sich die Laufzeit auf n reduzieren lässt. Der Vorteil dieses Algorithmus wird jedoch erst deutlich, wenn die Anzahl der 1000 Ziffern in n rund 10 beträgt. Allerdings bietet das bekannte Universum nicht genügend Platz, um eine Zahl derartiger Größe niederzuschreiben.
Primzahlen und Codes Primzahlen sind zu wichtigen Instrumenten in der Kryptographie geworden, der Wissenschaft von der Informationsverschlüsselung. Codes sind militärisch wichtig (siehe Kapitel [26]), aber auch Wirtschaftsunternehmen und Privatpersonen haben Geheimnisse. Wir wollen beispielsweise nicht, dass Kriminelle Zugang zu unseren Bankkonten oder zu unseren Kreditkartennummern erhalten, wenn wir das Internet benutzen. Der übliche Weg, dieses Risiko zu senken, besteht im Verschlüsseln: Die Information wird in einen Code umgesetzt. Das RSA-System, ein berühmter Code, der 1978 von Ted Rivest, Adi Shamir und Leonard Adleman entwickelt wurde, basiert auf Primzahlen – und zwar auf großen, rund hundert Ziffern langen. Das System hat die bemerkenswerte Eigenschaft, dass man die Art und Weise, wie eine Botschaft in einen Code umgewandelt wird, problemlos öffentlich machen kann. Was man für sich behält, ist, wie man den umgekehrten Weg findet – wie man die Botschaft also entschlüsselt. Dazu bedarf es einer zusätzlichen Information, die geheim gehalten wird. Jede Botschaft lässt sich leicht in eine Zahl verwandeln – beispielsweise dadurch, dass man jedem Buchstaben einen Code aus zwei Ziffern zuordnet und all diese Codes aneinanderfügt. Nehmen wir an, wir verwenden die Codes A = 01, B = 02 und so weiter, wobei Ziffern oberhalb von 27 für Satzzeichen und Zwischenräume verwendet werden können. Dann ließe sich das Wort BOTSCHAFT so verschlüsseln:
Ein Code ist eine Möglichkeit, eine gegebene Botschaft in eine andere Botschaft zu konvertieren. Aber da jede Botschaft eine Zahl ist, kann man sich einen Code als Weg vorstellen, eine gegebene Zahl in eine andere Zahl umzuwandeln. An dieser Stelle kommen Mathematiker ins Spiel, und sie können Ideen aus der Zahlentheorie einsetzen, um Codes zu schaffen. Beim RSA-System werden zunächst zwei Primzahlen p und q ausgewählt, jede mit, sagen wir, 100 Ziffern. Primzahlen dieser Größe lassen sich mit einem Primzahltest per Computer rasch finden. Man multipliziert beide und erhält pq. Die öffentlich bekannte Methode, Botschaften in Codes zu verwandeln, konvertiert die Botschaft in eine Zahl und führt dann eine Rechnung durch, die auf diesem Produkt pq basiert. (Die technischen Einzelheiten finden sich weiter unten.) Um den Code aber wieder in die eigentliche Botschaft zurückzuverwandeln, muss man p kennen (sodass sich auch q leicht errechnen lässt). Wenn man der Öffentlichkeit jedoch nicht erzählt, was p ist, dann kann sie die Botschaft nicht decodieren, es sei denn, jemand findet heraus, was p ist. Aber das erfordert die Faktorisierung von pq, einer Zahl mit 200 Ziffern, und wenn man p und q nicht wirklich schlecht gewählt hat, scheint das selbst mit dem leistungsfähigsten Supercomputer unserer Tage verlorene Liebesmüh zu sein. Wenn die Leute, die den Code entwickelt haben, p und q verlieren, befinden sie sich in derselben Lage wie alle übrigen: Sie stehen auf dem Schlauch.
Technische Einzelheiten Man wähle zwei große Primzahlen p und q. Man berechne n = pq und s = (p – 1)(q – 1). Man wähle eine Zahl e zwischen 1 und s, die teilerfremd mit s ist. (Es gibt eine sehr effiziente Methode, die gemeinsamen Teiler zweier Zahlen zu finden, den sogenannten euklidischen Algorithmus. Dieser datiert ins alte Griechenland zurück und taucht in Euklids Elementen auf. Siehe Professor Stewarts mathematische Detektivgeschichten. Man veröffentliche p und e. Man nenne e den öffentlichen Schlüssel. Die Modul-Arithmetik sagt uns nun, dass es eine eindeutige Zahl d zwischen 1 und s gibt, für die ein Rest 1 bleibt, wenn man de durch s teilt. Das heißt, de = 1(mod s). Man berechne diese Zahl d. Man halte p, q, s und d geheim. Man nenne d den privaten Schlüssel. Um eine Botschaft in einen Code umzuwandeln, stelle man sie, wie beschrieben, als Zahl m dar. Falls notwendig, zerlegt man eine lange Botschaft in Blöcke und verschickt alle Blöcke nacheinander. Anschließend e berechne man c = m (mod n). Das ist die codierte Botschaft, und sie kann an den Empfänger geschickt werden. Diese Verschlüsselungsregel kann man ohne Risiko publik machen. Und auf der Basis der binären Erweiterung von e lässt sich c rasch berechnen. Der Empfänger, der den privaten Schlüssel d kennt, kann die Botschaft d decodieren, indem er c (mod n) berechnet. Ein grundlegendes Theorem in der Zahlentheorie – eine geringfügige Erweiterung von Fermats kleinem Satz – besagt implizit, dass das Ergebnis mit der ursprünglichen Botschaft m identisch ist. Ein Spion, der versucht, die Botschaft zu entschlüsseln, muss d herausfinden, ohne s zu kennen. Das lässt sich auf die Kenntnis von p – 1
und q – 1 bzw. p und q zurückführen. Um diese Zahlen zu finden, muss der Spion n faktorisieren. Aber n ist so groß, dass dies nicht machbar ist. Codes diesen Typs werden als Falltür-Codes (trapdoor codes) bezeichnet, weil es leicht ist, durch eine Falltür zu fallen (die Botschaft in einen Code zu konvertieren), aber schwierig, wieder aus der Falle hinauszuklettern (die Botschaft zu decodieren), wenn man nicht spezielle Hilfe hat (den privaten Schlüssel). Mathematiker können nicht mit Sicherheit behaupten, dass dieser Code absolut unknackbar ist. Vielleicht gibt es eine rasche Möglichkeit, große Zahlen zu faktorisieren, und wir waren bisher nur noch nicht schlau genug, sie zu finden. (Möglicherweise lässt sich d auch noch auf eine andere Weise berechnen, aber sobald man d kennt, kann man p und q ausrechnen, daher würde dies auf eine effiziente Methode zum Auffinden von Faktoren herauslaufen.) Selbst wenn der Code theoretisch nicht knackbar ist, könnte ein Spion in der Lage sein, p und q auf anderem Weg in die Hände zu bekommen, sei es durch Einbruch oder Bestechung bzw. Erpressung einer Person, die das Geheimnis kennt. Das ist ein Problem bei jedem Geheimcode. In der Praxis wird das RSA-System für eine begrenzte Zahl wichtiger Botschaften verwendet, zum Beispiel, um jemandem den geheimen Schlüssel für eine einfachere Methode zur Verschlüsselung von Botschaften zu senden. Das Brocard-Problem Wenn man alle Zahlen von 1 bis n nimmt und sie miteinander multipliziert, erhält man «n Fakultät», geschrieben n!. Fakultäten geben an, wie viele
Möglichkeiten es gibt, n Objekte anzuordnen (siehe Kapitel [26!]). Die ersten Fakultäten sind: Wenn wir zu diesen Zahlen 1 addieren, erhalten wir: und wir erkennen drei dieser Zahlen als Quadratzahlen, nämlich Wir kennen keine weiteren derartigen Zahlen, doch es ist bisher nicht bewiesen, dass keine größere Zahl n in der Lage ist, n! + 1 zu einer perfekten Quadratzahl zu machen. Die Frage, welche Fakultäten Vorgänger zu Quadratzahlen sind, wird als das Brocard-Problem bezeichnet, weil sich Henri Brocard 1876 fragte, ob 7 die größte Zahl mit dieser Eigenschaft sei. Später vermutete Paul Erdős, die Antwort sei «nein». Im Jahr 2000 bewiesen Bruce Bernd und William Galway, dass es für n kleiner
1 Milliarde keine anderen Lösungen gibt. Und 1993 bewies Marius Overholt, dass es nur endlich viele Lösungen gibt, aber nur unter der Annahme, dass die sogenannte ABC-Vermutung richtig ist, ein wichtiges, bisher ungelöstes Problem der Zahlentheorie. (Siehe Ian Stewart: Die letzten Rätsel der Mathematik, S. 464) Eine siebenfarbige Karte auf einem Torus Percy Heawood arbeitete an einer Verallgemeinerung des Vierfarbensatzes (siehe Kapitel [4]) bei Karten auf komplizierteren Oberflächen. Die Frage, wie viele Farben man für eine Karte auf einer Kugel braucht, führt zur selben Antwort wie für die Ebene. Stellen Sie sich eine Karte auf einer Kugel vor und drehen Sie diese, bis der Nordpol irgendwo im Inneren eines Gebiets liegt. Wenn man in den Nordpol ein Loch bohrt, kann man die angestochene Kugel öffnen und auseinanderziehen und erhält so einen Raum, der topologisch einer unendlichen Ebene äquivalent ist. Das Gebiet, das den Pol enthielt, wird dann zu einem unendlich großen «Rand», der alle anderen Länder umschließt. Es gibt jedoch andere, interessantere Oberflächen, wie den Torus, der wie ein Schwimmreifen oder ein Doughnut mit einem Loch geformt ist, sowie Oberflächen mit mehreren derartigen Löchern.
Abbildung 45: Torus sowie ein Torus mit zwei bzw. mit drei Löchern. Es gibt ein nützliches Verfahren zur bildlichen Darstellung eines Torus, das das Leben oft einfacher macht. Wenn wir den Torus entlang zweier geschlossener Kurven aufschneiden, können wir ihn zu einem Quadrat öffnen. Abbildung 46: Ein aufgeschnittener Torus lässt sich zu einem Quadrat ausrollen. Diese Transformation verändert die Topologie des Torus, aber wir können dieses Problem beseitigen, indem wir uns einigen, korrespondierende Punkte auf gegenüberliegenden Seiten zu behandeln, als seien sie identisch (was durch Pfeile angezeigt wird). Nun kommt der clevere Teil. Wir müssen das Quadrat tatsächlich gar nicht ausrollen und die korrespondierenden
Ränder miteinander verbinden. Wir können geradewegs mit dem flachen Quadrat arbeiten, vorausgesetzt, wir behalten die Regel im Hinterkopf, die uns sagt, wie man die Ränder identifiziert. Für alles, was wir auf dem Torus tun, beispielsweise Kurven zeichnen, existiert eine präzise korrespondierende Konstruktion auf dem Quadrat. Abbildung 47: Für eine Karte auf einem Torus benötigt man sieben Farben. Heawood bewies, dass sieben Farben sowohl notwendig als auch hinreichend sind, um jede beliebige Karte auf einem Torus einzufärben. Die Abbildung zeigt, dass sieben «Farben» notwendig sind, wobei wir, wie oben beschrieben, ein Quadrat benutzen, um den Torus zu repräsentieren.
Man beachte, dass die Regionen an den gegenüberliegenden Rändern zusammenpassen, wie es diese Art der Darstellung verlangt. Wir haben gesehen, dass es Oberflächen gibt, die wie ein Torus aussehen, aber mehr Löcher aufweisen. Die Zahl der Löcher wird als das Geschlecht (Genus) des Torus bezeichnet und mit dem Buchstaben g abgekürzt. Heawood stellte entsprechend seiner Vermutung eine Gleichung für die Anzahl von Farben auf, die man für einen Torus mit g Löchern braucht, wenn g ≥ 1 ist: Es ist die größte ganze Zahl, die kleiner oder gleich ist. Wenn g von 1 bis 10 läuft, ergibt diese Formel die Zahlen Heawood entwickelte seine Formel, indem er seinen Beweis des FünfFarben-Satzes in der Ebene verallgemeinerte. Er konnte zeigen, dass die Zahl der Farben, die sich durch Anwendung seiner Formel ergibt, für jede Oberfläche stets ausreichend ist. Lange Jahre stand die große Frage im Raum, ob sich diese Zahl verringern ließ. Beispiele für kleine Werte des Geschlechts ließen vermuten, dass Heawoods Schätzung die bestmögliche ist. Nach längeren Untersuchungen ergänzten Gerhard Ringel und John W. T. (Ted) Youngs 1968 die letzten Einzelheiten in einem Beweis, der zeigt, dass Heawoods Vermutung richtig ist, wobei die beiden auf ihren eigenen Arbeiten und denjenigen mehrerer Kollegen aufbauten. Ihre
Methoden basieren auf Netzwerken ganz spezieller Art und sind so kompliziert, dass man ein eigenes Buch damit füllen könnte.
Fibonacci-Potenzen Die erste nichttriviale Kubikzahl; auch eine Fibonacci-Zahl. Gibt es noch weitere Fibonacci-Kubikzahlen? Das Nachdenken über Kubikzahlen führte Fermat zur Formulierung seines berühmten letzten Satzes. Sophie Germain, einer der großen Frauen in der Mathematik, gelang ein wichtiger Beitrag zu einem Spezialfall. 350 Jahre nach Fermats ursprünglicher Vermutung fand Andrew Wiles schließlich einen vollständigen Beweis. Die erste Kubikzahl (nach 1) Die Kubikzahl einer Zahl erhält man, indem man die Zahl mit sich selbst multipliziert und das Ergebnis anschließend mit der ursprünglichen Zahl multipliziert. Die Kubikzahl von 2, beispielsweise, ist 2 × 2 × 2 = 8. Die 3 Kubikzahl einer Zahl n wird n geschrieben, sie ist gleich der 3. Potenz von n. Die ersten Kubikzahlen sind
Fermats letzter Satz Kubikzahlen brachten einen Gedankengang ins Rollen, der die Köpfe von Mathematikern mehr als 300 Jahre lang beschäftigte. Um 1630 bemerkte Fermat, dass die Addition von zwei Kubikzahlen ungleich null offenbar keine Kubikzahl ergab. (Wenn man null zulässt, dann 3 3 3 gilt 0 + n = n für alle n.) Er hatte begonnen, eine 1621er Ausgabe eines berühmten antiken Algebrabuches zu lesen, die Arithmetica von Diophant. Auf den Rand seines Exemplars schrieb er: «Es ist unmöglich, eine Kubikzahl in die Summe von zwei Kubikzahlen zu zerlegen, eine vierte Potenz in zwei vierte Potenzen oder ganz allgemein irgendeine Potenz höher als die zweite Potenz in zwei Potenzen derselben Art. Ich habe hierfür einen wahrhaft wunderbaren Beweis entdeckt, doch ist dieser Rand hier zu schmal, um ihn zu fassen.» Algebraisch ausgedrückt behauptete Fermat, er habe einen Beweis dafür gefunden, dass die Gleichung keine ganzzahligen Lösungen hat, wenn n eine ganze Zahl größer oder gleich 3 ist. Diese Aussage, die nun als «Fermats letzter Satz» bezeichnet wird, wurde erstmals 1670 gedruckt, als Fermats Sohn Samuel eine Ausgabe der
Arithmetica mit den Randnotizen seines Vaters publizierte (siehe Abb. 48 auf Seite 132). Abbildung 48: Fermats Randnotiz, publiziert in der Veröffentlichung der von Fermats Sohn herausgegebenen Arithmetica von Diophant; Überschrift: «Beobachtung von Monsieur Pierre de Fermat». Vermutlich begann Fermat sich für diese Frage zu interessieren, weil er die pythagoreischen Tripel kannte: zwei Quadrate (von ganzen Zahlen), die 2 2 sich zu einer Quadratzahl addieren. Ein wohlbekanntes Beispiel ist 3 + 4 2 = 5 . Es gibt unendlich viele derartige Tripel, und eine allgemeine Formel dafür ist seit der Antike bekannt (siehe Kapitel [5]).
Wenn Fermat tatsächlich einen Beweis für seine Behauptung entdeckt haben sollte, so hat ihn bisher niemand gefunden. Wir wissen, dass er einen gültigen Beweis für vierte Potenzen entwickelt hatte, bei dem er die Tatsache nutzte, dass eine vierte Potenz ein Quadrat besonderer Art ist – nämlich das Quadrat eines Quadrats –, um diese Version des Problems mit pythagoreischen Tripeln zu verknüpfen. Wie dieselbe Idee zeigt, kann man, um Fermats letzten Satz zu beweisen, annehmen, dass die Potenz n entweder 4 oder eine ungerade Primzahl ist. Im Lauf der nächsten beiden Jahrhunderte wurde Fermats letzter Satz für genau drei ungerade Primzahlen bewiesen: 3, 5 und 7. Euler beschäftigte sich 1770 mit Kubikzahlen, Legendre und Peter Gustav Lejeune Dirichlet nahm sich um 1825 fünfte Potenzen vor, und Gabriel Lamé bewies 1839 den Satz für siebte Potenzen. Sophie Germain machte bedeutende Fortschritte bei einem Ansatz, der später als der «erste Fall» von Fermats letztem Satz bekannt wurde. Dabei nahm sie an, dass n prim ist und x, y oder z nicht teilt. Im Rahmen eines ehrgeizigeren Programms, das niemals abgeschlossen wurde, bewies sie den p p p Sophie-Germain-Satz: Wenn x + y = z ist, wobei p prim und kleiner als 2 100 ist, dann ist xyz durch p teilbar. Tatsächlich bewies sie viel mehr als das, aber die Aussage ist ziemlich fachspezifisch. Bei dem Beweis benutzte sie Zahlen, die heute als Sophie-Germain-Primzahlen oder auch Germain’sche Primzahlen bezeichnet werden: eine Primzahl p, für die gilt, dass 2p + 1 ebenfalls prim ist. Die ersten Sophie-Germain-Primzahlen sind
und die größte bekannte ist Sie wurde 2012 von Philipp Bliedung entdeckt. Man nimmt an, dass es unendlich viele derartige Primzahlen gibt, doch das ist eine bisher ungeklärte Frage. Sophie-Germain-Primzahlen finden in der Kryptographie und bei Primzahltests Anwendung. Fermats letzter Satz wurde schließlich 1995 von Andrew Wiles bewiesen, mehr als 350 Jahre nachdem Fermat ihn formulierte. Die Methoden, die in den Beweis einflossen, gingen weit über das hinaus, was zu Fermats Tagen möglich war, oder was er hätte erfinden können. Die Catalan’sche Vermutung Im Jahr 1844 stellte der belgische Mathematiker Eugène Catalan eine interessante Frage zu den Zahlen 8 und 9: «Ich bitte Sie, Monsieur, in Ihrer Sammlung das folgende Theorem zu veröffentlichen, das ich für wahr halte, wenngleich es mir noch nicht gelungen ist, es vollständig zu beweisen. Andere mögen mehr Glück haben. Zwei aufeinanderfolgende ganze Zahlen können, mit der Ausnahme von 8 und 9, keine exakten Potenzen sein; m n anderes gesagt: Die Gleichung x – y = 1, in der die Unbekannten positive ganze Zahlen sind, hat nur eine einzige Lösung.» Diese Aussage wurde als die Catalan’sche Vermutung bekannt. Im Jahr 2002 gelang es Preda V. Mihăilescu schließlich, sie mit fortschrittlichen Methoden aus der algebraischen Zahlentheorie zu beweisen.
Die sechste Fibonacci-Zahl und die einzige nichttriviale Fibonacci-Kubikzahl Im Jahr 1202 verfasste Leonardo da Pisa einen arithmetischen Text mit dem Titel Liber Abbaci (Das Buch vom Rechnen), in dem er einem europäischen Publikum die indo-arabischen Ziffern 0–9 erklärte. Das Buch enthielt eine seltsame Frage zum Wachstum einer Kaninchenpopulation. Man beginne mit einem Paar noch nicht geschlechtsreifer Kaninchen. Nach zwei Monaten wird dieses Paar geschlechtsreif und setzt nun jeden Monat ein weiteres Paar in die Welt, das sich genauso verhält. Kaninchen sind unsterblich. Wie wächst die Population in Lauf der Jahre?
Abbildung 49: Die ersten Generationen in Fibonaccis Kaninchenmodell. Leonardo zeigte, dass die Zahl der Paare dem Muster
folgt, bei dem jede Zahl nach den ersten beiden gleich der Summe der beiden vorangegangenen Zahlen ist. Beispielsweise ist 2 = 1 + 1, 3 = 1 + 2, 5 = 2 + 3, 8 = 3 + 5, 13 = 5 + 8 und so weiter. Leonardo erhielt später den Spitznamen Fibonacci (Sohn des Bonaccio), und seit 1877, als Lucas über diese Folge schrieb, sind ihre Vertreter als Fibonacci-Zahlen bekannt. Oft wird dieser Folge eine extra Null vorangestellt, die «nullte» Fibonacci-Zahl. Die Regel zur Bildung gilt auch dann, denn 0 + 1 = 1. Das Modell ist natürlich nicht realistisch und das war auch nicht beabsichtigt. Es war nur ein interessantes numerisches Problem in seinem Lehrbuch. Moderne Verallgemeinerungen, die als Leslie-Modelle bekannt sind, sind jedoch wirklichkeitsnäher und lassen sich auf reale Populationen praktisch anwenden. Eigenschaften von Fibonacci-Zahlen Seit langem sind Mathematiker von Fibonacci-Zahlen fasziniert. Es besteht eine grundlegende Beziehung zur Goldenen Zahl (auch: Goldener Schnitt) φ. Wenn man die grundlegende Eigenschaft verwendet, dass = φ – 1 ist, kann man beweisen, dass die n-te Fibonacci-Zahl Fn genau gleich ist. Das ist die ganze Zahl, die am nächsten kommt. Daher sind die n Fibonacci-Zahlen annähernd proportional zu φ , was darauf hinweist, dass sie exponentiell wachsen – wie die Potenzen einer festen Zahl.
Die Fibonacci-Zahlen weisen viele Muster auf. Man nehme beispielsweise drei aufeinanderfolgende Terme, wie 5, 8 und 13. Dann ist 5 2 × 13 = 65 und 8 = 64, sie unterscheiden sich also um 1. Allgemeiner ausgedrückt: Summen aufeinander folgender Fibonacci-Zahlen erfüllen die Gleichung: Beispielweise ist Es gibt keine bekannte Formel für die Summe der Kehrwerte der FibonacciZahlen ungleich null: Numerisch beträgt diese «reziproke Fibonacci-Konstante» ungefähr 3,359885666243, und Richard André-Jeannin hat bewiesen, dass diese Zahl irrational ist – kein glatter Bruch. Viele Fibonacci-Zahlen sind prim. Die ersten Fibonacci-Primzahlen sind 2, 3, 5, 13, 89, 233, 1597, 28657 und 514229. Die größte bekannte Fibonacci-Primzahl hat Tausende von Ziffern. Es ist nicht bekannt, ob es unendlich viele Fibonacci-Primzahlen gibt.
Eine sehr schwierige Frage, die erst kürzlich gelöst wurde, lautet: Wann ist eine Fibonacci-Zahl eine Potenz? Im Jahr 1951 bewies W. Ljunggren, 2 dass die zwölfte Fibonacci-Zahl 144 = 12 die einzige nichttriviale Fibonacci-Zahl ist, die eine Quadratzahl ist. Harvey Cohn fand 1964 einen weiteren Beweis. (0 und 1 sind n-te Potenzen für alle n, aber nicht 3 besonders interessant.) Die sechste Fibonacci-Zahl ist 8 = 2 , und 1969 bewiesen H. London und R. Finkelstein, dass es sich um die einzige nichttriviale Fibonacci-Zahl handelt, die eine Kubikzahl ist. 2006 bewiesen Y. Bugeaud, M. Mignotte und S. Siksek, dass die einzigen FibonacciZahlen, die perfekte Potenzen (höher als die erste Potenz) sind, 0, 1, 8 und 144 sind.
Magische Quadrate Das kleinste nichttriviale magische Quadrat hat 9 Zellen. Es gibt 9 Kachelungen oder Parkettierungen der Ebene mittels regelmäßiger Polygone, die an jeder Ecke in derselben Weise angeordnet sind. Ein Rechteck mit den richtigen Abmessungen lässt sich in 9 Quadrate unterschiedlicher Größe aufteilen. Das kleinste magische Quadrat Magische Quadrate sind quadratische Matrizen von Zahlen – gewöhnlich der Zahlen 1, 2, 3, … bis zu einer Obergrenze –, die so angeordnet sind, dass jede Zeile, Spalte und beide Diagonalen sich zur selben Summe addieren. Sie haben keine große Bedeutung für die Mathematik, aber sie machen Spaß. Das kleinste magische Quadrat (abgesehen vom trivialen 1 ×
1-Quadrat, das nur aus der Zahl 1 besteht) ist ein 3 × 3-Quadrat mit den Ziffern 1 bis 9. Abbildung 50: Links: Das Lo-Shu-Quadrat. Rechts: Moderne Version. Das früheste bekannte magische Quadrat wird in einer alten chinesischen Legende erwähnt, in der der Kaiser Yu dem Flussgott im Fluss Luo wegen einer riesigen Überschwemmung Opfergaben darbringt. Daraufhin tauchte eine magische Schildkröte aus dem Fluss auf, die auf ihrem Rückenpanzer ein seltsames mathematisches Muster trug. Das war das Lo Shu, ein magisches Quadrat der Größe 3 × 3, das Punkte anstelle von Zahlen benutzt.
Abbildung 51: Links: Ein tibetisches Bild des Lo Shu. Rechts: Kaiser Yu. Wenn das magische Quadrat die Ziffern 1–9 verwendet (die Standardannahme, falls es keine guten Gründe gibt, etwas anderes anzunehmen), und zwar jeweils nur einmal, ist das Lo Shu, abgesehen von Drehungen und Spiegelungen, die einzig mögliche magische Anordnung. Seine magische Konstante – die Summe der Zahlen in jeder Zeile, Spalte oder Diagonalen – ist 15. Das Quadrat zeigt darüber hinaus noch andere Muster. Die geraden Zahlen besetzen die vier Ecken. Zahlen, die sich diametral gegenüberstehen, addieren sich stets zu 10. Die Größe eines magischen Quadrats wird als seine Ordnung bezeichnet. 2 Das Lo Shu hat die Ordnung 3, ein magisches Quadrat n-ter Ordnung hat n 2 Zellen, die gewöhnlich die Zahlen 1 bis n enthalten. Andere alte Hochkulturen, wie Persien und Indien, interessierten sich ebenfalls für magische Quadrate. Im 10. Jahrhundert fand man in einem Tempel im indischen Khajuraho ein magisches Quadrat 4. Ordnung. Seine
magische Konstante ist – wie die aller magischen Quadrate 4. Ordnung, die die Zahlen 1–16 verwenden – 34. Abbildung 52: Magisches Quadrat 4. Ordnung aus dem 10. Jahrhundert. Es gibt viele unterschiedliche magische Quadrate 4. Ordnung; insgesamt sind es 880, wenn man Drehungen und Spiegelungen nicht mitzählt. Die Anzahl magischer Quadrate 5. Ordnung ist noch viel höher: 275305224. Die genaue Anzahl der magischen Quadrate 6. Ordnung ist nicht bekannt, 19 doch man nimmt an, dass es rund 1,7745 × 10 sind. Der Maler Albrecht Dürer verewigte ein magisches Quadrat in seinem Kupferstich Melencolia I, das noch mehrere weitere mathematische Objekte enthält. Das Quadrat wurde so gewählt, dass die Jahreszahl, 1514, in der Mitte der unteren Zeile erscheint.
Abbildung 53: Links: Melencolia I. Rechts: Detail des magischen Quadrats. Man beachte die Jahreszahl 1514 in der Mitte der unteren Zeile. Magische Quadrate existieren für sämtliche Ordnungen größer oder gleich 3, und ein triviales für Ordnung 1, aber keins für Ordnung 2. Es gibt allgemeine Methoden, um Beispiele zu konstruieren; sie sind davon abhängig, ob n ungerade ist, doppelt so groß wie eine ungerade Zahl ist oder ein Vielfaches von 4 ist. Die magische Konstante für ein magisches Quadrat n-ter Ordnung ist . Das ist so, weil die Summe aller Zellen 1 + 2 + 3 + … + n ist, was gleich 2 ist. Weil sich das Quadrat in n Zeilen aufspalten lässt, die alle dieselbe Summe aufweisen, lässt sich die magische Konstante daraus gewinnen, indem man den Ausdruck durch n teilt.
Abbildung 54: Allgemeine Methode zur Konstruktion eines magischen Quadrats mit ungerader Kantenlänge. Man schreibe 1 in die Mitte der obersten Zeile, anschließend platziere man die aufeinanderfolgenden Zahlen 2, 3, 4, …, indem man den Pfeilen diagonal folgt und immer eine Zeile weiter nach oben und eine Spalte weiter nach rechts sich bewegt. Wann immer eine Zahl auf ein bereits besetztes Feld trifft, bewege man sich zu der direkt darunter liegenden Zelle weiter. Archimedische Parkettierung
Neun Parkettierungsmuster benutzen mehr als einen einzigen regelmäßigen Polygontyp mit genau derselben Kachelanordnung in jeder Ecke. Diese Muster sind als archimedische, semireguläre oder 1-uniforme Parkettierungen der Ebene bekannt (siehe gegenüberliegende Seite). Quadratische Rechtecke Ein Quadrat lässt sich problemlos in neun kleinere Quadrate gleicher Größe zerlegen, indem man es längs jeder Kante drittelt. Die kleinste Zahl von ungleichen Quadraten, in die sich ein Rechteck mit ganzzahligen Seiten zerlegen lässt, beträgt ebenfalls neun, aber die Anordnung ist viel schwieriger herauszufinden. Wir alle wissen, dass sich ein rechteckiger Boden mit quadratischen Kacheln gleicher Größe auslegen lässt – vorausgesetzt, seine Kanten sind ganzzahlige Vielfache der Kachelgröße. Aber was passiert, wenn wir quadratische Kacheln benutzen müssen, die alle unterschiedliche Größen haben? Das erste «quadratische Rechteck» wurde 1925 von Zbigniew Morón veröffentlicht: Er verwendete zehn quadratische Kacheln der Größe 3, 5, 6, 11, 17, 19, 22, 23, 24 und 25. Bald darauf entdeckte er ein quadratisches Rechteck, für das er neun quadratische Kacheln der Größe 1, 4, 7, 8, 9, 10, 14, 15 und 18 benötigte.
Abbildung 55: Die neun archimedischen Parkettierungen. Wie steht es damit, ein Quadrat aus unterschiedlichen quadratischen Kacheln zusammenzusetzen? Lange Zeit galt das als unmöglich, doch 1939
fand Roland Sprague 55 unterschiedlich große quadratische Kacheln, die zusammengelegt ein Quadrat ergaben. Im Jahr 1940 veröffentlichten Leonard Brooks, Cedric Smith, Arthur Stone und William Tutte, damals Studenten am Trinity College in Cambridge, einen Artikel, der das Problem mit elektrischen Netzwerken in Verbindung brachte – das Netzwerk codiert für die Größe der Quadrate und die Art und Weise, wie sie zusammenpassen. Diese Methode führte zu weiteren Lösungen. Abbildung 56: Links: Moróns erstes in Quadrate unterteiltes Rechteck. Rechts: Seine Verbesserung auf neun Kacheln. Im Jahr 1948 fand Theophilus Willcock 24 Quadrate, die sich zu einem Quadrat zusammenfügen ließen. Bis vor kurzem nahm man an, dass es keine kleinere Menge gibt, die das schafft, aber 1962 zeigte Adrianus Duijvestijn mit Hilfe eines Computers, dass man nur 21 Kacheln braucht und dies die Minimalzahl ist. Ihre Größe ist 2, 4, 6, 7, 8, 9, 11, 15, 16, 17, 18, 19, 24, 25, 27, 29, 33, 35, 37, 42 und 50.
Abbildung 57: Links: Willcocks in Quadrate unterteiltes Quadrat mit 24 Kacheln. Rechts: Duijvestijns Quadrat mit 21 Kacheln. Im Jahr 1975 stellte sich Solomon Golomb die Frage: Kann man eine unendliche Ebene lückenlos kacheln, wenn man genau eine Kachel von der Größe jeder ganzen Zahl benutzt: 1, 2, 3, 4 und so weiter? Bis vor kurzem war das Problem ungelöst, doch 2008 entwickelten James und Frederick Henle einen einfallsreichen Beweis, der zeigte, dass die Antwort «ja» lautet.
Das Dezimalsystem Das Dezimalsystem, das wir verwenden, um Zahlen zu schreiben, basiert auf 10, wahrscheinlich, weil wir zehn Finger und Zehen haben – im Englischen digits, dasselbe Wort, das auch für Ziffern gebraucht wird. Andere Basen sind ebenfalls möglich, und einige von ihnen – vor allem 20 und 60 – sind in antiken Kulturen auch verwendet worden. 10 ist sowohl eine Dreiecks- als auch eine Viereckszahl. Anders, als Euler annahm, gibt es zwei orthogonale lateinische Quadrate der Abmessung 10 × 10. In Zehnerschritten zählen Unsere heutige Zahlenschreibweise wird als «dezimal» bezeichnet, weil sie 10 als Zahlenbasis benutzt. Decem ist lateinisch und steht für «zehn». In diesem System werden dieselben zehn Symbole
benutzt, um Einer, Zehner, Hunderter, Tausender und so weiter darzustellen. Was davon gemeint ist, wird durch die Position des Symbols in der Zahl angezeigt. In der Zahl 2015 bedeuten die Symbole beispielsweise: Die zentrale Rolle spielen hier die aufeinanderfolgenden Potenzen von 10: Wir haben uns so sehr an diese Schreibweise gewöhnt, dass wir dazu neigen, sie einfach als «Zahlen» anzusehen und anzunehmen, dass die Zahl 10 mathematisch eine Sonderstellung einnimmt. Sehr ähnliche Notationssysteme lassen sich jedoch auf jeder beliebigen Zahlenbasis errichten. Auch wenn 10 in der Tat etwas Besonderes ist – wir werden später noch darauf zurückkommen –, ist sie in dieser Hinsicht nichts Besonderes. Computer benutzen mehrere Basen:
Das Duodezimalsystem auf der Basis 12 ist oft als Verbesserung des Dezimalsystems vorgeschlagen worden, weil 12 durch 2, 3, 4 und 6 teilbar ist, 10 hingegen nur durch 2 und 5. Die Mayas nutzten die 20 als Basis, die alten Babylonier hingegen die 60 (siehe für beides Kapitel [0]). Wir können 2015 im Dezimalsystem folgendermaßen schreiben: oder wenn man die Potenzen ausschreibt: Dieses System wird als Stellenwertsystem bezeichnet, weil die Bedeutung eines Symbols von seiner Stellung abhängt. Dieselben Symbole zur Basis 8 würden folgendermaßen aussehen: In der uns vertrauteren Dezimalschreibweise wird daraus Daher stellen dieselben Symbole, wenn sie auf unterschiedlichen Basen interpretiert werden, unterschiedliche Zahlen dar.
Schauen wir uns noch eine weitere weniger vertraute Basis an: 7. Auf Apellobetnees III haben die außerirdischen Bewohner alle sieben Schwänze, und sie zählen mit Hilfe dieser Schwänze. Daher beschränkt sich ihr Zahlensystem auf die Ziffern 0 bis 6. Dann schreiben sie 10, wo wir 7 schreiben würden, und machen weiter bis 66, was wir als 48 schreiben würden. Für unsere 49 benutzen sie 100, und so weiter. Das heißt, eine Zahl wie abcd in Apellobetneesisch lässt sich folgendermaßen ins Dezimalsystem übersetzen: Mit ein wenig Übung kann man mit diesem System außerirdische Berechnungen ausführen, ohne sie ins Dezimalsystem und wieder zurück zu konvertieren. Man braucht Regeln wie «4 + 5 = 2, 1 im Sinn» (weil 9 im Dezimalsystem 12 im Siebenersystem entspricht), doch abgesehen davon sieht alles sehr vertraut aus. Geschichte der Zahlenschreibweise Frühe Zivilisationen verwendeten völlig andere Systeme, um Zahlen zu schreiben, als wir heutzutage. Die Babylonier benutzten eine Notation, die auf der Zahl 60 basierte, und drückten die sechzig Ziffern mit Keilschriftsymbolen aus (siehe Kapitel [0]). Die Ägypter besaßen spezielle Symbole für die Potenzen von 10 und wiederholten sie, um neue Zahlen zu schaffen. Die alten Griechen benutzten ihr Alphabet für die Zahlen 1–9, 10– 90 und 100–900.
Abbildung 58: Links: Ägyptische Zahlensymbole. Rechts: Die Zahl 5724 in ägyptischen Hieroglyphen. Unsere heutige Stellenwertschreibweise und unsere Symbole für die zehn Ziffern 0–9 tauchten um 500 n. Chr. in Indien auf, doch es gab frühere Vorläufer. Die Geschichte ist kompliziert, die Daten sind schwer zu belegen und umstritten. Abbildung 59: Links: Symbole aus dem Bakshali-Manuskript. Rechts: BrahmiZahlenzeichen. Das Bakshali-Manuskript, das 1881 in der Nähe des Dorfes Bakshali im heutigen Pakistan gefunden wurde, ist das älteste bekannte Dokument der indischen Mathematik. Experten nehmen an, dass es aus der Zeit zwischen dem 2. Jahrhundert v. Chr. und dem 3. Jahrhundert n. Chr. stammt; vermutlich handelt es sich um eine Kopie eines früheren Manuskripts. Es benutzt eigenständige Symbole für die Ziffern 0–9. Brahmi-Zahlenzeichen gehen bis in die Zeit um 200–300 n. Chr. zurück, verwendeten aber keine Stellenwertnotation. Vielmehr gab es zusätzliche Symbole für die Multiplikation mit 10, 100 und 1000 und zugleich Regeln, die angaben, wie man diese Symbole kombiniert, um beispielsweise eine Zahl wie 3000 zu schreiben.
Später wurden von den Brahmi-Zeichen «hindische» Zahlenzeichen abgeleitet. Sie wurden von dem indischen Mathematiker Aryabhata im 6. Jahrhundert in mehreren verschiedenen Formen verwendet. Brahmagupta benutzte im 7. Jahrhundert 0 als eigenständige Zahl und fand Regeln, um mit Null zu rechnen. Abbildung 60: Beispiele für arabische und indische Zahlensymbole. Die indische Erfindung breitete sich im Mittleren Osten aus, vor allem durch den persischen Mathematiker Al-Chwarizmi (De numero Indorum – Über die indische Zahlschrift, um 825) und den arabischen Mathematiker Al-Kindi (Über den Gebrauch von indischen Zahlen, um 830). Durch die lateinische Übersetzung von Al-Chwarizmis Buch gelangten diese Zahlensymbole schließlich auch nach Europa. Das erste Buch, das speziell geschrieben wurde, um dieses Notationssystem in Europa zu verbreiten, war Fibonaccis Liber Abbaci (1202). Er nannte die Notation modus Indorum (Methode der Inder), doch die Verbindung mit Al-Chwarizmi war so stark, dass sich der Begriff «arabische Zahlen» durchsetzte – trotz des Titels von Chwarizmis Buch.
Der Name bürgerte sich vermutlich auch deshalb ein, weil viele Europäer durch arabisierte Berbervölker mit diesen Zahlen in Kontakt kamen. Abbildung 61: Einige moderne Zahlensymbole. (* Japaner und Koreaner verwenden die vereinfachten chinesischen Symbole.) Es dauerte eine Weile, bis sich diese Symbole durchsetzten. Im mittelalterlichen Europa wurden Dutzende von Varianten benutzt. Selbst heutzutage verwenden unterschiedliche Kulturen unterschiedliche Versionen der Symbole. Das Dezimalkomma Fibonaccis Liber Abbaci enthielt eine Schreibweise, die wir bis heute gebrauchen: den waagerechten Strich in einem Bruch, wie in für «drei Viertel». Die Inder verwendeten eine ähnliche Notation, aber ohne
Querstrich; der Querstrich wurde offenbar von den Arabern eingeführt. Fibonacci benutzt ihn häufig, doch derselbe Querstrich konnte Teil mehrerer verschiedener Brüche sein. Heutzutage benutzen wir Brüche aus praktischen Gründen nur selten. Stattdessen verwenden wir ein Dezimalkomma und schreiben beispielsweise π als 3,14159. Dezimalzahlen in diesem Sinne gehen auf das Jahr 1585 zurück, als Simon Stevin Privatlehrer von Moritz von Nassau wurde, dem Sohn von Wilhelm dem Schweigsamen. Stevin wurde schließlich zum Finanzminister ernannt. Auf der Suche nach präzisen Buchführungsmethoden stieß er auf die indo-arabische Schreibweise, fand Brüche aber zu unhandlich. Die stets praktischen Babylonier stellten Brüche in ihrem auf 60 basierenden System dar, indem sie geeignete Zahlen für Potenzen von wählten, was zu unseren modernen Sekunden und Minuten führte, und zwar sowohl auf die Zeit als auch auf Winkel bezogen. In einer modernisierten Form der babylonischen Notation bedeutet 6:15 so viel wie 6 + 15 × ( was wir als ), oder 6,25 schreiben würden. Stevin gefiel diese Idee, abgesehen von der Benutzung der Basis 60, und er dachte sich ein System aus, das das Beste aus beiden Systemen kombinierte: das Dezimalsystem. Als er sein neues System veröffentlichte, betonte er seine praktischen Vorteile und die Verwendungsfähigkeiten im Geschäftsleben: «Alle geschäftsmäßigen Berechnungen lassen sich unter alleiniger Nutzung ganzer Zahlen und ohne die Hilfe von Brüchen durchführen.»
Seine Notation enthielt noch kein Dezimalkomma an sich, doch sie führte sehr rasch zu unserer heutigen Dezimalschreibweise. Wo wir beispielsweise 5,7731 schreiben würden, schrieb Stevin 5 Hier bedeutet das Symbol 7 eine ganze Zahl, 7 3 1 . verweist auf ein Zehntel, auf ein Hundertstel, und so weiter. Die Nutzer entledigten sich bald der und der und behielten nur die bei, die immer weiter schrumpfte und sich schließlich in den angelsächsischen Dezimalpunkt bzw. das kontinentaleuropäische Dezimalkomma verwandelte. Reelle Zahlen Ein Haken zeigt sich allerdings, wenn man Dezimalzahlen für Brüche benutzt: Sie sind nicht exakt. Beispielsweise liegt sehr nah an 0,333 und noch näher an 0,333333, aber keiner von beiden Werten ist exakt. Um das festzustellen, muss man die Werte nur mit 3 multiplizieren: Als Ergebnis sollte man 1 erhalten, aber es sind tatsächlich nur 0,999 bzw. 0,999999. Knapp vorbei ist auch daneben. Mathematiker erkannten, dass eine «korrekte» Dezimalentwicklung von in gewissem Sinne unendlich lang sein müsste: Und so müsste es endlos weitergehen. Und das führte zu der Idee, dass eine Zahl wie π ebenfalls endlos weitergeht, abgesehen davon, dass sich nicht dieselben Ziffern unendlich oft wiederholen:
Es ist wichtig, sich an dieser Stelle klarzumachen, dass tatsächlich gleich 0,333333… ist, solange die Zahl nicht aufhört. Hier ist der Beweis: Sei Man multipliziere diese Zahl mit 10. Das führt auf der einen Seite des Gleichheitszeichens zu 10x und verschiebt 0,333333… um eine Stelle nach links, also Daher ist Die Aussage, dass 10x = 3 + x ist, basiert darauf, dass die Zahlen unendlich weiterlaufen. Wenn sie irgendwann – selbst nach einer Billion Wiederholungen – stoppen sollten, wäre die Aussage falsch. Eine ähnliche Argumentation besagt, dass 0,999999…, wenn die Zahl unendlich weiterläuft, gleich 1 ist. Man kann entweder denselben Trick anwenden, der zu 10x = 9 + x führt, sodass x = 1 ist, oder man kann 0,333333… einfach mit 3 multiplizieren. =
Viele Leute sind überzeugt, dass 0,999999…, unendlich weitergeführt, nicht gleich 1 ist. Sie glauben, die Zahl müsse kleiner sein. Das stimmt, wenn man irgendwann anhält, aber die Menge, durch die sie sich von 1 unterscheidet, wird auch immer kleiner: und so weiter. Diese Differenz strebt gegen den Grenzwert 0. Sie wird kleiner als jede positive Zahl, ganz gleich, wie winzig. Mathematiker definieren den Wert einer unendlich langen Dezimalzahl als Grenzwert der endlich langen Dezimalzahlen, die man erhält, wenn man an irgendeiner Stelle abbricht, während die Zahl der Dezimalstellen bis unendlich steigt. Für eine unendliche Folge von Neunen beträgt der Grenzwert genau 1. Kein Wert kleiner 1 tut’s, denn eine ausreichend große Anzahl von Neunen ergibt einen größeren Wert. Es gibt nichts wie «unendlich viele Nullen, gefolgt von einer 1" – und selbst wenn es so etwas gäbe, würde man nicht 1 erhalten, indem man es zu 0,999999… addiert. Diese Definition ist es, die unendliche Dezimalzahlen zu einem vernünftigen mathematischen Konzept macht. Die resultierenden Zahlen werden als reelle Zahlen bezeichnet – nicht etwa, weil sie in der realen Welt auftreten, sondern um sie von diesen vertrackten «imaginären» Zahlen wie i zu unterscheiden (siehe Kapitel [i]). Der Preis, den wir für die Verwendung des Grenzwerts zahlen, ist, dass einige Zahlen zwei unterschiedliche dezimale Erweiterungen haben können wie 0,999999… und 1,000000… Daran gewöhnt man sich jedoch rasch.
Die vierte Dreieckszahl Abbildung 62: Die vierte Dreieckszahl Die vierte Dreieckszahl (siehe Kapitel [3]) ist Der alte Kult der Pythagoreer bezeichnete diese Anordnung als die Tetraktys und betrachtete sie als heilig. Die Pythagoreer glaubten, das Universum basiere auf Zahlen, und den ersten zehn Zahlen schrieben sie besondere Eigenschaften zu. Diese Zuschreibungen sind stark umstritten; zu Beispielen aus zahlreichen Quellen gehören:
Da 10 die Summe dieser vier bedeutenden Zahlen ist, galt sie als besonders wichtig. Sie symbolisierte auch die vier «Elemente» – Erde, Wasser, Feuer, Luft – und die vier Komponenten des Raums: Punkt, Linie, Ebene, Körper. Abbildung 63: Bowling mit zehn Kegeln. Die zehn Kegel auf einer Bowlingbahn werden in dieser Weise aufgestellt. Die dritte Viereckszahl
Genauso, wie die Dreieckszahlen 1, 3, 6, 10 und so weiter die Summen aufeinander folgender ganzer Zahlen sind, sind die Viereckszahlen die Summen aufeinander folgender Dreieckszahlen: Die n-te Viereckszahl ist gleich . Geometrisch lässt sich eine Viereckszahl von Kugeln zu einem Tetraeder aufstapeln, einem Stapel immer kleiner werdender Dreiecke. Abbildung 64: Viereckszahlen. Zehn ist (neben 1) die kleinste Zahl, die sowohl eine Dreiecks- als auch eine Viereckszahl ist. Die einzigen Zahlen, die sowohl Dreiecks- als auch Viereckszahlen sind, sind: 1, 10, 120, 1540 und 7140.
Orthogonale lateinische Quadrate 10. Ordnung Im Jahr 1873 dachte Euler über einen mathematischen Zeitvertreib nach, magische Quadrate, bei denen Zahlen so in einem quadratischen Gitter angeordnet werden, dass sich alle Zeilen und Spalten zum selben Ergebnis addieren (siehe Kapitel [9]). Doch Eulers fruchtbare Phantasie strebte in eine neue Richtung, und er veröffentlichte seine Ideen in einem Aufsatz «Eine neue Art von magischen Quadraten». Hier ein Beispiel: Die Zeilen und Spalten ergeben alle dieselbe Summe, nämlich 6, daher handelt es sich, abgesehen von einer Diagonale, um ein magisches Quadrat; zudem verletzt es aber auch die Standardbedingung, dass jede Zahl nur einmal auftauchen darf. Stattdessen besteht jede Zeile und jede Reihe aus 1, 2 und 3 in unterschiedlicher Reihenfolge. Solche Quadrate sind als lateinische Quadrate bekannt, weil die Symbole keine Zahlen zu sein brauchen; vor allem können sie aus den lateinischen (das heißt römischen) Buchstaben A, B, C bestehen. Hier die Aufgabe, die Zarin Katharina ihrem Hofmathematiker Euler stellte: Beim Divisionsball ordnet jedes der sechs teilnehmenden Regimenter für jeden der 6 Dienstgrade je 1 Offizier für eine besondere Aufgabe ab: Die 36 Offiziere sollten zur Feier des Tages so im Quadrat aufgestellt werden, dass in jeder Zeile und jeder Spalte genau 1 Offizier eines jeden Regiments und eines jeden Dienstgrades steht.
Wenn wir A, B, C, D, E und F für die Ränge benutzen und 1, 2, 3, 4, 5 und 6 für die Regimenter, geht es bei dem Problem um zwei lateinische 6 × 6-Quadrate, eines für jede Symbolmenge. Zudem müssen sie orthogonal sein, das heißt, dass beim Überlagern der Quadrate alle entstehenden Symbolpaare verschieden sind. Es ist einfach, separate Anordnungen für Ränge und Regimenter zu finden, aber beide so zusammenzuführen, dass sich keine Kombination von Rang und Regiment wiederholt, ist deutlich schwieriger. Beispielsweise könnten wir versuchen. Aber wenn wir beide Anordnungen kombinieren, erhalten wir: und da gibt es Wiederholungen. So taucht A1 beispielsweise zweimal auf und B2 sogar vier Mal. Das ist also keine Lösung.
Wenn wir dasselbe Problem mit 16 Offizieren und 4 Rängen A, B, C, D und für vier Regimenter 1, 2, 3, 4 versuchen, ist eine Lösung nicht allzu schwer zu finden: Diese Quadrate sind orthogonal. Bemerkenswerterweise gibt es ein drittes lateinisches Quadrat, das orthogonal zu diesen beiden ist: Um im Jargon zu bleiben, haben wir eine Menge von drei paarweise orthogonalen lateinischen Quadraten 4. Ordnung gefunden. Euler versuchte sein Bestes, um ein geeignetes Paar orthogonale lateinische Quadrate 6. Ordnung zu finden, aber all seine Mühen waren vergeblich. Das brachte ihn zu der Überzeugung, dass sein Rätsel um die 36 Offiziere keine Lösung hatte. Es gelang ihm jedoch, Paare orthogonaler lateinischer n × n-Quadrate für alle ungeraden Zahlen n und alle Vielfachen von 4 zu konstruieren, und es lässt sich leicht beweisen, dass kein solches Quadrat 2. Ordnung existiert. Es blieben die Größen 6, 10, 14, 18 und so
weiter – jeweils das Doppelte einer ungeraden Zahl –, und Euler vermutete, dass für diese Größen keine orthogonalen Paare existieren. Abbildung 65: Parkers zwei orthogonale lateinische 10 × 10-Quadrate, bereits überlagert: erste Ziffer das eine, zweite Ziffer das andere. Es gibt 812 Millionen verschiedener lateinischer 6 × 6-Quadrate und selbst, wenn man Abkürzungen nimmt, kann man nicht einfach alle möglichen Kombinationen auflisten. Dennoch bewies Gaston Tarry 1901, dass Euler recht hatte, was die 6 × 6-Quadrate anging. Bei allen anderen lag er allerdings falsch. Im Jahr 1959 konstruierte Ernest Tilden Parker zwei
orthogonale lateinische 10 × 10-Quadrate. Und bis 1960 war es Parker, Raj Chandra Bose und Sharadachandra Shankar Shrikhande gelungen zu beweisen, dass Eulers Vermutung für alle Größen mit Ausnahme des 6 × 6Quadrats falsch ist.
NULL UND NEGATIVE ZAHLEN Nachdem wir 1–10 abgehandelt haben, gehen wir einen Schritt zurück und beschäftigen uns mit 0. Dann gehen wir einen weiteren Schritt zurück und gelangen zu –1. Damit öffnet sich uns die ganz neue Welt der negativen Zahlen. Dies eröffnet zugleich neue Möglichkeiten für den Gebrauch von Zahlen. Sie dienen nicht länger nur zum Zählen.
Ist nichts eine Zahl? Die Null tauchte erstmals in Systemen zum Aufschreiben von Zahlen auf. Erst später wurde sie als eigenständige Zahl akzeptiert und konnte ihren Platz als grundlegendes Element des mathematischen Zahlensystems einnehmen. Diese Zahl weist jedoch viele ungewöhnliche, manchmal paradox erscheinende Merkmale auf. Vor allem kann man nicht vernünftig durch 0 teilen. Grundsätzlich lassen sich in der Mathematik alle Zahlen von 0 ableiten. Grundlage der Zahlennotation In vielen alten Kulturen waren die Symbole für 1, 10 und 100 nicht verknüpft. Die alten Griechen, beispielsweise, benutzten die Buchstaben ihres Alphabets, um die Zahlen 1–9, 10–90 und 100–900 darzustellen. Das ist potenziell recht verwirrend, auch wenn sich im Allgemeinen leicht aus
dem Kontext entscheiden lässt, ob ein Symbol für einen Buchstaben oder für eine Zahl steht. Aber es macht das Rechnen auch schwierig. Unsere Zahlenschreibweise, bei der dieselbe Ziffer je nach ihrer Stellung für verschiedene Zahlen steht, wird als Stellenwertschreibweise bezeichnet (siehe Kapitel [10]). Dieses System hat für das Rechnen mit Papier und Bleistift große Vorteile, und dies war bis vor kurzem die Methode, mit der die meisten Menschen auf der Welt rechneten. Bei der Stellenwertnotation muss man ein paar Grundregeln zum Addieren und Multiplizieren der zehn Symbole 0–9 kennen. Es gibt gemeinsame Muster, wenn dieselben Symbole an verschiedenen Stellen auftauchen, zum Beispiel: Abbildung 66: *vau, koppa und sampi sind verzichtbare Zeichen. Wenn man jedoch die Notation der alten Griechen benutzt, sehen die beiden ersten Gleichungen so aus:
wobei sich keine gemeinsame Struktur erkennen lässt. Es gibt jedoch eine besondere Eigenschaft der Stellenwertschreibweise, die sich bei 2015 zeigt: die Notwendigkeit eines Symbols für null. Es sagt uns, dass es keine Hunderter gibt. Die griechische Notation braucht dies nicht. Bei σπ, beispielsweise, bedeutet σ «200» und π «80». Wir können erkennen, dass es keine Einer gibt, denn keines der Einersymbole α bis θ taucht auf. Statt ein Symbol für null zu benutzen, schreiben wir einfach keines der Einser-Symbole auf. Wenn wir das im Dezimalsystem versuchen, wird aus 2015 215, aber es lässt sich nicht sagen, ob 215, 2150, 2105, 2015 oder aber, um es noch weiter zu treiben, 2000150 gemeint ist. Frühe Versionen der Stellenwertschreibweise benutzten einen Zwischenraum, 2 15, aber einen solchen Zwischenraum kann man leicht übersehen, und zwei benachbarte Zwischenräume ergeben nur einen etwas längeren Zwischenraum. Daher ist diese Art der Darstellung verwirrend und führt leicht zu Fehlern. Eine kurze Geschichte der Null Babylon Die erste Kultur, die ein Symbol für die Aussage «hier steht keine Zahl» einführte, war die der Babylonier. Erinnern Sie sich aus Kapitel 10 daran, dass die babylonische Zahlennotation nicht auf der 10, sondern auf der 60 2 basierte. In frühen babylonischen Berechnungen wird das Fehlen eines 60 -
Terms durch einen Zwischenraum angezeigt, aber ab 300 v. Chr. hatten sie ein spezielles Symbol erfunden. Die Babylonier sahen dieses Symbol jedoch offenbar nicht als eigenständige Zahl an. Zudem ließen sie es weg, wenn es am Ende der Zahl stand, sodass man die Bedeutung aus dem Zusammenhang erschließen musste. Indien Die Idee eines Stellenwertsystems zur Basis 10 taucht im Lokavibhaga auf, einem Sanskrit-Text der Jaina über Kosmologie aus dem Jahr 458 n. Chr., der auch den Begriff shunya (leer) verwendet, wo wir «null» benutzen würden. 498 n. Chr. beschrieb der berühmte indische Mathematiker und Astronom Aryabhata die Stellenwertnotation als «eine Verzehnfachung des Wertes von Stelle zu Stelle». Der erste unstrittige Gebrauch eines speziellen Symbols für die Dezimalziffer 0 findet sich 876 v. Chr. in einer Inschrift im Chaturbhuj-Tempel in Gwalior, und Sie werden es kaum glauben – es ist ein kleiner Kreis. Die Mayas Die Maya-Zivilisation in Mittelamerika, die ihren kulturellen Höhepunkt zwischen 250 und 900 n. Chr. erreichte, verwendete ein Zahlensystem, das auf der 20 basierte, und sie hatten ein explizites Symbol für null. Diese Schreibweise reicht offenbar viel weiter zurück, und man nimmt an, dass sie von den Olmeken (1500–400 v. Chr.) erfunden wurde. Die Mayas nutzten Zahlen vor allem in ihrem Kalendersystem, von dem ein Aspekt als Lange Zählung bekannt ist. Dieses System ordnet jedem Tag ein Datum zu,
indem es abzählt, wie viele Tage seit einem mythischen Schöpfungsdatum vergangen sind, das nach dem gegenwärtigen westlichen Kalender am 11. August 3114 v. Chr. stattgefunden haben soll. In diesem System ist ein Symbol für null unverzichtbar, um Mehrdeutigkeiten zu vermeiden. Abbildung 67: Links: Zahlenzeichen der Mayas. Rechts: Eine Steinstele in der präkolumbianischen Stadt Quirigua trägt das Schöpfungsdatum der Mayas: 13 Baktun, 0 Katun, 0 Tun, 0 Uinal, 0 Kin, 4 Ahau, 8 Cumku. Das ist nach unserer Rechnung der 11. August 3114 v. Chr. Ist null eine Zahl? Vor dem 9. Jahrhundert n. Chr. wurde null als bequemes Symbol für numerische Berechnungen angesehen, aber nicht als eigenständige Zahl
betrachtet – wahrscheinlich, weil es nichts zählte. Wenn jemand Sie fragt, wie viele Kühe Sie besitzen und Sie einige Kühe Ihr Eigen nennen, zeigen Sie nacheinander auf die Tiere und zählen «eins, zwei, drei …». Wenn Sie jedoch keine Kühe besitzen, zeigen Sie nicht auf eine Kuh und sagen «null», weil es keine Kuh gibt, auf die Sie zeigen könnten. Da man nicht durch Zählen zu 0 gelangen kann, handelt es sich offensichtlich nicht um eine Zahl. Wenn Ihnen diese Sichtweise seltsam erscheint, sollten Sie sich daran erinnern, dass noch früher «eins» nicht als Zahl galt. Wenn man eine Anzahl Kühe hatte, dann war das sicherlich mehr als nur eine. Eine ähnliche Unterscheidung kann man noch immer in modernen Sprachen finden: die Unterscheidung zwischen Einzahl und Mehrzahl. Die alten Griechen kannten ebenfalls eine «duale» Form, bei der spezielle Modifikationen von Wörtern benutzt wurden, wenn von zwei Objekten die Rede war. In diesem Sinne wurde «zwei» nicht als eine Zahl wie alle übrigen betrachtet. Für mehrere andere klassische Sprachen galt dasselbe, und ein paar moderne Sprachen, wie das schottische Gälisch und Slowenisch, tun es bis heute. Spuren davon finden sich auch im Deutschen oder im Englischen: Wir gebrauchen «beide» (both) für zwei Dinge, «alle» (all) hingegen für mehr. Als sich der Gebrauch der Null als Symbol weiter verbreitete und Zahlen für mehr als nur zum Zählen Verwendung fanden, wurde deutlich, dass sich die Null in den meisten Fällen wie alle anderen Zahlen verhält. Seit dem 9. Jahrhundert betrachteten indische Mathematiker die Null als Zahl wie jede andere, nicht nur als Symbol, das dazu diente, zwei andere Zahlen zu trennen, um Mehrdeutigkeiten zu vermeiden. Sie benutzten die Null uneingeschränkt bei alltäglichen Berechnungen.
Auf dem Zahlenstrahl, auf dem die Zahlen 1, 2, 3… von links nach rechts angeordnet sind, ist klar, wohin 0 gehört: direkt auf die Position links von 1. Der Grund liegt auf der Hand: Wenn man 1 zu einer Zahl addiert, so verschiebt man sie damit um eine Stelle nach rechts. Die Addition von 1 zu 0 verschiebt das Ergebnis zu 1, daher muss 0 dorthin gehen, von wo auch immer ein Schritt nach rechts zu 1 führt. Und das ist ein Schritt links von 1. Abbildung 68: Der Zahlenstrahl. Die Akzeptanz negativer Zahlen besiegelte den Platz der Null als echte Zahl. Jedermann war damit einverstanden, dass 3 eine Zahl ist. Wenn man akzeptiert, dass –3 ebenfalls eine Zahl ist und dass man, wenn man zwei Zahlen addiert, als Ergebnis eine Zahl erhält, dann muss 3 + (–3) eine Zahl sein. Und das ist 0. Ungewöhnliche Eigenschaften Ich habe gesagt, dass sich null in «fast jeder wichtigen Hinsicht» wie jede beliebige andere Zahl verhält, denn unter außerordentlichen Umständen tut sie es nicht. Null ist etwas Besonderes. Das muss so sein, denn es ist die einzige Zahl, die zwischen den positiven und den negativen Zahlen eingeklemmt ist. Es ist klar, dass sich eine Zahl nicht verändert, wenn man 0 addiert. Wenn ich drei Kühe habe und keine Kühe hinzufüge, bleibt es bei den drei
Kühen. Zugegebenermaßen gibt es seltsame Rechnungen wie diese: Eine Katze hat einen Schwanz. Keine Katze hat acht Schwänze. Eine Addition ergibt: Eine Katze hat neun Schwänze. Aber diese kleine Nonsense-Rechnung beruht auf den beiden verschiedenen Bedeutungen von «kein». Diese spezielle Eigenschaft von 0 bringt es mit sich, dass 0 + 0 = 0 ist, was uns sagt, dass –0 = 0 ist. Null ist ihre eigene Negierung. Es ist die einzige derartige Zahl. Das ist genau deshalb so, weil null auf dem Zahlenstrahl wie in einem Sandwich zwischen den positiven und den negativen Zahlen eingeklemmt ist. Wie sieht es mit der Multiplikation aus? Wenn wir die Multiplikation als wiederholte Addition ansehen, gilt und daher ist für jede beliebige Zahl n. Das ergibt bei finanziellen Transaktionen Sinn: Wenn ich dreimal kein Geld auf mein leeres Konto überweise, ist mein Konto weiterhin so leer wie zuvor. Wiederum ist null die einzige Zahl mit dieser Eigenschaft.
In der Arithmetik sind m × n und n × m für alle Zahlen m und n identisch. Diese Übereinkunft besagt implizit, dass für alle n gilt: obwohl wir nicht «keine Kopien» von n addieren können. Und wie steht es mit der Division? Wenn man null durch eine Zahl ungleich null teilt, ist die Antwort einfach: Man erhält null. Die Hälfte von nichts oder ein Drittel von nichts ist nichts. Aber wenn es darum geht, eine Zahl durch null zu teilen, kommt die ungewöhnliche Natur von 0 wieder einmal zum Tragen: Was ist zum Beispiel 1:0? Wir definieren m:n als die Zahl q, die q × n = m erfüllt. Daher ist 1:0 die Zahl q, die q × 0 = 1 erfüllt. Eine solche Zahl gibt es jedoch nicht. Welche Zahl auch immer wir für q wählen, wir erhalten q × 0 = 0. Wir erhalten niemals 1. Die einfachste Weise, damit umzugehen, besteht darin, diese Tatsache einfach zu akzeptieren. Teilung durch 0 ist verboten, weil das Ergebnis keinen Sinn ergibt. Auf der anderen Seite dachten die Leute früher, 1:2 ergebe keinen Sinn, bis sie Brüche einführten, daher sollten wir vielleicht nicht so schnell aufgeben. Wir könnten versuchen, eine neue Zahl einzuführen, die uns erlaubt, durch 0 zu teilen. Das Problem ist, dass eine solche Zahl Grundgesetze der Arithmetik verletzt. So wissen wir beispielsweise, dass 1 × 0 = 2 × 0 ist, denn beide sind null. Teilt man beide Seiten durch 0, so ergibt dies 1 = 2, was unsinnig ist. Daher erscheint es vernünftig, Dividieren durch null zu verbieten.
Zahlen aus dem Nichts Das Konzept, das demjenigen von «nichts» am nächsten kommt, findet sich in der Mengenlehre. Eine Menge ist eine Ansammlung von mathematischen Objekten: Zahlen, Formen, Funktionen, Netzwerken … Sie ist dadurch definiert, dass man ihre Elemente auflistet oder charakterisiert. «Die Menge mit den Elementen 2, 4, 6, 8» und «die Menge der geraden ganzen Zahlen zwischen 1 und 9» definieren beide dieselbe Menge, die wir bilden können, indem wir ihre Elemente auflisten: wobei die Schweifklammern {} die Menge kennzeichnen, die von ihrem Inhalt gebildet wird. Um 1880 entwickelte der deutsche Mathematiker Georg Cantor eine umfassende Theorie der Mengen. Er hatte versucht, einige fachspezifische Probleme in der Analysis im Zusammenhang mit Unstetigkeiten zu lösen, Stellen, wo eine Funktion plötzlich einen Sprung macht. In seiner Antwort bezog er sich auf die Struktur der Menge der Unstetigkeiten. Es war nicht die individuelle Unstetigkeit, die eine Rolle spielte: Es war das ganze Drum und Dran. Was Cantor wegen der Verbindung zur Analysis wirklich interessierte, waren unendlich große Mengen. Er machte die dramatische Entdeckung, dass einige Unendlichkeiten größer sind als andere (siehe Kapitel [ ]). Wie ich in dem Abschnitt «Was ist eigentlich eine Zahl?» (ab Seite 22) erwähnte, griff ein anderer deutscher Mathematiker, Gottlob Frege, Cantors Ideen auf, doch er interessierte sich viel mehr für endliche Mengen. Frege
glaubte, sie könnten das große philosophische Problem der Natur der Zahlen lösen. Er dachte darüber nach, wie Mengen miteinander korrespondieren: zum Beispiel zusammenpassende Tassen und Untertassen. Die sieben Tage der Woche, die sieben Zwerge und die Zahlen von 1 bis 7, sie alle passen perfekt zusammen, daher definieren sie alle dieselbe Zahl. Welche dieser Mengen sollten wir wählen, um die Zahl 7 zu repräsentieren? Freges Antwort war umfassend: sie alle. Er definierte eine Zahl als die Menge aller Mengen, die mit einer gegebenen Menge übereinstimmen. Auf diese Weise ist keine Menge privilegiert, und die Wahl ist eindeutig, statt eine willkürliche Übereinkunft zu sein. Unsere Zahlennamen und Symbole sind lediglich konventionelle Etiketten für diese riesigen Mengen. Die Zahl «Sieben» ist die Menge aller Mengen, die mit den Zwergen korrespondieren, und es ist dieselbe Menge wie die Menge aller Mengen, die mit den Tagen der Woche oder der Liste {1, 2, 3, 4, 5, 6, 7} korrespondiert. Vielleicht ist es überflüssig, darauf hinzuweisen, dass dies zwar eine elegante Lösung des konzeptuellen Problems ist, aber keine vernünftige Notation darstellt. Als Frege seine Ideen in den Grundgesetzen der Arithmetik vorstellte, einem zweibändigen Werk, das 1893 und 1903 erschien, sah es so aus, als habe er das Problem gelöst. Nun wusste jedermann, was eine Zahl war. Aber kurz bevor Band II in Druck ging, schrieb Bertrand Russell Frege einen Brief, in dem es hieß (ich drücke es mit etwas anderen Worten aus): «Lieber Gottlob, denk an die Menge aller Mengen, die sich nicht selbst als Element enthalten.» Wie der Dorfbarbier, der alle Leute rasiert, die sich nicht selbst rasieren, ist diese Menge in sich widersprüchlich. Russells
Paradox, wie wir es heute nennen, zeigten die Gefahr, die mit der Annahme verbunden ist, dass es ausufernd große Mengen gibt (siehe Kapitel [ ]). Mathematische Logiker haben versucht, das Problem zu beheben. Die Antwort stellte sich als das absolute Gegenteil von Freges «Think Big»Strategie heraus, alle möglichen Mengen zusammenzuwerfen. Vielmehr bestand der Trick darin, nur eine einzige Menge herauszugreifen. Um die Zahl 2 zu definieren, konstruiere man eine Standardmenge mit zwei Elementen. Um 3 zu definieren, benutze man eine Standarmenge mit drei Elementen, und so weiter. Die dahinterstehende Logik ist kein Zirkelschluss, vorausgesetzt, dass man die Mengen zuerst konstruiert, ohne ausdrücklich Zahlen zu verwenden, und ihnen erst anschließend Zahlensymbole und Namen zuordnet. Das Hauptproblem bestand darin, zu entscheiden, welche Standardmengen man verwenden sollte. Sie mussten eindeutig definiert sein, und ihr Aufbau sollte mit dem Zählvorgang korrespondieren. Die Antwort brachte eine sehr spezielle Menge, die sogenannte leere Menge. Null ist eine Zahl, die Basis des ganzen Zahlensystems. Daher sollte sie die Elemente einer Menge zählen. Welcher Menge? Nun, es muss eine Menge ohne Elemente sein. Sich eine solche Menge auszudenken, fällt nicht schwer: «die Menge aller Mäuse, die mehr als 20 Tonnen wiegen». Mathematisch handelt es sich um eine Menge ohne Elemente: die leere Menge. Wiederum lassen sich leicht Beispiele finden: die Menge aller Primzahlen, die durch 4 teilbar sind, oder die Menge aller Dreiecke mit vier Ecken. Diese Mengen sehen verschieden aus – die eine wird von Zahlen, die andere von Dreiecken gebildet –, aber tatsächlich handelt es sich um
dieselbe Menge, denn tatsächlich enthält sie weder Zahlen noch Dreiecke, also lässt sich kein Unterschied erkennen. Sämtliche leeren Mengen haben genau die gleiche Anzahl von Elementen, nämlich keines. Daher ist die leere Menge eindeutig. Ihr Symbol, das von der anonymen Gruppe Bourbaki 1939 eingeführt wurde, ist Ø. Die Mengentheorie braucht Ø aus demselben Grund, wie die Arithmetik 0 braucht: Alles ist mit einem solchen Symbol viel einfacher. Tatsächlich können wir die Zahl 0 als die leere Menge definieren! Wie steht es mit der Zahl 1? Intuitiv ist uns klar, dass wir eine Menge mit genau einem Element brauchen. Etwas Eindeutiges. Nun … die leere Menge ist eindeutig. Daher definieren wir 1 als die Menge, deren einziges Element die leere Menge ist: als Symbol geschrieben {Ø}. Das ist nicht dasselbe wie die leere Menge, denn sie enthält ein Element, die leere Menge hingegen keines. Es stimmt schon, dieses Element ist zufälligerweise die leere Menge, doch dabei handelt es sich zweifellos um ein Element. Stellen Sie sich eine Menge wie eine leere Papiertüte vor. Die Menge, deren einziges Element eine leere Menge ist, ist eine Papiertüte, die eine leere Papiertüte enthält. Was etwas anderes ist – sie enthält eine Tüte. Abbildung 69: Wie man aus leeren Mengen Zahlen macht. Tüten stellen Mengen dar; ihre Elemente sind ihr Inhalt. Etikette geben den Namen der Menge an. Die Tüte selbst ist kein Teil des Inhalts dieser Menge, aber sie kann gleichzeitig auch Teil des Inhalts einer anderen Tüte sein.
Der entscheidende Schritt besteht darin, die Zahl 2 zu definieren. Wir brauchen eine eindeutig definierte Menge mit zwei Elementen. Warum also nicht die beiden einzigen zwei Mengen benutzen, die wir bisher erwähnt haben: Ø und {Ø}? Daher definieren wir 2 als die Menge {Ø,{Ø}}. Was dank unserer Definition dasselbe wie 0, 1 ist. Nun kristallisiert sich ein allgemeines Muster heraus. Man definiere 3 = 0, 1, 2, eine Menge mit drei Elementen – die wir alle bereits definiert haben. Dann 4 = 0, 1, 2, 3 und 5 = 0, 1, 2, 3, 4 und so weiter. Alles lässt sich zu der leeren Menge zurückverfolgen, zum Beispiel Sie wollen wahrscheinlich nicht wissen, wie die Zahl der Zwerge aussieht. Die Baumaterialien hier sind Abstraktionen: die leere Menge und der Akt, eine Menge zu bilden, indem man ihre Elemente auflistet. Doch die Art und Weise, wie diese Mengen miteinander verknüpft sind, führen zu einem wohl definierten Gerüst für das Zahlensystem – das intuitiv eben diese Zahl von Elementen enthält. Und die Geschichte ist an dieser Stelle noch nicht zu Ende. Sobald man die positiven ganzen Zahlen definiert hat, definiert man mit einer ähnlichen mengentheoretischen Trickserei negative Zahlen, Brüche, reelle Zahlen (unendliche Dezimalzahlen), komplexe Zahlen und so weiter, den ganzen Weg bis hinauf zum neuesten und ausgefallensten mathematischen Konzept in der Quantentheorie. So, nun kennen Sie das schreckliche Geheimnis der Mathematik: Alles basiert auf nichts.
Weniger als nichts Kann eine Zahl kleiner als null sein? Das ist bei Kühen unmöglich, es sei denn, man führt «virtuelle Kühe» ein, die man jemand anderem schuldet. Dann erhält man eine natürliche Erweiterung des Zahlenkonzepts, was das Leben für Mathematiker und Buchhalter wesentlich einfacher macht. Es gibt ein paar Überraschungen: minus mal minus ergibt plus. Warum ist das so? Negative Zahlen Nachdem wir in der Schule gelernt haben, wie man Zahlen addiert, bringt man uns bei, wie man die umgekehrte Operation durchführt: Subtraktion. Beispielsweise ist das Ergebnis von 4 – 3 diejenige Zahl, die 4 ergibt, wenn man 3 addiert. Was natürlich 1 ist. Die Subtraktion ist nützlich, weil sie uns
zum Beispiel sagt, wie viel Geld uns bleibt, wenn wir mit 4 Euro starten und 3 Euro ausgeben. Eine kleinere Zahl von einer größeren Zahl abzuziehen, bereitet wenig Probleme. Wenn wir weniger Geld ausgeben, als wir in der Tasche haben, bleibt noch immer etwas übrig. Aber was passiert, wenn wir eine größere Zahl von einer kleineren abziehen? Was ist 3 – 4? Wenn Sie drei 1-Euro-Münzen in Ihrer Tasche haben, können Sie nicht vier von ihnen herausnehmen und die dem Kassierer an der Supermarktkasse aushändigen. Doch im Zeitalter der Kreditkarten kann man problemlos Geld ausgeben, das man nicht hat – weder in der Tasche noch auf der Bank. Wenn das geschieht, häuft man Schulden an. In diesem Fall würden die Schulden 1 Euro betragen, ohne irgendwelche Zinsen zu berücksichtigen. Daher ist 3 – 4 in gewissem Sinne gleich 1, aber eine andere Art von 1: eine Schuld, kein Guthaben. Wenn 1 ein Gegenteil hat, dann ist es das. Um Schulden von Guthaben zu unterscheiden, setzen wir vor die Zahl ein Minuszeichen. Damit können wir schreiben und wir haben einen neuen Zahlentyp erfunden: eine negative Zahl. Geschichte der negativen Zahlen
Historisch waren die erste Erweiterung des Zahlensystems die Brüche (siehe Kapitel [ ]). Negative Zahlen waren die zweite. Ich werde diese Zahlentypen jedoch in der umgekehrten Reihenfolge diskutieren. Nach heutigem Wissensstand tauchten negative Zahlen erstmals in einem chinesischen Dokument aus der Han-Dynastie (202 v. Chr.–220 n. Chr.) mit dem Titel Jiu Zhang Suanshu (Neun Kapitel der Rechenkunst) auf. Abbildung 70: Links: Eine Seite aus den Neun Kapitel der Rechenkunst. Rechts: Chinesische Rechenstäbchen. Dieses Buch benutzt Hilfsmittel zum Rechnen: Rechenstäbchen. Dabei handelt es sich um Stäbchen aus Holz oder Knochen oder einem ähnlichen Material. Diese Stäbchen wurden in einem bestimmten Muster ausgelegt,
um Zahlen darzustellen. Auf der «Einerstelle» einer Zahl stellt ein waagerechtes Stäbchen «eins» dar, ein senkrechtes «fünf». Dasselbe gilt für die «Hunderterstelle». Auf den Stellen für «Zehner» und «Hunderter» kehrt sich die Richtung der Stäbchen um: Ein senkrechtes Stäbchen steht für «eins» und ein waagerechtes für «fünf». Die Chinesen ließen eine Lücke, wo wir eine 0 schreiben würden, aber eine solche Lücke übersieht man leicht. Daher hilft die Regel zur Richtungsumkehr, Verwirrung zu vermeiden, wenn zum Beispiel die Zehnerstelle leer ist. Die Methode ist weniger effizient, wenn mehrere Nullen aufeinanderfolgen, aber das ist selten. Abbildung 71: Wie die Orientierung der Rechenstäbchen ermöglicht, zwischen 405 und 45 zu unterscheiden. Die Neun Kapitel benutzten Stäbchen auch, um negative Zahlen darzustellen, und stützten sich dabei auf eine sehr einfache Idee: Sie wurden schwarz statt rot gefärbt. Daher ergeben 4 rote Stäbchen minus 3 rote Stäbchen 1 rotes Stäbchen aber
3 rote Stäbchen minus 4 rote Stäbchen ergeben ein schwarzes Stäbchen. In dieser Weise stellt eine Anordnung von schwarzen Stäbchen eine Schuld dar, und die Größe dieser Schuld ist gleich der entsprechenden Anzahl roter Stäbchen. Indische Mathematiker kannten ebenfalls negative Zahlen, und sie legten widerspruchsfreie Regeln fest, um mit ihnen zu rechnen. Das BakhshaliManuskript, das ungefähr aus der Zeit von 300 n. Chr. stammt, enthält Berechnungen mit negativen Zahlen, die durch ein +-Zeichen gekennzeichnet sind, wo wir heute ein – gebrauchen. (Mathematische Symbole haben sich im Lauf der Zeit wiederholt geändert, manchmal auch in einer Weise, die uns verwirrend erscheint.) Die Idee wurde von arabischen Mathematikern aufgegriffen und breitete sich schließlich bis nach Europa aus. Bis ins 17. Jahrhundert deuteten europäische Mathematiker ein negatives Ergebnis allgemein als Beweis, dass das betreffende Problem unlösbar war, aber Fibonacci verstand, dass es sich bei finanziellen Berechnungen als Schulden deuten ließ. Ab dem 19. Jahrhundert ließen sich Mathematiker durch negative Zahlen nicht mehr aus dem Konzept bringen. Darstellung negativer Zahlen Geometrisch lassen sich Zahlen bequem dadurch darstellen, dass man sie längs eines Strahls von links nach rechts unterbringt, wobei man bei 0 beginnt. Wir haben bereits gesehen, dass der Zahlenstrahl eine natürliche
Erweiterung besitzt, die negative Zahlen einbezieht und sich in die entgegengesetzte Richtung erstreckt. Abbildung 72: Zahlenstrahl: Positive Zahlen laufen nach rechts, negative nach links. Addition und Subtraktion lassen sich auf dem Zahlenstrahl einfach darstellen. Um beispielsweise 3 zu einer beliebigen Zahl zu addieren, muss man sich lediglich um 3 Einheiten oder Schritte nach rechts bewegen. Um 3 von einer beliebigen Zahl zu subtrahieren, muss man sich um 3 Schritte nach links bewegen. Diese Beschreibung ergibt das richtige Resultat für positive wie auch für negative Zahlen; wenn wir beispielsweise mit –7 starten und 3 addieren, bewegen wir uns drei Schritte nach rechts und erhalten –4. Die Regeln für das Rechnen mit negativen Zahlen zeigen auch, dass das Addieren oder Subtrahieren einer negativen Zahl dasselbe bewirkt wie die Subtraktion oder Addition der entsprechenden positiven Zahl. Um daher –3 zu addieren, bewegen wir uns drei Schritte nach links. Um –3 von einer beliebigen Zahl zu subtrahieren, bewegen wir uns 3 Schritte nach rechts. Die Multiplikation mit negativen Zahlen ist interessanter. Als wir uns das erste Mal mit Multiplizieren beschäftigt haben, haben wir es uns als wiederholtes Addieren vorgestellt. Beispielsweise ist Derselbe Ansatz spricht dafür, dass wir 6 × –5 in entsprechender Weise definieren sollten:
Nun besagt eine der Regeln der Mathematik, dass die Multiplikation zweier positiver Zahlen dasselbe Resultat ergibt, ganz gleich, welche Reihenfolge wir benutzen. Beispielsweise sollte 5 × 6 ebenfalls 30 ergeben. Tatsächlich ist das auch der Fall, denn Voilà! Daher erscheint es vernünftig, anzunehmen, dass dieselbe Regel für negative Zahlen gilt; in diesem Fall ist auch –5 × 6 = –30. Wie steht es mit –6 × –5? Das ist weniger eindeutig. Wir können nicht minus sechs Fünfen niederschreiben und sie addieren. Daher müssen wir uns an die Frage heranschleichen. Lassen Sie uns schauen, was wir bisher wissen: Es ist vernünftig, anzunehmen, dass die fehlende Zahl entweder 30 oder – 30 ist. Die Frage ist nur: Welche von beiden? Auf den ersten Blick kommen viele Leute zu der Ansicht, es müsse –30 sein. Die Psychologie dahinter scheint zu sein, dass die Berechnung sozusagen von Negativität durchdrungen ist und das Ergebnis daher ebenfalls negativ sein sollte. Dieselbe Art von Annahme steckt in dem Protest: «I didn’t do nothing» (wörtlich: Ich habe nicht nichts getan). Dabei
muss man jedoch darauf verweisen, dass man, wenn man nicht nichts getan hat, dann doch eben etwas getan hat. Ob das ein fairer Kommentar ist, hängt von den Grammatikregeln ab, die man benutzt. Das zusätzliche «not» kann auch als Bestärkung angesehen werden. In derselben Weise ist die Bedeutung von –6 × –5 eine Sache der Übereinkunft. Wenn wir neue Zahlen erfinden, gibt es keine Garantie, dass die alten Konzepte noch immer auf sie anwendbar sind. Daher hätten die Mathematiker entscheiden können, dass –6 × –5 = –30 ist. Was das angeht, hätten sie auch beschließen können, dass –6 × –5 ein rosa Flusspferd ist. Es gibt jedoch mehrere Gründe, warum –30 eine unpraktische Wahl ist, und sie alle weisen in die entgegengesetzte Richtung, 30. Einer dieser Gründe ist: Wenn –6 × –5 = –30 ist, dann ist dies dasselbe Ergebnis wie bei –6 × 5. Teilt man durch –6, erhält man –5 = 5, aber das steht im Widerspruch zu dem, was wir bereits im Zusammenhang mit negativen Zahlen entschieden haben. Ein zweiter Grund ist, dass wir bereits wissen, dass 5 + –5 = 0 ist. Werfen Sie einen Blick auf den Zahlenstrahl: Wo landet man von 5 ausgehend, wenn man sich 5 Schritte nach links bewegt? Bei 0. Nun, die Multiplikation einer beliebigen positiven Zahl mit 0 ergibt wieder 0, und es erscheint vernünftig, dasselbe für negative Zahlen anzunehmen. Daher ist es sinnvoll, davon auszugehen, dass –6 × 0 = 0 ist. Demnach gilt: Nach den üblichen arithmetischen Regeln ist dies gleich
Wenn wir uns für –6 × –5 = –30 entscheiden, erhalten wir –30 + –30 = –60. Das ergibt 0 = –60, was nicht sehr vernünftig klingt. Wenn wir auf der anderen Seite jedoch –6 × –5 = 30 gewählt hätten, erhalten wir und alles ergäbe einen Sinn. Ein dritter Grund ist die Struktur des Zahlenstrahls. Wenn wir eine positive Zahl mit –1 multiplizieren, verwandeln wir sie in die entsprechende negative Zahl, das ist so, als hätten wir die positive Hälfte des Zahlenstrahls um 180° um die Null und damit von rechts nach links bewegt. Wohin soll dann die negative Hälfte gehen? Wenn wir sie an Ort und Stelle lassen, hätte wir dieselbe Art Problem, denn –1 × –1 wäre –1, was gleich –1 × 1 ist, und wir kämen zu dem Schluss, dass –1 = 1 ist. Die einzig vernünftige Alternative besteht darin, die negative Hälfte des Zahlenstrahls ebenfalls um 180° zu drehen und ihn damit von links nach rechts zu bewegen. Das ist eine hübsche Lösung, denn nun dreht eine Multiplikation mit –1 den Zahlenstrahl und kehrt die Anordnung um. Daraus folgt ganz ohne Zweifel, dass eine erneute Multiplikation mit –1 den Zahlenstrahl um weitere 180° dreht. Das kehrt die Anordnung nochmals um, und alles endet dort, wo es begonnen hat. Tatsächlich beträgt der Gesamtwinkel 180° + 180° = 360°, ein vollständiger Kreis, und damit kehrt alles zum Ausgangspunkt zurück. Daher ist –1 × –1 der Punkt, wohin –1 geht, wenn man den Strahl dreht, und das ist 1. Und wenn man sich einmal dafür entschieden hat, dass –1 × – 1 = 1 ist, folgt daraus, dass –6 × –5 = 30 ist.
Abbildung 73: Eine Drehung des Zahlenstrahls um 180° entspricht einer Multiplikation jeder Zahl mit –1. Ein vierter Grund ist die Deutung eines negativen Geldbetrags als Schuld. Bei dieser Interpretation ergibt die Multiplikation eines Geldbetrags mit einer negativen Zahl dasselbe Resultat wie eine Multiplikation mit der entsprechenden positiven Zahl, außer dass das Guthaben zur Schuld wird. Nun, das Subtrahieren, also das «Wegnehmen» einer Schuld, ist dasselbe, als ob die Bank den Betrag, den Sie ihr schulden, aus ihren Unterlagen streicht, was darauf hinausläuft, dass sie Ihnen einen gewissen Betrag
zurückgibt. Eine Schuld von 10 Euro von Ihrem Konto abzuziehen, ist dasselbe, wie 10 Euro Ihres eigenen Geldes darauf zu deponieren: Es erhöht Ihr Guthaben um 10 Euro. Der Nettoeffekt von beiden Transaktionen führt unter diesen Umständen dazu, dass Ihr Konto zurück auf null geht, also wieder ausgeglichen ist. Daraus folgt, dass –6 × –5 denselben Effekt auf Ihren Kontostand hat wie das Wegnehmen von sechs Verschuldungen à 5 Euro, und das heißt, Ihren Kontostand um 30 Euro zu erhöhen. Um das Ergebnis unserer Diskussion kurz zusammenzufassen: Zwar steht uns im Prinzip frei, –6 × –5 so zu definieren, wie es uns gefällt, doch es gibt nur eine Wahl, die es erlaubt, die üblichen Rechenregeln auf negative Zahlen anzuwenden. Zudem erscheint diese Wahl sehr einleuchtend, wenn man sie auf die Interpretation negativer Zahlen als Schulden anwendet. Und diese Wahl führt dazu, dass minus mal minus plus ergibt.
KOMPLEXE ZAHLEN Als Mathematiker eine Zahl durch eine andere zu teilen versuchten und diese Rechnung nicht glatt aufging, erfanden sie die Brüche. Als sie eine größere Zahl von einer kleineren Zahl abziehen wollten, erfanden sie die negativen Zahlen. Wenn sich eine Rechenoperation nicht durchführen lässt, erfinden Mathematiker etwas Neues, das die ganze Sache dennoch möglich macht. Als es wirklich lästig wurde, dass sich aus negativen Zahlen keine Quadratwurzeln ziehen ließen … nun, was denken Sie, was dann geschah?
Imaginäre Zahlen In dem Abschnitt «Das ständig wachsende Zahlensystem» (ab Seite 16) habe ich gesagt, dass wir dazu neigen, Zahlen als starr und unveränderlich anzusehen, aber tatsächlich handelt es sich um menschliche Erfindungen. Zahlen erwuchsen aus dem Zählen, doch das Zahlenkonzept wurde wiederholt erweitert: Null, negative Zahlen, rationale Zahlen (Brüche), reelle Zahlen (unendliche Dezimalzahlen). Trotz aller technischen Unterschiede fühlen sich all diese Systeme ähnlich an. Man kann mit ihnen rechnen, und man kann zwei beliebige Zahlen vergleichen, um zu entscheiden, welche größer ist. Das heißt, dem Ganzen wohnt eine Vorstellung von Ordnung inne. Ab dem 15. Jahrhundert fragten sich einige Mathematiker jedoch, ob es vielleicht einen neuen Zahlentyp mit weniger vertrauten Eigenschaften geben könnte, für die die übliche Beziehung «größer als» keine Bedeutung mehr hat.
Da minus mal minus gleich plus ist, ist die Quadratzahl einer jeden reellen Zahl positiv. Daher haben negative Zahlen innerhalb des Systems reeller Zahlen keine Quadratwurzeln. Das ist recht unbequem, vor allem in der Algebra. Einige seltsame Ergebnisse in der Algebra, die Formeln für die Lösung von Gleichungen liefern, sprachen jedoch dafür, dass es eine Möglichkeit geben muss, Ausdrücke wie sinnvoll zu machen. Daher kamen Mathematiker nach vielem Nachdenken zu dem Entschluss, einen neuen Zahlentyp zu erfinden, der diese fehlenden Quadratwurzeln liefert. Der entscheidende Schritt ist, eine Quadratwurzel für –1 einzuführen. Euler führte das Symbol i als Darstellung von in einem Artikel ein, den er 1777 in Französisch veröffentlichte. i wurde darin als imaginäre Zahl bezeichnet, weil sie sich nicht wie eine traditionelle «reelle» Zahl verhielt. Nachdem i etabliert worden war, musste man verwandte Zahlen wie 2 + 3i erlauben, die man als komplexe Zahlen bezeichnet. Daher erhält man nicht nur eine einzige Zahl, sondern ein ganz neues, erweitertes Zahlensystem. Logisch basieren komplexe Zahlen auf reellen Zahlen. Die Logik wird jedoch von dem übertroffen, was Terry Pratchett, Jack Cohen und ich in der Reihe über die Wissenschaft der Scheibenwelt «Narrativium» nennen: Die Macht des Erzählens. Die mathematischen Geschichten hinter den Zahlen sind das wirklich Wichtige, und wir brauchen komplexe Zahlen, um einige dieser Geschichten zu erzählen – selbst Geschichten von Zahlen, die uns besser vertraut sind.
Komplexe Zahlen Arithmetik und Algebra komplexer Zahlen sind recht simpel. Man benutzt die normalen Regeln der Addition und der Multiplikation mit einer 2 Zusatzregel: Wann immer man i schreibt, ersetzt man es durch –1. Zum Beispiel Als die Pioniere diese Idee weiter erkundeten, erhielten sie etwas, das wie ein logisch widerspruchsfreier Zahlentyp aussah und das System der reellen Zahlen erweiterte. Es gab Präzedenzfälle. Das Zahlensystem war seit seinen Ursprüngen – dem Zählen mit ganzen Zahlen – bereits mehrfach erweitert worden. Doch diesmal musste die Vorstellung von einem «größer als» geopfert werden. Sie funktionierte prima für die bereits existierenden Zahlen, doch man kam in Teufels Küche, wenn man annahm, sie ließen sich auch auf die neuen Zahlen anwenden. Zahlen, die keine Größe haben! Höchst eigenartig! So eigenartig, dass Mathematiker bei dieser Gelegenheit nicht umhinkonnten festzustellen, dass sie das Zahlensystem erweiterten, und sich fragten, ob das legitim sei. Diese Fragen hatten sie sich zuvor nicht wirklich gestellt, weil Brüche und negative Zahlen einfache Pendants in der wirklichen Welt haben. Aber i war lediglich ein Symbol, das sich in einer Weise verhielt, die zuvor als unmöglich gegolten hatte.
Schließlich setzte sich der Pragmatismus durch. Die Schlüsselfrage war nicht, ob die neue Art Zahlen «wirklich» existierte, sondern ob es nützlich wäre, dies anzunehmen. Es war bekannt, dass reelle Zahlen in den Naturwissenschaften von Nutzen sind, um Messungen physikalischer Größen präzise wiederzugeben. Nicht bekannt war jedoch, ob die Quadratwurzel einer negativen Zahl physikalisch sinnvoll war. Auf einem Lineal konnte man sie jedenfalls nicht entdecken. Zur Überraschung von Mathematikern, Physikern und Ingenieuren in aller Welt stellten sich komplexe Zahlen jedoch als überaus nützlich heraus. Sie schlossen eine eigenartige Lücke in der Mathematik. So lassen sich die Lösungen von Gleichungen beispielsweise viel besser handhaben, wenn man komplexe Zahlen erlaubt. Tatsächlich war das der Hauptgrund für die Einführung komplexer Zahlen. Aber das war noch nicht alles. Komplexe Zahlen ermöglichten die Lösung von Problemen auf ganz verschiedenen Gebieten der mathematischen Physik: Magnetismus, Elektrizität, Wärmelehre, Akustik, Schwerkraft und Hydrodynamik. Was bei solchen Problemen eine entscheidende Rolle spielt, ist nicht der Betrag irgendeiner physikalischen Größe, die sich mit einer bestimmten Zahl angeben lässt, sondern die Richtung, in die sie weist. Da komplexe Zahlen in der Ebene existieren (siehe unten), definieren sie eine Richtung: die Gerade zwischen 0 und der betreffenden Zahl. Daher eignet sich jedes Problem, bei dem es um Richtungen in der Ebene geht, potenziell für eine Bearbeitung mit komplexen Zahlen, und die Physik war voller solcher Fragen. Tatsächlich stellten sich auch weniger konkrete Deutungen komplexer Zahlen als nützlich heraus. Vor allem erweisen sie sich als ideal zur Beschreibung von Wellen.
Lange Zeit wurden komplexe Zahlen zu solchen Zwecken eingesetzt, auch wenn niemand erklären konnte, was diese Zahlen eigentlich bedeuteten. Sie waren einfach zu nützlich, um sie zu ignorieren, und da sie offenbar immer funktionierten, gewöhnten sich alle an sie und vergaßen fast, sich länger den Kopf über ihre Bedeutung zu zerbrechen. Schließlich gelang es einigen Mathematikern, die Idee der komplexen Zahlen so einzuführen, dass man ihre logische Stimmigkeit beweisen konnte: indem sie diese Zahlen mit Hilfe von Koordinaten in der Ebene interpretierten. Die komplexe Ebene (Gauß’sche Zahlenebene) Geometrisch lassen sich reelle Zahlen als Punkte auf einer Geraden, dem Zahlenstrahl, interpretieren, der eindimensional ist. Analog lassen sich komplexe Zahlen als Punkte in einer Ebene darstellen, die zweidimensional ist. Es gibt zwei «unabhängige» Grundzahlen, 1 und i, und jede komplexe Zahl ist eine Kombination dieser beiden. Die Ebene kommt ins Spiel, weil die Multiplikation von Zahlen mit –1 den Zahlenstrahl um 180° kreisen lässt (siehe Kapitel [–1]). Daher gilt: Was auch immer die Quadratwurzel von –1 bedeutet, sie macht vermutlich etwas mit dem Zahlenstrahl, und was auch immer sie macht, muss sie ihn, wenn es zweimal hintereinander gemacht wird, um 180° drehen. Was also dreht Dinge um einen Winkel von 180°, wenn man es zweimal macht? Etwas, das Dinge um 90° dreht. Wir dürfen daher vermuten, dass man die Quadratwurzel von –1 als eine 90°-Drehung des Zahlenstrahls interpretieren kann. Wenn wir ein Bild
zeichnen, stellen wir fest, dass dies den Zahlenstrahl nicht auf sich selbst zurückführt. Vielmehr schafft es einen zweiten Zahlenstrahl im rechten Winkel zum üblichen Zahlenstrahl. Der erste Strahl wird als Strahl der reellen Zahlen bezeichnet. Der zweite Strahl ist derjenige, der von den imaginären Zahlen, wie der Quadratwurzel von –1, bevölkert wird. Wenn man beide als Koordinatenachsen in der Ebene kombiniert, erhalten wir die komplexen Zahlen. «Reell» und «imaginär» sind Namen, die Jahrhunderte weit zurückdatieren, und sie spiegeln eine Sichtweise der Mathematik wider, die wir nicht länger teilen. Heutzutage betrachten wir alle mathematischen Konzepte als mentale Modelle der Realität, nicht als die Realität selbst. Daher sind die reellen Zahlen nicht realer als ihre imaginären Pendants. Die reellen Zahlen korrespondieren jedoch ziemlich direkt mit der Vorstellung vom Messen einer Geraden in der wirklichen Welt, während sich die imaginären Zahlen nicht direkt in dieser Art interpretieren lassen. Daher haben diese Namen bis heute überdauert.
Abbildung 74: Wenn man den Zahlenstrahl um 90° (rechter Winkel) dreht, erhält man einen zweiten Zahlenstrahl. Wenn wir die üblichen reellen Zahlen nehmen und diese neue Zahl i dazuwerfen, müssen wir auch in der Lage sein, Kombinationen wie 3 + 2i darzustellen. Diese Zahlen korrespondieren mit dem Punkt in der Ebene, der die Koordinaten (3, 2) hat. Das heißt, dieser Punkt liegt 3 Einheiten entlang der Realachse, gefolgt von 2 Einheiten parallel zur Imaginärachse. Allgemein gesprochen korrespondiert z = x + iy mit dem Punkt mit den Koordinaten (x, y).
Diese geometrische Deutung komplexer Zahlen wird gelegentlich als Argand-Diagramm bezeichnet, benannt nach dem französischen Mathematiker Jean-Robert Argand, der es 1806 beschrieb. Die Idee geht jedoch auf den norwegisch-dänischen Geodäten Caspar Wessel zurück, der 1797 eine Arbeit mit dem Titel Om Directiones analytiske betegning (Über die analytische Repräsentation der Richtung) bei der Königlich Dänischen Akademie der Wissenschaften einreichte, die 1799 veröffentlicht wurde. Damals war Dänemark gerade zeitweilig mit Norwegen vereinigt. Sein Artikel fand damals wenig Beachtung, weil kaum ein Wissenschaftler Dänisch lesen konnte. Gauß formulierte in seiner Doktorarbeit 1799 unabhängig von Wessel dieselbe Idee und erkannte später, dass sich die Beschreibung vereinfachen ließ, wenn man Koordinaten benutzte, um eine komplexe Zahl als ein Paar (x, y) von reellen Zahlen zu betrachten. In den 1830er Jahren definierte Hamilton komplexe Zahlen als «Paare von reellen Zahlen», wobei er damit ein geordnetes Paar meinte. So definieren wir komplexe Zahlen heute. Ein Punkt in der Ebene ist ein geordnetes Paar (x, y), und das Symbol x + iy ist lediglich ein anderer Name für diesen Punkt oder dieses Paar. Der geheimnisvolle Ausdruck i ist dann nichts anderes als das geordnete Paar (0, 1). Der entscheidende Punkt ist, dass wir Addition und Multiplikation für diese Paare folgendermaßen definieren müssen:
Woher kommen diese Gleichungen? Sie ergeben sich, wenn man x + iy und u + iv addiert oder multipliziert, die Standardgesetze der Algebra 2 voraussetzt und i durch –1 ersetzt. Diese Berechnungen motivieren die Definitionen, doch wir haben die algebraischen Gesetze angenommen, um herauszufinden, wie die Definitionen aussehen sollten. Diese Logik erscheint nicht länger als Zirkelschluss, wenn wir die algebraischen Gesetze für diese Paare allein auf der Basis der formalen Definitionen verifizieren. Es ist nicht überraschend, dass das alles funktioniert, aber es muss überprüft werden. Die Argumentation ist langwierig, aber nicht besonders kompliziert. Einheitswurzeln Das Wechselspiel zwischen Algebra und Geometrie bei komplexen Zahlen ist wirklich verblüffend. Nirgendwo ist das offensichtlicher als für die n Einheitswurzeln: Lösungen der Gleichungen z = 1 für komplexes z und ganzzahlige Zahlen n. Beispielsweise erfüllt die 5. Einheitswurzel die 5 Gleichung z = 1. Eine offensichtliche Lösung ist z = 1, die einzige reelle Lösung. Bei 2 3 4 komplexen Zahlen gibt es jedoch vier weitere, und zwar ζ, ζ , ζ und ζ , wobei ist. Hier ist 72° = . Es gibt exakte Formeln:
Abbildung 75: Die fünf 5. Einheitswurzeln in der komplexen Ebene. Diese fünf Punkte bilden die Ecken eines regelmäßigen Fünfecks, eine Tatsache, die sich mit Hilfe der Trigonometrie beweisen lässt. Die Grundidee ist, dass genauso, wie die Multiplikation mit i die komplexe Ebene um 90° dreht, die Multiplikation mit ζ die komplexe Ebene um 72° dreht. Wenn man diese Rotation fünf Mal wiederholt, erhält man eine Drehung um 360°, was genauso ist wie gar keine Drehung oder eine 5 Multiplikation mit 1. Daher ist ζ = 1.
n Allgemeiner ausgedrückt hat die Gleichung z = 1 genau n Lösungen: 1, 2 3 ζ, ζ , ζ … ζ n–1 , wobei nun gilt: Diese Ideen liefern eine algebraische Interpretation des regelmäßigen Fünfecks, die eingesetzt wird, um Konstruktionen mit Zirkel und Lineal in der euklidischen Geometrie zu untersuchen (siehe Kapitel [17]).
RATIONALE ZAHLEN Nun schauen wir uns die Brüche an, die von Mathematikern als rationale Zahlen bezeichnet werden. Historisch gesehen traten Brüche auf, wenn Güter oder Besitz unter mehreren Leuten geteilt werden mussten, sodass jeder seinen Anteil bekam. Alles begann mit , ein Bruch, der auftritt, wenn zwei Leute einen gleich großen Anteil erhalten. Das Ergebnis war ein Zahlensystem, in dem eine Division stets möglich ist, mit Ausnahme der Teilung durch null.
Das Unteilbare teilen Nun kommen wir zu den Brüchen. Mathematiker bevorzugen einen vornehmeren Ausdruck: rationale Zahlen. Dabei handelt es sich um Zahlen wie , oder , die entstehen, wenn man eine ganze Zahl durch eine andere teilt. Versetzen Sie sich doch einmal zurück in die Tage, als man unter «Zahl» eine ganze Zahl verstand. In dieser Welt erschien eine Division durchaus vernünftig, solange eine Zahl genau in eine andere passte, beispielsweise = 4. Aber auf diese Weise erhält man nichts Neues. Brüche werden gerade dann interessant, wenn die Division zu keinem glatten Ergebnis führt. Genauer gesagt, wenn das Ergebnis keine ganze Zahl ist. Denn dann brauchen wir eine neue Art von Zahl. Der einfachste Bruch und derjenige, dem wir im Alltag am häufigsten begegnen, ist eine Hälfte: . Das Oxford English Dictionary definiert sie als «einer von zwei gleichen oder korrespondierenden Teilen, in die etwas
geteilt wird oder geteilt werden kann». Auf Hälften stößt man im Alltag ständig: ein halber Liter Bier oder Milch, die beiden Hälften eines Fußballoder Rugbyspiels, Sonderangebote oder Tickets zum halben Preis, eine halbe Stunde, ein halbes Leben. Halb voll oder halb leer? Frisch gewagt ist halb gewonnen … ist nicht nur der einfachste, sondern auch wohl der wichtigste Bruch. Euklid wusste, wie man Geraden und Winkel halbiert, also in zwei gleiche Teile teilt. Eine komplexere Eigenschaft spielt in der analytischen Zahlentheorie eine wichtige Rolle: Man nimmt an, dass die nichttrivialen Nullstellen der Riemann’schen Zeta-Funktion stets den Realteil von haben. Diese Annahme zu beweisen, ist wahrscheinlich das wichtigste ungelöste Problem in der ganzen Mathematik. Einen Winkel teilen Die Besonderheit von taucht bereits früh in der euklidischen Geometrie auf. In Buch I, These 9 der Elemente findet sich eine Konstruktion, «um einen gegebenen Winkel in zwei gleich Teile zu teilen», das heißt, um einen halb so großen Winkel zu produzieren. Und das geht so: Gegeben sei ein Winkel BAC; mit Hilfe eines Zirkels konstruiert man auf den geraden AB und AC in gleichem Abstand von A die Punkte D und E. Nun schlägt man einen Kreis mit dem Radius DE um D und einen Kreis mit dem Radius ED um E. Diese beiden Kreise schneiden sich in dem Punkt F, der den gleichen Abstand von D und von E hat. Dementsprechend teilt die Gerade AF den
Winkel BAC in zwei gleich große Hälften. Tatsächlich beschreibt Euklid den letzten Schritt etwas anders: Man konstruiere ein gleichseitiges Dreieck DEF. Dies ist eine taktische Entscheidung, die auf dem basiert, was er zuvor bewiesen hat, und führt zu genau dem gleichen Ergebnis, denn das Dreieck DEF ist gleichseitig. Abbildung 76: Wie man einen Winkel halbiert. Der tiefere Grund, warum diese Konstruktion funktioniert, ist Symmetrie. Die gesamte Zeichnung ist spiegelsymmetrisch zur AF-Achse. Die Spiegelsymmetrie ist eine Symmetrie zweiter Ordnung; wenn man die Operation zweimal durchführt, gelangt man wieder an den Ausgangspunkt.
Daher ist es nicht überraschend, dass sich ein Winkel in zwei gleiche Teile teilen lässt. Euklid zeigt uns nicht, wie man einen beliebigen Winkel drittelt, also in drei gleiche Teile zerlegt, was dem Bruch entsprechen würde. Wie wir in Kapitel [3] gesehen haben, haben Mathematiker rund 2000 Jahre später bewiesen, dass dies mit traditionellen Werkzeugen wie einem (unmarkierten) Lineal und einem Zirkel unmöglich ist. Tatsächlich haben die einzigen Brüche eines beliebigen Winkels, die sich auf diese Weise konstruieren lassen, die Form : Man teile k mal durch 2 und mache dann p Kopien. Grundsätzlich ist das Einzige, was man tun kann, wiederholtes Halbieren. Daher nimmt in der Geometrie eine ganz besondere Stellung ein. Die Riemann-Hypothese In der höheren Mathematik taucht in dem wohl wichtigsten ungelösten Problem des ganzen Fachgebiets auf: der Riemann-Hypothese. Dabei handelt es sich um eine täuschend einfach scheinende Vermutung, die 1859 von Georg Bernhard Riemann aufgestellt wurde. Es handelt sich um eine tiefgründige Eigenschaft eines cleveren technischen Hilfsmittels, der ZetaFunktion ζ(z). Hier ist z eine beliebige komplexe Zahl, und ζ ist der griechische Buchstabe Zeta. Die Zeta-Funktion ist eng mit Primzahlen
verknüpft; daher können mächtige Techniken, die komplexe Zahlen verwenden, diese Funktion einsetzen, um die Anordnung von Primzahlen zu untersuchen. Leider können wir solche Techniken jedoch nicht richtig nutzen, bis wir einige Grundstrukturen der Zeta-Funktion herausgefunden haben, und an dieser Stelle wird’s schwierig. Die entscheidenden Merkmale sind die Nullstellen der Zeta-Funktion: diejenigen komplexen Zahlen z, für die ζ(z) = 0 ist. Einige Nullstellen lassen sich leicht finden: sämtliche negativen ganzen Zahlen, also z = –2, –4, –6, –8 … Riemann konnte jedoch beweisen, dass es unendlich viele andere Nullen gibt, und er fand sechs davon: (Die Nullstellen treten stets paarweise mit positiven oder negativen Imaginärteilen auf.) Man braucht kein großes mathematisches Einfühlungsvermögen, um festzustellen, dass diese sechs Zahlen eine interessante Gemeinsamkeit aufweisen: Sie alle haben die Form + iy. Das heißt, der Realteil ist gleich . Riemann vermutete nun, dass dies für alle Nullstellen der Zeta-Funktion mit Ausnahme der negativen geraden Zahlen zutrifft. Diese Vermutung wurde als Riemann-Hypothese bekannt. Wenn sie richtig wäre – und alle Hinweise deuten darauf hin –, so hätte dies zahlreiche weitreichende Konsequenzen. Dasselbe gilt für eine ganze Reihe von Verallgemeinerungen, die womöglich noch wichtiger sind.
Trotz 150 Jahren intensiver Suche ist bisher noch kein Beweis gefunden worden. Die Riemann-Hypothese ist und bleibt eines der verblüffendsten und irritierendsten Rätsel in der ganzen Mathematik. Ihre Lösung wäre eines der dramatischsten Ereignisse in der Geschichte der Mathematik. Der Weg zur Riemann-Hypothese begann mit der Entdeckung, dass individuelle Primzahlen zwar verblüffend unregelmäßig erscheinen, Primzahlen als Kollektiv jedoch klare statistische Verteilungsmuster aufweisen. Im Jahr 1835 versetzte Adolphe Quetelet seine Zeitgenossen dadurch in Erstaunen, dass er mathematische Regelmäßigkeiten bei soziologischen Ereignissen entdeckte, die auf bewussten menschlichen Entscheidungen oder Interventionen des Schicksals beruhten: Geburten, Eheschließungen, natürliche Todesfälle und Selbsttötungen. Die Muster waren statistischer Natur: Sie bezogen sich nicht auf Individuen, sondern auf das durchschnittliche Verhalten einer großen Anzahl von Menschen. Etwa um dieselbe Zeit begannen Mathematiker zu verstehen, dass derselbe Trick auch bei Primzahlen funktioniert. Obwohl jede Primzahl ein eingefleischter Individualist ist, zeigen sie, gemeinsam betrachtet, verborgene Muster. Als Gauß etwa 15 Jahre alt war, notierte er in seiner Logarithmentafel: Wenn x groß ist, beträgt die Anzahl der Primzahlen kleiner oder gleich x ungefähr . Diese Erkenntnis wurde als «Primzahlsatz» bekannt, doch anfangs fehlte ein Beweis, daher war es eigentlich eine PrimzahlenVermutung. 1848 und 1850 versuchte der russische Mathematiker Pafnuti Lwowitsch Tschebyschow, den Primzahlensatz mittels Analysis zu beweisen. Auf den ersten Blick besteht keinerlei offenkundige Verbindung;
man könnte genauso gut versuchen, diesen Satz per Hydrodynamik oder mit Hilfe des Rubik-Würfels zu beweisen. Euler hatte jedoch bereits eine seltsame Verknüpfung zwischen den beiden Gebieten festgestellt: die Formel bei der p sämtliche Primzahlen durchläuft und s jede beliebige reelle Zahl größer 1 ist. Die Bedingung s > 1 ist erforderlich, damit die Reihe auf der rechten Seite einen sinnvollen Wert ergibt. Der Hauptgedanke hinter der Formel besteht darin, die Eindeutigkeit der Primfaktorisierung (oder Primfaktorzerlegung) in der Sprache der Analysis auszudrücken. Die ZetaFunktion ζ(z) ist die Reihe auf der rechten Seite der Gleichung; ihr Wert hängt von s ab. Tschebyschow benutzte Eulers Formel, um zu beweisen, dass die Anzahl der Primzahlen kleiner oder gleich x für große x recht nahe bei liegt. Tatsächlich liegt das Verhältnis zwischen zwei Konstanten, die eine etwas größer als 1, die andere etwas kleiner. Das war nicht ganz so präzise wie der Primzahlsatz, führte aber zu einem Beweis für eine andere bedeutende Vermutung, dem Bertrand’schen Postulat von 1845: Wenn man eine beliebige ganze Zahl nimmt und sie verdoppelt, dann liegt zwischen diesen beiden Zahlen mindestens eine Primzahl.
Riemann fragte sich, ob man Eulers Idee durch die Anwendung neuer Techniken mächtiger machen könne, und das führte ihn zu einer ehrgeizigen Erweiterung der Zeta-Funktion: Er entschloss sich, sie nicht nur für reelle Zahlen, sondern auch für komplexe Zahlen zu definieren. Eulers Reihe ist ein guter Startpunkt dafür. Die Reihe ergibt für komplexe s durchaus Sinn, vorausgesetzt, der Realteil von s ist größer als 1. (Das ist eine technische Voraussetzung, die impliziert, dass die Reihe konvergiert: Die Summe ergibt einen sinnvollen Wert, wenn sie unendlich viele Glieder hat.) Riemanns erste große Erkenntnis war, dass er es besser konnte. Er konnte ein Verfahren benutzen, das als analytische Fortsetzung bezeichnet wird, um die Definition von ζ(s) auf alle komplexen Zahlen mit Ausnahme von 1 zu erweitern. Dieser Wert wird ausgeschlossen, weil die ZetaFunktion unendlich wird, wenn s = 1 ist. Diese sogenannte analytische Fortsetzung impliziert, dass alle negativen geraden ganzen Zahlen Nullstellen sind. Das lässt sich anhand der Reihe nicht sofort erkennen. Die Fortsetzung weist auch auf neue Eigenschaften der Zeta-Funktion hin, die Riemann erforschte. 1859 stellte er seine Ideen in einem Artikel Über die Anzahl der Primzahlen unter einer gegebenen Größe vor. Darin gab er eine exakte Formel für die Anzahl der Primzahlen unterhalb einer gegebenen reellen Zahl x an. Vereinfacht ausgedrückt besagt sie, dass die Summe der Logarithmen dieser Primzahlen näherungsweise
beträgt. Hier zeigt ∑ eine Summe über sämtliche Zahlen ρ an, für die ζ(ρ) null ist, wobei die negativen geraden ganzen Zahlen ausgeschlossen sind. Wenn wir genug über die Nullstellen in der Zeta-Funktion wissen, können wir aus der Riemann-Formel eine ganze Menge neuer Informationen über Primzahlen erschließen. Insbesondere können wir anhand der Realteile der Nullstellen auf statistische Eigenschaften von Primzahlen rückschließen: Wie viele von ihnen es bis zu einem bestimmten Wert gibt, wie sie zwischen den anderen ganzen Zahlen verteilt sind, und so weiter. In diesem Zusammenhang zahlt sich die Riemann-Hypothese aus … falls sie sich beweisen lässt. Riemann hatte den Weitblick, diese Möglichkeit zu sehen, doch er führte sein Programm niemals bis zu einer soliden Schlussfolgerung fort. Doch im Jahr 1896 benutzten Jacques Hadamard und Charles Jean de la Valée Poussin unabhängig voneinander Riemanns Vision, um den Primzahlsatz abzuleiten. Das gelang ihnen, indem sie eine schwächere Eigenschaft der nichttrivialen Nullstellen der Zeta-Funktion ableiteten: Der Realteil liegt zwischen 0 und 1. Im Jahr 1903 zeigte Jorgen Gram numerisch, dass die ersten zehn (±Paare von) Nullstellen auf der kritischen Geraden (das ist die Gerade, auf der alle komplexen Zahlen mit Realteil liegen) liegen. Bis 1935 hatte E.C. Titchmarsh die Zahl auf 193 erhöht. 1936 bewiesen Titchmarsh und Leslie Comrie, dass die ersten 1041 Nullstellenpaare auf der kritischen Geraden liegen – das war das letzte Mal, dass irgendjemand solche Berechnungen per Hand durchführte. 1953 entdeckte Alan Turing eine effizientere Methode und zeigte per Computer, dass die ersten
1104 Nullenpaare auf der kritischen Geraden liegen. Der gegenwärtige Rekord, der von Yannick Saouter und Patrick Demichel 2004 aufgestellt 13 wurde, besagt, dass die ersten 10 Billionen (10 ) nichttrivialen Nullstellen auf der kritischen Geraden liegen. Mathematiker und Computerwissenschaftler haben inzwischen andere Bereiche von Nullstellen überprüft. Bis heute liegen sämtliche nichttrivialen Nullstellen, die berechnet wurden, auf der kritischen Geraden. Leider ist eine experimentelle Beweisführung dieser Art in diesem Bereich der Zahlentheorie weniger aussagekräftig, als man erwarten sollte. Viele andere Vermutungen, für die es anscheinend eine Menge Belege gab, haben sich letztlich als falsch erwiesen. Es bedarf nur eines einzigen Gegenbeispiels, um das ganze Gebäude zum Einsturz zu bringen, und soweit wir wissen, könnte diese Ausnahme so groß sein, dass wir ihr mit unseren Berechnungen bisher nicht einmal nahe gekommen sind. Aus diesem Grund bestehen Mathematiker auf Beweisen – und das ist es, was den Fortschritt auf diesem Gebiet seit mehr als 150 Jahren aufhält.
Näherungen für π In der Schule wird den Schülern häufig geraten, mit π = zu rechnen. Aber können wir das tatsächlich tun, wenn wir das Gleichheitszeichen ernst nehmen? Und selbst wenn uns eine kleine Abweichung nicht stört, woher kommt dieser spezielle Bruch? Die Rationalisierung von π Die Zahl π kann nicht genau gleich Kapitel [ sein, weil sie irrational ist (siehe ] und [π]); das heißt, π ist kein Bruch , bei dem p und q ganze Zahlen sind. Diese Tatsache, die von Mathematikern schon lang vermutet worden war, wurde 1768 von Johann Lambert bewiesen. Seitdem sind mehrere weitere Beweise gefunden worden. Insbesondere impliziert dies, dass die Dezimalentwicklung von π unablässig weitergeht, ohne dass
sich dieselbe Ziffernfolge unablässig wiederholt. Das bedeutet jedoch nicht, dass ein bestimmter Zahlenblock wie 12345 nicht mehrfach auftauchen kann; tatsächlich wiederholt er sich sogar höchstwahrscheinlich unendlich oft. Aber man kann π nicht darstellen, indem man eine bestimmte feste Ziffernfolge unendlich oft wiederholt. Die Schulmathematik umgeht diese Schwierigkeit, indem sie eine einfache Näherung für π benutzt, nämlich oder . Man muss nicht beweisen, dass π irrational ist, um zu erkennen, dass dies nicht genau stimmt: Zudem ist wie jede rationale Zahl eine Dezimalzahl mit einer sich wiederholenden Ziffernfolge, und ihre Dezimalstellen wiederholen unablässig den Block 142857. Die ganze Geschichte hindurch sind verschiedene rationale Zahlen verwendet worden, um π näherungsweise zu beschreiben. Um 1900 v. Chr. stellten babylonische Mathematiker Berechnungen an, die der Näherung π ~ = entsprachen.
Der mathematische Papyrus Rhind wurde von einem Schreiber namens Ahmose in der Zweiten Zwischenzeit um 1650–1550 v. Chr. verfasst und gilt in wesentlichen Teilen als Kopie eines über zwei Jahrhunderte älteren Papyrus aus dem Mittleren Reich um 2055–1650 v. Chr. Darin findet sich unter anderem eine näherungsweise Berechnung des Flächeninhalts eines Kreises; in moderne Begriffe übersetzt, entspricht das Ergebnis einer Näherung von π durch den Bruch . Es ist jedoch nicht klar, ob die alten Ägypter eine spezielle Konstante analog π verwendeten. Etwa um 900 v. Chr. benutzte der indische Astronom Yajnavalkya in seinem Werk Shatapatha Brahmana als Näherung für π. Um 250 v. Chr. bewies der antike griechische Gelehrte Archimedes, einer der größten Mathematiker, die jemals gelebt haben, und zudem ein ausgezeichneter Ingenieur, in voller logischer Strenge, dass π kleiner als und größer als ist. Um 150 v. Chr. benutzte Ptolemäus für π die Näherung . Um 250 n. Chr. zeigte der chinesische Mathematiker Liu Hui, dass π ~ ist. Wir können diese Näherungen vergleichen, indem wir sie auf fünf Dezimalstellen berechnen: Zahl Auf 5 Stellen π 3,14159 3,14285 Relativer Fehler 4% zu groß
Tabelle 9 3,12500 5% zu klein 3,16049 6% zu groß 3,13888 8% zu klein 3,14084 2% zu klein 3,14166 0,2% zu groß 3,14160 0,02% zu groß
Abbildung 77: Ausschnitt aus dem Papyrus Rhind
Die Türme von Hanoi Auf den ersten Blick würde man kaum auf den Gedanken kommen, dass etwas Besonderes ist. So ging es mir jedenfalls, selbst nachdem ich einige Forschungen betrieben hatte, die genau zu dieser Zahl führten. Aber wie sich herausgestellt hat, steht dieser Bruch in enger Beziehung zu einem berühmten mathematischen Knobelspiel, den Türmen von Hanoi, und zudem zu einer noch berühmteren Form, dem Sierpiński-Dreieck. Tanz der Scheiben Bei den Türmen von Hanoi handelt es sich um ein traditionelles Knobelspiel, das vermutlich 1883 von dem französischen Mathematiker Édouard Lucas erfunden wurde. Es besteht aus einer Reihe runder, gelochter Scheiben unterschiedlicher Größe, die auf drei Stäben angeordnet
sind. An dieser Stelle wollen wir annehmen, dass die Größen der Scheiben den positiven ganzen Zahlen 1, 2, 3, …, n entsprechen und bezeichnen das Spiel als das n-Scheiben-Hanoi-Spiel. Bei der im Handel erhältlichen Variante des Spiels ist n gewöhnlich 5 oder 6. Anfangs sitzen alle Scheiben der Größe nach geordnet auf einem einzigen Stab, die größte Scheibe unten und die kleinste oben. Ziel des Spiels ist es, den kompletten Stapel an Scheiben auf einen anderen Stab zu transferieren. Bei jedem Zug wird die oberste Scheibe eines Stapels auf einen anderen Stab gelegt. Eine Scheibe darf jedoch nur dann in dieser Weise versetzt werden, wenn die Scheibe, auf die sie gelegt wird, größer ist, oder der Stab zuvor leer war. Die erste Regel stellt sicher, dass die Scheiben dann, wenn sie auf einen neuen Stab umgesetzt worden sind, wieder ihrer Größe nach von oben (kleinste) nach unten (größte) geordnet sind. Bevor Sie weiterlesen, sollten Sie versuchen, das Knobelspiel zu lösen. Beginnen Sie mit zwei Scheiben und arbeiten Sie sich zu fünf oder sechs Scheiben hinauf, je nachdem, wie ehrgeizig (und hartnäckig) Sie sind. Beispielsweise lässt sich ein 2-Scheiben-Hanoi-Spiel in nur drei Zügen lösen:
Abbildung 78: Die Lösung eines 2-Scheiben-Hanoi-Spiels. Man platziere Scheibe 1 auf dem mittleren Stab, dann Scheibe 2 auf dem rechten Stab und schließlich Scheibe 1 auf dem rechten Stab. Wie steht es mit einem 3-Scheiben-Hanoi-Spiel? Es beginnt so: Abbildung 79: Ausgangsposition mit drei Scheiben. Der erste Zug ist im Wesentlichen erzwungen: Die einzige Scheibe, die wir bewegen dürfen, ist Scheibe 1. Man kann sie auf jeden der beiden freien Stäbe legen, und welchen wir wählen, spielt eigentlich keine Rolle, denn wir können die beiden Stäbe vom Konzept her austauschen, ohne das Spiel dadurch zu beeinflussen. Daher können wir Scheibe 1 genauso gut auf den mittleren Stab verschieben:
Abbildung 80: Der erste Zug. In diesem Stadium können wir Scheibe 1 erneut verschieben, aber damit können wir nichts erreichen: Entweder wandert sie dahin zurück, wo sie begonnen hat, oder sie wandert zu dem anderen leeren Stab – wo wir sie gleich von Anfang an hätten platzieren können. Daher sollten wir eine andere Scheibe bewegen. Scheibe 3 ist nicht zugänglich, da sie unter Scheibe 2 liegt, also bleibt uns Scheibe 2. Und diese Scheibe dürfen wir nicht auf Scheibe 1 legen. Daher besteht die einzige Möglichkeit darin, sie auf den Stab rechts zu bewegen: Abbildung 81: Zweiter Zug. Nun können wir Scheibe 3 nicht bewegen, und es ergibt keinen Sinn, Scheibe 2 nochmals zu bewegen. Also bewegen wir Scheibe 1. Wenn wir sie auf Scheibe 3 legen, haben wir uns festgefahren und müssen diesen
Schritt beim nächsten Zug rückgängig machen. Daher bleibt uns nur eine Wahl: Abbildung 82: Dritter Zug. Wie geht’s nun weiter? Entweder machen wir diesen Zug rückgängig oder wir legen Scheibe 1 auf Scheibe 3, was uns offenbar nicht viel weiter bringt – oder aber wir versetzen Scheibe 3 auf den leeren Stab: Abbildung 83: Vierter Zug. In diesem Stadium sind wir der Lösung des Puzzles schon ein gutes Stück näher gekommen, denn wir haben die schwierigste Scheibe, Scheibe 3, auf einen neuen Stab verschoben. Offensichtlich müssen wir jetzt nur noch Scheibe 1 und Scheibe 2 obendrauf legen. Und wir wissen bereits, wie das geht. Wir haben bereits den Stapel aus Scheibe 1 und Scheibe 2 auf einen
neuen Stab versetzt. Daher müssen wir nur die Züge wiederholen und dabei darauf achten, dass wir die richtigen Stäbe wählen, nämlich so: Abbildung 84: Fünfter Zug. Abbildung 85: Sechster Zug. Abbildung 86: Siebter Zug. Geschafft! 3
3 Für diese Lösung haben wir sieben Züge gebraucht, was 2 – 1 entspricht. Es lässt sich zeigen, dass es keine kürzere Lösung gibt. Die Methode verweist auf eine raffinierte Lösung für eine beliebige Anzahl Scheiben. Wir können die Situation so zusammenfassen: Zuerst platziert man die obersten beiden Scheiben auf einem leeren Stab. Dann legt man die größte Scheibe auf den einzig verbliebenen leeren Stab. Anschließend versetzt man die beiden oberen Scheiben auf den Stab mit der größten Scheibe. Der erste und der letzte Schritt sind tatsächlich Lösungen des 2-ScheibenHanoi-Spiels. Der mittlere Schritt ist völlig unkompliziert. Nach demselben Schema lässt sich auch das 4-Scheiben-Hanoi-Spiel lösen: Zuerst platziert man die obersten drei Scheiben auf einem leeren Stab. Dann legt man die größte Scheibe auf dem einzig verbliebenen leeren Stab ab. Anschließend versetzt man die drei oberen Scheiben auf den Stab mit der größten Scheibe. Der erste und der letzte Schritt sind Lösungen des 3-Scheiben-Hanoi-Spiels, die wir gerade gefunden haben. Wiederum ist der mittlere Schritt völlig unkompliziert.
Dasselbe Schema lässt sich nun auf das 5-Scheiben-Hanoi-Spiel, das 6Scheiben-Hanoi-Spiel und so weiter anwenden. Wir können das Puzzle für jede beliebige Zahl von Scheiben lösen, und zwar mit einem «rekursiven» Verfahren, bei dem wir die Lösung für eine gegebene Zahl von Scheiben von der Lösung mit einer Scheibe weniger ableiten. Daher lässt sich die Lösung des 5-Scheiben-Hanoi-Spiels auf die Lösung des 4-ScheibenHanoi-Spiels zurückführen, die sich wiederum auf die Lösung des 3Scheiben-Hanoi-Spiels reduzieren lässt, und diese wiederum auf die Lösung des 2-Scheiben-Hanoi-Spiels, die man ihrerseits auf die Lösung des 1Scheiben-Hanoi-Spiels zurückführen kann. Aber das ist wirklich kein Problem: Man nehme einfach die Scheibe und platziere sie auf einem anderen Stab. Es gibt eine allgemeine Lösung für das Problem, und die geht so: Um ein n-Scheiben-Hanoi-Spiel zu lösen, ignoriert man vorübergehend die größte Scheibe n, benutzt die Lösung des (n – 1)-Scheiben-Hanoi-Spiels, um die Scheiben 1, 2, … n – 1 auf einen neuen Stab zu schieben, bewegt dann Scheibe n auf den verbliebenen leeren Stab, und verwendet schließlich die Lösung des (n – 1)-Scheiben-HanoiSpiels erneut, um die Scheiben 1, 2, … n – 1 auf den Stab mit der Scheibe n zu transferieren. (Man beachte, dass der Zielstab aufgrund der Symmetrie beliebig aus den beiden Möglichkeiten ausgewählt werden kann, wenn man sich auf die Lösung für das (n – 1)Scheiben-Hanoi-Spiel beruft.)
Der Spielbaum Rekursive Verfahren können sehr kompliziert werden, wenn man ihnen Schritt für Schritt folgt, und genau das geschieht bei den Türmen von Hanoi. Diese Komplexität ist ein inhärentes Merkmal des Spiels und nicht allein der Lösungsmethode. Um das einzusehen, werde ich das Spiel geometrisch darstellen, indem ich seinen Spielbaum zeichne. Dieser besteht aus Knoten, die mögliche Positionen der Scheiben darstellen, verbunden durch Linien, die zulässige Züge darstellen. Für das 2-Scheiben-HanoiSpiel sieht der Spielbaum folgendermaßen aus: Abbildung 87: Spielbaum des 2-Scheiben-Hanoi-Spiels. Man kann dieses Diagramm als drei Kopien des korrespondierenden Diagramms für das 1-Scheiben-Hanoi-Spiel ansehen, die an drei Stellen miteinander verbunden sind. In jeder Kopie befindet sich die unterste Scheibe auf einem der drei möglichen Stäbe in einer festgelegten Position.
Die Verbindungen treten auf, wenn ein leerer Stab eine Verschiebung der untersten Scheibe ermöglicht. Mehrere Mathematiker haben unabhängig voneinander festgestellt, dass sich die rekursive Lösung des Puzzles in der Struktur des Spielbaums widerspiegelt. Die Ersten, denen dies auffiel, waren R. S. Scorer, P. M. Grundy und Cedric A. B. Smith, die 1944 gemeinsam einen Artikel darüber schrieben. Wir können rekursive Lösungen benutzen, um den Spielbaum für mehr Scheiben vorherzusagen. Bei einem 3-Scheiben-Hanoi-Spiel macht man drei Kopien des oben stehenden Diagramms, jede mit einer zusätzlichen untersten Scheibe, und verbindet sie zu einem Dreieck. Und so weiter. Abbildung 88 zeigt beispielsweise den Spielbaum für das 5-ScheibenHanoi-Spiel, wobei die Positionen der Scheiben weggelassen sind:
Abbildung 88: Spielbaum für ein 5-Scheiben-Hanoi-Spiel. H.-T. Chan (1989) und Andreas Hinz (1992) haben die rekursive Struktur des Spielbaums benutzt, um eine Formel für die durchschnittliche Minimalzahl von Zügen zwischen zwei Spielstadien bei einem n-ScheibenHanoi-Spiel zu entwickeln. Die Gesamtzahl der Züge längs der kürzesten Wege zwischen allen möglichen Positionspaaren lässt sich nach folgender Formel berechnen:
Für große n ist sie näherungsweise gleich denn alle anderen Terme in der Formel sind viel kleiner als der erste. Die durchschnittliche Länge all dieser Wege ist näherungsweise gleich dem -Fachen der Zahl der Züge längs einer Seite des Spielbaums. Nun erkennen wir die Bedeutung des seltsamen Bruchs . Das Sierpiński-Dreieck Derselbe Bruch taucht bei einem eng verwandten Problem auf. Andreas Hinz und Andreas Schief haben die Formel für die durchschnittliche Zahl von Zügen zwischen Spielstadien des Hanoi-Spiels benutzt, um die durchschnittliche Entfernung zwischen zwei beliebigen Punkten in einer berühmten Form zu berechnen, dem Sierpiński-Dreieck. Wenn die Seiten des Dreiecks die Länge 1 haben, lautet die Antwort bemerkenswerterweise genau .
Das Sierpiński-Dreieck wird gebildet, indem man ein gleichseitiges Dreieck in vier halb so große Dreiecke teilt (dasjenige in der Mitte ist umgedreht) und das mittlere Dreieck entfernt. Dann wird derselbe Prozess mit den drei verbleibenden Dreiecken wiederholt, und so weiter und so weiter. Das Ergebnis ist ein frühes Beispiel für das, was wir heute als Fraktal bezeichnen: eine Form, die eine komplexe Struktur besitzt, ganz gleich, wie stark sie vergrößert wird (siehe Kapitel [ ]). Abbildung 89: Die ersten sechs Stufen bei der Bildung eines Sierpiński-Dreiecks. Der polnische Mathematiker Wacław Sierpiński erfand diese faszinierende Menge 1915, auch wenn ähnliche Formen schon seit Jahrhunderten zu Dekorationszwecken eingesetzt wurden. Er beschrieb sein Dreieck als «gleichzeitig Cantorisch und Jordanisch, wobei jeder Punkt gleichzeitig ein Verzweigungspunkt ist». Mit «Cantorisch» meinte Sierpiński, dass seine Figur eine zusammenhängende Punktmenge darstellte, aber mit einer komplexen Feinstruktur. Mit «Jordanisch» meinte er, dass es sich gleichzeitig um eine Kurve handelte. Und mit «jeder Punkt ist ein Verzweigungspunkt» meinte er, dass die Kurve sich an jedem Punkt verzweigte. Später taufte Benoît Mandelbrot die Form spielerisch Sierpiński-Dichtung, weil sie der viellöchrigen Dichtung ähnelt, die den Zylinderkopf eines Autos mit dem Rest des Motors verbindet.
IRRATIONALE ZAHLEN Brüche eignen sich für jedes praktische Divisionsproblem, und eine Weile lang waren die alten Griechen fest davon überzeugt, dass Brüche alles im Universum beschrieben. Dann setzte sich einer von ihnen mit dem Satz des Pythagoras auseinander und fragte, in welcher Beziehung die Diagonale eines Quadrats zu dessen Seiten steht. Die Antwort machte ihnen klar, dass es Probleme gibt, die sich mit Brüchen nicht lösen lassen. Das war die Geburtsstunde der irrationalen Zahlen. Zusammen bilden rationale und irrationale Zahlen das System der reellen Zahlen.
Die erste bekannte irrationale Zahl Rationale Zahlen – Brüche – reichen für die meisten praktischen Zwecke völlig aus, doch einige Probleme haben keine rationale Lösung. So entdeckten die griechischen Geometer beispielsweise, dass die Diagonale eines Quadrats mit der Seitenlänge 1 keine rationale Zahl ist. Wenn die Diagonale die Länge x hat, dann besagt der Satz des Pythagoras, dass ist, sodass x = ist. Und sie bewiesen zu ihrem Kummer, dass x nicht rational ist. Abbildung 90: Die Diagonale eines Einheitsquadrats.
Das brachte die griechischen Geometer dazu, sich auf geometrisch definierte Längen zu konzentrieren und die Zahlen zu ignorieren. Die Alternative, die sich als die bessere Idee herausstellte, bestand darin, das Zahlensystem so aufzupeppen, dass es diese Art Probleme bewältigen kann. Dezimalzahlen, Brüche und irrationale Zahlen Heutzutage schreiben wir Zahlen gewöhnlich als Dezimalzahlen. Aus praktischen Gründen verwenden Taschenrechner endliche Dezimalzahlen mit einer begrenzten Anzahl von Ziffern nach dem Dezimalkomma. Im Eingangskapitel haben wir gesehen, dass die Diagonale eines Einheitsquadrats auf zehn Dezimalstellen folgendermaßen aussieht: Eine Berechnung zeigt jedoch, dass der exakte Wert davon abweicht: Auch wenn dieser Wert nahe bei 2 liegt, ist er nicht gleich 2. Vielleicht haben wir zu früh mit dem Rechnen aufgehört. Vielleicht erhalten wir einen exakten Wert für die Quadratwurzel von 2, wenn wir mit einer Million Ziffern arbeiten. Tatsächlich lässt sich recht einfach zeigen, dass das nicht funktioniert. Die zehnstellige Dezimal-Näherung endet mit einer 3. Wenn wir sie quadrieren, erhalten wir eine 20-stellige Dezimalzahl, 2 die mit einer 9 endet, was 3 entspricht. Das ist kein Zufall, sondern folgt
aus der Art und Weise, wie wir Dezimalzahlen multiplizieren. Nun ist die letzte wichtige Ziffer jeder Dezimalzahl, wenn es sich nicht um 0 selbst handelt, ungleich null. Daher endet ihr Quadrat mit einer Ziffer ungleich null. Da die Dezimalentwicklung von 2 gleich 2,000… mit ausschließlich Nullen ist, kann keine derartige Quadratzahl genau gleich 2 sein. Alle Dezimalzahlen auf einem Taschenrechner sind tatsächlich rational. So ist der Wert von π auf zehn Dezimalstellen genau gleich 3,141592653, und das entspricht exakt dem Bruch Dezimalzahlen fester Länge repräsentieren nur eine sehr begrenzte Menge von Brüchen genau: diejenigen, bei denen der Nenner (die unter dem Bruchstrich stehende Zahl) eine Potenz von 10 ist. Andere Brüche sind in dieser Hinsicht komplizierter. Wenn ich in meinen Taschenrechner eingebe, spuckt er 0,333333333 aus. Tatsächlich ist das nicht ganz richtig: Wenn man diese Zahl mit 3 multipliziert, erhält man 0,999999999. Der Unterschied beträgt 0,0000000001. Aber wen kümmert schon 1 Teil auf 10 Milliarden? Die Antwort hängt davon ab, was man tun möchte. Wenn man ein Bücherregal baut und ein 1 m langes Holzbrett in drei gleich lange Teile schneidet, dann sind 0,333 Meter (333 Millimeter) präzise genug. Wenn man jedoch einen mathematischen Satz beweisen will und wünscht, dass 3 mal gleich 1 ist, wie es sein sollte, dann kann selbst ein kleiner Fehler
fatal sein. Wenn man auf eine völlig korrekte Dezimalzahl erweitern möchte, so müssen die Dreien endlos fortgeschrieben werden. Die Ziffern von können ebenfalls endlos weiterlaufen, doch da gibt es kein offensichtliches Muster. Dasselbe gilt für die Ziffern von π. Wenn man jedoch die Längen, die in der Geometrie auftreten, mit Zahlen darstellen will, muss man eine numerische Darstellung für mathematische Elemente wie und π finden. Das Ergebnis war das System, das wir heute als reelle Zahlen bezeichnen. Sie lassen sich durch unendlich lange Dezimalentwicklungen darstellen. In der höheren Mathematik werden jedoch abstraktere Methoden angewandt. Das Adjektiv «reell» bürgerte sich ein, weil diese Zahlen mit unserer intuitiven Vorstellung von Messungen korrespondieren. Jede zusätzliche Dezimalstelle macht die Messung präziser. Die wirkliche Welt wird jedoch auf der Ebene der Elementarteilchen ein wenig unschärfer, daher verlieren Dezimalzahlen um die 50. Dezimalstelle herum ihren Kontakt zur Realität. Nun haben wir die Büchse der Pandora geöffnet. Mathematische Objekte und Strukturen sind (bestenfalls) Modelle der realen Welt, nicht die Realität selbst. Wenn wir Dezimalzahlen betrachten, die unendlich weiterlaufen, ist das System der reellen Zahl hübsch und ordentlich. Deshalb können wir damit Mathematik betreiben und die Ergebnisse dann mit der Realität vergleichen, wenn das unser Hauptziel ist. Wenn wir versuchen, dafür zu sorgen, dass Dezimalzahlen nach 50 Stellen stoppen oder dass sie unbestimmt werden, geraten wir in einen komplizierten Schlamassel. Es
gibt immer einen Tauschhandel zwischen Nutzerfreundlichkeit und physikalischer Genauigkeit. Jede rationale Zahl ist reell. Tatsächlich (ich will die Sache nicht beweisen, auch wenn das nicht allzu schwierig ist) sind die Dezimalentwicklungen von rationalen Zahlen genau diejenigen, die periodisch wiederkehren (rekurrieren). Das heißt, sie wiederholen ständig denselben endlichen Ziffernblock, vielleicht mit ein paar anderen Ziffern vorneweg. Zum Beispiel ist wobei der Anfangsblock 3,2 aus dem Rahmen fällt, der Block 619047 aber anschließend unendlich oft wiederholt wird. Viele reelle Zahlen sind jedoch nicht rational. Jede Dezimalzahl, die solche Wiederholungen vermeidet, ist dafür ein Beispiel. Daher kann ich sicher sein, dass beispielsweise mit ihren zunehmend längeren 0-Strecken nicht rational ist. Solche Zahlen bezeichnet man als irrational. Jede reelle Zahl ist entweder rational oder irrational. Beweis, dass irrational ist
Alle endlichen Dezimalzahlen sind Brüche, aber viele Brüche sind keine endlichen Dezimalzahlen. Könnte einer von ihnen exakt wiedergeben? Hätte die Antwort «ja» gelautet, wäre all das, was die Griechen über Längen und Flächen herausgefunden haben, viel einfacher gewesen. Die Griechen stellten jedoch fest, dass die Antwort «nein» war, und zwar nicht mit Hilfe von Dezimalzahlen, sondern geometrisch. Wir sehen dies heute als bedeutende Revolution an, die uns große Gebiete voll neuer und nützlicher Mathematik eröffnete, aber damals war die ganze Sache den Mathematikern eher peinlich. Die Entdeckung geht auf die Pythagoreer zurück, die glaubten, das Universum sei auf Zahlen gegründet. Damit meinten sie ganze Zahlen und Brüche. Leider entdeckte einer aus ihrem Kreis – dem Vernehmen nach Hippasos von Metapont –, dass die Diagonale eines Einheitsquadrats irrational ist. Angeblich verkündete er diese ärgerliche Tatsache, während er sich mit einigen seiner pythagoreischen Kollegen auf See befand, und die anderen waren darüber so erzürnt, dass sie ihn über Bord warfen und er ertrank. Diese Geschichte ist historisch nicht belegt, doch die anderen Pythagoreer wären über diese Entdeckung sicher nicht besonders erfreut gewesen, denn sie brachte ihre Grundüberzeugungen ins Wanken. Der Beweis der Griechen basiert auf einem geometrischen Verfahren, das wir heute als euklidischen Algorithmus bezeichnen. Dabei handelt es sich um ein systematisches Verfahren, um herauszufinden, ob zwei gegebene Längen a und b kommensurabel sind – ob sie beide ganzzahlige Vielfache einer gemeinsamen Länge c sind. Wenn das der Fall ist, sagt uns das Verfahren die Länge von c. Aus unserer heutigen numerischen Sicht sind a
und b dann und nur dann kommensurabel, wenn rational ist, daher ist der euklidische Algorithmus «in Wirklichkeit» ein Test, um zu entscheiden, ob eine gegebene Zahl rational ist. Der geometrische Blickwinkel der Griechen führte sie zu einer ganz anderen Art der Argumentation, und zwar in folgender Richtung: Nehmen wir an, a und b seien ganzzahlige Vielfache von c. Beispielsweise können wir a = 17c und b = 5 c wählen. Nun zeichnen wir ein 17×5-Netz von Quadraten, die alle die Seitenlänge c haben. Man beachte, dass a in der obersten waagerechten Zeile aus 17 Kopien von c besteht, in der senkrechten Spalte besteht b aus 5 Kopien von c. Daher sind a und b kommensurabel. Abbildung 91: 17×5-Gitter. Als Nächstes schneidet man so viele 5×5-Quadrate ab wie möglich:
Abbildung 92: Man schneidet drei 5×5-Quadrate ab. Am Ende bleibt schließlich ein 2×5-Rechteck zurück. Man wiederholt den Prozess bei diesem kleineren Rechteck und schneidet nun 2×2-Quadrate ab: Abbildung 93: Dann schneidet man zwei 2×2-Quadrate ab. Nun ist nur noch ein 2×1-Rechteck übrig. Dies zerlegt man in zwei 1×1Quadrate, und kein kleines Rechteck bleibt übrig – die ganze Sache geht glatt auf.
Abbildung 94: Schließlich schneidet man zwei 1×1-Quadrate ab. Wenn die ursprünglichen Längen a und b ganzzahlige Vielfache einer gemeinsamen Länge c sind, muss der Prozess schließlich zu einem Ende kommen, weil alle Linien auf dem Gitter liegen und die Rechtecke immer kleiner werden. Wenn umgekehrt der Prozess jedoch stoppt, dann sind, wenn man rückwärts arbeitet, a und b ganzzahlige Vielfache von c. Kurz gesagt: Zwei Längen sind dann und nur dann kommensurabel, wenn der euklidische Algorithmus, angewandt auf das korrespondierende Rechteck, nach endlich vielen Schritten zu einem Ende führt. Wenn wir beweisen wollen, dass ein beliebiges Paar Längen nicht kommensurabel ist, müssen wir lediglich ein Rechteck konstruieren, für das der Prozess offensichtlich zu keinem Ende führt. Was angeht, besteht der Trick darin, mit einem Rechteck zu beginnen, dessen Form so gewählt ist, dass sichergestellt ist, dass nach dem Abschneiden zweier großer Quadrate ein Stück übrig bleibt, das genau dieselbe Form hat wie das Original. Wenn das der Fall ist, kann man mit dem euklidischen Algorithmus unendlich oft zwei Stücke abschneiden, und die ganze Sache kann nie zu einem Ende führen.
Abbildung 95: Das schattierte Rechteck muss dieselbe Form wie das ursprüngliche haben. Die Griechen konstruierten ein solches Rechteck geometrisch, aber wir können stattdessen Algebra verwenden. Angenommen, die Seiten sind a und 1. Dann ist die erforderliche Bedingung 2 2 Daher ist a – 2a = 1, wenn (a – 1) = 2 ist, daher ist a = 1 + . Zusammenfassend kann man sagen: Der euklidische Algorithmus besagt implizit, dass die Längen 1 + 1+ und 1 inkommensurabel sind; daher ist irrational. Und daher ist auch nehmen wir an, dass irrational. Um zu verstehen, warum das so ist, rational ist, gleich . Dann ist , was wiederum rational ist. Aber das ist
nicht der Fall, daher sind wir auf einen Widerspruch gestoßen, und unsere Annahme ist falsch.
Den Kreis vermessen Die Zahlen, die wir zum raschen Zählen benutzen, werden uns mit der Zeit vertraut, doch einige Zahlen sind weitaus seltsamer. Die erste wirklich ungewöhnliche Zahl, auf die wir im Mathematikunterricht in der Schule treffen, ist π. Diese Kreiszahl taucht in vielen Gebieten der Mathematik auf, von denen nicht alle eine offensichtliche Beziehung zu Kreisen aufweisen. Mathematiker haben π auf mehr als 12 Billionen Dezimalstellen berechnet. Wie machen sie das? Wer weiß, welche Art von Zahl π ist, kann die klassische Frage beantworten: Ist es möglich, aus einem Kreis allein mit Zirkel und Lineal ein Quadrat mit demselben Flächeninhalt zu konstruieren? Verhältnis von Umfang und Durchmesser eines Kreises π ist uns zum ersten Mal begegnet, als wir den Umfang und den Durchmesser eines Kreises berechnet haben. Wenn r der Radius ist, beträgt 2 der Umfang 2πr und die Fläche πr . Geometrisch sind diese beiden Größen nicht direkt korreliert, daher ist es eigentlich wirklich bemerkenswert, dass dieselbe Zahl π in beiden auftritt. Es gibt einen intuitiven Weg zu verstehen,
warum das so ist. Schneiden Sie einen Kreis in viele Teile wie eine Pizza und ordnen Sie diese Teile neu an, sodass sie näherungsweise ein Rechteck bilden. Die Länge dieses Rechtecks entspricht näherungsweise der Hälfte des Kreisumfangs, der gleich πr ist. Seine Höhe ist näherungsweise gleich 2 r. Daher beträgt die Fläche des Rechtecks näherungsweise πr × r = πr . Abbildung 96: Annäherung an die Fläche eines Kreises. Das ist jedoch lediglich eine Näherung. Vielleicht sind die Zahlen, die im Zusammenhang mit dem Durchmesser und der Fläche eines Kreises auftreten, sehr ähnlich, aber nicht identisch. Das ist jedoch unwahrscheinlich, denn die Argumentation funktioniert, ganz gleich, in wie viele Teile wir die Pizza zerlegen. Wenn wir eine große Zahl sehr dünner Teile wählen, kommt die Näherung dem tatsächlichen Wert sehr nahe. Dadurch, dass wir die Pizza so fein zerlegen, wie wir es wünschen, können wir die Differenz zwischen der aktuellen Form und einem wirklichen Rechteck beliebig klein werden lassen. Wenn man eine Grenzwertbetrachtung anstellt, liefert diese Beobachtung einen Beweis, dass die Formel für die Kreisfläche korrekt und exakt ist. Aus diesem Grund tritt dieselbe Zahl beim Umfang wie auch bei der Fläche eines Kreises auf.
Das Grenzwertverfahren definiert zudem, was wir in diesem Zusammenhang mit «Fläche» meinen. Flächen sind nicht so eindeutig bestimmt, wie man vielleicht meinen möchte. Man kann die Fläche von Vielecken definieren, indem man sie in Dreiecke zerlegt, doch diese Methode funktioniert bei Formen mit gerundeten Kanten nicht. Selbst der Flächeninhalt eines Rechtecks ist nicht so eindeutig bestimmt, wenn dessen Seiten nicht kommensurabel sind. Das Problem besteht nicht darin, zu sagen, was der Flächeninhalt ist: Dazu muss man nur die beiden Seiten multiplizieren. Der schwierige Teil besteht darin zu beweisen, dass sich das Ergebnis so verhält, wie sich ein Flächeninhalt verhalten sollte – beispielsweise, dass sich der Flächeninhalt von Formen, die man zusammenfügt, addiert. Die Schulmathematik übergeht dieses Problem möglichst rasch und hofft, dass niemand diese Schwierigkeit bemerkt. Warum benutzen Mathematiker ein obskures Symbol für eine Zahl? Warum nicht einfach die Zahl hinschreiben? In der Schule haben viele von uns gelernt, dass ist, aber gewissenhafte Lehrer fügen hinzu, dass es sich dabei lediglich um eine Näherung handelt (siehe Kapitel [ Warum benutzen wir also nicht stattdessen einen exakten Bruch für π? Weil es so etwas nicht gibt! ]).
Die Zahl π ist das bekannteste Beispiel für eine irrationale Zahl. Wie lässt sie sich nicht exakt durch irgendeinen noch so komplizierten Bruch darstellen. Das ist wirklich nicht einfach zu beweisen, aber Mathematiker wissen, wie man es anstellt, und es stimmt. Daher brauchen wir definitiv ein neues Symbol, denn diese spezielle Zahl lässt sich mit Hilfe der gewöhnlichen Zahlensymbole nicht exakt hinschreiben. Da π eine der wichtigsten Zahlen in der gesamten Mathematik ist, brauchen wir eine eindeutige Möglichkeit, sie darzustellen. Die Wahl fiel auf das griechische «p» (pi), den ersten Buchstaben in «Perimeter» (Umfang). In dieser Hinsicht hat uns das Universum wirklich einen üblen Streich gespielt: eine wirklich wichtige Zahl, die wir nicht niederschreiben können, es sei denn mit einer komplizierten Formel. Das ist vielleicht ein Ärgernis, aber auch faszinierend und trägt zum Geheimnis von π bei. π und Kreise Wir sind π erstmals im Zusammenhang mit Kreisen begegnet. Kreise sind sehr grundlegende mathematische Formen, daher muss alles, was uns etwas über Kreise sagt, sehr interessant sein. Kreise haben eine Menge nützlicher Anwendungen. Im Jahr 2011 betrug die Zahl der Kreise, die eine entscheidende Rolle bei einem einzigen Aspekt unseres Alltags spielten, mehr als 5 Milliarden, denn die Anzahl der Personenkraftwagen überschritt die Marke von 1 Milliarde, und damals hatte ein typisches Auto fünf Räder – vier auf der Straße und eins als Ersatz im Kofferraum. Natürlich gibt es noch eine ganze Menge anderer Räder in einem Auto, das reicht von
den Unterlegscheiben bis zum Steuerrad. Und denken Sie nur an all die Räder in Fahrrädern, Lastern, Bussen, Zügen, Flugzeugen … Abbildung 97: Kreisförmige Wellen. Räder sind nur eine Anwendung der Geometrie des Kreises. Sie funktionieren, weil jeder Punkt eines Kreises gleich weit vom Kreiszentrum entfernt ist. Wenn man ein kreisförmiges Rad um sein Zentrum dreht, bewegt es sich glatt und gleichförmig über eine ebene Straße. Aber Kreise zeigen sich noch auf vielerlei andere Weise. Die Wellenringe auf einem Teich sind rund, ebenso die farbigen Bögen des Regenbogens. Die Umlaufbahnen der Planeten sind in erster Näherung Kreise. Bei einer korrekteren Näherung sind die Umlaufbahnen Ellipsen, also Kreise, die in einer Richtung zusammengedrückt sind.
Abbildung 98: Ein Regenbogen bildet einen Kreisausschnitt. Ingenieure können jedoch problemlos Räder konstruieren, ohne π zu kennen. Die wahre Bedeutung dieser Zahl ist theoretisch und reicht viel tiefer. Erstmals stießen Mathematiker bei einer grundsätzlichen Frage über Kreise auf π. Die Größe eines Kreises lässt sich durch drei eng miteinander verknüpfte Zahlen beschreiben: seinen Radius – die Strecke zwischen dem Mittelpunkt des Kreises und einem beliebigen Punkt auf dem Kreis. seinen Durchmesser – die maximale Breite des Kreises. seinen Umfang – die Länge der Begrenzungslinie des Kreises, rundum gemessen.
Radius und Durchmesser stehen in einer ganz einfachen Beziehung zueinander: Der Durchmesser beträgt das Doppelte des Radius, und der Radius ist halb so lang wie der Durchmesser. Die Beziehung zwischen Umfang und Durchmesser ist nicht so einfach. Wenn man in den Kreis ein Sechseck zeichnet, kann man sehen, dass der Umfang etwas größer ist als das Dreifache des Durchmessers. Die Abbildung zeigt sechs Radien, die paarweise gemeinsam drei Durchmesser ergeben. Das Sechseck hat dieselbe Länge wie die sechs Radien – das heißt, drei Durchmesser. Und der Kreis ist eindeutig etwas länger als das Sechseck.
Abbildung 99: Warum π größer als 3 ist. Die Kreiszahl π ist definiert als der Umfang eines beliebigen Kreises, geteilt durch seinen Durchmesser. Ganz gleich, wie groß der Kreis ist, wir erwarten, dass diese Zahl stets denselben Wert hat, denn ob der Kreis nun weiter wird oder schrumpft, das Verhältnis von Umfang zu Durchmesser bleibt immer dasselbe. Vor rund 2200 Jahren entwickelte Archimedes einen völlig logischen Beweis, der zeigte, dass diese Zahl bei jedem Kreis funktioniert.
Archimedes machte sich nicht nur über Sechsecke in einem Kreis Gedanken, sondern verdoppelte die Zahl der Seiten auch von 6 auf 12, dann 24, dann 48 und schließlich 96 Seiten und erhielt so einen recht genauen Wert für π. Er bewies zudem, dass π größer als und kleiner als ist – in Dezimalzahlen ausgedrückt, größer als 3,141 und kleiner als 3,143. (Archimedes arbeitete mit geometrischen Figuren, nicht mit Zahlen, und er veranschaulichte sich das, was wir heute π nennen, geometrisch, daher ist dies eine moderne Neuinterpretation dessen, was er tatsächlich tat. Die Griechen hatten kein Dezimalsystem.) Archimedes’ Methode zur Berechnung von π lässt sich so genau machen, wie wir es wünschen, indem man die Zahl der Seiten des eingeschriebenen Vielecks, das zur Approximierung des Kreises dienen soll, genügend oft verdoppelt. Spätere Mathematiker fanden bessere Methoden – einigen davon werde ich im Folgenden diskutieren. Auf 1000 Dezimalstellen genau sieht π so aus:
Wenn man sich diese Ziffern ansieht, ist das auffälligste Merkmal das vollständige Fehlen eines Musters. Die Ziffern sehen zufällig verteilt aus. Aber das kann nicht sein, weil es sich um die Ziffern von π handelt, und das ist eine ganz bestimmte Zahl. Das Fehlen eines jeden Musters ist ein gewichtiger Hinweis darauf, dass π in der Tat eine höchst seltsame Zahl ist.
Mathematiker hegen den starken Verdacht, dass jede endliche Folge von Ziffern irgendwo in der dezimalen Erweiterung von π auftaucht, und das auch noch unendlich oft. Tatsächlich wird angenommen, dass π eine normale Zahl ist, das heißt, dass alle Ziffernblöcke einer gegebenen Länge gleich häufig auftreten. Diese Vermutungen sind bislang weder bewiesen noch widerlegt worden. Wo π sonst noch auftaucht Die Kreiszahl π taucht in vielen anderen Gebieten der Mathematik auf, die oft keine offensichtlichen Verbindungen mit Kreisen aufweisen. Es gibt stets eine indirekte Verbindung, denn π ist ihrem Ursprung nach eine Kreiszahl, und Kreise sind eine Möglichkeit, um π zu definieren. Jede andere Definition muss dieselbe Zahl ergeben, daher muss irgendwo längs des Weges eine Verbindung zum Kreis hergestellt und bewiesen werden. Die Verbindung kann jedoch sehr indirekt sein. So bemerkte Euler beispielsweise 1748 eine Verbindung zwischen den Zahlen π, e und i, der Quadratwurzel aus –1 (siehe Kapitel [e]). Er fand die elegante Formel Zudem stellte Euler fest, dass π als Wert gewisser unendlicher Reihen erscheint. Im Jahr 1735 löste er das Basler Problem und damit eine Frage, die 1644 von Pietro Mengoli gestellt worden war: Wie groß ist die Summe sämtlicher reziproker Quadratzahlen? Dabei handelt es sich um eine
unendliche Summe, denn es gibt unendlich viele Quadratzahlen. Viele der großen Mathematiker jener Tage versuchten, dieses Problem zu lösen, doch es gelang ihnen nicht. Euler entdeckte 1735 die wunderbar simple Antwort: Diese Entdeckung machte ihn unter seinen Kollegen mit einem Schlag berühmt. Erkennen Sie die Verbindung zu Kreisen? Nein, ich auch nicht. Diese Verbindung kann auch nicht gerade auf der Hand liegen, denn eine ganze Reihe von Spitzenmathematikern konnte das Basler Problem nicht lösen. Die Lösung bedient sich tatsächlich der Sinusfunktion, die auf den ersten Blick keinerlei Verbindung mit dem Problem zu haben scheint. Eulers Methode führte zu ähnlichen Ergebnissen für die vierte Potenz, die sechste Potenz und ganz allgemein für jede Potenz, zum Beispiel: Es ist auch möglich, ausschließlich ungerade oder gerade Zahlen zu benutzen:
Ähnliche Formeln für ungerade Potenzen, wie die 3. (kubische) oder die 5. Potenz sind jedoch bisher nicht bewiesen worden, und man vermutet, dass keine derartigen Formeln existieren (siehe Kapitel [ζ(3)]). Bemerkenswerterweise zeigen diese und verwandte Reihen tief greifende Verbindungen mit Primzahlen und der Zahlentheorie. Wenn man zum Beispiel zwei ganze Zahlen nach dem Zufallsprinzip wählt, dann ist die Wahrscheinlichkeit, dass sie keinen gemeinsamen Teiler (größer 1) haben, ~ 0,6089, entspricht also dem Kehrwert der Summe der Euler’schen Reihen. Auch in der Statistik taucht π ganz unerwartet auf. Die Fläche unter der –x2 berühmten Glockenkurve, die die Gleichung y = e . hat, ist genau gleich
Abbildung 100: Die Glockenkurve. Die Kreiszahl π erscheint auch in vielen Formeln der mathematischen Physik. Mathematiker haben eine Vielzahl von Gleichungen entdeckt, in denen π eine wichtige Rolle spielt; einige davon werden wir im Folgenden diskutieren. Wie man π berechnet Im Jahr 2013 berechnete Shigeru Kondo im Lauf von 94 Tagen π mit Hilfe eines Computers auf 12100000000050 Dezimalstellen genau – mehr als
12 Billionen. Wenn man π zu praktischen Zwecken einsetzt, benötigt man nicht annähernd ein derartiges Maß an Präzision. Und man kann diese Präzision nicht erreichen, indem man reale Kreise vermisst. Im Lauf der Jahrtausende sind verschiedene Methoden entwickelt worden, die alle auf Formeln für π oder Verfahren basierten, die wir heute durch Formeln ausdrücken. Vernünftige Gründe für die Durchführung solcher Berechnungen sind zum Beispiel, zu prüfen, wie gut sich diese Formeln «schlagen» oder wie gut ein neuer Computer funktioniert. Einige Mathematiker sind auch einfach fasziniert davon, immer weitere Stellen von π zu berechnen – ihnen geht es da wie Bergsteigern, die einen Gipfel besteigen, einfach, «weil er da ist». Aktivitäten wie diese, die allein dazu dienen, einen neuen Rekord aufzustellen, sind sicherlich nicht typisch für den Großteil der mathematischen Forschung und haben, für sich genommen, weder besondere Bedeutung noch praktischen Wert, doch sie haben zu ganz neuen und faszinierenden Formeln geführt und unerwartete Verbindungen zwischen verschiedenen Gebieten der Mathematik enthüllt. Bei Formeln für π spielen in der Regel unendliche Prozesse eine Rolle, die – wenn sie genügend häufig durchgeführt werden – gute Annäherungen an π liefern. Die ersten Fortschritte gegenüber Archimedes’ Berechnungen gelangen im 15. Jahrhundert, als indische Mathematiker π als die Summe einer Reihe darstellten – einer Summe unendlich vieler Glieder (Summanden). Wenn sich der Wert einer Summe bei Hinzufügen weiterer Glieder einer wohldefinierten Zahl, ihrem Grenzwert, immer stärker nähert, wie es bei diesen Formeln der Fall war, dann kann man die Reihe dazu benutzen, um zunehmend genauere Näherungen zu berechnen. Sobald das
erforderliche Niveau an Genauigkeit erreicht ist, stoppt man die Berechnung. Um 1400 n. Chr. benutzte Madhava von Sangamagramma eine solche Reihe, um π auf die 11. Dezimalstelle genau zu berechnen. Im Jahr 1424 verbesserte der Perser Dschamschid Mas῾ud al-Kaschi dieses Ergebnis, indem er Näherungen mittels Vielecken mit zunehmend vielen Kanten benutzte, ganz ähnlich, wie es Archimedes getan hatte. Er erhielt die ersten 28 16 Nachkommastellen, indem er ein Vieleck mit 3 × 2 Seiten berücksichtigte. Archimedes’ Methode zur Approximation von π inspirierte François Viète dazu, 1593 eine Formel neuer Art zu entwickeln, nämlich: (Hier zeigen die Punkte Multiplikationen an.) Um 1630 hatte Christoph Grienberger die Vieleckmethode auf 38 Nachkommastellen ausgeweitet. Im Jahr 1665 entwickelte John Wallis eine andere Formel: wobei er einen recht komplizierten Ansatz wählte, um die Fläche eines Halbkreises zu finden. Um 1641 entdeckte James Gregory eine von Madhavas Reihen für π wieder. Die Idee besteht darin, sich einer trigonometrischen Funktion namens Tangens zu bedienen, die als tan x geschrieben wird. Im Bogenmaß
ist ein Winkel von 45° gleich und in diesem Fall a = b, sodass tan ist. Abbildung 101: Links: Der Tangens tan x ist . Rechts: Wenn x = ist, ist der Tangens = 1. Nun wollen wir die inverse Funktion betrachten, die gewöhnlich als Arkustangens, kurz arctan, bezeichnet wird. Diese Funktion kehrt die Tangensfunktion um, das heißt, wenn y = tan x ist, dann ist x = arctan y. Insbesondere ist arctan unendliche Reihe für arctan: . Madhava und Gregory entdeckten eine
Wenn man y = 1 setzt, erhält man Im Jahr 1699 benutzte Abraham Sharp diese Formel, um π auf 71 Nachkommastellen zu bestimmen, doch die Reihe konvergiert sehr langsam, das heißt, man muss eine Menge Terme berechnen, um eine gute Näherung zu erhalten. 1706 verwendete John Machin eine trigonometrische Formel für tan(x + y), um zu zeigen, dass ist, und setzte dann und in der Reihe für arctan ein. Da diese Zahlen deutlich kleiner als 1 sind, konvergieren die Reihen rascher, was ihre Verwendung praktischer macht. Machin berechnete mit seiner Formel 100 Dezimalstellen von π. Bis 1946 hatte Daniel Ferguson diese allgemeine Idee wohl so weit vorangetrieben wie überhaupt möglich, und mit ähnlichen, wenn auch abgewandelten Formeln 620 Nachkommastellen erreicht. Es gibt eine Menge raffinierter Varianten von Machins Formel, ja sogar eine ganze Theorie aller derartigen Formeln. 1896 wusste Fredrik Störmer,
dass ist, und es gibt viele noch eindrucksvollere moderne Formeln dieser Art, die dank der großen Nenner, die auftreten, zu weitaus schneller konvergierenden Reihen führen. Niemand ist bei Berechnungen mit Papier und Bleistift weiter gekommen, doch mechanische Rechner und elektronische Computer haben die Berechnungen deutlich beschleunigt und Fehler eliminiert. Die Aufmerksamkeit wandte sich Formeln zu, die mit nur wenigen Termen zu sehr guten Näherungen führten. Der Chudnovsky-Algorithmus der von den Brüdern David und Gregory Chudnovsky entdeckt wurde, produziert pro Term 14 neue Dezimalstellen. Hier bedeutet das Summenzeichen ∑: Man addiere die Werte des angegebenen Ausdrucks, während k sämtliche natürlichen Zahlen durchläuft, angefangen mit 0 und fortlaufend bis unendlich. Es gibt noch viele weitere Methoden zur Berechnung von π, und es kommen immer noch neue hinzu. 1997 verkündete Fabrice Bellard, die billionste Ziffer von π in binärer Notation sei 1. Erstaunlicherweise kam er zu diesem Ergebnis, ohne eine der vorangehenden Ziffern berechnet zu
haben. 1996 hatten David Bailey, Peter Borwein und Simon Plouffe eine sehr eigenartige Formel entdeckt: Bellard benutzte eine ähnliche Formel, mit der sich die Nachkommastellen von π leichter berechnen ließen: Bei geschickt eingesetzter Analysis erhält man mit dieser Methode Ziffern von π in Binärdarstellung. Das Schlüsselmerkmal in dieser Gleichung ist, 4n 10n dass viele der darin auftretenden Zahlen wie 4, 32, 64, 256, 2 und 2 Potenzen von 2 sind, mit denen sich im Binärsystem, wie es Computer für ihre Berechnungen verwenden, sehr bequem rechnen lässt. Der Rekord für das Auffinden einer einzelnen Binärziffer von π wird regelmäßig gebrochen: 2010 berechnete der Yahoo-Mitarbeiter Nicholas Sze die 15 zweibilliardste (2 × 10 -te) Binärziffer von π, die sich als 0 herausstellte. Dieselbe Gleichung kann man benutzen, um isolierte Ziffern von π zur Basis 4, 8 und 16 zu finden. Für andere Basen ist nichts Derartiges bekannt; insbesondere können wir keine isolierten dezimalen Ziffern berechnen. Gibt es überhaupt Formeln, die so etwas ermöglichen? Bis die Bailey-Borwein-
Plouffe-Formel entdeckt wurde, konnte sich niemand vorstellen, dass es bei binären Zahlen funktionieren könnte. Die Quadratur des Kreises Die alten Griechen suchten nach einer geometrischen Konstruktion für die Quadratur des Kreises: Es ging darum, die Seite eines Quadrats zu finden, das dieselbe Fläche wie ein gegebener Kreis hat. Schließlich wurde wie für die Dreiteilung eines Winkels und die Verdopplung eines Würfels bewiesen, dass keine Konstruktion mit Zirkel und Lineal existierte (siehe Kapitel [3]). Der Beweis basiert auf der Kenntnis des Zahlentyps, zu dem π gehört. Wir haben gesehen, dass π keine rationale Zahl ist. Der nächste Schritt von den rationalen Zahlen aufwärts führt uns zu den algebraischen Zahlen, die einer polynomialen Gleichung mit ganzzahligen Koeffizienten genügen. Beispielsweise ist 2 algebraisch, da es die Gleichung x – 2 = 0 erfüllt. Eine Zahl, die nicht algebraisch ist, wird als transzendent bezeichnet, und 1761 vermutete Lambert, der bewiesen hatte, dass π irrational ist, dass diese Zahl tatsächlich transzendent ist. Es sollte 112 Jahre dauern, bis Charles Hermite 1873 der erste große Durchbruch gelang: Er konnte beweisen, dass die andere berühmte seltsame Zahl in der Mathematik, die Basis e der natürlichen Logarithmen (siehe Kapitel [e]), transzendent ist. 1882 verbesserte Ferdinand von Lindemann Hermites Methode und zeigte, dass e, wenn es mit einer algebraischen Zahl ungleich null potenziert wird, transzendent ist. Dann machte er sich Eulers iπ Formel e = –1 zunutze, und zwar so: Man nehme an, π sei algebraisch.
Dann gilt das auch für iπ. Daher besagt Lindemanns Satz implizit, dass –1 transzendent ist. Es erfüllt jedoch eine polynomiale Gleichung, nämlich x + 1 = 0, ist also algebraisch. Der einzige Ausweg aus diesem logischen Widerspruch ist, dass π eine algebraische Gleichung nicht erfüllt, was bedeutet, dass π transzendent ist. Eine wichtige Konsequenz dieses Satzes ist die Antwort auf das klassische geometrische Problem der Quadratur des Kreises. Dies ist der Konstruktion einer Geraden der Länge π äquivalent, wobei man von einer Geraden der Länge 1 ausgeht. Wie die Koordinatengeometrie zeigt, muss jede Zahl, die sich auf diese Weise konstruieren lässt, algebraisch sein. Da π nicht algebraisch ist, kann es keine derartige Konstruktion geben. Das hält einige Leute jedoch nicht davon ab, selbst heute noch weiter nach einer Zirkel-und-Lineal-Lösung zu suchen. Sie verstehen offenbar nicht, was «unmöglich» in der Mathematik meint. Es ist ein altes Verwirrspiel. Im Jahr 1872 verfasste De Morgan ein Buch mit dem Titel A Budget of Paradoxes (etwa: Ein Bündel Paradoxien), in dem er die Irrtümer zahlreicher Möchtegern-Kreisquadrierer entlarvte und sie mit einem Tausend Fliegen verglich, die um einen Elefanten herumsummten, wobei jede von sich behauptete, «größer als der Dickhäuter» zu sein. 1992 setzte Underwood Dudley die Arbeit seines Vorgängers in Mathematical Cranks (deutsch: Mathematik zwischen Wahn und Witz) fort. Lassen Sie sich nicht davon abhalten, geometrische Näherungen für π und Konstruktionen mit Hilfe anderer Instrumente zu versuchen. Aber glauben Sie mir bitte, dass Konstruktionen mit Zirkel und Lineal im strengen klassischen Sinne nicht möglich sind.
Der Goldene Schnitt Diese Zahl war schon den alten Griechen im Zusammenhang mit regelmäßigen Fünfecken und dem Dodekaeder in der euklidischen Geometrie geläufig. Sie ist eng mit der Folge der Fibonacci-Zahlen (siehe Kapitel [8]) verknüpft, und sie erklärt einige auffällige Merkmale beim Aufbau von Pflanzen im Allgemeinen und Blüten im Speziellen. Gewöhnlich wird sie als Goldene Zahl oder Goldener Schnitt bezeichnet, ein Name, der zwischen 1826 und 1835 geprägt wurde. Über die mystischen und ästhetischen Eigenschaften dieser Zahl wird seit langem spekuliert, doch die meisten dieser Spekulationen sind übertrieben, einige basieren auf zweifelhaften Statistiken, und viele haben auch gar keine Basis. Der Goldene Schnitt hat jedoch tatsächlich einige bemerkenswerte mathematische Eigenschaften; er ist mit den Fibonacci-Zahlen verknüpft und weist zudem echte Verbindungen mit der natürlichen Welt auf – vor allem mit der Numerologie und der Geometrie der Pflanzen. Die griechische Geometrie
Die Zahl φ (griechisch ‹Phi› – manchmal in einer anderen Notation τ für griechisch ‹Tau› geschrieben) tauchte in der Geometrie erstmals im Zusammenhang mit dem regelmäßigen Fünfeck in Euklids Elementen auf. So, wie es in jener Zeit üblich war, wurde sie geometrisch, nicht numerisch interpretiert. Es gibt eine exakte Formel für φ, zu der wir gleich kommen werden. Auf sechs Dezimalstellen genau ist und auf 100 Dezimalstellen ist Ein typisches Merkmal von φ wird deutlich, wenn wir den Kehrwert ausrechnen. Wiederum auf sechs Dezimalstellen genau ist Das spricht dafür, dass ist. Diese Beziehung lässt sich 2 als quadratische Gleichung φ = φ + 1 oder in Standardform schreiben. Die Algebra quadratischer Gleichungen zeigt, dass diese Gleichung zwei Lösungen hat:
Numerisch ergibt das 1,618034 und –0,618034. Wir nehmen die positive Lösung als Definition für φ. Daher ist und es stimmt tatsächlich, dass ist. Zusammenhang mit Fünfecken Der Goldene Schnitt taucht in der Geometrie der regelmäßigen Fünfecke auf. Man beginne mit einem regelmäßigen Fünfeck, dessen Seiten die Länge 1 haben. Man zeichne die fünf Diagonalen ein, um einen fünfzackigen Stern (Pentagramm) zu erhalten. Euklid bewies, dass die Länge jeder Diagonale dem Goldenen Schnitt entspricht. Genauer gesagt arbeitete Euklid mit der «Teilung einer Strecke im inneren und äußeren Verhältnis». Das ist ein Verfahren, eine Strecke so in zwei Teile zu teilen, dass das Verhältnis des größeren Teilstücks zum kleineren dem Verhältnis der ganzen Strecke zum größeren Teilstück entspricht.
Abbildung 102: Ein regelmäßiges Fünfeck oder Pentagon und seine Diagonalen. Abbildung 103: Teilung einer Strecke im inneren und äußeren Verhältnis: Das Verhältnis der dunkelgrauen Strecke der Länge 1 zu der hellgrauen Strecke (x – 1) entspricht dem Verhältnis der schwarzen Strecke der Länge x zu der dunkelgrauen Strecke (1). Zu welcher Zahl führt dieses Verfahren? In Symbolen ausgedrückt, nehmen wir an, die schwarze Strecke habe die Länge x, die dunkelgraue die Länge x – 1. Daher lässt sich die Bedingung für eine Teilung im inneren und äußeren Verhältnis auf die Gleichung
zurückführen, was sich zu umordnen lässt. Das ist die Gleichung, die den Goldenen Schnitt definiert, und uns interessiert diejenige Lösung, die größer 1 ist, nämlich φ. Euklid stellte fest, dass die Seiten in der Abbildung des Fünfecks die Diagonalen in einem inneren und äußeren Verhältnis teilen. Das erlaubte ihm, ein regelmäßiges Fünfeck mit den traditionellen Instrumenten Zirkel und Lineal zu konstruieren (siehe Kapitel [17]). Und das Fünfeck war für die Griechen von großer Bedeutung, denn es bildet die Seiten eines der fünf regelmäßigen Körper, des Dodekaeders (Zwölfflächners). Der Höhepunkt der Elemente ist ein Beweis, dass es genau fünf regelmäßige Körper gibt (siehe Kapitel [5]). Fibonacci-Zahlen Der Goldene Schnitt ist eng mit den Fibonacci-Zahlen verknüpft, die 1202 von Leonardo da Pisa eingeführt wurden (siehe Kapitel [8]). Erinnern Sie sich daran, dass diese Zahlenfolge so beginnt:
Nach den beiden ersten Zahlen ergibt sich jede Folgezahl aus der Addition der beiden vorangegangenen Zahlen: 1 + 1 = 2, 1 + 2 = 3, 2 + 3 = 5, 3 + 5 = 8, und so weiter. Die Verhältnisse aufeinander folgender Fibonacci-Zahlen rückt immer näher an den Goldenen Schnitt heran: und diese Eigenschaft lässt sich anhand der Regel für die Bildung der Folge und der quadratischen Gleichung für φ beweisen. Umgekehrt können wir die Fibonacci-Zahlen mittels des Goldenen Schnitts (siehe Kapitel [8])
ausdrücken. Auftreten bei Pflanzen Schon vor mehr als 2000 Jahren ist Beobachtern aufgefallen, dass Fibonacci-Zahlen im Pflanzenreich sehr häufig auftreten. So haben zum Beispiel viele Blütenpflanzen – vor allem in der Familie der Korbblütler, zu der auch das Gänseblümchen gehört – eine Fibonacci-Zahl an Blütenblättern. Ringelblumen haben in der Regel 13 Blütenblätter, Astern 21. Viele Vertreter der Gänseblümchengattung haben 34 Blütenblätter; wenn nicht, sind es gewöhnlich 55 oder 89. Sonnenblumen haben in der Regel 55, 89 oder 144 Blütenblätter. Andere Zahlen tauchen ebenfalls auf, wenn auch seltener: So haben Fuchsien beispielsweise 4 Blütenblätter. Bei diesen Ausnahmen kommt häufig die Lucas-Folge 4, 7, 11, 18 und 29 ins Spiel, deren Glieder genauso wie die der Fibonacci-Folge gebildet werden, die aber mit 1 und 3 startet. Auf einige Beispiele werden wir später noch zurückkommen. Dieselben Zahlen tauchen auch bei einer ganzen Reihe anderer Pflanzenmerkmale auf. Eine Ananasfrucht weist auf ihrer Oberfläche ein annähernd hexagonales Muster auf; diese Sechsecke sind individuelle Früchte, die beim Heranwachsen miteinander verschmelzen. Gemeinsam bilden sie zwei ineinandergreifende Spiralenfamilien. Eine Familie verläuft, von oben gesehen, gegen den Uhrzeigersinn und enthält 8 Spiralen, die andere Familie im Uhrzeigersinn und enthält 13 Spiralen. Es ist auch
möglich, eine dritte Familie mit 5 Spiralen auszumachen, die in einem flacheren Winkel im Uhrzeigersinn verläuft. Abbildung 104: Links: Drei Familien von Spiralen auf einer Ananasfrucht. Rechts: Familie von 13 gegen den Uhrzeigersinn verlaufenden Spiralen auf einem Kieferzapfen. Der Schlüssel zur Geometrie der Sonnenblumenspiralen ist der Goldene Schnitt, der seinerseits wiederum das Auftreten der Fibonacci-Zahlen erklärt. Man teile einen Vollkreis (360°) in zwei Kreisbögen, die im Verhältnis des Goldenen Schnitts zueinander stehen, sodass der vom größeren Bogen bestimmte Winkel φ-mal so groß ist wie der vom kleineren Bogen bestimmte Winkel. Dann ist der kleinere Bogen -mal kleiner als ein Vollkreis. Dieser Winkel, der als Goldener Winkel bezeichnet wird, hat ungefähr eine Größe von 137,5°. Im Jahr 1868 beobachtete der deutsche Botaniker Wilhelm Hofmeister, wie sich die Schösslinge einer jungen Pflanze im Lauf ihres Wachstums verändern, und legte die Grundlagen für alle weiteren Forschungen auf diesem Gebiet. Das Grundmuster der Entwicklung wird davon bestimmt, was in dem sich teilenden Gewebe an der Spitze der Pflanze passiert. Dabei
handelt es sich um Zellansammlungen, sogenannten Organanlagen (Primordien), aus denen sich zum Beispiel die Samen entwickeln. Hofmeister entdeckte nun, dass aufeinanderfolgende Primordien auf einer Spirale liegen. Jede dieser Anlagen ist von der davor liegenden Anlage durch den Goldenen Winkel A getrennt, daher ist der n-te Samen gegenüber dem ersten um einen Winkel nA verschoben. Die Entfernung vom Zentrum ist der Quadratwurzel von n proportional. Abbildung 105: Fibonacci-Spiralen auf dem Blütenboden einer Sonnenblume. Links: Anordnung der Samen («Sonnenblumenkerne»). Rechts: Vertreter zweier Familien von Spiralen: im Uhrzeigersinn (hell) und gegen den Uhrzeigersinn (dunkel). Diese Beobachtung erklärt das Muster der Sonnenblumenkerne auf dem Blütenboden einer Sonnenblume. Man erhält es, wenn man die aufeinanderfolgenden Kerne so gegeneinander versetzt, dass die Winkel ganzzahlige Vielfache des Goldenen Winkels bilden. Die Entfernung vom Mittelpunkt sollte dann proportional zur Quadratwurzel des betreffenden Vielfachen sein. Wenn wir den Goldenen Winkel A nennen, dann folgen die Kerne im Winkel von
aufeinander, und die Entfernung zum Zentrum ist proportional zu Bei Blüten von Korbblütlern wie Gänseblümchen bilden sich die Blütenblätter am äußeren Ende einer der Familien von Spiralen. Daher zieht eine Fibonacci-Zahl von Spiralen eine Fibonacci-Zahl an Blütenblättern nach sich. Aber warum entspricht die Anzahl der Spiralen einer FibonacciZahl? Das liegt am Goldenen Winkel. Abbildung 106: Platzierung aufeinanderfolgender Kerne bei Winkeln von 137°, 137,5° und 138°. Nur beim Goldenen Winkel liegen die Kerne dicht gepackt. Im Jahr 1979 benutzte Helmut Vogel die geometrische Anordnung von Sonnenblumenkernen, um zu erklären, warum dabei der Goldene Winkel auftritt. Er zeigte, was mit den Sonnenblumensamen passieren würde, wenn man dieselbe Spiralanordnung zugrunde legt, den Goldenen Winkel von 137,5° jedoch leicht verändert. Nur der Goldene Winkel führt zu eng gepackten Kernen, die weder Lücken lassen noch einander überlappen.
Selbst eine Veränderung des Winkels um nur ein Zehntelgrad führt dazu, dass das Muster in einzelne Spiralfamilien aufbricht und zwischen den Kernen Lücken bleiben. Das erklärt, warum der Goldene Winkel eine Sonderstellung einnimmt und es sich nicht nur um einen numerischen Zufall handelt. Eine umfassende Erklärung geht jedoch noch tiefer. Wenn die Zellen wachsen und sich bewegen, entstehen Kräfte, die sich auf die Nachbarzellen auswirken. Im Jahr 1992 untersuchten die Physiker Stéphane Douady und Yves Couder die Mechanismen solcher Systeme experimentell und anhand von Computersimulationen. Sie fanden, dass sich die Winkel zwischen aufeinanderfolgenden Samen dem Goldenen Winkel annähern wie das Verhältnis aufeinanderfolgender Fibonacci-Zahlen dem Goldenen Schnitt. Ihre Theorie erklärt auch das sonderbare Auftreten von Nicht-FibonacciZahlen, wie die vier Blütenblätter der Fuchsie. Diese Ausnahmen basieren auf einer Folge, die der Fibonacci-Folge sehr ähnlich ist und als LucasFolge bezeichnet wird: Die Formel für diese Gleichung lautet was stark an die Formel für die Fibonacci-Folge erinnert, die wir ein paar Seiten zuvor besprochen haben.
Die vier Blütenblätter der Fuchsie sind ein Beispiel für eine Lucas-Zahl von Blütenblättern. Einige Kakteen zeigen ein Muster von 4 Spiralen in der einen und 7 Spiralen in der anderen Richtung, oder auch 11 in der einen und 18 in der anderen. Eine Art der Kakteengattung Echinocactus weist 29 Rippen auf. Bei Sonnenblumen hat man Gruppen von 47 und 76 Spiralen gefunden. Eine der wichtigsten Gebiete der angewandten Mathematik ist die Elastizitätstheorie, die untersucht, wie sich Materialien verformen, wenn sie Kräften ausgesetzt sind. Diese Theorie erklärt zum Beispiel, wie sich Metallträger oder -platten in Gebäuden und Brücken verhalten. Im Jahr 2004 wendeten Patrick Shipman und Alan Newell die Elastizitätstheorie an, um das Heranwachsen eines Pflanzenschösslings zu simulieren, wobei sie sich vor allem auf Wachstum und Anordnung der Höcker konzentrierten, aus denen später die Kakteenstacheln hervorgehen. Sie stellten die Bildung von Organanlagen im Modell als Faltenbildung an der Wachstumsspitze des Schösslings dar und zeigten, dass dies zu einander überlagernden Mustern paralleler Wellen führt. Diese Muster werden von zwei Faktoren bestimmt: Wellenzahl und Wellenrichtung. Für die wichtigsten Muster spielen die Wechselbeziehungen zwischen drei solcher Wellen eine entscheidende Rolle, und die Wellenzahl für eine dieser Wellen muss gleich der Summe der beiden anderen Wellenzahlen sein. Die Spiralen auf der Ananasoberfläche sind ein gutes Beispiel; ihre Wellenzahlen betragen 5, 8 und 13. Mit ihrer Theorie können die beiden Physiker die Fibonacci-Zahlen unmittelbar auf die Arithmetik von Wellenmustern zurückführen. Wie steht es mit der dahinter steckenden Biochemie? Die Bildung von Organanlagen (Primordien) wird von einem pflanzlichen
Wachstumshormon namens Auxin vorangetrieben. Und ähnliche Wellenmuster wie oben beschrieben treten bei der Auxinverteilung auf. Daher steckt hinter einer vollständigen Erklärung von Fibonacci-Zahlen und Goldenem Schnitt ein Wechselspiel zwischen Biochemie, mechanischen Kräften, die zwischen Zellen wirken, und Geometrie. Auxin stimuliert das Wachstum von Primordien. Diese Primordien üben mechanische Kräfte aufeinander aus. Und diese Kräfte schaffen die Geometrie. Entscheidend ist, dass die Geometrie wiederum die Biochemie beeinflusst, indem sie an bestimmten Stellen die Produktion von zusätzlichem Auxin anregt. Daher existiert an dieser Stelle ein komplexes Geflecht von Rückkopplungsschleifen zwischen Biochemie, Mechanik und Geometrie.
Natürliche Logarithmen Nach π ist die nächste wirklich eigentümliche Zahl, auf die wir – gewöhnlich in der Differenzial- und Integralrechnung – stoßen, die Zahl e, wobei e für «exponentiell» steht. Erstmals wurde e 1683 von Jacob Bernoulli diskutiert. Diese Zahl tritt bei Zinseszinsproblemen auf, führte zu Logarithmen und sagt uns, in welcher Weise Variablen wie Temperatur, Radioaktivität oder die Weltbevölkerung zunehmen oder abnehmen. Euler verknüpfte e mit π und i. Zinsen Falls wir uns Geld leihen oder es anlegen, müssen wir in der Regel Zinsen auf die Kreditsumme zahlen bzw. erhalten Zinsen auf unser Kapital. Wenn wir beispielsweise 100 Euro mit einem Zinssatz von 10 Prozent pro Jahr anlegen, erhalten wir nach einem Jahr 110 Euro zurück. Natürlich erscheinen 10 Prozent Kapitalzinsen in der gegenwärtigen Finanzkrise unrealistisch hoch, doch gleichzeitig unrealistisch niedrig, wenn es sich um Kreditzinsen handelt, vor allem um solche für Überbrückungskredite mit
astronomisch hohem Effektivzins. Aber sei es, wie es wolle, es ist ein praktischer Prozentsatz, um diese Art von Rechnung zu illustrieren. Oft geht es bei Krediten oder Kapitalanlagen nicht um einfache Zinsrechnung, sondern um Zinseszinsrechnung. Das heißt, die Zinsen werden zu der ursprünglichen Summe dazuaddiert und die Zinsen dann auf die so entstandene neue Gesamtsumme gezahlt. Bei einem Zinseszinssatz von 10 Prozent und einer Zinseszinsrechnung betragen die Zinsen auf diese 100 Euro im Verlauf des zweiten Jahres 11 Euro, während die Zinsen für die ursprüngliche Summe nur 10 Euro betrügen. Daher hätten wir nach zwei Jahren Zinseszins 121 Euro. Im dritten Jahr Zinseszins kämen 12,10 Euro hinzu, insgesamt wären es also 133,10 Euro, und im vierten Jahr würde die Summe auf insgesamt 146,41 Euro steigen. Die mathematische Konstante, die als e bekannt ist, taucht auf, wenn wir uns einen Zinssatz von 100 Prozent vorstellen, sodass sich unser Kapital nach einem bestimmten festgelegten Zeitraum (sagen wir, nach einem Jahrhundert) verdoppelt. Für jeden Euro, den wir investieren, erhalten wir nach dieser Zeitspanne 2 Euro zurück. Angenommen, statt eines Zinssatzes von 100 Prozent über ein Jahrhundert wenden wir einen Zinssatz von 50 Prozent (halb so viel) auf ein halbes Jahrhundert (zweimal so oft) an und zinsen dies auf. Nach einem halben Jahrhundert beträgt unser Vermögen in Euro Nach der zweiten Hälfte besitzen wir
Daher wächst unser Vermögen schneller. Wenn wir das Jahrhundert in drei gleich lange Zeiträume teilen und den Zinssatz durch 3 teilen, würde unser einer Euro, auf zehn Dezimalstellen genau, so wachsen: Das ist ein noch schnelleres Wachstum als zuvor. Die obigen Zahlen bilden ein Muster: Mathematiker fragten sich, was wohl geschehen würde, wenn man den Zinssatz kontinuierlich anwenden würde – das heißt, über immer kleinere Teile der Gesamtperiode. Nun lässt sich das Muster so beschreiben: Wenn wir den Zeitraum in n gleiche Teile teilen und unser Zinssatz beträgt, dann besäßen wir am Ende des Verzinsungszeitraums einen Betrag von
Ein kontinuierlicher Zinseszins entspricht einem Verfahren, bei dem n außerordentlich groß wird. Lassen Sie uns daher einige Berechnungen durchführen, wiederum auf zehn Dezimalstellen genau: n 2 2,500000000 3 2,3703703704 4 2,4414062500 5 2,4883200000 10 2,5937424601 100 2,7048138294 1000 2,7169239322 10 000 2,7181459268 100 000 2,7182682372 1 000 000 2,7182816925 10 000 000 2,7182816925 Tabelle 10 Wir müssen sehr große Werte für n nehmen, um das Muster zu erkennen, doch es sieht so aus, als würde der Ausdruck einem Grenzwert zustreben und bei sehr stark wachsendem n letztlich immer näher an eine feste Zahl heranrücken, die annähernd gleich 2,171828 ist.
Das ist auch tatsächlich der Fall, und Mathematiker definieren eine spezielle Zahl namens e als diesen Grenzwert: wobei das Symbol lim (von lateinisch limes, Grenze) so viel bedeutet wie «Lassen wir n unendlich groß werden und schauen wir, auf welchen Wert der Ausdruck zustrebt». Auf 100 Dezimalstellen genau gilt Bei e handelt es sich um eine weitere dieser eigenartigen Zahlen, die wie π eine Dezimalentwicklung haben, welche ewig weiterläuft, aber niemals denselben Ziffernblock unablässig wiederholt. Das heißt, e ist irrational (siehe Kapitel [ ], [π]). Im Gegensatz zu π ist leicht zu beweisen, dass e irrational ist; Euler entdeckte den Beweis 1737, veröffentlichte ihn jedoch erst sieben Jahre später. Im Jahr 1748 berechnete Euler die ersten 23 Nachkommastellen von e, und eine Reihe späterer Mathematiker verbesserten sein Ergebnis. Bis 2010 war es Shigeru Kondo und Alexander Yee schließlich gelungen, mit Hilfe eines schnellen Computers und eines verbesserten Verfahrens die erste Billion Dezimalstellen von e zu bestimmen. Natürliche Logarithmen
Im Jahr 1614 schrieb John Napier, achter Laird of Merchistoun (heute Merchiston, Teil der schottischen Stadt Edinburgh) ein Buch mit dem Titel Mirifici Logarithmorum Canonis Descriptio (Beschreibung des wundervollen Grundprinzips der Logarithmen). Offenbar hat er den Begriff «Logarithmus» selbst geprägt, abgeleitet vom griechischen logos «Verständnis, Lehre, Verhältnis» und arithmos, «Zahl». Seine Idee stellte er so vor: «Nichts, meine werten Kollegen, ist beim Ausüben der Mathematik so lästig wie jene Eintönigkeit, die sich einstellt bei der Multiplikation und Division von großen Zahlen, beim Ziehen von Quadrat- und Kubikwurzeln. Nicht nur den damit verbundenen Zeitaufwand möge man bedenken, sondern auch das Ärgernis durch die vielen kleinen Flüchtigkeitsfehler, die hierbei entstehen können. Daher habe ich darüber nachgedacht, wie ich auf schnellem und sicherem Wege hinsichtlich besagter Misslichkeiten für eine Verbesserung sorgen könnte. Schließlich habe ich nach langem Grübeln einen erstaunlichen Weg gefunden, um dieses Prozedere abzukürzen … Es ist mir eine angenehme Aufgabe, Mathematikern diese Methode für den allgemeinen Gebrauch zu erläutern.» Napier wusste aus eigener Erfahrung, dass viele wissenschaftliche Probleme, vor allem in der Astronomie, das Multiplizieren komplizierter großer Zahlen oder auch das Ziehen von Quadrat- und Kubikwurzeln
erforderten. In einer Zeit, in der es keine Elektrizität gab, geschweige denn Computer, mussten sämtliche Berechnungen per Hand vorgenommen werden. Zwei Dezimalzahlen zu addieren, war noch einigermaßen simpel, aber sie zu multiplizieren, war schon deutlich zeitaufwendiger. Daher erfand Napier eine Methode, um Multiplikationen in Additionen zu verwandeln. Der Trick bestand darin, mit den Potenzen einer festen Zahl zu arbeiten. In der Algebra werden die Potenzen einer unbekannten Größe x durch 2 3 eine kleine hochgestellte Zahl angezeigt. Das heißt, xx = x , xxx = x , xxxx = 4 x und so weiter, wobei das Nebeneinanderstellen zweier Buchstaben bedeutet, dass beide miteinander multipliziert werden sollen. Beispielsweise 3 4 ist 10 = 10 × 10 × 10 = 1000, und 10 = 10 × 10 × 10 × 10 = 10000. Zwei derartige Ausdrücke miteinander zu multiplizieren, ist einfach. 4 3 Stellen Sie sich zum Beispiel vor, wir wollten das Ergebnis von 10 × 10 finden. Wir schreiben Die Zahl der Nullen in der Antwort beträgt 7, was gleich 4 + 3 ist. Der erste Schritt in der Berechnung zeigt, warum das so ist: Wir platzieren vier Zehner und 3 Zehner nebeneinander. Daher ist
In derselben Weise gilt: Welchen Wert auch immer x annimmt, wenn wir seine a-te Potenz mit seiner b-ten Potenz multiplizieren, wobei a und b ganze Zahlen sind, erhalten wir die (a + b)-te Potenz: Das ist interessanter, als es auf den ersten Blick scheinen mag, denn während auf der linken Seite zwei Größen miteinander multipliziert werden, werden auf der rechten Seite lediglich a und b addiert werden, was deutlich einfacher ist. In der Lage zu sein, ganzzahlige Potenzen von 10 zu multiplizieren, ist kein besonders großer Fortschritt. Dasselbe Prinzip lässt sich jedoch auch auf schwierigere Berechnungen ausdehnen. Angenommen, wir wollen 1,484 mit 1683 multiplizieren. Durch Ausmultiplizieren erhält man 2,497572, was, auf drei Nachkommastellen a b a+b gerundet, 2,498 ergibt. Stattdessen können wir auch die Formel x x = x benutzen, indem wir x geeignet wählen. Wenn wir x gleich 1,001 setzen, dann zeigt ein wenig Arithmetik, dass ist, jeweils korrekt auf drei Nachkommastellen. Dann sagt uns die Formel, dass 1,484 × 1,683 gleich ist, was, auf drei Nachkommastellen genau, 2,498 ergibt. Nicht schlecht!
Das Kernstück der Berechnung ist eine einfache Addition: 395 + 521 = 916. Auf den ersten Blick scheint es jedoch so, als verkompliziere diese 395 Methode das Problem. Um das Ergebnis von 1001 herauszufinden, muss man 1001 zunächst 395 Mal mit sich selbst multiplizieren, und dasselbe gilt für die beiden anderen Potenzen. Daher scheint das Ganze wirklich verlorene Liebesmüh zu sein. Napiers Geistesblitz war zu erkennen, dass dieser Einwand nicht sticht. Aber um ihn aus dem Weg zu räumen, muss irgendjemand eine wahre Sisyphusarbeit erledigen und eine ganze Menge 2 Potenzen von 1001 berechnen, beginnend mit 1001 und fortlaufend bis zu, 10 000 sagen wir, 1001 . Wenn man eine Tabelle mit diesen Potenzen veröffentlicht, steckt die ganze Arbeit da schon drin. Dann muss man nur noch mit dem Finger die Reihen mit den sukzessiven Potenzen entlangfahren, bis man 1,484 neben 395 und auf dieselbe Weise 1,683 neben 521 findet. Anschließend addiert man diese beiden Zahlen und erhält 921. Die korrespondierende Reihe der Tabelle sagt uns dann, dass diese Potenz von 1001 gleich 2,498 ist. Aufgabe gelöst. Im Kontext dieses Beispiels sagen wir, dass die Potenz 395 der Logarithmus der Zahl 1,484 und 521 der Logarithmus der Zahl 1,683 ist. Entsprechend ist 916 der Logarithmus ihres Produkts 2,498. Wenn wir ‹log› als Abkürzung für Logarithmus benutzen, führt uns das, was wir gerade gemacht haben, zu der Gleichung was für alle beliebigen Zahlen a und b gilt. Die recht willkürlich gewählte Zahl 1001 wird als Basis bezeichnet. Wenn wir eine andere Basis benutzen,
sind die Logarithmen, die wir berechnen, ebenfalls andere, aber für jede feste Basis funktioniert alles in der gleichen Weise. Briggs’ Verbesserung Das ist es, was Napier hätte tun sollen, doch aus unerfindlichen Gründen wählte er einen etwas anderen und nicht ganz so bequemen Weg. Ein Mathematiker namens Henry Briggs war begeistert von dem Durchbruch, der Napier gelungen war. Aber als typischer Vertreter seiner Zunft war die Tinte auf dem Papier kaum getrocknet, als er sich schon zu fragen begann, ob es nicht eine Möglichkeit gäbe, die ganze Sache zu vereinfachen. Und die gab es tatsächlich. Als Erstes schrieb er Napiers Idee so um, dass sie in der Weise funktionierte, die ich gerade beschrieben habe. Anschließend stellte er fest, dass die Benutzung von Potenzen einer Zahl wie 1001 darauf hinausläuft, Potenzen dieser speziellen Zahl e (bzw. einer Näherung an e) zu verwenden. 1000 Die 1000. Potenz 1001 ist gleich , und das muss aufgrund der Definition von e nahe an e liegen. Setzen Sie nur einmal n = 1000 in die Formel können wir schreiben: 1000 ein. Statt daher zu schreiben
1000 Nun liegt 1,001 sehr nahe bei e, daher kann man in vernünftiger Näherung schreiben: Um genauere Ergebnisse zu erzielen, benutzen wir Potenzen einer Zahl, die 1000000 deutlich näher an 1 liegt, zum Beispiel 1,000001. Nun liegt 1,000001 noch näher an e. Das macht die Tafel mit rund einer Million Potenzen natürlich beträchtlich größer. Diese Tafel zu berechnen, ist eine Mordsarbeit – aber diese Arbeit muss nur ein einziges Mal durchgeführt werden. Wenn jemand diese Mühe auf sich nimmt, spart er damit nachfolgenden Generationen eine gigantische Menge an Rechnerei. Und es ist nicht besonders schwierig, eine Zahl mit 1,000001 zu multiplizieren. Man muss nur wie ein Luchs aufpassen, um keinen Fehler zu machen. Diese Version von Briggs’ Verbesserung lief darauf hinaus, den natürlichen Logarithmus einer Zahl als die Potenz zu definieren, zu der e erhoben werden muss, um diese Zahl zu ergeben. Das heißt, für jedes beliebige x. Nun ist und eine Tafel mit natürlichen Logarithmen reduziert, einmal berechnet, jedes beliebige Multiplikationsproblem auf ein Additionsproblem. Das Verfahren lässt sich für praktische Berechnungen sogar noch stärker vereinfachen, wenn wir e durch 10 ersetzen, sodass 10 log x = x wird. Nun
erhalten wir Logarithmen zur Basis 10, geschrieben log10x. Der entscheidende Punkt ist, dass nun log10 10 = 1 ist, log10 100 = 2, und so weiter. Sobald man einmal die Logarithmen zur Basis 10 der Zahlen zwischen 1 und 10 kennt, lassen sich alle anderen Logarithmen leicht finden. Zum Beispiel: und so weiter. Logarithmen zur Basis 10 (auch kurz Zehnerlogarithmen genannt) sind für normale arithmetische Berechnungen praktischer, weil wir im Allgemeinen das Zehnersystem benutzen. In der höheren Mathematik gilt die 10 jedoch nicht als etwas so Besonderes. Wir könnten auch jede andere Zahl als Basis für unsere Notation gebrauchen. Wie sich herausgestellt hat, spielen Briggs’ natürliche Logarithmen zur Basis e für die höhere Mathematik eine wichtigere Rolle als Zehnerlogarithmen. Von den vielen Eigenschaften von e möchte ich an dieser Stelle nur eine erwähnen: Die Zahl taucht in der Stirling-Formel zur näherungsweisen Berechnung von Fakultäten auf, die sehr nützlich ist, wenn n groß wird: Exponentielles Wachstum und exponentielles Abklingen
Die Zahl e taucht überall in den Naturwissenschaften auf, denn sie bildet die Grundlage sämtlicher natürlicher Prozesse, bei denen die Wachstumsoder Abklingrate einer Größe zu jedem beliebigen Zeitpunkt proportional zur Menge der Größe zu diesem Zeitpunkt ist. Wenn man die Rate, mit der sich die Größe x verändert, x' nennt, lässt sich ein solcher Prozess durch eine Differenzialgleichung beschreiben: wobei k eine Konstante ist. Nach den Regeln der Differentialrechnung lautet die Lösung zum Zeitpunkt t, wobei x0 der Anfangswert zum Zeitpunkt t = 0 ist. kt Abbildung 107: Links: Exponentielles Wachstum e für k = 0,1 (unterste Kurve); 0,2; …, 1 –kt (obere Kurve). Rechts: Exponentielles Abklingen e (unterste Kurve). Exponentielles Wachstum k für k = 0,1 (obere Kurve); 0,2; …, 1
kt Wenn k positiv ist, wächst x0e mit steigendem t immer schneller: Das nennt man exponentielles Wachstum. Nehmen wir zum Beispiel an, x sei die Größe einer tierischen Population. Wenn die Tiere über unbegrenzte Ressourcen verfügen, wächst die Population mit einer Rate, die proportional zu ihrer Größe ist, daher ist das exponentielle Modell anwendbar. Schließlich wächst die Population auf eine unrealistische Größe an. In der Praxis ist es jedoch so, dass den Tieren die Nahrung, der Lebensraum oder irgendeine andere Ressource ausgeht, sodass die Größe der Population begrenzt wird, und man muss ein komplexeres Modell benutzen. Dieses einfache Modell hat jedoch den Vorteil zu zeigen, dass uneingeschränktes Wachstum mit konstanter Zuwachsrate im Endeffekt unrealistisch ist. Die menschliche Bevölkerung ist im größten Teil der aufgezeichneten Geschichte mehr oder minder exponentiell gewachsen, doch es gibt Anzeichen, die dafür sprechen, dass diese Wachstumsrate seit etwa 1980 abgenommen hat. Wenn nicht, stehen uns große Schwierigkeiten bevor. Vorhersagen über die zukünftige Populationsentwicklung gehen davon aus, dass sich dieser Trend fortsetzen wird, doch selbst dann ist die Unsicherheit beträchtlich. Schätzungen der Vereinten Nationen für das Jahr 2100 schwanken zwischen 6 Milliarden (weniger als die gegenwärtige Weltbevölkerung von 7,2 Milliarden) und 16 Milliarden (mehr als das Doppelte der gegenwärtigen Weltbevölkerung).
Abbildung 108: Wachstum der Weltbevölkerung. Exponentielles Abklingen kt Wenn k negativ ist, geht x0e mit steigendem t immer schneller zurück: Das bezeichnet man als exponentielles Abklingen oder als exponentiellen Abfall. Zu den bekannten Beispielen gehören das Abkühlen eines heißen Körpers und der radioaktive Zerfall. Radioaktive Elemente wandeln sich durch Vorgänge im Atomkern in andere Elemente um, wobei Kernteilchen in Form von Strahlung frei werden. Das Niveau der Radioaktivität geht mit der Zeit exponentiell zurück. Daher folgt der Radioaktivitätspegel x(t) zum Zeitpunkt t der Gleichung wobei x0 das Anfangsniveau und k eine positive Konstante ist, die von dem betreffenden Element abhängt.
Ein praktisches Maß für einen Zeitraum, in dem die Radioaktivität anhält, ist die sogenannte Halbwertszeit, ein Konzept, das 1907 eingeführt wurde. Das ist die Zeit, in der die Radioaktivität von einem Anfangswert x0 auf die Hälfte zurückgeht. Angenommen, die Halbwertszeit beträgt beispielsweise 1 Woche. Dann halbiert sich die ursprüngliche Radioaktivität und auch die Rate, mit der das Material radioaktive Strahlung emittiert, nach 1 Woche, ist nach 2 Wochen auf ein Viertel gesunken, nach 3 Wochen auf ein Achtel, und so weiter. Die Radioaktivität benötigt 10 Wochen, um auf ein Tausendstel des ursprünglichen Niveaus abzufallen (genauer ), und 20 Wochen, um auf ein Millionstel zurückzugehen. Um die Halbwertszeit zu berechnen, lösen wir die Gleichung indem wir beide Seiten logarithmieren. Das Ergebnis ist Die Konstante k lässt sich experimentell bestimmen. Die wichtigsten radioaktiven Produkte, die bei Unfällen aus modernen Kernreaktoren freigesetzt werden, sind Jod-131 und Caesium-137. Ersteres kann zu Schilddrüsenkrebs führen, weil sich in der Schilddrüse radioaktives Jod ansammelt. Die Halbwertszeit von Jod-131 beträgt nur 8 Tage, daher richtet es nur wenig Schaden an, wenn die richtige Medikation (hauptsächlich Jodtabletten) zur Verfügung steht. Caesium-137 hat eine Halbwertszeit von 30 Jahren, daher dauert es fast 200 Jahre, bis das
Radioaktivitätsniveau auf ein Hundertstel des Anfangswertes fällt. Aus diesem Grund bleibt radioaktives Caesium, wenn es nicht beseitigt werden kann, sehr lange Zeit ein Gesundheitsrisiko. Verbindung zwischen e und π (Euler’sche Formel) Im Jahr 1748 stieß Leonhard Euler auf eine bemerkenswerte Beziehung zwischen e und π, von der man oft sagt, sie habe zur wunderbarsten Gleichung in der gesamten Mathematik geführt. Mit von der Partie ist auch die imaginäre Zahl i. Die Formel lautet: Diese Formel lässt sich anhand einer überraschenden Verbindung zwischen komplexen Exponentialfunktionen und trigonometrischen Funktionen erklären, nämlich was sich am einfachsten mit Methoden der Differenzial- und Integralrechnung beweisen lässt. In diesem Fall wird der Winkel θ im Bogenmaß gemessen, einer Einheit, bei der die vollen 360° eines Kreises gleich 2π rad gesetzt werden – rad steht dabei für Radiant, den Umfang eines Kreises vom Radius 1. Das Bogenmaß ist Standard in der höheren Mathematik, denn es vereinfacht sämtliche Formeln. Um die Euler’sche Formel herzuleiten, setzen wir θ = π. Dann ist cos π = –1, sin π = 0, und iπ daraus folgt, dass e = cos π + i sin π = –1 + i × 0 = –1 ist.
Ein alternativer Beweis, der die Theorie der Differenzialgleichungen benutzt, führt die Gleichung auf die Geometrie der komplexen Ebene zurück und hat den Vorteil, dass er erklärt, wie π in die ganze Sache hineinkommt. Hier ein Kurzabriss: Eulers Formel funktioniert, weil eine Multiplikation komplexer Zahlen mit i die komplexe Ebene um einen rechten Winkel dreht. Im Bogenmaß, das Mathematiker für theoretische Untersuchungen benutzen – hauptsächlich deshalb, weil es Differenzial- und Integralgleichungen vereinfacht –, ist ein Winkel durch die Länge des korrespondierenden Kreisbogens eines Einheitskreises definiert. Da der Einheitshalbkreis die Länge π hat, ist ein rechter Winkel gleich rad. Mit Hilfe von Differenzialgleichungen lässt sich nun zeigen, dass für jede reelle ix Zahl x eine Multiplikation mit der komplexen Zahl e die komplexe Ebene um x rad rotieren lässt. Insbesondere wird die komplexe Ebene durch eine Multiplikation mit um einen rechten Winkel gedreht. Aber genau diese Drehung ist es, die i bewirkt, und deshalb ist Durch Quadrieren beider Seiten erhalten wir die Euler’sche Formel.
Fraktale ist wirklich ein seltsamer Bruch, aber er definiert eine Grundeigenschaft des Sierpiński-Dreiecks (auch Sierpiński-Fläche oder Sierpiński-Dichtung genannt) und legt fest, wie stark geschlängelt oder rau Sierpińskis berühmte pathologische Kurve ist. Themen wie diese tauchen in der fraktalen Geometrie auf, eine neue Möglichkeit, komplexe Formen in der Natur nachzubilden. In diesem Zusammenhang verallgemeinert die fraktale Geometrie das Konzept der Dimension. Eines der berühmtesten Fraktale, die Mandelbrot-Menge, ist eine unendlich komplexe Form, die durch einen sehr einfachen Prozess definiert wird. Fraktale Das Sierpiński-Dreieck (siehe Kapitel [ ]) gehört zu einer kleinen Palette von Beispielen, die Anfang des 20. Jahrhunderts entdeckt wurden und damals den recht negativen Beinamen «pathologische Kurven» erhielten. Dazu gehören die Schneeflockenkurve von Helge von Koch wie auch die raumfüllenden Kurven von Giuseppe Peano und David Hilbert.
Abbildung 109: Links: Schneeflockenkurve. Rechts: Aufeinander folgende Stadien bei der Konstruktion von Hilberts raumfüllender Kurve. Damals waren solche Kurven etwas für Kenner: Gegenbeispiele für mehr oder weniger plausible mathematische Behauptungen, die tatsächlich falsch waren. Die Schneeflockenkurve ist stetig, aber nirgendwo differenzierbar, das heißt, sie weist keine Sprünge auf, ist aber überall gezackt. Sie hat eine unendliche Länge, schließt aber eine endliche Fläche ein. Die raumfüllenden Kurven sind nicht nur sehr dicht, sondern sie füllen tatsächlich den Raum. Wenn man die Konstruktion unendlich oft durchführt, laufen die resultierenden Kurven buchstäblich durch jeden Punkt im Inneren eines quadratischen Körpers. Einige stärker konservativ geprägte Mathematiker verspotteten solche Kurven als intellektuell unergiebig. Hilbert gehörte zu den wenigen führenden Wissenschaftlern seiner Zeit, die die Bedeutung dieser Kurven erkannten, da sie dazu beitrugen, die Mathematik präzise zu machen und ihre logische Basis zu beleuchten. Daher setzte er sich nachdrücklich dafür ein, ihre seltsamen Eigenschaften ernst zu nehmen.
Heute sehen wir diese Kurven in einem positiveren Licht: Es waren die ersten Schritte, die auf ein neues Gebiet der Mathematik führten: die fraktale Geometrie, deren Pionier Benoît Mandelbrot in den 1970er Jahren wurde. Pathologische Kurven wurden aus rein mathematischen Gründen entwickelt, doch Mandelbrot erkannte, dass ähnliche Formen Licht auf unregelmäßige Strukturen in der natürlichen Welt werfen können. Er wies darauf hin, dass Dreiecke, Quadrate, Kreise, Kegel, Kugeln und andere traditionelle Formen der euklidischen Geometrie keine Feinstruktur aufweisen. Wenn man einen Kreis genügend vergrößert, sieht das Ergebnis wie eine merkmalslose Gerade aus. Viele Formen in der Natur weisen jedoch bei starker Vergrößerung ein höchst komplexes «Innenleben» auf. Mandelbrot schrieb: «Wolken sind keine Kugeln, Berge keine Kegel, Küstenlinien keine Kreise. Baumrinde ist nicht glatt – und auch der Blitz bahnt sich seinen Weg nicht gerade.» Das war jedermann bekannt, doch Mandelbrot verstand als Erster die Bedeutung dieser Erkenntnis. Er wollte damit nicht sagen, dass die euklidischen Formen nutzlos sind. Sie spielen in den Naturwissenschaften eine herausragende Rolle. So sind Planeten beispielsweise annähernd kugelförmig, und frühe Astronomen benutzten dies als nützliche Näherung. Eine bessere Näherung erhält man, wenn die Kugel zu einem Ellipsoid zusammengedrückt wird – wiederum eine einfache euklidische Form. Für manche Zwecke sind einfache Formen jedoch nicht besonders hilfreich. Die Äste von Bäumen verzweigen sich in immer dünnere Triebe, Wolken sind unregelmäßig geformte rundliche Gebilde, Berge sind gezackt und Küstenlinien geschlängelt. Um diese Formen mathematisch zu verstehen und wissenschaftliche Probleme zu
lösen, die damit in Zusammenhang stehen, brauchen wir einen völlig neuen Ansatz. Als Mandelbrot über Küstenlinien nachdachte, fiel ihm auf, dass sie auf Landkarten immer ziemlich ähnlich aussahen, ganz gleich, welchen Kartenmaßstab man wählt. Eine Karte mit einem großen Maßstab zeigt mehr Details mit zusätzlichen Schlängelungen, doch das Ergebnis erinnert stark an eine Küstenlinie auf einer Karte mit einem kleineren Maßstab. Die genaue Form der Küstenlinie verändert sich, aber die «Beschaffenheit» bleibt annähernd die gleiche. Tatsächlich verändern sich die meisten Merkmale einer Küstenlinie – zum Beispiel, welcher Anteil an Buchten eine bestimmte relative Größe hat – ganz unabhängig vom Maßstab der Karte, die man benutzt, so gut wie nicht. Mandelbrot führte den Begriff «Fraktal» ein, um jede beliebige Form zu beschreiben, die eine komplexe Struktur aufweist, ganz gleich, wie stark man sie vergrößert. Wenn die Struktur bei schwacher Vergrößerung dieselbe ist wie bei stärkerer Vergrößerung, bezeichnet man das Fraktal als selbstähnlich. Wenn sich nur die statistischen Merkmale bei Vergrößerung so verhalten, spricht man von einer statischen Selbstähnlichkeit. Die Fraktale, die sich am einfachsten verstehen lassen, sind die selbstähnlichen. Das Sierpiński-Dreieck (siehe Kapitel [ ]) ist ein gutes Beispiel. Es besteht aus drei Kopien seiner selbst, jede halb so groß wie die Ausgangsform.
Abbildung 110: Das Sierpiński-Dreieck. Ein weiteres Beispiel ist die Schneeflockenkurve. Sie lässt sich aus drei Kopien der Kurve rechts in Abbildung 111 zusammensetzen. Diese Komponente (wenn auch nicht die ganze Schneeflocke) ist exakt selbstähnlich. Iterative Stadien in der Konstruktion fügen vier Kopien der vorangegangenen Stadien zusammen, jede ein Drittel so groß wie die Ausgangsform. Wenn man diese Iteration unendlich oft wiederholt, erhält man eine unendlich komplexe Kurve, die sich aus vier Kopien ihrer selbst
aufbaut, von denen jede ein Drittel der jeweils vorhergehenden Größe aufweist. Abbildung 111: Die Schneeflockenkurve und iterative Stadien ihrer Konstruktion.
Abbildung 112: Jeder Teil der Kurve, auf das Dreifache der Ausgangsgröße aufgeblasen, sieht wie die ursprüngliche Kurve aus. Diese Form ist zu regelmäßig, um eine wirkliche Küstenlinie darzustellen, doch sie weist annähernd das richtige Maß an «Schlängelung» auf, und unregelmäßige Kurven, die auf ähnliche Weise erzeugt wurden, jedoch mit zufälligen Variationen, schauen tatsächlich wie natürliche Küstenlinien aus.
Abbildung 113: Romanesco. Fraktale sind in der natürlichen Welt weit verbreitet. Oder präziser ausgedrückt: Auf Formen, die sich durch Fraktale recht gut nachbilden lassen, trifft man häufig. In der natürlichen Welt gibt es keinerlei mathematische Objekte; es handelt sich stets lediglich um Konzepte. Eine Blumenkohlsorte, Romanesco genannt, besteht aus kleinen Röschen, die alle dieselbe Form haben wie der ganze Blumenkohl. Der Anwendungsbereich von Fraktalen reicht von der Feinstruktur von Mineralien bis zur Verteilung der Materie im Universum. Fraktale sind schon als Antennen für Mobiltelefone, zur Komprimierung riesiger Datenmengen auf CDs und DVDs und zum Aufspüren von Krebszellen
benutzt worden. Und regelmäßig finden sich neue Anwendungsmöglichkeiten. Die fraktale Dimension Wie stark geschlängelt ein Fraktal ist oder wie effizient es einen Raum füllt, lässt sich anhand einer Zahl angeben, der sogenannten fraktalen Dimension. Um diese Größe zu verstehen, wollen wir uns zunächst mit einigen einfacheren, nicht-fraktalen Formen beschäftigen. Wenn wir eine Strecke in 5 gleich lange Teile teilen, brauchen wir 5 davon, um die ursprüngliche Strecke wiederherzustellen. Um dasselbe mit 2 einem Quadrat zu tun, brauchen wir 25 Teile, also 5 . Bei Würfeln sind es 3 dann 125 Teile, also 5 . Abbildung 114: Effekt einer Skalierung auf «Würfel» in 1, 2 und 3 Dimensionen. Die Potenz von 5, die auftritt, entspricht der Dimension der Form: 1 für eine Gerade, 2 für ein Quadrat, 3 für einen Würfel. Wenn man die Dimension als d bezeichnet und wir k Teile der Größe zusammenfügen müssen, um die d ursprüngliche Form wiederherzustellen, dann ist k = n . Wenn man
Logarithmen benutzt (siehe Kapitel [e]) und die Formel nach d auflöst, erhält man Diese Formel wollen wir auf das Sierpiński-Dreieck anwenden. Um ein Dreieck aus kleineren Kopien zusammenzusetzen, brauchen wir k = 3 Teildreiecke, jedes halb so groß wie das Ausgangsdreieck. Daher ist n = 2, und die Formel lautet was ungefähr gleich 1,5849 ist. Daher ist die Dimension des SierpińskiDreiecks in diesem speziellen Sinne keine ganze Zahl. Wenn wir uns Dimensionen in konventioneller Weise als die Zahl der verfügbaren, voneinander unabhängigen Richtungen im Raum vorstellen, dann muss eine Dimension eine ganze Zahl sein. Doch wenn es um Fraktale geht, versuchen wir zu bestimmen, wie unregelmäßig sie sind, wie komplex sie sind oder wie gut sie den umgebenden Raum füllen – nicht, in wie viele unabhängige Richtungen sie weisen. Das Sierpiński-Dreieck ist sichtlich dichter als eine Linie, aber weniger dicht als ein ausgefülltes Quadrat. Daher sollte die Größe, die wir suchen, irgendwo zwischen 1 (der Dimension einer Linie) und 2 (der Dimension eines Quadrats) liegen. Und zweifellos kann es sich nicht um eine ganze Zahl handeln.
Auf dieselbe Weise können wir die fraktale Dimension einer Schneeflockenkurve bestimmen. Wie zuvor ist es einfacher, mit einem Drittel der Schneeflockenkurve, mit einer ihrer drei identischen «Kanten», zu arbeiten, denn diese ist selbstähnlich. Um eine Kante einer Schneeflockenkurve aus kleineren Kopien dieser Kante zusammenzufügen, benötigen wir k = 4 Teile, jedes Teil so groß, daher ist n = 3. Deshalb lautet die Formel was ungefähr 1,2618 ergibt. Wiederum ist die fraktale Dimension keine ganze Zahl, und wiederum ergibt dies durchaus Sinn. Eine Kurve der Dimension 1,2618 ist stärker geschlängelt als eine Kurve der Dimension 1, wie eine Gerade, doch sie ist weniger geschlängelt als eine Kurve der Dimension 1,5849, wie das Sierpiński-Dreieck. Die fraktalen Dimensionen der meisten natürlichen Küstenlinien liegen nahe bei 1,25 – das kommt der Schneeflockenkurve näher als dem Dreieck. Daher stimmen die Dimensionen mit unserer intuitiven Vermutung überein, welches dieser Fraktale den Raum besser füllt. Zudem ermöglicht eine Dimensionsbetrachtung experimentell arbeitenden Wissenschaftlern, Theorien, die auf Fraktalen basieren, quantitativ zu überprüfen. So hat Ruß beispielsweise eine fraktale Dimension von etwa 1,8; daher lassen sich fraktale Modelle von Rußablagerungen, von denen es eine Vielzahl gibt, testen, indem man schaut, ob die Modelle diese Zahl ergeben.
Es gibt viele verschiedene Möglichkeiten, die Dimension eines Fraktals zu definieren, wenn das Fraktal nicht selbstähnlich ist. Mathematiker benutzen die Hausdorff-Besicovitch-Dimension, die ziemlich schwierig zu definieren ist. Physiker verwenden hingegen häufig eine einfachere Definition, die sogenannte Box-Dimension. In vielen, wenn auch nicht in allen Fällen decken sich diese beiden Auffassungen von Dimension. In diesem Fall spricht man von fraktaler Dimension und meint mit diesem Begriff sowohl die eine wie die andere Dimension. Die ersten Fraktale waren Kurven, doch Fraktale können auch Oberflächen, Körper oder höherdimensionale Formen sein. In diesem Fall gibt die fraktale Dimension an, wie groß die Rauheit des Fraktals ist oder wie effizient es den Raum füllt. Beide dieser fraktalen Dimensionen sind irrational. Denn nehmen wir an, dass ist, wobei p und q ganze Zahlen sein sollen, dann ist q q p q p log 3 = p log 2, also log 3 = log 2 und damit 3 = 2 . Das widerspricht jedoch der eindeutigen Primfaktorenzerlegung. Eine ähnliche Argumentation funktioniert bei . Ist es nicht wirklich bemerkenswert, wie Grundtatsachen wie diese plötzlich an ganz unerwarteten Stellen auftauchen? Die Mandelbrot-Menge
Das wohl berühmteste aller Fraktale ist die Mandelbrot-Menge. Sie zeigt, was mit einer komplexen Zahl geschieht, wenn man sie wiederholt quadriert und gleichzeitig eine Konstante addiert. Das heißt, man wählt eine 2 2 2 2 2 komplexe Konstante c, bildet dann c + c, dann (c + c) + c, dann [(c + c) 2 + c] + c, und so weiter. (Man kann die Menge auch noch auf andere Weise definieren, aber dies ist die einfachste.) Geometrisch gesehen existieren komplexe Zahlen in einer Ebene, die den gewöhnlichen Zahlenstrahl für reelle Zahlen erweitert. Es gibt im Wesentlichen zwei Möglichkeiten: Entweder sämtliche komplexen Zahlen in der obigen Folge bleiben in irgendeiner endlichen Region der komplexen Ebene, oder sie tun es nicht. Färben wir diejenigen c, für die die Folge in einer endlichen Region bleibt, schwarz, und diejenigen, die daraus entkommen, weiß. Dann ist die Menge aller schwarzen Punkte die Mandelbrot-Menge. Und das sieht so aus:
Abbildung 115: Mandelbrot-Menge, auch «Apfelmännchen» genannt. Die Grenze der Mandelbrot-Menge – die Punkte auf dem Rand, die so eng an den schwarzen bzw. den weißen Punkten liegen, wie wir wollen – ist ein Fraktal. Seine fraktale Dimension beträgt, wie sich herausgestellt hat, 2, daher ist dieses Fraktal «beinahe raumfüllend». Um mehr feine Details zu sehen, können wir die weißen Punkte mit unterschiedlichen Farben versehen, je nachdem, wie rasch die Folge gegen unendlich strebt. Nun erhalten wir bemerkenswert komplexe Figuren voller Schnörkel und Spiralen und anderen Formen. Wenn man das Bild vergrößert, so führt das lediglich zu einem ständig detaillierteren Bild. Wenn man sich die richtigen
Stellen anschaut, kann man sogar komplette Baby-Mandelbrot-Mengen entdecken. Abbildung 116: Baby-Mandelbrot-Menge. Die Mandelbrot-Menge als solche hat offenbar keine wichtigen Anwendungen, doch es handelt sich um eines der einfachsten nichtlinearen dynamischen Systeme, das auf komplexen Zahlen basiert. Daher hat es bei Mathematikern viel Interesse geweckt, die nach allgemeinen, möglicherweise weiter anwendbaren Prinzipien suchen. Zudem demonstrieren diese Systeme eine «philosophische» Schlüsselerkenntnis: Einfache Regeln können zu komplexen Ergebnissen führen: Das heißt, einfache Ursachen können komplexe Wirkungen haben. Wenn man versucht, ein sehr kompliziertes System zu verstehen, ist die Verlockung groß, anzunehmen, dass die zugrunde liegenden Regeln ebenso kompliziert
sind. Die Mandelbrot-Menge beweist, dass eine solche Erwartung falsch sein kann. Diese Erkenntnis bildet den Kern der sogenannten Komplexitätswissenschaft: Die Forscher, die auf diesem neuen Gebiet arbeiten, versuchen, mit offensichtlich komplexen Systemen klarzukommen, indem sie nach den einfacheren Regeln suchen, denen diese Systeme folgen.
Kugelpackungen Die Zahl ist in der Mathematik sowie in Chemie und Physik von grundlegender Bedeutung. Es ist der Anteil am Rauminhalt, der gefüllt wird, wenn wir gleich große Kugeln auf möglichst effiziente Weise so dicht zusammenpacken, dass möglichst wenig Leerraum bleibt. Kepler formulierte dieses Ergebnis 1611 als Vermutung, doch seine Vermutung blieb unbewiesen, bis Thomas Hales 1998 einen computergestützten Beweis lieferte. Ein Beweis, der sich direkt von einem Menschen überprüfen lässt, ist bisher noch nicht gefunden worden. Kreispackungen Wir beginnen mit der einfacheren Frage nach der besten Packung von identischen Kreisen in der Ebene. Wenn man mit ein paar Dutzend Münzen mit demselben Nennwert experimentiert und sie zusammenschiebt, um so viele wie möglich auf einer bestimmten Fläche unterzubringen, wird man rasch feststellen, dass bei einer zufälligen Anordnung eine Menge ungenutzter Raum bleibt. Wenn man versucht, diese Lücken zu schließen,
indem man die Münzen enger zusammenschiebt, entdeckt man bald, dass die effizienteste Packung offenbar darin besteht, sie zu einem Wabenmuster zusammenzufügen. Es ist jedoch zumindest denkbar, dass sich die Münzen mittels irgendeiner anderen geschickten Anordnung noch dichter packen lassen. So etwas ist nicht besonders wahrscheinlich, aber das ist kein Beweis. Es gibt unendlich viele Möglichkeiten, identische Münzen anzuordnen, also lässt sich die Frage experimentell nicht klären. Das Bienenwabenmuster ist im Gegensatz zu zufälligen Anordnungen sehr regelmäßig und symmetrisch. Es ist zudem starr: Man kann keine der Münzen bewegen, denn ihre Nachbarn halten sie an Ort und Stelle fest. Auf den ersten Blick sollte eine starre Anordnung einen Raum am effizientesten füllen, denn es gibt keine Möglichkeit, sie zugunsten einer raumsparenderen Anordnung zu verändern, indem man Münzen nacheinander verschiebt. Abbildung 117: Links: Eine Zufallsanordnung lässt eine Menge Lücken. Rechts: Bei einem Wabenmuster verschwindet ein Großteil der Lücken.
Es gibt jedoch andere starre Anordnungen, die weniger «sparsam» sind. Schauen wir uns zunächst einmal die beiden auf der Hand liegenden Möglichkeiten an, Kreise zu einem regelmäßigen Muster zusammenzufügen: Das Wabengitter oder hexagonale Gitter, so genannt, weil die Mittelpunkte der Kreise Sechsecke bilden. Das quadratische Gitter, in dem die Kreise wie die Quadrate auf einem Schachbrett angeordnet sind. Abbildung 118: Links: Sechs Kreismittelpunkte bilden ein regelmäßiges Sechseck (Hexagon). Rechts: Eine quadratische Gitterpackung. Das quadratische Gitter ist ebenfalls starr, doch die Kreise sind darin weniger dicht gepackt. Wenn man eine sehr große Fläche auslegt, bedeckt das hexagonale Gitter einen größeren Anteil der verfügbaren Fläche. Um all dies zu präzisieren, definieren Mathematiker die Dichte einer Kreispackung als den Anteil einer gegebenen Fläche, der von Kreisen
abgedeckt wird, wenn man die Fläche unendlich groß werden lässt. Einfach gesagt geht es darum, die gesamte Ebene mit Kreisen zu überdecken und herauszufinden, wie groß der Anteil der bedeckten Fläche ist. Wörtlich genommen ist dieser Anteil , was keinen Sinn ergibt, daher bedecken wir immer größer werdende Quadrate und bilden den Grenzwert. Wir wollen einmal die Dichte der quadratischen Gitterpackung berechnen. Wenn jedes Quadrat eine Einheitsfläche ist, haben die Kreise alle den Radius , daher beträgt ihre Fläche . Der bedeckte Anteil der Fläche ändert sich nicht, auch wenn man viele Quadrate und viele Kreise betrachtet. Deshalb erhalten wir im Grenzwert eine Packungsdichte von , was ungefähr 0,785 entspricht. Eine etwas kompliziertere Berechnung für das hexagonale Gitter führt zu einer Packungsdichte von , was ungefähr 0,906 entspricht. Das ist eine höhere Dichte als diejenige für das quadratische Gitter. Im Jahr 1773 bewies Lagrange, dass das hexagonale Gitter die dichteste Gitterpackung von Kreisen in der Ebene ergibt. Dies ließ jedoch die Möglichkeit offen, dass sich mit einer weniger regelmäßigen Packung bessere Ergebnisse erzielen lassen. Es sollte mehr als 150 Jahre dauern, bis es Mathematikern gelang, diese unwahrscheinliche Möglichkeit auszuschließen. 1892 hielt Axel Thue einen Vortrag, in dem er einen Beweis skizzierte, dem zufolge keine Kreispackung in der Ebene dichter sein kann als die hexagonale Gitterpackung, doch die veröffentlichten Details sind zu vage, um nachzuvollziehen, wie der vorgeschlagene Beweis aussehen sollte, geschweige denn, um zu prüfen, ob er richtig war. 1910
veröffentlichte Thue einen neuen Beweis, doch dieser Beweis wies noch immer einige logische Lücken auf. Der erste vollständige Beweis wurde 1940 von Laszlo Fejes Tóth vorgestellt. Kurz darauf entdeckten Beniamino Segre und Kurt Mahler einen alternativen Beweis. Im Jahr 2010 stellten Hai-Chau Chang und Lih-Chung Wang einen einfacheren Beweis ins Netz. Die Kepler-Vermutung In der Kepler-Vermutung geht es um das analoge Problem der Packung gleich großer Kugeln im dreidimensionalen Raum. Anfang des 17. Jahrhunderts stellte der große Mathematiker und Astronom Johannes Kepler diese Vermutung auf – und zwar in einem Buch über Schneeflocken.
Abbildung 119: Diese Aufnahmen zeigen echte Schneekristalle, die in Northern Ontario, in Alaska, in Vermont, auf der Oberen Halbinsel von Michigan und im Hochgebirge der kalifornischen Sierra Nevada vom Himmel fielen. Aufgenommen wurden sie von Kenneth G. Libbrecht mit Hilfe eines speziell konstruierten Schneeflocken-Fotomikroskops. Kepler interessierte sich für Schneeflocken, weil sie häufig eine Sechsersymmetrie aufweisen: Bei ihnen wiederholt sich fast genau dieselbe Form sechs Mal, jeweils um einen Winkel von 60° versetzt. Er fragte sich nach dem Grund und benutzte Logik, Phantasie und sein Wissen über ähnliche Muster in der Natur, um eine Erklärung zu finden, die dem, was wir heute wissen, bemerkenswert nahe kommt. Kepler war Mathematiker am Hof von Rudolf II., Kaiser des Heiligen Römischen Reiches, und seine Arbeit wurde von Johannes Wacker von Wackenfels, einem wohlhabenden Diplomaten und Ratgeber des Kaisers, finanziell unterstützt. 1611 überreichte Kepler seinem Förderer ein Neujahrsgeschenk: eine speziell für ihn verfasste Schrift, De Nive Sexangula (Vom sechseckigen Schnee). Er begann mit der Frage, warum Schneeflocken sechseckig sind. Um eine Antwort zu erhalten, diskutiert er natürliche Formen, die ebenfalls eine Sechsersymmetrie aufweisen, wie die Honigwaben in einem Bienenstock und die dicht gepackten Samen im Inneren eines Granatapfels. Wir haben gerade besprochen, wie das Packen von Kreisen in der Ebene auf natürliche Weise zu einem Wabenmuster führt. Kepler führte die symmetrische Form von Schneeflocken auf das Problem zurück, Kugeln möglichst effizient im dreidimensionalen Raum zusammenzupacken. Dabei kam er der modernen Erklärung erstaunlich nahe. Eine Schneeflocke ist ein Eiskristall, dessen atomare Struktur der einer
Honigwabe sehr ähnlich ist. Vor allem weist sie eine hexagonale Symmetrie auf (tatsächlich ein wenig mehr Symmetrie als das). Die Vielfalt von Schneeflockenformen, die alle dieselbe Symmetrie besitzen, ergibt sich aus den wechselnden Bedingungen in Wetterwolken, in denen die Schneeflocken heranwachsen. Auf dem Weg zu seiner Antwort machte Kepler eine recht beiläufige Bemerkung, die ein mathematisches Rätsel aufwarf, das erst 387 Jahre später gelöst werden sollte. Wie packt man identische Kugeln auf die effizienteste Weise im dreidimensionalen Raum? Er nahm an, die Antwort sei das, was wir heute als kubisch-flächenzentrierte Packung bezeichnen. Auf diese Weise stapeln Obsthändler gewöhnlich ihre Orangen. Zuunterst legt man eine flache Lage von Kugeln in einem quadratischen Gittermuster aus (siehe Abbildung 120, links). Dann platziert man eine ähnliche Schicht obendrauf, wobei man jede Kugel in die Vertiefung zwischen vier benachbarten Kugeln in der Lage darunter legt (Mitte). Auf diese Weise fährt man fort (rechts), bis man den ganzen verfügbaren Raum gefüllt hat. Das erfordert, jede Lage seitwärts zu verschieben, um eine ganze Ebene zu füllen, und Lagen sowohl unter der ersten Lage als auch obenauf zu platzieren. Die Dichte dieser Packung lässt sich berechnen und ergibt ~ 0,740480. Kepler zufolge ist dies die «bestmögliche Packung», das heißt, sie hat die höchste Dichte, die sich erzielen lässt.
Abbildung 120: Kubisch-flächenzentriertes Gitter. Links: Die erste Lage. Mitte: Die ersten beiden Lagen. Rechts: Die ersten vier Lagen. Obsthändler beginnen mit einer Kiste oder einer Palette und arbeiten sich Lage um Lage nach oben, und das ist eine Möglichkeit, um eine kubischflächenzentrierte Packung zu definieren. Die Kepler-Vermutung fragt jedoch nach allen möglichen Packungen; daher können wir nicht annehmen, dass flache Lagen die einzige Möglichkeit sind. Die Obsthändlermethode löst tatsächlich ein anderes Problem. Die Frage ist: Ändert das die Antwort? Auf den ersten Blick sieht die Verpackungsmethode, die die Obsthändler wählen, wie die falsche Antwort aus, denn sie stützt sich auf eine quadratische Gitteranordnung, und eine hexagonale Gitteranordnung ist dichter. Obsthändler benutzen Gitteranordnungen mit quadratischen Lagen, weil sie ihre Orangen in rechteckigen Kisten unterbringen müssen, nicht, weil sie die dichteste Packung finden wollen. Wäre es daher nicht besser, wenn die erste Lage ein hexagonales Gitter bilden würde? Wiederum würden die folgenden Lagen in die Vertiefungen der Lage darunter zu liegen kommen, jede angeordnet im selben hexagonalen Gittermuster.
Kepler erkannte, dass dies keinen Unterschied macht. Eine Schrägseite der Abbildung rechts bildet ein hexagonales Muster. Lagen, die zu dieser Lage parallel verlaufen, bilden ebenfalls hexagonale Lagen, die in die Vertiefungen der benachbarten Lagen passen. Daher ist die alternative Anordnung, welche hexagonale Lagen benutzt, nichts anderes als eine gekippte Version der kubisch-flächenzentrierten Gitteranordnung. Das sagt uns jedoch etwas Wichtiges: Unendlich viele verschiedene Packungen, fast alle davon keine Gitter, haben dieselbe Dichte wie das kubisch-flächenzentrierte Gitter. Es gibt zwei unterschiedliche Möglichkeiten, ein hexagonales Gitter in der Vertiefung eines anderen zu platzieren, und für jede sukzessive Lage können wir die eine oder die andere Alternative wählen. Bei nur zwei Lagen ist die eine Anordnung eine Spiegelung der anderen, aber ab drei Lagen ist das nicht mehr der Fall. Daher gibt es 2 tatsächlich unterschiedliche Anordnungen für 3 Lagen, 4 für 4 Lagen, 8 für 5 Lagen und so weiter. Bei entsprechend vielen Lagen an Ort und Stelle ist die Zahl der Anordnungsmöglichkeiten unendlich groß. Jede Lage hat jedoch dieselbe Packungsdichte, und ganz unabhängig von der Wahl der Vertiefungen ist die Dichte der Lagen immer gleich groß. Daher beträgt die Packungsdichte, ganz gleich, welche Abfolge von Entscheidungen man trifft, stets . Bis 1998 blieb die Kepler’sche Vermutung unbewiesen; in diesem Jahr vervollständigten Thomas Hales und sein Student Samuel Ferguson einen computergestützten Beweis. Hales sandte diesen Beweis 1999 an die renommierte Fachzeitschrift Annals of Mathematics. Ein Gremium von Experten brauchte vier Jahre, um Hales’ Beweis zu prüfen, aber die
Berechnungen waren so kompliziert und die Datenmenge war so riesig, dass die Experten sich außerstande sahen, die völlige Korrektheit des Beweises zu bestätigen. Schließlich wurde der Beweis veröffentlicht, jedoch mit einer Anmerkung, die auf diese Schwierigkeit hinwies. Ironischerweise lässt sich das Problem wahrscheinlich dadurch umschiffen, dass man den Beweis in eine Form umschreibt, deren Richtigkeit sich verifizieren lässt – und zwar von einem Computer. Der entscheidende Punkt ist, dass das Prüfprogramm vermutlich einfacher ist als Hales’ Beweis; daher lässt sich die Logik der Prüfsoftware möglicherweise per Hand überprüfen. Dann können wir darauf vertrauen, dass die Software tatsächlich hält, was sie verspricht, nämlich den weitaus komplizierteren Beweis der Kepler’schen Vermutung zu verifizieren. Man darf also gespannt sein.
Die Tonleiter Die zwölfte Wurzel aus 2 ist das Verhältnis der Frequenzen aufeinanderfolgender Töne in der gleichstufigen Tonleiter. Sie ist ein Kompromiss, ein bisschen wie π durch zu approximieren – nur dass dieses Mal die natürlichen musikalischen Intervalle einfache rationale Zahlen sind und die Potenzen von irrationale Näherungen dafür. Sie tauchen aufgrund der Art auf, wie menschliche Ohren Schall wahrnehmen. Schallwellen Physikalisch ist ein Ton eine Schallwelle, die durch ein Musikinstrument erzeugt und vom Ohr wahrgenommen wird. Eine Welle ist eine Störung in einem Festkörper, einer Flüssigkeit oder einem Gas, die, ohne ihre Gestalt zu verändern, sich fortpflanzt oder dieselbe Bewegung immer und immer wieder regelmäßig wiederholt. Wellen sind in der realen Welt etwas sehr Übliches: Beispiele sind Lichtwellen, Schallwellen, Wasserwellen und Vibrationen. Wellen im Erdkörper sind die Ursache für Erdbeben.
Abbildung 121: Sinuskurve. Die einfachste und grundlegende Form einer Welle ist eine Sinuskurve. Die Höhe der Kurve stellt die Amplitude der Welle dar, ein Maß für die Größe der entsprechenden Störung. Bei Schallwellen entspricht die Amplitude der Lautstärke des Tons: Eine größere Amplitude stellt eine größere Störung der Luft dar, was wiederum das Ohr stärker stört, und das nimmt man als Zuwachs an Lautstärke wahr.
Abbildung 122: Wellenlänge. Ein weiteres wichtiges Merkmal einer Sinuskurve ist ihre Wellenlänge: Das ist der Weg (oder die Zeit, die vergeht) zwischen aufeinanderfolgenden Amplitudengipfeln. Die Wellenlänge bestimmt die Kurvenform der Welle. Bei Schallwellen bestimmt sie die Tonhöhe. Kleinere Wellenlängen bewirken, dass der Ton höher klingt, und größere Wellenlängen lassen ihn tiefer klingen.
Eine weitere Möglichkeit, dasselbe Merkmal einer Welle zu messen, ist die sogenannte Frequenz. Sie ist umgekehrt proportional zur Wellenlänge. Sie entspricht der Zahl von Amplitudengipfeln, die auf einer bestimmten Strecke oder in einem bestimmten Zeitraum auftreten. Frequenzen werden in der Einheit Hertz (Hz) gemessen: Ein Hertz ist eine Schwingung pro Sekunde. Zum Beispiel hat das eingestrichene c auf dem Klavier die Frequenz 261,62556 Hz, also etwas mehr als 261 Schwingungen pro Sekunde. Abbildung 123: Der Standardnotensatz. Das eine Oktave höhere c hat die Frequenz 523,25113 Hz: genau zweimal so groß. Das eine Oktave tiefere c hat die Frequenz 130,81278 Hz: genau halb so groß. Diese Beziehungen zeigen beispielhaft die Verwandtschaft zwischen der Mathematik der Wellen und der Musik. Um das Thema weiter auszuspielen, stellen Sie sich ein Streichinstrument vor, wie etwa eine
Violine oder eine Gitarre, und betrachten Sie zunächst einmal nur eine einzige Saite. Das Instrument liege auf der Seite und Sie schauen frontal darauf. Wenn der Musiker die Saite anschlägt, schwingt sie relativ zum Instrument von Seite zu Seite. Für uns bewegt sie sich auf und nieder. Das führt zu einer Art Welle, die man stehende Welle nennt, bei der die Enden der Saite fixiert sind, die Form sich jedoch periodisch wiederholt. Die einfachste Schwingung tritt ein, wenn die Saite eine halbe Sinuswelle formt. Die nächst einfache Schwingung ist eine komplette Sinuswelle. Danach kommen die anderthalbfachen Sinuswellen, dann zwei Sinuswellen usw. Halbwellen gibt es, weil eine ganze Sinuswelle die Horizontale einmal in der Mitte sowie an jedem Ende kreuzt. Abbildung 124: Von links nach rechts: Eine halbe Sinuswelle. Eine ganze Sinuswelle. Eineinhalb Sinuswellen. Zwei Sinuswellen. Hier betragen die Wellenlängen , 1, , 2 usw. Die halbzahligen Werte treten auf, weil wir mit Halbwellen arbeiten. Würden wir Einheiten benutzen, in denen die Saitenlänge ist, dann wären die Wellenlängen einfach ganze Zahlen 1, 2, 3, 4. Die zugehörigen Frequenzen, wenn man dieselbe Saite unter derselben Spannung hält, verhalten sich wie 1, , , . Wenn zum Beispiel die
Halbwellenschwingung die Frequenz 261 Hz hat, also nah am eingestrichenen c liegt, dann sind diese Frequenzen Die zugrunde liegende einzelne Halbwelle nennt man Grundschwingung oder 1. Harmonische, alle weiteren sind die höheren Oberschwingungen oder Harmonischen. Vor etwa 2500 Jahren glaubten die Pythagoreer, alles in der Welt sei durch mathematische Formeln und zahlenmäßige Zusammenhänge bestimmt. Sie entdeckten bemerkenswerte Beziehungen zwischen Zahlen und Musikharmonien. Einer Legende zufolge kam Pythagoras an der Werkstatt eines Schmieds vorbei und bemerkte, dass verschieden große Schmiedehämmer in unterschiedlichen Tonhöhen erklangen, und dass Hämmer, deren Größen in einem einfachen Zahlenverhältnis standen – zum Beispiel einer doppelt so lang wie der andere –, harmonierende Töne erzeugten. Wer das jedoch mit echten Hämmern versucht nachzuvollziehen, wird feststellen, dass sie eine zu komplizierte Form haben, um harmonisch
zu schwingen. Doch im Großen und Ganzen trifft es zu, dass kleine Objekte höhere Töne erzeugen als größere. Ein plausibleres Experiment der Pythagoreer macht von einer gespannten Saite Gebrauch, wie Ptolemäus in seiner «Harmonik» um 150 v. Chr. berichtet. Die Pythagoreer entdeckten, dass zwei Saiten, die unter gleicher Spannung stehen, aber ein einfaches Längenverhältnis, wie oder haben, ungewöhnlich harmonische Töne erzeugen. Komplexere Längenverhältnisse erzeugen Misstöne und sind unangenehm fürs Ohr. Musikalische Intervalle Musiker beschreiben Töne paarweise in Form von Intervallen zwischen ihnen, ein Maß dafür, wie viele Stufen sie in einer bestimmten Tonart trennen. Das grundlegende Intervall ist die Oktave: auf dem Klavier sieben weiße Tasten nach oben. Töne, die eine Oktave voneinander entfernt liegen, klingen erstaunlich ähnlich, außer dass der eine Ton höher als der andere ist, und sie sind extrem harmonisch. So weit, so gut, aber tatsächlich klingen Harmonien, die auf einer Oktave beruhen, ein wenig fade. Auf einer Geige oder einer Gitarre spielt man den eine Oktave höheren Ton, indem man die Mitte der Saite gegen das Griffbrett drückt. Eine Saite, die halb so lang ist, erzeugt einen um eine Oktave höheren Ton. Also entspricht die Oktave dem einfachen Zahlenverhältnis . Weitere harmonische Intervalle hängen ebenfalls mit einfachen Zahlenverhältnissen zusammen. Die für die westliche Musik bedeutsamsten
Intervalle sind die Quarte, die einem Verhältnis entspricht, und die Quinte mit dem Verhältnis . Die Namen ergeben Sinn, wenn man eine Tonleiter mit ganzen Noten c d e f g a h c betrachtet. Mit c als Grundnote ist f die Quarte, g die Quinte und c die Oktave. Würde man die Töne von der Grundnote aus aufsteigend nummerieren, dann sind Quarte (lateinisch quartus = der vierte), Quinte (lateinisch quintus = der fünfte) und Oktave (lateinisch octavus = der achte) jeweils der vierte, fünfte und achte Ton der Tonleiter. Die Geometrie wird auf einem Instrument wie der Gitarre besonders klar, weil sie Abschnitte hat, die man Bünde nennt, und die an den richtigen Positionen eingefügt sind. Der Bund für die Quarte ist bei einem Viertel der Gesamtlänge positioniert, der für die Quinte bei einem Drittel der Saite und die Oktave ist die halbe Strecke entfernt. Man kann das mit einem Maßband überprüfen. Tonleitern Diese Verhältniszahlen bilden die theoretische Grundlage für eine musikalische Stimmung, und sie führten zu den Tonleitern, die heute in der westlichen Musik überwiegend in Gebrauch sind. Es gibt sehr viele verschiedene Tonleitern und wir beschreiben nur die einfachste. Man beginne mit einer Grundnote und bekommt mit aufsteigenden Quinten Saiten der Länge
ausmultipliziert ergeben diese Brüche Außer den ersten beiden sind alle diese Töne zu hoch, um innerhalb einer Oktave zu bleiben, doch wir können sie um ein oder zwei Oktaven erniedrigen, indem wir die Brüche jeweils wiederholt durch 2 teilen, bis das Ergebnis zwischen 1 und 2 liegt. Das ergibt die Brüche Ordnet man diese in aufsteigender Reihenfolge, so erhält man Diese Verhältniszahlen entsprechen ziemlich gut den Noten c d e g a b auf einem Klavier. Man beachte, dass f fehlt. Tatsächlich klingt die Lücke zwischen größer als die anderen. Um diese Lücke zu füllen, fügen wir und ein, das Verhältnis für die Quarte, die auf dem Klavier sehr nah bei f liegt. Außerdem ist es nützlich, die Tonleiter mit einem zweiten c zu ergänzen, das eine Oktave höher liegt, mit dem Verhältnis . Nun haben wir eine
Tonleiter, die vollständig auf Quarten, Quinten und Oktaven beruht, deren Tonhöhen den Verhältnissen entsprechen. Die Saitenlänge ist umgekehrt proportional zur Tonhöhe, also müssten wir nur die Brüche umkehren, um die dazugehörigen Längen zu bekommen. Wir haben nun alle weißen Tasten auf dem Klavier erklärt, doch es gibt auch schwarze Tasten. Die zugehörigen Töne treten auf, weil aufeinanderfolgende Zahlen in der Tonleiter in unterschiedlichen Verhältnissen zueinander stehen, nämlich Sekunde» genannt) und (Halbton oder «kleine Sekunde»). Zum Beispiel ist das Verhältnis von 81/64 zu ist (Ganzton, auch «große gleich , doch das von zu . Die Bezeichnungen «Ganzton» und «Halbton» deuten einen näherungsweisen Vergleich der Intervalle an. Numerisch liegen sie bei 1,125 und 1,05. Der erste Wert ist größer, also entspricht ein Ganzton einer größeren Tonhöhenänderung als ein Halbton. Zwei Halbtöne ergeben ein 2 Verhältnis von 1,05 , was ungefähr bei 1,11 und damit nicht weit von 1,125 entfernt liegt. Damit entsprechen zwei Halbtöne etwa einem Ganzton. Indem wir so weitermachen, können wir jeden Ganzton in zwei Intervalle unterteilen, die beide einem Halbton nahekommen, und erhalten so eine
zwölfstufige Notenskala. Man kann das auf verschiedene Weise bewerkstelligen und erhält etwas unterschiedliche Ergebnisse. Wie auch immer man es macht, kann es zu sehr kleinen, aber hörbaren Problemen beim Wechsel der Tonart kommen: Die Intervalle verändern sich leicht, wenn wir zum Beispiel jeden Ton um einen Halbton erhöhen. Auf einigen Musikinstrumenten, zum Beispiel der Klarinette, kann das ernsthafte technische Probleme zur Folge haben, weil die Töne dadurch erzeugt werden, dass Luft durch die Löcher im Instrument strömt, die sich an festen Positionen befinden. Bei anderen Instrumenten, wie zum Beispiel der Geige, kann man einen kontinuierlichen Tonbereich erzeugen, sodass der Musiker die Tonhöhe anpassen kann. Auf wieder anderen Instrumenten, wie zum Beispiel der Gitarre und dem Klavier, kommt ein unterschiedliches mathematisches System zur Anwendung. Es vermeidet das Problem des Tonartwechsels, verlangt aber einige subtile Kompromisse. Die Idee ist, das Intervall zwischen zwei in der Tonleiter aufeinanderfolgenden Tönen exakt gleichzumachen. Der Abstand zwischen zwei Tönen hängt vom Verhältnis ihrer Frequenzen ab, also muss man, um ein vorgegebenes Intervall zu erzeugen, die Frequenz des einen Tons nehmen und sie mit einem festen Betrag multiplizieren, um die Frequenz des anderen zu bekommen. Wie sollte dieser Betrag für einen Halbton aussehen?
Zwölf Halbtöne bilden eine Oktave, also das Verhältnis 2. Um eine Oktave zu bekommen, muss man mit der Grundfrequenz starten und sie mit einem festen Betrag multiplizieren, der einem Halbton entspricht, und das zwölf Mal in Folge. Das Resultat muss die ursprüngliche Frequenz verdoppeln. Deswegen muss das Verhältnis für einen Halbton zur zwölften Potenz erhoben gleich 2 sein. Das Verhältnis für einen Halbton muss daher die zwölfte Wurzel von 2 sein. Dies schreibt man , und diese Zahl hat näherungsweise den Wert 1,059463. Der große Vorteil dieser Idee besteht darin, dass nun viele musikalische Beziehungen exakt aufeinander abgestimmt sind. Zwei Halbtöne bilden exakt einen Ganzton, und zwölf Halbtöne bilden eine Oktave. Was noch besser ist: Man kann die Tonart ändern, also den Anfang der Tonleiter, indem man alle Noten um einen festen Betrag nach oben oder unten verschiebt. Diese Zahl, die zwölfte Wurzel aus 2, führt zur gleichstufigen (auch gleichtemperierten oder gleichschwebenden) Stimmung. Sie stellt einen Kompromiss dar. Zum Beispiel ist in der gleichstufigen Stimmung der 5 Bruch für eine Quarte nicht , sondern 1,0595 = 1,335. Ein geübter Musiker kann den Unterschied hören, doch gewöhnt man sich leicht daran, und die meisten Menschen bemerken den Unterschied nie. Es handelt sich um eine irrationale Zahl. Angenommen 12 wobei p und q natürliche Zahlen sind. Dann müsste p , 12 = 2q gelten. Nach einer Primfaktorzerlegung hat aber die linke Seite eine gerade Anzahl von
Zweien (möglicherweise gar keine), während die rechte Seite eine ungerade Anzahl hat. Das widerspricht der Eindeutigkeit der Primfaktorzerlegung. Schwingende Saiten und Trommeln Um zu erklären, warum einfache Zahlenverhältnisse mit musikalischer Harmonie einhergehen, muss man sich die Physik einer schwingenden Saite anschauen. Im Jahr 1727 machte John Bernoulli den ersten großen Fortschritt bei der Beschreibung eines einfachen mathematischen Modells für eine Violinsaite. Im einfachsten Fall, so fand er heraus, ist die Form der schwingenden Saite zu jedem Zeitpunkt eine Sinuskurve. Die Amplitude der Schwingung folgt ebenfalls einer Sinuskurve, allerdings nicht räumlich, sondern im Zeitverlauf.
Abbildung 125: Aufeinanderfolgende Momentaufnahmen einer schwingenden Saite. Zu jedem Zeitpunkt hat sie die Form einer Sinuskurve. Auch die Amplitude variiert sinusförmig in der Zeit. Es gab jedoch auch andere Lösungen. Alle waren Sinuskurven, doch beschrieben sie unterschiedliche «Schwingungsmodi», mit 1, 2, 3 oder mehr Wellen auf der Saite. Wiederum stellte die Sinuskurve eine Momentaufnahme der Form zu jedem Zeitpunkt dar, und ihre Amplitude war um einen zeitabhängigen Faktor vervielfacht, der sich ebenfalls sinusförmig veränderte. Abbildung 126: Momentaufnahmen der Modi 1, 2, 3 einer schwingenden Saite. In jedem Fall schwingt die Saite auf und ab, und ihre Amplitude verändert sich sinusförmig mit der Zeit. Die Schwingung ist umso schneller, je mehr Wellen vorhanden sind.
An den festen Enden bewegt sich die Saite nie. In allen Modi außer dem ersten hat die Saite auch zwischen ihren Enden Punkte, die nicht schwingen: diejenigen Orte, an denen die Kurve die horizontale Achse quert. Diese «Schwingungsknoten» erklären, warum in den pythagoreischen Experimenten einfache Zahlenverhältnisse auftauchen. Weil zum Beispiel in derselben Saite die Schwingungsmodi 2 und 3 auftreten können, ist die Lücke zwischen aufeinanderfolgenden Knoten in der Modus‑2‑Kurve eineinhalb Mal so groß wie die entsprechende Lücke in der Modus‑3‑Kurve. Das erklärt, warum Verhältnisse wie auf natürliche Weise aus der Dynamik einer schwingenden Saite hervorgehen. Im letzten Schritt müssen wir verstehen, warum diese Verhältnisse harmonisch sind, andere dagegen nicht. Im Jahre 1746 entdeckte Jean Le Rond d’Alembert, dass die Schwingungen einer Saite einer mathematischen Gleichung gehorchen, die Wellengleichung heißt. Sie beschreibt, wie die auf eine Saite wirkenden Kräfte – ihre eigene Spannung und auch die Kräfte, die durch das Anschlagen oder Streichen der Saite entstehen – ihre Bewegung beeinflussen. D’Alembert bemerkte, dass er Bernoullis Sinuskurvenlösungen kombinieren konnte. Zur Vereinfachung betrachten wir nur eine Momentaufnahme und werden damit die Zeitabhängigkeit los. Die Abbildung zeigt beispielhaft die Form von 5 sin x + 4 sin 2x – 2 cos 6x. Sie ist weitaus komplexer als eine einfache Sinuskurve. Echte Musikinstrumente erzeugen typischerweise komplexe Wellen mit vielen verschiedenen Sinus- und Kosinus-Termen.
Der Einfachheit halber schauen wir uns sin 2x an, der die doppelte Frequenz wie sin x hat. Wie klingt er? Es ist der eine Oktave höhere Ton. Das ist der Ton, der besonders harmonisch klingt, wenn man ihn zusammen mit dem Grundton spielt. Nun kreuzt die Form der Saite im zweiten Modus (sin2x) die horizontale Achse im Mittelpunkt. An diesem Schwingungsknoten bleibt sie fest. Setzt man einen Finger auf diesen Punkt, können immer noch beide Hälften der Saite im sin2x-Muster schwingen, im sin-x-Muster jedoch nicht mehr. Das erklärt die pythagoreische Entdeckung, dass eine halb so lange Saite einen eine Oktave höheren Ton erzeugt. Eine ähnliche Erklärung ist auf die anderen einfachen Frequenzverhältnisse anwendbar, die sie entdeckt hatten: Sie gehören alle zu Sinuskurven, deren Frequenzen diese Zahlenverhältnisse haben, und solche Kurven passen gut auf einer Saite fester Länge zueinander, deren Enden fest eingespannt sind.
Abbildung 127: Typische Überlagerung von Sinus- und Kosinuswellen unterschiedlicher Amplituden und Frequenzen. Warum klingen diese Verhältnisse harmonisch? Der Grund liegt einerseits darin, dass Sinuswellen, deren Frequenzen nicht in einfachen Verhältnissen stehen, sogenannte Schwebungen erzeugen, wenn sie überlagert werden. Zum Beispiel entspricht ein Verhältnis wie der Wellenform sin 7x + sin 8x. Der entstehende Ton ist ein hohes Summen, das erst lauter und dann wieder leiser wird. Das menschliche Ohr reagiert auf einfallenden Schall in etwa auf dieselbe Weise wie eine Violinsaite. Bei einer Schwebung hört sich das Resultat deshalb nicht harmonisch an. Zum anderen gibt es einen weiteren Grund. Die Ohren von Neugeborenen stimmen sich auf diejenigen Töne ein, die sie während der
Entwicklung des Gehirns am häufigsten hören. Tatsächlich gibt es mehr Nervenverbindungen vom Gehirn zum Ohr als in die andere Richtung, und das Gehirn kann diese nutzen, um die Reaktion des Ohrs auf einfallenden Schall zu regulieren. Deshalb hat unsere Auffassung von Harmonie eine kulturelle Dimension. Allerdings sind die einfachsten Verhältnisse von Natur aus harmonisch, und die meisten Kulturen machen von ihnen Gebrauch. Eine Saite ist eindimensional, doch lassen sich ähnliche Ideen auch in höheren Dimensionen anwenden. Um die Schwingungen einer Trommel zu verstehen, betrachten wir eine schwingende Membran – eine zweidimensionale Oberfläche –, die wie die Haut einer Trommel geformt ist. Viele Trommeln sind kreisförmig, doch können wir genauso gut den Klang einer quadratischen oder einer rechteckigen Trommel berechnen, oder meinetwegen auch einer Trommel, die wie der Umriss einer Katze geformt ist.
Abbildung 128: Schwebungen. Abbildung 129: Links: Momentaufnahme der Schwingungsmodi 2 und 3 einer rechteckigen Trommel. Rechts: Momentaufnahme einer schwingenden kreisförmigen Trommel. Für jede feste Grundform gibt es Funktionen, die Bernoullis Sinus und Kosinus entsprechen: die einfachsten Schwingungsmuster. Diese Muster nennt man Modi oder Normalschwingungen, wenn man klarstellen will,
wovon die Rede ist. Alle anderen Wellen können durch Überlagerung von Normalschwingungen erzeugt werden, wobei, falls nötig, auch unendliche Summen benutzt werden. Die Grundform kann auch dreidimensional sein: ein Körper. Ein wichtiges Beispiel ist eine schwingende massive Kugel, die ein einfaches Modell dafür darstellt, wie die Erde sich bei einem Erdbeben bewegt. Eine genauere Form ist eine Ellipse, die an den Polen leicht abgeflacht ist. Seismologen benutzen die Wellengleichung und weiterentwickelte Versionen dieser Gleichung, welche die Physik der Erde naturgetreuer modellieren, um die Signale deuten zu können, die durch Erdbeben entstehen. Wer Autos entwirft und unerwünschte Vibrationen eliminieren möchte, muss sich die Wellengleichung für ein autoförmiges Objekt anschauen, oder welchen Teil auch immer die Ingenieure verstehen wollen. Beim Entwurf erdbebensicherer Gebäude geht man ähnlich vor.
Die Apéry-Konstante Diese Konstante ist ein bemerkenswertes Beispiel für eine mathematische Gesetzmäßigkeit, die bei allen geraden Zahlen funktioniert, bei ungeraden aber wahrscheinlich nicht. Soweit man weiß. Der Beweis, dass diese Zahl irrational ist, kam wie ein Blitz aus heiterem Himmel. Zeta von drei Erinnern Sie sich an die Zeta-Funktion (siehe Kapitel [ ])? Sie wird, mit einigen technischen Einschränkungen hinsichtlich der analytischen Fortsetzung, für jede komplexe Zahl z (siehe Kapitel [i]) durch folgende Reihe definiert: Die Mathematiker des 18. Jahrhunderts begegneten dieser unendlichen Summe erstmals bei dem Spezialfall z = 2, als Euler das Baseler Problem
löste. Anders ausgedrückt, suchten sie nach einem Ausdruck für ζ(2), also die Summe der reziproken Quadratzahlen. Euler fand 1735 die Antwort (siehe Kapitel [π]): Dieselbe Methode klappt auch für die vierte, sechste oder jede andere geradzahlige Potenz: und es geht weiter mit: Anhand dieser Beispiele würde man annehmen, dass die Summe der 3 reziproken Kubikzahlen ein rationales Vielfaches von π , die Summe der 5 reziproken fünften Potenzen ein rationales Vielfaches von π , und so weiter wäre. Numerische Rechnungen sprechen jedoch stark dagegen. Tatsächlich sind überhaupt keine Formeln für diese Reihen, mit oder ohne π, bekannt. Sie sind ein Rätsel.
Weil π irrational, ja sogar transzendent ist (siehe Kapitel [π]), haben alle obigen Reihen irrationale Werte. Also ist ζ(n) für n = 2, 4, 6, 8, … irrational. Man weiß jedoch nicht, ob das auch für ungerade n gilt. Es ist zwar sehr wahrscheinlich, aber ζ(n) ist für ungerade n viel schwerer zu überprüfen, weil Eulers Methode nur für gerade n funktioniert. Viele Mathematiker haben sich schon mit dieser Frage abgegeben, aber alles in allem sind sie nicht weitergekommen. Für n = 3, die reziproken Kubikzahlen, ist die Zahl als Apéry‑Konstante bekannt. Ihr Zahlenwert ist 3 Teilt man das durch π , wird daraus eine Zahl, die keine Anzeichen für Wiederholungen liefert, zumindest also sieht sie nicht rational aus. Mit Sicherheit ist sie kein Bruch mit kleinem Zähler und Nenner. Im Jahr 2013 berechnete Robert Setti die Apéry‑Konstante bis auf 200 Milliarden Stellen. Das Ergebnis sieht noch 3 weniger wie ein rationales Vielfaches von π aus, und es scheint keinerlei Verwandtschaft mit anderen mathematischen Konstanten zu haben.
Daher war es eine riesige Überraschung, als Raoul Apéry 1978 einen Beweis für die Irrationalität von ζ(3) veröffentlichte. Noch größer war die Überraschung, als sich sein Beweis auch noch als richtig herausstellte. Damit soll nichts Schlechtes über Apéry gesagt sein. Der Beweis machte allerdings einige bemerkenswerte Behauptungen: Zum Beispiel, dass eine Folge von offensichtlich rationalen Zahlen, die jedoch keineswegs wie natürliche Zahlen aussehen, tatsächlich natürliche Zahlen sind. (Jede natürliche Zahl ist rational, aber nicht umgekehrt.) Als Computerberechnungen immer wieder natürliche Zahlen lieferten, wurde das langsam plausibel, doch erst nach einiger Zeit gelang der Nachweis, dass das immer so weiterging. Apérys Beweis ist sehr kompliziert, aber er benutzt keine Techniken, die nicht auch schon Euler bekannt waren. Seither sind auch einfachere Beweise gefunden worden. Die Methoden sind auf ζ(3) zugeschnitten und lassen sich offenbar nicht auf andere ungerade Zahlen übertragen. Jedoch konnten Wadim Zudilin und Tanguy Rivoal im Jahr 2000 zeigen, dass unendlich viele ζ(2n+1) irrational sein müssen. Ein Jahr später bewiesen sie, dass wenigstens eine der vier Zahlen ζ(5), ζ(7), ζ(9) und ζ(11) irrational ist – aber gemeinerweise verrät ihr Theorem nicht, welche der Zahlen irrational ist oder sind. Manchmal ist Mathematik so.
Die Euler-Konstante Diese Zahl taucht in vielen Gebieten der Analysis und der Zahlentheorie auf. Sie ist sicherlich eine reelle Zahl, und mit ziemlicher Sicherheit auch irrational, weswegen ich sie hier vorstelle. Sie hat mit der einfachsten Näherung für die Summe der reziproken ganzen Zahlen bis zu einem bestimmten Wert zu tun. Obwohl sie so häufig auftaucht und so einfach ist, weiß man sehr wenig über sie. Insbesondere kann niemand beweisen, dass sie irrational ist. Sollte sie jedoch rational sein, so viel ist bekannt, muss es sich um einen höchst komplizierten Bruch handeln: Er würde absolut gigantische Zahlen mit mehr als 240000 Stellen enthalten. Harmonische Zahlen Harmonische Zahlen sind Summen reziproker ganzer Zahlen:
Es ist keine einfache algebraische Formel für Hn bekannt, und mit ziemlicher Sicherheit gibt es auch keine. Allerdings lässt sich mit Hilfe der Analysis relativ leicht beweisen, dass Hn ungefähr gleich dem natürlichen Logarithmus der Zahl n ist (siehe Kapitel [e]). Eine noch bessere Näherung lautet: mit einer Konstanten γ. Mit wachsendem n wird die Differenz der beiden Seiten beliebig klein. Die Dezimalentwicklung von γ beginnt mit Alexander Yee berechnete sie 2013 bis zur 19377958182‑ten Dezimalstelle. Sie heißt Euler‑Konstante, weil sie erstmals in einer Arbeit auftaucht, die Euler 1734 schrieb. Er bezeichnete sie mit C und mit O und berechnete sie auf 16 Dezimalstellen genau. Im Jahr 1790 veröffentlichte auch Lorenzo Mascheroni einige Ergebnisse für diese Zahl, doch er nannte sie A und a. Er versuchte, ihre ersten 32 Dezimalstellen zu berechnen, machte jedoch Fehler an den Stellen 20 bis 22. Gelegentlich ist sie auch als Euler‑Mascheroni‑Konstante bekannt, doch gebührt Euler im Großen und Ganzen die größere Ehre. Um 1830 hatten Mathematiker die Bezeichnung in die heutige Standardschreibweise γ umgewandelt. Die Euler’sche Konstante erscheint in zahlreichen mathematischen Formeln, insbesondere im Zusammenhang mit Reihen und bestimmten γ Integralen in der Analysis. Die Potenz e ist in der Zahlentheorie
gebräuchlich. Man vermutet, dass die Euler‑Konstante transzendent ist, doch weiß man noch nicht einmal mit Sicherheit, ob sie irrational ist. Berechnungen ihrer Kettenbruchentwicklung zeigen, dass ihr Nenner – falls 242080 sie als Bruch darstellbar, also rational ist – mindestens 10 sein muss. Eine noch genauere Näherungsformel für die harmonischen Zahlen lautet: Dabei beträgt der Fehler höchstens .
SPEZIELLE KLEINE ZAHLEN Nun kehren wir zu ganzen Zahlen zurück, die ihren eigenen Charme haben. Jede ist ein eigenes Individuum mit speziellen Eigenschaften, die sie interessant machen. Im Grunde sind alle Zahlen interessant. Beweis: Wenn nicht, gäbe es eine kleinste uninteressante Zahl. Diese Eigenschaft wiederum würde sie interessant machen: Widerspruch.
Die Stringtheorie Gewöhnlich stellen wir uns den Raum dreidimensional vor. Die Zeit liefert eine vierte Dimension für die Raumzeit, die Domäne der Relativität. Neuere Forschungen an der Front der Physik, als Stringtheorie – genauer als M‑Theorie – bekannt, behaupten dagegen, dass die Raumzeit eigentlich elf Dimensionen hat. Sieben der elf Dimensionen sind unseren menschlichen Sinnen nicht zugänglich. Tatsächlich sind sie noch nicht einmal in irgendeinem Experiment sicher nachgewiesen. Das mag ungeheuerlich erscheinen und es könnte auch nicht stimmen. Doch hat die Physik uns verschiedentlich gelehrt, dass das Bild der Welt, das uns unsere Sinne liefern, von der Realität beträchtlich abweichen kann. Zum Beispiel bilden diskrete, kleine Bestandteile, die Atome, zusammenhängende Materie. Nun glauben Physiker, dass der tatsächliche Raum vom Raum, in dem wir zu leben glauben, sehr verschieden ist. Der Grund für die elf Dimensionen ist keine Beobachtung in der wirklichen Welt: Es ist die Zahl, die eine entscheidende mathematische Struktur
vernünftig funktionieren lässt. Die Stringtheorie ist sehr technisch, doch die wesentlichen Ideen können relativ einfach skizziert werden. Die Vereinigung von Relativität und Quantentheorie Die zwei großen Triumphe der theoretischen Physik sind Relativität und Quantenmechanik. Erstere, von Einstein eingeführt, erklärt die Gravitation als Krümmung der Raumzeit. Nach der allgemeinen Relativitätstheorie – die Einstein nach der speziellen Relativität, seiner Theorie von Raumzeit und Materie, entwickelte – folgt ein Teilchen auf seinem Weg von einem Ort zum anderen einer Geodäte: dem kürzesten Weg, der die beiden Orte verbindet. In der Nähe eines massiven Körpers, wie zum Beispiel eines Sterns, wird die Raumzeit verformt, und das scheint auch den Weg zu verbiegen. Zum Beispiel bewegen sich die Planeten in elliptischen Umlaufbahnen um die Sonne. Die ursprüngliche Gravitationstheorie Newtons interpretierte diese gekrümmten Bahnen als Ergebnis einer Kraft und lieferte eine mathematische Formel für die Stärke dieser Kraft. Äußerst genaue Messungen zeigten jedoch, dass Newtons Theorie nicht ganz zutrifft. Einstein ersetzte die Gravitationskraft durch die Krümmung der Raumzeit, und seine neue Theorie korrigierte die Fehler. Seitdem haben zahlreiche unterschiedliche Beobachtungen, hauptsächlich an fernen astronomischen Objekten, diese Theorie bestätigt.
Abbildung 130: Wie die Krümmung der Raumzeit sich als Kraft zeigen kann. Ein Teilchen, das an einem schweren Körper, wie zum Beispiel einem Stern, vorbeifliegt, wird durch die Krümmung abgelenkt – sie hat dieselbe Wirkung wie eine anziehende Kraft. Der zweite große Triumph, die Quantenmechanik, wurde von verschiedenen großen Physikern entwickelt – darunter Max Planck, Werner Heisenberg, Louis de Broglie, Erwin Schrödinger und Paul Dirac. Die Quantenmechanik erklärt, wie sich Materie im kleinsten Maßstab verhält: bei der Größe von Atomen oder kleiner. Bei diesen Längenskalen verhält sich Materie sowohl wie Teilchen als auch wie Wellen. Die Quantenmechanik sagt viele fremdartige Effekte voraus, die sich sehr vom Verhalten der Welt im Größenmaßstab des Menschen unterscheiden, doch Tausende von Experimenten stimmen mit diesen Vorhersagen überein. Die heutige Elektronik würde nicht funktionieren, wenn die Quantenmechanik stark von der Realität abwiche.
Theoretische Physiker finden es sehr unbefriedigend, zwei verschiedene Theorien zu haben, die in verschiedenen Kontexten angewendet werden, insbesondere weil sie einander widersprechen, wenn diese Kontexte sich überlappen, wie das in der Kosmologie der Fall ist – der Theorie des Universums als Ganzem. Einstein selbst begann mit der Suche nach einer einheitlichen Feldtheorie, die beide Bestandteile in einer logisch konsistenten Weise verbindet. Diese Suche hat Teilerfolge erzielt, bislang jedoch nur im Quantenregime. Diese Erfolge vereinigen drei der vier grundlegenden physikalischen Kräfte. Physiker unterscheiden vier Arten von Kräften in der Natur: Gravitationskräfte, elektromagnetische Kräfte, die für Elektrizität und Magnetismus verantwortlich sind, die schwache Kraft, die mit dem Zerfall radioaktiver Teilchen zusammenhängt, und die starke Kraft, die Teilchen wie Protonen und Neutronen zusammenhält. Genau genommen sind alle diese Kräfte «Wechselwirkungen» zwischen den Teilchen der Materie. Die Relativität beschreibt die Schwerkraft, und die Quantenmechanik ist für die anderen drei grundlegenden Kräfte zuständig. In den letzten Jahrzehnten haben Physiker eine einzige, allgemeine Theorie gefunden, die die drei Kräfte der Quantenmechanik vereinigt. Sie ist als Standardmodell bekannt und beschreibt die Struktur der Materie auf subatomaren Skalen. Nach diesem Standardmodell besteht alle Materie aus nicht mehr als 17 Elementarteilchen. Aufgrund verschiedener Beobachtungsprobleme – zum Beispiel Galaxien, die auf eine Weise rotieren, welche nicht mit den Voraussagen der allgemeinen Relativitätstheorie übereinstimmt, falls sie nur aus Materie bestehen, die wir beobachten – glauben Kosmologen derzeit, dass der
Großteil des Universums aus «dunkler Materie» besteht, die vermutlich weitere neue Teilchen über die 17 hinaus verlangt. Falls sie recht haben, muss das Standardmodell abgeändert werden. Oder wir brauchen eine neue Gravitationstheorie oder eine veränderte Auffassung, wie sich Körper unter dem Einfluss einer Kraft bewegen. Den theoretischen Physikern ist es jedoch bislang nicht gelungen, Relativität und Quantenmechanik in einer einzelnen Theorie zu vereinigen, die alle vier Kräfte in konsistenter Weise beschreibt, zugleich aber mit jeder der Theorien in ihrem jeweiligen Anwendungsbereich übereinstimmt (im Großen und im Kleinen). Die Suche nach dieser einheitlichen Feldtheorie, oder Theorie von Allem, hat zu einigen wunderbaren mathematischen Ideen geführt, die in der Stringtheorie kulminierten. Derzeit gibt es keinen klaren experimentellen Beweis für diese Theorie, und verschiedene andere Vorschläge werden ebenfalls aktiv erforscht. Ein typisches Beispiel ist die Schleifenquantengravitation, in welcher der Raum durch ein Netzwerk winziger Schleifen dargestellt wird, so ähnlich wie ein Kettenhemd. Technisch gesprochen, handelt es sich um einen Spin‑Schaum.
Abbildung 131: Die 17 fundamentalen Teilchen. Die Stringtheorie begann mit dem Vorschlag, Elementarteilchen nicht als Punkte zu betrachten. Tatsächlich verbreitete sich die Auffassung, dass die Natur in der Tat nicht mit Punktteilchen auskommt, was der Grund für die Inkonsistenz einer Quantentheorie für Teilchen und einer Relativitätstheorie sein könnte, welche nur mit glatten Kurven und Flächen arbeitet. Stattdessen sollten Teilchen eher kleinen geschlossenen Schleifen ähneln, die man Strings nennt. Schleifen kann man verbiegen, auf diese Weise
kommt Einsteins Vorstellung von Krümmung auf natürliche Weise ins Spiel. Außerdem können Schleifen schwingen, und diese Schwingungen erklären sehr schön verschiedene Quanteneigenschaften wie elektrische Ladung und Spin. Eine der verwirrenden Eigenheiten der Quantenmechanik besteht darin, dass solche Eigenschaften in der Regel als ganzzahlige Vielfache gewisser Naturkonstanten auftreten. Zum Beispiel hat das Proton die Ladung +1 einer bestimmten Einheit, das Elektron die Ladung –1 und das Neutron die Ladung 0. Quarks – noch fundamentalere Teilchen, aus denen Protonen und Neutronen gebildet sind – haben die Ladung und – . Damit kommen nur Vielfache –3, –1, 0, 2, 3 einer grundlegenden Einheit auf, die Ladung einer der Quarksorten. Aber warum ganzzahlige Vielfache? Die Mathematik schwingender Strings verhält sich ganz ähnlich. Jede Schwingung ist eine Welle mit einer bestimmten Wellenlänge (siehe Kapitel [ ]). Wellen auf einer geschlossenen Schleife müssen genau aufeinander abgestimmt sein, deswegen muss eine ganze Zahl von Wellenbergen auf die Schleife passen. Wenn die Wellen Quantenzustände repräsentieren, erklärt das, warum alles in ganzzahligen Vielfachen daherkommt.
Abbildung 132: Ganzzahlig viele Wellen passen auf einen Kreis. Natürlich erwies sich die Geschichte als nicht ganz so einfach. Doch hat die Idee, Teilchen als Schleifen zu betrachten, Physiker und Mathematiker zu einigen bemerkenswerten und leistungsfähigen Ideen geführt.
Extra‑Dimensionen Ein schwingender Quantenstring braucht eine Art Raum, in dem er schwingen kann. Um die Mathematik sinnvoll zu machen, kann das nicht der gewöhnliche Raum sein. Es muss eine zusätzliche Variable geben, eine Extra-Dimension des Raums, weil diese Art Schwingung keine räumliche, sondern eine Quanteneigenschaft ist. Als sich die Stringtheorie entwickelte, wurde es den Theoretikern klar, dass sie einige Extra‑Dimensionen benötigten, damit alles funktioniert. Ein neues Prinzip mit dem Namen Supersymmetrie legte nahe, dass jedes Teilchen einen verwandten «Partner» haben sollte, ein wesentlich schwereres Teilchen. Strings mussten durch Superstrings ersetzt werden, die diese Art Symmetrie gestatteten. Und Superstrings funktionierten nur, wenn der Raum sechs Extra‑Dimensionen hatte. Folglich konnte ein String nicht mehr einfach eine Schleife wie ein Kreis sein, er musste eine kompliziertere Form in sechs Dimensionen haben. Unter den Formen, die vielleicht in Frage kommen, sind sogenannte CalabiYau‑Mannigfaltigkeiten.
Abbildung 133: Projektion einer sechsdimensionalen Calabi‑Yau‑Mannigfaltigkeit auf den gewöhnlichen Raum. Dieser Vorschlag ist keineswegs so verrückt, wie er scheinen mag, weil «Dimension» in der Mathematik lediglich «unabhängige Variable» bedeutet. Der klassische Elektromagnetismus beschreibt Elektrizität durch ein elektrisches und ein magnetisches Feld, die den gewöhnlichen Raum
durchdringen. Jedes Feld braucht drei neue Variablen: die drei Feldkomponenten längs der drei Raumrichtungen, jeweils für das elektrische und das magnetische Feld. Obwohl diese Komponenten längs der Raumrichtungen zeigen, sind die Feldstärken in diesen Richtungen von den Raumrichtungen selbst unabhängig. Also braucht schon der klassische Elektromagnetismus sechs Extra‑Dimensionen: drei für die Elektrizität und drei für den Magnetismus. In gewisser Weise erfordert also auch die klassische elektromagnetische Theorie zehn Dimensionen: vier für die Raumzeit plus sechs für den Elektromagnetismus. In der Stringtheorie ist es ähnlich, doch braucht sie nicht diese sechs Dimensionen. In gewissem Sinne verhalten sich die neuen Dimensionen der Stringtheorie – die neuen Variablen – im Gegensatz zu Elektrizität oder Magnetismus mehr wie normale räumliche Dimensionen. Eine von Einsteins großen Errungenschaften bestand darin, den dreidimensionalen Raum und die eindimensionale Zeit zu einer vierdimensionalen Raumzeit vereinigt zu haben. Das war in der Tat notwendig, weil in der Relativitätstheorie Raum- und Zeitvariablen vermischt werden, wenn Objekte sich sehr schnell bewegen. Die Stringtheorie ist ähnlich, doch nutzt sie jetzt eine zehndimensionale Raumzeit mit neun Dimensionen für den Raum plus einer für die Zeit. Diese Idee drängte sich den Theoretikern durch die Notwendigkeit einer logisch konsistenten mathematischen Beschreibung auf. Falls wir annehmen, dass die Zeit wie gewöhnlich eine Dimension beansprucht und die Raumzeit d Dimensionen hat, führen die Rechnungen zu Termen in den Gleichungen, die Anomalien heißen und im Allgemeinen unendlich sind. Das bedeutet großes Ungemach, weil es in der wirklichen Welt keine
Unendlichkeiten gibt. Es zeigt sich jedoch, dass all diese Terme Vielfache von d –10 sind. Das ist null genau dann, wenn d = 10, und die Anomalien sind verschwunden. Deswegen braucht man zum Verschwinden der Anomalien zehn Raumzeitdimensionen. Der Faktor d –10 ist durch die Formulierung der Theorie vorgegeben. Mit d = 10 umgeht man das gesamte Problem, handelt sich dafür jedoch ein noch schlimmeres ein. Zieht man eine Dimension für die Zeit ab, so findet man neun Raumdimensionen, keine drei. Doch würde das stimmen, hätten wir es nicht längst bemerken müssen? Wo sind die zusätzlichen sechs Dimensionen? Eine sehr ansprechende Antwort besagt, dass die Extra‑Dimensionen vorhanden sind, aber so stark eingerollt, dass wir sie nicht bemerken, sie tatsächlich nicht bemerken können. Stellen Sie sich einen langen Gartenschlauch vor. Aus großer Entfernung betrachtet, können Sie seine Dicke nicht erkennen: Er sieht aus wie eine eindimensionale Linie. Die beiden anderen Dimensionen, der kreisförmige Querschnitt des Gartenschlauchs, sind in einem so kleinen Raumbereich aufgerollt, dass sie nicht zu sehen sind. Ein String ist genauso, nur noch weitaus stärker aufgerollt. Bei einem Gartenschlauch ist die Länge ungefähr 1000 Mal so groß wie seine Dicke. Die «Länge» eines Strings (die sichtbare räumliche 40 Bewegung) ist mehr als 10 Mal so groß wie seine «Dicke» (die neun Dimensionen, in denen er schwingt). Eine weitere mögliche Antwort besagt, dass die neuen Dimensionen eigentlich ganz groß sind, die meisten Zustände des Teilchens jedoch auf einen festen Ort in diesen Dimensionen beschränkt sind – wie ein Boot, das auf der Oberfläche des Ozeans schwimmt. Der Ozean selbst hat drei
Dimensionen: Länge, Breite und Tiefe. Doch das Boot muss auf der Oberfläche bleiben und kann nur zwei der Dimensionen erkunden: Länge und Breite. Ein paar wenige physikalische Gegebenheiten, wie etwa die Schwerkraft, nutzen die Extra‑Dimensionen der Raumzeit aus – wie ein Taucher, der aus dem Boot springt. Doch die meisten tun es nicht. Etwa um 1990 hatten Theoretiker fünf verschiedene Typen von Stringtheorien entworfen, die sich hauptsächlich in den Symmetrien ihrer Extra‑Dimensionen unterscheiden. Diese Typen heißen I, IIA, IIB, HO und HE. Edward Witten entdeckte eine elegante mathematische Vereinigung all dieser fünf, die er M‑Theorie nannte. In dieser Theorie muss die Raumzeit elf Dimensionen haben: zehn für den Raum und eine für die Zeit. Verschiedene mathematische Tricks, die von einer der fünf StringtheorieTypen zur anderen führen, kann man als physikalische Eigenschaften der vollen elfdimensionalen Raumzeit ansehen. Indem man bestimmte «Gegenden» in dieser elfdimensionalen Raumzeit auswählt, kommt man zu den fünf Typen der Stringtheorie. Selbst wenn die Stringtheorie sich nicht als die richtige Beschreibung des Universums erweisen sollte, hat sie doch größere Beiträge zur Mathematik geliefert, die unglücklicherweise zu technisch sind, um sie hier vorzustellen. Die Mathematiker werden die Stringtheorie also weiter studieren und sie als wertvoll betrachten, selbst wenn die Physiker beschließen, dass sie nicht auf die reale Welt passt.
Pentominos Unter einem Pentomino versteht man eine ebene Form, die entsteht, wenn man fünf identische Quadrate Kante an Kante aneinanderlegt. Es gibt dafür, von Spiegelungen abgesehen, 12 Möglichkeiten. Üblicherweise bezeichnet man sie mit den Buchstaben des Alphabets, die eine ähnliche Form haben. 12 ist auch die Kusszahl im dreidimensionalen Raum.
Abbildung 134: Die 12 Pentominos. Polyominos Allgemeiner ist ein n-omino eine Fläche aus n identischen Quadraten. Als Oberbegriff dieser Formen hat man Polyomino gewählt. Es gibt 35 Hexominos (n = 6) und 108 Heptominos (n = 7).
Abbildung 135: Die 35 Hexominos. Das allgemeine Konzept und der Name wurden von Solomon Colomb 1953 erfunden und von Martin Gardner im Scientific American populär gemacht. Der Name ist eine Abwandlung des Wortes «Domino», ein Spielstein, der aus zwei Quadraten besteht, wobei der Buchstabe D eine nette Interpretation des lateinischen di oder des griechischen do mit der Bedeutung «zwei» liefert. (Das Wort «Domino» kommt eigentlich vom lateinischen dominus, «Herr».)
Abbildung 136: Die 108 Heptominos. Vorläufer findet man in der Literatur zuhauf. Der englische Rätselspezialist Henry Dudeney hatte ein Pentomino in seinen Canterbury Puzzles von 1907. Zwischen 1937 und 1957 druckte das Magazin Fairy Chess Review viele Anordnungen bis hin zu Hexominos und nannte sie «Zerlegungsrätsel». Polyomino‑Rätsel Polyominos im Allgemeinen und Pentominos im Besonderen bilden die Grundlage für eine gewaltige Zahl unterhaltsamer Rätsel und Spiele. Zum Beispiel können daraus interessante Formen gebildet werden. Die zwölf Pentominos haben zusammen eine Fläche von 60, wenn jedes Quadrat die Fläche 1 hat. Jede Art, 60 als Produkt von zwei ganzen Zahlen
zu schreiben, definiert ein Rechteck, und es ist eine amüsante und ziemlich schwierige Aufgabe, die Pentominos so zusammenzusetzen, dass sie solch ein Rechteck bilden. Man darf sie, wenn nötig, umdrehen, um das Spiegelbild zu bekommen. Die möglichen Rechtecke sind 6 × 10, 5 × 12, 4 × 15 und 3 × 20. Man kann leicht erkennen, dass 2 × 30 und 1 × 60 nicht möglich sind. Abbildung 137: Die möglichen Rechtecke aus den 12 Pentominos. Die Anzahl der Möglichkeiten, diese Rechtecke zusammenzulegen (wobei Drehungen und Spiegelungen des gesamten Rechtecks nicht als verschieden
gezählt werden, man aber kleinere Rechtecke drehen und spiegeln darf, solange alles andere unverändert bleibt) ist bekannt: Eine weitere typische Knobelaufgabe geht von der Gleichung 8 × 8 – 2 × 2 = 60 aus und fragt, ob ein 8 × 8-Quadrat mit einem zentralen 2 × 2‑Loch in der Mitte mit den zwölf Pentominos gelegt werden kann. Die Antwort lautet «ja»:
Abbildung 138: Wie man ein gelochtes Quadrat aus Pentominos legt. Ein ansprechender Weg, Hexominos zu einem Parallelogramm zu verlegen, ist folgender:
Abbildung 139: Wie man ein Parallelogramm aus Hexominos bildet. Die Anzahl der Polyominos Mathematiker und Computerwissenschaftler haben für viele n berechnet, wie viele n‑ominos es gibt. Falls Drehungen und Spiegelungen nicht als verschieden angesehen werden, sind die Zahlen folgende: n Zahl der n-ominos 1 1 2 1 3 2 4 5 5 12 6 35 7 108 8 369 9 1285 10 4655
11 17 073 12 63 600 Tabelle 11 Kusszahl für Kugeln Die Kusszahl für Kreise – die größte Anzahl von Kreisen, die einen gegebenen Kreis berühren und alle die gleiche Größe haben – ist sechs (siehe Kapitel [6]). Es gibt auch eine Kusszahl für Kugeln – die größtmögliche Anzahl Kugeln, die eine gegebene Kugel berühren können und alle die gleiche Größe haben. Diese Zahl ist 12. Es ist relativ leicht nachzuweisen, dass 12 Kugeln eine weitere berühren können. Tatsächlich kann man das so machen, dass die Kontaktpunkte die zwölf Ecken eines regulären Ikosaeders bilden (siehe Kapitel [5]). Es bleiben genug Zwischenräume, um Kugeln einzufügen, die einander berühren. In der Ebene lassen die sechs Kreise, die mit einem zentralen Kreis in Kontakt sind, keinen freien Raum und die Anordnung ist starr. In drei Dimensionen aber gibt es eine Menge freien Raum und die Kugeln können bewegt werden. Lange Zeit wusste man nicht, ob nicht sogar Platz für eine dreizehnte Kugel wäre, wenn man die anderen zwölf an die richtigen Plätze rückte. Zwei berühmte Mathematiker, Newton und David Gregory, haben lange über diese Frage gestritten. Newton blieb dabei, dass die richtige Zahl 12 lautet, während Gregory überzeugt war, dass es 13 wäre. Anfang des
19. Jahrhunderts gab es Versuche, Newtons Ansicht zu beweisen, doch sie hatten alle Lücken. Ein vollständiger Beweis, dass 12 die richtige Antwort ist, erschien 1953. Abbildung 140: Links: Wie zwölf Kugeln eine weitere berühren können. Rechts: Die «Schatten» von zwölf Kugeln, die eine weitere in einer ikosaedrischen Anordnung berühren. Vier und mehr Dimensionen Ganz ähnlich ist die Lage im vierdimensionalen Raum, wo man relativ leicht eine Anordnung von 24 3‑Sphären finden kann, die sich küssen; es bleibt jedoch genug Platz, dass eine 25. hineinpassen könnte. Diese Lücke wurde von Oleg Musin schließlich im Jahr 2003 ausgeschlossen: Wie erwartet, ist die Antwort 24. In den meisten übrigen Dimensionen wissen Mathematiker, dass bestimmte Zahlen für sich küssende Sphären möglich sind, weil sie solche Anordnungen angeben können und aus verschiedenen indirekten Gründen eine größere Anzahl unmöglich ist. Diese Zahlen nennt man die untere
Schranke und obere Schranke für die Kusszahl. Diese muss irgendwo dazwischen liegen, möglicherweise ist sie gleich einer der beiden. Nur in zwei Fällen jenseits der vierten Dimension fallen untere und obere Schranke zusammen, sodass ihr gemeinsamer Wert die Kusszahl ist. Bemerkenswerterweise handelt es sich dabei um die Dimensionen 8 und 24, in denen die jeweiligen Kusszahlen 240 und 196650 betragen. In diesen Dimensionen gibt es zwei hochgradig symmetrische Gitter, höherdimensionale Analoga von Quadratgittern oder allgemeiner von Parallelogrammgittern. Diese speziellen Gitter bezeichnet man als E8 (oder auch Gosset-Gitter) und Leech-Gitter, und die Kugeln können an geeigneten Gitterpunkten platziert werden. Durch eine geradezu an Wunder grenzende Koinzidenz sind die beweisbaren oberen Schranken für die Kusszahl in diesen Dimensionen dieselben wie die unteren Schranken, die man von diesen speziellen Gittern erhält. Den gegenwärtigen Stand dieser Untersuchungen kann man in der Tabelle zusammenfassen, darin zeigt der Fettdruck diejenigen Dimensionen, in denen eine exakte Antwort bekannt ist: Dimension untere Schranke obere Schranke 1 2 2 2 6 6 3 12 12 4 24 24 5 40 45 6 72 78 7 126 135 8 240 240
9 306 366 10 500 567 11 582 915 12 840 1416 13 1130 2233 14 1582 3492 15 2564 5431 16 4320 8313 17 5346 12 215 18 7398 17 877 19 10 688 25 901 20 17 400 37 974 21 27 720 56 852 22 49 896 86 537 23 93 150 128 096 24 196 560 196 560 Tabelle 12
Vielecke und Tapetenmuster Schon in seiner Jugend entdeckte Gauß zu seiner und aller anderen Überraschung, dass man ein 17-seitiges Viereck allein mit Zirkel und Lineal konstruieren kann – etwas, das Euklid niemals geglaubt hätte. So ging es auch allen anderen, und das mehr als 2000 Jahre lang. Es gibt 17 verschiedene Symmetrietypen von Tapetenmustern. Das ist eigentlich eine zweidimensionale Version von Kristallographie: der Atomanordnung in Kristallen. Im Standardmodell der Teilchenphysik gibt es 17 Typen fundamentaler Teilchen (siehe Kapitel [11]). Regelmäßige Vielecke Ein Vieleck oder Polygon (griechisch für «viele Seiten») ist eine Form, deren Kanten gerade Linien sind. Man nennt es regelmäßig, wenn jede
Kante dieselbe Länge hat und jeweils zwei Kanten sich unter demselben Winkel treffen. Regelmäßige Vielecke spielten in Euklids Geometrie eine zentrale Rolle und haben sich seitdem für viele Gebiete der Mathematik als grundlegend erwiesen. Eines der Hauptziele von Euklids Elementen bestand in dem Nachweis, dass es genau fünf regelmäßige Polyeder gibt, Körper, deren Begrenzungsflächen identische regelmäßige Vielecke sind, die an jeder Ecke auf dieselbe Weise angeordnet sind (siehe Kapitel [5]). Zu diesem Zweck musste er Flächen untersuchen, die regelmäßige Vielecke mit 3, 4, und 5 Seiten waren. Größere Seitenzahlen kommen in den Flächen der regelmäßigen Polyeder nicht vor. Abbildung 141: Regelmäßige Vielecke mit 3, 4, 5, 7 und 8 Seiten. Sie heißen: gleichseitiges Dreieck, Quadrat und regelmäßiges (oder reguläres) Fünfeck, Sechseck, Siebeneck und Achteck. Im Zuge des Beweises musste Euklid diese Formen konstruieren, indem er die traditionellen Instrumente Zirkel und Lineal benutzte, weil seine Geometrie auf diesen Voraussetzungen fußte. Die einfachsten Konstruktionen ergeben das gleichseitige Dreieck und das regelmäßige Sechseck. Ein Zirkel kann die Ecken festlegen. Für das Zeichnen der Seiten braucht man ein Lineal, doch das ist nicht seine einzige Rolle. Ein Quadrat zu konstruieren, ist ein bisschen schwieriger, doch es wird ganz leicht, sobald man weiß, wie man einen rechten Winkel konstruiert.
Abbildung 142: Man zeichne einen Kreis und wähle einen Punkt auf ihm. Dann markiert man aufeinanderfolgende Punkte rund um den Kreis mit dem Zirkel, der auf dieselbe Entfernung eingestellt bleibt. Das führt zu den sechs Ecken eines regelmäßigen Sechsecks. Jede zweite Ecke ergibt ein gleichseitiges Dreieck.
Abbildung 143: Auf einer Geraden sei ein Punkt gegeben. Man setze die Spitze des Zirkels auf diesen Punkt und schlage einen Kreis, der die Gerade zweimal schneidet. Dann macht man den Zirkel weiter und schlägt zwei Bögen, die sich schneiden. Die Gerade in der dritten Abbildung steht dann senkrecht auf der ursprünglichen Geraden. Das wiederholt man für die übrigen Seiten des Quadrats. Das regelmäßige Fünfeck ist viel trickreicher. So hat Euklid es gemacht: Drei verschiedene Ecken eines regelmäßigen Fünfecks bilden immer ein Dreieck mit den Winkeln 36°, 72° und 72°. Man kann das auch umkehren und ein regelmäßiges Fünfeck erhalten, indem man einen Kreis durch die Ecken eines solchen Dreiecks schlägt und die beiden 72°-Winkel halbiert –
was Euklid in seinem Buch schon in einem früheren Kapitel gezeigt hatte (siehe Kapitel [ ]). Nun musste er nur noch ein Dreieck konstruieren, das diese spezielle Form hatte, was sich wiederum als der schwierigste Teil der Konstruktion erwies. Tatsächlich brauchte man dafür eine weitere trickreiche Konstruktion, die ihrerseits auf der vorhergehenden beruhte. Wenig überraschend stieß Euklid deshalb erst in Buch IV seines 13-teiligen Buches zum regelmäßigen Fünfeck vor. Abbildung 144: Links: Diese drei Ecken eines regulären Fünfecks bilden ein Dreieck mit den Winkeln 36°, 72° und 72°. Rechts: Ist ein solches Dreieck vorgegeben, schlage man einen Kreis durch seine Ecken (graue Linie) und halbiere die 72°‑Winkel (hellgrau). So erhält man die restlichen beiden Ecken des Fünfecks.
Abbildung 145: Einfachere Konstruktion eines regelmäßigen Fünfecks. Die Abbildung zeigt eine einfachere, zeitgemäßere Konstruktion. Sie beginnt mit einem Kreis mit Mittelpunkt O und Durchmesser CM. Man zeichne OS in rechtem Winkel zu CM und halbiere diese Strecke bei L. Schlage einen Kreis um L durch O, der den ursprünglichen Kreis bei S berührt. Die Strecke ML schneidet diesen Kreis bei N und P. Schlage Kreisbögen (grau) um M durch N und P. Sie schneiden den großen Kreis bei B, D, A und E. ABCDE (gestrichelt) ist ein regelmäßiges Fünfeck.
Mehr als sechs Seiten Euklid wusste auch, wie man die Seitenzahl eines regulären Vielecks verdoppelt, indem man die zentralen Winkel halbiert. Die Abbildung zeigt, wie man aus einem regelmäßigen Sechseck ein regelmäßiges Zwölfeck macht. Abbildung 146: Links: Man beginnt mit einem Sechseck in einem Kreis. Zeichne seine Diagonalen. Rechts: Halbiere die zentralen Winkel (gestrichelt). Die Winkelhalbierenden schneiden den Kreis in den weiteren sechs Ecken eines regelmäßigen 12-Ecks. Indem er die Konstruktionen für ein gleichseitiges Dreieck und ein gleichseitiges Fünfeck kombinierte, erhielt Euklid ein gleichseitiges 15Eck. Das funktioniert, weil 3 × 5 = 15 und 3 und 5 teilerfremd sind.
Abbildung 147: Wie man ein 15-Eck konstruiert. Punkt A auf einem gleichseitigen Dreieck und Punkt B auf einem regelmäßigen Fünfeck sind aufeinanderfolgende Ecken eines regelmäßigen 15-Ecks. Mit einem Zirkel kann man die übrigen Ecken festlegen. Durch Kombination all dieser Tricks konnte Euklid regelmäßige Vielecke mit den folgenden Seitenzahlen konstruieren:
usw. – die Zahlen 3, 4, 5 und 15 und alle anderen, die man durch wiederholtes Verdoppeln dieser Zahlen erhalten kann. Viele Zahlen fehlten jedoch, als erste die 7. Die Griechen waren nicht in der Lage, Konstruktionen mit Zirkel und Lineal für die fehlenden regelmäßigen Vielecke zu finden. Was nicht hieß, dass diese Vielecke nicht existierten; es legte nur nahe, dass die Konstruktionsmethode mit Zirkel und Lineal dafür ungeeignet war. Niemand hat offenbar angenommen, dass man irgendeines der fehlenden Polygone möglicherweise doch mit Zirkel und Lineal konstruieren könnte, oder auch nur die Frage aufgeworfen. Das regelmäßige 17-Eck Gauß, einer der größten Mathematiker, die jemals gelebt haben, wäre beinah Linguist geworden. Aber im Jahr 1796 entdeckte er im Alter von 19 Jahren, dass die Zahl 17 zwei spezielle Eigenschaften hat, die in Kombination dazu führen, dass es eine Konstruktion mit Zirkel und Lineal für ein regelmäßiges 17-Eck gibt (auch Heptadekagon oder Heptakaidekagon genannt). Er machte diese erstaunliche Entdeckung nicht, als er sich mit Geometrie befasste, sondern mit algebraischen Überlegungen. In den komplexen 17 Zahlen gibt es genau 17 Lösungen der Gleichung x = 1, und wie sich herausstellt, bilden sie ein regelmäßiges 17-Eck in der komplexen Ebene: siehe «Einheitswurzeln» in Kapitel [i]. Das war damals recht gut bekannt, doch Gauß bemerkte etwas, das allen anderen entgangen war. Sie wussten wie er, dass 17 eine Primzahl ist und dass sie um eins größer ist als eine 4 Potenz von 2, nämlich 16 + 1 und 16 = 2 . Gauß bewies jedoch, dass man
mit Hilfe der Kombination dieser beiden Eigenschaften die Gleichung mit den üblichen Rechenoperationen der Algebra lösen kann – Addition, Subtraktion, Multiplikation und Division –, wenn man zusätzlich noch das Quadratwurzelziehen hinzunimmt. Und alle diese Operationen können geometrisch mit Hilfe von Zirkel und Lineal vollzogen werden. Kurz und gut, es musste eine Konstruktion mit Zirkel und Lineal für ein regelmäßiges 17-Eck geben. Und das war eine große Neuigkeit, da sich mehr als 2000 Jahre lang niemand so etwas hatte vorstellen können. Es kam aus heiterem Himmel, vollkommen unerwartet. Gauß brachte es dazu, sich für eine Karriere als Mathematiker zu entscheiden. Er formulierte keine explizite Konstruktion, schrieb aber fünf Jahre später in seinem Meisterwerk, den Disquisitiones Arithmeticae, folgende Formel auf und bewies, dass ein 17-Eck konstruiert werden kann, wenn man aus einer Einheitsstrecke eine Gerade dieser Länge konstruieren kann. Da nur Quadratwurzeln auftauchen, lässt sich die Formel in eine ziemlich komplizierte geometrische Konstruktion umwandeln. Es gibt jedoch leistungsfähigere Methoden, auf die verschiedene Leute kamen, als sie über den Beweis von Gauß nachdachten. Gauß war klar, dass dasselbe Argument griff, wenn man 17 durch irgendeine andere Zahl mit denselben beiden Eigenschaften ersetzte: eine Primzahl, die um 1 größer ist als ein n-te Potenz von 2. Diese Zahlen heißen k
k Fermat’sche Primzahlen. Algebraisch kann man beweisen, dass, falls 2 +1 eine Primzahl ist, dann auch k selbst entweder 0 oder eine Potenz von 2 sein n muss, also k = 0 oder 2 . Eine solche Zahl heißt dann Fermat-Zahl. Die ersten paar Fermat-Zahlen zeigt Tab. 13: Abbildung 148: Richmonds Methode, ein regelmäßiges 17-Eck zu konstruieren. Man nehme zwei senkrechte Durchmesser AOP0 und BOC eines Kreises. Setze OJ = OB und den
Winkel OJE = FP 0 OJP . Bestimme F so, dass der Winkel EJF 45° ist. Schlage einen Kreis mit 0 als Durchmesser, der OB in K schneidet. Schlage um E einen Kreis durch K, der AP0 in G und H schneidet. Zeichne HP3 und GP5 senkrecht zu AP0. n n k k=2 2 +1 Primzahl? 0 2 ja 0 1 3 ja 1 2 5 ja 2 4 17 ja 3 8 257 ja 4 16 65 537 ja 5 32 4 294 967 297 (das nein ist gleich 641 × 6 700 417) Tabelle 13 Die ersten sechs Fermat-Zahlen sind Primzahlen. Die ersten drei, 2, 3 und 5, entsprechen Konstruktionen, die schon die Griechen kannten. Die nächste, 17, ist Gauß’ Entdeckung. Es folgen zwei noch verblüffendere Zahlen, 257 und 65537. Gauß’ Überlegung zeigt, dass regelmäßige Vielecke mit diesen Seitenzahlen ebenfalls mit Zirkel und Lineal konstruierbar sind. F. J. Richelt veröffentlichte 1832 eine Konstruktion für das regelmäßige 257‑Eck. J. Hermes von der Universität Lingen widmete zehn Jahre seines Lebens dem 65537-Eck. Seine unveröffentlichte Arbeit kann man in der Universität Göttingen einsehen, doch halten Experten sie für fehlerhaft. Es ist unklar, ob ihre Überprüfung der Mühe wert ist, weil man ja weiß, dass eine Konstruktion existiert. Eine solche zu finden, ist
dann reine Routine, von dem gewaltigen Umfang der Rechnungen einmal abgesehen. Ich schätze, das könnte ein guter Test für eine computergestützte Beweisüberprüfung werden. Eine Zeit lang glaubte man, dass alle Fermat-Zahlen Primzahlen seien, jedoch bemerkte Euler 1732, dass die siebte Fermat-Zahl zusammengesetzt ist, nämlich gleich 641 × 6700417. (Man muss bedenken, dass damals Rechnungen per Hand ausgeführt werden mussten. Heute würde das ein Computer in Sekundenbruchteilen herausbekommen.) Bis jetzt haben sich keine weiteren Fermat-Zahlen als Primzahlen erwiesen. Sie sind für 5 ≤ n ≤ 11 zusammengesetzt und die vollständige Primfaktorzerlegung ist in diesen Fällen bekannt. Die Fermat-Zahlen 12 ≤ n ≤ 32 sind zusammengesetzt, aber es sind nicht alle Faktoren bekannt, und für n = 20 und 24 kennt man überhaupt keine Faktoren. Es gibt einen indirekten Test, ob eine Fermat-Zahl prim ist, und diese beiden Fälle bestehen den Test nicht. Die kleinste Fermat-Zahl mit bekanntem Status ist n = 33, und sie hat 2585827973 Dezimalstellen. Nun potenziere man 2 mit dieser Zahl und addiere 1… Gewaltig! Doch sollte man angesichts der Größe nicht den Mut verlieren: Die größte bekannte zusammengesetzte Fermat-Zahl ist F3329780, die durch teilbar ist (Raymond Ottusch 2014). Es erscheint plausibel, dass die bekannten Fermat’schen Primzahlen die einzigen sind, es ist jedoch unbewiesen. Sollte diese Annahme falsch sein,
würde es ein konstruierbares regelmäßiges Vieleck mit einer absolut gigantischen Primzahl-Anzahl von Seiten geben. Tapetenmuster Ein Tapetenmuster wiederholt dasselbe Motiv in zwei verschiedenen Richtungen: die Wand abwärts und längs der Wand (möglicherweise schräg). Die Abwärtswiederholung entsteht dadurch, dass das Papier als fortlaufende Rolle gedruckt wird, wobei ein sich drehender Zylinder das Muster erzeugt. Die Wiederholung längs der Wand ermöglicht es, das Muster seitlich fortzuführen, um eine ganze Wand zu bedecken. Die Anzahl möglicher Tapetendesigns ist gigantisch, aber viele verschiedene Muster sind identisch angeordnet, sie benutzen nur unterschiedliche Motive. Deswegen unterscheiden Mathematiker die grundsätzlich verschiedenen Muster anhand ihrer Symmetrien. Welche unterschiedlichen Möglichkeiten gibt es, ein Muster zu verschieben, zu rotieren oder zu spiegeln, sodass am Ende dasselbe herauskommt?
Abbildung 149: Tapetenmuster wiederholen sich in zwei Richtungen. Symmetrien der Ebene Die Symmetriegruppe eines ebenen Designs enthält alle starren Bewegungen der Ebene, die das Design auf sich selbst abbilden. Es gibt vier wichtige Typen solcher Bewegungen: Translation (Verschiebung ohne Rotation) Rotation (Drehung um einen festen Punkt, das Rotationszentrum) Reflexion (Spiegelung an einer Linie, der Spiegelachse) Gleitspiegelung (Spiegelung und Verschiebung längs der Spiegelachse)
Abbildung 150: Die vier Typen starrer Bewegungen. Hat das Design endliche Ausdehnung, sind nur Rotations- und Spiegelsymmetrien möglich. Pure Rotationen führen zu einer zyklischen Gruppensymmetrie, während Rotationen plus Reflexionen dihedrale Gruppensymmetrie ergeben.
Abbildung 151: Links: Zyklische Gruppensymmetrie (hier Drehungen um Vielfache eines rechten Winkels). Rechts: Dihedrale Gruppensymmetrie (gepunktete Linien stellen Spiegelachsen dar). Tapetenmuster, die sich unentwegt wiederholen, können Translations- und Gleitspiegelungssymmetrien haben. Zum Beispiel können wir das dihedrale Schweinegruppendesign auf eine quadratische Kachel malen und diese Kachel zum Bedecken der Ebene benutzen (Das Diagramm zeigt nur vier dieser unendlich vielen Kachelanordnungen.) Nun gibt es Translationssymmetrien (zum Beispiel die durchgezogenen Pfeile) sowie auch Gleitspiegelungssymmetrien (zum Beispiel der gepunktete Pfeil).
Abbildung 152: Ein Feld quadratischer Kacheln mit Translations- (durchgezogene Pfeile) und Gleitspiegelsymmetrien (gepunkteter Pfeil). Die 17 Symmetrietypen von Tapeten Für meine Tapete mit Blumenmuster sind die einzig möglichen Symmetrien Verschiebung in den zwei Richtungen, in denen sich das Muster wiederholt, oder verschiedene solche Verschiebungen, abwechselnd wiederholt. Das ist der einfachste Typ von Tapetensymmetrie, und jedes Tapetendesign hat
diese Gittersymmetrien im mathematischen Sinne per Definition. Ich leugne gar nicht, dass es Tapeten gibt, die im Grunde nur ein Wandbild darstellen und keinerlei Symmetrien außer der trivialen «lass alles unverändert» haben. Ich schließe solche Muster nur von dieser speziellen Betrachtung aus. Viele Arten von Tapeten haben zusätzliche Symmetrien, wie zum Beispiel Rotationen und Spiegelungen. Im Jahr 1924 bewiesen George Pólya und P. Niggli, dass es exakt 17 verschiedene Symmetrietypen für Tapetenmuster gibt. In drei Dimensionen besteht das entsprechende Problem darin, alle möglichen Symmetriegruppen von kristallinen atomaren Gittern aufzulisten. Dort sind es 230 Typen. Erstaunlicherweise wurde dieses Problem gelöst, bevor irgendjemand das viel einfachere zweidimensionale Tapetenproblem löste.
Abbildung 153: Die 17 Tapetenmuster-Typen und ihre internationale kristallographische Bezeichnung. (Aus: MathWorld, a Wolfram web resource.)
Das Geburtstagsparadox Während eines Fußballspiels sind gewöhnlich 23 Leute auf dem Spielfeld: zwei Mannschaften mit jeweils 11 Spielern und der Schiedsrichter. (Es gibt natürlich noch vier Assistenzschiedsrichter am Spielfeldrand, doch davon werden wir absehen, genauso wie von Ambulanzhelfern, Fans, die das Spielfeld stürmen, und wütenden Managern.) Wie groß ist die Wahrscheinlichkeit, dass zwei oder mehr dieser 23 Leute denselben Geburtstag haben? Wahrscheinlicher als nicht Die Antwort überrascht, es sei denn, Sie kennen sie schon.
Um die Berechnungen einfach zu halten, wollen wir annehmen, dass nur 365 unterschiedliche Geburtstage möglich sind (also kein 29. Februar für Menschen, die in einem Schaltjahr geboren sind), und dass jedes dieser Daten genau dieselbe Wahrscheinlichkeit hat: . Die tatsächlichen Zahlen zeigen eine kleine, aber signifikante Differenz, wobei einige Daten oder Jahreszeiten wahrscheinlicher sind als andere; diese Differenzen sind von Land zu Land unterschiedlich. Die gesuchte Wahrscheinlichkeit ändert sich nicht viel, wenn man diese Faktoren berücksichtigt, und das Ergebnis ist ohnehin genauso überraschend. Wir nehmen weiterhin an, dass die Wahrscheinlichkeiten für jeden Spieler unabhängig voneinander sind – was nicht der Fall wäre, wenn die Spieler zum Beispiel bewusst so ausgewählt wären, dass sie unterschiedliche Geburtstage haben. Oder wenn es zuginge wie in der außerirdischen Eiswelt Gnux Prime. Hier schlüpft jede neue Generation außerirdischer Monster zur gleichen Zeit aus dem unterirdischen Winterquartier, und verschiedene Generationen spielen grundsätzlich nie im selben Team – das wäre so wahrscheinlich wie eine Kreuzung zwischen Menschen und Zikaden. Sobald zwei Gnuxoide auf dem Spielfeld sind, wird die Wahrscheinlichkeit, dass sie denselben Geburtstag haben, schlagartig 1. Es ist einfacher, eine verwandte Wahrscheinlichkeit zu bestimmen: dass alle 23 Geburtstage verschieden sind. Die Regeln für das Berechnen von Wahrscheinlichkeiten besagen dann, dass wir diese von eins abziehen müssen, um die gesuchte Antwort zu erhalten. Das heißt, die Wahrscheinlichkeit, dass etwas nicht stattfindet, ist eins minus die
Wahrscheinlichkeit, dass das Ereignis stattfindet. Es vereinfacht die Berechnung, wenn wir annehmen, dass die Spieler einer nach dem anderen auf das Spielfeld kommen. Wenn die erste Person das Spielfeld betritt, ist niemand sonst zugegen. Die Wahrscheinlichkeit, dass ihr Geburtstag verschieden ist von dem irgendeines anderen, ist also 1 (Gewissheit). Mit dem Eintreffen der zweiten Person muss ihr Geburtstag verschieden sein von dem der ersten, und dafür gibt es 364 Auswahlmöglichkeiten. Die Wahrscheinlichkeit, dass dem so ist, ist Sobald die dritte Person dazukommt, muss ihr Geburtstag sich von denen der ersten beiden unterscheiden, dafür gibt es 363 von 365 Möglichkeiten. Die Regeln zum Berechnen von Wahrscheinlichkeiten besagen, dass wir die einzelnen Wahrscheinlichkeiten multiplizieren müssen, wenn wir die Wahrscheinlichkeit dafür suchen, dass zwei unabhängige Ereignisse eintreten. Also ist die Wahrscheinlichkeit dass keiner der Geburtstage übereinstimmt, bis jetzt
Bei der vierten Person muss ihr Geburtstag sich von denen der ersten drei unterscheiden, dafür gibt es 362 Möglichkeiten. Die Wahrscheinlichkeit für Nichtübereinstimmung lautet bisher also Die Gesetzmäßigkeit sollte jetzt klar sein. Nach k Personen auf dem Spielfeld lautet die Wahrscheinlichkeit, dass alle k Geburtstage verschieden sind Für k = 23 ist das 0,492703, nur etwas weniger als . Die Wahrscheinlichkeit, dass zumindest zwei Menschen denselben Geburtstag haben, ist also 1 – 0,492703 und das ist – also etwas größer als . Mit anderen Worten: Bei 23 Personen auf dem Spielfeld ist es wahrscheinlicher, dass zwei von ihnen am selben Tag Geburtstag haben, als nicht. Tatsächlich ist 23 die kleinste Zahl, für die diese Feststellung zutrifft. Bei 22 Menschen ist p(22) = 0,524305, etwas größer als . Also ist die
Wahrscheinlichkeit, dass wenigstens zwei Menschen denselben Geburtstag haben, 1 – 0,524305 Das ist etwas kleiner als . In der Abbildung sieht man, wie p(k) für k zwischen 1 und 50 von k abhängt. Die waagerechte Linie steht für den Schwellenwert . Abbildung 154: Wie p(k) von k abhängt.
Es überrascht, wie klein die Zahl 23 ist. Bei 365 Daten zur Auswahl könnte man sich leicht vorstellen, dass eine Menge Leute zusammenkommen müssen, bevor eine Übereinstimmung wahrscheinlicher wird als nicht. Diese Intuition ist deswegen falsch, weil mit dem Hinzufügen weiterer Menschen eine abnehmende Folge von Chancen miteinander multipliziert wird. Deswegen nimmt das Ergebnis schneller ab, als man erwartet. Am selben Tag wie Sie Es könnte einen anderen Grund geben, warum man überrascht ist, wie klein die Zahl ist, nämlich die Verwechslung mit einem anderen Problem: Wie viele Menschen müssen zusammenkommen, damit die Wahrscheinlichkeit, dass einer von ihnen denselben Geburtstag hat wie man selbst, größer ist als ? Diese Frage ist etwas leichter zu beantworten. Wiederum berechnen wir zunächst die Wahrscheinlichkeit, dass niemand denselben Geburtstag hat wie man selbst. Die Wahrscheinlichkeit, dass irgendjemand am selben Tag Geburtstag hat wie man selbst, ist immer dieselbe, nämlich Damit ist die Wahrscheinlichkeit, dass bei k Personen alle ihre Geburtstage vom eigenen verschieden sind
In diesem Ausdruck nehmen die Zahlen, die miteinander multipliziert werden, nicht ab. Ihr Produkt nimmt zwar ab, je mehr wir dazunehmen, weil kleiner als 1 ist, aber die Abnahmerate ist geringer. Tatsächlich braucht man k = 253, bevor diese Zahl unter fällt. Nun ist die Überraschung eher, dass diese Zahl so groß ist. Geburtstage auf dem Jupiter Wir haben 23 herausbekommen, weil es 365 Tage im Jahr gibt. Die Zahl 365 hat aber keine spezielle mathematische Relevanz: Sie taucht aus astronomischen Gründen auf. Vom Standpunkt der Mathematik aus sollten wir ein allgemeineres Problem lösen, bei dem die Zahl der Tage im Jahr beliebig groß sein kann. Beginnen wir mit dem Geburtstagsproblem für Bloons – ausgedachte Aliens, die in Jupiters Wasserstoff‑Helium‑Atmosphäre schweben, weil ihre Zellen mit Wasserstoff gefüllt sind. Jupiter ist weiter von der Sonne entfernt als die Erde, also ist sein «Jahr» – die Zeit, die der Planet braucht, um die Sonne zu umrunden – länger als unseres (das 4332,59-Fache). Außerdem dreht er sich viel schneller, sodass sein «Tag» – die Zeit für eine Umdrehung des Planeten um seine Achse – kürzer ist als unser Tag (9h 55min 30sec). Folglich hat Jupiters «Jahr» ungefähr 10477 «Jupitertage».
Auf ähnliche Weise kann man berechnen, dass immer dann, wenn 121 Bloons – drei Teams von jeweils 40 Bloons plus ein Schiedsrichter – ein «Fließball-Spiel» austragen, die Wahrscheinlichkeit, dass wenigstens zwei von ihnen denselben Geburtstag haben, etwas über liegt. Genauer wohingegen bei 120 Bloons die Wahrscheinlichkeit 0,495455 beträgt. Die Jupiter-Mathematiker waren unzufrieden, immer wieder solche Wahrscheinlichkeiten für unterschiedliche Zahlen von Jahrestagen zu berechnen, und entwickelten deshalb eine allgemeine Formel. Sie ist nicht ganz exakt, doch stellt sie eine sehr gute Näherung dar, und sie beantwortet die allgemeine Frage: Wenn man n mögliche Tage zur Wahl hat, wie viele Wesen müssen dann zusammenkommen, damit die Wahrscheinlichkeit, dass wenigstens zwei von ihnen denselben Geburtstag haben, größer ist als ? Ohne dass die Jupiteraner es ahnten, hatte eine unsichtbare Flotte von außerirdischen Invasoren vom Nachbarplaneten Nebelbrücke den Jupiter bereits länger als ein halbes Jupiterjahrhundert umrundet. Im Laufe der Jahre haben sie viele 42er‑Gruppen von Jupiter-Mathematikern entführt, weil sie hofften, ihnen ihr Geheimnis zu entreißen. Der Haken ist, dass ein 4 Nebelbrückenjahr exakt 42 = 3111696 Nebelbrückentage zählt, und niemand es bisher geschafft hat, die zu 121 korrespondierende Zahl zu errechnen.
Mit der Geheimformel vom Jupiter kann dieses Problem gelöst werden. Sie besagt, dass bei n Jahrestagen und k Personen die Wahrscheinlichkeit, dass mindestens zwei von ihnen denselben Geburtstag haben, erstmals übersteigt, wenn k nahe ist, wobei die Konstante die Quadratwurzel des Logarithmus von 4 zur Basis e ist und den Wert 1,1774 hat. Lassen Sie uns die Formel an drei Beispielen testen: Erde: n = 365 und k ≈ 22,4944 Mars: n = 670 und k ≈ 30,4765 Jupiter: n = 10477 und k ≈ 120,516 Aufgerundet zur nächsten ganzen Zahl lauten die Schwellenwerte 23, 31 und 121. Das sind tatsächlich die exakten Zahlen. Allerdings ist die Formel bei großen n nicht ganz so genau. Auf das Nebelbrückenjahr angewendet, für das n = 3111696 gilt, ergibt die Formel und aufgerundet 2077. Eine genaue Berechnung zeigt aber, dass
was etwas unterhalb liegt. Die richtige Zahl stellt sich als 2078 heraus, denn für sie ist Die Näherungsformel erklärt, warum die Zahl der für eine Geburtstagskoinzidenz nötigen Wesen so klein ist. Sie hat in etwa die Größe der Quadratwurzel aus der Zahl der Tage im Jahr. Und das ist viel kleiner als die Zahl der Tage. Zum Beispiel ist die Quadratwurzel für ein Jahr, das 1 Million Tage dauert, lediglich 1000. Erwartungswert Eine bekannte Variante des Problems lautet: Wie groß ist bei n möglichen Geburtstagen die mittlere Anzahl von Personen, die man braucht, damit wenigstens zwei denselben Geburtstag haben? Bei n = 365 ergibt sich als Antwort 23,9. Das liegt so nah bei 23, dass die beiden Probleme häufig verwechselt werden. Wiederum gibt es eine gute Näherungsformel: und die Konstante ist 1,1774. = 1,2533. Das ist etwas größer als =
Frank Mathis hat eine genauere Formel für die Zahl von Personen gefunden, die man braucht, damit eine Geburtstagskoinzidenz wahrscheinlicher ist als nicht: Srinivasa Ramanujan, ein indischer Autodidakt in Sachen Mathematik und ein Genie für Formeln, fand eine genauere Formel für die mittlere Zahl von Personen:
Geheime Botschaften Bei der Erwähnung von Codes denken viele automatisch an James Bond oder «Der Spion, der aus der Kälte kam». Doch fast jeder benutzt geheime Codes im Alltag für ganz normale und legale Aktivitäten wie zum Beispiel Internetbanking. Die Kommunikation mit der Bank ist verschlüsselt – in einen Code übersetzt –, damit Kriminelle die Botschaften nicht lesen und Zugriff auf unser Geld bekommen können. Zumindest nicht so einfach. Es gibt 26 Buchstaben im deutschen Alphabet, und in der Praxis benutzen Codes häufig die Zahl 26. Insbesondere Enigma, die Maschine, die die Deutschen im Zweiten Weltkrieg benutzten, hatte Zahnräder mit 26 Stellungen, die den Buchstaben entsprachen. Deswegen bietet sich diese Zahl als sinnvoller Einstieg in die Kryptographie an. Sie hat jedoch in diesem Zusammenhang keine speziellen mathematischen Eigenschaften, und ähnliche Prinzipien funktionieren mit anderen Zahlen.
Cäsars Geheimschrift Die Geschichte der Codes geht zumindest bis ins alte Ägypten zurück, also etwa bis 1900 v. Chr. Julius Cäsar benutzte einen einfachen Code für seine private Korrespondenz und für militärische Geheimnisse. Sein Biograph Suetonius schrieb: «Wenn er irgendetwas Vertrauliches mitteilen wollte, schrieb er es chiffriert, d.h. indem er die Reihenfolge der Buchstaben des Alphabets so abänderte, dass man kein Wort erkennen konnte. Falls irgendjemand es entziffern und den Sinn herausbekommen will, muss er den vierten Buchstaben des Alphabets, nämlich D, für A setzen und so ähnlich mit anderen Buchstaben verfahren.» Zu Cäsars Zeit enthielt das Alphabet nicht die Buchstaben J, Q und W, wir machen aber mit dem heutigen Alphabet weiter, weil es uns vertrauter ist. Cäsars Idee bestand darin, das Alphabet in seiner gewöhnlichen Reihenfolge aufzuschreiben und dann eine verschobene Version darunter zu schreiben – vielleicht etwa so: ABCDEFGHIJKLMNOPQRSTUVWXYZ FGHIJKLMNOPQRSTUVWXYZABCDE Nun kann man eine Botschaft verschlüsseln, indem man jeden Buchstaben im normalen Alphabet durch den Buchstaben an derselben Stelle im verschobenen Alphabet ersetzt. Etwa A wird F, B wird G und so weiter. Zum Beispiel so: JULIUSCAESAR
OZQNZXHFJXFW Um die Botschaft zu entschlüsseln, muss man die Entsprechung zwischen den Alphabeten in der anderen Richtung lesen: OZQNZXHFJXFW JULIUSCAESAR Um einen praktischen Apparat herzustellen, der automatisch das Alphabet verschiebt, platzieren wir die Buchstaben auf einem Kreis oder auf einem Zylinder: Abbildung 155: Praktische Geräte zum Verdrehen. Cäsars Schlüssel ist unsicher, weil er viel zu einfach ist, und die Gründe erkläre ich gleich. Doch fußt er auf einigen grundlegenden Ideen, die allen
Schlüsseln, d.h. Geheimschriften, gemeinsam ist: Klartext – die ursprüngliche Botschaft. Chiffrierter Text – deren verschlüsselte Version. Verschlüsselungsalgorithmus – die Methode, um den Klartext in chiffrierten Text zu verwandeln. Entschlüsselungsalgorithmus – die Methode, um verschlüsselten Text in Klartext zu überführen. Schlüssel – eine geheime Information, die man zum Chiffrieren und Dechiffrieren von Text braucht. In Cäsars Geheimschrift ist der Schlüssel die Anzahl von Stellen, um die man das Alphabet verschiebt. Der Verschlüsselungsalgorithmus lautet «Verschiebe das Alphabet um diesen Schlüssel». Der Entschlüsselungsalgorithmus lautet «Verschiebe das Alphabet in der umgekehrten Richtung um diesen Schlüssel», d.h. um minus Schlüssel in dieselbe Richtung.
Abbildung 156: Allgemeine Merkmale von Verschlüsselungssystemen. Bei diesem Verschlüsselungssystem sind Verschlüsselungs- und Entschlüsselungsschlüssel eng verwandt: Einer ist das Negative des anderen, d.h., dieselbe Verschiebung in entgegengesetzter Richtung. In solchen Fällen kennt man mit dem Verschlüsselungsschlüssel automatisch den Schlüssel zur Entschlüsselung. Ein solches System nennt man ein symmetrisches Kryptosystem. Cäsar benutzte wohl auch raffiniertere Geheimschriften, was auch angebracht war. Mathematische Beschreibung Man kann Cäsars Geheimschrift mathematisch mit Hilfe der modularen Arithmetik (siehe Kapitel [7]) beschreiben. In diesem Fall ist der Modulus 26 – die Zahl der Buchstaben im Alphabet. Gerechnet wird wie üblich, aber mit einer zusätzlichen Bedingung: Jedes ganzzahlige Vielfache von 26 kann
durch null ersetzt werden. Genau das ist nötig, um das verschobene Alphabet konsistent mit seinem Anfang zu verketten. Auf diese Weise werden die Buchstaben A–Z durch die Zahlen 0–25 dargestellt, wobei A = 0, B = 1, C = 2 usw. bis Z = 25 ist. Der Verschlüsselungsalgorithmus, der A (an der Stelle 0) nach F (an Position 5) verschiebt, wird mathematisch durch die Regel beschrieben. Man beachte, dass U (an Position 20) nach 20 + 5 = 25 (mod 26) wandert, was für Z steht, wohingegen V (an der Stelle 21) nach 21 + 5 = 26 = 0 (mod 26) geht, zum Buchstaben A. Damit stellt die mathematische Formel sicher, dass das Alphabet sich richtig schließt. Der Dechiffrierungsalgorithmus ist eine ähnliche Regel: Da n + 5 – 5 = n (mod 26) ist, macht die Dechiffrierung die Verschlüsselung rückgängig. Im Allgemeinen lautet für einen Schlüssel k, was «Verschiebe um k Schritte nach rechts» bedeutet, die Regel für die Verschlüsselung und die Dechiffrierung wird durch die Regel beschrieben.
Die Verschlüsselung mathematisch zu formulieren, ist deswegen gewinnbringend, weil wir nun die Chiffre präzise beschreiben und ihre Eigenschaften analysieren können, ohne auf das jeweilige Alphabet achten zu müssen. Nun geschieht alles mit Zahlen. Damit können wir auch zusätzliche Symbole in den Blick nehmen – kleine Buchstaben a, b, c …; Satzzeichen; Zahlen. Man muss nur statt 26 etwas Größeres nehmen und ein für alle Mal entscheiden, wie man die Zahlen zuordnet. Cäsars Geheimschrift entschlüsseln Cäsars Geheimschrift ist hochgradig unsicher. Wie beschrieben, gibt es nur 26 Möglichkeiten; so könnte man alle ausprobieren, bis ein entschlüsseltes Stück Text sinnvoll erscheint. Das klappt nicht für eine Abwandlung, die man Substitution nennt. Dabei wird das Alphabet durcheinandergewürfelt und nicht nur verschoben. Nun gibt es 26! Codes (siehe Kapitel [26!]), eine gewaltige Anzahl. Doch gibt es eine einfache Methode, alle derartigen Codes zu knacken. In jeder Sprache kommen einige Buchstaben häufiger vor als andere.
Abbildung 157: Häufigkeit von Buchstaben in einem typischen deutschen Text. Im Deutschen ergeben die sieben häufigsten Buchstaben hintereinander gelesen ein Wort, das wie der Name eines Aufklärungssatelliten klingt: ENIRSAT. E taucht in etwa 17,5 Prozent aller Texte auf, gefolgt von N mit 9,8 Prozent dann I mit 7,7 Prozent usw. Wenn Sie einen längeren Geheimtext abfangen und den Verdacht haben, dass er mit Hilfe eines durcheinandergewürfelten Alphabets erzeugt wurde, können Sie alle Buchstabenhäufigkeiten ausrechnen. Sie werden wahrscheinlich nicht genau das theoretische Ergebnis erhalten, denn Texte variieren. Wenn aber, sagen wir, der Buchstabe Q öfter im Geheimtext erscheint als irgendetwas sonst, kann man versuchen, E für Q einzusetzen. Falls der zweithäufigste Buchstabe M ist, schaut man, was passiert, wenn man M durch N ersetzt usw. Man kann die Reihenfolge auch ein bisschen verändern; selbst dann muss man noch viel weniger Möglichkeiten ausprobieren.
Nehmen wir zum Beispiel an, dass ein Teil des Geheimtexts folgendermaßen lautet XJMNQXJMAB und dass die sieben häufigsten Buchstaben im gesamten Geheimtext Q, U, A, V, W, J und M sind, in dieser Reihenfolge. Nun ersetzt man E für Q, A für J und T für M und lässt die übrigen Stellen frei: –AT–E–ATI– Es liegt nahe zu vermuten, dass die Botschaft eigentlich MATHEMATIK lauten sollte. Hat man noch mehr chiffrierten Text, wird man feststellen können, ob das sinnvoll ist, denn als Nächstes vermutet man, dass X für M steht, N für H und B für K. Wenn der Geheimtext an einer anderen Stelle XJFNMWGJWW lautet, dann wird man ihn versuchsweise als
MA–HTS–ASS entziffern, was vermutlich MACHTSPASS heißen soll. Dass W zweimal auftaucht, erweist sich dabei als nützliche Bestätigung. Dieses Vorgehen geht sogar von Hand ganz flott und knackt den Code schnell. Es gibt Tausende verschiedene Verschlüsselungssysteme. Die Methode, den Code zu knacken – also herauszufinden, wie man die Nachricht entschlüsselt, ohne den Algorithmus oder den Schlüssel zu kennen –, hängt vom Code ab. Es gibt ein paar praktikable Systeme, die praktisch unmöglich zu knacken sind, weil der Schlüssel sich immer wieder verändert, bevor die Kryptographen, die versuchen, den Code zu knacken, über genug Informationen verfügen. Im Zweiten Weltkrieg bewerkstelligte man das mit «Einmalschlüsseln»: Im Grunde war das eine Sammlung von komplizierten Schlüsseln in einem Notizbuch, die jeweils nur einmal benutzt und dann vernichtet wurden. Das Hauptproblem bei solchen Methoden besteht darin, dass der Spion das Notizbuch mit sich führen muss – oder heute eben ein elektronisches Gerät mit derselben Funktion – und dass man es bei ihm finden konnte. Enigma
Eines der bestbekannten Chiffriersysteme ist die deutsche EnigmaMaschine, die im Zweiten Weltkrieg benutzt wurde. Der Code wurde von Mathematikern und Elektronikingenieuren geknackt, die in Bletchley Park arbeiteten; der berühmteste unter ihnen war der Computerpionier Alan Turing. Dass sie eine funktionierende Enigma-Maschine hatten, war ihnen bei ihrer Aufgabe eine große Hilfe; die Maschine wurde ihnen 1939 von einem Team polnischer Kryptographen zur Verfügung gestellt, die bereits bedeutende Fortschritte beim Knacken des Enigma-Codes gemacht hatten. Auch andere deutsche Codes wurden geknackt, einschließlich der noch schwierigeren Lorenz-Geheimschrift, obwohl in diesem speziellen Falle keine Maschine zur Verfügung stand. Stattdessen leitete ein Team von Kryptoanalytikern unter Ralph Tester die wahrscheinliche Struktur der Maschine aus den Botschaften her, die sie ausgab. Dann hatte Bill Tutte einen Geistesblitz und machte beim Knacken des Codes einen Anfang, der nützliche Information über die Funktionsweise der Maschine lieferte. Danach ging alles sehr schnell. Die praktische Aufgabe, diesen Code zu knacken, bedurfte eines elektronischen Rechners, Colossus, der von einem Team unter Thomas Flowers entworfen und gebaut wurde. Colossus war letztendlich einer der ersten elektronischen Computer, die für eine spezielle Aufgabe entworfen wurden.
Abbildung 158: Eine Enigma.
Die Enigma bestand aus einer Tastatur zum Eingeben von Klartext und einer Reihe von drehbaren Walzen, deren jeweils 26 Stellungen den Buchstaben des Alphabets entsprachen. Frühe Maschinen hatten drei Walzen; später wurden sie auf fünf aufgestockt – sogar acht für die deutsche Marine –, von denen man jeden Tag jeweils drei neu auswählte. Der Zweck der Walzen bestand darin, die Buchstaben des Klartextes auf eine Weise zu verändern, die sich mit jedem neuen Buchstaben, der gedruckt wurde, änderte. Wie das genau ging, ist kompliziert. Siehe www.codesandciphers.org.uk/enigma/example1.htm Grob vereinfacht funktioniert der Prozess folgendermaßen: Jede Walze bringt das Alphabet wie in Cäsars Geheimschrift durcheinander, wobei die Verschiebung durch ihre Position bestimmt wird. Ein Buchstabe, der an die erste Walze kommt, wird verschoben, an die zweite weitergegeben und abermals verschoben; dann wandert das Ergebnis zur dritten Walze und wird ein drittes Mal verschoben. An diesem Punkt erreicht das Signal einen Reflektor – einen Satz von 13 Drähten, die die Buchstaben paarweise verbinden –, der den letzten Buchstaben in denjenigen verwandelt, mit dem dieser Buchstabe per Draht verbunden ist. Dann läuft das Ergebnis abermals durch die drei Walzen und ergibt schließlich den endgültigen Codebuchstaben. Der verschlüsselte Text wird dann von einem Lampenfeld abgelesen: 26 Birnen, jede hinter einem Buchstaben des Alphabets, die aufleuchten,
um den Buchstaben im Geheimtext anzuzeigen, der dem eingegebenen Klartextbuchstaben entspricht. Das einfallsreichste Merkmal der Maschine besteht darin, wie die Entsprechung zwischen Klartextbuchstabe und dem zugehörigen chiffrierten Buchstaben sich bei jedem Anschlag ändert. Mit jedem neuen Buchstaben auf der Tastatur rotieren die Walzen zur nächsten Position weiter und verändern das Alphabet damit auf unterschiedliche Weise. Die Walze ganz rechts bewegt sich bei jedem Anschlag eine Position vorwärts. Die mittlere dreht sich nur dann einen Schritt, wenn die rechte an Z vorbeikommt und auf A zurückgeht. Ebenso macht es die linke Walze in Bezug zur mittleren.
Abbildung 159: Drei Walzen in einer Reihe. Die Walzen funktionieren also ganz ähnlich wie der Kilometerzähler in einem Auto (bevor diese elektronisch wurden). Bei diesen dreht sich der «Einerring» jeweils in einem Schritt von 0 bis 9 und dann weiter zurück auf 0. Der Zehnerring macht dasselbe, doch bewegt er sich nur, wenn er ein «eins im Sinn»-Signal vom Einerring bekommt, sobald dieser sich von 9 auf 0 weiterdreht. Ganz ähnlich vergrößert sich die Hunderterstelle nur dann um eins, wenn sie ein «eins im Sinn»‑Signal von der Zehnerposition bekommt. So durchläuft die Reihe der drei Stellen die Zahlen 000 bis 999 in Einerschritten und kehrt dann wieder zu 000 zurück. Die Enigma‑Motoren hatten jedoch nicht nur zehn, sondern 26 «Stellen» – die Buchstaben A bis Z. Außerdem konnten sie bei jeder denkbaren Position starten, also an 26 × 26 × 26 = 17576 Positionen. Im tatsächlichen praktischen Gebrauch wurde dieser Startpunkt zu Beginn des Tages festgelegt und 24 Stunden lang benutzt, bevor er zurückgesetzt wurde. Ich habe den schrittweisen Prozess beschrieben, als liefe er von rechts nach links, doch tatsächlich konnte man die Maschine so einstellen, dass sie jede beliebige der sechs möglichen Stellringanordnungen realisieren konnte. Das vervielfacht die möglichen Anfangseinstellungen um 6, was 105456 Möglichkeiten ergibt. Für den militärischen Gebrauch wurde eine zusätzliche Sicherung durch ein Steckerbrett gewährleistet, das Buchstaben paarweise vertauschte, je nachdem, welcher Buchstabe per Kabel mit einem anderen verbunden war. Bis zu zehn solcher Kabel wurden benutzt, was die Anzahl der
Anfangskonfigurationen auf 150738274937250 wachsen lässt. Und auch hier wurden die Einstellungen am Steckerbrett jeden Tag geändert. Dieses System hat für den Nutzer einen bedeutenden praktischen Vorteil: Es ist symmetrisch. Man kann dieselbe Maschine auch zum Entschlüsseln von Botschaften benutzen. Die Anfangseinstellungen eines Tages müssen nur an alle Nutzer weitergegeben werden: Die Deutschen benutzten zu diesem Zweck eine Variante des Einmal-Notizbuchs. Wie der Enigma-Code geknackt wurde Andererseits birgt die Methode auch Schwächen. Die auffälligste ist folgende: Falls der Feind – in diesem Fall die Alliierten – die Einstellungen herausbekam, konnte jede Botschaft entschlüsselt werden, die an diesem Tag gesendet wurde. Es gab auch noch andere Schwächen. Insbesondere war der Code immer dann unsicher, wenn dieselben Einstellungen an zwei aufeinanderfolgenden Tagen benutzt wurden – wie es gelegentlich aus Versehen vorkam.
Abbildung 160: Das Steckerbrett mit zwei Kabelverbindungen. Indem sie diese Schwächen ausnutzten, knackte das Team in Bletchley Park den Enigma-Code zum ersten Mal im Januar 1940. Ihre Arbeit stützte sich stark auf Wissen und Ideen, die von einem polnischen KryptoanalytikerTeam unter der Leitung des Mathematikers Marian Rejewski stammten, das seit 1932 versuchte, die Enigma-Codes zu knacken. Die Polen entdeckten einen Fehler, der auf der Art und Weise beruhte, wie die täglichen Einstellungen an Benutzer weitergegeben wurden. Das reduzierte letztendlich die Anzahl der Einstellungen, die man untersuchen musste, von 10000 Billionen auf etwa 100000. Anhand einer Liste mit diesen Einstellungsmustern konnten die Polen schnell herausfinden, welche Einstellung an einem bestimmten Tag benutzt wurde. Sie erfanden eine
Maschine namens Zyklometer, die ihnen dabei half. Den Katalog vorzubereiten dauerte ungefähr ein Jahr, doch sobald er komplett war, brauchte man nur 15 Minuten, um die Einstellung des Tages abzuleiten und den Code zu knacken. Die Deutschen verbesserten ihr System 1937, und die Polen mussten von vorn anfangen. Sie entwickelten verschiedene Methoden, deren leistungsfähigste ein Gerät war, dass sie bomba kryptologiczna nannten. Jede dieser Methoden erstellte eine Analyse der 17576 möglichen Grundeinstellungen der drei Walzen inklusive der sechs möglichen Anordnungen der Walzen. Im Jahr 1939 führte Turing, kurz nachdem er in Bletchley Park angekommen war, eine britische Version der bomba ein, die als Bombe bekannt wurde. Auch ihre Funktion bestand darin, die Anfangseinstellungen der Walzen und ihre Anordnung herauszubekommen. Im Juni 1941 waren fünf Bomben in Gebrauch; am Ende des Krieges 1945 gab es 210. Als die deutsche Marine auf Maschinen mit vier Walzen wechselte, führte man modifizierte Bomben ein. Als das deutsche System verändert wurde, um seine Sicherheit zu erhöhen, fanden die Codeknacker Wege, die Verbesserungen obsolet zu machen. Etwa um 1945 konnten die Alliierten nahezu alle deutschen Botschaften entschlüsseln, das deutsche Oberkommando jedoch glaubte weiterhin, dass die gesamte Kommunikation vollkommen sicher sei. Ihre Kryptographen dagegen machten sich keine derartigen Illusionen, bezweifelten jedoch, dass irgendjemand den gewaltigen Aufwand treiben würde, der nötig wäre, um den Code zu knacken. Die Alliierten hatten einen gewaltigen Vorteil erlangt, doch sie mussten im Umgang damit sehr
vorsichtig sein, um ihre Fähigkeiten, die Botschaften zu entschlüsseln, nicht preiszugeben. Codes mit asymmetrischem Schlüssel Eine der größten Ideen in der Kryptographie ist die Möglichkeit asymmetrischer Schlüssel. Dabei sind Chiffrierschlüssel und Dechiffrierschlüssel verschieden; und zwar so stark, dass es praktisch nicht möglich ist, den Dechiffrierschlüssel aus dem Chiffrierschlüssel abzuleiten. Das mag unwahrscheinlich erscheinen, da der eine Prozess die Umkehrung des anderen darstellt, doch gibt es Methoden, die Schlüssel so einzustellen, dass «den Verschlüsselungsweg umkehren» nicht machbar ist. Ein Beispiel ist der RSA‑Code (siehe Kapitel [7]), der auf Eigenschaften von Primzahlen in der modularen Arithmetik beruht. In diesem System können Chiffrieralgorithmus, Dechiffrieralgorithmus und chiffrierter Schlüssel öffentlich gemacht werden und selbst dann ist es nicht möglich, den Dechiffrierschlüssel herauszubekommen. Nur legitimierte Empfänger können das, weil sie außerdem über einen geheimen Schlüssel verfügen, der ihnen sagt, wie man die Botschaft dechiffriert.
Die Wurst-Vermutung Es ist bewiesen, dass diejenige Anordnung von Kugeln, deren konvexe Hülle das kleinste Volumen hat, immer einer Wurst gleicht, solange es sich um 56 oder weniger Kugeln handelt, aber ab 57 Kugeln gilt das nicht mehr. Schrumpffolienverpackung Um dieses Ergebnis zu verstehen, beginnen wir mit etwas Einfacherem: Kreise verpacken. Stellen Sie sich vor, Sie wollten eine Menge identischer Kreise in der Ebene in eine Schrumpffolie packen, indem Sie sie mit einer möglichst kurzen Kurve umschließen. Technisch gesprochen nennt man diese Kurve die konvexe Hülle der Menge von Kreisen. Bei sieben Kreisen zum Beispiel könnte man es mit einer langen Wurst versuchen:
Abbildung 161: Wurstform und Umhüllung. Stellen Sie sich nun jedoch vor, Sie wollten die Gesamtfläche innerhalb der Kurve so klein wie möglich machen. Wenn alle Kreise den Radius 1 haben, ist die Fläche der Wurst gegeben durch Es gibt jedoch eine bessere Anordnung für die Kreise, nämlich ein Sechseck mit einem Kreis in der Mitte, und nun ist die Fläche gegeben durch was kleiner ist.
Abbildung 162: Die umhüllte Sechseckanordnung ergibt eine kleinere Fläche als die Wurst. Tatsächlich ist die Wurstform sogar mit nur drei Kreisen nicht die beste. Die Fläche innerhalb der Kurve ist für eine Wurst, jedoch für ein Dreieck aus Kreisen.
Abbildung 163: Wurstform und Umhüllung mit drei Kreisen. Das Dreieck hat eine kleinere Fläche. Nimmt man nun jedoch anstelle von Kreisen identische Kugeln und Schrumpffolie, die sie so umgibt, dass die Oberfläche möglichst klein ist, dann führt die lange Wurstform für sieben Kugeln zu einem kleineren Gesamtvolumen als das Sechseckarrangement. Tatsächlich ergibt die Wurstform das kleinste Volumen innerhalb der Verpackung für bis zu 56 Kugeln einschließlich. Mit 57 oder mehr Kugeln ist die minimale Anordnung jedoch rundlicher. Was in Räumen mit vier und mehr Dimensionen passiert, ist noch weniger einzusehen. Die Anordnung vierdimensionaler Kugeln, deren Umhüllung das kleinste vierdimensionale «Volumen» ergibt, ist eine Wurst, solange die Anzahl der Kugeln kleiner als 50000 ist. Bei mehr als 100000 Kugeln ist es jedoch keine Wurst mehr. Das heißt, um beim Einpacken das kleinste Volumen zu bekommen, braucht man sehr lange, dünne Kugelwürste, bis man unheimlich viele Kugeln nimmt. Niemand weiß, bei welchem Wert genau die vierdimensionalen Würste nicht mehr die besten Formen sind.
Der wirklich faszinierende Formenwechsel passiert wahrscheinlich in fünf Dimensionen. Man könnte denken, dass in fünf Dimensionen Würste die beste Lösung für, sagen wir, bis zu 50 Milliarden Kugeln sind, dass dann aber irgendetwas Runderes ein kleineres fünfdimensionales Volumen ergibt und für sechs Dimensionen dasselbe bis zu 29 Quadrillionen Kugeln gilt usw. Im Jahr 1975 jedoch formulierte Laszlo Fejes Tóth die WurstVermutung, die besagt, dass in fünf und mehr Dimensionen die Anordnung von Kugeln, deren konvexe Hülle minimales Volumen hat, immer eine Wurst ist – ganz gleich, wie groß die Zahl der Kugeln auch sein mag. Im Jahr 1998 bewiesen Ulrich Betke, Martin Henk und Jörg Wills, dass Tóth in allen Dimensionen ab 42 recht hat. Das ist alles, was wir bis heute mit Sicherheit sagen können.
Endliche Geometrie Über etliche Jahrhunderte gab es nichts als Euklids Geometrie. Man glaubte, sie sei die wahre Geometrie des Raums und hielt keine andere Geometrie für möglich. Heute glauben wir weder das eine noch das andere. Es gibt viele Arten nichteuklidischer Geometrie, die gekrümmten Flächen entsprechen. Die allgemeine Relativitätstheorie hat gezeigt, dass die reale Raumzeit in der Nähe massiver Körper, wie Sterne es sind (siehe Kapitel [11]), nicht flach, sondern gekrümmt ist. Eine weitere Art von Geometrie, die projektive Geometrie, entwickelte sich aus der Perspektive in der Kunst. Es gibt sogar Geometrien mit nur endlich vielen Punkten. Die einfachste hat sieben Punkte, sieben Strecken und 168 Symmetrien. Sie führt zu der bemerkenswerten Geschichte der endlichen einfachen Gruppen und findet ihre Krönung in der bizarren Gruppe, die man – ganz zu Recht – das Monster nennt.
Nichteuklidische Geometrie Als Menschen begannen, um die Erde zu reisen, wurde die sphärische Geometrie – die natürliche Geometrie der Kugeloberfläche – bedeutsam, weil eine Kugel ein ziemlich genaues Modell der Erde ist. Es war nicht exakt – die Erde ähnelt mehr einem Sphäroid, sie ist an den Polen abgeflacht. Doch die Kunst der Navigation war ihrerseits nicht exakt. Eine Kugel ist jedoch eine Oberfläche im euklidischen Raum, deshalb sah man die sphärische Geometrie nicht als eine neue Art von Geometrie an, sondern lediglich als Spezialfall der euklidischen. Schließlich hält auch niemand die Geometrie eines Dreiecks für eine radikale Abwendung von Euklid, auch wenn ein Dreieck genau genommen keine Ebene ist. All das änderte sich, als Mathematiker begannen, sich eine Eigenschaft der euklidischen Geometrie genauer anzuschauen: die Existenz von Parallelen. Das sind gerade Linien, die sich niemals treffen, ganz gleich, wie weit sie sich erstrecken. Euklid muss klar gewesen sein, dass Parallelen ihre Feinheiten haben, denn er war klug genug, ihre Existenz als eines der grundlegenden Axiome bei der Entwicklung seiner Geometrie zugrunde zu legen. Er muss wohl auch verstanden haben, dass das nicht selbstverständlich war. Die meisten seiner Axiome waren eingängig und intuitiv: «Je zwei rechte Winkel gleichen sich», zum Beispiel. Im Gegensatz dazu war das Parallelenaxiom geradezu geschwätzig. «Wenn eine Gerade zwei Geraden trifft und mit ihnen auf derselben Seite innere Winkel bildet, die zusammen kleiner sind als zwei rechte Winkel, dann treffen sich die beiden Geraden, wenn man sie ins Unendliche verlängert, schließlich auf der Seite, auf der
die Winkel liegen, die kleiner als zwei rechte Winkel sind.» Mathematiker fragten sich, ob eine derartige Komplexität notwendig war. Konnte man vielleicht die Existenz von Parallelen aus den übrigen euklidischen Axiomen beweisen? Zumindest schafften sie es, Euklids umständliche Formulierung durch einfachere und intuitivere Annahmen zu ersetzen. Die einfachste ist wohl Playfairs Axiom: Ist eine Gerade gegeben und ein Punkt, der nicht auf ihr liegt, dann existiert eine eindeutige Parallele zu der vorgegebenen Linie, die durch den Punkt verläuft. Es ist nach John Playfair benannt, der es 1795 in den Elements of Geometry konstatierte. Genau genommen forderte er, dass es höchstens eine Parallele gab, weil andere Axiome ausreichten, um zu beweisen, dass zumindest eine Parallele existiert. Es gab viele Versuche, das Parallelenaxiom aus den übrigen euklidischen Aktionen herzuleiten, doch sie schlugen alle fehl. Letztendlich wurde auch der Grund klar: Es geht einfach nicht. Es gibt Modelle für Geometrien, die alle euklidischen Axiome außer dem einen über Parallelen erfüllen. Würde ein Beweis des Parallelenaxioms existieren, dann wäre das Axiom auch in solch einem Modell gültig, was es jedoch nicht ist. Deswegen – kein Beweis. Tatsächlich bildet die sphärische Geometrie solch ein Modell. «Linie» wird darin neu als «Großkreis» interpretiert, ein Kreis, in dem eine Ebene durch den Mittelpunkt der Kugel die Oberfläche schneidet. Zwei beliebige Kreise schneiden sich immer, deswegen gibt es überhaupt keine Parallelen in dieser Geometrie. Dieses Gegenbeispiel blieb jedoch unbeachtet, weil sich zwei unterschiedliche Kreise in zwei Punkten treffen, die diametral gegenüberliegen. Im Gegensatz dazu verlangt Euklid, dass sich zwei
beliebige Geraden in einem Punkt treffen, außer sie sind parallel und treffen sich überhaupt nicht. Aus heutiger Sicht liegt die Antwort auf der Hand: Man muss nur «Punkt» durch «diametral gegenüberliegende Punkte» ersetzen. Das führt zur sogenannten elliptischen Geometrie. Doch für damalige Geschmäcker war das viel zu abstrakt und ließ ein Schlupfloch offen, das Playfair ausnutzte, als er solche Geometrie ausschloss. Stattdessen entwickelten Mathematiker die hyperbolische Geometrie, in der unendlich viele Parallelen zu einer vorgegebenen Geraden durch einen gegebenen Punkt verlaufen. Ein Standardmodell ist das Kreisscheibenmodell von Henrí Poincaré, das das Innere eines Kreises darstellt. Als Gerade wird jeder Kreisbogen definiert, dessen Enden unter rechten Winkeln auf den Rand treffen. Es dauerte etwa ein Jahrhundert, bis diese Ideen sich festgesetzt hatten und nicht mehr umstritten waren.
Abbildung 164: Das Poincaré’sche Scheibenmodell der hyperbolischen Ebene (schattiert). Beide grauen Geraden sind parallel zu der schwarzen und verlaufen durch denselben Punkt. Projektive Geometrie Derweil entwickelte sich eine weitere Variante der euklidischen Geometrie. Sie kam aus Kunst und Architektur, als italienische Renaissancekünstler die Perspektive entdeckten. Stellen Sie sich vor, Sie stünden auf einer flachen
euklidischen Ebene zwischen zwei Parallelen – wie jemand, der in der Mitte einer unendlich langen, absolut geraden Straße steht. Was sehen Sie? Was Sie nicht sehen, sind zwei Geraden, die sich niemals treffen. Stattdessen sehen Sie zwei Geraden, die sich am Horizont treffen. Wie kann das sein? Euklid sagt, dass sich Parallelen nicht treffen; Ihr Auge sagt Ihnen, dass sie es doch tun. In Wirklichkeit gibt es keinen logischen Widerspruch. Euklid behauptet ja nur, dass sich Parallelen nicht in einem Punkt der Ebene treffen. Der Horizont ist aber nicht Teil der Ebene. Wäre er es, dann wäre er der Rand der Ebene, aber eine Ebene hat keinen Rand. Künstler benötigen keine euklidische Ebene, sondern eine Ebene mit einem Extra: dem Horizont. Und den kann man sich als eine «Gerade im Unendlichen» denken, zusammengesetzt aus «Punkten im Unendlichen» – und zwar die, in denen sich Parallelen treffen. Abbildung 165: Parallelen treffen sich am Horizont.
Diese Beschreibung wird sinnvoller, wenn man bedenkt, was ein Maler tut. Der stellt eine Staffelei mit einer Leinwand auf und überträgt die Szene vor sich auf die Leinwand, indem er sie projiziert. Er tut das mit dem Auge oder mit Hilfe von mechanischen oder optischen Instrumenten. Mathematisch gesprochen, projiziert man einen Punkt auf die Leinwand, indem man sich eine Gerade von dem Punkt zum Auge des Künstlers denkt und dort einen Punkt auf die Leinwand malt, wo diese Gerade die Leinwand trifft. Das ist im Wesentlichen die Funktionsweise einer Kamera: Die Linse projiziert die äußere Welt auf den Film oder bei Digitalkameras einen CCD-Chip. Unser Auge projiziert ganz ähnlich eine Szene auf unsere Netzhaut. Um zu verstehen, wo der Horizont herkommt, zeichnen wir das Bild der Parallelen von der Seite (Abbildung nächste Seite). Punkte in der euklidischen Ebene (grau) werden auf Punkte unterhalb des Horizonts projiziert. Geraden vor dem Maler bilden sich auf Geraden am Ende des Horizonts ab. Der Horizont selbst ist nicht die Projektion irgendeines Punktes der Ebene. Abbildung 166: Links: Dürers Stich aus dem Jahr 1525, der die Projektion illustriert. Rechts: Wie Parallelen auf eine Leinwand projiziert werden.
Nehmen Sie an, Sie wollten einen solchen Punkt wiederfinden, indem sie ihn zurückprojizieren, wie durch die Linie mit dem Pfeil angedeutet. Der Horizont verläuft parallel zur Ebene, also trifft er sie nie. Er setzt sich ins Unendliche fort, ohne die Ebene zu treffen. Folglich entspricht nichts auf der Ebene dem Horizont. Auf der Grundlage dieser Idee kann man eine logisch konsistente Geometrie aufbauen. Man erweitert die euklidische Ebene durch eine «Linie im Unendlichen», die aus «Punkten im Unendlichen» besteht. In diesem Modell, das man projektive Geometrie nennt, gibt es keine Parallelen. Je zwei Geraden schneiden sich in genau einem Punkt. Zudem können, wie in der euklidischen Geometrie, zwei beliebige Punkte durch eine Gerade verbunden werden. Nun gibt es also eine befriedigende «Dualität»: Wenn man Punkte mit Geraden und Geraden mit Punkten austauscht, bleiben alle Axiome gültig. Die Fano-Ebene Im Gefolge dieser Idee spekulierten Mathematiker, ob es vielleicht endliche Analogien der projektiven Geometrie geben könnte, d.h. Konfigurationen aus einer endlichen Zahl von Punkten und Geraden, für die galt: Je zwei Punkte liegen auf exakt einer Geraden. Je zwei Geraden treffen sich in exakt einem Punkt. Tatsächlich gibt es solche Konfigurationen – wenn auch nicht unbedingt als Diagramme in Ebene oder Raum darstellbar. Man kann sie algebraisch
definieren, indem man spezielle Koordinatensysteme für die projektive Geometrie einführt. Statt eines Paars reeller Zahlen (x, y), wie wir sie normalerweise für die euklidische Ebene benutzen, nimmt man ein Tripel (x, y, z). Normalerweise definieren Tripel Koordinaten im dreidimensionalen euklidischen Raum, wir fordern jedoch eine zusätzliche Bedingung. Das Einzige, auf das es ankommt, sind die Verhältnisse der Koordinaten. Zum Beispiel steht (1, 2, 3) für denselben Punkt wie (2, 4, 6,) oder wie (3, 6, 9). Nun kann man (x, y, z) fast durch das Paar ( , ) ersetzen, was uns zu den zwei Koordinaten und der euklidischen Ebene zurückführt. Allerdings kann z in diesem Fall null sein. Wenn das der Fall ist, können wir uns und als «unendlich» vorstellen, wobei erfreulicherweise das Verhältnis immer noch sinnvoll ist. Damit befinden sich Koordinaten (x, y, 0) «im Unendlichen», und die Menge aller dieser Tripel bildet die Gerade im Unendlichen – den Horizont. Nur ein einziges Tripel muss man bei all diesen Überlegungen ausschließen: Wir einigen uns, dass (0, 0, 0) keinen Punkt darstellt. Wäre es so, würde es alle Punkte repräsentieren, weil (x, y, z) und (0x, 0y, 0z) dasselbe wären. Letzteres ist jedoch (0, 0, 0). Hat man sich einmal an diese sogenannten homogenen Koordinaten gewöhnt, kann man ein ähnliches Spiel in größerer Allgemeinheit spielen. Insbesondere erhalten wir endliche Konfigurationen mit den gewünschten Eigenschaften, indem wir die Koordinaten von reellen Zahlen zu ganzen Zahlen modulo p verändern, wobei p eine Primzahl ist. Nehmen wir p = 2, der einfachste Fall, sind die möglichen Koordinatenziffern 0 und 1. Es gibt
dann acht Tripel, wobei wiederum (0, 0, 0) nicht erlaubt ist, sodass sieben Punkte übrig bleiben: Die sich daraus ergebende «endliche projektive Geometrie» heißt FanoEbene nach dem italienischen Mathematiker Gino Fano, der diese Idee im Jahr 1892 veröffentlichte. Tatsächlich beschrieb er eine endliche projektive dreidimensionale Geometrie mit 15 Punkten, 35 Geraden und 15 Ebenen. Er braucht dafür vier Koordinaten mit den Ziffern 0 oder 1, mit Ausnahme von (0, 0, 0, 0). Jede Ebene hat dieselbe Geometrie wie die Fano-Ebene.
Abbildung 167: Die sieben Punkte und sieben Geraden der Fano-Ebene. Die Fano-Ebene hat sieben Geraden, von denen jede drei Punkte enthält, und sieben Punkte, die jeweils auf drei Geraden liegen. In der Zeichnung sind alle Geraden außer der Geraden BCD, die kreisförmig ist, als gerade Linien gezeichnet. Doch ist das darauf zurückzuführen, dass man versucht, ganze Zahlen modulo 2 in der üblichen Ebene darzustellen. Tatsächlich werden alle sieben Punkte symmetrisch behandelt. Die Koordinaten von je
drei Punkten, die eine Gerade bilden, addieren sich immer zu null: Zum Beispiel entspricht die untere Gerade denn 1 + 1 = 0 modulo 2. Symmetrien der Fano-Ebene Noch immer ist 168 nicht in Sicht, doch wir kommen langsam näher. Der Schlüssel ist die Symmetrie. Eine Symmetrie eines mathematischen Objekts oder Systems ist eine Art, es zu verändern, die seine Struktur erhält. Die natürlichen Symmetrien der euklidischen Geometrie sind starre Bewegungen, die weder Winkel noch Abstände verändern. Beispiele sind Translationen, die die Ebene seitwärts verschieben, Rotationen, die sie um einen festen Punkt drehen, und Spiegelungen, die sie an einer festen Geraden spiegeln. Die natürlichen Symmetrien der projektiven Geometrie sind nicht die starren Bewegungen, denn Projektionen können Formen verzerren sowie Längen und Winkel verkleinern oder vergrößern. Symmetrien sind die Projektionen selbst: Transformationen, die die Beziehungen zwischen Geraden und Punkten nicht verändern, d.h., ob ein Punkt auf einer Gerade liegt oder nicht. Symmetrien sind heute als wichtige Eigenschaften aller mathematischen Objekte anerkannt. Deswegen ist es nur natürlich, nach den Symmetrien der Fano-Ebene zu fragen.
Ich spreche nicht von starren Bewegungssymmetrien der Zeichnung. So wie ein gleichseitiges Dreieck hat sie sechs Bewegungssymmetrien. Was ich meine, sind Permutationen der sieben Punkte, sodass immer dann, wenn drei Punkte eine Gerade bilden, die permutierten Punkte das auch tun. Zum Beispiel könnten wir die untere Gerade EDF in den Kreis CDB transformieren. Bezeichnen wir das so: sodass der Strich anzeigt, wie die drei Buchstaben zu transformieren sind. Wir müssen entscheiden, was A', B', C' und G' sein sollen, sonst haben wir keine Permutation. Sie müssen von C, D und B verschieden sein. Man könnte versuchen und schauen, was daraus wird. Da ADG eine Gerade ist, muss A'D'G' auch eine Gerade sein. Doch haben wir soeben entschieden, dass A' = E und D' = D ist. Was sollte dann G' sein? Um das herauszufinden, beachte man, dass die einzige Gerade, die E und D enthält, EDF ist. Also müssen wir G' = F wählen. Indem wir weitere Geraden auf diese Weise vervollständigen, finden wir B' = G und C' = A. Meine Permutation bildet also ABCDEFG auf A'B'C'D'E'F'G' ab, und das ist EGADCBF. Es ist nicht so einfach, sich diese Transformationen vorzustellen, doch man kann sie sich algebraisch auf diese Weise herleiten. Es gibt noch mehr, wie Sie vielleicht schon vermutet haben. Tatsächlich sind es bemerkenswerte 168.
Um das zu beweisen, benutzen wir die obige, typische Methode. Man beginnt mit einem Punkt A. Wohin kann er wandern? Im Prinzip zu jedem anderen Punkt, also gibt es sieben Wahlmöglichkeiten. Nehmen wir an, er wandert nach A’. Dann schauen wir uns Punkt B an. Ihn kann man auf jede der verbliebenen sechs Positionen bewegen, ohne mit den Zusammenhangsbeziehungen in Konflikt zu geraten. Das macht 7 × 6 = 42 mögliche Symmetrien bislang. Hat man A und B auf A' und B' festgelegt, bleibt für E, den dritten Punkt auf der Geraden AB, keine Wahl mehr. Er muss sich auf den dritten Punkt von AB abbilden lassen, welcher auch immer das ist – es gibt keine weiteren Möglichkeiten. Es gibt jedoch noch vier Punkte, deren Endpositionen noch nicht entschieden sind. Nehmen wir einen von ihnen: Er kann zu jedem dieser vier Punkte wandern. Doch sobald man seine Position ausgewählt hat, ist alles durch die Geometrie festgelegt. Man kann nachprüfen, dass alle Kombinationen die Beziehungen erfüllen: Entsprechende Geraden treffen sich immer in entsprechenden Punkten. Also gibt es alles in allem 7 × 6 × 4 = 168 Symmetrien. Eine elegante Beweisführung bedient sich der linearen Algebra über dem Körper der ganzen Zahlen modulo 2. Die Transformationen, um die es geht, werden dann durch 3 × 3 invertierbare Matrizen mit den Elementen 0 oder 1 dargestellt. Die Klein-Quartik Dieselbe Gruppe taucht auch in der komplexen Analysis auf. Im Jahr 1893 bewies Adolf Hurwitz, dass eine komplexe Fläche mit g Löchern höchstens
84(g – 1) Symmetrien hat. Bei drei Löchern ist diese Zahl 168. Felix Klein konstruierte eine Fläche, bekannt als Klein-Quartik, mittels der Gleichung in komplexen homogenen Koordinaten (x, y, z). Die Symmetriegruppe dieser Fläche stellt sich als dieselbe wie die der Fano-Ebene heraus, also hat sie die maximal mögliche Anzahl Symmetrien, die von Hurwitz’ Satz vorausgesagt werden, 168. Die Fläche gehört zu einer Triangulation der hyperbolischen Ebene, bei der sich sieben Dreiecke an jedem Knotenpunkt treffen. Abbildung 168: Drei reelle Schnitte der Klein-Quartik.
Abbildung 169: Zugehörige Parkettierung der hyperbolischen Ebene, dargestellt anhand der Poincaré’schen Kreisscheibe. Einfache Gruppen und das Monster Die Symmetrien irgendeines mathematischen Systems oder Objekts bilden eine Gruppe. In der Alltagssprache meint man damit einfach eine Ansammlung oder eine Menge, doch in der Mathematik bezieht sich das Wort auf eine Ansammlung mit einer Extraeigenschaft. Je zwei Elemente
der Menge können verknüpft werden, sodass ein anderes Element der Menge herauskommt. Das ähnelt der Multiplikation: Zwei Elemente g, h der Gruppe ergeben verknüpft das Produkt gh. Allerdings können die Elemente und die Operation, die sie verknüpft, alles Mögliche sein. Es müssen lediglich ein paar hübsche Eigenschaften erfüllt sein, die durch Symmetrien begründet sind. Symmetrien sind Transformationen, und die Art und Weise, zwei Transformationen zu verknüpfen, besteht darin, zunächst die erste, dann die zweite auszuführen. Diese besondere Auffassung von «Multiplikation» gehorcht einigen einfachen algebraischen Gesetzen. Multiplikation ist assoziativ: (gh)k = g(hk). Es gibt ein Einselement 1 (auch neutrales Element –1 –1 genannt), sodass 1g = g1 = g. Jedes g hat ein inverses g , sodass gg – =g 1 g = 1. (Das Kommunikativgesetz gh = hg wird nicht verlangt, denn bei vielen Symmetrien versagt es.) Jedes mathematische System, das mit einer Verknüpfungsoperation ausgestattet ist, die diese drei Regeln erfüllt, nennt man eine Gruppe. Für Symmetrien ist das Assoziativgesetz automatisch erfüllt, weil wir Transformationen verknüpfen; das Einselement ist die Transformation «Tu gar nichts», und das Inverse einer Transformation ist «Mache sie rückgängig». Deswegen bilden Symmetrien jedes Systems oder Objekts eine Gruppe bezüglich der Verknüpfung. Insbesondere gilt das für die FanoEbene. Die Zahl der Transformationen in ihrer Symmetriegruppe (Ordnung der Gruppe genannt) ist 168. Sie erweist sich als eine sehr ungewöhnliche Gruppe. Viele Gruppen kann man in kleinere Gruppen zerlegen – etwa so, wie man Zahlen in Primzahlen faktorisiert, jedoch ist der Prozess bei Gruppen
komplizierter. Das Analoge der Primfaktoren nennt man einfache Gruppen. Dabei handelt es sich um Gruppen, die nicht mehr weiter zerlegt werden können. «Einfach» bedeutet nicht «leicht» – sondern lediglich «hat nur eine Komponente». Es gibt unendlich viele endliche Gruppen – Gruppen endlicher Ordnung, d.h. solche, die nur endlich viele Elemente haben. Wählt man zufällig eine aus, ist sie selten einfach – ganz so wie die Primzahlen verglichen mit den zusammengesetzten Zahlen selten sind. Es gibt jedoch unendlich viele einfache Gruppen, wiederum wie bei den Primzahlen. Tatsächlich stehen einige sogar zu den Primzahlen in Beziehung. Wenn n irgendeine ganze Zahl ist, dann bilden die ganzen Zahlen modulo n (siehe Kapitel [7]) eine Gruppe, falls wir ihre Elemente durch Addition verknüpfen. Diese Gruppe heißt zyklische Gruppe der Ordnung n. Sie ist genau dann einfach, wenn n prim ist. Tatsächlich sind alle einfachen Gruppen, die Primzahlordnung haben, zyklisch. Gibt es auch noch andere? Galois fand in seiner Arbeit über die Gleichungen fünfter Ordnung eine einfache Gruppe der Ordnung 60. Das ist keine Primzahl, also ist die Gruppe nicht zyklisch. Sie besteht aus allen geraden Permutationen (siehe Kapitel [2]) von fünf Objekten. Für Galois waren diese Objekte die fünf Lösungen einer Gleichung fünfter Ordnung (siehe Kapitel [5]), und die Symmetriegruppe der Gleichung bestand aus allen 120 Permutationen dieser Lösungen. Darunter befand sich seine Gruppe der Ordnung 60, und damit wusste Galois, dass es keine algebraische Formel für die Lösungen gibt, weil die Gruppe einfach ist. Die Gleichung hat die falsche Art Symmetrie, um durch eine algebraische Formel gelöst zu werden.
Die nächstgrößere nichtzyklische einfache Gruppe hat die Ordnung 168, und sie ist die Symmetriegruppe der Fano-Ebene. Zwischen 1995 und 2004 konnten so um die 100 Algebraiker alle endlichen einfachen Gruppen klassifizieren, d.h., sie alle auflisten. Der wichtige Punkt dieser monumentalen Arbeit – sie nahm mehr als 10000 Seiten in wissenschaftlichen Zeitschriften ein – besteht darin, dass jede endliche einfache Gruppe zu einer unendlichen Familie eng verwandter Gruppen gehört, und dass es 18 verschiedene Familien gibt. Eine Familie, die projektiven speziellen linearen Gruppen, beginnen mit der einfachen Gruppe der Ordnung 168. Nun gut, nicht ganz. Es gibt genau genommen 26 Ausnahmen, die sogenannten sporadischen Gruppen. Diese Kreaturen sind ein faszinierender Mischmasch – außergewöhnliche Individuen, die zuweilen lose miteinander verwandt sind. Die folgende Tabelle listet alle 26 mit Namen und Ordnung auf. Die meisten dieser Gruppen werden nach demjenigen benannt, der sie entdeckt hat, doch die größte nennt man das Monster, und zwar zu Recht, weil seine Ordnung ungefähr 8 × 10 53 beträgt. Um genau zu sein: Siehe die Tabelle für die Primzahlenfaktorisierung, die für Gruppentheoretiker nützlicher ist. Ich war schon versucht, dieser Zahl ein Kapitel zu widmen, habe mich aber schließlich entschlossen, sie bei der 168 anzusiedeln, statt den größeren Zusammenhang zu erörtern.
Das Monster wurde 1973 von Bernd Fischer und Robert Griess vermutet und 1982 von Griess konstruiert. Es ist die Symmetriegruppe einer merkwürdigen algebraischen Struktur, der Griess-Algebra. Das Monster hat bemerkenswerte Beziehungen zu einem völlig anderen Gebiet der Mathematik: den Modulformen in der komplexen Analysis. Einige zahlenmäßige Übereinstimmungen wiesen auf diese Beziehung hin und brachten John Conway und Simon Norton dazu, ihre «Mondscheinvermutung» zu formulieren, die 1992 von Richard Borcherds bewiesen wurde. Das ist zu technisch, um es hier zu erklären; es gibt Beziehungen zur Stringtheorie der Quantenphysik (siehe Kapitel [11]). Falls Sie Details wissen wollen, besuchen Sie http://en.wikipedia.org/wiki/Monstrous‑moonshine Bezeichnung Gruppe Ordnung M11 Mathieu-Gruppe 2 × 3 × 5 × 11 M12 Mathieu-Gruppe 2 × 3 × 5 × 11 M22 Mathieu-Gruppe 2 × 3 × 5 × 7 × 11 M23 Mathieu-Gruppe 2 × 3 × 5 × 7 × 11 × 23 M24 Mathieu-Gruppe 2 J1 Janko-Gruppe 2 × 3 × 5 × 7 × 11 × 19 J2 Janko-Gruppe 2 ×3 ×5 ×7 J3 Janko-Gruppe 2 × 3 × 5 × 17 × 19 J4 Janko-Gruppe 2 4 2 6 3 7 2 7 2 10 3 × 3 × 5 × 7 × 11 × 23 3 7 3 7 5 21 2 3 3 × 3 × 5 × 7 × 11 × 23 × 29 × 31 × 37 × 43 Co1 Conway-Gruppe 21 2 9 4 6 3 × 23 18 2 × 3 × 5 × 7 × 11 × 13
18 Co2 Conway-Gruppe 2 Co3 Conway-Gruppe 2 Fi22 Fischer-Gruppe 2 Fi23 Fischer-Gruppe 2 10 17 18 6 3 7 3 9 2 × 3 × 5 × 7 × 11 × 23 × 3 × 5 × 7 × 11 × 23 × 3 × 5 × 7 × 11 × 13 13 ×3 2 × 5 × 7 × 11 × 13 × 17 × 23 Fi24 Fischer-Gruppe 21 2 16 ×3 2 3 × 5 × 7 × 11 × 13 × 17 × 23 × 29 9 2 3 7 6 3 Hs Higman-Sims-Gruppe 2 × 3 × 5 × 7 × 11 McL McLaughlin-Gruppe 2 × 3 × 5 × 7 × 11 He Held-Gruppe 2 Ru Rudvalis-Gruppe 2 Suz Suzuki-Gruppe 2 O’N O’Nan-Gruppe 2 × 3 × 5 × 7 × 11 × 19 × 10 14 13 3 2 3 3 7 2 3 × 3 × 5 × 7 × 17 × 3 × 5 × 7 × 13 × 29 × 3 × 5 × 7 × 11 × 13 9 4 3 31 14 6 6 HN Harada-Norton-Gruppe 2 × 3 × 5 × 7 × 11 × 19 Ly Lysons-Gruppe 2 × 3 × 5 × 7 × 11 × 31 × 8 7 6 37 × 67 Th Thompson-Gruppe 15 2 10 ×3 3 2 6 2 × 5 × 7 × 13 × 19 × 31 B Babymonster 41 2 13 ×3 × 5 × 7 × 11 × 13 × 17 × 19 × 23 × 31 × 47 M Monster 46 2 3 20 ×3 9 6 2 × 5 × 7 × 11 × 13 × 17 × 19 × 23 × 29 × 31 × 41 × 47 × 59 × 71 Tabelle 14: Die 26 sporadischen Gruppen.
GROSSE ZAHLEN Die Reihe der ganzen Zahlen geht immer weiter. Es gibt keine größte Zahl, weil man jede Zahl noch größer machen kann, indem man 1 hinzuaddiert. Infolgedessen sind die meisten ganzen Zahlen zum Aufschreiben zu groß, ganz gleich, welches System man benutzt. Natürlich kann man immer mogeln und ein Symbol wie für irgendeine große Zahl benutzen, die gerade interessiert. Aber das ist kein System, nur ein Ex-und-Hopp-Zeichen. Zum Glück braucht man die richtig großen Zahlen nur selten. Dennoch üben sie eine besondere Faszination aus. Und ganz gelegentlich wird eine von ihnen auch nützlich in der Mathematik.
Fakultäten Die Anzahl der Möglichkeiten, die Buchstaben des Alphabets anzuordnen. Dinge umordnen Auf wie viele Weisen kann man eine Liste umordnen? Falls die Liste zwei Einträge hat, nennen wir sie A und B, gibt es zwei Möglichkeiten: AB BA Hat die Liste drei Buchstaben A, B und C, gibt es sechs Möglichkeiten: ABC ACB BAC BCA CAB CBA Aber wie sieht es bei vier Buchstaben A, B, C und D aus?
Man kann alle Möglichkeiten systematisch aufschreiben und erhält als Ergebnis 24. Es gibt eine gute Möglichkeit, das einzusehen. Man überlege sich, wo D auftauchen kann. Es muss entweder an der ersten, der zweiten, dritten oder vierten Stelle stehen. Dann denkt man sich D weg, ganz gleich wo es steht. Dann bleibt eine Liste, in der nur A, B und C vorkommen. Das muss eine der sechs Möglichkeiten sein. Und alle sechs können vorkommen: Man fügt nun D an der richtigen Stelle ein. Also kann man alle Möglichkeiten für vier Buchstaben in Form von vier Listen mit jeweils sechs Anordnungen wie folgt aufschreiben: D an erster Stelle: DABC DACB DBAC DBCA DCAB DCBA BDAC BDCA CDAB CDBA BADC BCDA CADB CBDA D an zweiter Stelle: ADBC ADCB D an dritter Stelle: ABDC ACDB D an vierter Stelle:
ABCD ACBD BACD BCAD CABD CBAD Alle Anordnungen sind verschieden, entweder weil sie D an einer anderen Stelle haben, oder weil D an derselben Stelle in unterschiedlichen Anordnungen von ABC steht. Überdies kommt jede Anordnung von ABCD auch vor: Die Stellung von D verrät, in welcher der sechs Listen man suchen muss. Und welche Ordnung von ABC aufzusuchen ist, zeigt sich, wenn man D weglässt. Da man vier Gruppen Anordnungen hat, von denen jede sechs enthält, ist die Gesamtzahl der Anordnungen 4 × 6 = 24. Wir hätten auch schon die sechs Anordnungen von ABC auf ähnliche Weise bestimmen können: In diesem Fall sucht man C auf und entfernt es: CAB CBA ACB BCA ABC BAC Man kann das sogar mit nur zwei Buchstaben durchführen: BA AB Diese Art, die Anordnungen zu sortieren, legt ein gemeinsames Muster nahe: Die Anzahl der Anordnungen ist bei
Auf wie viele Arten kann man also 5 Buchstaben anordnen? Das Muster legt die Antwort nahe. Tatsächlich kann man das bestätigen, indem man sich wieder die fünf verschiedenen Positionen von E vergegenwärtigt, jede mit 24 Anordnungen von ABCD, wenn man E weglässt. Die gesuchte Zahl muss demnach 5 × 24, also 5 × 4 × 3 × 2 ×1 sein. Mit derselben Überlegung kommt man darauf, dass die Anzahl der verschiedenen Anordnungen von n Buchstaben durch ist. Man nennt diesen Ausdruck «n Fakultät» und kürzt ihn mit n! ab. Man nehme alle Zahlen von 1 bis n und multipliziere sie miteinander. Die ersten Fakultäten lauten Offensichtlich werden die Zahlen rapide größer, schneller und immer schneller. Die Anzahl der möglichen Anordnungen der 26 Buchstaben des Alphabets ist also
Ein Kartendeck mit 52 Spielkarten kann man auf so viele Arten anordnen: Die Gamma-Funktion Man kann der Gleichung einen Sinn geben. Dazu muss man die Gamma-Funktion einführen, die die Definition der Fakultäten auf beliebige komplexe Zahlen erweitert, aber ihre wesentlichen Merkmale erhält. Gewöhnlich definiert man sie durch ein Integral: Die Beziehung zu den Fakultäten besteht darin, dass für natürliche Zahlen n gilt:
Mit Hilfe der sogenannten analytischen Fortsetzung kann man Γ(z) für alle komplexen Zahlen definieren. Abbildung 170: Der Graph von Γ(x) für reelle x. Die Gamma-Funktion Γ(z) ist für negative ganzzahlige z unendlich, hat aber für alle übrigen komplexen Zahlen endliche Werte. Sie hat wichtige Anwendungen in der Statistik. Eine ihrer Schlüsseleigenschaften definiert die Fakultäten:
Damit ist Γ(z) = (z–1)!, aber leider nicht z!. Um das loszuwerden, schlug Gauß vor, eine Pi-Funktion mittels Γ(z) = Γ(z+1) einzuführen, die dann für z = n mit n! übereinstimmt. Die Verwendung der Gamma-Funktion ist jedoch heute gebräuchlicher. Die Verdopplungsformel für die Gamma-Funktion lautet Setzt man darin z = , erhält man Also In diesem Sinn ist gültig.
Der Rubik-Würfel Im Jahr 1974 erfand der ungarische Professor Ernő Rubik ein Geduldsspiel, das aus beweglichen Würfeln besteht. Man kennt es als Rubik-Würfel oder Zauberwürfel, und mittlerweile sind mehr als 350 Millionen dieser Spielzeuge weltweit verkauft worden. Ich erinnere mich gut, wie die Mathematics Society der Universität Warwick (eine Studentenvereinigung, die sich der Mathematik verschrieben hat) diese Würfel kistenweise aus Ungarn importierte, bis der Hype so verbreitet war, dass kommerzielle Unternehmen den Vertrieb übernahmen. Die gewaltige Zahl sagt uns, wie viele unterschiedliche Anordnungen es für einen Rubik-Würfel gibt. Geometrie des Rubik-Würfels Das Puzzle besteht aus einem Würfel, der in 27 kleinere Würfel von jeweils einem Drittel der Kantenlänge unterteilt ist. Liebhaber nennen sie «cubies». Jede Seitenfläche des Würfels hat eine bestimmte Farbe. Rubiks clevere Idee bestand darin, sich einen Mechanismus auszudenken, mit dem man
jede Seite des Würfels verdrehen kann. Wiederholte Drehungen vermischen die Farben auf den cubies. Die Aufgabe besteht darin, die cubies in ihre ursprüngliche Position zurückzubringen, sodass jede Seitenfläche des großen Würfels wieder eine einheitliche Farbe hat. Abbildung 171: Der Rubik-Würfel. Den cubie im Zentrum kann man nicht sehen, und tatsächlich ist er durch den schlauen Mechanismus von Rubik ersetzt. Die cubies im Zentrum der
Flächen drehen sich, aber sie wandern nicht auf eine neue Fläche, ihre Farbe ändert sich nicht. Von nun an werden wir also voraussetzen, dass diese sechs Mittelsteine sich, von Drehungen abgesehen, nicht bewegen. Das bedeutet, wenn man den ganzen Rubik-Würfel in eine unterschiedliche Orientierung bringt, ohne tatsächlich irgendwelche Oberflächen zu verdrehen, dann hat das keinen bedeutsamen Effekt. Es gibt zwei Sorten cubies, die sich bewegen können: 8 Ecken und 12 Kanten, die jeweils zwischen zwei Ecken sitzen. Wenn man die Farben auf diesen Kanten und Ecken auf alle möglichen Arten verändert – zum Beispiel, indem man die farbigen Aufkleber entfernt und sie in unterschiedlicher Anordnung wieder aufbringt – ist die Zahl der möglichen Anordnungen gegeben durch Allerdings ist das bei Rubiks Würfel ja gar nicht erlaubt: Das Einzige, was man machen kann, ist, die Flächen des Würfels zu verdrehen. Somit erhebt sich die Frage: Welche dieser Anordnungen kann man durch eine Abfolge von Drehungen erreichen? Im Prinzip könnte das nur ein winziger Bruchteil sein, doch Mathematiker konnten zeigen, dass man exakt ein Zwölftel der obigen Anordnungen durch eine Abfolge erlaubter Bewegungen erhalten kann, was ich weiter unten nachweise. Damit ergibt sich die Zahl der erlaubten Anordnungen der Farben auf dem Rubik-Würfel als Könnte jeder der 7 Milliarden Menschen in jeder Sekunde jeweils eine dieser Anordnungen herstellen, würde es ungefähr 200 Jahre dauern, bis
man sie alle durchhätte. Wie man diese Zahlen berechnet Die acht Ecken kann man auf 8! Arten arrangieren. Erinnern Sie sich, dass Diese Zahl taucht auf, weil es 8 Möglichkeiten für die erste Ecke gibt, die wiederum mit jeder der 7 übrigen Möglichkeiten für die zweite Ecke und die wiederum mit jeder der 6 verbleibenden Möglichkeiten für die dritte kombiniert werden können, usw. (siehe Kapitel [26!]). Jede Ecke kann man 8 in drei verschiedene Richtungen drehen. Also gibt es 3 Möglichkeiten, 8 diese Richtungen auszuwählen. Alles in allem gibt es also 3 × 8! Arten, die Ecken anzuordnen. Ganz ähnlich kann man sich überlegen, dass auch die zwölf Kanten auf 12! Arten angeordnet werden können, wobei Jede Kante hat zwei Orientierungsmöglichkeiten, diese kann man also auf 12 12 2 Arten wählen. Alles in allem gibt es 2 × 12! Arten, die Kanten anzuordnen. Die Anzahl der Möglichkeiten, diese Anordnungen miteinander zu 8 kombinieren, erhält man durch Multiplikation der beiden Zahlen, was 3 × 12 8! × 2 × 12! ergibt. Und das wiederum ist 519024039293878272000. Wie schon gesagt, können die meisten Anordnungen nicht durch eine Abfolge von Verdrehungen des Würfels erreicht werden. Jede Rotation
beeinflusst verschiedene cubies zugleich. Und dabei können sich bestimmte Merkmale der Gesamtmenge von cubies nicht ändern. Solche Merkmale nennt man Invarianten. In diesem Fall gibt es ihrer drei: Parität der cubies. Es gibt zwei Sorten Permutationen, gerade und ungerade (siehe Kapitel [2]). Eine gerade Permutation verändert die Reihenfolge einer geraden Zahl von Objektpaaren. Falls man zwei gerade Permutationen kombiniert, indem man sie hintereinander ausführt, ist die entstehende Permutation ebenfalls gerade. Nun ist aber jede Drehung des Rubik-Würfels eine gerade Permutation der cubies. Deshalb ist auch jede Kombination von Verdrehungen eine gerade Permutation. Diese Einschränkung halbiert die Anzahl der möglichen Anordnungen. Parität der Ecken. Jede Drehung ist auch eine gerade Permutation der Eckflächen, also gilt das auch für eine Folge von Drehungen. Diese Einschränkung halbiert ebenfalls die Anzahl möglicher Anordnungen. Trialität an den Ecken. Man nummeriere die 24 Oberflächen der Ecken mit den Zahlen 0, 1, 2, so, dass die Zahlen sich im Uhrzeigersinn in der Reihenfolge 0, 1, 2 an jeder Ecke wiederfinden. Man mache das so, dass die Zahlen an zwei gegenüberliegenden Flächen mit 0 bezeichnet sind, wie in der Abbildung rechts. Die Summe all dieser Zahlen modulo 3 genommen – d.h., dass man nur den Rest beim Teilen durch 3 nimmt – bleibt bei jeder Drehung des Würfels unverändert. Diese Einschränkung reduziert die Anzahl der möglichen Anordnungen auf ein Drittel. Wenn man alle drei Bedingungen in Betracht zieht, muss die Anzahl der möglichen Anordnungen durch 2 × 2 × 3 = 12 geteilt werden. D.h., die Anzahl der Anordnungen, die durch eine Abfolge von Verdrehungen erzeugt werden kann, ist gegeben durch
Abbildung 172: Invarianten der Rubik-Gruppe. Links: Auswirkung einer Vierteldrehung im Uhrzeigersinn auf die cubies. Rechts: Bezeichnung der Ecken. Die mathematischen Techniken, die man bei der Analyse des RubikWürfels braucht, führen auch zu systematischen Lösungsmöglichkeiten. Diese Methoden sind jedoch zu kompliziert, um sie hier zu beschreiben.
Und sie zu verstehen, ist ein langwieriges und gelegentlich arg technisches Unterfangen. Gottes Zahl Man definiere eine Bewegung als Drehung einer einzelnen Oberfläche um beliebig viele rechte Winkel. Die kleinste Anzahl von Bewegungen, die die Aufgabe unabhängig von der Ausgangsposition lösen, nennt man Gottes Zahl – wahrscheinlich, weil die Antwort herauszubekommen weit jenseits der Möglichkeiten von Sterblichen liegen sollte. Das stellte sich jedoch als zu pessimistisch heraus. Im Jahr 2010 wandten Thomas Rokicki, Herbert Kociemba, Morley Davidson und John Dethridge einige clevere Mathematik sowie die rohe Kraft eines Computers an und zeigten, dass man den Zauberwürfel aus jeder denkbaren Stellung immer in höchstens 20 Bewegungen lösen kann. Gottes Zahl beträgt also 20. Die Rechnung lief zeitgleich auf einer großen Zahl von Computern und hätte mit einem einzelnen Computer 350 Jahre gedauert.
Sudoku Sudokus überschwemmten 2005 die Welt, doch ihre Vorgänger reichen viel weiter zurück. Man spielt auf einem Quadratgitter, das in neun 3 × 3Unterquadrate unterteilt ist. In jeder Reihe, jeder Spalte und jedem Unterquadrat müssen alle Ziffern von 1–9 vorkommen. Einige Ziffern werden durch das Rätsel vorgegeben. Oben steht die Zahl der unterschiedlichen Sudokugitter. Sie werden uns also nicht ausgehen. Abbildung 173: Links: ein Sudoku-Rätsel. Rechts: seine Lösung.
Von lateinischen Quadraten zum Sudoku Häufig wird die Geschichte des Sudoku auf Eulers Arbeit über lateinische Quadrate zurückgeführt (siehe Kapitel [10]). Ein vollständiges Sudokugitter ist ein spezielles lateinisches Quadrat: Die 3 × 3 Unterquadrate führen zu zusätzlichen Bedingungen. Ein ähnliches Rätsel erschien 1892, als die französische Zeitung Le Siècle ihre Leser aufforderte, ein magisches Quadrat zu vervollständigen, in dem einige Zahlen fehlten. Bald darauf benutzte La France magische Quadrate, die nur die Ziffern 1–9 enthielten. In den Lösungen enthielten auch die 3 × 3 Unterquadrate alle neun Ziffern, jedoch war das nicht explizit gefordert. Die moderne Form des Sudoku ist wahrscheinlich Howard Garns zuzuschreiben, der vermutlich eine Reihe von Rätseln erfunden hat, die 1979 von Dell Magazines unter der Rubrik «Zahlenecke» veröffentlicht wurden. Im Jahr 1986 veröffentlichte Nicoli, ein japanisches Unternehmen, Sudokurätsel in Japan. Zunächst lautete der Name sūji wa dokushin ni kagiru («jede Ziffer darf nur einmal vorkommen»), doch wurden die Rätsel schnell als sū doku bekannt. The Times begann 2004 mit der Veröffentlichung von Sudokurätseln in Großbritannien, und 2005 wurden sie weltweit der letzte Schrei. Die große Zahl die dieses Kapitel ziert, ist die Anzahl unterschiedlicher Sudokugitter. Die Zahl aller 9 × 9 lateinischen Quadrate ist noch einmal ungefähr eine Million Mal größer:
Die Anzahl von Sudokugittern wurde 2003 in der USENET Newsgruppe rec.puzzle ohne Beweis gepostet. Im Jahr 2005 klärten Bertram Felgenhauer und Frazer Jarvis mit Hilfe eines Computers die Details, wobei sie sich auf einige wenige plausible, aber unbewiesene Voraussetzungen stützten. Für die Methode muss man die Symmetrie von Sudokus verstehen. Jedes einzelne vervollständigte Gitter hat seine eigene Symmetriegruppe, die aus denjenigen Transformationen besteht (Vertauschen von Reihen und Spalten, Umbenennung der Ziffern), die das Gitter unverändert lassen. Die Schlüsselstruktur ist jedoch die Symmetriegruppe der Menge aller möglichen Gitter: die Möglichkeiten, irgendein Gitter in ein anderes zu überführen (möglicherweise dasselbe Gitter, jedoch nicht notwendigerweise). Die Symmetrietransformationen, um die es geht, sind von unterschiedlicher Art. Die offensichtlichsten sind die 9! Permutationen der neun Ziffern. Indem man systematisch die Ziffern eines Sudokugitters vertauscht, erzeugt man scheinbar ein anderes Sudokugitter. Man kann jedoch auch Reihen vertauschen, solange man die Dreierblockstruktur erhält. Dasselbe kann man mit den Spalten tun. Man kann auch ein gegebenes Gitter an seiner Hauptdiagonalen spiegeln. Die 4 4 Symmetriegruppe hat die Ordnung 2 × 6 × 6 = 3359232. Beim Abzählen der möglichen Gitter müssen diese Symmetrien mit in Betracht gezogen werden. Der Beweis ist kompliziert, daher die Benutzung von Computern. Die Lücken im ursprünglichen Beweis sind seitdem geschlossen worden. Details und weitere Informationen kann man
http://en.wikipedia.org/wiki/Mathematics_of_Sudoku entnehmen. Da symmetrische Varianten eines gegebenen Gitters im Wesentlichen dasselbe Gitter in Verkleidung ergeben, können wir auch fragen: Wie viele verschiedene Gitter gibt es, falls man symmetrische als äquivalent betrachtet? Im Jahr 2006 berechneten Jarvis und Ed Russell diese Zahl als Das ist nicht die Gesamtzahl dividiert durch 3359232, weil einige Gitter ganz eigene Symmetrien haben. Wie beim Rubik-Würfel eröffnen die mathematischen Techniken, die man zur Analyse von Sudoku benutzt, auch systematische Lösungswege für Sudokurätsel. Diese Methoden sind jedoch zu kompliziert, um sie hier zu beschreiben, und können unter dem Stichwort systematischer Versuch und Irrtum zusammengefasst werden.
Die größte bekannte Primzahl Wie lautet die größte Primzahl? Schon um 300 v. Chr. bewies Euklid, dass es diese Zahl nicht gibt. «Primzahlen sind häufiger als jede zugeordnete Vielheit.» D.h., es gibt unendlich viele Primzahlen. Computer können die Liste der Primzahlen beträchtlich verlängern; wenn sie nicht weiterkommen, ist das hauptsächlich auf Mangel an Speicherplatz oder die lächerlich langen Ausdrucke zurückzuführen. Oben steht der gegenwärtige Rekordhalter. Mersenne-Zahlen Um die Suche nach der größten bekannten Primzahl ist eine kleine Industrie entstanden. Die Suche ist hauptsächlich als Übung im Rekordbrechen interessant und um neue Computer zu testen. Im April 2014 hieß die größte 57885161 bekannte Primzahl 2 – 1, eine riesige Zahl, die 17425170 Dezimalstellen hat. Zahlen der Gestalt
nennt man Mersenne-Zahlen nach dem französischen Mönch Marin Mersenne. Falls Sie darauf aus sein sollten, den Rekord für große Primzahlen zu brechen, sollten Sie sich an Mersenne-Zahlen halten, weil diese bestimmte Eigenschaften haben, die es selbst dann zu entscheiden erlauben, ob sie prim sind, wenn sie für allgemeinere Methoden viel zu groß werden. 11 Mit einfacher Algebra lässt sich beweisen, dass n prim ist, wenn 2 – 1 prim ist. Ursprünglich dachten Mathematiker, dass auch das Umgekehrte gilt: Mn ist immer dann prim, wenn n prim ist. Hudalricus Regius stellte jedoch 1536 fest, dass Mn = 2047 nicht prim ist, obwohl 11 eine Primzahl ist. Tatsächlich gilt Pietro Cataldi zeigte, dass M17 und M19 prim sind, was für heutige Computer eine leichte Aufgabe ist, damals jedoch mussten alle Rechnungen per Hand gemacht werden. Er behauptete auch, dass Mn prim sei, wenn n = 23, 29, 31 und 37 ist. Allerdings sind diese drei Mersenne-Zahlen alle zusammengesetzt. Fermat entdeckte 1640 die Faktoren von M23 und M37, und Euler fand die Faktoren von M29 1738. Später bewies Euler, dass Cataldi mit M31 recht hatte.
Im Jahr 1644 konstatierte Mersenne im Vorwort seines Buches Cogitata physico-mathematica, dass Mn für n = 2, 3, 5, 7, 13, 17, 19, 31, 67, 127 und 257 prim ist. Diese Liste beschäftigte Mathematiker über 200 Jahre lang. Wie konnte er Aussagen über derart große Zahlen machen? Schließlich wurde klar: Er hatte lediglich gut geraten. Seine Liste enthält einige Fehler. Im Jahr 1876 bewies Lucas, dass Mersenne mit recht gehabt hatte, indem er einen selbst entwickelten genialen Primzahltest für Mn verwendete. Derrick Lehmer erfand eine kleine Verbesserung für Lucas’ Test im Jahr 1930. Man definiere eine Zahlenfolge Sn durch S2 = 4, 2 S3 = 14, S4 = 194, …, wobei Sn+1 = S n–2. Der Lucas‑Lehmer‑Test stellt sicher, dass Mp genau dann prim ist, wenn Mp Teiler von Sp ist. Dieser Test stellt heute das Mittel zum Testen von Mersenne-Zahlen auf Primalität dar. Allmählich sickerte es durch, dass Mersenne in einigen Fällen falsch lag: Zwei Zahlen aus seiner Liste sind zusammengesetzt (n = 67 und 257), und er ließ n = 61, 89 und 107 aus, die auf Primzahlen führen. Zieht man die Schwierigkeit von händischen Rechnungen in Betracht, war seine Arbeit doch ziemlich ordentlich. Im Jahr 1883 bewies Ivan Mikheevich Pervushin, dass M61 prim ist, einer der Fälle, die Mersenne ausgelassen hatte. R.E. Powers zeigte daraufhin, dass Mersenne auch M89 und M107 übersehen hatte, die beide prim sind. Bis 1947 waren die Mn für n von 2 bis 257 überprüft. In diesem Bereich treten Mersenne-Primzahlen bei n = 2, 3, 5, 7, 13, 17, 19, 31, 61, 89, 107 und 127 auf. Die aktuelle Liste von Mersenne‑Primzahlen lautet:
n Jahr Entdecker 2 — Antike 3 — Antike 5 — Antike 7 — Antike 13 1456 unbekannt 17 1588 Cataldi 19 1588 Cataldi 31 1772 Euler 61 1883 Pervushin 89 1911 Powers 107 1914 Powers 127 1876 Lucas 521 1952 Robinson 607 1952 Robinson 1279 1952 Robinson 2203 1952 Robinson 2281 1952 Robinson 3217 1957 Riesel 4253 1961 Hurwitz 4423 1961 Hurwitz 9689 1963 Gillies 9941 1963 Gillies 11 213 1963 Gillies 19 937 1971 Tuckerman 21 701 1978 Noll & Nickel 23 209 1979 Noll 44 497 1979 Nelson & Slowinski
86 243 1982 Slowinski 110 503 1988 Colquitt & Welsh 132 049 1983 Slowinski 216 091 1985 Slowinski 756 839 1992 Slowinski, Gage et al. 859 433 1994 Slowinski & Gage 1 257 787 1996 Slowinski & Gage 1 398 269 1996 Armengaud, Woltman et al. 2 976 221 1997 Spence, Woltman et al. 3 021 377 1998 Clarkson, Woltman, Kurowski et al. 6 972 593 1999 Hajratwala, Woltman, Kurowski et al. 13 466 917 2001 Cameron, Woltman, Kurowski et al. 20 996 011 2003 Shafer, Woltman, Kurowski et al. 24 036 583 2004 Findley, Woltman, Kurowski et al. 25 964 951 2005 Nowak, Woltman, Kurowski et al. 30 402 457 2005 Cooper, Boone, Woltman, Kurowski et al. 32 582 657 2006 Cooper, Boone, Woltman, Kurowski et al. 37 156 667 2008 Elvenich, Woltman, Kurowski et al. 42 643 801 2009 Strindmo, Woltman, Kurowski et al. 43 112 609 2008 Smith, Woltman, Kurowski et al.
57 885 161 2013 Cooper, Woltman, Kurowski et al. Tabelle 15 Die Suche nach richtig großen Primzahlen hat sich aus unterschiedlichen Gründen hauptsächlich auf Mersenne-Zahlen konzentriert. In der n Binärschreibweise der Computer wird 2 durch eine 1, gefolgt von einer Reihe von n Nullen dargestellt, und Mn ist eine Reihe von n Einsen. Das macht einige Berechnungen schneller. Zudem ist der Lucas‑Lehmer‑Test weitaus effizienter als allgemeine Methoden zum Testen auf Primalität, deswegen ist er für große Zahlen viel praktischer. Dieser Test führt auf die 48 Mersenne-Primzahlen der Tabelle. Neueste Entwicklungen und weitere Informationen findet man auf http://primes.utm.edu/mersenne/
UNENDLICHE ZAHLEN Wie schon gesagt, lassen Mathematiker nie von etwas ab, nur weil es unmöglich ist. Wenn es interessant genug ist, finden sie Wege, es möglich zu machen. Es gibt keine größte ganze Zahl. Sie gehen immer weiter. Jeder wusste das. Doch als Georg Cantor sich entschloss, die Frage zu stellen, wie groß dieses ganz eigene Konzept von «für immer weiter» genau war, fand er eine neue Methode, unendlich großen Zahlen einen Sinn zu geben. Eine Konsequenz ist, dass einige Unendlichkeiten größer sind als andere. Viele seiner Zeitgenossen hielten ihn für verrückt. Doch Cantors Wahnsinn hatte Methode, und seine transfiniten Zahlen erwiesen sich als sinnvoll und wichtig. Man musste sich nur an sie gewöhnen.
Was nicht einfach war.
Aleph-null: Die kleinste Unendlichkeit Mathematiker machen freizügig und ausgiebig Gebrauch von dem Wort «Unendlichkeit». Salopp gesprochen ist etwas unendlich, wenn man mit gewöhnlichen ganzen Zahlen nicht zählen kann, wie groß es ist, oder seine Größe in reellen Zahlen nicht angeben kann. Wenn es keine konventionellen Zahlen mehr gibt, benutzen wir «Unendlich» als Platzhalter. Unendlich ist keine Zahl im gewöhnlichen Sinne. Sie wäre gewissermaßen die größtmögliche Zahl, wenn eine solche Ausdrucksweise logisch sinnvoll wäre. Doch außer man ist sehr, sehr sorgfältig in Bezug auf das, was man meint, ist das nicht logisch. Cantor fand einen Weg, Unendlich zu einer echten Zahl zu machen, indem er unendliche Mengen abzählte. Indem man seine Idee auf die Menge aller ganzen Zahlen ausdehnt, stößt man auf eine unendliche Zahl, die er (Aleph-null) nannte. Sie ist größer als jede ganze Zahl. Also ist sie unendlich, richtig? Nun ja, gewissermaßen. Sie ist eine Unendlichkeit,
das mit Sicherheit. Eigentlich die kleinste Unendlichkeit. Aber es gibt andere, und die sind noch größer. Unendlichkeit Wenn Kinder zählen lernen und sich mit großen Zahlen wie 1000 oder 1 Million angefreundet haben, fragen sie oft, was die allergrößte Zahl ist. Vielleicht, so meinen sie, ist es Doch dann wird ihnen klar, dass sie eine größere Zahl machen können, indem sie noch eine Null anhängen – oder einfach 1 addieren und so erhalten. Keine spezielle ganze Zahl kann die größte sein, weil die Addition von 1 jede Zahl größer macht. Die ganzen Zahlen gehen immer weiter. Wenn man anfängt zu zählen und immer weitermacht, erreicht man keine größtmögliche Zahl, weil es so etwas nicht gibt. Es gibt unendlich viele Zahlen. Über Hunderte von Jahren waren die Mathematiker sehr vorsichtig mit dem Unendlichen. Als Euklid bewies, dass es unendlich viele Primzahlen gibt, drückte er das keineswegs so aus. Er sagte nur: «Primzahlen sind häufiger als jede zugeordnete Vielheit». Das heißt, es gibt keine größte Primzahl.
Wirft man die Vorsicht über Bord, so ist das Naheliegende, historischen Vorläufern zu folgen und eine neue Art von Zahl einzuführen, die größer ist als irgend eine ganze Zahl. Man nenne sie Unendlich und führe ein Zeichen für sie ein. Gewöhnlich ist das ∞, eine Art liegende Acht. Doch Unendlich macht Ärger, weil diese Zahl sich gelegentlich paradox verhält. Sicher ist ∞ doch die größtmögliche Zahl? Nun, sie ist zwar per Definition größer als jede ganze Zahl, doch werden die Dinge weniger einfach, wenn man mit der neuen Zahl rechnen will. Offensichtlich gibt es folgendes Problem: Was ist ∞ + 1? Ist es größer als ∞, dann ist ∞ nicht die größtmögliche Zahl. Ist es dasselbe wie ∞, dann gilt ∞ + 1 = ∞. Zieht man auf beiden Seiten ∞ ab, erhält man 0 = 1. Und was ist mit ∞ + ∞? Wenn das größer ist als ∞, haben wir dasselbe Problem. Wenn es jedoch das Gleiche ist, dann wäre ∞ + ∞ = ∞. Zieht man wieder ∞ ab, erhält man ∞ = 0. Die Erfahrung mit früheren Erweiterungen des Zahlensystems zeigt, dass man einige Regeln der Arithmetik und Algebra opfern muss, wenn man neue Arten von Zahlen einführt. Hier sieht es so aus, als müssten wir die Subtraktion von ∞ verbieten. Aus ähnlichen Gründen dürfen wir nicht annehmen, dass die Division durch ∞ so ähnlich funktioniert, wie wir normalerweise annehmen würden. Andererseits wäre sie eine ziemlich klägliche Zahl, wenn man sie nicht für Subtraktion und Division gebrauchen könnte. Das hätte schon das Ende der Geschichte sein können, andererseits fanden Mathematiker es extrem nützlich, mit unendlichen Prozessen zu arbeiten. Es gab nützliche Resultate, wenn man geometrische Formen endlos in immer kleinere Stücke zerlegte. Die Begründung dafür, dass dieselbe Zahl π sowohl im Umfang wie im Flächeninhalt des Kreises
auftaucht, ist ein Beispiel dafür (siehe Kapitel [π]). Archimedes nutzte diese Idee um 200 v. Chr. in seiner Arbeit über Kreise, Kugeln und Zylinder. Er fand einen komplizierten, aber logisch einwandfreien Beweis, dass die Methode die richtigen Antworten liefert. Seit dem 17. Jahrhundert wurde der Bedarf an einer sinnvollen Theorie für diese Art Methode dringlich, ganz besonders für unendliche Summen, durch die sich wichtige Zahlen und Funktionen mit beliebiger Genauigkeit annähern ließen, indem man mehr und mehr kleinere Zahlen dazuaddierte. Zum Beispiel haben wir in Kapitel [π] gesehen, dass gilt, worin die Summe der reziproken Quadratzahlen sich durch π ausdrücken lässt. Diese Feststellung stimmt nur dann, wenn man die Summe ohne Ende fortsetzt. Hört man mit dem Summieren auf, ergibt sich eine rationale Zahl, die eine Näherung für π darstellt, die aber nicht gleich π sein kann, weil π irrational ist. Auf jeden Fall macht jeder zusätzliche Term die Summe größer. Die Schwierigkeit mit unendlichen Reihen wie dieser besteht darin, dass sie zuweilen völlig sinnlos sind. Der klassische Fall ist Schreibt man diese Reihe so
wird daraus was natürlich null ergibt. Schreibt man die Reihe in anderer Form und nimmt an, dass die üblichen Gesetze der Algebra anwendbar sind, wird sie zu Das ist aber was, ebenso offensichtlich, 1 ergibt. Hier, so stellte sich heraus, besteht das Problem darin, dass die Reihe nicht konvergiert; d.h. sie nähert sich nicht einem bestimmten Wert an, wenn man immer mehr Terme dazuaddiert. Stattdessen springt ihr Wert zwischen 1 und 0 hin und her: usw. Das ist nicht die einzige Quelle denkbarer Schwierigkeiten, doch weist es den Weg für eine logische Theorie unendlicher Reihen. Die sinnvollen unter ihnen sind diejenigen, die konvergieren. Die Reihe der reziproken Quadratzahlen ist konvergent, und sie konvergiert exakt gegen .
Philosophen unterscheiden zwischen potenzieller und aktualer Unendlichkeit. Etwas ist potenziell unendlich, falls man es im Prinzip unendlich fortsetzen kann – so wie das unaufhörliche Zufügen von Termen zu einer Summe. Jede Summe für sich ist endlich, doch der gesamte Prozess, der diese Summen erzeugt, hat keinen festen Endpunkt. Aktuale Unendlichkeit tritt auf, wenn ein unendlicher Prozess oder unendliches System als Ganzes behandelt wird. Mathematiker haben einen sinnvollen Weg gefunden, die potenzielle Unendlichkeit unendlicher Summen zu deuten. Sie benutzen unterschiedliche potenziell unendliche Prozesse, doch in allen wird das Symbol interpretiert als «Mach weiter damit und du wirst der richtigen Antwort so nahe kommen wie gewünscht». Die aktuale Unendlichkeit war eine gänzlich andere Geschichte, und Mathematiker gaben sich große Mühe, sie zu meiden. Was ist eine unendliche Zahl? Ich habe die Frage bereits (siehe Seite 22) für gewöhnliche ganze Zahlen 1, 2, 3,… gestellt und bin bis zu Freges Idee gekommen, der Klasse aller Klassen in Entsprechung zu einer gegebenen Klasse, und ich habe dort mit dem Hinweis aufgehört, dass es noch ein Problem geben könnte. Hier kommt es. Die Definition ist sehr elegant, wenn man sich erst einmal an diesen Denkstil gewöhnt hat, und zudem hat sie den Vorteil, ein eindeutiges Objekt zu definieren. Doch war die Tinte auf Freges Meisterwerk noch nicht trocken, als Russell eine Entgegnung aufstellte. Nicht gegen die zugrunde
liegende Idee, über die er selbst schon nachgedacht hatte, sondern gegen die Art von Klasse, die Frege benutzt hatte. Die Klasse aller Klassen ist im Verhältnis zu unserer Klasse von Tassen gewaltig. Man nehme irgendwelche drei Objekte, packe sie in einer Klasse zusammen, und schon muss das Resultat ein Element von Freges alles umspannender Klasse aller Klassen sein. Zum Beispiel muss auch die Klasse, deren Elemente der Eiffelturm, ein bestimmtes Gänseblümchen auf einem Feld in Cambridge und der Geist Oscar Wildes sind, darin inbegriffen sein. Russells Paradox Sind derart umfassende Klassen wirklich sinnvoll? Russell wurde klar, dass sie es in voller Allgemeinheit nicht sind. Sein Beispiel war eine Version des berühmten Barbierparadoxons. In einem bestimmten Ort gibt es einen Barbier, der genau die Leute rasiert, die sich nicht selbst rasieren. Wer rasiert jetzt den Barbier? Unter der Bedingung, dass jeder im Ort von jemand rasiert wird, kann es einen solchen Barbier nicht geben. Denn falls der Barbier sich nicht selbst rasiert, muss er sich per Definition selbst rasieren. Wenn er sich jedoch selbst rasiert, verletzt er die Bedingung, dass er ausschließlich diejenigen rasiert, die sich nicht selbst rasieren. Wir nehmen hierbei an, dass der Barbier männlich ist, um das Problem mit er/sie zu vermeiden. Aber natürlich ist mir klar, liebe Leserinnen, dass viele von Ihnen sich heutzutage auch rasieren – nur in der Regel nicht die Bärte. Folglich ist ein weiblicher Barbier keine zufriedenstellende Lösung des Paradoxons, wie einige Leute sich gern vorstellten. Russell fand eine Klasse, die derjenigen, die Frege gerne benutzt hätte, nahe kam, die sich genau wie der Barbier verhält: die Klasse aller Klassen,
die sich nicht selbst enthalten. Enthält sich diese Klasse nun selbst oder nicht? Beide Möglichkeiten sind ausgeschlossen. Falls sie sich tatsächlich selbst enthält, dann muss sie tun, was alle ihre Elemente tun: sich nicht selbst enthalten. Enthält sie sich dagegen selbst nicht, muss sie bedingungsgemäß zu der Klasse gehören, folglich enthält sie sich selbst. Obgleich dieses Russell-Paradox nicht beweist, dass Freges Definition einer Zahl logisch widersprüchlich ist, zeigt es jedoch, dass man nicht einfach ohne Beweis annehmen kann, dass irgendeine Wahr/falschBedingung eine Klasse definiert, insbesondere solche Objekte, für die die Bedingung zutrifft. Und das beraubte Freges Ansatz seiner Substanz. Später versuchten Russell und sein Mitarbeiter Alfred North Whitehead, die Lücke zu schließen, indem sie eine komplexe Theorie über Klassen entwickelten, die man in einem mathematischen Rahmen sinnvoll definieren kann. Das Ergebnis war ein dreibändiges Werk, Principia Mathematica (Prinzipien der Mathematik, eine bewusste Hommage an Isaac Newton), das die gesamte Mathematik aus den logischen Eigenschaften von Klassen entwickelte. Es braucht mehrere 100 Seiten, um die Zahl 1 zu definieren, und noch ein paar mehr für + und um zu zeigen, dass 1 + 1 = 2 ist. Danach geht es sehr viel schneller weiter. Aleph-null: Die kleinste unendliche Zahl Nur wenige Mathematiker benutzen den Russell-Whitehead-Ansatz über Klassen heute noch, weil einfachere Methoden besser funktionieren. Eine Schlüsselfigur in der heutigen Formulierung der logischen Grundlagen der
Mathematik ist Cantor. Er begann wie Frege, indem er die logischen Grundlagen der ganzen Zahlen zu verstehen versuchte. Seine Forschung führte jedoch in eine neue Richtung: Zahlen mit unendlichen Mengen zu verbinden. Sie wurden als transfinite Zahlen bekannt. Ihre bemerkenswerteste Eigenschaft besteht darin, dass es mehrere gibt. Cantor arbeitete auch mit Ansammlungen von Dingen, die er «Mengen» nannte statt Klassen, weil die Dinge in ihnen strengeren Bedingungen unterlagen als die, die Frege verlangt hatte (nämlich gar keine). So wie Frege begann er mit der intuitiven Idee, dass zwei Mengen genau dann dieselbe Anzahl von Elementen haben, wenn sie in eine eineindeutige Beziehung gesetzt werden können. Anders als Frege jedoch machte er dies auch für unendliche Mengen. Mag sein, dass er sogar mit der Vorstellung begann, auf diese Weise Unendlichkeit definieren zu können. Sicherlich kann doch jede unendliche Menge zu einer beliebigen anderen in eine eineindeutige Beziehung gesetzt werden? Wenn dem so ist, dann gäbe es genau eine unendliche Zahl, und sie wäre größer als jede endliche – Ende der Geschichte. Stattdessen, so stellte sich heraus, war das erst der Anfang. Die grundlegende unendliche Menge ist die Menge aller ganzen Zahlen. Da man sie zum Zählen von Dingen benutzt, definierte Cantor eine Menge als abzählbar, wenn man ihre Elemente in eine eineindeutige Beziehung zur Menge der ganzen Zahlen setzen konnte. Man beachte, dass Cantor dadurch, dass er die gesamte Menge betrachtete, von der aktualen Unendlichkeit, nicht der potenziellen sprach. Ganz offensichtlich ist die Menge der natürlichen Zahlen abzählbar – man setzt einfach jede Zahl zu sich selbst in Beziehung:
Abbildung 174 Aber gibt es noch andere? Ja – und sie sind ziemlich schräg. Wie wär’s mit folgender? Abbildung 175 Man entfernt die Zahl 1 aus der Menge der ganzen Zahlen, und doch nimmt die Zahl der Elemente in der Menge nicht um 1 ab: Sie bleibt exakt gleich. Zugegeben, würden wir bei einer endlichen Zahl aufhören, hätten wir am rechten Ende eine Zahl übrig, doch wenn wir alle ganzen Zahlen benutzen, gibt es kein rechtes Ende. Jede Zahl n korrespondiert zu n + 1, und dies ist die Beziehung zwischen der Menge aller ganzen Zahlen und derselben Menge, aus der die 1 entfernt wurde. Der Teil hat dieselbe Größe wie das Ganze. Cantor nannte diese unendlichen Zahlen Kardinalzahlen, weil das ein schicker Name für die natürlichen Zahlen in der gewöhnlichen Arithmetik ist. Um es deutlicher zu machen, nennt man sie auch transfinite Zahlen. Als Symbol für die Kardinalzahl der ganzen Zahlen wählte er ein Zeichen, den
ersten Buchstaben (aleph) des hebräischen Alphabets, weil die ganze Idee ungewöhnlich war. Dann fügte er noch einen Index 0 hinzu, sodass entstand, und das aus Gründen, die wir im nächsten Kapitel erklären werden. Wenn jede unendliche Menge mit den natürlichen Zahlen in Beziehung gesetzt werden konnte, wäre lediglich ein schickes Zeichen für «Unendlichkeit». Und am Anfang sah es auch tatsächlich so aus. Zum Beispiel gibt es eine Menge rationale Zahlen, die nicht ganz sind, deswegen erschien es vernünftig, dass auch die Kardinalzahl der rationalen Zahlen größer sein könnte als . Cantor bewies jedoch, dass man die rationalen Zahlen eineindeutig auf die natürlichen Zahlen abbilden kann. Deswegen ist auch ihre Kardinalzahl . Um grob zu verstehen, wie das funktioniert, lassen Sie uns bei den rationalen Zahlen zwischen 0 und 1 bleiben. Der Trick besteht darin, sie in der richtigen Reihenfolge anzuordnen, nämlich nicht ihrer numerischen Reihenfolge. Stattdessen ordnen wir sie nach der Größe des Nenners, der Zahl unter dem Bruchstrich. Für jeden Nenner ordnen wir sie dann nach ihrem Zähler, der Zahl darüber. Also listen wir sie folgendermaßen auf: wobei zum Beispiel fehlt, weil es dasselbe ist wie . Nun können wir diese rationalen Zahlen auf die natürlichen Zahlen abbilden, indem wir sie
in dieser bestimmten Ordnung nummerieren. Jede rationale Zahl zwischen 0 und 1 kommt irgendwo in der Liste vor, sodass wir keine auslassen. Vorerst hat Cantors Theorie lediglich zu einer unendlichen Kardinalzahl geführt. Doch werden wir im nächsten Kapitel sehen, dass es so einfach nicht ist.
Mächtiges Kontinuum Cantors brillanteste Einsicht ist, dass einige Unendlichkeiten größer sind als andere. Er entdeckte etwas Bemerkenswertes über das «Kontinuum» – ein schicker Name für die reellen Zahlen. Seine Mächtigkeit, die er nannte, ist größer als . Damit meine ich nicht einfach, dass einige reelle Zahlen keine ganzen Zahlen sind. Einige rationale Zahlen (eigentlich die meisten) sind ebenfalls keine ganzen Zahlen, und doch haben natürliche und rationale Zahlen dieselbe Kardinalität oder Mächtigkeit, . Für unendliche Kardinalzahlen muss das Ganze nicht unbedingt größer sein als seine Teile, wie schon Galileo feststellte. Es bedeutet einfach, dass man die reellen Zahlen nicht alle eins zu eins auf die ganzen Zahlen abbilden kann, ganz gleich, wie man sie sortiert. Da größer ist als , überlegte Cantor, ob es noch andere unendliche Mächtigkeiten dazwischen gäbe. Seine Kontinuumshypothese besagt, dass dem nicht so ist. Er konnte diese Annahme weder beweisen noch
widerlegen. Die Antwort kann «ja und nein» lauten, wie Kurt Gödel 1940 und Paul Cohen 1963 bewiesen. Es hängt davon ab, wie man die logischen Fundamente der Mathematik ansetzt. Nicht abzählbare Unendlichkeit Erinnern Sie sich, dass man reelle Zahlen als Dezimalzahlen schreiben kann, die entweder nach endlich vielen Stellen enden, wie zum Beispiel 1,44, oder die ewig weitergehen, wie zum Beispiel π. Cantor stellte fest (wenn auch anders ausgedrückt), dass die Unendlichkeit der reellen Zahlen definitiv größer ist als die der natürlichen Zahlen, . Die Idee ist trügerisch einfach. Sie bedient sich eines Beweises mittels Widerspruch. In der Hoffnung, einen logischen Widerspruch herleiten zu können, nehmen wir an, dass die reellen Zahlen eins zu eins auf die natürlichen Zahlen abgebildet werden können. Dann muss es eine Liste von unendlich vielen Dezimalzahlen der Form geben, wobei jede mögliche unendliche Dezimalzahl irgendwo auf der rechten Seite auftaucht. Achten Sie vorerst nicht auf den Fettdruck; ich komme darauf gleich zurück.
Cantors großartige Idee besteht darin, eine unendliche Dezimalzahl zu konstruieren, die auf keinen Fall in der Liste auftauchen kann. Sie hat die Form wobei usw. Das sind genau die Stellen, die ich fett gedruckt habe. Wenn man in einer unendlichen Dezimalzahl nur eine ihrer Stellen verändert, ganz gleich wo, verändert man ihren Wert – das ist hier der Punkt. Man verändert nicht viel, aber das ist nicht wichtig. Wichtig ist, dass sie sich überhaupt ändert. Wir erhalten die neue «fehlende» Zahl, indem wir dieses Spiel mit jeder Zahl auf der angeblich kompletten Liste durchführen. Die Bedingung für x1 bedeutet, dass die neue Zahl nicht die erste in der Liste ist, weil sie die falsche Ziffer an erster Stelle nach dem Dezimalkomma hat. Die Bedingung für x2 bedeutet, dass die Zahl auch nicht die zweite auf der Liste ist, weil sie dann die falsche Ziffer an der zweiten Stelle nach dem Dezimalkomma hätte. Und so weiter. Weil sowohl die Dezimalstellen als auch die Liste unendlich weitergehen, ist die Schlussfolgerung, dass die neue Zahl sich nirgends auf der Liste findet.
Unsere Annahme war aber: Sie befindet sich auf der Liste. Das ist ein Widerspruch, folglich ist unsere Annahme falsch und keine solche Liste kann existieren. Eine technisches Detail bedarf unserer Aufmerksamkeit: Man vermeidet entweder 0 oder 9 als Ziffern in der zu konstruierenden Zahl, weil die Dezimaldarstellung mehrdeutig ist. Zum Beispiel ist 0,10000… exakt dieselbe Zahl wie 0,09999… (Es handelt sich um zwei unterschiedliche Arten, als unendliche Dezimalzahl zu schreiben). Diese Mehrdeutigkeit entsteht nur dann, wenn die Dezimalzahl in einer unendlichen Folge von Nullen oder einer unendlichen Folge von Neunen aufhört. Die ganze Idee nennt man Cantors Diagonalargument, weil die Ziffern a1, b2, c3, d4, e5, usw., längs der Diagonalen auf der rechten Seite der Liste stehen. (Halten Sie nach den fett gedruckten Stellen Ausschau.) Der Beweis funktioniert genau deshalb, weil sowohl die Ziffern als auch die Liste sich auf die natürlichen Zahlen abbilden lassen. Es ist wichtig, die Logik dieses Beweises zu verstehen. Natürlich könnte man mit der speziellen Zahl, die wir konstruiert haben, so umgehen, dass man sie an die erste Stelle der Liste setzt und alle anderen eine Stelle nach unten rückt. Doch die Logik des Beweises mittels Widerspruch besteht darin, dass wir das bereits ausgeschlossen haben. Die Zahl, die wir konstruiert haben, befindet sich laut Voraussetzung bereits in der Liste, ohne irgendwelche weiteren Modifikationen. Doch sie ist nicht da. Deswegen: Es kann keine solche Liste geben. Da jede ganze Zahl auch eine reelle Zahl ist, hat das zur Folge, dass in Cantors Modell die Unendlichkeit der reellen Zahlen größer ist als die
Unendlichkeit der ganzen Zahlen. Indem er Russells Paradox modifizierte, ging er noch viel weiter; er zeigte, dass es keine größte unendliche Zahl geben kann. Das führte ihn dazu, sich eine unendliche Reihe von immer größer werdenden unendlichen Zahlen vorzustellen, die als transfinite Kardinalzahlen bekannt sind. Keine größte Unendlichkeit Cantor glaubte, dass die Reihe seiner unendlichen Zahlen so beginnen sollte: wobei jede folgende unendliche Zahl in dem Sinne die «nächste» sein sollte, dass es keine dazwischen gibt. Die ganzen Zahlen entsprechen . Ebenso die rationalen Zahlen. Reelle Zahlen aber müssen nicht rational sein. Cantors Diagonalelement zeigt, dass sollten die reellen Zahlen wohl zu größer ist als , folglich korrespondieren. Aber tun sie das auch? Der Beweis sagt uns nicht, dass es so ist. Er besagt nur, dass als größer ist , aber er schließt nicht die Möglichkeit aus, dass noch etwas dazwischen liegt. Nach Cantors Wissensstand hätte sagen wir sein können. Oder noch schlimmer. Einiges konnte er beweisen. Transfinite Kardinalzahlen können tatsächlich auf diese Weise geordnet werden. Mehr noch enden die Indizes
0, 1, 2, 3, 4… nicht mit den endlichen ganzen Zahlen. Es muss zum Beispiel auch eine transfinite Zahl geben: nämlich die kleinste transfinite Zahl, die größer ist als alle , wobei n eine ganze Zahl ist. Und würde alles hier enden, wäre sein Theorem verletzt, dass es keine größte transfinite Zahl geben kann, folglich endet die Reihe auch nicht. Niemals. Eines konnte er jedoch nicht beweisen: dass die reellen Zahlen zu korrespondieren. Vielleicht gehörten sie zu und irgendeine andere Menge lag dazwischen, sodass deren Mächtigkeit war. So sehr er sich auch bemühte, er konnte keine solche Menge finden, konnte jedoch auch nicht beweisen, dass sie nicht existiert. Wo standen die reellen Zahlen in der Liste von Alephs? Er hatte keine Idee. Er vermutete, dass die reellen Zahlen tatsächlich zu gehörten, doch war dies nur eine Hypothese. Also benutzte er ein anderes Symbol: das gotische , das für «Kontinuum» steht, der Name, der damals für die Menge aller reellen Zahlen benutzt wurde. n Eine endliche Menge mit n Elementen hat 2 verschiedene Teilmengen. A Deswegen definierte Cantor 2 für eine beliebige Kardinalzahl A, indem er A eine Menge mit Mächtigkeit A hernahm und 2 als die Kardinalzahl der A Menge all ihrer Teilmengen setzte. Damit konnte er beweisen, dass 2 größer ist als A für jede transfinite Kardinalzahl A. Was übrigens auch zur Folge hat, dass es keine größte transfinite Kardinalzahl gibt. Er konnte auch beweisen, dass gleich ist. Es schien wahrscheinlich, dass allgemein gilt. Das heißt, wenn man die Menge aller Teilmengen
nimmt, so führt das zur nächstgrößeren transfiniten Kardinalzahl. Doch beweisen konnte er das nicht. Cantor konnte noch nicht einmal den einfachsten Fall, n = 0, beweisen, was so viel bedeutet wie die Feststellung = . Im Jahr 1878 stellte Cantor die Vermutung auf, dass diese Gleichung stimmt und sie wurde als Kontinuumshypothese bekannt. Gödel bewies 1940, dass das Zutreffen dieser Hypothese mit den üblichen Annahmen der Mengentheorie logisch verträglich ist, was die Mathematiker ermutigte. Im Jahr 1963 jedoch konnte Cohen zeigen, dass auch das Nichtzutreffen der Hypothese logisch verträglich ist. Hoppla! Das ist aber kein logischer Widerspruch in der Mathematik. Die Bedeutung dieses Sachverhalts ist viel merkwürdiger und in gewisser Weise auch verstörender: Die Antwort hängt davon ab, welche Version der Mengenlehre man benutzt. Es gibt mehrere verschiedene Wege, die logischen Grundlagen der Mathematik festzulegen, und während sie alle in den Grundannahmen übereinstimmen, können sie bei weiter entwickelten Konzepten auseinandergehen. Wie Walt Kellys Comicfigur Pogo zu sagen pflegte: «Wir sind auf den Feind gestoßen – auf uns selbst.» Das Insistieren auf axiomatischer Logik beißt sich in den Schwanz. Heutzutage ist bekannt, dass auch viele andere Eigenschaften der transfiniten Kardinalzahlen davon abhängen, welche Version der Mengenlehre man benutzt. Darüber hinaus haben derartige Fragen enge Verbindungen zu anderen Eigenschaften von Mengen, die nicht explizit mit Kardinalzahlen zusammenhängen. Das Gebiet ist ein ergiebiger Jagdgrund
für mathematische Logiker, doch im Großen und Ganzen funktioniert der Rest der Mathematik augenscheinlich ganz gut, egal welche Version der Mengenlehre man benutzt.
DAS LEBEN, DAS UNIVERSUM UND … Ist 42 wirklich die absolut langweiligste Zahl?
Kein bisschen langweilig Nun, damit würde man sicherlich zu früh aufgeben. Wie im Vorwort schon erwähnt, spielt diese Zahl eine prominente Rolle in Douglas Adams’ Science-Fiction-Roman «Per Anhalter durch die Galaxis», wo sie die Antwort auf «die große Frage nach dem Leben, dem Universum und dem ganzen Rest» darstellt. Ihre Entdeckung warf sofort eine neue Frage auf: Was denn das große Rätsel des Lebens, des Universums und des ganzen Rests ist. Adams zufolge hat er diese Zahl gewählt, weil eine kurz Umfrage bei seinen Freunden ergab, dass sie total langweilig sei. An dieser Stelle würde ich gerne die 42 gegen diese Verleumdung verteidigen. Zugegeben, 42 steht hinsichtlich ihrer mathematischen Bedeutung nicht auf einer Stufe mit 4 oder π oder sogar 17. Sie ist aber auch nicht völlig uninteressant. Sie ist eine Rechteckzahl, eine Catalan’sche Zahl und die magische Konstante des kleinsten magischen Würfels. Und noch ein paar andere Dinge.
Rechteckzahl Eine Rechteckzahl oder pronische Zahl ist das Produkt zweier aufeinanderfolgender ganzer Zahlen. Sie hat daher die Form n(n+1). Falls n = 6 ist, erhalten wir 6 × 7 = 42. Da die n-te Dreieckszahl ist, ist eine pronische Zahl das Doppelte einer Dreieckszahl. Deshalb stellt sie auch die Summe der ersten n geraden Zahlen dar. Eine pronische Zahl von Punkten kann man rechteckförmig anordnen, wobei eine Seite des Rechtecks um einen Punkt länger ist als die andere. Abbildung 176: Die ersten sechs pronischen Zahlen. Die Schattierung illustriert, dass jede das Doppelte einer Dreieckszahl darstellt.
Einer Legende zufolge wurde der junge Gauß als Schüler mit einem Problem der Art konfrontiert. Er bemerkte sofort Folgendes: Wenn man die Summe in absteigender Reihenfolge darunter schreibt addieren sich entsprechende Paare zu 101. Da es 100 solche Paare gibt, ist die Gesamtsumme gleich 100 × 101 = 10100. Dies ist eine Rechteckzahl. Die Antwort auf die Frage des Lehrers beträgt die Hälfte davon: 5050. Wir wissen allerdings nicht, welche Zahlen Gauß’ Lehrer der Klasse tatsächlich vorsetzte, möglicherweise waren sie unangenehmer als diese. Umso größer wäre Gauß’ Genie gewesen. Die sechste Catalan’sche Zahl Catalan’sche Zahlen tauchen in vielen verschiedenen kombinatorischen Problemen auf. Sie repräsentieren die Anzahl der Möglichkeiten, diverse mathematische Aufgaben auszuführen, und sie gehen auf Euler zurück, der abzählte, auf wie viele Arten einen Vieleck in Dreiecke aufgeteilt werden kann, indem man seine Ecken verbindet. Später fand Eugène Catalan eine Beziehung zur Algebra: auf wie viele Arten man Klammern in eine Summe oder ein Produkt einfügen kann. Ich komme darauf in Kürze zurück, doch lassen Sie mich erst die Zahlen einführen.
Die ersten paar Catalan’schen Zahlen Cn für n = 0, 1, 2, …, sind Dafür gibt es eine Formel, die Fakultäten benutzt: Eine recht gute Näherung für große n ist was ein weiteres Beispiel dafür ist, dass π in Problemen auftaucht, die keine Beziehung zu Kreisen oder Kugeln zu haben scheinen. Cn ist die Anzahl verschiedener Möglichkeiten, ein regelmäßiges (n + 2)‑Eck in Dreiecke aufzuteilen.
Abbildung 177: Die 14 Triangulationen eines Sechsecks. Cn ist auch die Anzahl von Binärbäumen mit n + 1 Blättern. Solche Bäume erhält man, indem man mit einem einzelnen Punkt (oder Knoten) beginnt, der Wurzel, und dann aus jedem Knoten zwei Äste sprießen lässt. Jeder Ast endet entweder in einem Knoten oder einem Blatt. Jeder Knoten muss seinerseits zwei Zweige hervorbringen. Abbildung 178: Die fünf Binärbäume mit vier Blättern. Falls Ihnen diese Konstruktion esoterisch vorkommt, sie steht in direkter Beziehung zu einem algebraischen Problem: Sie stellt die Anzahl verschiedener Möglichkeiten dar, Klammern in einem Produkt wie abcd zu setzen, wo es C3 = 5 Möglichkeiten gibt: Im Allgemeinen beträgt die Anzahl der möglichen Klammerungen bei n + 1 Symbolen Cn. Um die Beziehung herzustellen, schreibe man die Symbole an die Blätter des Baumes und setze Klammern dort, wo zwei Äste in einem Knoten münden. Genauer (siehe Abbildung) bezeichnen wir die vier Blätter von links nach rechts mit a, b, c, d. Unten beginnend schreiben wir (bc) neben den Knoten, der b und c verbindet. Dann verbindet der Knoten darüber a mit dem Punkt, der (bc) markiert ist, daher entspricht der neue
Knoten (a(bc)). Schließlich verbindet der Punkt ganz oben das Ganze mit d, sodass er das Etikett ((a(bc))d) erhält. Abbildung 179: Wie man einen Binärbaum in einen algebraischen Ausdruck verwandelt. Zahlreiche kombinatorische Probleme führen auf Catalan’sche Zahlen. Die oben aufgeführten stellen nur einen kleinen Ausschnitt derjenigen dar, die sich leicht beschreiben lassen. Magische Würfel
Die magische Konstante eines 3 × 3 × 3 magischen Würfels ist 42. Solch ein Würfel enthält alle Zahlen von 1 bis 27, und die Summe jeder zu einer Kante parallelen Reihe und auch jeder Diagonalen, die durch das Zentrum führt, ist dieselbe – die magische Konstante. Die Summe aller 27 Zahlen ist 1 + 2 +… + 27 = 378. Diese lässt sich aus neun sich nicht überschneidenden Tripeln zusammensetzen. Die magische Konstante muss demnach = 42 sein. Solche Anordnungen gibt es; die Abbildung zeigt eine. Abbildung 180: Benachbarte Schichten eines 3 × 3 × 3 magischen Würfels. Weitere besondere Eigenschaften 42 ist die Anzahl der Partitionen von 10, d.h. der Möglichkeiten, die 10 als Summe ganzer Zahlen in natürlicher Reihenfolge zu schreiben, wie zum Beispiel
42 ist die zweite sphenische Zahl – Zahlen, die das Produkt dreier verschiedener Primzahlen sind. In diesem Fall 42 = 2 × 3 × 7. Die ersten paar sphenischen Zahlen lauten 42 ist die dritte Fünfzehneckszahl – analog zu den Dreieckszahlen, aber auf einem regelmäßigen 15‑Eck basierend. 42 ist eine super-multivollkommene Zahl, genauer die kleinste (2,6)perfekte Zahl: Bildet man die Summe der Teiler der Summe ihrer Teiler, erhält man das 6-Fache der Zahl selbst. Eine Zeit lang war 42 das bekannteste Irrationalitätsmaß für π – eine präzise Art und Weise, zu quantifizieren, «wie irrational» π ist. Insbesondere zeigte Kurt Mahler 1953, dass für beliebiges rationales p/q gilt: Im Jahr 2008 ersetzte V.Kh. Salikov die 42 jedoch durch 7,60630853, sodass 42 in diesem Zusammenhang wieder langweilig wurde. 42 ist die dritte primär pseudovollkommene Zahl. Solche Zahlen erfüllen die Bedingung:
wobei die pj die verschiedenen Primteiler der Zahl N sind. Die ersten primär pseudovollkommenen Zahlen lauten 42 ist die Anzahl n von Mengen aus vier verschiedenen natürlichen Zahlen a, b, c, d (alle < n), sodass ab – cd, ac – bd und ad – bc alle durch n teilbar sind. Sie ist die einzige bekannte Zahl mit dieser Eigenschaft, man weiß jedoch nicht, ob es noch andere gibt. 42 ist die kleinste Dimension, für die sich die Wurst-Vermutung hat beweisen lassen (siehe Kapitel [56]). Man vermutet jedoch, dass sie für alle Dimensionen größer oder gleich 5 gilt, sodass die Bedeutung von 42 in dieser Frage vom gegenwärtigen Stand der Erkenntnis abhängt. Sehen Sie? Kein bisschen langweilig!
Weiterführende Literatur Carl B. Boyer: A History of Mathematics, Wiley, New York 1968 John H. Conway und Richard K. Guy: The Book of Numbers, Springer, New York 1996 John H. Conway und Derek A. Smith: On Quaternions and Octonions, A. K. Peters, Natick MA 2003 John H. Conway, Heidi Burgiel und Chaim Goodman-Strauss: The Symmetries of Things, A. K. Peters, Wellesley MA 2008 Tobias Dantzig: Number: The Language of Science, Pi Press, New York 2005 Augustus De Morgan: A Budget of Paradoxes (2 Bände, Nachdruck), Books for Libraries Press, New York 1969 Underwood Dudley: Mathematical Cranks, Mathematical Association of America, New York 1992 (deutsch: Mathematik zwischen Wahn und Witz: Trugschlüsse, falsche Beweise und die Bedeutung der Zahl 57 für die amerikanische Geschichte, Birkhäuser, Basel 1995) Marcus Du Sautoy: The Music of the Primes, Harper Perennial, New York 2004 (deutsch: Die Musik der Primzahlen: Auf den Spuren des größten Rätsels der Mathematik. Deutscher Taschenbuch-Verlag, München 2006) Richard J. Gillings: Mathematics in the Time of the Pharaohs (Nachdruck), Dover, New York 1982
Anton Glaser: History of Binary and Other Nondecimal Numeration, Tomash, Los Angeles 1981 Jan Gullberg: Mathematics from the Birth of Numbers, Norton, New York 1997 Richard K. Guy: Unsolved Problems in Number Theory, Springer, New York 1994 G. H. Hardy und E. M. Wright: An Introduction to the Theory of Numbers, Oxford University Press (4. Aufl.), Oxford 1960 (deutsch: Einführung in die Zahlentheorie. Oldenbourg, München 1958) Andreas M. Hinz, Sandi Klavzar, Uros Milutinovic und Ciril Petr: The Tower of Hanoi – Myths and Maths, Birkhäuser, Basel 2013 Gareth A. Jones und J. Mary Jones: Elementary Number Theory, Springer, Berlin 1998 George Gheverghese Joseph: The Crest of the Peacock: NonEuropean Roots of Mathematics, Penguin, London 1992 Viktor Klee und Stan Wagon: Old and New Unsolved Problems in Plane Geometry and Number Theory, Mathematical Association of America, New York 1991 Mario Livio: The Golden Ratio, Broadway, New York 2002 Mario Livio: The Equation That Couldn’t Be Solved, Simon & Schuster, New York 2005 John McLeish: Number, Bloomsbury, London 1991 Otto Neugebauer: A History of Ancient Mathematical Astronomy (3 Bände), Springer, Berlin 1975
Paulo Ribenboim: The Book of Prime Number Records, Springer, New York 1984 (deutsch: Die Welt der Primzahlen: Geheimnisse und Rekorde. Springer, Berlin/New York 2011) Ernő Rubik, Támás Varga, Gerszon Kéri, György Marx und Támás Vekerdy: Rubik’s Cubic Compendium, Oxford University Press, Oxford 1987 Karl Sabbagh: Dr. Riemann’s Zeros, Atlantic Books, London 2022 Wacław Sierpiński: Elementary Theory of Numbers, North-Holland, Amsterdam 1998 Simon Singh: Fermat’s Last Theorem, Fourth Estate, London 1997 (deutsch: Fermats letzter Satz: Die abenteuerliche Geschichte eines mathematischen Rätsels, Deutscher Taschenbuch-Verlag, München, 3. Aufl. 2000) Ian Stewart: Professor Stewart’s Cabinet of Mathematical Curiosities, Profile, London 2008 (deutsch: Professor Stewarts mathematisches Kuriositätenkabinett, Rowohlt, Reinbek 2010) Ian Stewart: Professor Stewart’s Hoard of Mathematical Treasures, Profile, London 2009 (deutsch: Professor Stewarts mathematische Schätze, Rowohlt, Reinbek, 2013) Ian Stewart: Professor Stewart’s Casebook of Mathematical Mysteries, Profile, London 2014 (deutsch: Professor Stewarts mathematische Detektivgeschichten, Rowohlt, Reinbeck, 2016) Frank J. Swetz: Legacy of the Luoshu, A. K. Peters, Wellesley MA 2008 Jean-Pierre Tignol: Galois’s Theory of Algebraic Equations, Longman, London 1988
Matthew Watkins und Matt Tweed: The Mystery of the Prime Numbers, Inamorata Press, Dursley 2010 Jeremy Webb (Hg.): Nothing, Profile, London 2013 Robin Wilson: Four Colors Suffice (2. Auflage), Princeton University Press, Princeton 2014
Online-Quellen Spezielle Internet-Quellen sind im Text genannt. Was alle anderen mathematischen Informationen angeht, versuche man es zunächst mit Wikipedia und mit Wolfram MathWorld (in Englisch).
Abbildungsnachweis Autor und Verlag danken für die freundliche Abdruckgenehmigung folgender Abbildungen: Abb. 1: Wikimedia creative commons, Albert1ls; Abb. 3: Wikimedia creative commons, Marie-Lan Nguyen; Abb. 31: Livio Zucca; Abb. 32: Metropolitan Museum of Art, New York, Schenkung von Chester Dale; Abb. 63: Wikimedia creative commons, Flagstaffotos; Abb. 77: Lessing Archive; Abb. 108: Allianz SE; Abb. 119: Kenneth Libbrecht; Abb. 130: thoughtyoumayask.com; Abb. 133: Jeff Bryant und Andrew Hanson; Abb. 153: Wolfram MathWorld; Abb. 159: Wikimedia creative commons; Abb. 160: Wikimedia creative commons, Matt Crypto; Abb. 168: Joe Christy. Trotz sorgfältiger Recherche konnten nicht alle Rechteinhaber der verwendeten Abbildungen ermittelt werden. Autor und Verlag sind dankbar für Informationen über Abbildungen, deren Rechteinhaber sie nicht ermitteln konnten, und werden diese in weiteren Auflagen berücksichtigen.
Die englische Originalausgabe erschien 2015 unter dem Titel «Professor Stewart’s Incredible Numbers» bei W.W. Profile Books Ltd., London. Veröffentlicht im Rowohlt Taschenbuch Verlag, Reinbek bei Hamburg, Juli 2016 Copyright © 2016 by Rowohlt Verlag GmbH, Reinbek bei Hamburg «Professor Stewart’s Incredible Numbers» Copyright © 2015 by Joat Enterprises Dieses Werk ist urheberrechtlich geschützt, jede Verwertung bedarf der Genehmigung des Verlages Redaktion Heiner Höfener Umschlaggestaltung ZERO Werbeagentur, München, nach der Originalausgabe von Profile Books, Gestaltung Steve Panton Schrift DejaVu Copyright © 2003 by Bitstream, Inc. All Rights Reserved. Bitstream Vera is a trademark of Bitstream, Inc. ISBN Printausgabe 978-3-499-63153-5 (1. Auflage 2016) ISBN E-Book 978-3-644-56431-2 www.rowohlt.de Hinweis: Aus technischen Gründen können die Zahlen der kapitelführenden Formeln nicht im ToC und in der «[Inhaltsübersicht]» angezeigt werden.
Aus diesem Grund wird das in dieser Hinsicht vollständige Inhaltsverzeichnis der Printausgabe («INHALT») dargestellt; dieses ist aber nicht interaktiv, im Gegensatz zu den aufgeführten und verlinkten Überschriften der «[Inhaltsübersicht]», über die man direkt zur entsprechenden Kapitelüberschrift springen kann. Die Seitenverweise im Inhalt, im Text und im Abbildungsnachweis beziehen sich auf die Seiten der Printausgabe.
Verbinden Sie sich mit uns! Neues zu unseren Büchern und Autoren finden Sie auf www.rowohlt.de. Werden Sie Fan auf Facebook und lernen Sie uns und unsere Autoren näher kennen. Folgen Sie uns auf Twitter und verpassen Sie keine wichtigen Neuigkeiten mehr. Unsere Buchtrailer und Autoren-Interviews finden Sie auf YouTube. Abonnieren Sie unseren Instagram-Account.
Besuchen Sie unsere Buchboutique! Die Buchboutique ist ein Treffpunkt für Buchliebhaberinnen. Hier gibt es viel zu entdecken: wunderbare Liebesromane, spannende Krimis und Ratgeber. Bei uns finden Sie jeden Monat neuen Lesestoff, und mit ein bisschen Glück warten attraktive Gewinne auf Sie. Tauschen Sie sich mit Ihren Mitleserinnen aus und schreiben Sie uns hier Ihre Meinung.