Sudoku Solver
NEU: Auflistung aller Einzelschritte inklusive genauer Erklärungen und Punkte-Bewertung - und mit Goldenen Ketten; jetzt auch mit Eindeutigkeitstest
Geben Sie die Ausgangszahlen ein (1..9)
Prinzipen zur Lösung von Sudokus
Sudoku-Grundregel: Es sollen in jeder Zeile, in jeder Spalte und in jeder Box (3x3-Kästchen) alle Zahlen von 1 bis 9 genau einmal vorkommen. Die Zeilen und Spalten werden hier von oben links an mit 1 bis 9 durchnummeriert, die Boxen werden mit OL (oben links), OM (oben Mitte), OR (oben rechts), ML (Mitte links), MM (Mitte Mitte), ..., bis UR (unten rechts) bezeichnet.
Dieses Programm benutzt 5 Lösungsverfahren mit verschiedener Punkte-Gewichtung, wobei für die Ausdünnung 5 verschiedene Analysemethoden (ebenfalls mit unterschiedlichen Punkten gewichtet) programmiert wurden.
Dabei wird nach einem Treffer immer wieder bei der einfachsten Methode begonnen, und zusätzlich in der Reihenfolge: Suche immer erst in Zeilen - dadurch sind diese Fälle immer am häufigsten -, dann in Spalten, zuletzt in Boxen.
Bei der Bewertung wird davon ausgegangen, dass zuerst versucht wird, das Sudoku ohne Anschreiben der Reste (Kandidaten) zu lösen. Dabei kommen die Methoden A, B und C zum Einsatz. Kommt man damit nicht weiter, muss man für jede Zelle alle Zahlen aufschreiben, die dafür in Frage kommen: die Kandidaten, die hier als Ganzes oft Rest genannt und auch der Einfachheit halber als eine mehrstellige Zahl (ohne Komma oder andere Trennzeichen) geschrieben werden. Danach versucht man, diese Reste so lange auszudünnen, also zu verkürzen, bis man zu einer eindeutigen Lösung für eine Zelle kommt (Methoden D und E). Das Ausdünnen (Kandidaten-Reduzierung) wird hier mit den wichtigsten 5 Methoden versucht, die weiter unten erklärt werden.
Trial- and Error-Verfahren werden nicht benutzt, sondern nur logisch nachvollziehbare Methoden - dieses Programm soll nicht ein Sudoku lösen, sondern alle Lösungsschritte aufzeigen. Ein "richtiges" Sudoku sollte immer ohne "zufälligen" Versuch und Irrtum und auf jeden Fall eindeutig gelöst werden können.
Programm-Neuigkeiten
- Die bei http://sourceforge.net/projects/php-sudoku/ gefundenen 1 Million Sudokus (Dank an Michael Jentsch) wurden durchgerechnet. Sie sind aber etwas einfacher als die hier bisher gesammelten mehr als 22000 Sudokus, denn 965351 Sudokus konnte ohne Ausdünnung gerechnet werden, 30420 Sudokus (3 %) konnten nur mit Ausdünnung gelöst werden, und nur 4229 (0.4 %) Sudokus konnten mit diesem Programm nicht gelöst werden, hatten aber eine eindeutige Lösung, die sich durch Trial&Error aber im Allgemeinen auch sehr einfach finden ließ. Interessant wieder: X-Wings waren 4483 dabei, aber Goldene Ketten 47581, fast 11 Mal so viel (August 2010).
- Die jeweils neu gefundene Zahl wird mit spitzen Klammern, also z.B. >7< markiert (Juli 2010).
- Die Beispiele wurden in ihrem Aufbau verändert und auf eine extra Webseite gebracht, damit die eigentliche Seite nicht zu lang ist (Juni 2010).
- Jetzt gibt es die Möglichkeit, ein Sudoku, das mit den hier programmierten Methoden nicht gelöst werden kann, auf eindeutige Lösbarkeit testen zu lassen. Von 3400 untersuchten hier nicht lösbaren Sudokus waren etwa 630 eindeutig lösbar, über 2500 hatten mehr als eine Lösung - mit bis zu 52000 verschiedenen Lösungen - und etwa 230 waren prinzipiell nicht lösbar (Mai/Juni 2010).
- Die Punkte-Bewertung wurde geändert, insbesondere wurden die A-Methoden getrennt, da man eine fehlende Zahl in Boxen einfacher (1 Punkt) sieht als in Zeilen oder Spalten (2 Punkte); und eine jeweils 9. fehlende Zahl wird gar nicht bewertet. Außerdem werden die Felder gezählt und mit je 1 Punkt bewertet, in denen zur Ausdünnung Reste eingetragen werden müssen (April/Mai 2010).
- Jetzt wurden die Erklärungen und Beispiele zum Verständnis der Lösungsstrategien vollkommen überarbeitet und dabei auch Fehler behoben (Sorry!). Vielleicht kann man das Ganze nun besser verstehen... (März 2010).
- Es wurden auch schon über 200 Stunden für die Analyse der über 20000 Beispiele aufgewendet, z.B. für die verschiedenen Beispiel-Listen (höchste Punktzahl, längste Goldene Kette, lösbar nur durch Quadrupel, usw.), - insbesondere ein paar Dutzend Prozeduren geschrieben, um das Ganze einigermaßen automatisch zu erzeugen, da es immer wieder aktualisiert wird. Auch die beiden Reduzierungsläufe kosteten einiges an Zeit... (Februar 2010).
- Endlich wurde auch die Ausdünn-Methode X-Wing programmiert (in 5 Stunden von nun insgesamt etwa 300 Stunden Programmierarbeit). Leider erbrachte das aber auch nur knapp 1% mehr Lösungen (gegenüber 15% bei der Goldenen Kette!)... Aber immerhin hat die X-Wing-Methode den Vorteil, auch bei Zellen mit mehr als 2 Kandidaten zu funktionieren (gegenüber der Goldenen Ketten) - weswegen die Programmierung doch sinnvoll ist (Januar 2010).
- Dem entsprechend wurde auch die Reihenfolge der Ausdünn-Methoden umgestellt: Zuerst kommen nun die einfachen Zeilen-/Spalten-/Box-Test-Methoden, danach erst die N-Tupel, dann X-Wing und am Ende die Goldenen Ketten (Januar 2010).
- Es wurde die Goldene Kette in einer zweiten Version programmiert: Kürzere Kette werden zuerst gefunden (Maximallänge 14 - gegenüber vorher 23). Erstaunlichstes Ergebnis überhaupt aber war, dass durch die Programmierung der Goldenen Ketten 15% mehr Lösungen gefunden werden konnten als voher - und zwar auch noch fast genau so viele wie durch die Methode der 2-Tupel (Doppel) gefunden werden! Das Verfahren ist damit eine sehr wichtige Methode, aber auch aufwändiger: Es wurden schon Sudokus mit einer Rechenzeit von über 20 Sekunden (auf dem aktuellen Webserver) gelöst (bei der ersten Version aber wesentlich länger) - 30 Sekunden stehen bei Web-Anwendungen im Allgemeinen nur zur Verfügung (Dezember 2009; erste Version mit Rekursion: November 2009).
- Die Programmierung der N-Tupel wurde verbessert, so dass nun auch N-Tupel gefunden werden, deren einzelne Mitglieder alle aus weniger als N Zahlen bestehen. Die gewählte Methode erkennt nun etwa 99.9% dieser Fälle - eine nochmals erweiterte Programmierung brachte nur ein Beispiel aus 10000 Sudokus, kostet aber 15 % mehr an Laufzeit und wird deswegen weggelassen (die Programmteile sind auskommentiert und könnten auf dem eigenen Rechner aktiviert werden)... Versteckte N-Tupel müssen nicht extra programmiert werden, da sie immer mit direkten N-Tupel korrespondieren (Oktober 2009).
- Es fehlt die Programmierung von weiteren Ausdünn-Methoden wie z.B.: Swordfish (Erweiterung von X-Wing), und Colouring und Multicolouring, die aber nicht so viel zusätzliche Sudokus lösen werden können wie die bisherigen Methoden (auch X-Wing hatte ja nicht so viel gebracht...).
Fünf Sudoku-Lösungsmethoden (A bis E)
- Einfachste Methode (Wert: 1 Punkt innerhalb Boxen, 2 Punkte innerhalb Zeilen/Spalten, 0 Punkte bei der 9. fehlenden Zahl; Farbmarkierung: Grün): Direkte Dreier-Methode oder eindeutige Stelle: Bestimme die fehlende dritte Zahl in drei zusammen liegenden (nebeneinander oder untereinander) Boxen. D.h.: Findet man in zwei von drei zusammen liegenden Boxen eine bestimmte Zahl, sucht man in der dritten Box nach einem eindeutigen Ort, an dem diese Zahl stehen kann. In vielen Fällen ist es auch einfach die einzige Stelle, an der eine bestimmte Zahl nur stehen kann, insbesondere beim Durchsuchen von Zeilen und Spalten.
Bemerkung: In knapp 95 % aller Lösungsschritte findet man eine Zahl (und den dazugehörenden Ort) mit dieser Methode, davon 90 % mit der Suche innerhalb von Boxen!
Einfacher Fall:
In der dritten Box (OR) kann die Zahl 7 nur in der dritten Zeile sein; damit bleibt die letzte Spalte als einzig möglicher Ort übrig (mit kleinem x markiert).
PS: Der Übersichtlichkeit wegen wurden viele Felder nicht ausgefüllt, da deren Inhalt ohne Bedeutung ist; ebenso fehlen im Allgemeinen die letzten Zeilen der Beispiel-Sudokus.
Komplexerer Fall:
Oft muss auch in den Spalten (bzw. Zeilen, wenn die drei Boxen untereinander liegen) nachgesehen werden, ob eine Stelle für die bestimmte Zahl frei ist. In diesem Beispiel kann die Zahl 7 wieder nur in der dritten Zeile der rechten Box (OR) liegen. Da aber in der 8. Spalte in der darunter liegenden Box (MR) schon eine 7 steht, bleibt wieder nur die letzte Spalte (mit kleinem x markiert) als Zielort übrig.
- Erweiterte oder indirekte Dreier-Methode (Wert: 4 Punkte, Farbmarkierung: Rot): Bestimme den Ort der dritten Zahl ohne genaue Kenntnis des Ortes der zweiten Zahl:
Hier nutzt man aus, dass die Position der zweiten Zahl zwar noch nicht genau bekannt ist, aber auf eine Zeile oder Spalte einer Box beschränkt werden kann. Dann folgt der Ort für die dritte Zahl analog der oben beschriebenen Methode A. Dieses Verfahren kann in bestimmten Fällen auch ohne Kenntnis der ersten Zahl funktionieren.
Einfacher Fall:
Im einfachen Fall weiß man, dass in der rechten Box (OR) die Zahl 6 nur in der zweiten Zeile sein kann, da die erste Zeile nicht in Frage kommt (wegen der 6 in Spalte 9) - die genaue Position der Zahl 6 in der mittleren Zeile von Box OR ist aber noch unbekannt. Trotzdem kann man daraus schließen, dass in der ersten Box (OL) die 6 nur in der dritten Zeile sein kann; in dieser Zeile bleibt dann nur die zweite Spalte als einzig möglicher Ort übrig (mit kleinem x markiert).
Komplexerer Fall:
Wegen der Zahl 7 in der rechten mittleren Box (MR) kann in der davor liegenden Box (MM) die 7 nicht in Zeile 5 stehen. Damit bleiben als möglicher Ort für die 7 in dieser Box nur die beiden Positionen in der Spalte 5 übrig (mit kleinem a markiert).
Nun kann man ähnlich wie im einfachen Fall folgern, dass in der darüber liegenden Box (OM) die Zahl 7 nur in der oberen Zeile sein kann (Spalte 4 oder 6), wobei die genaue Position aber noch unbekannt ist. Also muss in der rechts davon liegenden Box (OR) die 7 wieder in der 3. Zeile sein. Da aber in der 8. Spalte in der darunter liegenden Box (MR) schon eine 7 steht, bleibt wieder nur die letzte Spalte (mit kleinem x markiert) als Zielort übrig.
Alternativ kann man auch argumentieren, dass die Zahl 7 in der 3. Zeile nicht in Box OL stehen kann (in dieser Box ist schon eine 7), auch nicht in Box OM wegen der 7 irgendwo in Spalte 5 von Box MM (siehe oben, mit kleinem a markiert), aber auch nicht in Spalte 8 der Box OR (siehe oben), und somit bleibt dort nur die Spalte 9 (mit kleinem x markiert) als Zielort übrig.
- Einzig mögliche Zahl (Wert: 6 Punkte, Farbmarkierung: Blau): Einzige noch fehlende Zahl an einem bestimmtem Ort:
Man untersucht für einen Ort, welche der 9 Zahlen dort stehen könnten, wobei die Sudoku-Regeln berücksichtigt werden müssen. Bleibt nur eine Zahl übrig, hat man die Lösung für diese Stelle gefunden. Das klingt zwar einfach, ist aber nicht so leicht zu erkennen.
Beispiel: Die einzige Zahl an der Position Zeile 3 und Spalte 4 (mit kleinem x markiert) kann nur die Zahl 7 sein, weil alle anderen Zahlen schon in gleicher Zeile (1, 4, 8, 9), in gleicher Spalte (2, 5), bzw. in gleicher Box (1, 2, 3, 6) vorhanden sind.
- Vollständige Ausdünnung mit einstelliger Restzahl bzw. einziger Kandidatenzahl (Wert: 1 Basis-Punkt, Farbmarkierung: Braun): Hat man nach einem oder mehreren Ausdünnschritten einen Rest so weit verkleinert, dass er nur noch aus einer Zahl besteht, ist diese Zahl die Lösung für die betrachtete Stelle.
Ausdünnung:
Hier wird davon ausgegangen, dass zuerst versucht wird, das Sudoku ohne Anschreiben der Reste (das sind die Kandidaten, also die möglichen Zahlen für die jeweilige Stelle) zu lösen (Methoden A, B und C). Kommt man damit nicht weiter, muss man für jede freie Stelle alle Zahlen aufschreiben, die für diese Stelle in Frage kommen (also die dafür überhaupt noch möglichen Zahlen): Das sind die Kandidaten für die jeweilige Stelle, die hier als Ganzes "Rest" genannt und auch der Einfachheit halber als eine mehrstellige Zahl (ohne Komma oder andere Trennzeichen unterhalb der Eingabefelder) geschrieben werden.
Danach versucht man, diese Reste so lange "auszudünnen", also zu verkürzen, bis man zu einer eindeutigen Lösung für eine Stelle kommt (Methoden D und E). Die Ausdünn-Methoden I bis V werden im nächsten Abschnitt ausführlich beschrieben.
Beispiel:
Nach der Ausdünn-Methode I (siehe weiter unten im nächsten Abschnitt) kommt die Zahl 9 innerhalb der zweiten Zeile nur in der ersten Box (OL) vor: Daher muss die 9 dort sein (auch wenn man die Position innerhalb der zweiten Zeile noch nicht weiß) - sie kann also nicht in der dritten Zeile dieser Box noch einmal vorkommen. Daher kann man aus den Resten dieser Zeile in der Box OL den Kandidaten 9 streichen (d.h.: 249 wird zu 24, 39 wird zu 3).
Damit bleibt an der Position Zeile 3 und Spalte 3 (mit kleinem x markiert) nur noch die 3 als Kandidat übrig. Also hat man einen eindeutigen Rest an dieser Stelle gefunden.
- Vollständige Ausdünnung mit einzig auftretender Restzahl (alleine auftretender Kandidat) (Wert: 4 Basis-Punkte, Farbmarkierung: Lila): Hat man nach einem oder mehreren Ausdünnschritten mehrere Reste so weit verkleinert, dass eine bestimmte Zahl nur noch an einer einzigen Stelle innerhalb der Reste einer Zeile, einer Spalte oder einer Box vorkommt, ist diese Zahl Lösung für diese Stelle.
Beispiel:
Nach der Ausdünn-Methode III (siehe weiter unten im nächsten Abschnitt) findet man in der Box OR das Reste-Paar 79 zwei Mal. Die Zahlen 7 und 9 müssen also an diesen beiden Stellen auftreten. Damit können in allen anderen Resten dieser Box die Zahlen 7 und 9 gestrichen werden. Daraus folgt, dass an der Position Zeile 1 und Spalte 4 (mit kleinem x markiert) die Zahl 7 stehen muss.
Fünf Methoden zur Ausdünnung der Reste (I bis V)
Der Begriff der Ausdünnung zur Verkürzung der Reste wurde im vorherigen Abschnitt unter Methode D schon erlätert. Im Allgemeinen sind, um eine Lösung zu finden, immer mehrere Ausdünnschritte notwendig (bis zu 23 direkt nacheinander wurden schon beobachtet!). Manche Schritte helfen dabei nicht zur Lösungsfindung, aber das weiß man vorher nicht.
Über die Hälfte (56 %) aller hier berechneten Sudokus sind nur durch Anschreiben der Reste und anschließender Ausdünnung lösbar!
In den folgenden Beispielen werden oft nur Teile eines Sudokus mit entsprechenden Resten dargestellt, um das Ganze übersichtlicher zu machen; es sind Ausschnitte aus aktuellen Sudokus.
- Box-Test der Reste in einer Zeile oder Spalte: Man sieht in den Resten einer Box nach, ob innerhalb einer Zeile bzw. Spalte eine Zahl vorkommt, die nur genau in dieser Box auftaucht. Diese Zahl muss also innerhalb dieser Box in der gefundenen Zeile bzw. Spalte stehen (wobei die genaue Position noch unbekannt ist), sie kann dann aber aus den anderen Zeilen bzw. Spalten innerhalb dieser Box gestrichen werden. Dies ist die am häufigsten auftretende Methode, um die Reste auszudünnen: 48 %!
Bewertung: Für jedes Vorkommen gibt es 4 Punkte.
Beispiel:
Hier findet man z.B. die Zahl 1: Sie ist innerhalb der ersten Zeile nur in den Resten der rechten Box OR vorhanden (rot gefärbte Reste). Also kann man in den anderen Zeilen dieser Box diese Zahl aus den Resten streichen - das wird hier durch die Darstellung in eckigen Klammern hervorgehoben. Damit bleibt übrig:
- Zeilen-/Spalten-Test der Reste innerhalb einer Box: Man sieht in den Resten nach, ob innerhalb einer Box eine Zahl vorkommt, die nur genau in einer Zeile bzw. Spalte dieser Box auftaucht - diese Zahl muss dann in dieser Zeile bzw. Spalte dieser Box stehen (wobei die genaue Position noch unbekannt ist). Dann kann man in den anderen Resten dieser Zeile bzw. Spalte außerhalb der Box diese Zahl streichen.
Bewertung: Für jedes Vorkommen gibt es 6 Punkte.
Beispiel:
Hier findet man z.B. die Zahl 1: Sie ist in den Resten der Box OL nur in der zweiten Zeile vorhanden (rot gefärbte Reste), nicht in den anderen Zeilen dieser Box. Also kann man in den anderen Resten dieser Zeile in den anderen beiden Boxen diese Zahl streichen (durch die Darstellung in eckigen Klammern hervorgehoben). Damit bleibt übrig:
- Man sucht in einer Zeile, Spalte oder Box nach N-Tupel, also danach, dass bestimmte Kandidaten an nur wenigen Stellen auftreten: Genauer heißt das, dass man N zusammen gehörende Stellen (innerhalb einer Zeile, Spalte oder Box) sucht, in denen genau N verschiedene Kandidaten auftreten. Wenn an N Stellen alle oder ein Teil der N betrachteten Kandidaten stehen, können diese Kandidaten nur an diesen N Stellen auftreten (wobei die Verteilung noch unbekannt ist), diese Kandidaten können dann aber aus den anderen Resten gestrichen werden.
Es gibt 2-Tupel (Doppel), 3-Tupel (Tripel), 4-Tupel (Quadrupel), 5-Tupel (Pentupel), 6-Tupel und 7-Tupel (8-Tupel machen keinen Sinn, da dann die neunte Zahl eindeutig ist und somit direkt gefunden werden kann).
Bewertung: Für jedes N-Tupel gibt es 2*N Punkte.
Einfaches Beispiel mit 2-Tupel (Doppel):
Hier findet man z.B. in der ersten Zeile das 2-Tupel 79 (Doppel: 79, 79), als rot gefärbte Reste markiert; die beiden Kandidaten 7 und 9 müssen also an diesen beiden Stellen sein. Also kann man in den anderen Resten dieser Zeile diese beiden Zahlen streichen (durch die Darstellung in eckigen Klammern hervorgehoben). Damit bleibt übrig:
Kurzes Beispiel mit 3-Tupel (Tripel):
Hier findet man in der Box OM (und in der 5. Spalte) das 3-Tupel 235 (Tripel: 235, 23, 25). Damit können in allen anderen Resten dieser Box (und in der 5. Spalte) die Zahlen 2, 3 und 5 gestrichen werden.
Relativ häufig (in etwa 10% aller N-Tupel-Fälle) findet man noch 4-Tupel (z.B. das Quadrupel 1479 mit: 147, 17, 79, 49), aber 5-Tupel, 6-Tupel und 7-Tupel sind sowohl noch seltener (2 %) als auch schwieriger zu erkennen...
- X-Wing-Methode: Man sieht in den Resten nach, ob es zwei Zeilen gibt, in denen in den Resten eine bestimmte Zahl in genau zwei Spalten vorkommt, wobei aber die Position der gefundenen Spalten in beiden Zeilen übereinstimmen muss. Dann weiß man, dass diese Zahl entweder als erste in der ersten Zeile und als zweite in der zweiten Zeile vorkommen muss oder umgekehrt als zweite in der ersten Zeile und dann als erste in der zweite Zeile. Diese 4 Möglichkeiten bilden das "X". Also kann man in den Spalten, die zu dem "X" gehören, diese Zahl in allen anderen Zeilen streichen.
Das Ganze gilt entsprechend für Spalten: Man sieht in den Resten nach, ob es zwei Spalten gibt, in denen in den Resten eine bestimmte Zahl in genau zwei Zeilen vorkommt, wobei aber die Position der gefundenen Zeilen in beiden Spalten übereinstimmen muss. Dann kann man in den Zeilen, die zu dem "X" gehören, diese Zahl in allen anderen Spalten streichen.
Bewertung: Für jedes Vorkommen gibt es 10 Punkte.
Beispiel:
Hier findet man z.B. für die Zahl 5: Sie ist in den Resten der ersten Zeile nur in Spalte 2 und 5 vorhanden, aber auch in fünften Zeile nur in Spalte 2 und 5 (diese Positionen bilden das namensgebende "X"). An zwei gegenüberliegenden Stellen des "X" muss also die Zahl 5 liegen (rot gefärbte Reste), und deshalb kann in den anderen Zeilen die 5 in den Spalten 2 und 5 gestrichen werden (durch die Darstellung in eckigen Klammern hervorgehoben). Damit bleibt übrig:
- Goldene Kette:
Eine Goldene Kette (Golden Chain, manchmal auch Remote Pairs genannt) ist eine Reihe von Paaren vom Typ ab, bc, cd, de, ef, ..., xy, yz, za, von denen jeweils zwei aufeinanderfolgende Paare in der gleichen Zeile, Spalte oder Box sind und die eine gemeinsame Zahl besitzen. Wenn die Zahl des ersten Paars, die nicht im zweiten Paar vorkommt (hier bei ab also a) mit der Zahl des letzten Paars, die nicht im vorletzten Paar vorkommt (bei za also auch a), übereinstimmt, dann kann man alle Zahlen a streichen, die sowohl von dem ersten als auch dem letzten Paar aus "gesehen" werden, also in der jeweils gleichen Zeile, Spalte oder Box liegen, weil die Zahl a auf jeden Fall entweder an der Stelle des ersten oder des letzten Paars vorkommt (wenn a im ersten Paar vorkommt, ist das offensichtlich; kommt aber b vor, so muss im zweiten Paar c sein, daher im dritten Paar d usw., bis zu z im vorletzten Paar, also a im letzten Paar).
Bewertung: Hierbei gibt es 3*N Punkte entsprechend der Länge N der gefundenen Kette (3 bis 14 = längste bisher gefundene Kette, aber längere sind durchaus vorhanden - Längen über 20 wurden schon beobachtet).
Literatur:
Download des Artikels von Eduyng Castan: http://www.coverpop.com/sfiles/Sudoku-GoldenChains.pdf
Ähnlicher Artikel von Mihail Iusut: http://www.scanraid.com/sudoku/Remote_Pairs_and_XY_Chains.pdf
Beispiel einer Goldenen Kette (nach wenigen anderen Ausdünnschritten):
Die gefundene Goldene Kette ist: (1:2)27 - (1:7)73 - (4:7)31 - (4:1)12.
Beachte, dass hier die Reihenfolge der Zahlen innerhalb eines Doppels dem Verkettungs-Prinzip angepasst ist: Also 73 statt der sonst aufsteigenden Reihenfolge 37 und 31 statt sonst 13. Das jeweilige Ende der Goldenen Kette ist also die Zahl 2, die daher im Feld (2:1), also Zeile 2 und Spalte 1, und im Feld (5:2), also Zeile 5 und Spalte 2, gestrichen werden kann.
Identisch mit der gefundenen Goldenen Kette ist auch die in umgekehrter Reihenfolge: (4:1)21 - (4:7)13 - (1:7)37 - (1:2)72.
Es wurden 16 Sudokus gefunden, die in den im Web zur Verfügung stehenden 30 Sekunden nicht gelöst werden konnten. Hier drei Beispiele einer Batch-Rechnung - auffallend die immer länger werdenden Ketten mit immer mehr Alternativen (bei allen bisher gelösten Sudokus waren nicht mehr als 2770 Ketten einer Länge aufgetreten):
- 000030080300000409054006700060178000400000510003000027007001000800300900092780000
Nach 7 gefundenen Goldenen Ketten waren noch 25 Paare übrig. Daraus ergaben sich dann 210 Ketten der Länge 3 (aber keine Goldenen), 424 der Länge 4, ..., 18662 der Länge 13. Dann wurde aber abgebrochen, da der Programm-Hauptspeicher (hier 8 MB) überschritten wurde. Dieses Sudoku ist trotzdem eindeutig lösbar (bei 2 Einsetzversuchen gefunden), wenn auch bisher nicht mit diesem Programm...
- 042000590809000002000209000206040000050000614004076000000608009408000003061000750
Nach 8 gefundenen Goldenen Ketten waren noch 30 Paare übrig. Daraus ergaben sich dann 134 Ketten der Länge 3 (aber keine Goldenen), ..., 90886 der Länge 18, 86514 der Länge 19. Dann wurde aber - nach über 1 Stunde - mit "Bus error" abgebrochen. Auf einem anderen Rechner wurde weiter gerechnet bis 6436 Ketten der Länge 25, 1160 der Länge 25, dann aber keine Kette der Länge 27. Das führte zu Einsetzversuchen, bei der es nach 6 Versuchen in 3 Rekursionen zu 4 Lösungen führte => also ist dieses kein wirkliches Sudoku.
- 568002070003070090000500200000007100204089007005300000001005302080060900050900040
Nach 5 gefundenen Goldenen Ketten waren noch 27 Paare übrig. Daraus ergaben sich dann 296 Ketten der Länge 3 (aber keine Goldenen), 628 der Länge 4, ..., 268106 der Länge 15, 355184 (!) der Länge 16. Dann wurde aber - nach 72 Minuten - abgebrochen, da der Programm-Hauptspeicher von 128 MB überschritten wurde. Einsetzversuche ergaben nach 2 Versuchen 2 Lösungen => also ist dieses kein wirkliches Sudoku.
Allgemeines
Die Punktzahlen sind so einigermaßen den Schwierigkeitsgraden angepasst. Sie hängen aber auch von der Reihenfolge im Programm ab - so ergibt eine andere Reihenfolge im Suchen von Mustern in den Resten etwas andere Werte. Gerade die Bewertung beim Ausdünnen ist schwierig: es werden alle Ausdünnschritte mitgezählt, egal, ob sie am Ende etwas bringen oder nicht. Aber das weiß man ja auch beim Lösen mit Hand vorher nicht...
Ab 50 Punkten wird es interessant, über 75 Punkte ist es schon schwerer, über 100 Punkte wirklich schwer, und über 125 Punkte ist schon eine Herausforderung. Der Mittelwert aller Sudokus liegt bei 106 Punkten (der Hauptwert liegt um 60 Punkte ohne Ausdünnung (siehe Kurve), und um 144 Punkte mit Ausdünnung (siehe Kurve)). Aktuelles Maximum mit schwer zu überbietenden 516 Punkten (sehr viel mehr Punkte sind wohl kaum erreichbar?!), also das bisher am schwersten (hier) gelöste Sudoku:
- Bisher: 454 Punkte aus 23 Zahlen (erste einfache Schritte: 11, Verhältnis 7.8): - A: 50, B: 0, C: 2, D: 5, E: 1, Ausduennschritte: 28, N-Tupel: 3 (bis Tripel), X-Wings: 0, Goldene Ketten: 16 (maximal 10 lang) - in 17 sec:
000000070003805906050403080047000320000000000020000100000204050506100000080000000
- Neu (Dank an Michael Jentsch): 516 Punkte aus 25 Zahlen (erste einfache Schritte: 6, Verhältnis 9.2): - A: 48, B: 0, C: 1, D: 4, E: 3, Ausduennschritte: 28, N-Tupel: 1 (bis Tripel), X-Wings: 0, Goldene Ketten: 17 (maximal 11 lang) - in 18 sec:
507000040003100009000000800000503100002010950070004600006000000380000000009280306
- PS: Ohne Goldene Ketten liegt das Maximum bei 217 Punkten aus 17 Zahlen (erste einfache Schritte: 2, Verhältnis 3.4): - A: 51, B: 2, C: 0, D: 8, E: 3, Ausduennschritte: 20, N-Tupel: 4 (bis Quadrupel), X-Wings: 0, Goldene Ketten: 0 - in 1.5 sec:
008000000000002540031060000000000070000400200063000000000000001500007000000080003
Das 454-Punkte-Sudoku wurde durch Reduzierung aller bis dahin gelösten etwa 9200 Sudokus in einem Aufwand von über 2100 Stunden Rechenzeit (insgesamt wurden fast 3 Millionen Sudokus durchgerechnet) gefunden... Reduzierung heißt hier: Lässt man aus einem Sudoku mit N Zahlen jeweils eine Zahl aus, so entstehen N Sudokus mit jeweils N-1 Zahlen, die alle berechnet werden. Gibt es dabei Lösungen, macht man die gleiche Prozedur mit dem berechneten Sudoku, das die höchste Punktzahl hat, usw., bis es keine Lösung mehr gibt.
Etwas Statistik:
Bei bisher nun insgesamt etwa 22100 gelösten Sudokus wurden etwa 1197000 mal die Methoden A bis E eingesetzt; davon 94.5% für Methode A, 2.8% (0.8% + 2.0%) Methode B+C, und 2.7% (1.9% + 0.8%) Methode D+E (also Ausdünnung). Die Ausdünn-Methoden werden zwar selten gebraucht, sind aber trotzdem zur Lösung von knapp der Hälfte aller Sudokus notwendig!
Genauer gesehen waren etwa 26% der Sudokus allein mit Methode A lösbar, insgesamt 54% nur mit den Methoden A+B+C. Das sind die einfacheren Sudokus, obwohl dabei immerhin auch etwa 100 Punkte erreicht werden können - bisheriges Maximum: 96, also die (hier) schwierigsten Sudokus ohne Ausdünnung:
- 96 Punkte aus 23 Zahlen (erste einfache Schritte: 58, Verhältnis 1.7): - A: 48, B: 0, C: 10, D: 0, E: 0, Ausduennschritte: 0, N-Tupel: 0, X-Wings: 0, Goldene Ketten: 0 - in 0.5 sec:
371600500000000300025000700054000000000102090200008004100000000000029001000830000
- 96 Punkte aus 24 Zahlen (erste einfache Schritte: 57, Verhältnis 1.7): - A: 47, B: 0, C: 10, D: 0, E: 0, Ausduennschritte: 0, N-Tupel: 0, X-Wings: 0, Goldene Ketten: 0 - in 0.8 sec:
000050007940000020000000040001200098086045000000100000600037010002060000038000400
Obwohl in einem weiteren Aufwand von etwa 550 Stunden Rechenzeit (insgesamt fast 2 Millionen Sudokus wurden durchgerechnet) alle Sudokus ohne Ausdünnung nach einem analogen Verfahren wie oben beschrieben reduziert wurden, konnte kein Sudoku gefunden werden, das mehr als 100 Punkte hat. Es dürfte also schwierig sein, ein Sudoku ohne Ausdünnung mit höherer Punktzahl zu finden.
Für die etwa 10200 Sudokus (46% der Fälle), bei denen die Kandidaten/Reste analysiert werden mussten, waren insgesamt etwa 81000 Ausdünnschritte notwendig (davon 48 % Box-Tests, 7 % Zeilen-/Spalten-Tests, 20.5 % N-Tupel, 2.5 % X-Wings, 22 % Goldene Ketten). In einem Fall waren es 23 Ausdünnschritte hintereinander, bis eine Zahl gefunden werden konnte, und in einem anderen Fall insgesamt 33 Schritte!
Dabei konnten etwa 1350 alleine durch die einfachen Box-Test- und Zeilen-/Spalten-Test-Methoden gelöst werden. Etwa 2950 Sudokus wurden durch die N-Tupel-Methode (darunter ein 7-Tupel!), nur 260 Sudokus durch die X-Wing-Methode (erstaunlich wenig!, aber immerhin wurden insgesamt etwa 1900 X-Wings gefunden), jedoch 5650 durch die Goldene Kette gelöst (bei insgesamt gut 17700 gefundenen Goldenen Ketten, und in einzelnen Sudokus bis zu 20 Goldenen Ketten bzw. maximal mit der Länge 14) - insofern verwundert es, dass dieses Verfahren so wenig bekannt ist!
Literatur:
Allgemeine Lösungsstrategien bei: http://www.sadmansoftware.com/sudoku/solvingtechniques.htm
oder bei: http://hodoku.sourceforge.net/de/techniques.php