Sudoku Solver
Auflistung aller Einzelschritte inklusive genauer Erklärungen und Punkte-Bewertung - mit Einzelzahl-Ketten, Goldenen Ketten und Ausschluss-Rechtecken und Ausschluss-Schleifen; NEU: mit offensichtlichen 2-Tupeln und mit Anzeigen aller Alternativen
Geben Sie die Ausgangszahlen ein (1..9)
Prinzipen zur Lösung von Sudokus
Sudoku-Grundregel: Es sollen in jeder Zeile, in jeder Spalte und in jeder Box (3x3-Kästchen) alle Zahlen von 1 bis 9 genau einmal vorkommen. Die Zeilen und Spalten werden hier von oben links an mit 1 bis 9 durchnummeriert, die Boxen werden mit OL (oben links), OM (oben Mitte), OR (oben rechts), ML (Mitte links), MM (Mitte Mitte), ..., bis UR (unten rechts) bezeichnet.
Dieses Programm benutzt 6 Lösungsverfahren mit verschiedener Punkte-Gewichtung, wobei für die Ausdünnung 6 verschiedene Analysemethoden (ebenfalls mit unterschiedlichen Punkten gewichtet) programmiert wurden.
Dabei wird nach einem Treffer immer wieder bei der einfachsten Methode begonnen, und zusätzlich in der Reihenfolge: Suche immer erst in Boxen (was wegen dem engeren Gesichtsfeld einfacher zu erkennen ist) - dadurch sind diese Fälle immer am häufigsten -, dann in Zeilen, zuletzt in Spalten.
Bei der Lösung und der Bewertung wird davon ausgegangen, dass zuerst versucht wird, das Sudoku ohne Anschreiben der Kandidaten (Reste) zu lösen, da beim Arbeiten mit Hand dies zuerst einmal der natürliche Weg ist - im Gegensatz zu den sonst üblichen, im Internet zu findenden Sudoku-Solver (z.B. HoDoKu, SudokuExplainer), die sofort alle möglichen Kandidaten für alle Zellen aufschreiben! Es kommen also zuerst nur die Methoden A, B, C und D zum Einsatz. Erst dann, wenn man damit nicht weiter kommt, muss man für jede Zelle alle Zahlen aufschreiben, die dafür in Frage kommen: die Kandidaten, die hier als Ganzes oft Rest genannt und auch der Einfachheit halber als eine mehrstellige Zahl (ohne Komma oder andere Trennzeichen) geschrieben werden - und das ist per Hand einiges an Arbeit (dafür gibt es auch extra Punkte). Danach versucht man, diese Reste so lange auszudünnen, also zu verkürzen, bis man zu einer eindeutigen Lösung für eine Zelle kommt (Methoden E und F). Das Ausdünnen (Kandidaten-Reduzierung) wird hier mit den wichtigsten 6 Methoden versucht, die weiter unten erklärt werden.
Trial- and Error-Verfahren werden nicht benutzt, sondern nur logisch nachvollziehbare Methoden - wobei aber auf Verfahren, die von Hand kaum ausführbar sind (z.B. Zwangsketten, Forcing Chains), verzichtet wird. Dieses Programm soll nicht ein Sudoku einfach lösen, sondern alle Lösungsschritte - zum Nachvollziehen - aufzeigen. Und: Ein "richtiges" Sudoku sollte auf jeden Fall eindeutig gelöst werden können.
Programm-Neuigkeiten
- Das Programm wurde in größerem Maße umgestellt: Es wurde verschiedene Methoden (D) programmiert, die darauf beruhen, dass man oft 2-Tupel (zwei Paare) direkt sieht, ohne dass man alle Kandidaten explizit anschreiben muss. Das betrifft sowohl das Auffinden einer Zahl an einer eindeutigen Stelle (Methode A) als auch als einzige Zahl an einer bestimmten Stelle (jetzt Methode B - früher C genannt). Außerdem werden nun alle Ergebnisse eines Sudoku-Standes aufgeführt, die gleichzeitig gefunden werden können. Darüber hinaus wurden auch die drei wichtigsten Fälle der Ausschluss-Schleifen (Verallgemeinerung der Ausschluss-Rechtecke auf 6 zellen) programmiert (April/Mai 2011).
- Die Aussagen der B-Methode wurde stark verbessert (in den meisten Fällen werden jetzt nur noch die zur Lösung notwendigenen Begründungen werden angezeigt) und dazu auch die Reihenfolge der ersten Methoden geändert: Zuerst A3, dann die B-Methoden (jetzt mit 2 Punkten pro aussagefähigen Begründungen; und falls es auch gleichzeitig eine A-Methode gibt, wird diese auch genannt und bei der Bewertung wird der kleinste Punktwert benutzt), dann erst A1 und A2, und am Ende C, weil dies der natürlichen Reihenfolge entspricht, wenn man - wie das Ziel dieser Software ist - möglichst ohne Anschreiben der Reste/Kandidaten auskommen will (März 2011).
- Ohne ausführliche Beschreibung wird als letztes die Ausdünn-Methode Ausschluss-Rechteck (Unique Rectangle) eingeführt, die aber darauf basiert, dass das Sudoku eindeutig lösbar sein muss und insofern eine umstrittene Methode ist. Sie soll hier trotzdem angeboten werden. Genaueres siehe bei http://hodoku.sourceforge.net/de/tech_ur.php.
Dazu etwas Statistik:
Von insgesamt 1210923 zur Verfügung stehenden Sudokus können- 993056 nur mit den einfachen Methoden A und C gelöst werden
- 110589 Sudokus können mit den hier programmierten Ausdünn-Methoden gelöst werden
- 107278 Sudokus können mit diesem Programm nicht gelöst werden; sie benötigen in der Trial&Error-Version bis zu 338 Versuche in bis zu 16 Feldern, um gelöst werden zu können. Mit einer abgewandelten Forcing-Chain-Methode konnten davon aber 100554 Sudokus gelöst werden, aber 6724 Sudokus bleiben weiterhin ungelöst, darunter AI Escargo, Easter Monster und Golden Nugget.
Bei den 110589 mit Ausdünnen lösbaren Sudokus werden folgende Methoden benutzt:- 53.5 % Box- und Zeilen-/Spalten-Tests
- 16.5 % N-Tupel
- 12.0 % Einzelzahl-Ketten
- 16.5 % Goldene Ketten
- 1.5 % Ausschluss-Rechtecke (dabei 75 % für Typ 7, 1, und 4)
Man sieht weiterhin die Bedeutung der Goldenen Ketten, aber auch, dass spezielle Methoden wie die der Ausschluss-Rechtecke nicht so sehr viel bringen (8300 vorher nicht lösbare Sudokus wurden damit gelöst); analoges gilt auch für andere Methoden wie Fast Gesperrte Mengen (Almost Locked Sets) oder Zwangsketten (Forcing Chains) (Februar 2011).
- Da die X-Wing-Methode keine bedeutende Ausdünnmethode war, wurde ein Verfahren, das diese Methode als Sonderfall enthält, eingebaut: die Einzelzahl-Ketten-Methode (Single Digit Pattern). Damit konnten etwa 13400 der bisher knapp 129000 nicht lösbaren Sudokus erfolgreich berechnet werden. Erstaunlicherweise wurden bisher keine Ketten mit mehr als 8 Gliedern gefunden, wenn sie auch gleichzeitig zu einer Lösung führen sollte - nur bei 6 Sudokus wurden Ketten der Länge 10 gesehen (Dezember 2010/Januar 2011).
- Inzwischen wurden über 1210000 Sudokus gerechnet, von denen 1081000 (90 %) lösbar waren; d.h. 129000 sind mit dieser Software bisher nicht lösbar - darunter auch die bisher bekannten schwierigsten Sudokus überhaupt (AI Escargo, Easter Monster und Golden Nugget - Dank an Peter Frei!). Dazu müssten mehr Verfahren implementiert werden, es ist aber schwierig zu sagen, welche von den etwa 50 bekannten Verfahren sinnvoll sind, da sie ja auch mit Hand durchführbar sein sollen (November 2010).
- Die bei http://sourceforge.net/projects/php-sudoku/ gefundenen 1 Million Sudokus (Dank an Michael Jentsch) wurden durchgerechnet. Sie sind aber etwas einfacher als die hier bisher gesammelten mehr als 22000 Sudokus, denn 965351 Sudokus konnte ohne Ausdünnung gerechnet werden, 30420 Sudokus (3 %) konnten nur mit Ausdünnung gelöst werden, und nur 4229 (0.4 %) Sudokus konnten mit diesem Programm nicht gelöst werden, hatten aber eine eindeutige Lösung, die sich durch Trial&Error aber im Allgemeinen auch sehr einfach finden ließ. Interessant wieder: X-Wings waren 4483 dabei, aber Goldene Ketten 47581, fast 11 Mal so viel (August 2010).
- Die jeweils neu gefundene Zahl wird mit spitzen Klammern, also z.B. >7< markiert (Juli 2010).
- Die Beispiele wurden in ihrem Aufbau verändert und auf eine extra Webseite gebracht, damit die eigentliche Seite nicht zu lang ist (Juni 2010).
- Jetzt gibt es die Möglichkeit, ein Sudoku, das mit den hier programmierten Methoden nicht gelöst werden kann, auf eindeutige Lösbarkeit testen zu lassen. Von 3400 untersuchten hier nicht lösbaren Sudokus waren etwa 630 eindeutig lösbar, über 2500 hatten mehr als eine Lösung - mit bis zu 52000 verschiedenen Lösungen - und etwa 230 waren prinzipiell nicht lösbar (Mai/Juni 2010).
- Die Punkte-Bewertung wurde geändert, insbesondere wurden die A-Methoden getrennt, da man eine fehlende Zahl in Boxen viel einfacher (1 Punkt) sieht als in Zeilen oder Spalten (NEU: 3 Punkte); und eine jeweils 9. fehlende Zahl wird gar nicht bewertet. Außerdem werden die Felder gezählt und mit je 1 Punkt bewertet, in denen zur Ausdünnung Reste/Kandidaten eingetragen werden müssen (April/Mai 2010).
- Jetzt wurden die Erklärungen und Beispiele zum Verständnis der Lösungsstrategien vollkommen überarbeitet und dabei auch Fehler behoben (Sorry!). Vielleicht kann man das Ganze nun besser verstehen... (März 2010).
- Es wurden auch schon über 200 Stunden für die Analyse der über 20000 Beispiele aufgewendet, z.B. für die verschiedenen Beispiel-Listen (höchste Punktzahl, längste Goldene Kette, lösbar nur durch Quadrupel, usw.), - insbesondere ein paar Dutzend Prozeduren geschrieben, um das Ganze einigermaßen automatisch zu erzeugen, da es immer wieder aktualisiert wird. Auch die beiden Reduzierungsläufe kosteten einiges an Zeit... (Februar 2010).
- Endlich wurde auch die Ausdünn-Methode X-Wing programmiert (in 5 Stunden von nun insgesamt etwa 300 Stunden Programmierarbeit). Leider erbrachte das aber auch nur knapp 1% mehr Lösungen (gegenüber 15% bei der Goldenen Kette!)... Aber immerhin hat die X-Wing-Methode den Vorteil, auch bei Zellen mit mehr als 2 Kandidaten zu funktionieren (gegenüber der Goldenen Ketten) - weswegen die Programmierung doch sinnvoll ist (Januar 2010).
- Dem entsprechend wurde auch die Reihenfolge der Ausdünn-Methoden umgestellt: Zuerst kommen nun die einfachen Zeilen-/Spalten- und Box-Test-Methoden, danach erst die N-Tupel, dann X-Wing und am Ende die Goldenen Ketten (Januar 2010).
- Es wurde die Goldene Kette in einer zweiten Version programmiert: Kürzere Kette werden zuerst gefunden (Maximallänge 14 - gegenüber vorher 23). Erstaunlichstes Ergebnis überhaupt aber war, dass durch die Programmierung der Goldenen Ketten 15% mehr Lösungen gefunden werden konnten als voher - und zwar auch noch fast genau so viele wie durch die Methode der 2-Tupel (Doppel) gefunden werden! Das Verfahren ist damit eine sehr wichtige Methode, aber auch aufwändiger: Es wurden schon Sudokus mit einer Rechenzeit von über 20 Sekunden (auf dem aktuellen Webserver) gelöst (bei der ersten Version aber wesentlich länger) - 30 Sekunden stehen bei Web-Anwendungen im Allgemeinen nur zur Verfügung (Dezember 2009; erste Version mit Rekursion: November 2009).
- Die Programmierung der N-Tupel wurde verbessert, so dass nun auch N-Tupel gefunden werden, deren einzelne Mitglieder alle aus weniger als N Zahlen bestehen. Die gewählte Methode erkennt nun etwa 99.9% dieser Fälle - eine nochmals erweiterte Programmierung brachte nur ein Beispiel aus 10000 Sudokus, kostet aber 15 % mehr an Laufzeit und wird deswegen weggelassen (die Programmteile sind auskommentiert und könnten auf dem eigenen Rechner aktiviert werden)... Versteckte N-Tupel müssen nicht extra programmiert werden, da sie immer mit direkten N-Tupel korrespondieren (Oktober 2009).
- Es fehlt die Programmierung von weiteren Ausdünn-Methoden wie z.B.: Swordfish (Erweiterung von X-Wing), und Colouring und Multicolouring, die aber nicht so viel zusätzliche Sudokus lösen werden können wie die bisherigen Methoden (auch X-Wing hatte ja nicht so viel gebracht...). Die verschiedenen Forcing Chain-Verfahren sind im Prinzip Trial&Error-Methoden und werden daher nicht implementiert.
Sechs Sudoku-Lösungsmethoden (A bis F)
- Einfachste Methode (Wert: 1 Punkt innerhalb Boxen, 3 Punkte innerhalb Zeilen/Spalten, 0 Punkte bei der 9. fehlenden Zahl; Farbmarkierung: Grün): Direkte Dreier-Methode oder eindeutige Stelle (Hidden Single): Bestimme die fehlende dritte Zahl in drei zusammen liegenden (nebeneinander oder untereinander) Boxen. D.h.: Findet man in zwei von drei zusammen liegenden Boxen eine bestimmte Zahl, sucht man in der dritten Box nach einem eindeutigen Ort, an dem diese Zahl stehen kann. In vielen Fällen ist es auch einfach die einzige Stelle, an der eine bestimmte Zahl nur stehen kann, insbesondere beim Durchsuchen von Zeilen und Spalten.
Bemerkung: In knapp 95 % aller Lösungsschritte findet man eine Zahl (und den dazugehörenden Ort) mit dieser Methode, davon 90 % mit der Suche innerhalb von Boxen!
Einfacher Fall:
In der dritten Box (OR) kann die Zahl 7 nur in der dritten Zeile sein; damit bleibt die letzte Spalte als einzig möglicher Ort übrig (mit kleinem x markiert).
PS: Der Übersichtlichkeit wegen wurden viele Felder nicht ausgefüllt, da deren Inhalt ohne Bedeutung ist; ebenso fehlen im Allgemeinen die letzten Zeilen der Beispiel-Sudokus.
Komplexerer Fall:
Es kann auch in den Zeilen und Spalten nachgesehen werden, ob eine Stelle für die bestimmte Zahl frei ist. In diesem Beispiel kann die Zahl 7 wieder nur in der dritten Zeile der rechten Box (OR) liegen. Da aber in der 8. Spalte in der darunter liegenden Box (MR) schon eine 7 steht, bleibt wieder nur die letzte Spalte (mit kleinem x markiert) als Zielort übrig.
- Einzig mögliche Zahl (Wert: 5 Punkte, Farbmarkierung: Blau): Einzige noch fehlende Zahl an einem bestimmtem Ort (Naked Single):
Man untersucht für einen Ort, welche der 9 Zahlen dort stehen könnten, wobei die Sudoku-Regeln berücksichtigt werden müssen. Bleibt nur eine Zahl übrig, hat man die Lösung für diese Stelle gefunden. Das klingt zwar einfach, ist aber nicht so leicht zu erkennen.
Beispiel: Die einzige Zahl an der Position Zeile 3 und Spalte 4 (mit kleinem x markiert) kann nur die Zahl 7 sein, weil alle anderen Zahlen schon in gleicher Zeile (1, 4, 8, 9), in gleicher Spalte (2, 5), bzw. in gleicher Box (1, 2, 3, 6) vorhanden sind.
Beispiele mit vielen B-Fällen:
Mit 11 B-Fällen ohne Ausdünnung: 030201060570000098000000000640090005000002000920610040000000000210040083090007010
Mit 11 B-Fällen mit Ausdünnung: 160005907840000000050100002095400010000000000700509000900306058000907600000000000
- Erweiterte oder indirekte Dreier-Methode (Wert: 2 Punkte mal Anzahl der Begründungen, Farbmarkierung: Rot): Bestimme den Ort der dritten Zahl ohne genaue Kenntnis des Ortes der zweiten Zahl (entspricht dem hier offensichtlichen Zeilen-/Spalten-Test, siehe unter Ausdünnen):
Hier nutzt man aus, dass die Position der zweiten Zahl zwar noch nicht genau bekannt ist, aber auf eine Zeile oder Spalte einer Box beschränkt werden kann. Dann folgt der Ort für die dritte Zahl analog der oben beschriebenen Methode A. Dieses Verfahren kann in bestimmten Fällen auch ohne Kenntnis der ersten Zahl funktionieren. Diese Methode ist oft einfacher zu sehen als die A1- und A2-Methoden (einzige Position in einer Zeile oder Spalte), wenn es nur eine Begründung gibt.
Einfacher Fall:
Im einfachen Fall weiß man, dass in der rechten Box (OR) die Zahl 6 nur in der zweiten Zeile sein kann, da die erste Zeile nicht in Frage kommt (wegen der 6 in Spalte 9) - die genaue Position der Zahl 6 in der mittleren Zeile von Box OR ist aber noch unbekannt. Trotzdem kann man daraus schließen, dass in der ersten Box (OL) die 6 nur in der dritten Zeile sein kann; in dieser Zeile bleibt dann nur die zweite Spalte als einzig möglicher Ort übrig (mit kleinem x markiert).
Komplexerer Fall:
Wegen der Zahl 7 in der rechten mittleren Box (MR) kann in der davor liegenden Box (MM) die 7 nicht in Zeile 5 stehen. Damit bleiben als möglicher Ort für die 7 in dieser Box nur die beiden Positionen in der Spalte 5 übrig (mit kleinem a markiert).
Nun kann man ähnlich wie im einfachen Fall folgern, dass in der darüber liegenden Box (OM) die Zahl 7 nur in der oberen Zeile sein kann (Spalte 4 oder 6), wobei die genaue Position aber noch unbekannt ist. Also muss in der rechts davon liegenden Box (OR) die 7 wieder in der 3. Zeile sein. Da aber in der 8. Spalte in der darunter liegenden Box (MR) schon eine 7 steht, bleibt wieder nur die letzte Spalte (mit kleinem x markiert) als Zielort übrig.
Alternativ kann man auch argumentieren, dass die Zahl 7 in der 3. Zeile nicht in Box OL stehen kann (in dieser Box ist schon eine 7), auch nicht in Box OM wegen der 7 irgendwo in Spalte 5 von Box MM (siehe oben, mit kleinem a markiert), aber auch nicht in Spalte 8 der Box OR (siehe oben), und somit bleibt dort nur die Spalte 9 (mit kleinem x markiert) als Zielort übrig.
Beispiele mit vielen C-Begründungen:
Wegen ... und ... daher ... und ... daher ... : 000000000000000012003045000000000400010600000700200080000170060045000000800000000
Wegen ... daher ... und ... daher ... daher... : 000602000030000080000705400501000604000000000709000501002409800040000010000801000
Wegen ... daher ... daher ... und ... daher ... : 000908000003105200090000070160000042000000000240000096050000010002504800000706000
- Offensichtliche 2-Tupel (Doppel) (Wert: 5 Punkte, Farbmarkierung: Gelbgrün): In vielen Fällen sieht man zwei zusammengehörende Zellen, in denen zwei bestimmte Kandidaten nicht vorkommen können, weil sie in den anderen Zellen der Zeile, Spalte oder Box schon vorkommen. Diese werden hier offensichtliche 2-Tupel genannt und ermöchen das Auffinden von Zahlen, ohne dass alle Kandidaten aufgeschrieben werden müssen. Dabei gibt es drei Arten:
Methode D1/D2/D3 analog A1/A2/A3 - Beispiel: Wegen des offensichtlichen 2-Tupels 15 kann die einzige Zahl an der Position Zeile 2 und Spalte 6 (mit kleinem x markiert) nur die Zahl 7 sein.
Methode D0 analog B0 - Beispiel: Durch das offensichtliche 2-Tupel 48 kann ausgeschlossen werden, dass die Zahlen dieser 2-Tupel 4 und 8 an der betrachteten Stelle (mit kleinem x markiert) liegen; daher kann dort nur die Zahl 9 sein.
Methode D4 - Beispiel: Die zwei offensichtlichen, aber verschiedenen 2-Tupel 17 und 47 haben eine gemeinsame Zelle (mit kleinem x markiert): Dann kann diese Zelle nur den gemeinsamen Kandidaten haben.
In der mittleren Reihe der linken Box können 1 und 7 nicht vorkommen; in der letzten Reihe können 4 und 7 nicht in der rechten Box liegen: Die einzige Zahl an der mit kleinem x markierten Stelle kann also nur die den beiden Paaren gemeinsame Zahl 7 sein.
- Vollständige Ausdünnung mit einzig auftretender Restzahl (alleine auftretender Kandidat) (Wert: 4 Basis-Punkte, Farbmarkierung: Lila): Hat man nach einem oder mehreren Ausdünnschritten mehrere Reste so weit verkleinert, dass eine bestimmte Zahl nur noch an einer einzigen Stelle innerhalb der Reste einer Zeile, einer Spalte oder einer Box vorkommt, ist diese Zahl Lösung für diese Stelle.
Ausdünnung:
Hier wird davon ausgegangen, dass zuerst versucht wird, das Sudoku ohne Anschreiben der Reste (das sind die Kandidaten, also die möglichen Zahlen für die jeweilige Stelle) zu lösen (Methoden A, B, C und D). Kommt man damit nicht weiter, muss man für jede freie Stelle alle Zahlen aufschreiben, die für diese Stelle in Frage kommen (also die dafür überhaupt noch möglichen Zahlen): Das sind die Kandidaten für die jeweilige Stelle, die hier als Ganzes "Rest" genannt und auch der Einfachheit halber als eine mehrstellige Zahl (ohne Komma oder andere Trennzeichen unterhalb der Eingabefelder) geschrieben werden.
Danach versucht man, diese Reste so lange "auszudünnen", also zu verkürzen, bis man zu einer eindeutigen Lösung für eine Stelle kommt (Methoden E und F). Die Ausdünn-Methoden I bis VI werden im nächsten Abschnitt ausführlich beschrieben.
Beispiel:
Nach der Ausdünn-Methode III (siehe weiter unten im nächsten Abschnitt) findet man in der Box OR das Reste-Paar 79 zwei Mal. Die Zahlen 7 und 9 müssen also an diesen beiden Stellen auftreten. Damit können in allen anderen Resten dieser Box die Zahlen 7 und 9 gestrichen werden. Daraus folgt, dass an der Position Zeile 1 und Spalte 4 (mit kleinem x markiert) die Zahl 7 stehen muss.
- Vollständige Ausdünnung mit einstelliger Restzahl bzw. einziger Kandidatenzahl (Wert: 1 Basis-Punkt, Farbmarkierung: Braun): Hat man nach einem oder mehreren Ausdünnschritten einen Rest so weit verkleinert, dass er nur noch aus einer Zahl besteht, ist diese Zahl die Lösung für die betrachtete Stelle.
Beispiel:
Nach der Ausdünn-Methode I (siehe weiter unten im nächsten Abschnitt) kommt die Zahl 9 innerhalb der zweiten Zeile nur in der ersten Box (OL) vor: Daher muss die 9 dort sein (auch wenn man die Position innerhalb der zweiten Zeile noch nicht weiß) - sie kann also nicht in der dritten Zeile dieser Box noch einmal vorkommen. Daher kann man aus den Resten dieser Zeile in der Box OL den Kandidaten 9 streichen (d.h.: 249 wird zu 24, 39 wird zu 3).
Damit bleibt an der Position Zeile 3 und Spalte 3 (mit kleinem x markiert) nur noch die 3 als Kandidat übrig. Also hat man einen eindeutigen Rest an dieser Stelle gefunden.
Sechs Methoden zur Ausdünnung der Reste (I bis VI)
Der Begriff der Ausdünnung zur Verkürzung der Reste wurde im vorherigen Abschnitt unter Methode D schon erlätert. Im Allgemeinen sind, um eine Lösung zu finden, immer mehrere Ausdünnschritte notwendig (bis zu 23 direkt nacheinander wurden schon beobachtet!). Manche Schritte helfen dabei nicht zur Lösungsfindung, aber das weiß man vorher nicht.
Über die Hälfte (56 %) aller hier berechneten Sudokus sind nur durch Anschreiben der Reste und anschließender Ausdünnung lösbar!
In den folgenden Beispielen werden oft nur Teile eines Sudokus mit entsprechenden Resten dargestellt, um das Ganze übersichtlicher zu machen; es sind Ausschnitte aus aktuellen Sudokus.
- Zeilen-/Spalten-Test der Reste innerhalb einer Box (Block/Line Interaction, Pointing): Man sieht in den Resten nach, ob innerhalb einer Box eine Zahl vorkommt, die nur genau in einer Zeile bzw. Spalte dieser Box auftaucht - diese Zahl muss dann in dieser Zeile bzw. Spalte dieser Box stehen (wobei die genaue Position noch unbekannt ist). Dann kann man in den anderen Resten dieser Zeile bzw. Spalte außerhalb der Box diese Zahl streichen.
Bewertung: Für jedes Vorkommen gibt es 6 Punkte.
Beispiel:
Hier findet man z.B. die Zahl 1: Sie ist in den Resten der Box OL nur in der zweiten Zeile vorhanden (rot gefärbte Reste), nicht in den anderen Zeilen dieser Box. Also kann man in den anderen Resten dieser Zeile in den anderen beiden Boxen diese Zahl streichen (durch die Darstellung in eckigen Klammern hervorgehoben). Damit bleibt übrig:
- Box-Test der Reste in einer Zeile oder Spalte (Line/Block Interaction, Claiming): Man sieht in den Resten einer Box nach, ob innerhalb einer Zeile bzw. Spalte eine Zahl vorkommt, die nur genau in dieser Box auftaucht. Diese Zahl muss also innerhalb dieser Box in der gefundenen Zeile bzw. Spalte stehen (wobei die genaue Position noch unbekannt ist), sie kann dann aber aus den anderen Zeilen bzw. Spalten innerhalb dieser Box gestrichen werden. Dies ist die am häufigsten auftretende Methode, um die Reste auszudünnen: 48 %!
Bewertung: Für jedes Vorkommen gibt es 4 Punkte.
Beispiel:
Hier findet man z.B. die Zahl 1: Sie ist innerhalb der ersten Zeile nur in den Resten der rechten Box OR vorhanden (rot gefärbte Reste). Also kann man in den anderen Zeilen dieser Box diese Zahl aus den Resten streichen - das wird hier durch die Darstellung in eckigen Klammern hervorgehoben. Damit bleibt übrig:
- Man sucht in einer Zeile, Spalte oder Box nach N-Tupel, also danach, dass bestimmte Kandidaten an nur wenigen Stellen auftreten (Naked Pairs, Hidden Pairs, Naked Triples, Hidden Triples, Naked Quadrupels, Hidden Quadrupels): Genauer heißt das, dass man N Stellen innerhalb einer Zeile, Spalte oder Box sucht, in denen genau N verschiedene Kandidaten auftreten, also keine anderen Kandidaten. Wenn an N Stellen alle oder ein Teil der N betrachteten Kandidaten stehen, können diese Kandidaten nur an diesen N Stellen auftreten (wobei die Verteilung noch unbekannt ist); diese Kandidaten können dann aber aus den anderen Resten gestrichen werden.
Es gibt 2-Tupel (Doppel), 3-Tupel (Tripel), 4-Tupel (Quadrupel), 5-Tupel (Pentupel), 6-Tupel und 7-Tupel (8-Tupel machen keinen Sinn, da dann die neunte Zahl eindeutig ist und somit direkt gefunden werden kann). Zu jedem gefundenen N-Tupel gehört ein entsprechendes verstecktes M-Tupel (mit M anderen Kandidaten), wobei N+M gleich der Anzahl der freien Zellen innerhalb einer Zeile, Spalte oder Box ist. Sind die N Kandidaten aus den anderen Resten gestrichen worden, wird aus dem versteckten M-Tupel ein normales M-Tupel (im ersten Beispiel gibt es zu dem Doppel 79 das versteckte Tripel 345).
Bewertung: Für jedes N-Tupel gibt es 2*N Punkte.
Einfaches Beispiel mit 2-Tupel (Doppel):
Hier findet man z.B. in der ersten Zeile das 2-Tupel 79 (Doppel: 79, 79) - bzw. das versteckte 3-Tupel (Tripel) 345 -, als rot gefärbte Reste markiert; die beiden Kandidaten 7 und 9 müssen also an diesen beiden Stellen sein. Also kann man in den anderen Resten dieser Zeile diese beiden Zahlen streichen (durch die Darstellung in eckigen Klammern hervorgehoben). Damit bleibt übrig:
Kurzes Beispiel mit 3-Tupel (Tripel):
Hier findet man in der Box OM (und in der 5. Spalte) das 3-Tupel 235 (Tripel: 235, 23, 25). Damit können in allen anderen Resten dieser Box (und in der 5. Spalte) die Zahlen 2, 3 und 5 gestrichen werden.
Relativ häufig (in etwa 10% aller N-Tupel-Fälle) findet man noch 4-Tupel (z.B. das Quadrupel 1479 mit: 147, 17, 79, 49), aber 5-Tupel, 6-Tupel und 7-Tupel sind sowohl noch seltener (2 %) als auch schwieriger zu erkennen...
- Einzelzahl-Ketten (Single Digit Pattern, Forcing X-Chain): Kette aus Resten, bei denen überall eine bestimmte Zahl vorkommt (verbindendes Element). Man sieht für eine bestimmte Zahl in den Resten nach, ob in Zeilen oder Spalten oder Boxen diese Zahl genau zwei Mal vorkommt. Hat man mehrere solcher sogenannten starken Paare gefunden, lassen sich diese eventuell dadurch zu einer Einzelzahl-Kette verbinden, dass jeweils ein Anfang oder Ende in der gleichen Zeile, Spalte oder Box wie ein anderes starkes Paar liegen; interessant ist hierbei, dass die anderen Kandidaten der jeweiligen Reste keine Rolle spielen. Wenn sowohl vom Anfang einer so konstruierten Kette als auch vom Ende dieser Kette ein oder mehrere Zellen "gesehen" werden, also in der jeweils gleichen Zeile, Spalte oder Box liegen, kann die bestimmte Zahl aus diesen Zellen gestrichen werden. Es gilt: Entweder liegt die bestimmte Zahl am Anfang der Kette; ist das nicht der Fall, gilt foldender Schluss: Liegt diese Zahl nicht im ersten Feld der Kette, muss sie aber im zweiten Feld liegen, da dieses ein starkes Paar ist; dann kann sie jedoch nicht im dritten Feld sein, muss somit im vierten Feld liegen, usw. - d.h. in jedem 2*K-ten Feld der Kette muss dann die bestimmte Zahl liegen, also auch - wegen der Geradzahligkeit der Kettenglieder - im letzten Feld am Ende der Kette.
Bewertung: Für jedes Vorkommen gibt es 3*N Punkte entsprechend der Länge N der gefundenen Kette (N = 4 bis 10, immer geradzahlig, maximal 18 ist möglich).
Literatur:
Sonderfälle dieses Verfahrens: X-Wing, Swordfish (Minimum-Version), Jellyfish (Minimum-Version), Skyscraper, Turbot Fish, Two-String Kite (Long String Kite und Empty Rectangle sind Erweiterungen).
AHR Software: Single Digit Pattern, z.B. Skyscraper http://www.ahr-sudoku.de/solving.php/technic/Skyscraper
HoDoKu: http://hodoku.sourceforge.net/de/tech_sdp.php
Beispiel:
Hier untersucht man z.B. die Zahl 2: Man findet die 2 genau zwei Mal in Zeile 1 (2389-28), in Spalte 5 oder in Box MM (27-27) und in Spalte 7 (24-24), und in Box OR (28-24). Startet man zum Beispiel mit dem Paar 27-27 in Spalte 5, kann man mit dem zweiten Spaltenpaar (24-24) über Zeile 4 verbinden (die dritte 2 in dieser Zeile stört hier nicht). Das Zeilenpaar kann man als letzten Teil der Kette in der rechten oberen Box anschließen (das starke Paar 28-24 ist hierbei keine Notwendigkleit) und erhält somit die Kette: (6:5)27 - (4:5)27 - (4:7)24 - (3:7)24 - (1:9)28 - (1:1)2389.
Die Kette kann natürlich auch andersherum geschrieben werde: (1:1)2389 - (1:9)28 - (3:7)24 - (4:7)24 - (4:5)27 - (6:5)27.
Nun gilt: In Zeile 6/Spalte 1 kann die Zahl 2 nicht stehen, denn entweder liegt wegen der gefundenen Kette die 2 in Zeile 6/Spalte 5 (Anfang der Kette) oder in Zeile 1/Spalte 1 (Ende der Kette). D.h.: Ist die 2 in Zeile 6/Spalte 5, ist alles klar; ist die 2 aber nicht in Zeile 6/Spalte 5, muss sie in Zeile 4/Spalte 5 sein (da 27-27 ein sogenanntes starkes Paar ist), kann somit nicht in Zeile 4/Spalte 7 sein, muss also in Zeile 3/Spalte 7 sein (starkes Paar 24-24), also nicht in Zeile 1/Spalte 9, und muss daher in Zeile 1/Spalte 1 (starkes Paar 2389-28) sein. Damit erhält man:
Bisher wurde hier die X-Wing-Methode benutzt. Diese ist aber nur ein Sonderfall der Einzelzahl-Ketten-Methode, im Beispiel also die Ketten 56-56-157-157 (ab Spalte 2) und 56-56-157-157 (ab Spalte 5): es können alle Auftreten der Zahl 5 außerhalb dieser Kette bzw. des X-Wings in der Spalte 2 bzw. Spalte 5 gestrichen werden:
Die Erkenntnis, dass X-Wing nur ein Sonderfall der Einzelzahl-Ketten-Methode ist, erklärt auch, warum X-Wing relativ selten (gegenüber der Goldenen Kette) auftrat. Aber auch dieses Verfahren könnte noch mehr verallgemeinert werden...
- Goldene Kette:
Eine Goldene Kette (Golden Chain, manchmal auch Double Implication Chain genannt) ist eine Reihe von Paaren vom Typ ab, bc, cd, de, ef, ..., xy, yz, za, von denen jeweils zwei aufeinanderfolgende Paare in der gleichen Zeile, Spalte oder Box liegen und die eine gemeinsame Zahl besitzen, die aber - im Gegensatz zur Einzelzahl-Kette - von Kettenglied zu Kettenglied anders sein kann. Wenn die Zahl des ersten Paars, die nicht im zweiten Paar vorkommt (hier bei ab also a) mit der Zahl des letzten Paars, die nicht im vorletzten Paar vorkommt (bei za also auch a), übereinstimmt, dann kann man alle Zahlen a streichen, die sowohl von dem ersten als auch dem letzten Paar aus "gesehen" werden, also in der jeweils gleichen Zeile, Spalte oder Box liegen, weil die Zahl a auf jeden Fall entweder am Anfang der Kette oder am Ende der Kette vorkommen muss (wenn a an der Stelle des ersten Paares vorkommt, ist das offensichtlich; kommt dort aber b vor, so muss an der Stelle des zweiten Paares c sein, daher an der des dritten Paares d usw., bis zu z an der Stelle des vorletzten Paares, also a an der Stelle des letzten Paares, was behauptet wurde).
Bewertung: Hierbei gibt es 3*N Punkte entsprechend der Länge N der gefundenen Kette (N = 3 bis 14, mit 14 als größte bisher gefundene Kettenlänge).
Literatur:
Download des Artikels von Eduyng Castan: http://www.coverpop.com/sfiles/Sudoku-GoldenChains.pdf
Ähnlicher Artikel von Mihail Iusut: http://www.scanraid.com/sudoku/Remote_Pairs_and_XY_Chains.pdf
Beispiel einer Goldenen Kette (nach wenigen anderen Ausdünnschritten):
Die gefundene Goldene Kette ist: (1:2)27 - (1:7)73 - (4:7)31 - (4:1)12.
Beachte, dass hier die Reihenfolge der Zahlen innerhalb eines Doppels dem Verkettungs-Prinzip angepasst ist: Also 73 statt der sonst aufsteigenden Reihenfolge 37 und 31 statt sonst 13. Das jeweilige Ende der Goldenen Kette ist also die Zahl 2, die daher im Feld (2:1), also Zeile 2 und Spalte 1, und im Feld (5:2), also Zeile 5 und Spalte 2, gestrichen werden kann.
Identisch mit der gefundenen Goldenen Kette ist auch die in umgekehrter Reihenfolge: (4:1)21 - (4:7)13 - (1:7)37 - (1:2)72.
- Ausschluss-Rechtecke/Ausschluss-Schleifen:
Ausschluss-Rechtecke sind 4 Zellen, die in zwei verschiedenen Zeilen, zwei verschiedenen Spalten und zwei (!) verschiedenen Boxen liegen und in allen diesen Zellen neben anderen Kandidaten zwei gleiche Kandidaten haben. Wegen der eindeutigen Lösbarkeit eines Sudokus kann man dann bestimmte Kandidaten ausschließen; dabei werden (hier) 7 Typen unterschieden. Genaueres siehe bei http://hodoku.sourceforge.net/de/tech_ur.php.
Übersicht der Typen (mit "ab" als die zwei gleichen Kandidaten):
- Typ 1: ab - ab - ab - abc(de) => ab streichbar bzw. c setzbar - [Recht häufig]
- Typ 2: ab - ab - abc - abc => Alle anderen c in betroffener Zeile bzw. Spalte und auch Box (wenn beide c in gleicher Box) streichbar
- Typ 3: ab - ab - abcd - abe - cde - cde => Quasi-N-Tupel, z.B. cde: Alle anderen cde in betroffener Zeile bzw. Spalte und/oder Box streichbar
- Typ 4: ab - ab - abcd - abef, a sonst nirgendwo in der Zeile bzw. Spalte und/oder Box => b in Zeile/Spalte/Box streichbar - [Recht häufig]
- Typ 5: ab - abc - abc - ab(c) mit c diagonal => Alle anderen c in sichtbarer Zeile/Spalte/Box streichbar (Erweiterung von Typ 2) - [Sehr selten]
- Typ 6: ab - abc - abd - ab mit c und d diagonal, a nur im Rechteck => a streichbar aus Zellen mit Zusatzkandidat (Erweiterung von Typ 4)
- Typ 7: ab - abc - abd - ab(e), a nur im Rechteck => b streichbar aus gegenüber liegender Zelle mit Zusatzkandidat (Verstecktes Rechteck) - [Sehr häufig]
Beispiel mit den Typen 1, 2, 4: 000000000000000012003004000000000005000006307010000000000087000004010020020500080
Beispiel mit den Typen 3, 6, 7: 020450000006000000709003500200000908091200040800900030300000850010070400000010000
Beispiel mit Typ 5: 103400000050709000000020004000005007600000090000007258092000000501090300000060000
Eine Erweiterung der Ausschluss-Rechtecke sind Ausschluss-Schleifen: Ausschluss-Schleifen sind 6 Zellen, die in drei verschiedenen Zeilen, drei verschiedenen Spalten und drei (!) verschiedenen Boxen liegen und in allen diesen Zellen neben anderen Kandidaten zwei gleiche Kandidaten haben (siehe z.B. http://home.arcor.de/r.sudogu/r_tec/UniqueLoop.html. Hier wurde nur die einfache Version mit 6 Zellen programmiert, es geht auch mit 8 oder 10 Zellen.
Übersicht der Typen (mit "ab" als die zwei gleichen Kandidaten):
- Typ 1: ab - ab - ab - ab - ab - abc(de) => ab streichbar bzw. c setzbar
- Typ 2: ab - ab - ab - ab(c) - abc - abc => Alle anderen von (abc -) abc - abc aus sichtbaren c in Zeile/Spalte streichbar
- Typ 3: ab - ab - ab - ab - abcd - abef => a bzw. b streichbar, wenn nicht in gleicher Zeile/Spalte/Box
Allgemeines
Die Punktzahlen sind so einigermaßen den Schwierigkeitsgraden angepasst. Sie hängen aber auch von der Reihenfolge im Programm ab - so ergibt eine andere Reihenfolge im Suchen von Mustern in den Resten etwas andere Werte. Gerade die Bewertung beim Ausdünnen ist schwierig: es werden alle Ausdünnschritte mitgezählt, egal, ob sie am Ende etwas bringen oder nicht. Aber das weiß man ja auch beim Lösen mit Hand vorher nicht...
Ab 50 Punkten wird es interessant, über 75 Punkte ist es schon schwerer, über 100 Punkte wirklich schwer, und über 125 Punkte ist schon eine Herausforderung. Der Mittelwert aller Sudokus liegt bei 106 Punkten (der Hauptwert liegt um 60 Punkte ohne Ausdünnung (siehe Kurve), und um 144 Punkte mit Ausdünnung (siehe Kurve)). Aktuelles Maximum mit schwer zu überbietenden 591 Punkten (sehr viel mehr Punkte sind mit diesen Methoden wohl kaum erreichbar?!), also das bisher am schwersten (hier) gelöste Sudoku:
- Bisher: 440 Punkte aus 23 Zahlen (erste einfache Schritte: 11, Verhältnis 7.6): - A: 48, B: 2, C: 2, D: 5, E: 1, Ausdünnschritte: 27, N-Tupel: 3 (bis Tripel), Einzelzahl-Ketten: 4 (maximal 8 lang), Goldene Ketten: 12 (maximal 10 lang) - in 4.3 sec:
000000070003805906050403080047000320000000000020000100000204050506100000080000000
- Neu (Dank an Michael Jentsch): 515 Punkte aus 25 Zahlen (erste einfache Schritte: 6, Verhältnis 9.2): - A: 46, B: 2, C: 1, D: 4, E: 3, Ausdünnschritte: 28, N-Tupel: 1 (bis Tripel), Einzelzahl-Ketten: 0, Goldene Ketten: 17 (maximal 11 lang) - in 5.1 sec:
507000040003100009000000800000503100002010950070004600006000000380000000009280306
- Neuer (Dank an Glenn Fowler, ATT): 591 Punkte aus 23 Zahlen (erste einfache Schritte: 9, Verhältnis 10.2): - A: 49, B: 1, C: 1, D: 1, E: 6, Ausdünnschritte: 29, N-Tupel: 3 (maximal Quadrupel), Einzelzahl-Ketten: 1 (maximal 4 lang), Goldene Ketten: 17 (maximal 12 lang) - in 5.8 sec:
103050000050009000080000004000060008008000072000290310004072000000004050030000800
- PS: Ohne Einzelzahl-Ketten, Goldene Ketten und Ausschluss-Rechtecken liegt das Maximum bei 218 Punkten aus 17 Zahlen (erste einfache Schritte: 2, Verhältnis 3.4): - A: 49, B: 4, C: 0, D: 8, E: 3, Ausdünnschritte: 20, N-Tupel: 4 (bis Quadrupel), Einzelzahl-Ketten: 0, Goldene Ketten: 0 - in 0.2 sec:
008000000000002540031060000000000070000400200063000000000000001500007000000080003
Das 440-Punkte-Sudoku wurde durch Reduzierung aller bis dahin gelösten etwa 9200 Sudokus in einem Aufwand von über 2100 Stunden Rechenzeit (insgesamt wurden fast 3 Millionen Sudokus durchgerechnet) gefunden... Reduzierung heißt hier: Lässt man aus einem Sudoku mit N Zahlen jeweils eine Zahl aus, so entstehen N Sudokus mit jeweils N-1 Zahlen, die alle berechnet werden. Gibt es dabei Lösungen, macht man die gleiche Prozedur mit dem berechneten Sudoku, das die höchste Punktzahl hat, usw., bis es keine Lösung mehr gibt.
Etwas Statistik:
Bei (Stand Anfang 2010) insgesamt etwa 22100 gelösten Sudokus wurden etwa 1197000 mal die Methoden A bis E eingesetzt; davon 94.5% für Methode A, 2.8% (0.8% + 2.0%) Methode B+C, und 2.7% (1.9% + 0.8%) Methode D+E (also Ausdünnung). Die Ausdünn-Methoden werden zwar selten gebraucht, sind aber trotzdem zur Lösung von knapp der Hälfte aller Sudokus notwendig!
Genauer gesehen waren etwa 26% der Sudokus allein mit Methode A lösbar, insgesamt 54% nur mit den Methoden A+B+C. Das sind die einfacheren Sudokus, obwohl dabei immerhin auch fast 100 Punkte erreicht werden können - bisheriges Maximum: 93 (nach aktueller Punkte-Bewertung), also die (hier) schwierigsten Sudokus ohne Ausdünnung:
- 90 Punkte aus 17 Zahlen (erste einfache Schritte: 64, Verhältnis 1.4): - A: 53, B: 6, C: 5, D: 0, E: 0, Ausdünnschritte: 0 - in 0.1 sec:
000000000000001002034000050000000006003070080600000000000009000008000370100206000
- 92 Punkte aus 17 Zahlen (erste einfache Schritte: 64, Verhältnis 1.4): - A: 52, B: 7, C: 5, D: 0, E: 0, Ausdünnschritte: 0 - in 0.1 sec:
000000000000001002034000050000000006003050040600000000000007000005000830100206000
- 93 Punkte aus 17 Zahlen (erste einfache Schritte: 64, Verhältnis 1.5): - A: 53, B: 6, C: 5, D: 0, E: 0, Ausdünnschritte: 0 - in 0.1 sec:
000000000000001002034000050000000006003070040600000000000008000050000730100206000
Für die etwa 10200 Sudokus (46% der Fälle) - Stand Anfang 2010, bei denen die Kandidaten/Reste analysiert werden mussten, waren insgesamt etwa 81000 Ausdünnschritte notwendig (davon 48 % Box-Tests, 7 % Zeilen-/Spalten-Tests, 20.5 % N-Tupel, 2.5 % X-Wings, 22 % Goldene Ketten). In einem Fall waren es 23 Ausdünnschritte hintereinander, bis eine Zahl gefunden werden konnte, und in einem anderen Fall insgesamt 33 Schritte!
Dabei konnten etwa 1350 alleine durch die einfachen Box-Test- und Zeilen-/Spalten-Test-Methoden gelöst werden. Etwa 2950 Sudokus wurden durch die N-Tupel-Methode (darunter ein 7-Tupel!), nur 260 Sudokus durch die X-Wing-Methode (erstaunlich wenig!, aber immerhin wurden insgesamt etwa 1900 X-Wings gefunden), jedoch 5650 durch die Goldene Kette gelöst (bei insgesamt gut 17700 gefundenen Goldenen Ketten, und in einzelnen Sudokus bis zu 20 Goldenen Ketten bzw. maximal mit der Länge 14) - insofern verwundert es, dass dieses Verfahren so wenig bekannt ist!
Literatur:
Allgemeine Lösungsstrategien bei: http://www.sadmansoftware.com/sudoku/solvingtechniques.htm
oder bei: http://hodoku.sourceforge.net/de/techniques.php