Funktionale Programmierung - Einführung in die logische Programmierung mit Microsoft z3

In diesem Artikel werden wir anhand eines kleinen Praxisbeispiels sehen, wie man stark verwobene Probleme gut mithilfe der sogenannten logischen Programmierung in Angriff nehmen kann. Die logische Programmierung erfordert keinerlei algorithmische Überlegungen, sondern reine Problembeschreibungen. Für unser Beispiel übersetzen wir ein typisches Ressourcenplanungsproblem in das SMT-LIB-2-Format und schicken dieses dann an das Programm z3 von Microsoft.

Deklarative Programmierung

Der Schritt von der imperativen Programmierung zur funktionalen Programmierung ist auch ein Schritt hin zu einem deklarativen Programmierstil. Wir beschreiben die Lösung eines Problems, anstatt den Computer Schritt für Schritt anzuweisen, welche konkreten Hebel er ziehen und welche Knöpfe er drücken muss. Der große Vorteil dieses deklarativen Stils ist, dass er die Kommunikation zwischen den beteiligten Menschen vereinfacht und sei es nur die Kommunikation zwischen der Entwicklerin und ihr selbst.

Die funktionale Programmierung ist zwar deklarativer als die imperative Programmierung, aber ein Konzept von Schritten finden wir auch in der funktionalen Programmierung noch. Die Problemlösungen bauen schließlich meist auf kleineren Lösungen auf. Wir sagen beispielsweise, dass eine Liste von Zahlen komponentenweise verdoppelt werden kann, indem wir den Kopf der Liste verdoppeln und den Rest der Liste komponentenweise verdoppeln. Die beschriebene Lösung baut auf einer Teillösung auf. Sehr viele Problemlösungen lassen sich so beschreiben. Es gibt aber auch Probleme, die sich nicht so einfach in Teilprobleme aufschneiden lassen. Man denke an klassische Rätselaufgaben wie Sudoku. Bei Sudoku hängt beinahe alles mit allem zusammen. In jeder Entscheidung müssen wir beachten, dass die Entscheidung einen Einfluss auf fast alle anderen Felder des Spiels hat. Im Folgenden werden wir ein ähnlich verwobenes Praxisbeispiel kennenlernen und dieses mithilfe der logischen Programmierung lösen.

Erster Schultag

Anna, Sarah, Martha, Salma und Daisy brauchen jeweils einen Sitzplatz, aber Anna will nicht neben Sarah sitzen und Martha und Salma müssen am selben Tisch sitzen. Wir möchten jeder Teilnehmerin einen Sitzplatz zuordnen und dabei alle Wünsche, Regeln und sonstigen Einschränkungen beachten.

Die Beschreibung des Problems hat uns einen Satz gekostet. Die Charakterisierung der Lösung konnten wir auch in einem einzigen Satz angeben. Das Problem sollte also eigentlich mit einem deklarativen Programmierstil leicht zu lösen sein. Aber selbst mit funktionaler Programmierung müssen wir hier lange rätseln, um einen effizienten Algorithmus zu finden. Das liegt, wie in der Einleitung bereits angedeutet, daran, dass sich das Problem schwer in Teilprobleme aufteilen lässt. Hat der deklarative Ansatz also versagt?

Logische Programmierung

Vielleicht ist die funktionale Programmierung einfach noch nicht deklarativ genug? Wenn wir von der funktionalen Programmierung noch einen Schritt weiter in Richtung deklarative Programmierung gehen, dann landen wir bei der logischen Programmierung. Wir werden im Folgenden das Sitzplatzproblem mithilfe der logischen Programmierung lösen, um zu sehen, wie praktikabel dieser Ansatz ist. Zunächst müssen wir dazu verstehen, welche Theorie hinter der logischen Programmierung steht.

Das SAT-Problem

Die logische Programmierumgebung, die wir nutzen möchten, wird von Microsoft z3 bereitgestellt. z3 ist ein sogenannter SAT-Solver. SAT steht für englisch Satisfiability. Es handelt sich dabei um den Namen eines der schwierigsten Probleme in der theoretischen Informatik, dem Erfüllbarkeitsproblem der Aussagenlogik. Viele Ressourcenplanungsprobleme sind Ausprägungen dieses Problems, so auch unser Sitzplatzproblem.

Die Aussagenlogik besteht aus Variablen, Und-Verknüpfungen, Oder-Verknüpfungen, Negation und den beiden Wahrheitswerten true und false. Mit diesen Bausteinen können wir Ausdrücke formulieren. Ein Ausdruck ohne Variablen kann direkt einem der Wahrheitswerte zugeordnet werden. Wir können den Ausdruck sozusagen direkt ausrechnen:

   (true oder false) und (false oder (nicht true))
=>       true        und (false oder false)
=>       true        und        false
=>                   false

True und true ergibt true, true und false (oder umgekehrt) ergibt false, false und false ergibt false. True oder true ergibt true, true oder false (oder umgekehrt) ergibt true, aber false oder false ergibt false. Nicht true ergibt false, nicht false ergibt true. Wir rechnen diese logischen Ausdrücke analog zu arithmetischen Ausdrücken von innen nach außen aus.

Wenn Variablen ins Spiel kommen, können wir den Ausdrücken nicht mehr einfach Wahrheitswerte zuweisen. Die Wahrheitswerte der Ausdrücke hängen von den Wahrheitswerten der Variablen ab.

   (x oder y) und (x und (nicht z))

Wir können uns aber eine ganz zentrale Frage stellen: Gibt es überhaupt eine Lösung, bei der jeder Variablen ein fester Wahrheitswert zugeordnet wird und der Gesamtausdruck zu true ausgewertet werden kann? Und falls ja: welche Wahrheitswerte nehmen dann die Variablen an?

Das Beispiel oben hat mindestens eine gültige Zuordnung. Wenn wir für x true, für y false und für z false einsetzen, wertet der Ausdruck zu true aus. Wir nennen diese Zuordnung ein Modell des Ausdrucks. Ein Modell ist eine Variablenbelegung, die zeigt, dass die Probleminstanz erfüllbar ist. Deshalb heißt das Problem Erfüllbarkeitsproblem der Aussagenlogik.

In den kleinen Beispielen lassen sich Modelle noch recht einfach finden. Im Zweifelsfall zählen wir einfach alle Kombinationen von Wahrheitswertbelegungen für die Variablen auf und rechnen den Ausdruck jeweils aus. Für drei Variablen gibt es nur 2 hoch 3, also 8 solcher Kombinationen. Die Zahl der Kombinationen wächst aber exponentiell mit der Zahl der Variablen. Bei 10 Variablen gibt es schon mehr als 1000 Kombinationen, die wir durchprobieren müssten.

z3

Wir wollen also davon Abstand nehmen, unser Sitzplatzproblem mit einem selbst entworfenen Algorithmus zu lösen, weil das Problem nicht greifbar ist. Das könnte daran liegen, dass es sich um eine Form des SAT-Problems handelt: Wir stehen vor einem riesigen Suchraum, der exponentiell mit der Größe des Problems wächst. Eine schrittweise Zerlegung des Problems in Teilprobleme finden wir auch nicht auf Anhieb.

Das SAT-Problem ist theoretisch zwar ein sehr schwieriges, aber zum Glück nur im schlimmsten Fall. In der Praxis sind die meisten konkreten Probleme trotzdem in angemessener Zeit lösbar. Das liegt daran, dass die SAT-Probleme, die in der Praxis auftreten, mehr Struktur enthalten, als das theoretisch allgemeinste Problem. Forscher haben jahrzehntelang versucht, diese Struktur auszunutzen, um solche Probleme zu bezwingen. Vor einigen Jahren erzielte die Wissenschaft den Durchbruch. Die eigentlich schwierigen Probleme konnten plötzlich in Sekundenschnelle gelöst werden. Im SAT-Solver z3 von Microsoft Research laufen all diese wissenschaftlichen Fortschritte zusammen und sind damit auch für Praktiker nutzbar.

Wir können also unser Sitzplatzproblem in ein SAT-Problem übersetzen und dann z3 die schwierige Arbeit erledigen lassen. Dazu müssen wir zunächst das Format kennenlernen, in welchem z3 diese SAT-Probleme entgegennimmt.

SMT-LIB 2

z3 nimmt SAT-Probleme im speziellen Format SMT-LIB 2 entgegen. SMT-LIB 2 ist eine logische Programmiersprache für SAT-Probleme. Ein SMT-LIB-2-Programm teilt sich in zwei Teile auf: Variablendeklarationen und Assertions. Wir können das oben beschriebene SAT-Problem in SMT-LIB 2 wie folgt ausdrücken:

(declare-const x Bool)
(declare-const y Bool)
(declare-const z Bool)

(assert
  (and
    (or x y)
    (and x (not z))))

(check-sat)
(get-model)

In den ersten drei Zeilen deklarieren wir die drei Variablen x, y, und z. Danach folgt die Assertion, also der Ausdruck, den wir gerne zu true ausgewertet sehen möchten. In der vorletzten Zeile geben wir die Anweisung, das Problem auf Erfüllbarkeit zu prüfen. Wenn das Problem erfüllbar ist, dann gibt es auch ein Modell, also eine Variablenbelegung, die die Erfüllbarkeit beweist. Dieses Modell lassen wir uns mit (get-model) in der letzten Zeile ausgeben.

z3 kann im Web direkt ausprobiert werden. Wir können unser Programm in den Online-Editor übertragen und von z3 ausführen lassen. Die Ausgabe lautet:

sat
(model 
  (define-fun z () Bool
    false)
  (define-fun x () Bool
    true)
)

Wir sehen, dass z3 ein Modell gefunden hat. Die Variable z ist in diesem Modell false und die Variable x ist true. Die Variable y scheint unerheblich zu sein, darf also sowohl true als auch false sein. Um diesen Verdacht zu bestätigen, können wir z3 so konfigurieren, dass es uns immer ein vollständiges Modell ausgibt. Dazu fügen wir am Anfang des Programms den Ausdruck (set-option :model_evaluator.completion true) hinzu. Um dann einen Ausdruck auszuwerten, können wir eval verwenden. Das ganze Programm sieht dann so aus:

(set-option :model_evaluator.completion true)
(declare-const x Bool)
(declare-const y Bool)
(declare-const z Bool)

(assert
  (and
    (or x y)
    (and x (not z))))

(check-sat)
(eval x)
(eval y)
(eval z)

SMT-LIB 2 erlaubt auch die Verwendung von Funktionen. Diese Funktionen verhalten sich etwas anders als Funktionen in herkömmlichen Sprachen. In SMT-LIB 2 müssen wir die Funktionen nicht selbst implementieren. Wir sagen lediglich, dass es eine Funktion gibt und spezifizieren dann von außen einige Einschränkungen darüber, wie sich die Funktion zu verhalten hat:

(declare-fun f (Bool) Int)

(assert (= 5 (f false)))
(assert (> (f true) 23))

(check-sat)
(get-model)

Hier sehen wir, wie mit declare-fun eine Funktion deklariert wird. Wir sagen lediglich, dass die Funktion Bool-Werte (true oder false) auf Ganzzahlen abbildet. Desweiteren sagen wir, dass die Funktion auf false angewendet zu 5 auswerten soll. Auf true angewendet soll die Funktion eine Zahl größer 23 zurückgeben. z3 generiert jetzt für uns eine Implementierung der Funktion. Die Ausgabe sieht so aus:

sat
(model 
  (define-fun f ((x!0 Bool)) Int
    (ite (= x!0 false) 5
    (ite (= x!0 true) 24
      5)))
)

z3 hat wieder ein Modell gefunden und uns dabei die Funktion f implementiert. ite steht für „if then else“. Die Implementierung sagt, dass die Funktion 5 zurück gibt, wenn die Eingabe false ist. Wenn die Eingabe true ist, gibt sie 24 zurück.

Das Sitzplatzproblem in SMT-LIB 2

Mit diesen Werkzeugen können wir jetzt unser eigentliches Problem mithilfe von z3 lösen.

Die Umgebung

Wir wollen als Erstes die Teilnehmerinnen in SMT-LIB 2 abbilden. Die Gesamtheit aller Teilnehmerinnen bildet eine Menge. Der entsprechende Typ ist damit eine geschlossene Aufzählung, ein Enum-Typ. Wir können Enums in SMT-LIB 2 mit declare-datatypes erstellen:

(declare-datatypes () ((Teilnehmerin Anna Sarah Martha Salma Daisy)))

Teilnehmerin ist jetzt ein Typ-Name wie Integer. Anna, Sarah, Martha, Salma und Daisy sind die Werte, die Variablen dieses Typs annehmen können.

Wir übersetzen Tische und Plätze genauso in Enum-Typen:

(declare-datatypes () ((Tisch id-tisch-1 id-tisch-2 id-tisch-3)))
(declare-datatypes () ((Platz id-platz-a id-platz-b id-platz-c
                              id-platz-d id-platz-e id-platz-f)))

Jetzt fehlt uns noch der Zusammenhang von Tischen und Plätzen. Jeder Tisch hat einen Platz links und einen Platz rechts. Es gibt mehrere Möglichkeiten, diesen Zusammenhang zu modellieren. Wir entscheiden uns dafür, zwei Funktionen einzuführen: platz-links und platz-rechts, die jeweils einen Tisch auf einen Platz abbilden.

(declare-fun platz-links (Tisch) Platz)
(declare-fun platz-rechts (Tisch) Platz)

Wenn wir jetzt keine weiteren Angaben machen, generiert uns z3 automatisch eine Implementierung dieser zwei Funktionen. Das ist in diesem Fall noch nicht das, was wir wollen. Wir wissen genau, wie sich die Funktionen zu verhalten haben. Entsprechend müssen wir die Funktionen in SMT-LIB noch mithilfe einiger Assertions einschränken:

(assert (= (platz-links id-tisch-1) id-platz-a))
(assert (= (platz-rechts id-tisch-1) id-platz-b))

(assert (= (platz-links id-tisch-2) id-platz-c))
(assert (= (platz-rechts id-tisch-2) id-platz-d))

(assert (= (platz-links id-tisch-3) id-platz-e))
(assert (= (platz-rechts id-tisch-3) id-platz-f))

Zu diesem Zeitpunkt haben wir unsere Modellierung so festgezurrt, dass z3 gar nichts berechnen muss. Alles ist schon da. Das ist auch richtig so, denn bisher haben wir nur das Universum beschrieben, innerhalb dessen wir nun ein Problem lösen möchten.

Die Beschreibung der Lösung

Die nächste Frage, die wir uns stellen müssen, ist: Wie soll eine Lösung aussehen? Wir möchten Teilnehmerinnen und Sitzplätze verknüpfen, also eine Abbildung zwischen diesen beiden Mengen finden. Die Abbildung ist jedoch nicht beliebig. Jeder Teilnehmerin soll genau ein Platz zugeordnet werden. Diese Eigenschaft wird von einer Funktion erfüllt:

(declare-fun loesung (Teilnehmerin) Platz)

Das gesamte bisherige Programm sieht damit wie folgt aus:

(set-option :model_evaluator.completion true)

(declare-datatypes () ((Teilnehmerin Anna Sarah Martha Salma Daisy)))

(declare-datatypes () ((Tisch id-tisch-1 id-tisch-2 id-tisch-3)))
(declare-datatypes () ((Platz id-platz-a id-platz-b id-platz-c
                              id-platz-d id-platz-e id-platz-f)))

(declare-fun platz-links (Tisch) Platz)
(declare-fun platz-rechts (Tisch) Platz)

(assert (= (platz-links id-tisch-1) id-platz-a))
(assert (= (platz-rechts id-tisch-1) id-platz-b))

(assert (= (platz-links id-tisch-2) id-platz-c))
(assert (= (platz-rechts id-tisch-2) id-platz-d))

(assert (= (platz-links id-tisch-3) id-platz-e))
(assert (= (platz-rechts id-tisch-3) id-platz-f))

(declare-fun loesung (Teilnehmerin) Platz)

(check-sat)
(get-model)
(eval (loesung Anna))
(eval (loesung Sarah))
(eval (loesung Martha))
(eval (loesung Salma))
(eval (loesung Daisy))

Um an die Plätze der fünf Teilnehmerinnen zu gelangen, verwenden wir ganz am Ende wieder eval.

Wir können das so definierte Programm im Online-Editor ausprobieren. Ein großer Vorteil des Online-Editors ist, dass wir iterativ modellieren können und so sehr schnell sehen, wo unsere Spezifikationen noch Lücken haben. In diesem Fall gibt uns z3 direkt eine unerwünschte „falsche“ Lösung. Alle fünf Teilnehmerinnen werden auf den selben Platz gesetzt! Diese Lösung entspricht jedoch tatsächlich unserer bisherigen Spezifikation. Wir haben also vergessen, eine wichtige Angabe zu spezifizieren.

Wir möchten, dass jeder Platz von maximal einer Teilnehmerin besetzt wird. Die Funktion, die Teilnehmerinnen auf Plätze abbildet, muss also injektiv sein. Wir können die Formel für Injektivität eins zu eins in SMT-LIB 2 ausdrücken.

(declare-fun loesung (Teilnehmerin) Platz)

(assert (forall ((t1 Teilnehmerin))
          (forall ((t2 Teilnehmerin))
            (=> (= (loesung t1) (loesung t2))
                (= t1 t2)))))

In der Assertion verwenden wir ein neues Konstrukt, den sogenannten Allquantor forall. forall nimmt als erstes Argument ein Paar aus einem Variablennamen und einem Typen und als zweites Argument einen Ausdruck, worin der neue Variablenname verwendet wird. Der gesamte, allquantifizierte Ausdruck wird nur dann wahr, wenn der innere Ausdruck für alle Variablenbelegung wahr ist.

Die Assertion sagt aus, dass zwei Teilnehmerinnen nur dann auf den selben Platz abgebildet werden dürfen, wenn es sich um ein und dieselbe Teilnehmerin handelt. Mit diesem Zusatz erhalten wir eine gültige Lösung von z3.

Die Regeln

Jetzt müssen wir noch die Regel „Anna will nicht neben Sarah sitzen“ umsetzen. Dieses Verbot übersetzen wir in eine weitere Assertion in unserem SMT-LIB-2-Programm. Dazu müssen wir uns klar werden, was das Verbot genau ausdrückt. Was bedeutet es, nebeneinander zu sitzen? Zum Zwecke dieses Artikels sagen wir, dass zwei Teilnehmerinnen nebeneinandersitzen, wenn sie am selben Tisch sitzen. Zwei Teilnehmerinnen Anna und Sarah sitzen am selben Tisch T, wenn entweder Anna am linken Platz des Tisches T und Sarah am rechten Platz des Tisches T sitzt, oder umgekehrt. Es darf also keinen solchen Tisch T geben. Wir können dafür einen neuen Quantor benutzen, den Existenzquantor exists:

(assert (not (exists ((t Tisch))
               (or
                 (and
                   (= (loesung Anna)
                      (platz-links t))
                   (= (loesung Sarah)
                      (platz-rechts t)))
                 (and
                   (= (loesung Anna)
                      (platz-rechts t))
                   (= (loesung Sarah)
                      (platz-links t)))))))

Das Nebensitzergebot mit Martha und Salma sieht ganz ähnlich aus. Der einzige Unterschied ist, dass das not am Anfang entfällt.

(assert (exists ((t Tisch))
           (or
             (and
               (= (loesung Martha)
                  (platz-links t))
               (= (loesung Salma)
                  (platz-rechts t)))
             (and
               (= (loesung Martha)
                  (platz-rechts t))
               (= (loesung Salma)
                  (platz-links t))))))

Wenn wir diese zwei Assertions zum Programm hinzufügen, erhalten wir vom Online-Editor wieder eine Lösung, die dieses Mal allen unseren Anforderungen genügt. Wir haben das Sitzplatzproblem in weniger als 60 Zeilen Code beschrieben und automatisch lösen lassen. z3 braucht für die Berechnung der Lösung auf einem modernen Rechner weniger als eine Sekunde.

sitzplan.org

Die Anwendung, die wir gerade im Kleinen gesehen haben, ist in etwas ausführlicherer Form auf sitzplan.org umgesetzt. Die Webanwendung bietet eine einfache grafische Benutzeroberfläche und im Hintergrund läuft z3 und rechnet Sitzpläne aus, wie wir es in diesem Artikel kennengelernt haben.

Abschließende Gedanken

Wir haben ein schwieriges Problem in ein SAT-Problem übersetzt und den allgemeinen Problemlöser z3 darauf angesetzt, das Problem zu lösen, anstatt uns selbst einen komplizierten Algorithmus auszudenken. z3 kann solche Probleme erstaunlich schnell lösen, obwohl es sich theoretisch um die schwierigsten Probleme handelt, die die Informatik zu bieten hat. Allgemeine Problemlöser wie z3 finden in diesen Problemen noch genug Struktur, um schnell zu Ergebnissen zu gelangen. Ist das nicht eigentlich unintuitiv? Die Struktur, die z3 ausnutzt, ist schließlich von Anfang an in der Probleminstanz enthalten. Durch die Übersetzung in ein SAT-Problem geht wahrscheinlich sogar noch Struktur verloren. Ist es nicht doch so, dass wir uns mit dem Wissen über das ursprüngliche Problem selbst einen viel schnelleren Algorithmus ausdenken könnten?

Theoretisch ist die Antwort auf diese Frage Ja. Aber es verhält sich hier wahrscheinlich wie bei handoptimiertem Maschinencode. Theoretisch könnten wir als Programmierer jeden Compiler schlagen, indem wir Algorithmen ausschließlich in Maschinencode schreiben würden. In der Praxis sind Optimierungen in modernen Compilern aber so gut, dass sie in 99% der Fälle besseren Code produzieren können als ein Mensch. Der Mensch ist viel besser, abstrakt zu denken und den Dschungel an Informationen so aufzubereiten, dass er für spezialisierte Software wie z3 überhaupt verständlich wird.