ChatGPT vs. Planerio: Wer kann bessere Dienstpläne erstellen?

Dienstplan mit KI erstellen: ChatGPT vs. Planerio | Planerio

Kann ChatGPT nicht auch einfach Dienstpläne erstellen? Diese Frage hören wir immer wieder. Also haben wir den Test gemacht.

Unsere spezialisierte Dienstplanungs-KI gegen den Alleskönner ChatGPT (Version 5.2). Ein echter Praxistest mit echten Daten aus der Pflege. Die Ergebnisse haben uns selbst überrascht…

Das war unsere Basis: 6 Mitarbeitende, 10 Tage, die üblichen harten und weichen Constraints (das sind Muss-Regeln und Soll-Regeln). Also ein einfacher Dienstplan, eine Aufgabe, wie sie die Automatische Planung von Planerio täglich löst. Hier das Ergebnis:

Was hat ChatGPT wirklich gut gemacht?

ChatGPT hat komplexe Zusammenhänge gut erklärt.
Alle Begründungen waren klar und nachvollziehbar.

ChatGPT hat Fairness-Aspekte selbst angesprochen.
Ohne dass wir danach fragten, hat ChatGPT vorgeschlagen, Nachtschichten fair zu verteilen. Ein wichtiger Aspekt, den viele vergessen.

ChatGPT hat einen eigenen Fehler erkannt.
Nach einem Fehler haben wir nachgefragt. ChatGPT hat den Fehler (fast) selbst erkannt und korrigiert. Diese Fähigkeit zur Selbstkorrektur ist bemerkenswert.

ChatGPT hat selbst gewarnt, dass bei der Berechnung Fehler passieren können.
„Fehler können auftreten“ und „Es gibt bessere Tools dafür“.

Allerdings sind folgende Probleme aufgetreten:

Problem 1: Unfaire Verteilung
Eine Pflegekraft wurde komplett vergessen – sie hatte 0 Schichten in 30 Tagen.
Die anderen Pflegekräfte? Waren teilweise massiv überlastet.

Problem 2: Compliance-Verstöße
Wöchentliche Arbeitszeitgrenzen wurden überschritten.
Das bedeutet im echten Leben: Rechtliche Konsequenzen und eine Gefährdung der Mitarbeitergesundheit.

Problem 3: Halluzinierte Regeln
ChatGPT hat eine „Präferenz für Tagschichten“ erfunden, die wir nie vorgegeben hatten.

Problem 4: Mathematische Fehler
Die Gesamtzahl der Schichten wurde falsch gezählt.

ChatGPT hat am Ende selbst empfohlen, spezialisierte Tools wie Planerio zu verwenden, und den Schichtplan trotz Anweisung nicht fertiggestellt.

Was haben wir daraus gelernt?

LLMs sind auf Mustererkennung trainiert, nicht auf exakte Berechnungen.

Für Dienst- und Schichtplanung bedeutet das:

  • Keine Garantie für Regelkonformität
  • Keine konsistente Fairness
  • Keine Verlässlichkeit bei Planungszielen

ChatGPT ist brillant in dem, wofür es entwickelt wurde. Aber das Beispiel zeigt: Nicht jede Aufgabe ist für General Purpose AI geeignet.
Spezialisierte Systeme wie Planerio nutzen deterministische Algorithmen. Was das bedeutet? Fragen wir Wikipedia:

Was sind die Kernmerkmale deterministischer Systeme?

Festgelegt: Zukünftige Zustände sind durch die Vergangenheit determiniert.
Berechenbar: Identische Eingaben führen stets zur gleichen Ausgabe.
Kein Zufall: Es gibt keine echten Zufallselemente oder Abweichungen im Ablauf. 

Unsere Erkenntnisse zusammengefasst:

General Purpose LLMs sind auf vielen Gebieten eine immense Bereicherung
General Purpose LLMs ersetzen nicht spezialisierte Systeme
Allerdings kann man sie kombinieren: Spezialisierte Systeme übernehmen die Planung, LLM können erläutern und analysieren.

Bevor Sie also Ihren nächsten Dienstplan mit ChatGPT erstellen, sprechen Sie lieber mit dem Experten.

Kontaktieren Sie uns für eine Demo.
Ihre Planung verdient Besseres!

30 Minuten
Ihr Wunschtermin
Kostenlos & unverbindlich