Wie Large Language Models und algorithmische Verfahren
Datenbestände auf Auffälligkeiten analysieren
Sprachverständnis, Kontextanalyse und die Grenzen reiner Textmodelle
LLM als Orchestrator — Python als Ausführungsschicht
Benford, Zeitreihen, Clustering, Ausreißer-Erkennung
Von der Fragestellung zum Prüfungsergebnis
Sprachverständnis trifft auf steuerliches Fachwissen
Kernproblem: Ein LLM allein kann keine 50.000 Buchungssätze analysieren. Es braucht Werkzeuge — und genau hier kommt Code ins Spiel.
LLM denkt — Python rechnet — Ergebnisse werden verstanden
💬 „Analysiere die Kreditorenbuchungen der Gemeinschuldnerin auf Auffälligkeiten im Zeitraum 6 Monate vor Insolvenzantrag. Prüfe insbesondere auf ungewöhnliche Zahlungen an nahestehende Personen."
Entscheidend: Das LLM führt den Code aus, sieht das Ergebnis und kann iterativ nachfragen: „Die Verteilung ist auffällig — soll ich die Top-10 Buchungen einzeln prüfen?"
Das analytische Werkzeugset hinter der KI
In natürlich gewachsenen Zahlenreihen folgt die Verteilung der führenden Ziffern einer logarithmischen Gesetzmäßigkeit.
Abweichungen deuten auf Manipulation, fehlende Belege oder systematische Rundungen hin.
Insolvenz-Kontext: Auffällige Häufung bestimmter Beträge kurz vor Insolvenzantrag — Indizien für § 133 InsO (Vorsätzliche Benachteiligung)
| Methode | Einsatzgebiet | Insolvenz-Relevanz |
|---|---|---|
| Benford's Law | Ziffernverteilung in Betragsfeldern | Manipulierte Rechnungen, Scheinbuchungen |
| Z-Score / IQR | Statistische Ausreißer-Erkennung | Ungewöhnlich hohe Einzelzahlungen |
| Zeitreihenanalyse | Trends und Brüche im Zeitverlauf | Plötzliche Umsatzeinbrüche / -spitzen |
| Clustering (k-Means) | Gruppierung ähnlicher Transaktionen | Identifikation atypischer Geschäftspartner |
| Duplikat-Erkennung | Fuzzy Matching auf Belegen | Doppelzahlungen, Scheinrechnungen |
| Netzwerkanalyse | Beziehungsgeflechte zwischen Konten | Nahestehende Personen (§ 138 InsO) |
| Gap-Analyse | Lücken in Nummernkreisen | Fehlende Rechnungen, Belegmanipulation |
Verflechtungen zwischen Gemeinschuldner, Geschäftsführern, Gesellschaftern und Geschäftspartnern werden in tabellarischen Daten leicht übersehen.
Ein Graph-Algorithmus erkennt automatisch:
Von der Frage zur Prüfungsfeststellung — Schritt für Schritt
GDPdU-Export oder CSV der FiBu — Buchungsjournal, Kontenstammdaten, Gesellschafterliste
„Gibt es Zahlungen an Gesellschafter in den letzten 12 Monaten vor Antrag, die über dem Durchschnitt liegen?"
Automatisch: Datenimport → Verknüpfung → Filterung → Statistische Analyse → Visualisierung
Tabelle + Grafik + textliche Einordnung. Nachfragen: „Zeige die Gegenkonten dieser Buchungen."
Beispiel-Output des LLM:
„In den 180 Tagen vor Insolvenzantrag wurden 23 Zahlungen an den Gesellschafter-GF M. identifiziert, Gesamtvolumen 187.340 €. Der Durchschnittsbetrag liegt 3,2 Standardabweichungen über dem Median aller Kreditorenzahlungen. 7 Buchungen haben identische Beträge (8.900 €) — mögliche Indizien für § 133 InsO."
Der Paradigmenwechsel: Die Prüferin / der Prüfer wird vom Datenhandwerker zum Datendirigenten. Die fachliche Kompetenz bleibt entscheidend — das Werkzeug ändert sich.
Was bleibt Aufgabe des Menschen?
KI liefert Hinweise — die rechtliche Würdigung trifft der Prüfer
§ 30 AO: Steuergeheimnisdaten nicht in Cloud-LLMs. Lokale oder abgesicherte Umgebungen
Jedes LLM-Ergebnis plausibilisieren — Stichproben, Gegenproben, Vier-Augen-Prinzip
Merksatz: KI ist ein Werkzeug, kein Ersatz für steuerliche Urteilskraft. Das LLM findet die Nadel — der Prüfer entscheidet, ob sie relevant ist.
Das LLM versteht die Frage. Python liefert die Antwort.
Der Prüfer trägt die Verantwortung.
Insolvenzsteuer-Fachtagung 2025 · Vielen Dank für Ihre Aufmerksamkeit
StB Michel Braun · WTS, Düsseldorf | Stefan Werner · GKBp Land Brandenburg (in nicht dienstlicher Eigenschaft)
Moderation: Prof. Dr. Marc Desens · Universität Leipzig