Die Herausforderung: Langsame Rechnungs- und Belegverarbeitung

Die meisten Finanzteams verlassen sich noch immer auf Menschen, die Rechnungen, Belege und Kreditkartenabrechnungen lesen und die Daten anschließend Zeile für Zeile in ERP- oder Spesentools eintippen. Jedes neue Lieferantenformat, jeder unscharfe Taxibeleg und jeder Ausnahmefall landet auf dem Schreibtisch von jemandem. Wenn die Volumina wachsen, führt dieser manuelle Ansatz zu Rückständen, verzögerten Freigaben und einem ständigen Kampf, zum Monatsende aufzuholen.

Traditionelle Ansätze wie einfache OCR, Templates oder das Outsourcing an Shared Service Center halten nicht mehr Schritt. Template-basierte Systeme brechen zusammen, sobald ein Lieferant sein Layout ändert; Regelwerke erfordern ständige Pflege; und Offshoring senkt zwar die Stückkosten, reduziert aber weder die Durchlaufzeit noch verbessert es die Datenqualität. Keine dieser Lösungen kann den realen Mix aus PDFs, gescannten Bildern, Handyfotos und E-Mail-Threads, den moderne Finanzteams täglich erhalten, zuverlässig verarbeiten.

Die geschäftlichen Auswirkungen sind erheblich. Langsame Rechnungs- und Belegverarbeitung bindet hochqualifizierte Finanzkräfte in Tätigkeiten mit geringem Mehrwert, verursacht Säumnisgebühren und schädigt Lieferantenbeziehungen. Sie blockiert zudem die Echtzeit-Sicht auf tatsächliche Ausgaben, was die Liquiditätsplanung ungenauer macht und Kostenkontrolle reaktiv statt proaktiv werden lässt. In wettbewerbsintensiven Märkten bedeutet die fehlende Möglichkeit, Ausgabemuster nahezu in Echtzeit zu erkennen, verpasste Chancen, Verträge neu zu verhandeln, redundante Abonnements abzuschaffen oder Reiserichtlinien zu verschärfen.

Die gute Nachricht: Dieses Problem ist lösbar. Moderne multimodale KI wie Gemini kann PDFs, Bilder und E-Mails lesen und daraus strukturierte, finanzreife Daten mit Erläuterungen und Anomalie-Hinweisen erzeugen. Bei Reruption haben wir Organisationen dabei unterstützt, langsame, manuelle Workflows durch KI-first-Prozesse in dokumentenintensiven Bereichen zu ersetzen. Nachfolgend finden Sie praxisnahe Hinweise, wie Sie denselben Ansatz auf Ihre Rechnungs- und Belegverarbeitung anwenden können.

Brauchen Sie einen Sparring-Partner für diese Herausforderung?

Lassen Sie uns unverbindlich sprechen und brainstormen.

Innovatoren bei diesen Unternehmen vertrauen uns:

Unsere Einschätzung

Eine strategische Einschätzung der Herausforderung und High-Level-Tipps, wie Sie sie angehen können.

Aus Reruption-Sicht ist langsame Rechnungs- und Belegverarbeitung kein Personalproblem mehr, sondern ein Architekturproblem. Mit der multimodalen KI von Gemini können Finanzteams ihre Prozesse so neu gestalten, dass das System Rechnungen liest, Positionen extrahiert, Ausgaben klassifiziert und Anomalien markiert, bevor ein Mensch die Daten überhaupt anfasst. Basierend auf unserer praktischen Erfahrung im Aufbau von Lösungen für KI-gestützte Dokumentenverarbeitung und Automatisierung sehen wir Gemini als robuste Grundlage für Finanzorganisationen, die von manueller Datenerfassung zu KI-first-Ausgabenkontrolle wechseln wollen.

In End-to-End-Workflows denken, nicht in Insellösungen

Wenn Finanzteams Gemini für Rechnungs- und Belegverarbeitung evaluieren, starten sie oft mit der Frage: „Kann es dieses spezifische Rechnungsformat lesen?“ Das ist die falsche Ebene. Strategisch sollten Sie den End-to-End-Workflow gestalten: vom E-Mail-Eingang oder Upload über Datenauslesung, Anreicherung (Kostenstelle, USt, Projektcodes), Richtlinienprüfungen, Freigaben bis hin zur Buchung in Ihrem ERP- oder Spesensystem.

Mit dieser Denkweise vermeiden Sie, ein weiteres isoliertes Tool zu bauen, das vom Finanzteam betreut werden muss. Stattdessen wird Gemini zur Intelligenz, die in einen größeren Prozess eingebettet ist: Es verarbeitet Dokumente aus Ihren bestehenden Kanälen (z. B. Kreditoren-Mailbox, Google Drive, Spesen-App), gibt strukturierte Daten per API aus und löst nachgelagerte Automatisierungen aus. Reruption beginnt typischerweise damit, diesen End-to-End-Prozess gemeinsam mit Finance, Procurement und IT zu modellieren, um sicherzustellen, dass KI die gesamte Kette verbessert – nicht nur einen einzelnen Schritt.

Mit klar abgegrenzten, volumenstarken Use Cases starten

Strategisch entstehen die schnellsten Erfolge von KI im Finanzbereich in volumenstarken, repetitiven Rechnungskategorien: wiederkehrende Abonnements, Standardlieferantenrechnungen, Reisebelege von einigen großen Anbietern. Hier kann Gemini mit relativ einfachen Konfigurationen sofortige Reduktionen der Durchlaufzeit und Verbesserungen der Genauigkeit liefern.

Widerstehen Sie der Versuchung, mit chaotischen, ausnahmeintensiven Rechnungen zu starten. Definieren Sie stattdessen einen klaren Ausschnitt: beispielsweise „alle Rechnungen unserer Top-30-Lieferanten“ oder „alle Hotel- und Flugbelege von bevorzugten Reisepartnern“. Belegen Sie, dass Gemini die richtigen Felder extrahieren, Kostenstellen zuverlässig zuordnen und Steuern korrekt erkennen kann. Sobald dies stabil läuft, erweitern Sie auf komplexere Szenarien. Dieser stufenweise Ansatz reduziert Risiken und baut Vertrauen bei Controllern und Prüfern auf.

Ihr Finanzteam auf eine KI-assistierte Rolle vorbereiten

Die Einführung von Gemini in der Rechnungsverarbeitung verändert die Rolle Ihres Finanzteams von der Datenerfassung hin zu Überwachung und Ausnahmebehandlung. Dieser Wandel ist strategisch, nicht nur technisch. Controller, Kreditorenbuchhalter und Finance Business Partner müssen verstehen, wie die KI konzeptionell arbeitet, welche typischen Fehlermuster auftreten und wie sie eingreifen sollen.

Wir empfehlen, neue Rollen und Verantwortlichkeiten explizit zu definieren: Wer prüft Auslesungen mit geringer Konfidenz, wer bearbeitet Anomalie-Hinweise und wer verantwortet den Trainings- und Verbesserungszyklus. Mit einem KI-first-Blickwinkel werden Finanzteams zu Gestaltern von Regeln, Prompts und Leitplanken statt zu Datentypisten. Reruption führt häufig gezielte Enablement-Sessions durch, damit Finanzmitarbeitende KI-Ausgaben sicher interpretieren und hinterfragen können, anstatt sie blind zu vertrauen.

Governance für Datenqualität und Compliance aufbauen

Der Einsatz von Gemini für Finanzdokumente erfordert von Anfang an ein Governance-Framework. Rechnungen und Belege enthalten sensible Daten (Lieferantendetails, Preise, teilweise personenbezogene Daten). Strategisch brauchen Sie klare Richtlinien dazu, wo Daten gespeichert werden, welche Gemini-Bereitstellung verwendet wird (z. B. innerhalb bestimmter Google-Cloud-Regionseinstellungen) und wie Protokolle für Audit-Trails aufbewahrt werden.

Etablieren Sie KPIs zur Datenqualität (z. B. Extraktionsgenauigkeit je Feld, Anzahl manueller Korrekturen, Erkennungsrate von Richtlinienverstößen) und verknüpfen Sie diese mit Ihrem Internen Kontrollsystem. Finance, IT und Compliance sollten gemeinsam definieren, was „gut genug“ für automatisierte Buchungen ist und ab welchen Schwellenwerten eine menschliche Prüfung ausgelöst wird. So wird Gemini von einem experimentellen Tool zu einem prüfbaren Bestandteil Ihres Financial-Control-Frameworks.

Integration frühzeitig planen, nicht als Nachgedanken

Selbst die genaueste KI-Rechnungsextraktion ist wertlos, wenn die Daten Ihr ERP, Ihre Buchhaltungs- oder Spesenlösung nicht sauber erreichen. Strategisch muss Integration Teil des initialen Designs sein: Wo wird Gemini laufen (Google-Workspace-Add-ons, individuelle Web-App oder Backend-Service)? Wie wird es an SAP, DATEV, NetSuite oder Ihren individuellen Finanz-Stack angebunden?

In unseren Projekten sehen wir den höchsten ROI, wenn Gemini direkt in bestehende Tools eingebettet ist: eine Finanz-Mailbox, die Rechnungen automatisch weiterleitet und verarbeitet, ein Google Sheet, das sich selbst mit strukturierten Rechnungsdaten füllt, oder ein Middleware-Service, der Buchungen per API ins ERP überträgt. Besprechen Sie diese Integrationspfade frühzeitig mit der IT und wählen Sie eine Architektur, die von einem Pilot auf einen gruppenweiten Roll-out skalieren kann, ohne neu entwickelt werden zu müssen.

Sorgfältig eingesetzt kann Gemini langsame, fehleranfällige Rechnungs- und Belegverarbeitung in einen schnellen, kontrollierten und weitgehend automatisierten Workflow verwandeln. Entscheidend ist nicht nur, ein Modell anzuschließen, sondern den Finanzprozess rund um die KI neu zu gestalten: klarer Scope, Governance, Teambefähigung und robuste Integrationen.

Reruption kombiniert tiefgehende KI-Engineering-Kompetenz mit einem finanzorientierten Co-Preneur-Ansatz, um genau solche Systeme in Organisationen aufzubauen. Wenn Sie erkunden möchten, wie Gemini in Ihre Kreditorenprozesse und Ihre Ausgabenkontrolle passt, helfen wir Ihnen, von der Idee zu einem funktionierenden Prototyp und anschließend in die Produktion zu kommen – in einem Tempo, das zu Ihrem Anspruch passt.

Hilfe bei der Umsetzung dieser Ideen?

Nehmen Sie gerne unverbindlich Kontakt zu uns auf.

Fallbeispiele aus der Praxis

Von Fintech bis Energie: Erfahren Sie, wie Unternehmen Gemini erfolgreich einsetzen.

PayPal

Fintech

PayPal, als globaler Marktführer im Online-Zahlungsverkehr, sieht sich unablässigen, sich weiterentwickelnden Betrugstaktiken durch hochentwickelte Cyberkriminelle gegenüber. Mit Milliarden von Transaktionen, die monatlich verarbeitet werden—über 500 Millionen Zahlungen—muss die Plattform Anomalien in Echtzeit erkennen, um massive finanzielle Verluste und Vertrauensverluste bei Kunden zu verhindern. Traditionelle regelbasierte Systeme kämpften mit False Positives und verpassten neuartige Betrugsmuster, was pro Vorfall potenziell zu Millionenverlusten führen konnte. Der Umfang verstärkte die Herausforderungen: hochfrequente Datenströme erforderten Entscheidungen in Bruchteilen einer Sekunde, während unausgewogene Datensätze (Betrug <0.1% der Transaktionen) die Modellgenauigkeit behinderte. Regulatorischer Druck und Nutzererwartungen an nahtlose Erlebnisse verlangten eine Lösung, die Sicherheit und Geschwindigkeit ausbalanciert, da unentdeckter Betrug $2B+ pro Jahr kosten und dem Ruf schaden könnte.

Lösung

PayPal implementierte Machine-Learning-Ensembles mit Deep-Learning-Modellen zur Anomalieerkennung und bewertet jede Transaktion anhand von 250+ Signalen wie Geräte-Fingerprinting, verhaltensbiometrischen Merkmalen und Netzwerkdaten. Die Modelle werden kontinuierlich mit aktuellen Daten retrainiert, um sich an neue Bedrohungen anzupassen, wobei Plattformen wie H2O Driverless AI für automatisiertes Feature Engineering und Deployment genutzt werden. Das System integriert Echtzeit-Inferenz über fortschrittliche Hardware und markiert Hochrisiko-Transaktionen sofort zur Prüfung oder Sperrung. Hybride Ansätze kombinieren überwachtes Lernen für bekannten Betrug und unüberwachte Anomalieerkennung für Zero-Day-Angriffe, wodurch manuelle Prüfungen um 50% reduziert werden.

Ergebnisse

  • 10% Verbesserung der Betrugserkennungsgenauigkeit
  • $500 million an Betrug, vierteljährlich blockiert (~$2B jährlich)
  • 25 million Angriffe täglich verhindert
  • 50% Reduktion der manuellen Prüfungsaufwände
  • 99.99% Genehmigungsrate für legitime Zahlungen
  • Latenz für Echtzeit-Inferenz unter 50ms
Fallstudie lesen →

Bank of America

Bankwesen

Die Bank of America sah sich einem hohen Volumen routinemäßiger Kundenanfragen gegenüber, etwa Kontostände, Zahlungen und Transaktionsverläufe, was traditionelle Callcenter und Supportkanäle überlastete. Bei Millionen täglicher Nutzer des digitalen Bankings fiel es der Bank schwer, rund um die Uhr personalisierte Finanzberatung in großem Maßstab anzubieten, was zu Ineffizienzen, längeren Wartezeiten und uneinheitlicher Servicequalität führte. Kunden forderten proaktive Erkenntnisse über einfache Abfragen hinaus, etwa Ausgabemuster oder finanzielle Empfehlungen, doch menschliche Mitarbeitende konnten das Volumen nicht ohne steigende Kosten bewältigen. Zudem stellte die Sicherstellung von konversationeller Natürlichkeit in einer regulierten Branche wie dem Bankwesen eine Herausforderung dar, einschließlich der Einhaltung von Datenschutzbestimmungen im Finanzwesen, der präzisen Interpretation komplexer Anfragen und der nahtlosen Integration in die Mobile App, ohne die Nutzererfahrung zu stören. Die Bank musste KI-Automatisierung mit menschlicher Empathie ausbalancieren, um Vertrauen und hohe Zufriedenheitswerte zu erhalten.

Lösung

Bank of America entwickelte Erica, einen internen durch NLP unterstützten virtuellen Assistenten, der direkt in die Mobile-Banking-App integriert ist und Natural Language Processing sowie prädiktive Analytik nutzt, um Anfragen konversationell zu bearbeiten. Erica fungiert als Einstiegspunkt für Self-Service, bearbeitet Routineaufgaben sofort und liefert gleichzeitig personalisierte Einblicke, wie Liquiditätsprognosen oder maßgeschneiderte Empfehlungen, wobei Kundendaten sicher verwendet werden. Die Lösung entwickelte sich von einem einfachen Navigationstool zu einer ausgefeilten KI und integrierte Generative-AI-Komponenten für natürlichere Interaktionen sowie das nahtlose Eskalieren komplexer Fälle an menschliche Agenten. Mit dem Fokus auf interne Sprachmodelle gewährleistet sie Kontrolle über Datenschutz und Anpassung, treibt die unternehmensweite KI-Einführung voran und steigert das digitale Engagement.

Ergebnisse

  • Über 3 Milliarden Kundeninteraktionen insgesamt seit 2018
  • Nahezu 50 Millionen eindeutige Nutzer unterstützt
  • Über 58 Millionen Interaktionen pro Monat (2025)
  • 2 Milliarden Interaktionen bis April 2024 erreicht (Verdoppelung von 1 Mrd. in 18 Monaten)
  • Bis 2024 wurden 42 Millionen Kunden unterstützt
  • 19 % Gewinnanstieg, verbunden mit Effizienzgewinnen
Fallstudie lesen →

Kaiser Permanente

Gesundheitswesen

In Krankenhäusern erfahren erwachsene Patienten auf Allgemeinstationen häufig eine , ohne dass rechtzeitig ausreichend Warnzeichen erkannt werden. Das führt zu Notfallverlegungen auf Intensivstationen, erhöhter Sterblichkeit und vermeidbaren Wiederaufnahmen. Kaiser Permanente Northern California stand vor diesem Problem in seinem Netzwerk, in dem subtile Veränderungen bei Vitalparametern und Laborwerten bei hohem Patientenvolumen und anspruchsvollen Arbeitsabläufen leicht übersehen wurden. Das resultierte in erhöhten negativen Ergebnissen, darunter vermeidbar hohe Sterberaten und 30-Tage-Wiederaufnahmen . Traditionelle Frühwarnscores wie MEWS (Modified Early Warning Score) waren durch manuelle Erfassung und unzureichende Vorhersagegenauigkeit für Verschlechterungen innerhalb von 12 Stunden limitiert und nutzten nicht das volle Potenzial elektronischer Patientenakten (EHR). Die Herausforderung wurde durch Alarmmüdigkeit durch weniger präzise Systeme verschärft und erforderte eine skalierbare Lösung für 21 Krankenhäuser, die Millionen von Patienten versorgen .

Lösung

Kaiser Permanente entwickelte den Advance Alert Monitor (AAM), ein KI-gestütztes Frühwarnsystem, das prädiktive Analytik einsetzt, um Echtzeit-EHR-Daten — einschließlich Vitalzeichen, Laborwerte und Demografie — zu analysieren und Patienten mit hohem Risiko einer Verschlechterung innerhalb der nächsten 12 Stunden zu identifizieren. Das Modell erzeugt eine Risikobewertung und automatisierte Alarme, die in die klinischen Arbeitsabläufe integriert werden und zeitnahe Interventionen wie ärztliche Überprüfungen oder den Einsatz von Rapid Response Teams auslösen . Seit der Einführung in 2013 in Nordkalifornien verwendet AAM Machine-Learning-Algorithmen, die auf historischen Daten trainiert wurden und traditionelle Scores übertreffen, wobei erklärbare Vorhersagen das Vertrauen der Mitarbeitenden stärken. Die Einführung erfolgte stationsweit, Integrationsprobleme wurden über Epic-EHR-Kompatibilität und Schulungen für Klinikpersonal adressiert, um Alarmmüdigkeit zu minimieren .

Ergebnisse

  • 16 % geringere Sterblichkeitsrate in der AAM-Interventionskohorte
  • Über 500 Todesfälle jährlich im Netzwerk verhindert
  • 10 % Reduktion bei 30-Tage-Wiederaufnahmen
  • Identifiziert Verschlechterungsrisiken innerhalb von 12 Stunden mit hoher Zuverlässigkeit
  • Eingesetzt in 21 Krankenhäusern in Nordkalifornien
Fallstudie lesen →

Tesla, Inc.

Automobilindustrie

Die Automobilindustrie steht vor der alarmierenden Tatsache, dass 94 % aller Verkehrsunfälle auf menschliches Versagen zurückzuführen sind — einschließlich Ablenkung, Ermüdung und Fehlentscheidungen — was weltweit über 1,3 Millionen Verkehrstote pro Jahr zur Folge hat. In den USA zeigen NHTSA‑Daten im Durchschnitt einen Unfall pro 670.000 Meilen, was den dringenden Bedarf an fortschrittlichen Fahrerassistenzsystemen (ADAS) zur Verbesserung der Sicherheit und Reduzierung von Todesfällen unterstreicht. Tesla stand vor spezifischen Hürden beim Skalieren einer rein visionbasierten Autonomie, indem Radar und LiDAR zugunsten kamerabasierter Systeme verworfen wurden, die auf KI angewiesen sind, um menschliche Wahrnehmung nachzubilden. Zu den Herausforderungen gehörten die variable KI‑Leistung unter unterschiedlichen Bedingungen wie Nebel, Nacht oder Baustellen, regulatorische Prüfungen wegen irreführender Level‑2‑Kennzeichnung trotz Level‑4‑ähnlicher Demos sowie die Gewährleistung robuster Fahrerüberwachung, um Überverlass zu verhindern. Frühere Vorfälle und Studien kritisierten die inkonsistente Zuverlässigkeit der Computer Vision.

Lösung

Teslas Autopilot und Full Self-Driving (FSD) Supervised setzen auf End-to-End Deep Learning‑Neuronale Netze, die auf Milliarden realer Meilen trainiert wurden und Kameradaten für Wahrnehmung, Vorhersage und Steuerung verarbeiten — ohne modulare Regeln. Der Übergang von HydraNet (Multi‑Task‑Learning für 30+ Outputs) zu reinen End‑to‑End‑Modellen brachte FSD v14 das Tür‑zu‑Tür‑Fahren mittels video‑basiertem Imitationslernen. Um die Herausforderungen zu meistern, skalierte Tesla die Datenerfassung über seine Flotte von über 6 Mio. Fahrzeugen und nutzte Dojo‑Supercomputer zum Training auf Petabytes an Videodaten. Der rein visionbasierte Ansatz senkt Kosten gegenüber LiDAR‑Konkurrenten; aktuelle Upgrades wie neue Kameras adressieren Randfälle. Regulatorisch zielt Tesla auf unüberwachtes FSD bis Ende 2025, wobei eine Zulassung in China für 2026 angepeilt ist.

Ergebnisse

  • Unfallrate Autopilot: 1 pro 6,36 Mio. Meilen (Q3 2025)
  • Sicherheitsfaktor: 9x sicherer als US‑Durchschnitt (670.000 Meilen/Unfall)
  • Flottendaten: Milliarden von Meilen für das Training
  • FSD v14: Tür‑zu‑Tür‑Autonomie erreicht
  • Q2 2025: 1 Unfall pro 6,69 Mio. Meilen
  • Rekord Q4 2024: 5,94 Mio. Meilen zwischen Unfällen
Fallstudie lesen →

Duolingo

EdTech

Duolingo, ein Vorreiter im gamifizierten Sprachlernen, sah sich mit wesentlichen Einschränkungen bei der Bereitstellung von praktischer Konversationspraxis und tiefgehendem Feedback konfrontiert. Während die kurzen Lektionen Wortschatz und Grundlagen effektiv vermittelten, sehnten sich Nutzer nach immersiven Dialogen, die Alltagssituationen simulieren – etwas, das statische Übungen nicht leisten konnten . Diese Lücke behinderte den Fortschritt in Richtung Sprachflüssigkeit, da Lernende kaum Gelegenheiten für freies Sprechen und nuancierte Grammatik-Erklärungen ohne teure menschliche Tutoren hatten. Zudem war die Inhaltserstellung ein Engpass. Fachexperten erstellten Lektionen manuell, was die Einführung neuer Kurse und Sprachen bei schnellem Nutzerwachstum verlangsamte. Die Skalierung personalisierter Erfahrungen über 40+ Sprachen erforderte Innovation, um das Engagement ohne proportionale Ressourcensteigerung aufrechtzuerhalten . Diese Herausforderungen drohten erhöhte Abwanderung und begrenzte Monetarisierung in einem wettbewerbsintensiven EdTech-Markt.

Lösung

Duolingo startete Duolingo Max im März 2023 – ein Premium-Abo, das von GPT-4 angetrieben wird und Roleplay für dynamische Dialoge sowie Explain My Answer für kontextuelle Rückmeldungen einführte . Roleplay simuliert reale Interaktionen wie Kaffeebestellungen oder Urlaubsplanung mit KI-Charakteren und passt sich in Echtzeit an Nutzereingaben an. Explain My Answer liefert detaillierte Aufschlüsselungen richtiger/falscher Antworten und verbessert so das Verständnis. Ergänzend automatisiert Duolingo's Birdbrain-LLM (feinabgestimmt auf proprietären Daten) die Lektionserstellung, sodass Experten Inhalte 10× schneller produzieren können . Dieser hybride Mensch‑KI-Ansatz sicherte Qualität bei gleichzeitiger schneller Skalierung und wurde nahtlos in die App für alle Schwierigkeitsstufen integriert .

Ergebnisse

  • DAU-Wachstum: +59 % YoY auf 34,1 Mio. (Q2 2024)
  • DAU-Wachstum: +54 % YoY auf 31,4 Mio. (Q1 2024)
  • Umsatzwachstum: +41 % YoY auf 178,3 Mio. $ (Q2 2024)
  • Bereinigte EBITDA-Marge: 27,0 % (Q2 2024)
  • Lektionserstellung: 10× schneller mit KI
  • Selbstwirksamkeit der Nutzer: deutliche Steigerung nach KI-Nutzung (Studie 2025)
Fallstudie lesen →

Best Practices

Erfolgreiche Implementierungen folgen bewährten Mustern. Werfen Sie einen Blick auf unsere taktischen Ratschläge für den Einstieg.

Gemini-gestützte Rechnungsannahme in Google Workspace einrichten

Eine praxisnahe Möglichkeit, Gemini für die Rechnungsverarbeitung zu nutzen, besteht darin, den Eingang von PDF-Rechnungen und rechnungsbezogenen E-Mails in Google Workspace zu automatisieren. Richten Sie eine dedizierte Kreditoren-Mailbox ein (z. B. invoices@yourcompany.com) und leiten Sie alle Lieferantenrechnungen dorthin. Nutzen Sie Google Apps Script und die Gemini-API, um diese Mailbox auf neue Anhänge und E-Mails zu überwachen.

Wenn eine neue Nachricht eintrifft, kann Ihr Skript die Rechnungs-PDF oder das Bild herunterladen, Gemini mit einem strukturierten Prompt aufrufen und die extrahierten Daten in ein Google Sheet oder direkt in Ihre Middleware schreiben. Dadurch entfällt die Notwendigkeit, dass Finanzmitarbeitende jede Rechnung manuell öffnen, lesen und abtippen.

Beispiel-Prompt für Gemini bei PDF-Rechnungen:
Sie sind ein KI-Assistent für ein Finanzteam. Extrahieren Sie strukturierte Daten aus der folgenden Rechnung.
Geben Sie JSON mit diesen Feldern zurück:
- supplier_name
- supplier_vat_id
- invoice_number
- invoice_date (ISO-Format)
- due_date (ISO-Format)
- currency
- total_gross
- total_net
- total_vat
- vat_rate
- payment_terms
- purchase_order_number
- line_items: [
    {description, quantity, unit_price, net_amount, vat_amount, cost_center_suggestion}
  ]
Wenn ein Feld auf der Rechnung fehlt, setzen Sie dieses Feld auf null.

Erwartetes Ergebnis: Rechnungen landen in Ihrer Kreditoren-Mailbox und werden automatisch in strukturierte Datenzeilen für die weitere Verarbeitung umgewandelt, wodurch die manuelle Intake-Zeit bei Standardfällen um 70–90 % reduziert wird.

Gemini zur automatischen Ausgabenkategorisierung und Kostenstellenvorschlägen nutzen

Sobald Sie strukturierte Positionen haben, ist der nächste Schritt, Gemini für die Ausgabenkategorisierung einzusetzen. Geben Sie Beschreibung, Lieferant und historische Kontierungsbeispiele an Gemini weiter, sodass das System Vorschläge für Sachkonten, Kostenstellen, Projekte und USt-Codes machen kann. Mit der Zeit kann dies den Großteil der wiederkehrenden Lieferanten und Ausgabentypen abdecken.

Implementieren Sie eine Feedbackschleife: Immer wenn eine Finanznutzerin oder ein Finanznutzer einen Vorschlag korrigiert, protokollieren Sie die Korrektur und verfeinern Sie in regelmäßigen Abständen Prompt und Beispiele. So entsteht auf Basis von Gemini ein unternehmensspezifisches Klassifizierungswissen.

Beispiel-Few-Shot-Prompt für Kostenstellenvorschläge:
Sie ordnen Kostenstellen und Sachkonten für Rechnungen zu.
Nutzen Sie die Beispiele, um unternehmensspezifische Regeln zu lernen.

Beispiele:
Rechnung: "Microsoft 365 Business Premium Abonnement für das Vertriebsteam, April"
Lieferant: Microsoft
Ergebnis: {gl_account: "6400 - Software-Abonnements", cost_center: "400 - Vertrieb"}

Rechnung: "Hotelaufenthalt für Kundentermine in Berlin (Vertrieb)"
Lieferant: Marriott
Ergebnis: {gl_account: "6600 - Reisekosten", cost_center: "400 - Vertrieb"}

Klassifizieren Sie nun diese Position:
Rechnungstext: {{line_description}}
Lieferant: {{supplier_name}}
Geben Sie JSON mit gl_account und cost_center zurück.

Erwartetes Ergebnis: 60–80 % der Rechnungen können mit hoher Konfidenz automatisch kontiert werden, sodass nur Spezialfälle und Positionen mit geringer Sicherheit manuell geprüft werden müssen.

Belegverarbeitung für Mitarbeiterspesen automatisieren

Mitarbeiterspesen sind oft noch chaotischer als Lieferantenrechnungen – mit Fotos von zerknitterten Belegen und mehrsprachigen Formaten. Nutzen Sie die multimodalen Fähigkeiten von Gemini, um diese zu verarbeiten. Integrieren Sie Gemini in Ihre Spesen-App oder bauen Sie ein einfaches Webformular, in dem Mitarbeitende Belegfotos zusammen mit minimalen Metadaten hochladen.

Beim Upload senden Sie das Bild an Gemini mit einem Prompt, der Händler, Datum, USt, Summen und Währung extrahiert und diese Daten auf Ihre Spesenkategorien abbildet. Kombinieren Sie dies mit einfacher Richtlinienlogik (z. B. maximale Tagespauschalen für Mahlzeiten, Hotelpreisobergrenzen je Stadt), um potenzielle Verstöße zu kennzeichnen.

Beispiel-Prompt für Reisebelege:
Sie verarbeiten Reisebelege für ein Spesenmanagementsystem.
Extrahieren Sie aus dem Bild:
- merchant_name
- address
- country
- receipt_date
- currency
- total_gross
- total_vat
- vat_rate
- payment_method
- category (eine der folgenden: HOTEL, MEAL, TAXI, TRAIN, FLIGHT, OTHER)
Geben Sie JSON zurück. Wenn Sie sich bei einem Feld unsicher sind, setzen Sie es auf null und vermerken Sie Ihre Unsicherheit in einem Feld namens "comments".

Erwartetes Ergebnis: Mitarbeitende verbringen weniger Zeit mit dem Ausfüllen von Spesenformularen, während Finance strukturierte, richtlinienfähige Daten erhält und weniger manuelle Korrekturen nötig sind.

Richtlinienprüfungen und Anomalieerkennung in den Workflow einbetten

Über die reine Extraktion hinaus kann Gemini Anomalieerkennung und Richtliniendurchsetzung unterstützen. Sobald strukturierte Daten vorliegen, rufen Sie Gemini erneut auf – diesmal mit Richtlinienbeschreibungen und historischen Mustern –, damit das System Buchungen als „OK“, „Needs review“ oder „Likely violation“ mit Begründung kennzeichnet.

Kombinieren Sie dies mit Schwellwerten und Heuristiken: Markieren Sie beispielsweise jede Rechnung, die um mehr als 30 % vom typischen Betrag für diesen Lieferanten abweicht, oder jede Reisekostenposition, die Ihre Standard-Tagespauschale übersteigt. Stellen Sie die Erklärung von Gemini dem oder der Controller:in zur Verfügung, damit diese:r schnell entscheiden kann, ob blockiert, freigegeben oder eskaliert werden soll.

Beispiel-Prompt für Richtlinienprüfung:
Sie sind für die Kontrolle der Spesenrichtlinie verantwortlich. Prüfen Sie diese Ausgabe:
{{structured_invoice_json}}

Zusammenfassung der Unternehmensrichtlinie:
- Hotel max.: 180 EUR/Nacht in der EU, 250 USD/Nacht in den USA.
- Keine First-Class-Flüge.
- Taxi-Fahrten > 150 EUR erfordern eine Begründung.

Antwort:
- policy_status: OK / NEEDS_REVIEW / VIOLATION
- reasons: [Liste von Gründen]
- suggested_action: APPROVE / REJECT / REQUEST_EXPLANATION

Erwartetes Ergebnis: Controller konzentrieren sich auf einen kleineren Teil tatsächlich risikoreicher oder ungewöhnlicher Ausgaben und verbessern die Risikodeckung, ohne zusätzliches Personal aufzubauen.

Über Middleware mit Ihrem ERP- oder Buchhaltungssystem integrieren

Um den Prozess vollständig zu schließen, verbinden Sie die Ausgaben von Gemini mit Ihrem ERP- oder Buchhaltungssystem. Ein leichtgewichtiger Middleware-Service (z. B. ein kleiner Backend-Service auf Google Cloud Functions oder Ähnlichem) kann das strukturierte Rechnungs-JSON entgegennehmen und in API-Aufrufe oder Importdateien für SAP, DATEV, NetSuite oder Ihre eigene Finanzbuchhaltung übersetzen.

Implementieren Sie klare Buchungsregeln: Rechnungen über einem bestimmten Konfidenzwert und unterhalb einer monetären Schwelle können automatisch gebucht werden; andere werden in einer Prüfoberfläche in die Warteschlange gestellt, in der Finanzmitarbeitende das Originaldokument, die von Gemini ausgelesenen Daten und die Kontierungsvorschläge sehen. So kombinieren Sie die Geschwindigkeit der Automatisierung mit der Sicherheit menschlicher Kontrolle.

Beispielhafter technischer Ablauf:
1) Rechnungs-E-Mail trifft in der Kreditoren-Mailbox ein.
2) Apps Script leitet den Anhang an die Gemini-API weiter.
3) Gemini gibt strukturiertes JSON zurück.
4) Middleware validiert die Felder und reichert sie mit Lieferanten-IDs und Kontenzuordnungen an.
5) Wenn confidence >= 0.9 und amount < 5.000 EUR, direkte Buchung über die ERP-API.
6) Andernfalls Versand an ein "AP Review"-Dashboard zur manuellen Bestätigung.

Erwartetes Ergebnis: Ein großer Anteil der Rechnungen wird ohne manuelle Bearbeitung direkt in Ihr ERP durchgebucht, während Ausnahmen effizient an die richtigen Prüfer:innen geleitet werden.

KPIs verfolgen und Prompts sowie Regeln kontinuierlich optimieren

Betrachten Sie Gemini-basierte Rechnungsautomatisierung schließlich als lebendes System. Implementieren Sie ein Logging zentraler KPIs: Extraktionsgenauigkeit je Feld, Anteil automatisch kontierter Rechnungen, durchschnittliche Bearbeitungszeit je Dokument, Anzahl an Richtlinienverstößen sowie Anzahl von False Positives/Negatives.

Nutzen Sie diese Daten, um Prompts iterativ zu verfeinern, weitere Few-Shot-Beispiele hinzuzufügen und Ihre Schwellenwerte anzupassen. Planen Sie vierteljährliche Reviews mit Finance und IT, um zu analysieren, wo Menschen noch Zeit aufwenden und ob Gemini zusätzlichen Workload zuverlässig übernehmen kann. Diese kontinuierliche Optimierung erschließt einen großen Teil des langfristigen ROI.

Erwartete Ergebnisse: Innerhalb von 3–9 Monaten verzeichnen Finanzteams typischerweise eine Reduktion manueller Datenerfassung für Standardrechnungen und -belege um 50–80 %, deutlich kürzere Freigabezyklen, weniger Säumnisgebühren und einen Quantensprung bei der Echtzeit-Transparenz über Ausgabenkategorien und Kostentreiber.

Brauchen Sie jetzt Umsetzungskompetenz?

Lassen Sie uns über Ihre Ideen sprechen!

Häufig gestellte Fragen

Gemini beschleunigt die Rechnungs- und Belegverarbeitung, indem es PDFs, Bilder und E-Mails direkt liest und in strukturierte Daten umwandelt, die von Finanzsystemen genutzt werden können. Statt dass Mitarbeitende Lieferantennamen, Daten, Beträge, USt und Positionen manuell eintippen, extrahiert Gemini diese Felder in Sekunden.

Zusätzlich zur Extraktion können Sie Gemini so konfigurieren, dass Sachkonten, Kostenstellen und Ausgabenkategorien vorgeschlagen werden, sodass die meisten Dokumente nahezu „touchless“ verarbeitet werden. Finanzteams prüfen dann nur noch Fälle mit geringer Konfidenz und Anomalien, was Rückstände und Durchlaufzeiten drastisch reduziert.

Mindestens benötigen Sie Zugriff auf Gemini über Google Workspace oder die API, eine Person mit grundlegenden Skript- oder Entwicklungskenntnissen (z. B. Google Apps Script, Python oder eine Low-Code-Plattform) sowie eine:n Finance-Stakeholder:in, die oder der die benötigten Felder, Kontierungsregeln und Richtlinien definiert.

Für eine robuste Implementierung sollten Sie außerdem die IT für die Integration in Ihr ERP- oder Buchhaltungssystem einbinden sowie eine:n Finanzverantwortliche:n, die oder der die Prozessneugestaltung und das Kontrollframework verantwortet. Reruption stellt üblicherweise ein kleines, funktionsübergreifendes Team (Finance + IT + unsere Engineers) zusammen, um von einem ersten Prototyp zu einer sicheren, wartbaren Lösung zu gelangen.

Mit einem fokussierten Scope können Sie greifbare Ergebnisse in wenigen Wochen sehen. Ein grundlegender Pilot, der einen Ausschnitt von Lieferantenrechnungen oder Reisebelegen verarbeitet, lässt sich üblicherweise innerhalb von 2–4 Wochen aufsetzen – inklusive Prompt-Design, Extraktionstests und einer einfachen Review-Oberfläche (z. B. Google Sheets oder ein Web-Dashboard).

Die Ausweitung auf weitere Lieferanten, die Integration in Ihr ERP sowie die Ergänzung von Richtlinienprüfungen dauert typischerweise weitere 4–12 Wochen – abhängig von Ihrer IT-Landschaft und Ihren Governance-Anforderungen. Die meisten Organisationen sehen reduzierte Rückstände und schnellere Durchlaufzeiten, sobald der Pilot mit echten Dokumenten live geht.

Die Kosten für den Einsatz von Gemini bestehen im Wesentlichen aus API-Nutzung (abhängig vom Dokumentenvolumen und vom gewählten Modell) sowie dem einmaligen Aufwand für das Design und die Integration der Lösung. Für viele Finanzteams bleiben die API-Kosten selbst in großem Maßstab im Vergleich zu den eingesparten Personalkosten moderat.

Hinsichtlich ROI sehen Unternehmen typischerweise eine Reduktion manueller Datenerfassung für Standardrechnungen und -belege um 50–80 %, weniger Säumnisgebühren und eine bessere Nutzung von Skonti und Frühzahler-Rabatten. Der zusätzliche Wert aus Echtzeit-Transparenz der Ausgaben und verbesserter Compliance (weniger unerkannte Richtlinienverstöße) übertrifft die direkten Produktivitätsgewinne häufig – insbesondere in größeren Organisationen.

Reruption begleitet Sie von der Idee bis zum produktiven System mit unserem AI-PoC-Angebot und dem Co-Preneur-Ansatz. Wir starten mit einem fokussierten Proof of Concept (9.900 €), in dem wir den Use Case definieren, Gemini mit Ihren realen Rechnungen und Belegen verbinden und einen funktionierenden Prototyp entwickeln, der Daten extrahiert, Ausgaben klassifiziert und Anomalien markiert.

Darauf aufbauend unterstützen wir Sie hands-on bei der Implementierung: Integration in Ihr ERP- oder Spesentool, Aufbau von Governance und Security sowie Befähigung Ihres Finanzteams, effektiv mit der KI zu arbeiten. Als Co-Preneure arbeiten wir eng mit Ihrem Team, übernehmen Mitverantwortung für Ergebnisse und bewegen uns in dem Tempo, das nötig ist, um langsame, manuelle Rechnungsverarbeitung durch eine KI-first-Lösung abzulösen, die zu Ihrer Organisation passt.

Kontaktieren Sie uns!

0/10 min.

Direkt Kontaktieren

Your Contact

Philipp M. W. Hoffmann

Founder & Partner

Adresse

Reruption GmbH

Falkertstraße 2

70176 Stuttgart

Kontakt

Social Media