Portal Automation
Automatisierte Rechnungsverarbeitung mit OCR, Azure-Authentifizierung und SOAP-Integration
Überblick
End-to-End-Automatisierung der Rechnungsverarbeitung für einen Immobilienkonzern. PDF-Rechnungen werden automatisiert aus Azure SharePoint abgerufen, per OCR ausgelesen, validiert und über eine SOAP-Schnittstelle ins Handwerkerportal übertragen. Authentifizierung über Azure Entra ID mit OAuth2 Client Credentials und ChainedTokenCredential-Fallback. Inklusive Service-Katalog-Mapping, E-Mail-Benachrichtigungen bei Fehlern und lückenlosem Abarbeitungs-Log mit JSONB-Speicherung der OCR-Rohdaten.
Eigenständige Konzeption und Fullstack-Entwicklung von Anforderungsanalyse und Kundenkontakt über UI-Design bis zu Deployment. Hexagonale Architektur mit klarer Trennung zwischen Domain-Logik, API-Schicht und Backend-Integrationen (Azure, SOAP, OCR, PostgreSQL). Scheduling-basierter Polling-Mechanismus prüft minütlich den SharePoint-Ordner auf neue Rechnungen. Fehlerhafte Rechnungen werden automatisch in Error-Ordner verschoben und per E-Mail eskaliert.
Tech Stack
Architektur-Highlights
- Domain-Driven Design mit Repository-Interfaces in der Domain und technologie-spezifischen Adaptern (Azure, SOAP, OCR, PostgreSQL)
- Scheduling-basierter Polling-Mechanismus mit automatischem Fehler-Routing
- WS-Security mit XML-Signatur, Timestamp und Java-KeyStore für SOAP-Kommunikation
- ChainedTokenCredential für resiliente Azure-Authentifizierung (Username/Password → Client Secret Fallback)
- Flyway-Migrationen mit PostgreSQL JSONB für flexible OCR-Datenspeicherung
Kernfunktionen
- OCR-Erkennung von PDF-Rechnungen mit Tesseract (deutsche Spracherkennung)
- Azure Entra ID Authentifizierung mit OAuth2 und ChainedTokenCredential-Fallback
- SharePoint-Integration über Microsoft Graph API (Lesen, Verschieben, Ordner-Management)
- SOAP-Anbindung ans Handwerkerportal mit WS-Security und gegenseitiger Zertifikatsauthentifizierung
- Service-Katalog-Mapping für automatische Zuordnung von Rechnungspositionen
- Lückenloses Abarbeitungs-Log mit JSONB-Speicherung der OCR-Rohdaten
- E-Mail-Eskalation bei Verarbeitungsfehlern