Zurück zu Projekten
AbgeschlossenHighlight

Portal Automation

Automatisierte Rechnungsverarbeitung mit OCR, Azure-Authentifizierung und SOAP-Integration

Zeitraum
März 2023Dezember 2023
Branche
Immobilienwirtschaft
Rollen
FullstackBackendFrontendArchitektProduct OwnerDevOps
Status
Abgeschlossen

Überblick

End-to-End-Automatisierung der Rechnungsverarbeitung für einen Immobilienkonzern. PDF-Rechnungen werden automatisiert aus Azure SharePoint abgerufen, per OCR ausgelesen, validiert und über eine SOAP-Schnittstelle ins Handwerkerportal übertragen. Authentifizierung über Azure Entra ID mit OAuth2 Client Credentials und ChainedTokenCredential-Fallback. Inklusive Service-Katalog-Mapping, E-Mail-Benachrichtigungen bei Fehlern und lückenlosem Abarbeitungs-Log mit JSONB-Speicherung der OCR-Rohdaten.

Eigenständige Konzeption und Fullstack-Entwicklung von Anforderungsanalyse und Kundenkontakt über UI-Design bis zu Deployment. Hexagonale Architektur mit klarer Trennung zwischen Domain-Logik, API-Schicht und Backend-Integrationen (Azure, SOAP, OCR, PostgreSQL). Scheduling-basierter Polling-Mechanismus prüft minütlich den SharePoint-Ordner auf neue Rechnungen. Fehlerhafte Rechnungen werden automatisch in Error-Ordner verschoben und per E-Mail eskaliert.

Tech Stack

Sprachen & Technologien
JavaTypeScript
Frameworks
Spring BootAngularAngular MaterialFlywayTesseractSpring Web Services
Datenbanken
PostgreSQL
Infrastruktur
Azure Entra IDAzure SharePointMicrosoft Graph APIDocker-ComposeGitLab CI/CDJava-KeyStorenginx
Konzepte & Patterns
SOAPRESTDomain Driven DesignOCROAuth2Hexagonal ArchitectureScheduled Processing

Architektur-Highlights

  • Domain-Driven Design mit Repository-Interfaces in der Domain und technologie-spezifischen Adaptern (Azure, SOAP, OCR, PostgreSQL)
  • Scheduling-basierter Polling-Mechanismus mit automatischem Fehler-Routing
  • WS-Security mit XML-Signatur, Timestamp und Java-KeyStore für SOAP-Kommunikation
  • ChainedTokenCredential für resiliente Azure-Authentifizierung (Username/Password → Client Secret Fallback)
  • Flyway-Migrationen mit PostgreSQL JSONB für flexible OCR-Datenspeicherung

Kernfunktionen

  • OCR-Erkennung von PDF-Rechnungen mit Tesseract (deutsche Spracherkennung)
  • Azure Entra ID Authentifizierung mit OAuth2 und ChainedTokenCredential-Fallback
  • SharePoint-Integration über Microsoft Graph API (Lesen, Verschieben, Ordner-Management)
  • SOAP-Anbindung ans Handwerkerportal mit WS-Security und gegenseitiger Zertifikatsauthentifizierung
  • Service-Katalog-Mapping für automatische Zuordnung von Rechnungspositionen
  • Lückenloses Abarbeitungs-Log mit JSONB-Speicherung der OCR-Rohdaten
  • E-Mail-Eskalation bei Verarbeitungsfehlern