Zusammenfassung
Ein mittelständisches Maschinenbauunternehmen stand vor der Herausforderung, seine CRM-Datenbank mit 80.000 Einträgen zu bereinigen, zu aktualisieren und um relevante Neukunden zu erweitern. Mithilfe einer KI-gestützten Pipeline wurden bestehende Daten verbessert, Dubletten entfernt und über 20.000 neue Unternehmen identifiziert. Dies ermöglichte eine gezieltere Vertriebssteuerung und sparte über 800 Arbeitstage manuellen Aufwands.
Ausgangslage
Das Unternehmen arbeitet mit einer Vielzahl kleiner Betriebe zusammen, die ihre Produkte verbauen. Die Vertriebssteuerung benötigte eine zuverlässige Datenbasis, um gezielt neue Betriebe ansprechen und bestehende Kunden strategischer betreuen zu können. Die CRM-Datenbank war jedoch fehlerbehaftet, unvollständig und enthielt viele Dubletten.
Ziele
- Verbesserung der Datenqualität im CRM durch Korrektur, Aktualisierung und Validierung.
- Identifikation neuer relevanter Betriebe, die noch nicht im CRM erfasst waren.
- Effektivere Vertriebssteuerung, um das Potenzial bestehender und neuer Kunden besser zu nutzen.
- Reduktion manueller Aufwände durch Automatisierung der Recherche und Validierung.
Herausforderungen
- Dateninkonsistenzen: Uneinheitliche Schreibweisen, unvollständige Einträge und Dubletten erschwerten die Datenverarbeitung.
- Fehlende Webpräsenz vieler Betriebe: Automatisierte Verifikationsprozesse waren notwenig, um valide Informationen zu generieren.
- Unterschiedliche Datenformate: Adress- und Unternehmensdaten mussten vereinheitlicht und standardisiert werden.
- Matching-Problematik: Abweichende Schreibweisen erschwerten die Identifikation bereits bekannter Betriebe.
Ergebnis
- Datenqualitätsverbesserung: 75 % der Bestandsunternehmen wurden erfolgreich mit externen Quellen angereichert, korrigiert und validiert.
- Dramatische Verbesserung der wichtigsten Datenpunkte: Die Anzahl der Unternehmen mit Website-Angabe wurde verdreifacht.
- Dublettenbereinigung: 3.000 redundante Einträge wurden entfernt oder zusammengeführt.
- Identifikation neuer Betriebe: Mehr als 20.000 zusätzliche Unternehmen wurden erstmals für den Vertrieb erfasst.
- Massive Zeiteinsparung: Manuelle Überprüfung hätte pro Eintrag 5–10 Minuten benötigt, was insgesamt über 800 Arbeitstagen entsprochen hätte – ein Aufwand, der ohne Automatisierung nicht wirtschaftlich gewesen wäre.
- Bessere Vertriebssteuerung: Mit validierten und erweiterten CRM-Daten konnte das Vertriebsteam gezielt auf die vielversprechendsten Kontakte fokussieren, was zu einer effizienteren Nutzung der Vertriebsressourcen führte.
Feedback des Kunden:
„Der Vertrieb liebt den neuen Datensatz und die ganzen neuen Infos!“
Technologie & Umsetzung
- Fuzzy Matching & Dubletten-Identifikation: Intelligente Algorithmen gleichen ähnliche, aber leicht abweichende Einträge ab.
- Kombinierte KI-Pipeline: Eine speziell entwickelte Pipeline simuliert den manuellen Rechercheprozess eines Menschen durch eine Kombination aus:
- Scraping-Algorithmen
- Sprachmodelle für Textanalyse
- Schrittweise Verifikation durch KI-gestützte Prüfmechanismen
- Iterativer Aufbau:
- Nutzung der zuverlässigsten, offensichtlichen Datenquellen
- Stufenweise Ergänzung durch tiefere Recherche
- Automatisierte KI-Verifikation nach jedem Schritt
- Salesforce-Integration: Strukturierte Ergebnisse wurden direkt in das CRM überführt.
- Projektlaufzeit: 6 Wochen von Datenerhebung bis zur Übergabe:
- 1 Woche: Anforderungsdefinition & Datenbereitstellung
- 2 Wochen: Entwicklung & Testing der Pipeline
- 2 Wochen: Verarbeitung der kompletten Daten
- 1 Woche: Strukturierung, Validierung & Übergabe
Langfristige Vorteile
- Automatisierung mit echtem ROI: Ohne diese Lösung wäre eine manuelle Bearbeitung niemals wirtschaftlich machbar gewesen.
- Hohe Akzeptanz beim Vertrieb: Durch die besseren Daten konnte das Team effektiver arbeiten.
- Wiederkehrende Aktualisierung: Aufgrund des Erfolgs wurden nach dem initialen Projekt 2023, in den Jahren 2024 und 2025 Folgeprojekte zur erneuten Datenanreicherung und -validierung durchgeführt.