Healthy Data: Eine gesunde Datenbasis ist der Schlüssel zu KI und maschinellem Lernen

Für ambitionierte Unternehmen führt heutzutage kein Weg an maschinellem Lernen (ML) und künstlicher Intelligenz (KI) vorbei. Bei der Arbeit mit diesen beiden Zukunftstechnologien spielen Daten eine zentrale Rolle: Eine umfangreiche und „gesunde“ Datenbasis ist der unabdingbare Treibstoff, mit dem die entsprechenden KI/ML-Anwendungen befeuert werden.

Ihr enormes Potenzial können KI und ML nämlich nur dann entfalten, wenn sie mit hochwertigen, normalisierten Datenmengen gefüttert werden. Gerade in hart umkämpften Märkten können Erkenntnisse, die aus fundierten Datenanalysen gewonnen werden, Unternehmen einen entscheidenden Wettbewerbsvorteil verschaffen.

Minderwertige Datenbestände hingegen verursachen Schätzungen zufolge allein in den USA Kosten in Höhe von mehr als 3 Billionen US-Dollar pro Jahr. Datenwissenschaftler, die keinen Zugang zu einer ausreichend großen Menge an Daten haben, mangelt es am „Rohmaterial“, um erfolgreiche ML-Architekturen und -Modelle zu bauen. Die Folge sind dann fehleranfällige Systeme und unzuverlässige Ergebnisse.

Das Fundament gesunder Daten: Datenmanagement mit Struktur

Dahingegen weisen fehlerfreie oder „gesunde“ Daten keine Duplikate oder falsche Informationen auf; sie enthalten keine Formatierungsfehler, Informationslücken oder falsch zugeordnete Terminologien. Die Menge an Daten, die heutzutage generiert und verfügbar gemacht wird, nimmt exponentiell zu. Nicht zuletzt deshalb kann die strukturierte Erfassung großer Datenmengen eine erhebliche Herausforderung darstellen. Wer dabei ins Hintertreffen gerät und die Flut an Daten nicht in die richtigen Bahnen lenkt, verpasst unter Umständen wertvolle Erkenntnisse oder erhält schlimmstenfalls irreführende Resultate.

Unternehmen, die ihre Daten vor diesem Hintergrund optimieren und in gesunde Daten verwandeln wollen, müssen über ihre kurzfristigen Geschäftsziele hinausdenken. Sie benötigen einen integrierten Ansatz, bei dem sie identifizieren, welche Daten wo und wie erfasst und bereinigt werden und wie sich ihre Nutzung mit den anvisierten Geschäftszielen deckt.

Die Vorteile gesunder Daten

Gesunde Daten können die Effizienz einer Organisation durch folgende Vorteile erhöhen:

  • Vertrauenswürdige Daten: Unternehmen müssen sich darauf verlassen können, dass ihre Daten „sauber“ sind – schließlich müssen auf dieser Grundlage in kurzer Zeit weitreichende Geschäftsentscheidungen getroffen werden – etwa bevor ein Auftrag vorbeizieht oder eine Bedrohung unerkannt bleibt.
  • Entscheiden und handeln in Echtzeit: Gesunde Daten dienen als wertvolle Entscheidungsgrundlage. Sie können auch für die strategische Planung herangezogen werden und Unternehmen einen wertvollen Wettbewerbsvorteil verschaffen.
  • Smartere KI: Mit gesunden Daten können sich Datenwissenschaftler stärker auf Analysen konzentrieren, die das Unternehmen tatsächlich voranbringen – ein klarer Fortschritt gegenüber reinem Data Wrangling.

Unternehmen benötigen gesunde Daten, um KI und ML effizienter einzusetzen, betriebliche Abläufe zu optimieren und einen wichtigen Beitrag zum Geschäftserfolg zu leisten. Mit gesunden, bereinigten Daten sind die Möglichkeiten für geschäftlichen Mehrwert beinahe grenzenlos.

Scott Gnau

Scott Gnau

Vice President, Data Platforms

Scott Gnau stieß 2019 als Vice President of Data Platforms zu InterSystems. Im Rahmen dieser Position ist er für die Entwicklung, das Management und den Vertrieb der Plattformfamilie InterSystems IRIS™ verantwortlich.

Er kann mehr als 20 Jahre Erfahrung im Bereich Datenmanagement vorweisen und leitete in der Vergangenheit bereits große Technologie- und Datenarchitekturinitiativen für Unternehmen. Vor seinem Eintritt bei InterSystems war Scott Gnau als Chief Technology Officer bei Hortonworks tätig.

Zuvor arbeitete Scott Gnau zwei Jahrzehnte bei Teradata, wo er leitende Positionen wie die des President von Teradata Labs bekleidete. Er hat einen Bachelor in Elektrotechnik von der Drexel University.

Kommentar verfassen

*