Labels

Labels

In Data Analytics sind menschliche Mitarbeiter darauf angewiesen, dass ihnen die Daten möglichst perfekt vorsortiert werden, um Informationen auszuwerten. Dazu müssen KI-Anwendungen per Machine Learning auf bestimmte Labels und Features trainiert werden. Das Label beschreibt die Art des Datensatzes, während die Feature die Details definieren. Auf einem Bild kann beispielsweise ein Mensch enthalten sein. Der Algorithmus erkennt den Menschen an seinen typischen Identifikationsmerkmalen und labeled das Bild „Mensch“, während zu den Features beispielsweise „Mann“, „alt“ und „graue Haare“, aber auch „Portrait“ oder „laufend“ hinzugefügt werden. Dadurch bildet das Label eine Art Überkategorie zur ersten Sortierung.

Schnellere Analyse durch Machine Learning

Besonders im Bereich der Big Data Analytics ist es unerlässlich, Daten labeln zu lassen, bevor mit ihnen gearbeitet werden kann. Unlabeled Daten sind meist in großer Menge aus verschiedenen Quellen und in verschiedenen Formaten verfügbar. Allein die Sortierung nach Arten der Formate, beispielsweise Bilder, Videos, Audio, Text, csv, hashes usw. würde die Kapazitäten der Datenanalytiker übersteigen. Darum sortiert die KI in verschiedenen Abstufungen vor, bis hin zu den Features, die aufgrund von Training voraussagen können, welche Art von Information sich hinter der Datei verbirgt. Dabei handelt es sich jedoch häufig um unsaubere Predictions, die für sich genommen nicht verlässlich sind.

Labels manuell vergeben

Nicht jedes Label in der Datenanalyse wurde durch die KI vergeben. Stichprobenartige Daten lassen sich auch manuell mit Labels versehen. Da diese Aufgabe sehr zeitaufwendig ist, lohnt sich ein Outsourcen bei nicht-sensiblen Daten. Alle Labels, ob maschinell oder manuell erstellt, sollten vor der konkreten Arbeit damit überprüft werden. Die Vergabe ungenauer Labels kann die Analyse selbst verzerren oder Datensätze unbrauchbar machen, wenn der Fehler zu spät bemerkt wird.

DataAnalyst.eu

Das Angebot von DataAnalyst.eu richtet sich an Jobsuchende im Bereich Data Science und Unternehmen, die auf der Suche nach Data-Analysten sind.

In unserem Lexikon und Data-Science-Blog bündeln wir für Sie außerdem Informationen rund um Begrifflichkeiten, Berufsfeld, Karriere und Trends.
DataAnalyst.eu
« Back to Glossary Index