AI News
KI-Training: Menschliche Annotation entscheidend für ChatGPT und autonomes Fahren
Forscher James Muldoon zeigt in seinem Buch "Feeding the Machine", wie menschliche Annotation und Datenlabeling das Training von Large Language Models wie ChatGPT und autonomen Fahrzeugen ermöglichen. Die versteckten Arb
Quelle und Methodik
Dieser Beitrag wird von LLMBase als quellengestützte Analyse von Berichten oder Ankündigungen von Handelsblatt .
Versteckte Arbeitskraft hinter KI-Modellen
Während automatische Web-Crawler der Tech-Konzerne oft als Hauptakteure der KI-Datensammlung gelten, stellt die menschliche Annotation den entscheidenden zweiten Schritt dar. Ohne Menschen, die Texte und Bilder kommentieren, bewerten und beschriften, können gesammelte Daten nicht für das Training von Large Language Models verwendet werden.
Diese "Annotatoren" arbeiten größtenteils versteckt von der Öffentlichkeit und sind für populäre KI-Systeme wie ChatGPT essenziell. Ihre Arbeit umfasst die manuelle Einordnung und Bewertung von Trainingsdaten, die für die Funktionalität moderner KI-Modelle unerlässlich ist.
Aufwändige Datenaufbereitung für autonome Fahrzeuge
Besonders deutlich wird der menschliche Arbeitsaufwand bei autonomen Fahrzeugen. Laut Muldoons Forschung sind 800 menschliche Arbeitsstunden erforderlich, um eine einzige Stunde brauchbares Trainingsmaterial für KI-Systeme im autonomen Fahren herzustellen.
Diese Zahlen verdeutlichen das Missverhältnis zwischen dem öffentlichen Verständnis von KI als automatisierter Technologie und der Realität arbeitsintensiver manueller Datenaufbereitung. Tausende Stunden Bildmaterial müssen von Menschen eingeordnet werden, bevor sie für das Training autonomer Fahrsysteme verwendet werden können.
Globale Arbeitskräftereserve für KI-Training
Eine weltweite Arbeitskräftereserve kümmert sich um die verschiedenen Aspekte der Datenannotation für KI-Systeme. Diese Arbeiter bleiben oft unsichtbar in der öffentlichen Diskussion über KI-Entwicklung, obwohl ihre Tätigkeit fundamental für den Fortschritt in diesem Bereich ist.
Für europäische Unternehmen, die KI-Systeme entwickeln oder einsetzen, ergeben sich daraus Fragen zur Transparenz der Lieferkette und zu ethischen Arbeitsstandards. Die Abhängigkeit von menschlicher Annotation wirft auch Fragen zur Skalierbarkeit und Kostenstruktur von KI-Projekten auf.
Implikationen für KI-Entwicklung und -Einsatz
Die Erkenntnisse von Muldoon zeigen, dass KI-Entwicklung nicht nur eine technologische, sondern auch eine arbeitsorganisatorische Herausforderung darstellt. Unternehmen, die Large Language Models trainieren oder autonome Systeme entwickeln, müssen erhebliche Ressourcen für menschliche Annotation einplanen.
Für Käufer und Betreiber von KI-Systemen bedeutet dies, dass die Qualität der zugrundeliegenden menschlichen Annotation direkt die Leistung der finalen KI-Modelle beeinflusst. Die versteckten Kosten der Datenannotation sollten bei Investitionsentscheidungen berücksichtigt werden.
Die Forschung basiert auf dem über zehn Jahre erarbeiteten Buch von James Muldoon und seinen Kollegen, wie Handelsblatt berichtet.
KI-News Updates
KI-News direkt ins Postfach
Wöchentliche Zusammenfassungen der neuesten KI-News. Jederzeit abmelden.
Weitere Nachrichten
Weitere aktuelle Artikel, die Sie interessieren könnten.
Chat with 100+ AI Models in one App.
Use Claude, ChatGPT, Gemini alongside with EU-Hosted Models like Deepseek, GLM-5, Kimi K2.5 and many more.