KI-Begriff 1 Min. Lesezeit

LLM

Ein Large Language Model (LLM) ist eine Form künstlicher Intelligenz, die mit großen Mengen an Textdaten trainiert wurde, um menschliche Sprache zu verstehen und zu erzeugen.


Ein LLM (Large Language Model) ist ein auf neuronalen Netzen basierendes Sprachmodell, das große Textmengen verarbeitet, um menschliche Sprache zu verstehen und zu generieren. Es wird durch selbstüberwachtes Lernen auf umfangreichen Datensätzen vortrainiert und kann Aufgaben wie Textvervollständigung, Übersetzung, Fragebeantwortung oder Textklassifikation übernehmen. LLMs zeichnen sich durch ihre Skalierbarkeit aus: Mit zunehmender Modellgröße und Datenmenge verbessert sich in der Regel die Leistung, allerdings steigen auch Rechenaufwand und ökologischer Fußabdruck. Typische Einschränkungen sind das Erzeugen von Fehlinformationen („Halluzinationen“), mangelndes Weltwissen über den Trainingszeitpunkt hinaus und mögliche Verzerrungen in den Trainingsdaten. Bekannte Beispiele sind GPT-4, BERT und T5.

← Zurück zum Glossar