AI News

OpenAI Model Spec: Öffentliche Bewertung durch 1.000 Teilnehmer weltweit

OpenAI befragte über 1.000 Menschen zur KI-Verhaltenssteuerung und verglich ihre Ansichten mit der Model Spec. Die Collective Alignment Initiative zeigt hohe Übereinstimmung bei Fairness und Objektivität, Differenzen bei

LLMBase Redaktion Aktualisiert 27. August 2025 2 Min. Lesezeit
OpenAI Model Spec Collective Alignment KI-Sicherheit KI-Modell

Hohe Übereinstimmung bei Kernprinzipien

Die Befragung ergab besonders starke Übereinstimmung bei Prinzipien wie Ehrlichkeit, Demut, Fairness und Objektivität. Teilnehmer bewerteten vier verschiedene Antworten auf kontroverse Prompts und begründeten ihre Präferenzen. OpenAI nutzte einen Model Spec Ranker auf Basis von GPT-5 Thinking, um die öffentlichen Präferenzen mit den bestehenden Richtlinien zu vergleichen.

Die höchste Übereinstimmung zeigte sich bei Prinzipien wie "Unsicherheit ausdrücken", "Grenzen nicht überschreiten" und "Fairness wahren". Divergenzen konzentrierten sich hauptsächlich auf Grenzbereiche der Meinungsfreiheit: politische Inhalte, sexuelle oder grafische Darstellungen sowie Kritik an Pseudowissenschaften.

Geplante Änderungen an der Model Spec

Aus der Befragung resultierten konkrete Anpassungen der Model Spec. OpenAI kategorisierte Vorschläge in Klarstellungen bestehender Prinzipien und grundlegende Prinzipienänderungen. Eine wichtige Klarstellung betrifft politische Inhalte: Künftig wird explizit erlaubt, politische Inhalte für breite Zielgruppen wie "Demokraten" oder "Konservative im Iran" zu erstellen.

Nicht übernommen wurden Vorschläge für personalisierte politische Inhalte und die Freigabe erotischer Inhalte. Bei personalisierten politischen Inhalten verwies OpenAI auf Risiken großangelegter individueller politischer Manipulation. Erotische Inhalte bleiben vorerst eingeschränkt, obwohl viele Teilnehmer diese befürworteten.

Methodik und internationale Perspektive

Die Teilnehmer stammten aus 19 Ländern, ursprünglich aus über 50 Nationen, mit etwa einem Drittel aus den USA. Weitere Teilnehmer kamen aus Mexiko, Südafrika, den Niederlanden, Chile, Großbritannien, Indien, Kenia und Japan. Die demografische Verteilung umfasste verschiedene Altersgruppen, Geschlechter, ethnische Hintergründe, Bildungsebenen und KI-Nutzungsgrade.

Statt die gesamte Model Spec zu bewerten, konzentrierten sich Teilnehmer auf vorausgewählte Prompts in wertesensitiven Bereichen. OpenAI stellte den gesammelten Datensatz auf HuggingFace für weitere Forschung zur Verfügung.

Ausblick für KI-Entwicklung in Europa

Für europäische KI-Teams und Unternehmen bietet OpenAIs Collective Alignment Ansatz wichtige Einblicke in kulturübergreifende Präferenzen bei KI-Verhalten. Die Methodik könnte Vorbildcharakter für die Entwicklung regionaler KI-Governance-Standards haben, besonders vor dem Hintergrund der EU AI Act Implementierung.

Die Ergebnisse zeigen, dass globale Übereinstimmung bei grundlegenden KI-Prinzipien möglich ist, während kulturspezifische Anpassungen bei kontroversen Themen weiterhin erforderlich bleiben.

Original source: OpenAI veröffentlichte diese Collective Alignment Studie unter https://openai.com/index/collective-alignment-aug-2025-updates

KI-News Updates

KI-News direkt ins Postfach

Wöchentliche Zusammenfassungen der neuesten KI-News. Jederzeit abmelden.

EU Made in Europe

Chat with 100+ AI Models in one App.

Use Claude, ChatGPT, Gemini alongside with EU-Hosted Models like Deepseek, GLM-5, Kimi K2.5 and many more.