23.04.2026

Neue Veröffentlichung in Computational Communication Research

Emese Domahidi aus der CCS-Gruppe hat gemeinsam mit einem internationalen Team von Autor*innen einen neuen Open-Access-Artikel mit dem Titel „Gender Representation in Large Language Models: A Cross-Linguistic and Cross-Model Analysis“ in der Zeitschrift Computational Communication Research veröffentlicht.

Darum geht es: 

Die Darstellung von Geschlecht in Large Language Models (LLMs) kann bestehende soziokulturelle Ungleichheiten widerspiegeln und verstärken. Gleichzeitig unterscheiden sich solche Verzerrungen teils deutlich zwischen Sprachen, was sowohl auf sprachliche Eigenschaften als auch auf die Trainingsdaten der Modelle zurückzuführen ist. In der Studie untersuchte das Team die Geschlechterrepräsentation in 24 Open-Weight-LLMs über sechs sprachlich unterschiedliche Kontexte hinweg: Englisch, Deutsch, Russisch, Tschechisch, Albanisch und Serbisch.

Über binäre Geschlechterkonzepte hinaus wurden auch nichtbinäre Personen in die Analyse einbezogen. Untersucht wurden Zusammenhänge zwischen verschiedenen Geschlechterkategorien und psychometrisch validierten Stereotypdimensionen. Die Ergebnisse zeigen, dass traditionelle Geschlechterstereotype weiterhin bestehen, allerdings mit unterschiedlicher Ausprägung je nach Sprache und Modell. Gleichzeitig weisen Assoziationen mit nichtbinären Identitäten eine hohe sprachübergreifende Variabilität auf. Die Analysen zeigen zudem, dass diese Muster tief in den Modellparametern verankert sind. Insgesamt verdeutlichen die Befunde, dass sowohl kontextuelle (z. B. sprachliche) als auch technische Faktoren die Identifikation und mögliche Reduktion von Gender-Bias in LLMs prägen.

Weitere Informationen zur Studie gibt es hier: https://doi.org/10.5117/CCR2026.2.11.URMA