Künstliche Intelligenz wird zunehmend zur Vorauswahl von Bewerbungen eingesetzt. Effizienz, Geschwindigkeit und vermeintliche Objektivität stehen im Vordergrund. Doch diese Vorteile haben eine Schattenseite:
LLMs (Large Language Models) halluzinieren unter Komplexität und verstecken Fehler hinter plausibel klingender Sprache.
Für Unternehmen kann das nicht nur ineffizient, sondern auch rechtlich und reputationsbezogen riskant werden.
1. Bias im Recruiting ist real – und nachgewiesen
Mehrere unabhängige Untersuchungen zeigen:
KI-basierte Screening-Tools erzeugen systematische Verzerrungen. Bewerbungen werden je nach Namen, Sprache oder wahrgenommenem Geschlecht unterschiedlich gerankt – selbst bei identischen Qualifikationen.
Untersuchungen der University of Washington belegen, dass gängige KI-Tools subtile, aber signifikante Bias-Effekte im Bewerbungsranking erzeugen.
Auch aktuelle Forschungsarbeiten auf arXiv analysieren LLM-basierte Screeningprozesse und identifizieren wiederholt Verzerrungen gegenüber bestimmten Gruppen.
Kernpunkt:
KI ist nicht neutral. Sie repliziert statistische Muster aus Trainingsdaten – inklusive historischer Diskriminierung.
2. Plausible Sprache ist nicht gleich korrekte Bewertung
LLMs erzeugen Texte auf Basis von Wahrscheinlichkeiten – nicht auf Basis von Verständnis oder Wahrheit.
Forschungen zeigen:
- Modelle liefern auch bei Unsicherheit selbstbewusst klingende Antworten
- sprachliche Glätte wird mit inhaltlicher Qualität verwechselt
- Fehler werden nicht als Fehler markiert
In der Fachwelt wird dieses Phänomen als „fluent but wrong“ bezeichnet.
Im Recruiting bedeutet das:
Eine sauber formulierte Bewerbung wirkt kompetenter – unabhängig von tatsächlicher Eignung.
3. Sensitivität auf Stil und Kontext verzerrt Ergebnisse
Wenn Lebensläufe:
- nicht linear verlaufen
- aus anderen kulturellen Kontexten stammen
- sprachlich variantenreich formuliert sind
zeigen KI-Systeme eine erhöhte Wahrscheinlichkeit, diese schlechter zu bewerten.
Nicht wegen fehlender Qualifikation – sondern wegen statistischer Abweichung vom „Normmuster“.
Forschungen aus dem Harvard-Umfeld zeigen, dass algorithmische Recruiting-Systeme gerade bei heterogenen Ausdrucksformen besonders anfällig für Verzerrungen sind.
Kurz gesagt:
Standardisierte Karrieren werden belohnt. Vielfalt wird systemisch benachteiligt.
4. Skalierung macht Fehler nicht kleiner – sondern unsichtbar
Ein einzelner Fehlentscheid mag korrigierbar sein.
Tausende automatisierte Entscheidungen nicht.
Bei Skalierung:
- verschwinden Fehler in Rankinglisten
- wirken Resultate objektiv
- fehlt Transparenz über Unsicherheiten
Das Risiko ist nicht nur ethisch – sondern unternehmerisch:
- Reputationsschäden
- Diskriminierungsvorwürfe
- regulatorische Probleme (DSGVO, EU AI Act, künftige Schweizer Regelwerke)
5. KI beeinflusst menschliche Entscheidungen stärker als gedacht
Studien zeigen, dass Menschen ihre Urteile an KI-Empfehlungen anpassen – selbst wenn sie Verzerrungen erkennen.
Das heisst:
Ein voreingenommenes System wirkt nicht neutralisierend,
sondern verschiebt menschliche Entscheidungen systematisch mit.
Der „Human in the Loop“ ist oft kein Korrektiv, sondern ein Verstärker.
6. Was Unternehmen konkret tun sollten
1) KI als Assistenz, nicht als Entscheider einsetzen
Strukturieren ja – urteilen nein.
2) Regelmässige Bias-Audits durchführen
Nicht einmalig, sondern laufend.
3) Transparenz schaffen
Warum bewertet ein System so – nicht nur was es ausgibt.
4) Rechtliche Risiken aktiv mitdenken
Automatisierte Entscheidungen ohne Nachvollziehbarkeit sind haftungsrelevant.
5) Menschliche Verantwortung fest verankern
Finale Entscheide müssen beim Menschen bleiben – real, nicht formal.
Schweizer Kontext
Gerade für Schweizer Unternehmen ist das kein abstraktes Technologiethema.
KMU leben von Vertrauen, Fairness und Reputation als Arbeitgeber.
Automatisierte Fehlbewertungen oder systematische Verzerrungen gefährden nicht nur Compliance – sondern die kulturelle Substanz von Organisationen.
In einem kleinen Arbeitsmarkt werden algorithmische Fehler nicht statistisch unsichtbar – sie wirken direkt auf Talentbindung und Arbeitgeberimage.
Fazit
LLMs sind beeindruckende Werkzeuge.
Aber ihre Grenzen haben reale Konsequenzen:
- Bias wird skaliert
- Fehler werden sprachlich kaschiert
- Plausibilität ersetzt Urteilskraft
- Verantwortung wird an Systeme delegiert
Effizienz ohne Entscheidungsverantwortung wird zum systemischen Risiko.
KI kann unterstützen.
Sie darf nicht entscheiden.
Reflexionsfrage zum Schluss
Wo in Ihrem Recruiting werden Entscheidungen bereits an Systeme delegiert, die keine Verantwortung tragen können?
Vertrauen Sie Ergebnissen – oder verstehen Sie Ihre Entscheidungslogik?
Wir decken systemische Risiken in automatisierten Auswahlprozessen auf.
Quellen & weiterführende Literatur
University of Washington – KI-Bias im Bewerbungsranking
https://www.washington.edu/news/2024/10/31/ai-bias-resume-screening-race-gender/
AI Screening Bias in Resume Evaluation (arXiv Preprint)
https://arxiv.org/abs/2407.20371
Harvard – Bias in AI-powered Hiring Platforms
https://seas.harvard.edu/news/how-can-bias-be-removed-artificial-intelligence-powered-hiring-platforms
No Thoughts Just AI – Einfluss von KI auf menschliche Entscheidungen (arXiv)
https://arxiv.org/abs/2509.04404
HR Today – Wenn KI Diskriminierung skaliert
https://hrtoday.ch/de/article/wenn-ki-die-diskriminierung-skaliert