UNABHäNGIGE BEWERTUNG BESTäTIGT HOHE GENAUIGKEIT

Bei Gender-API nehmen wir die Genauigkeit unseres Dienstes sehr ernst. Kürzlich wurde eine unabhängige Bewertung durchgeführt, um die Zuverlässigkeit unseres Dienstes bei der Bestimmung des Geschlechts anhand von Vornamen zu validieren. Die Ergebnisse waren ermutigend und zeigten die Präzision und Effektivität unserer API im Umgang mit vielfältigen Namen aus verschiedenen Ländern.
Studienübersicht
Eine Validierungsstudie, durchgeführt von Jim Hagberg von der University of Maryland, um die Fehlerrate unseres Geschlechtsidentifikationsdienstes im Vergleich zu manuell verifizierten Online-Quellen zu bewerten. Die Studie analysierte Vornamen, die aus in drei wissenschaftlichen Zeitschriften veröffentlichten Forschungsartikeln extrahiert wurden:
- Journal of Applied Physiology
- Medizin und Wissenschaft in Sport und Medizin
- Internationales Journal für Sportmedizin
Die Analyse umfasste 500 Vornamen, die nicht geschlechtsspezifisch waren und dem Forscher unbekannt waren. Diese Namen wurden mithilfe von Online-Suchen nach Bildern oder geschlechtsspezifischen Pronomen in Verbindung mit den Autoren validiert.
Methoden der Geschlechtsidentifikation
Die Studie nutzte drei unabhängige Methoden, um das Geschlecht zu identifizieren:
- Die traditionelle Erkennung von Vornamen basiert auf allgemein anerkannten geschlechtsspezifischen Namen.
- Persönliches Wissen des Forschers über das Geschlecht der Person.
- Gender-API nutzt KI und eine Datenbank mit über 6 Millionen Namen aus 190 Ländern, um das Geschlecht vorherzusagen.
Wichtige Erkenntnisse
- Von 500 Namen hatten 11 (2,2%) keine Ergebnisse in der Gender-API-Datenbank.
- Von den verbleibenden 488 Namen wurden 435 (89,1%) mit mindestens 80% Vertrauen korrekt identifiziert.
- 392 Namen (80,3%) wurden mit über 90% Vertrauen korrekt identifiziert.
- 359 Namen (73,5%) wurden mit über 95% Vertrauen korrekt identifiziert.
- 282 Namen (57,8%) wurden mit über 98% Vertrauen korrekt identifiziert.
Der durchschnittliche Zuverlässigkeitsgrad über alle Vorhersagen hinweg lag bei 94 % ± 13 %. Das zeigt ein hohes Maß an Zuverlässigkeit, sogar bei weniger häufigen Namen.
Fehlerquotenanalyse
Insgesamt zeigten 22 Namen (4.5%) Abweichungen zwischen den Vorhersagen der Gender-API und der Online-Validierung. Wenn jedoch ein 80%%iges Vertrauensniveau angewendet wird, sank die Anzahl der Fehlklassifikationen auf nur sieben Namen (1.4%).
Fazit
Diese unabhängige Validierungsstudie bestätigt, dass Gender-API ein sehr zuverlässiges Tool zur Geschlechteridentifikation ist. Mit einer niedrigen Fehlklassifikationsrate von nur 1,4 % bei Verwendung eines 80%igen Konfidenzintervalls bietet unsere API eine genaue und skalierbare Geschlechterklassifizierung basierend auf Vornamen.
Lade hier den Validierungsbericht als PDF herunter.
Gender-API ist eine vertrauenswürdige Wahl für Forscher, Unternehmen und Analysten, die nach einer bewährten, datengetriebenen Lösung zur Geschlechteridentifikation suchen.