Oberoende bedömning bekräftar hög noggrannhet
På Gender-API tar vi noggrannheten av vår tjänst på allvar. Nyligen genomfördes en oberoende bedömning för att validera tillförlitligheten av vår tjänst när det gäller att bestämma kön baserat på förnamn. Resultaten var uppmuntrande och visade på vår API:s precision och effektivitet i att hantera olika namn över flera länder.
Översikt av Studien
En valideringsstudie genomförd av Jim Hagberg från University of Maryland för att utvärdera felprocenten för vår könsidentifieringstjänst jämfört med manuellt verifierade onlinekällor. Studien analyserade förnamn som extraherats från forskningsartiklar publicerade i tre vetenskapliga tidskrifter:
- Tillämpad fysiologis tidskrift
- Medicin och vetenskap inom idrott och hälsa
- Internationell tidskrift för idrottsmedicin
Analysen inkluderade 500 förnamn som inte var könsinriktade och var okända för forskaren. Dessa namn validerades genom online-sökningar efter bilder eller könsspecifika pronomen kopplade till författarna.
Metoder för könsidentifiering
Studien använde tre oberoende metoder för att identifiera kön:
- Traditionell förnamnsigenkänning baseras på allmänt accepterade könsspecifika namn.
- Personlig kännedom om individens kön av forskaren.
- Gender-API utnyttjar AI och en databas med över 6 miljoner namn från 190 länder för att förutsäga kön.
Viktiga Resultat
- Av 500 namn hade 11 (2,2 %) inga resultat i Gender-API-databasen.
- Av de återstående 488 namnen identifierades 435 (89,1 %) korrekt med minst 80 % säkerhet.
- 392 namn (80,3 %) identifierades korrekt med över 90 % säkerhet.
- 359 namn (73,5 %) identifierades korrekt med över 95 % säkerhet.
- 282 namn (57,8 %) identifierades korrekt med över 98 % säkerhet.
Den genomsnittliga säkerhetsnivån för alla förutsägelser var 94 % ± 13 %. Detta visar på en hög grad av tillförlitlighet, även för mindre vanliga namn.
Felprocentanalys
Totalt 22 namn (4,5 %) visade på avvikelser mellan Gender-API:s förutsägelser och online-validering. Dock, när en 80 % tröskel för säkerhet tillämpades, minskade felklassificeringarna till endast sju namn (1,4 %).
Slutsats
Den här oberoende valideringsstudien bekräftar att Gender-API är ett mycket pålitligt verktyg för könsidentifiering. Med en låg felklassificeringsgrad på bara 1,4% vid användning av en 80% konfidensnivå, erbjuder vår API en noggrann och skalbar könsklassificering baserad på förnamn.
Ladda ner valideringsrapporten här som PDF.
Gender-API är ett tillförlitligt val för forskare, företag och analytiker som söker en beprövad, datadriven lösning för könsidentifiering.