स्वतंत्र मूल्यांकन ने उच्च सटीकता की पुष्टि की
Gender-API पर हम अपनी सर्विस की सटीकता को बेहद गंभीरता से लेते हैं। हाल ही में, पहले नाम के आधार पर gender निर्धारित करने में हमारी सर्विस की विश्वसनीयता को परखने के लिए एक स्वतंत्र मूल्यांकन किया गया। नतीजे उत्साहजनक रहे और यह दिखाया गया कि हमारा API अलग‑अलग देशों के विविध नामों को संभालने में कितना सटीक और प्रभावी है।
स्टडी का सारांश
जिम हैगबर्ग (University of Maryland) द्वारा एक वैलिडेशन स्टडी की गई, जिसमें हमारी gender‑identification सर्विस की एरर रेट की तुलना मैन्युअली वेरिफ़ाइड ऑनलाइन सोर्सेज से की गई। इस स्टडी में तीन वैज्ञानिक जर्नल्स में प्रकाशित रिसर्च पेपर्स से लिए गए पहले नामों का विश्लेषण किया गया:
- Journal of Applied Physiology
- Medicine and Science in Sports and Medicine
- International Journal of Sports Medicine
विश्लेषण में 500 ऐसे पहले नाम शामिल थे जो gender‑oriented नहीं थे और शोधकर्ता के लिए पहले से अज्ञात थे। इन नामों को ऑनलाइन इमेज सर्च या ऑथर्स से जुड़े gender‑specific सर्वनामों (pronouns) के ज़रिए वेरिफ़ाई किया गया।
Gender पहचान के तरीके
स्टडी में gender पहचान के लिए तीन स्वतंत्र तरीकों का इस्तेमाल किया गया:
- परंपरागत पहले नाम की पहचान, जो व्यापक रूप से स्वीकार किए गए gender‑specific नामों पर आधारित है।
- शोधकर्ता की अपनी, उस व्यक्ति के gender के बारे में व्यक्तिगत जानकारी।
- Gender-API, जो 190 देशों के 60 लाख से ज़्यादा नामों के डेटाबेस और AI का इस्तेमाल कर gender प्रेडिक्ट करता है।
मुख्य निष्कर्ष
- 500 नामों में से 11 (2.2%) नाम Gender-API डेटाबेस में नहीं मिले।
- बचे हुए 488 नामों में से 435 (89.1%) को कम से कम 80% कॉन्फ़िडेंस के साथ सही पहचाना गया।
- 392 नाम (80.3%) को 90% से अधिक भरोसे के साथ सही पहचान किया गया।
- 359 नाम (73.5%) को 95% से अधिक भरोसे के साथ सही पहचान किया गया।
- 282 नाम (57.8%) को 98% से अधिक भरोसे के साथ सही पहचान किया गया।
सभी प्रेडिक्शन्स में औसत भरोसा स्तर 94% ± 13% रहा। यह दिखाता है कि कम प्रचलित नामों के लिए भी हमारी सर्विस काफी भरोसेमंद है।
त्रुटि दर विश्लेषण
कुल 22 नामों (4.5%) में [Gender-API] की भविष्यवाणी और ऑनलाइन वैलिडेशन के बीच अंतर पाया गया। लेकिन जैसे ही 80% कॉन्फिडेंस थ्रेशहोल्ड लगाया गया, गलत वर्गीकृत नामों की संख्या घटकर सिर्फ 7 (1.4%) रह गई।
निष्कर्ष
यह स्वतंत्र वैलिडेशन स्टडी साबित करती है कि [Gender-API] जेंडर पहचान के लिए एक बेहद भरोसेमंद टूल है। 80% कॉन्फिडेंस थ्रेशहोल्ड पर सिर्फ 1.4% की कम मिसक्लासिफिकेशन रेट के साथ, हमारा API पहले नामों के आधार पर सटीक और स्केलेबल जेंडर क्लासिफिकेशन प्रदान करता है।
वैलिडेशन रिपोर्ट यहाँ PDF के रूप में डाउनलोड करो।
[Gender-API] शोधकर्ताओं, व्यवसायों और विश्लेषकों के लिए एक भरोसेमंद विकल्प है, जो एक आज़माया हुआ, डेटा-ड्रिवन जेंडर आइडेंटिफिकेशन समाधान ढूंढ रहे हैं।