名前データはどのくらいの頻度で更新していますか?
私たちは、各国の状況や公開データの入手状況に応じて、データを定期的に更新しています。
多くの欧米諸国については、年に一度のペースで更新を行っています。
また、名前の男女比は時代とともに変化することがあります。
たとえば、1970年代には女性だけに使われていた名前が、数十年後には主に男性に使われるようになる、といったケースもあります。
そのため、アメリカなど一部の国では出生データも活用し、結果をより豊かにしています。
私たちのモデルは、こうした要素をできるだけ幅広く考慮するよう設計されています。
返却される精度(accuracy)の値も、実際の人口における名前の使われ方をより正確に反映するよう、定期的に調整しています。
この値は、過去数十年分のデータに基づいた妥当な評価を提供することを目的としており、その中には一定の変動の可能性も含まれています。
私たちはおおよそ過去40年分のデータを参照しています。
同じ名前で今日クエリを実行し、1年後にもう一度まったく同じクエリを実行した場合、結果が異なることがあります。
これは、古いデータが削除され、新しいデータが追加される可能性があるためです。
新しいデータが追加されるたびに、必ず「インテグレーションテスト」と呼ばれる検証を実施しています。
このプロセスでは、あらかじめ検証済みのデータセットに対してAPIをテストし、品質を確認します。
この検証用データセットは、可能な限り広いカバレッジを実現するために、名前やテストケースを継続的に追加しながら拡張しています。
関連キーワード
この記事は役に立った?