PDF形式の資料を閲覧するにはAdobe Acrobat Readerが必要です。
- Adobe Acrobat Readerをダウンロードする
2025年6月25日
東日本電信電話株式会社(代表取締役社長:澁谷直樹、以下「NTT東日本」)のデータサイエンティスト青柳裕介(あおやぎゆうすけ)、小林優輝(こばやしゆうき)の2名のチームが、世界的なAIのデータ分析コンペティションプラットフォーム「Kaggle(カグル)」※1で開催された「BirdCLEF+ 2025」※2コンペティション(以下、本コンペティション)において、全2,026チーム中12位に入賞し、金メダルを獲得しました。これにより、「Grandmaster」昇格条件の金メダル5枚獲得に対して、2名の金メダル獲得数は2枚となりました。※3
NTT東日本は、「地域循環型社会の共創」というパーパスを掲げ、地域に密着した現場力とテクノロジーの力で地域課題の解決を実現するために、社員ひとりひとりのデジタルスキルの向上をめざした全社的な育成を実施しています。なかでも、データサイエンティストにおける重要指標の一つとして、「Kaggle」への積極的な参加を推奨しており、今後も、データサイエンス分野の人材育成を推進してまいります 。
「Kaggle」はデータサイエンスと機械学習の分野における競技プラットフォームで、世界中のデータサイエンティストがAIの精度を競い合います。さまざまな企業や研究機関が提供するデータセットに基づいてコンペティションが開催されており、効果的なソリューションを提出した参加者に報酬や称号が提供されます。
BirdCLEF+ 2025コンペティションは、コロンビア中部マグダレナ渓谷/エルシレンシオ自然保護区で収録された音声データから鳥、昆虫、両性類、哺乳類の合計206種の鳴き声を検出するアルゴリズムを開発するタスクでした。
本コンペティションは地球の生物多様性の解説・保全を目的に、鳥類学を専門とする研究活動、教育、市民科学者育成を進める「Cornell Lab of Ornithology」の主催で、2025年3月11日(火)から2025年6月6日(金)にかけて開催されました。
「本コンペティションでは、学習データと評価データの差が大きく、机上での評価だけでは十分な検証が困難でした。そこで、これまでのコンペティションで培ったノウハウを活かし、学習途中のモデル重みを平均化する手法を導入するなど、主観的なバイアスができる限り入らないように注意を払いました。 さらに、評価データと同じ録音環境のラベルなしデータを追加学習に用いることで、分布が異なる評価データに適応したモデルを構築することができました。 今回で4回目の参加となり、思い入れのあるコンペであるBirdCLEFで金メダルを獲得できたことは、挑戦し続ける価値を再認識するきっかけになりました。
また、チームメンバーの小林さんとともに数多くの試行錯誤を重ね、こうして成果を出せたことが大変嬉しく思います。 実業務でも、検証用データと実運用データのギャップはしばしば課題となります。本コンペティションで得た知見を活かし、業務でも成果を発揮すべく取り組んでまいります。」
「まずは、最終日の終了直前まで一緒に走り抜いてくれた青柳さんに心から感謝しています。コンペ終盤は悔いの残らないよう夜遅くまで議論を重ね、提出モデルを慎重に検討しました。結果として、終盤に提出したモデルのほとんどが金メダル圏内に入り、今回のコンペの特徴であった訓練データセットと評価用データセット間の録音環境の乖離や、クラスごとのデータ量の偏りといった課題にも一定の対応ができたと感じています。
また、提出数が400件を超える中で、数百におよぶ実験の再現性を保ちつつ管理する方法についても、先人の知見を参考にしながらブラッシュアップでき、大変貴重な学びの機会となりました。これで金メダルは2枚目となり、Kaggle Grandmasterの称号に向けて着実に一歩前進できたと実感しています。引き続き、さらなる金メダル獲得をめざして研鑽を重ね、得られた知見を業務である地域課題解決にも還元していきたいと思います。」
NTT東日本 ビジネス開発本部 CXビジネス部 データビジネス共創担当
Mail:db-ai-co-creation-ml@east.ntt.co.jp
報道発表資料に記載している情報は、発表日時点のものです。
現時点では、発表日時点での情報と異なる場合がありますので、あらかじめご了承いただくとともに、ご注意をお願いいたします。