BirdNET et HawkEars sont des algorithmes informatiques, souvent appelés classifieurs ou
reconnaisseurs, spécialement entraînés pour interpréter les spectrogrammes d’enregistrements
audio dans lesquels on a capté des sons d’oiseaux (et de quelques autres taxons acoustiques)
afin de les classifier par espèces.
BirdNET est un classifieur bioacoustique de portée mondiale, qui a été entraîné pour classifier
des milliers d’espèces d’oiseaux, alors que HawkEars est un classifieur régional qui a été
entraîné pour classifier des centaines d’espèces d’oiseaux, principalement des espèces du
Canada et du Nord des États-Unis. Les algorithmes diffèrent également, ce qui peut influer sur
la précision des résultats selon l’espèce et les conditions d’enregistrement. On peut comparer
les deux algorithmes à deux types de marteaux différents: tous deux sont conçus pour taper sur
des clous, mais la taille et la forme spécifique à chaque marteau donnent des résultats
différents selon le type de clou. HawkEars est souvent l’option privilégiée pour les
communautés acoustiques de la région dans laquelle l’algorithme a été entraîné (Canada et
Nord des États-Unis). Une comparaison des deux classifieurs pour la région HawkEars est
disponible ici : (https://www.sciencedirect.com/science/article/pii/S1574954125001311).
BirdNET et HawkEars analysent chaque fenêtre de 3 secondes d’un spectrogramme et
attribuent un score de confiance pour chaque espèce de leur modèle pour chacune de ces
fenêtres. Ces scores ne correspondent pas à des probabilités, mais sont présentés sur une
échelle de 0 à 1 pour en faciliter la lisibilité. Ainsi, un score de 0,5 pour un merle d’Amérique ne
signifie pas qu’il y a 50 % de chances que l’identification soit exacte, mais indique généralement
une probabilité d’exactitude plus élevée qu’un score de 0,2 pour la même espèce. Il faut noter
que chaque modèle est différent et que les appels de différentes espèces varient
considérablement en complexité, ce qui signifie que les scores de différentes espèces, ou de la
même espèce identifiée avec des modèles différents, ne sont pas directement comparables.
Pour plus d’informations sur l’interprétation des seuils des scores, consultez Wood and Kahl,
2024 (https://link.springer.com/article/10.1007/s10336-024-02144-5).
Pour chaque fenêtre de 3 secondes, les classifieurs génèrent un score pour chaque espèce de
leur base de données. Néanmoins, la plupart de ces scores sont extrêmement faibles, ce qui
indique que l’espèce n’est pas présente dans la fenêtre de 3 secondes. Un seuil minimal est
donc établi pour déterminer les scores qui seront rapportés.
Dans WildTrax, le seuil de score minimal est établi à 0,2 pour BirdNET et 0,3 pour HawkEars
(ce paramètre peut être modifié par l’utilisateur). La plupart des détections dont le score est en
deçà de ces seuils sont incorrectes et l’inclusion de tous ces faux positifs masquerait les vrais
positifs. Les scores entre 0,2 et 0,6 ont également de fortes chances de représenter de faux
positifs pour plusieurs espèces. Chaque espèce est légèrement différente et parfois les
conditions d’enregistrement peuvent générer des scores de détection différents pour la même
espèce. C’est pourquoi WildTrax maintient des seuils minimums relativement faibles pour
permettre aux utilisateurs d’explorer les détections à faible score selon leurs besoins.
Le seuil de détection des classifieurs représente un compromis entre le nombre de faux positifs
et le nombre de détections manquées (faux négatifs). L’équilibre à atteindre et la sélection du
seuil qui en découle dépendent de l’utilisation prévue des données. Les utilisateurs devraient
valider un sous-échantillon de leurs données pour mieux évaluer la précision et la sensibilité
des modèles pour leurs espèces cibles. Pour plus d’information sur le processus d’évaluation,
consultez Wood and Kahl 2024 (https://link.springer.com/article/10.1007/s10336-024-02144-5).
Des outils intégrés au package R wildRtrax peuvent également vous aider à l’évaluation et la
sélection d’un seuil (https://rdrr.io/github/ABbiodiversity/wildRtrax/f/vignettes/classifiers-
tutorial.Rmd).
Les échelles de scores des classifieurs BirdNET et HawkEars diffèrent pour chaque modèle,
davantage de détections à un score intermédiaire (0,1 – 0.6) étant générées pour HawkEars
que pour BirdNET. Ces détections intermédiaires seraient donc davantage ignorées pour
HawkEars si un seuil minimal plus élevé était utilisé. L’interface d’utilisateur des deux
classifieurs peut devenir très chargée pour les scores sous 0,5, en raison du grand nombre de
faux positifs. Il est donc recommandé d’utiliser un seuil minimal de 0,5 lorsqu’on visualise le
spectrogramme. Pour les utilisateurs qui désirent utiliser des seuils plus bas, HawkEars permet
d’abaisser le seuil jusqu’à 0,3 et BirdNET jusqu’à 0,2. Le rapport du classifieur est sous forme
de fichier CSV et comprend toutes les détections jusqu’à ces seuils minimaux pour les
utilisateurs désirant explorer les courbes de sensibilité et de précision pour des espèces et des
classifieurs en particulier. Les utilisateurs qui désirent utiliser des seuils inférieurs à ceux de
WildTrax devraient envisager de traiter leurs données directement dans le classifieur, en dehors
de WildTrax, afin de tester des seuils très bas.
BirdNET et HawkEars appliquent tous deux quelques filtres qui peuvent être utilisés pour
ajuster les résultats générés par les classifieurs, outre le seuil minimal de confiance. WildTrax
utilise seulement les filtres d’emplacement dans BirdNET et HawkEars, ce qui permet de
conserver uniquement les résultats géographiquement pertinents. Ces filtres déterminent, à
l’aide de données eBird, si les détections d’espèces sont celles attendues pour la région dans
laquelle l’enregistrement a eu lieu. Par exemple, les détections du classifieur pour une espèce
comme le colin de Californie (une espèce de la côte ouest) n’apparaîtront pas pour un
enregistrement provenant des Maritimes, puisqu’il n’y a aucun signalement de cette espèce
dans cette région; toutes détections générées par les classifieurs de cette espèce dans cette
région sont donc fort probablement de faux positifs et peuvent être ignorées. Les utilisateurs
désirant avoir accès aux résultats non filtrés des classifieurs devraient explorer la possibilité
d’analyser leurs enregistrements directement dans les classifieurs pour pouvoir ajuster leur
utilisation de filtres eux-mêmes pour répondre à leurs besoins spécifiques.
Les classifieurs BirdNET et HawkEars ne sont pas parfaits. Ce sont des outils qui ont subi un
entraînement poussé par un logiciel de pointe, mais ils ne remplacent pas un humain
hautement qualifié qui peut reconnaître des motifs et des différences de sons bien mieux que
les algorithmes informatiques les plus avancés. Les appels qui se chevauchent, les appels
anormaux et les appels discrets sont particulièrement difficiles à détecter et à identifier pour les
classifieurs, puisque les motifs du spectrogramme peuvent ne pas concorder avec les motifs
que les classifieurs ont été entraînés à détecter. De plus, les espèces dont les appels sont
particulièrement variés sont plus susceptibles d’être manquées ou confondues, puisque les
appels à variabilité élevée sont plus difficiles à identifier correctement.
Tout comme les classifieurs peuvent parfois manquer une espèce détectée par un humain, ils
peuvent également rapporter une espèce qui n’est pas présente dans l’enregistrement. Les
classifieurs fournissent un score pour chaque espèce pour laquelle ils sont entraînés et,
idéalement, le seuil du score sert à éliminer les espèces dont le score est bas parce qu’elles ne
sont pas présentes dans l’enregistrement. Néanmoins, comme le processus de classification
n’est pas parfait, les résultats du classifieur contiennent souvent des faux positifs. La façon de
gérer ces faux positifs dépend de l’application désirée des données. Si vous vous intéressez à
une espèce commune et que vous détectez des dizaines de vocalisations dans chaque
enregistrement, la présence d’une ou deux détections erronées n’est probablement pas très
grave. Si vous souhaitez ne plus avoir à vérifier manuellement toutes vos détections, vous
pouvez en vérifier un échantillon pour connaître le taux de faux positifs, puis incorporer celui-ci
dans une gamme de modèles statistiques, tels que des modèles d’occupation. En revanche, si
vous vous intéressez à une espèce rare qui fait des appels occasionnels et que le classifieur
donne souvent des faux positifs, il pourrait être préférable de vérifier manuellement toutes les
détections du classifieur pour vous assurer de la justesse de l’interprétation de votre base de
données.
WildTrax et ABMI ne possèdent pas ces classifieurs et n’en assurent pas la maintenance; ils ont
été développés par des programmeurs et des biologistes qui les ont ensuite rendus disponibles
en accès libre. WildTrax utilise ces classifieurs dans ses analyses et en présente les résultats à
l’aide de l’interface d’utilisateur pour faciliter le traitement de toutes les données acoustiques
des utilisateurs au sein d’une même plateforme, sans nécessiter de programme externe pour
utiliser les classifieurs. Les développeurs de ces modèles continuent de les mettre à jour pour
en améliorer la précision et ajouter de nouvelles espèces; WildTrax ne peut pas intégrer toutes
ces mises à jour, mais effectue des mises à jour périodiques lorsque les plus récents modèles
offrent une mise à niveau importante pour les utilisateurs. Le dépôt de code pour BirdNET peut
être trouvé ici : (https://github.com/birdnet-team/BirdNET-Analyzer) et pour HawkEars, ici:
(https://github.com/jhuus/HawkEars).