France: les expertises vocales confondront-elles le «corbeau» dans l'affaire Grégory?

La justice a autorisé la comparaison des enregistrements des appels du « corbeau » avec les témoignages des protagonistes de l’affaire recueillis par les journalistes en 1984, lors de la découverte du corps de Grégory Villemin, 4 ans, dans la Vologne, pieds et poings liés. Les expertises vont être réalisées grâce à un logiciel de reconnaissance vocale par l’Institut de recherche criminelle de la gendarmerie nationale, (IRCGN). Y a-t-il une chance d’identifier le coupable ? D’après les scientifiques, ces expertises peuvent seulement orienter l’enquête.

« Je me suis vengé du chef et j'ai kidnappé son fils du chef. Je l'ai étranglé et je l'ai jeté dans la Vologne. Sa mère est en train de le chercher, mais elle ne le trouvera pas ». Ces propos déclarés par le « corbeau » font partie des enregistrements qui serviront à l’expertise vocale. L’Institut de recherche criminelle de la gendarmerie nationale (IRCGN) va utiliser les enregistrements de la voix du « corbeau » réalisés par la famille Villemin lors de ces appels malveillants en 1984. Conservés sur cassettes à l’époque, ils ont été numérisés. Ils vont être comparés aux documents sonores recueillis par les journalistes. Ces derniers ont été récupérés auprès de l’Ina, Institut national de l’audiovisuel.

Jusqu’à présent, l’idée n’avait pas convaincu. Mais, la justice a estimé qu’il y avait assez de matière pour comparer les différents extraits sonores. La chambre de l'instruction de la cour d'appel de Dijon va établir une ordonnance dans ce sens. De plus, l’IRCGN dispose d’un outil de comparaison performant : la Batvox.

Ce logiciel, d’origine espagnole, permet d’analyser et comparer plusieurs voix en créant une série d’algorithmes. Comme de nombreux systèmes de reconnaissance vocale, le principe est de créer un modèle statistique de référence, que l’on va ensuite comparer aux échantillons sonores dont on dispose. Pour cela, les experts utilisent ce qu’on appelle « des indices acoustiques ». « C’est par exemple, l’énergie qui se trouve dans certaines bandes de fréquence, comme 50 Hz pour une voix grave et jusqu’à des milliers de Hz. La répartition de ces énergies donne des indices acoustiques », explique Nancy Bertin, chercheuse au CNRS au sein de l’Institut de recherche en informatique et systèmes aléatoires (IRISA).

« Les résultats ne sont jamais fiables à 100 % »

« Le logiciel réalise une série de tests statistiques et donne des probabilités. Il peut quantifier la fiabilité à 85% ou 90% par exemple. Mais, il y aura toujours une marge d’erreur. On n’atteint jamais 100 % », affirme la chercheuse.

La fiabilité des résultats va dépendre des transformations inhérentes à la voix. « Il n’existe pas d’empreinte vocale, comme une empreinte de main, ou l’ADN », déclare Andrzej Drygajlo, chercheur et professeur à l’Ecole de sciences criminelles de Lausanne en Suisse. « La voix change en fonction de l’état de santé, de la vieillesse, de l’émotion du moment », ajoute-t-il.

« L’ADN, l’empreinte de la main sont en revanche des constantes, précise Nancy Bertin du CNRS. La voix est le résultat d’un geste celui de la gorge, du nez, de la bouche et d’autres muscles. Si j’étais juré dans un procès, cela ne permettrait pas de me prononcer avec une intime conviction. »

La qualité des enregistrements, un facteur primordial

Outre l’aspect volatile de la voix et ses nombreuses variations, il faut aussi prendre en compte la qualité de l’enregistrement. La voix change en fonction « des conditions dans lesquelles elle a été enregistrée. L’appareil qui a été utilisé, un téléphone, ou un micro. La pièce où elle a été enregistrée. Tous ces paramètres transforment votre voix », détaille Andrzej Drygajlo. En effet, le téléphone ou d'autres appareils peuvent créer des distorsions.

Le support de l’enregistrement modifie aussi la voix. « A l’époque, c’était des cassettes audio. Il faut voir la qualité. Et même aujourd’hui avec le numérique et le format mp3, il faut prendre en compte le système d’encodage qui influe sur la voix », développe Andrzej Drygajlo.

Ainsi, les comparaisons vocales n’offrent que des pistes de recherche, une orientation à l’enquête. Les expertises vocales peuvent aboutir sur des hypothèses : un nombre de similitudes entre plusieurs une voix, ou la sélection de plusieurs suspects parmi les voix analysées. La chercheuse Nancy Bertin l'explique avec un exemple : « Si je vous parle d’une suspect, je ne vous dirais pas, c’est un homme ou une femme. Mais je dirais que compte tenu de la fréquence c’est un individu qui mesure 1,55 m donc il peut s’agir d’une femme ».

Les conditions optimales pour un enregistrement restent ceux opérées dans un laboratoire : salle insonorisée, micro de qualité, aucune compression du signal enregistré, diversité des phrases et des éléments de référence pour la comparaison. Dans le cas de l’enquête sur la mort de Grégory Villemin (4 ans), retrouvé noyé, pieds et poings liés dans la Vologne (Vosges), le 16 octobre 1984, toutes ces conditions n’étaient pas réunies.

Partager :