Avis Sonix AI : que penser de ce logiciel de transcription audio qui utilise l’intelligence artificielle ?

Auteur : Pierre

Mis à jour le :

Avis en bref sur Sonix.ai 

Un service de transcription facile à utiliser, Sonix.ai est conçu pour les utilisateurs professionnels qui ne sont pas préoccupés par le coût élevé de l’utilisation. Ce n’est pas la solution la plus précise, mais elle est rapide et l’interface est très simple.

LES +

  • Facile à utiliser
  • Essai gratuit
  • Intégration de Zapier

LES –

  • Fortement axé sur la grammaire
  • Coûteux
  • Les résultats peuvent varier

Un service de transcription peut s’avérer inestimable pour les professionnels ou les étudiants qui s’appuient fréquemment sur des enregistrements vocaux pour leur travail. 

Sonix offre un service automatisé avec de nombreux outils d’édition en ligne et un traitement rapide. Cependant, son prix élevé et ses performances peu fiables sur les fichiers complexes dans nos tests le freinent. 

Pour les enregistrements plus simples, Sonix peut fonctionner correctement, mais il existe des options moins chères qui produisent des résultats plus précis. Ses performances irrégulières sont parfois décevantes car il offre des fonctionnalités inédites que l’on ne trouve pas dans les services concurrents. 

Pour une expérience de transcription de premier ordre, essayez plutôt Editors’ Choice Rev.

Prix et tarifs abonnement Sonix AI

sonix ai prix tarif abonnement

Comme pour de nombreux services de transcription, le modèle de coût de Sonix est basé sur le temps. Plus précisément, la durée de tout enregistrement que vous téléchargez sur le service pour le traiter, et le coût de cette ressource est de 10 $ par heure si vous utilisez son service standard à la carte.

Le coût de l’heure peut être ramené à 5 dollars si vous souscrivez au service d’abonnement Premium pour 22 dollars par mois et par utilisateur. 

Des remises sur le volume sont également disponibles pour les entreprises qui ont besoin de plus de 100 heures de transcription par mois.

La formule Standard offre les fonctions les plus élémentaires, tandis que la formule Premium en ajoute d’autres, comme l’accès multi-utilisateurs et le partage en équipe. 

Enfin, le plan Enterprise offre tout ce que Premium propose, avec de nombreuses fonctions d’administration supplémentaires et un modèle de support amélioré.

En matière de services de transcription, Sonix est l’un des plus chers, et n’est certainement pas à la portée de la majorité des étudiants ou des utilisateurs à domicile.

Prise en main et sécurité de Sonix AI

présentation sonix ai

Pour vous inscrire à l’essai, il vous suffit de fournir votre nom, votre adresse électronique et votre mot de passe. Comme indiqué, vous n’avez pas besoin de carte de crédit pour commencer. 

Sonix ne propose pas d’application mobile, vous ne pouvez donc accéder à votre compte que via le Web. La plupart des autres services que nous avons examinés vous permettent d’effectuer des enregistrements et de soumettre des commandes via un appareil mobile. 

Otter va plus loin et vous permet d’éditer directement les transcriptions sur votre téléphone ou votre tablette. Cette fonctionnalité est particulièrement pratique pour les professionnels et les étudiants fréquemment en déplacement, ou pour ceux qui ne veulent tout simplement pas transporter un enregistreur vocal dédié.

Comme pour les offres similaires, Sonix bénéficie de la confidentialité inhérente à un service de transcription automatique, ce qui signifie que personne ne regarde jamais votre fichier. 

Avec un service humain, au moins une personne doit avoir accès à vos enregistrements pour pouvoir effectuer la transcription. Sonix affirme utiliser un cryptage TLS entièrement sécurisé pour sécuriser tous les fichiers que vous téléchargez. 

Dans le même ordre d’idées, Sonix vous permet également de définir des niveaux d’autorisation pour chaque personne dans les comptes partagés, ce dont nous parlerons plus tard. Gardez à l’esprit que Sonix n’a pas d’option pour activer l’authentification à deux facteurs au moment de cette revue, ce qui pourrait constituer un risque de sécurité pour les organisations ou les personnes qui traitent des informations sensibles. 

Pour être juste, aucun autre service de transcription que j’ai examiné ne propose cette option non plus.

Design et interface graphique du logiciel de transcription audio Sonix AI

fonctionnalités sonix ai

Le site my.sonix.ai utilise un design exceptionnellement propre, et la création d’un compte est gratuite.

Au moment de la rédaction de cet article, il s’agit exclusivement d’un service en ligne, et Sonix ne dispose pas d’une application mobile pour capturer et envoyer au traitement des enregistrements audio.

Cependant, comme nous le verrons plus tard, il existe des moyens simples de contourner ce problème, ce qui résout quelque peu l’absence d’application mobile.

Le point de départ de tout travail de transcription est le tableau de bord de Sonix.ai, où vous pouvez voir les enregistrements audio déjà transcrits et en ajouter de nouveaux à traiter.

Comme ce système a été conçu pour plusieurs utilisateurs, il comprend un système de dossiers virtuels permettant d’organiser les transcriptions de la manière qui convient.

En cliquant sur « télécharger », l’utilisateur accède à une page où il peut déposer plusieurs fichiers dans le système. Si le compte dispose d’un crédit suffisant, ils peuvent être traités.

Tous les formats de fichiers audio standard sont pris en charge, notamment wav, mp3, mp4a, aiff, acc, ogg et wma, et vous pouvez également télécharger certaines structures de conditionnement vidéo. 

La taille maximale des fichiers est de 4 Go. Avant de télécharger un gros fichier vidéo en résolution 4K, nous vous recommandons d’utiliser un autre outil pour séparer l’audio afin d’accélérer le téléchargement.

Un bon moyen d’accélérer le téléchargement est d’utiliser une installation de stockage en nuage comme Google Drive, One Drive, Box ou Dropbox et de la relier directement au compte. Vous pouvez également envoyer un courriel au système en utilisant Gmail, afin de créer un flux de travail plus élégant que le dépôt de fichiers sur une page Web.

Cette automatisation est fournie via Zapier, ce qui permet une intégration beaucoup plus large si l’entreprise qui l’utilise a investi dans cette technologie pour connecter ses processus d’entreprise.

Une autre touche agréable est que, avec le fichier audio ou vidéo, vous pouvez inclure la transcription existante, comme un moyen de compléter plus rapidement le processus et d’améliorer la précision.

Un autre avantage est qu’avec le fichier audio ou vidéo, vous pouvez inclure une transcription existante, ce qui vous permet d’accélérer le processus et d’améliorer la précision.

En raison de la nature du traitement basé sur le Cloud, il est impossible de juger de la rapidité ou de la lenteur du traitement, mais Sonix.ai est relativement rapide selon notre expérience. En général, la transcription prend entre 10 et 20 % du temps que dure l’enregistrement. Par conséquent, compléter un enregistrement de 10 minutes prend généralement moins de 2 minutes.

Vous n’avez pas besoin de suivre le traitement, car le système vous envoie une notification par e-mail lorsque le travail est terminé, ainsi qu’un lien vers la nouvelle transcription.

Une fois le fichier traité, vous pouvez l’ouvrir dans une page d’édition pour examiner les résultats, mais aussi exporter le texte dans un large éventail de formats utiles, y compris ceux définis comme sous-titres par certaines applications.

Le système prend en charge 36 langues et dialectes, dont l’anglais, le français, le cantonais, le mandarin, le portugais et l’espagnol, ainsi que toutes les langues courantes d’Europe de l’Ouest et de l’Est, ainsi que certaines langues asiatiques et arabes.

Tableau de bord de Sonix

L’interface Web de Sonix est principalement blanche et grise, avec des accents bleus pour les icônes, le texte et d’autres éléments. 

Elle a l’air bien et donne la priorité au contenu et aux zones les plus importantes, ce que j’apprécie. Curieusement, Sonix met en évidence des citations de personnes célèbres sur la plupart des écrans ; j’ai vu des exemples de John Steinbeck et Orson Welles. 

Le message d’introduction change également à chaque rafraîchissement de page, de sorte que Sonix peut vous accueillir avec un « Welcome » formel ou un « Howdy » plus familier. Les deux ajoutent une subtile touche de personnalité.

En haut de l’interface, Sonix s’organise autour de trois onglets : Accueil, Télécharger, et Ajouter un utilisateur. Vous disposez d’une barre de recherche sur le côté droit de l’écran et d’une icône de profil pour accéder aux paramètres. 

Vous pouvez télécharger des fichiers depuis votre appareil local ou depuis des sources en ligne comme Dropbox ou Google Drive. La barre de recherche est particulièrement utile car elle permet de rechercher des termes dans le texte de toutes vos transcriptions (mais pas dans vos notes). 

Accueil est l’endroit où vous pouvez trouver, organiser et télécharger des transcriptions. Les paramètres du compte personnel sont assez basiques. Sonix affiche vos informations de facturation, vos minutes de transcription restantes et vous permet de modifier votre compte. Sonix propose également un onglet Programme de parrainage, dans lequel vous gagnez 100 minutes de transcription supplémentaires pour chaque ami qui s’abonne au service à partir d’un lien d’invitation que vous lui envoyez.

Si vous vous abonnez au niveau Business ou Enterprise, une nouvelle option apparaît dans le menu de droite pour les paramètres professionnels. 

À partir de là, vous pouvez ajouter des utilisateurs à votre compte et gérer les rôles d’autres personnes. Il existe cinq rôles principaux que vous pouvez attribuer à chaque personne qui utilise le compte Sonix : Admins, Editors, Members, View Only, et Disabled. 

Cette fonction est précieuse dans les environnements d’entreprise pour les responsables qui veulent garder certains fichiers privés et en rendre d’autres accessibles à tous. Jetez un coup d’œil au tableau ci-dessous pour connaître les différents rôles.

Enregistrements audio sur Sonix AI

workflow sonix ai

Outre le travail effectué sur l’IA nécessaire pour interpréter les bruits émis par les humains, la page des enregistrements représente probablement un effort de codage important.

Ici, l’audio et sa transcription associée peuvent être comparés et améliorés manuellement avec des détails sur les changements de locuteurs et les corrections des erreurs d’interprétation.

Pour tous ceux qui travaillent sur une transcription afin de peaufiner le texte, cette page est le point de départ. Il est logique qu’un certain effort ait été consacré à cette partie, car elle est très facile à utiliser et à suivre.

Pour tenter d’indiquer à l’utilisateur où se situent les problèmes, Sonix.ai attribue un code couleur au contenu pour mettre en évidence les sections dans lesquelles il n’a pas confiance. Cette fonction peut être utile, bien que Sonix.ai puisse commettre des erreurs même dans les parties où il considère que la transcription a un statut « Très confiant ».

Les meilleurs aspects de cette page sont la synchronisation de la lecture audio et du texte, de sorte que le fait de placer le curseur dans le texte déplace la position de lecture sur la même section.

Outre l’édition pure et simple, il est également possible de surligner des sections dans différents styles et de prendre des notes pour accompagner la transcription.

Vous pouvez également modifier le timecode, ce qui est particulièrement utile si l’enregistrement commence par une longue pause ou un préambule indésirable.

Fonctionnalités supplémentaires de Sonix AI

organisation du travail sonix ai

L’une des fonctions les plus intéressantes de Sonix est la possibilité d’intégrer votre transcription à d’autres endroits sur le Web. Comment cela fonctionne-t-il, me direz-vous ? Sonix peut générer un code HTML qui comprend à la fois la transcription audio et le texte de la transcription combinés dans un ensemble soigné. 

Le widget lui-même comprend l’intégralité du texte de la transcription dans une zone de texte déroulante avec des outils de lecture audio en bas. Selon Sonix, ce widget contribue au référencement puisque le texte réel de la transcription peut être découvert par les moteurs de recherche sur la page. 

En outre, la lecture via l’intégration se synchronise avec le texte, de sorte que vous pouvez facilement suivre. En outre, si vous modifiez la transcription via l’éditeur Web de Sonix, même après l’avoir intégrée à un site Web, l’intégration en direct sera également mise à jour. Si vous le souhaitez, vous pouvez même choisir de rendre les notes de transcription publiques.

Précision de Sonix.ai

Pour tester la précision des services de transcription, j’ai téléchargé le même enregistrement de 16 minutes sur chacun d’eux. L’enregistrement original d’une conférence téléphonique entre trois personnes provient d’un enregistreur vocal dédié Olympus VN-722PC. 

Ce n’est pas un enregistrement facile, mais c’est la meilleure façon de comparer directement le moteur de reconnaissance vocale automatique (RVA) de Sonix à d’autres services.

Sonix a terminé le processus de transcription en trois minutes environ. Tous les services de transcription automatique ont terminé la tâche en trois à quatre minutes. Le service de transcription humaine le plus rapide, Rev, a nécessité environ une heure pour la même tâche.

Au lieu de comparer l’intégralité de chaque transcription, j’ai choisi trois paragraphes, un pour chaque intervenant de l’appel. Pour chaque extrait de la transcription, j’ai marqué une erreur chaque fois qu’il y avait un mot manquant, incorrect ou supplémentaire. 

J’ai calculé le taux d’erreur global en divisant le nombre total d’erreurs par le nombre total de mots des sections combinées (dans ce cas, 201 mots). L’échantillon de la section A est une courte section d’introduction. La section B est légèrement plus longue et utilise un vocabulaire plus complexe. La section C est encore plus longue et contient un langage technique.

Sonix a obtenu des résultats lamentables lors du premier test (taux d’erreur de 97 %). Il a entièrement manqué de larges pans de la conversation, a ajouté des mots superflus ou a simplement trouvé des mots à consonance similaire (mais incorrects) dans d’autres sections. 

Ces résultats m’ont surpris, et Sonix m’a informé par la suite que son service était conçu pour fonctionner avec des fichiers audio de haute qualité, comme les podcasts. Bien que ce soit le cas, il en va de même pour tous les services de transcription, automatiques ou non ; ils fonctionnent tous mieux avec des enregistrements parfaits. 

Cependant, comme tout auditeur de podcast le sait, il n’est pas toujours possible d’enregistrer un son parfait, c’est pourquoi nous testons avec un fichier non idéal. Notre objectif est de différencier autant que possible les capacités de ces services.

Pour être juste, Sonix m’a informé dans le menu déroulant Qualité que la transcription nécessitait une édition importante et m’a recommandé d’utiliser un service de transcription manuelle pour de meilleurs résultats. 

Sonix dispose d’une sorte de mécanisme de recommandation, connu sous le nom de Sonix Cleanup, mais il n’est pas facile à trouver sur le site Web. Cette section présente une liste de services de transcription indépendants que vous pouvez contacter si vous souhaitez qu’un humain améliore les résultats.

Même Trint, avec son piètre taux d’erreur de 78 %, s’en sort mieux. À titre de référence, les services automatiques ne sont pas aussi performants dans ce test de transcription plus difficile, même si Otter a enregistré un taux d’erreur admirable de 17 %. 

Rev, notre meilleur service de transcription humaine, a enregistré un taux d’erreur de seulement 3 %, et Scribie a rendu une copie finale avec 6 %. Jetez un coup d’œil au tableau ci-dessous pour connaître la répartition complète.

Test de précision complexe de Sonix.ai 

J’ai retesté tous les services automatiques, y compris Sonix, avec un enregistrement plus simple (deux personnes, en personne) et calculé le taux d’erreur de la même manière, en utilisant deux échantillons au lieu de trois. 

Les services automatiques ont mieux réussi cette tâche dans l’ensemble, mais ils ne sont toujours pas parfaits. Avec un taux d’erreur de 23 %, Sonix se situe dans la moyenne du peloton et n’est pas très éloigné des 14 % de Trint ou des 21 % de Temi. Les résultats complets du second test sont présentés ci-dessous.

Conclusion et avis final sur Sonix.ai 

Compte tenu de son coût relativement élevé, nous nous attendions à ce que Sonix soit plus performant qu’il ne l’a été.

Nous n’avons peut-être pas eu de chance dans le choix des fichiers à transcoder, mais il semble quand même faire un nombre excessif d’erreurs.

Le côté positif de cette équation est la rapidité et la facilité d’utilisation du système, bien que nous recommandions d’utiliser quelques exemples d’enregistrements avec cette solution avant de souscrire un abonnement.

Le plus gros problème de Sonix est son coût élevé, et même si c’est l’outil qui convient à vos besoins particuliers, il existe des moyens moins coûteux de transformer de l’audio en texte ailleurs.

4.8/5 - (24 votes)

Laisser un commentaire