audio2text.email Glossaire

API: Application Programming Interface

Qu'est-ce qu'une API ?

API signifie Application Programming Interface. Il s'agit d'un ensemble de règles et de protocoles qui permettent à différentes applications logicielles de communiquer entre elles. Une API définit les méthodes et les formats de données que les applications peuvent utiliser pour demander et échanger des informations, leur permettant ainsi de travailler ensemble efficacement.

Comment fonctionne une API ?

Les API fonctionnent comme intermédiaires entre différents systèmes logiciels. Ils définissent la manière dont les demandes d'informations et de services doivent être formulées et la manière dont les réponses doivent être fournies. Voici une analogie simple : imaginez une API comme un serveur dans un restaurant. Le serveur (API) amène votre commande (demande) à la cuisine (serveur) puis vous ramène votre nourriture (réponse).

FAQ - Foire Aux Questions

Comment fonctionne le processus de transcription chez audio2text.email ?
Chaque fichier audio est testé, transcodé puis transcrit à l'aide du modèle Whisper de l'API OpenAI.
Combien de temps faut-il pour obtenir un transcript ?
Le temps de traitement de votre transcription dépendra de la longueur du fichier audio. En règle générale, les messages vocaux plus courts peuvent être transcrits rapidement à l'aide de l'API speech-to-text d'OpenAI.
Quelle est la taille maximale des fichiers pour la transcription ?
Notez que notre service de transcription a une limite de taille de fichier de 10 Mo.
Quelle est la durée maximale que vous pouvez transcrire ?

Nous avons actuellement une limite de taille de fichier de 10 Mo. Étant donné que la plupart des messages vocaux sont encodés avec un bitrate constant et un seul canal (mono, pas de stéréo), nous pouvons calculer la durée maximale d'un fichier en utilisant l'équation suivante :

Durée ( secondes ) = Taille du fichier ( bits ) Bitrate ( bits/seconde )

En appliquant cette équation à notre limite de 10 Mo et à un bitrate de 64 kbps (couramment utilisé par l'application d'enregistrement iPhone), nous arrivons à une durée maximale d'environ 21 minutes et 51 secondes. Pour calculer facilement les durées pour différentes tailles de fichiers et bitrates, vous pouvez utiliser notre calculette de calcul de durée de fichier audio.

Dois-je transformer l'audio avant de l'envoyer à mon adresse audio2textemail.com ?
Non, ce n'est pas nécessaire. audio2text.email transcodera automatiquement votre fichier audio à la réception dans le format attendu par l'API OpenAI.
ChatGPT peut-il transcrire l'audio en texte ?
Oui, ChatGPT peut transcrire l'audio en texte, mais il existe des modèles d'IA plus spécialisés conçus spécifiquement pour cette tâche, tels que Whisper. Whisper est un outil de transcription de pointe qui offre une précision et une efficacité supérieures pour convertir l'audio en texte. Si vous recherchez les meilleurs résultats en matière de transcription audio, Whisper est le choix idéal.
Pourquoi une transcription par e-mail ?
Notre service de transcription automatique par courrier électronique est conçu pour éliminer les barrières et fournir un accès universel à la transcription des messages vocaux. En tirant parti de l'e-mail comme méthode de saisie et de livraison, nous facilitons l'automatisation et l'intégration aux plates-formes existantes. L'e-mail étant une méthode de communication établie, il est susceptible de persister, offrant ainsi une longévité.
Que signifient les termes audio2text, voice2text et speech2text ?
Les termes audio2text, voice2text et speech2text font tous référence au même concept : la conversion de la parole ou du contenu audio en texte écrit. Ces termes sont essentiellement interchangeables. Le "2" dans ces termes est une convention courante dans la tech, servant d'abréviation pour "vers" ou "en". Ainsi, "audio2text" peut être lu comme "audio vers texte" ou "audio en texte". Cette convention est souvent utilisée pour créer des noms de domaine concis et faciles à retenir. Dans notre cas, audio2text.email, voice2text.email et speech2text.email mènent tous au même service de transcription, utilisant simplement une terminologie légèrement différente pour décrire le processus de conversion de l'audio en texte.