FAQ sur Amazon Polly

Questions d'ordre général

Qu'est-ce qu'Amazon Polly ?

Amazon Polly est un service qui convertit le texte en un enregistrement audio réaliste. Amazon Polly permet d'intégrer une fonction de communication de première classe aux applications existantes et de créer de toutes nouvelles catégories de produits vocaux allant des applications mobiles aux voitures, en passant par différents appareils et appliances. Ce service comprend des douzaines de voix réalistes et prend en charge de nombreuses langues. Vous pouvez donc sélectionner la voix idéale et distribuer vos applications vocales dans plusieurs zones géographiques. Amazon Polly est simple d'utilisation : il suffit d'envoyer le texte que vous souhaitez convertir en enregistrement audio à l'API Amazon Polly pour que le service renvoie immédiatement le flux audio à votre application, afin que vous puissiez le lire directement ou le stocker dans un fichier audio au format standard, tel que le MP3. Amazon Polly prend en charge les balises SSML (Speech Synthesis Markup Language) comme prosody pour vous permettre d'ajuster le débit de parole, le ton ou le volume de la synthèse vocale. Amazon Polly est un service sécurisé qui offre tous ces avantages à grande échelle et à une faible latence. Vous pouvez également mettre en cache et réécouter le discours généré par Amazon Polly sans frais supplémentaires. Amazon Polly vous permet de convertir gratuitement plusieurs millions de caractères par mois durant la première année, à compter de la date d'inscription. La tarification à l'utilisation, les faibles coûts par requête ainsi que l'absence de restrictions sur le stockage et la réutilisation des enregistrements audio font d'Amazon Polly un moyen économique d'adopter la synthèse vocale dans toutes vos applications.

Pourquoi utiliser Amazon Polly ?

Vous pouvez utiliser Amazon Polly pour alimenter votre application avec une sortie vocale de haute qualité. Ce service économique présente des temps de réponse très courts et est disponible pour pratiquement tous les cas d'utilisation, sans restrictions sur le stockage et la réutilisation de l'enregistrement vocal généré.

Quelles sont les fonctions disponibles ?

Vous pouvez contrôler différents aspects de la voix, tels que la prononciation, le volume, le ton, le débit de parole, etc. à l'aide du langage de balisage de synthèse vocale (Speech Synthesis Markup Language, SSML) normalisé. Vous pouvez synthétiser le discours pour certaines voix neuronales en utilisant le style Newscaster pour qu'elles sonnent comme un présentateur télé ou radio. Vous pouvez détecter lorsqu'un mot ou une phrase spécifique d'un texte est dit à l'utilisateur grâce aux métadonnées incluses dans le flux audio. Cela permet au développeur de synchroniser le surlignage graphique et les animations, telles que le mouvement des lèvres de l'avatar, avec le discours synthétisé. Vous pouvez modifier la prononciation de mots spécifiques, tels que les noms d'entreprise, les acronymes, les mots étrangers et les néologismes, par exemple « P!nk », « ROTFL », « C'est la vie » (lorsque la voix utilisée n'est pas française) à l'aide de glossaires personnalisés.

Que sont les Speech Marks ?

Les Speech Marks sont conçus comme un complément au discours synthétisé généré à partir du texte saisi. En utilisant ces métadonnées en même temps que le flux audio du discours synthétisé, les clients peuvent offrir une expérience visuelle améliorée telle qu'une synchronisation labiale ou un surlignage similaire à celui des vidéos de karaoké.

Amazon Polly génère des Speech Marks grâce aux quatre éléments suivants :

la phrase, qui indique un élément de phrase du texte saisi qui doit être prononcé ;
le mot, qui indique un élément de mot dans le texte ;
le visème, qui décrit la forme des lèvres correspondant au son prononcé ;
le SSML, qui décrit un élément SSML utilisé dans le texte.

Les Speech Marks sont générés sous la forme d'un flux JSON. Plus précisément, il s'agit d'un ensemble d'objets JSON autonomes délimités par des retours à la ligne, contenant un à quatre de ces éléments et produits pendant l'utilisation de la méthode de synthèse vocale avec le paramètre speech-mark-types. Consultez le guide du développeur Amazon Polly pour plus d'informations.

Quels sont les cas d'utilisation les plus courants pour ce service ?

Avec Amazon Polly, vous pouvez donner vie à vos applications en ajoutant des capacités de synthèse vocale réaliste. Par exemple, dans le cadre de l'apprentissage en ligne et de l'enseignement, vous pouvez concevoir des applications utilisant la capacité Text-to-Speech (TTS) d'Amazon Polly pour aider les personnes rencontrant des difficultés de lecture. Amazon Polly peut permettre aux aveugles et malvoyants de consulter des contenus numériques (eBooks, actualités, etc.). Amazon Polly peut également être utilisé dans les systèmes d'annonces des transports publics et les systèmes de contrôle industriels à des fins de diffusion d'informations et de messages d'avertissement en cas d'urgence. Un large éventail d'appareils, tels que des décodeurs, des montres intelligentes, des tablettes, des smartphones et des appareils de l'Internet des objets, peuvent se servir d'Amazon Polly pour fournir un enregistrement audio. Amazon Polly peut aussi être utilisé dans les solutions de téléphonie pour ajouter de la voix aux systèmes de serveur vocal interactif. Les applications telles que les jeux-questionnaires, les animations, les avatars ou la génération de narrations constituent des cas d'utilisation courants pour une solution TTS basée sur le cloud comme Amazon Polly.

Comment ce produit fonctionne-t-il avec d'autres produits AWS ?

En utilisant également Amazon Lex, les développeurs peuvent créer de véritables interfaces utilisateur vocales pour leurs applications. Au sein d'Amazon Connect, la synthèse vocale d'Amazon Polly est utilisée pour créer des services de centre de contact basés sur le cloud et en libre-service. En outre, les développeurs d'applications mobiles et de solutions de l'Internet des objets peuvent utiliser Amazon Polly pour ajouter une sortie vocale à leurs propres systèmes.

Quels sont les avantages d'une solution de synthèse vocale basée sur le cloud par rapport à une solution sur appareil ?

Les solutions de synthèse vocale sur appareil nécessitent que des ressources informatiques importantes, notamment une puissance CPU, de la RAM et de l'espace disque, soient disponibles sur l'appareil. Elles peuvent entraîner des coûts de développement plus élevés et une consommation d'énergie plus importante sur des appareils tels que des tablettes, des smartphones, etc. En revanche, la conversion d'un texte en voix effectuée dans le cloud permet de réduire considérablement les besoins en ressources locales. Toutes les langues et voix disponibles peuvent ainsi être prises en charge en qualité optimale. En outre, des améliorations au niveau de la voix sont instantanément disponibles pour tous les utilisateurs finaux et ne requièrent pas d'autres mises à jour au niveau des appareils. Les solutions de synthèse vocale basées sur le cloud sont indépendantes de la plateforme, ce qui permet de réduire les délais et efforts de développement.

Comment démarrer avec Amazon Polly ?

Il vous suffit de vous connecter à votre compte AWS et d'accéder à la console Amazon Polly (qui fait partie de la console AWS). Vous pouvez ensuite utiliser la console pour saisir du texte et écouter l'enregistrement audio généré ou l'enregistrer sous forme de fichier audio.

Dans quelles régions le service est-il disponible ?

Reportez-vous à la liste des services régionaux AWS pour connaître toutes les régions prenant en charge les voix standard d'Amazon Polly. Les voix neuronales sont prises en charge dans le sous-ensemble de régions suivant : USA Est (Virginie du Nord), USA Ouest (Oregon), Canada (Centre), Asie-Pacifique (Tokyo), Asie-Pacifique (Séoul), Asie-Pacifique (Singapour), Asie-Pacifique (Sydney), Afrique (Le Cap), UE (Londres), UE (Francfort), UE (Irlande) et AWS GovCloud (US, côte ouest).

Quels langages de programmation sont pris en charge ?

Amazon Polly prend en charge tous les langages de programmation figurant dans le kit SDK AWS (Java, Node.js, .NET, PHP, Python, Ruby, Go et C++) et dans le kit SDK AWS Mobile (iOS/Android). Le service prend également en charge une API HTTP afin que vous puissiez mettre en place votre propre couche d'accès.

Quels formats audio sont pris en charge ?

Avec Amazon Polly, vous pouvez diffuser du contenu audio à vos utilisateurs quasiment en temps réel. Vous pouvez également faire votre choix parmi plusieurs taux d'échantillonnage afin d'optimiser la bande passante et la qualité audio pour votre application. Amazon Polly prend en charge les formats MP3 et Vorbis, ainsi que les formats de diffusion audio PCM bruts.

Quelles langues sont-elles prises en charge ?

Veuillez consulter la documentation pour connaître la liste complète des langues prises en charge par Amazon Polly.

Des limites de service AWS s'appliquent-elles à Amazon Polly ?

Pour garantir la disponibilité des ressources AWS et réduire le risque de facturation pour les nouveaux clients, AWS gère des limites de service pour chaque compte. Lorsque vous utilisez Amazon Polly pour alimenter votre application avec une sortie vocale de haute qualité, des limites de service par défaut s'appliquent, notamment concernant la limitation, les opérations et l'utilisation du langage de balisage SSML. Pour en savoir plus, consultez la section Limites dans Amazon Polly du guide du développeur Amazon Polly. La combinaison d'Amazon Polly avec d'autres services AWS, tels qu'AWS Batch pour un traitement par lots efficace, peut vous aider à tirer le meilleur parti d'Amazon Polly dans le cadre de ces limites de service.

Le service Amazon Polly est-il certifié HIPAA ?

R : Amazon Polly est un service éligible à la norme HIPAA couvert par AWS Business Associate Addendum (AWS BAA). Si vous avez un AWS BAA en place, Amazon Polly utilisera, divulguera et maintiendra vos PHI (Protected Health Information – Infomartions de santé protégées) uniquement tel que permis par les conditions de votre AWS BAA, et non comme prévu par la section Protection des données (Data Privacy) de la FAQ Amazon Polly.

Comment démarrer avec Amazon Polly Brand Voice ?

Si vous souhaitez créer une Brand Voice à l'aide d'Amazon Polly, contactez votre responsable de compte AWS ou nous-mêmes pour plus d'informations.

Quels sont les coûts et la chronologie de création d'une Brand Voice ?

Chaque voix étant unique, il est donc important que nous en apprenions plus sur vos objectifs afin de définir avec précision un engagement Brand Voice. Si vous souhaitez créer une Brand Voice à l'aide d'Amazon Polly, contactez votre responsable de compte AWS ou nous-mêmes pour plus d'informations.

Facturation

Combien coûte le service Amazon Polly ?

Consultez la page de tarification d'Amazon Polly pour obtenir des informations sur les tarifs actuellement en vigueur.

Puis-je utiliser ce service pour générer des messages vocaux statiques qui seront lus à plusieurs reprises ?

Oui. Le service n'impose aucune limite pour cette opération et aucuns frais supplémentaires ne s'appliquent.

Puis-je utiliser ce service pour générer du contenu qui sera utilisé dans des systèmes de notification publics (par exemple, dans une gare) ?

Oui. Le service n'impose aucune limite pour cette opération et aucuns frais supplémentaires ne s'appliquent.

Si je formule une demande de synthétisation pour 1 000 caractères, puis que je demande des Speech Marks pour les mêmes 1 000 caractères, serai-je facturé pour 2 000 caractères ?

Oui. Vous serez facturé pour chaque requête de synthétisation ou de Speech Marks suivant le nombre de caractères que vous envoyez au service.

Amazon Polly fait-il partie de l'offre gratuite d'AWS ?

Oui, dans le cadre de l'offre gratuite d'AWS, vous pouvez commencer à utiliser Amazon Polly gratuitement. À compter de la date de leur inscription, les nouveaux clients Amazon Polly peuvent synthétiser gratuitement plusieurs millions de caractères par mois pendant les 12 premiers mois. Consultez la page de tarification d'Amazon Polly pour obtenir des informations sur les tarifs actuellement en vigueur.

Vos prix sont-ils toutes taxes comprises ?

Pour obtenir plus d'informations sur les taxes, consultez la page d'aide sur les taxes d'Amazon Web Services.

Confidentialité des données

Les saisies de texte traitées par Amazon Polly sont-elles stockées ? Et comment sont-elles utilisées par AWS ?

Amazon Polly peut stocker et utiliser des saisies de texte traitées par le service uniquement pour fournir et entretenir le service et pour améliorer et développer la qualité d'Amazon Polly et d'autres technologies d'apprentissage automatique/d'intelligence artificielle d'Amazon. L'utilisation de votre contenu est importante pour assurer l'amélioration continue de l'expérience client du service Amazon Polly, notamment le développement et la formation de technologies associées. Nous n'utilisons pas les informations personnellement identifiables qui peuvent être présentes dans votre contenu pour proposer à vos utilisateurs finaux ou à vous-même des produits, des services ou du marketing ciblés. Votre confiance, ainsi que la confidentialité et la sécurité de votre contenu, sont notre priorité absolue. Nous mettons en œuvre des contrôles techniques et physiques appropriés et sophistiqués, notamment le chiffrement au repos et en transit, afin d'éviter l'accès non autorisé à votre contenu ou sa divulgation. Nous nous assurons également que notre utilisation respecte nos engagements à votre égard. Consultez https://aws.amazon.com/compliance/data-privacy-faq/ pour en savoir plus. Vous pouvez utiliser une stratégie d'exclusion d'AWS Organizations pour refuser l'utilisation de votre contenu pour améliorer et développer la qualité d'Amazon Polly et d'autres technologies de machine learning/d'intelligence artificielle d'Amazon. Pour en savoir plus sur la désinscription, consultez Gestion de la politique de désinscription des services d'IA.

Qui a accès à mon contenu traité et stocké par Amazon Polly ?

Seuls les employés autorisés ont accès à votre contenu traité par Amazon Polly. Votre confiance, ainsi que la confidentialité et la sécurité de votre contenu, sont notre priorité absolue. Nous mettons en œuvre des contrôles techniques et physiques appropriés et sophistiqués, notamment le chiffrement au repos et en transit, afin d'éviter l'accès non autorisé à votre contenu ou sa divulgation. Nous nous assurons également que notre utilisation respecte nos engagements à votre égard. Consultez https://aws.amazon.com/compliance/data-privacy-faq/ pour en savoir plus.

Suis-je toujours propriétaire de mon contenu traité et stocké par Amazon Polly ?

Vous restez propriétaire de votre contenu et nous n'utiliserons ce dernier qu'avec votre consentement.

Le contenu traité par Amazon Polly est-il transféré en dehors de la région AWS où j'utilise le service ?

Tout contenu traité par Amazon Polly est chiffré et stocké au repos dans la région AWS où vous utilisez le service. Certaines parties du contenu traité par Amazon Polly peuvent être stockées dans une autre région AWS uniquement en lien avec les efforts d'amélioration et de développement continus de votre expérience client Amazon Polly et d'autres technologies d'apprentissage automatique/d'intelligence artificielle d'Amazon. Si vous refusez que votre contenu soit utilisé pour améliorer et développer la qualité d'Amazon Polly et d'autres technologies d'apprentissage automatique/d'intelligence artificielle d'Amazon en contactant AWS Support, votre contenu ne sera pas stocké dans une autre région AWS. Votre confiance, ainsi que la confidentialité et la sécurité de votre contenu, sont notre priorité absolue. Nous mettons en œuvre des contrôles techniques et physiques appropriés et sophistiqués, notamment le chiffrement au repos et en transit, afin d'éviter l'accès non autorisé à votre contenu ou sa divulgation. Nous nous assurons également que notre utilisation respecte nos engagements à votre égard. Consultez https://aws.amazon.com/compliance/data-privacy-faq/ pour en savoir plus.

Puis-je utiliser Amazon Polly dans le cadre de sites web, de programmes ou d'autres applications qui visent les enfants de moins de 13 ans (et qui sont donc concernés par la loi COPPA [Children's Online Privacy Protection Act]) ?

Oui. Si vous respectez les conditions de service d'Amazon Polly, notamment votre obligation de fournir tout avis requis et d'obtenir l'accord parental vérifiable nécessaire selon le COPPA, vous pouvez utiliser Amazon Polly dans le cadre de sites web, de programmes et d'autres applications visant, entièrement ou partiellement, les enfants de moins de 13 ans.

Qui détient les enregistrements Polly ?

Entre vous et AWS, votre sortie Polly est votre propriété. Si vous saisissez dans Polly du texte appartenant à une tierce partie, vous vous devez d'en avoir le droit. Pour plus d'informations, veuillez consulter notre contrat client et les dispositions relatives au traitement de « votre contenu »

Comment puis-je déterminer si mon site web, mon programme ou mon application sont concernés par le COPPA ?

Pour plus d'informations sur les exigences du COPPA, et pour des directives pour déterminer si votre site web, votre programme ou toute autre application est régi par le COPPA, consultez directement les ressources fournies et mises à jour par la Federal Trade Commission des États-Unis. Ce site contient également des informations permettant de déterminer si un service vise, entièrement ou partiellement, les enfants de moins de 13 ans.

En savoir plus sur la tarification d'Amazon Polly

Visiter la page de tarification

Prêt à vous lancer ?

S'inscrire

D'autres questions ?

Contactez-nous