IA de voz

NVIDIA Riva

Cree e implemente IA de voz y traducción multilingüe totalmente personalizables para sus aplicaciones basadas en modelos lingüísticos de gran tamaño y generación aumentada con recuperación.

¿Qué es NVIDIA Riva?

NVIDIA® Riva es un conjunto de microservicios de voz y traducción multilingüe acelerados por GPU para crear canalizaciones de IA conversacional totalmente personalizables y en tiempo real. Riva incluye reconocimiento de voz automático (ASR), conversión de texto a voz (TTS) y traducción automática neuronal (NMT), y puede implementarse en todas las nubes, en centros de datos, en el perímetro o en dispositivos integrados. Con Riva, las organizaciones pueden añadir capacidades de voz y traducción con modelos lingüísticos de gran tamaño (LLM) y generación aumentada con recuperación (RAG) para transformar los chatbots en potentes asistentes y avatares multilingües.

Presentamos la magia de la IA de voz y traducción integral

Ofrezca chatbots de IA con transcripción, traducción y voces multilingües de última generación.

Ver Riva en acción

Probar el reconocimiento de voz automático de NVIDIA Riva

Seleccione el idioma y compruebe cómo Riva ASR ofrece una transcripción de gran precisión en tiempo real proporcionando una entrada a través del micrófono o cargando un archivo .wav desde el dispositivo.

Nota: La duración de cada muestra está limitada a 30 segundos.

Try saying something

Probar el texto a voz de NVIDIA Riva

Seleccione una voz y escriba una frase de prueba para escuchar la voz inglesa femenina o masculina lista para usar de Riva.

Nota: El texto de entrada está limitado a 400 caracteres.

El uso de las habilidades de Riva está sujeto a los términos de uso de NVIDIA Riva. Sus datos se utilizarán para mejorar los productos y servicios de NVIDIA.

Ventajas de NVIDIA Riva

Voces multilingües expresivas y muy precisas

Logre una alta precisión de transcripción para traducciones bilingües y multilingües e implemente voces femeninas y masculinas profesionales y expresivas listas para usar con modelos de última generación entrenados previamente con miles de horas de audio en superordenadores NVIDIA.

Totalmente personalizable

Personalice las canalizaciones ASR para diferentes idiomas, acentos, dominios, vocabulario y contexto, y obtenga la mayor precisión posible para su caso de uso y en todas las canalizaciones TTS para lograr la voz y la entonación que desea.

Implementaciones flexibles

Proporcione experiencias coherentes a sus clientes para cientos de miles de flujos de entrada con un rendimiento de inferencia superior al de la tecnología existente y en la implementación que elija: en centros de datos, en las instalaciones, en la nube, en el perímetro o en dispositivos integrados. 

Opciones iniciales

Empezar con NVIDIA Riva

Utilice las herramientas adecuadas para crear e implementar aplicaciones de IA de voz y traducción multilingüe totalmente personalizables.

Experimentar con API y demostraciones interactivas

Para las personas que deseen experimentar con Riva, el catálogo de API ofrece un terreno de pruebas basado en la IU y acceso gratuito a los terminales de la API gestionados por NVIDIA como punto de partida ideal. 

Probar antes de comprar

Las empresas que deseen probar Riva antes de comprar NVIDIA AI Enterprise para producción tienen dos opciones para empezar de forma gratuita:

Sin infraestructura:
Para quienes no dispongan de infraestructura, NVIDIA ofrece laboratorios prácticos gratuitos a través de NVIDIA LaunchPad.

Con infraestructura:
Para quienes ya dispongan de infraestructura, NVIDIA ofrece una licencia de evaluación gratuita para probar NVIDIA AI Enterprise durante 90 días.

Casos prácticos

Líderes en adopción en todos los sectores

Escuchar a los expertos

IA de voz para centros de contacto efectivos

Descubra cómo AT&T, Kore.ai, Deloitte y Sutherland se benefician del uso de ASR, traducción y TTS multilingües para ofrecer un autoservicio al cliente más rápido y preciso, mejorar la productividad de los agentes en directo y aumentar la eficiencia operativa de las empresas. 

El futuro del servicio de atención al cliente con AT&T

Conozca de la mano de un experto en ciencia de datos y tecnología de IA las vanguardistas soluciones de IA de traducción y voz de NVIDIA Riva que están revolucionando el sector, desde asistentes virtuales y avatares digitales para mejorar la divulgación, la gestión de siniestros, los pedidos y el aprovisionamiento hasta sistemas de detección de fraudes para la mitigación de riesgos.

Crear un asistente virtual con reconocimiento de voz habilitado de IA

Vea este seminario web bajo demanda para aprender a crear asistentes virtuales inteligentes en forma de agentes digitales con reconocimiento de voz. Mostraremos cómo implementar soluciones flexibles y totalmente personalizables para mejorar la satisfacción del cliente.

Presentamos la magia de la IA de voz y traducción integral

Descubra cómo Motorola y SoftServe ofrecen la transcripción, traducción y voces más precisas y atractivas a la velocidad y escala que exigen las experiencias de IA conversacional.

Transform Your Business With Speech AI

Watch this on-demand webinar to learn how speech AI is revolutionizing customer experiences in finance, broadcasting, and retail by removing barriers across languages and dialects, driving operational efficiency, and helping businesses stay ahead by improving accuracy and enhancing performance.

Telcos Transform Customer Experiences With Conversational AI

Watch Infosys, Quantiphi, Talkmap, and NVIDIA on-demand to learn how telecommunications companies are using AI to improve operational efficiency and enhance customer engagement.

Enabling Contact Center Agents Through Speech AI

Learn best practices from Infosys and Quantiphi for seamlessly integrating speech and translation AI into agent-assist solutions, ensuring smooth and effective customer-agent communication.

Speech-to-Text at Scale With T-Mobile

Watch T-Mobile as they walk through their model development with NVIDIA NeMo, cloud deployment with NVIDIA Riva, their efforts to identify and remove bias in their models, and the future of speech-to-text at T-Mobile.

Transform Your Business With Speech AI

Watch this on-demand webinar to learn how speech AI is revolutionizing customer experiences in finance, broadcasting, and retail by removing barriers across languages and dialects, driving operational efficiency, and helping businesses stay ahead by improving accuracy and enhancing performance.

Unveiling End-to-End Speech and Translation AI Magic

Join Motorola and Softserve to learn how to deliver the most accurate transcription, translation, and engaging voices at the speed and scale conversational AI experiences demand.

Telcos Transform Customer Experiences With Conversational AI

Watch Infosys, Quantiphi, Talkmap, and NVIDIA on-demand to learn how telecommunications companies are using AI to improve operational efficiency and enhance customer engagement.

Enabling Contact Center Agents Through Speech AI

Learn best practices from Infosys and Quantiphi for seamlessly integrating speech and translation AI into agent-assist solutions, ensuring smooth and effective customer-agent communication.

Más recursos

Obtener una introducción

Conozca las características clave de Riva que le ayudarán a crear servicios de IA de voz y traducción.

Explorar los recursos para empezar

Obtenga todo lo que necesita para empezar a crear sus canalizaciones de IA de voz y traducción con NVIDIA Riva, incluidos tutoriales, Jupyter Notebooks y documentación.

Explorar blogs técnicos

Lea un tutorial técnico sobre cómo crear e implementar aplicaciones de IA de voz y traducción con Riva.  

Echar un vistazo a un libro electrónico

Descubra cómo empezar a integrar e implementar modelos Riva ASR y TTS en producción con inferencia de alto rendimiento y un esfuerzo mínimo.

AI2Labs

En 2021, AI2Labs se separó de Yoozoo Games como una startup tecnológica local en Singapur. AI2Labs innova, experimenta y desarrolla productos y aplicaciones de IA, lo que permite procesos eficientes y mejora la sostenibilidad y los resultados empresariales.

AI2Labs ha integrado Riva en su Speakr, la IA de voz específica de dominio, la API de reconocimiento de voz para adaptarse a las complejidades de los dominios de voz y negocio asiáticos y ha logrado una precisión de traducción de Singlish de última generación.

Avaya

Avaya se especializa en comunicaciones en la nube y soluciones de colaboración de flujo de trabajo, proporcionando comunicaciones unificadas, centro de contacto, plataforma de comunicaciones como servicio (CPaaS) y servicios con su plataforma OneCloud.

Avaya ha integrado el motor de voz a texto de NVIDIA Riva para subtítulos en tiempo real a escala. Riva mejora la calidad de la transcripción, reduce la tasa de errores de palabras y ofrece una entrega económica.

C-DAC

For over 10 years, the Applied AI Group at C-DAC in Pune, India, has focused on research and development of speech technology. They’ve successfully created a cutting-edge speech-to-text (STT) system for Indic languages such as Hindiand Marathi. The group continues to advance their work by exploring AI-enabled, open-source deep learning frameworks, libraries, and tools for creating STT and speech-enabled applications for other Indic and low-resource languages. Experiments were conducted using various neural network architectures and topologies from NVIDIA’s open-source NeMo framework, with Citrinet and Conformer-CTC network topologies proving to be effective in building and training neural acoustic models for speech recognition. These models were trained on single- and multi-node Param Siddhi AI systems, optimizing training time and performance. Finally, the models were deployed for real-time and batch-mode inference using the Riva GPU-accelerated production pipeline.

NCS

NCS, una filial de Singtel Group, es una empresa líder en servicios tecnológicos con presencia en Asia Pacífico y se asocia con gobiernos y empresas para avanzar en las comunidades a través de la tecnología. Al combinar la experiencia y los conocimientos de su equipo de 12 000 personas en 61 especializaciones, NCS proporciona servicios tecnológicos diferenciados e integrales a los clientes con sus funcionalidades NEXT en plataformas, nube y datos digitales, así como ofertas básicas en aplicaciones, infraestructura, ingeniería y ciberseguridad. NCS también cree en la creación de un ecosistema de partners sólido con los principales agentes tecnológicos, instituciones de investigación y startups que apoyen la innovación y la creación conjunta abiertas. 

NCS utiliza NVIDIA Riva TTS in Breeze, la aplicación complementaria del conductor, para la navegación guiada por voz, actualizaciones del tráfico y el estado de la carretera en directo, tarifas de estacionamiento en tiempo real, tarifas de precios de peaje electrónico y horas de funcionamiento, para ayudar a los conductores de Singapur a experimentar trayectos de conducción fluidos.

Más información.

breeze.com.sg/

www.ncs.co

Customer Story

RingCentral

RingCentral, un proveedor líder de soluciones globales de comunicaciones en la nube empresariales, colaboración y centros de contacto, atiende a millones de usuarios. La plataforma RingCentral permite la colaboración desde cualquier ubicación y dispositivo, lo que mejora la eficiencia empresarial y la satisfacción del cliente.

RingCentral utiliza NVIDIA Riva para la transcripción de videoconferencias para 200 000 usuarios simultáneos en su plataforma.

Más información.

www.ringcentral.com

Customer Story

GTC Session

Snap

Snap es una empresa de cámaras y redes sociales que permite la creación de mensajes multimedia con filtros y efectos. Para crear experiencias más interactivas, los usuarios de Snapchat juegan con Lenses, una característica que añade efectos en tiempo real a las instantáneas, más de 6 mil millones de veces al día. 

El servicio de IA de voz optimizado para ruido y Lingo de NVIDIA Riva se integra en Snap AR Lens Studio, lo que permite a los creadores (artistas y desarrolladores) crear experiencias de realidad aumentada (AR) emocionantes.

T-Mobile

T-Mobile, un Un-carrier sobrecargado, ofrece una avanzada red 4G LTE y 5G transformadora para la mejor experiencia del cliente. Para capacitar a los agentes del centro de contacto, T-Mobile implementa Expert Assist. Este software basado en IA utiliza NVIDIA Riva para transcribir conversaciones de clientes en tiempo real que proporcionan recomendaciones y ayudan a miles de agentes.

Con Riva, T-Mobile ajusta los modelos de reconocimiento automático de voz en conjuntos de datos personalizados e interpreta la jerga del cliente con precisión en entornos ruidosos.

Más información.

www.t-mobile.com

Customer Story

GTC Session

Póngase en contacto con un representante de ventas de NVIDIA AI Enterprise

Responderemos a sus preguntas y ayudaremos con las necesidades de su organización.

Contáctenos