NVIDIA Riva

构建和部署完全可定制的多语种语音 和翻译 AI 应用。

什么是 NVIDIA Riva?

NVIDIA® Riva 是一款 GPU 加速的多语种语音和翻译 AI 软件开发套件,用于构建完全可定制的实时对话式 AI 流程,包括自动语音识别 (ASR)、文本转语音 (TTS) 和神经网络机器翻译 (NMT) 应用,可部署在云端、数据中心、边缘或嵌入式设备上。NVIDIA Riva 是 NVIDIA AI Enterprise 软件平台的一部分,可简化生产级 AI 的开发和部署。

查看 Riva 的实际应用

试用 NVIDIA Riva 自动语音识别

选择语言,并通过麦克风输入或从设备上传.wav文件,了解Riva ASR如何实时提供高度准确的转录。

注意:每个样本的持续时间限制为 30 秒。

试着说点什么

试用 NVIDIA Riva 文本转语音

选择语音并输入测试句子,即可聆听 Riva 开箱即用的英语女性或男性语音。

注意:输入文本不得超过 400 个字符。

Riva 技术的使用受 NVIDIA Riva使用条款的约束。 您的数据将用于改进 NVIDIA 产品和服务。

NVIDIA Riva 的优势

多语种高精度和富有表现力的语音

为英语、西班牙语、普通话、印地语、俄语、阿拉伯语、日语、韩语、德语、葡萄牙语、法语和意大利语的双语和多语种翻译实现高转录准确性,并使用 NVIDIA 超级计算机上经过数千小时音频预训练的先进模型,为英语、西班牙语、德语、意大利语和法语部署两种开箱即用的富有表现力的专业男女语音。

完全可定制

跨 ASR 流程针对不同的语言、口音、领域、词汇和上下文进行自定义,以尽可能提高您用例的准确性,并跨 TTS 流程针对您想要的语音和语调进行自定义。

灵活部署

在数据中心、本地、云、边缘或嵌入式设备中部署数十万个输入流,为客户提供一致的体验,且推理性能高于现有技术。

开始使用 NVIDIA Riva

在生产环境中部署

购买 NVIDIA AI Enterprise,即可在所有云上无限制使用、获得 NVIDIA AI 专家的长期支持。同时,作为 NVIDIA 开发者计划的成员,可以在 90 天内免费访问 Riva 容器进行开发。

试用语音 AI 工作流程

借助打包的音频转录和智能虚拟助理 AI 工作流加速开发。这些 AI 工作流包括 AI 框架和预训练模型,以及 Helm 图表、Jupyter Notebook 和文档等资源,可帮助您快速构建 AI 解决方案。

在 NVIDIA LaunchPad 上试用,开启您的 Riva 之旅

您是否是否有即将推出的语音 AI 项目?申请访问免费精选实验的 NVIDIA Riva。获取逐步指导的语音 AI 实验,其中包括可立即使用的硬件、软件、示例数据和应用程序。

阅读客户案例

NCS 在 Breeze(一款驾驶员的配套应用)中使用 NVIDIA Riva TTS 为数以万计的月度活跃用户定制具有当地发音、语调和口音的新加坡语音。

T-Mobile 在呼叫中心使用 NVIDIA Riva ASR 准确转录客户对话,并提供实时建议,从而帮助代理快速解决客户问题。

Data Monsters 使用 NVIDIA Riva 为 Plabook 应用添加了语音工作流,帮助学生阅读、评估音素级的准确性,并提供个性化反馈。

Artisight 开发了智能医院解决方案,可通过支持语音的操作台自动检查并通知等待患者。这些解决方案集成了定制的语音 AI 应用程序,并使用 GPU 加速的 NVIDIA Riva 文本转语音技能提供实时性能。

借助 NVIDIA Riva,RingCentral 在视频会议方面实现了超高的实时转录准确性,为数百万使用特定领域术语且口音各异的用户提供服务。

Tarteel 使用 NVIDIA Riva 和 NVIDIA NeMo 大规模提供关于《可兰经》朗诵的实时反馈,使穆斯林教徒、讲师、内容创作者和研究人员能够与《可兰经》进行互动。

Floatbot 利用 NVIDIA Riva 和 NVIDIA TAO 开发定制的新加坡英语语音 AI 应用,帮助全球保险公司和金融领域客户实现呼叫中心的自动化。

各行各业的领先采用者。

聆听专家意见

AT&T 携手打造客户服务的未来

与数据科学和 AI 技术专家一起,了解如何通过行业领先的 NVIDIA Riva 语音和翻译 AI 解决方案,在虚拟助手和数字人的帮助下进行展业、索赔管理、订单管理,以及通过欺诈检测系统降低业务风险。

适用于有影响力的联络中心的语音 AI

与 NVIDIA、AT&T、Kore.ai、Deloitte、Appen 和 Sutherland 一起,探索使用多语言 ASR、翻译和 TTS 的优势和挑战,从而为企业提供更快、更准确的客户自助服务、提高在线客服生产力并提高运营效率。

构建支持 AI 语音的虚拟助手

观看此点播式在线研讨会,了解如何在智能虚拟助理中构建语音功能。我们将展示如何部署灵活、完全可定制的解决方案,以提高客户满意度。

借助 T-Mobile 大规模语音转文本

观看 T-Mobile 如何使用 NVIDIA NeMo 进行模型开发、使用 NVIDIA Riva 进行云部署、如何识别和消除模型中的偏差,以及 T - Mobile 对语音转文本的未来规划。

借助语音 AI 实现业务转型

观看此点播式在线研讨会,了解语音 AI 如何消除跨语言和方言的障碍、提高运营效率,以及通过提高准确性和性能帮助企业保持领先地位,从而彻底改变金融、广播和零售业的客户体验。

揭开端到端语音和翻译 AI 魔力

加入 Motorola 和 Softserve,了解如何以对话式 AI 体验所需的速度和规模提供更准确的转录、翻译和引人入胜的语音。

电信公司利用对话式 AI 转变客户体验

点播观看 Infosys、Quantiphi、Talkmap 和 NVIDIA,了解电信公司如何利用 AI 提高运营效率并增强客户参与度。

通过语音 AI 为联络中心客服提供支持

了解 Infosys 和 Quantiphi 的最佳实践,将语音和翻译 AI 无缝集成到坐席辅助解决方案中,确保客户和坐席之间顺畅有效的沟通。

更多资源

获取简介

了解 Riva 中可帮助您构建语音和翻译 AI 服务的主要功能。

探索入门资源

获取使用 NVIDIA Riva 构建语音和翻译 AI 工作流所需的一切,包括教程、Jupyter Notebook 和文档。

探索技术博客

阅读技术演示,了解如何使用 Riva 构建和部署语音和翻译 AI 应用。

查看电子书

探索如何开始在生产环境中集成和部署 Riva ASR 和 TTS 模型,同时轻松实现高性能推理。

接收 NVIDIA 发布的最新语音和翻译 AI 新闻。

AI2Labs

2021 年,AI2Labs 从 Yoozoo Games 中分离出来,成为新加坡的一家本地技术初创公司。AI2Labs 创新、试验和开发 AI 产品和应用,实现高效流程并改善可持续性和业务成果。

AI2Labs 将 Riva 集成到其 Speakr (特定领域的语音 AI)语音识别 API 中,以适应亚洲语音和商业领域的复杂性,并实现了出色的新加坡英语翻译准确性。

Avaya

Avaya 专注于云通信和工作流协作解决方案,通过其 OneCloud 平台提供统一通信、联系中心、通信平台即服务 (CPaaS) 和服务。

Avaya 集成了 NVIDIA Riva 语音转文本引擎,可大规模实现实时字幕。Riva 可实现更好的转录质量、更低的字错误率和经济的交付。

C-DAC

十多年来,位于印度浦那的 C-DAC 的应用 AI 小组一直专注于语音技术的研究和开发。他们已成功为印度语(如印地语和马拉松语)创建了先进的语音转文本 (STT) 系统。该小组通过探索支持 AI 的开源深度学习框架、库和工具来为其他印度语和低资源语言创建支持 STT 和语音的应用程序,从而继续推进其工作。使用各种神经网络架构和 NVIDIA 开源 NeMo 框架中的拓扑进行了实验,事实证明 Citrinet 和 Conformer-CTC 网络拓扑在构建和训练用于语音识别的神经声学模型方面非常有效。这些模型在单节点和多节点 Param Siddhi AI 系统上进行了训练,优化了训练时间和性能。最后,使用 Riva GPU 加速的生产流程部署了模型,以进行实时和批量模式推理。

NCS

NCS 是新加坡电信集团的子公司,是一家领先的技术服务公司,在亚太地区设有办事处,并与政府和企业合作,通过技术推动社区发展。NCS 结合其 12000 人的团队在 61 个专业领域的经验和专业知识,利用其在数字、数据、云和平台方面的 NEXT 能力,以及应用、基础设施、工程和网络安全方面的核心产品,为客户提供差异化的端到端技术服务。NCS 还相信与领先的技术参与者、研究机构和初创公司建立强大的合作伙伴生态系统,以支持开放式创新和共同创造。

NCS 在 Breeze (驾驶员的配套应用)中使用 NVIDIA Riva TTS 进行语音导航、实时交通和路况更新、实时停车费用以及电子道路定价费用和运营时间,帮助新加坡驾驶员体验平稳的驾驶旅程

了解详情。

breeze.com.sg/

www.ncs.co

客户案例在 Omniverse 中

RingCentral

RingCentral 是全球企业云通信、协作和联络中心解决方案的领先提供商,为数百万用户提供服务。RingCentral 平台支持从任何位置和设备进行协作,提高业务效率和客户满意度。

RingCentral 使用 NVIDIA Riva 为其平台上的 20 万并发用户进行视频会议转录

了解详情。

www.ringcentral.com

客户案例

GTC 会议

Snap

Snap 是一家摄像头和社交媒体公司,致力于通过滤镜和特效创建多媒体信息。为打造更具交互性的体验,Snapchat 用户每天使用 Lenses (一种为快照添加实时特效的功能)的次数超过 60 亿次。

NVIDIA Riva 针对噪音和术语优化的语音 AI 服务集成到 Snap AR Lens Studio 中,使创作者(艺术家和开发者)能够打造扣人心弦的增强现实 (AR) 体验。

T-Mobile

T-Mobile 是一款功能强大的 Un - Carrier,可提供先进的 4G LTE 和变革性 5G 网络,以提供最佳客户体验。为了增强联系中心坐席的能力,T - Mobile 实施了专家协助。这个基于 AI 的软件使用 NVIDIA Riva 转录实时客户对话,为推荐系统提供信息,并为成千上万的坐席提供帮助。

借助 Riva,T-Mobile 可在自定义数据集上微调自动语音识别模型,并在杂的环境中准确解释客户术语。

了解详情。

www.t-mobile.com

客户案例y

GTC 会议

联系 NVIDIA AI Enterprise 业务代表

我们会就您的疑问为您提供帮助。

联系我们咨询语音 AI