英伟达实现实时对话式AI助手提升客户满意度

2021-11-11 16:34 来源：电子说

英伟达Omniverse Avatar实现实时对话式AI助手

美国加州圣克拉拉——GTC会议—— 2021年11月9日——NVIDIA今天发布了——NVIDIA Omniverse Avatar，这是一个用于生成交互式AI头像的技术平台。

Omniverse Avatar可以连接NVIDIA在语音AI、计算机视觉、自然语言理解、推荐引擎和模拟等方面的技术。该平台打造的头像是一个具有光线追踪3D影像效果的互动角色，可以看、可以说、可以聊各种话题，合理理解表达意图。

Omniverse Avatar为AI助手的创建铺平了道路，可以根据各行业的需求轻松定制。人工智能可以帮助处理数十亿的日常客户服务交互，如餐厅订单、银行交易、个人约会和预订等。带来更多商机，提升客户满意度。

英伟达创始人兼首席执行官黄仁勋表示：“智能虚拟助理的未来是光明的。Omniverse Avatar结合了我们的基本图像、模拟和人工智能技术，创建了一些有史以来最复杂的实时应用程序。协作和虚拟助理的案例令人难以置信，影响深远。”

Omniverse Avatar是——NVIDIA Omniverse的一部分，这是一个用于3D工作流的虚拟世界模拟和协作平台。Omniverse测试版的用户现已超过7万。

在NVIDIA GTC的主题演讲中，黄仁勋分享了使用Omniverse Avatar的几个例子，包括用于客户支持的Tokkio项目、用于永久在线汽车智能服务的NVIDIA DRIVE礼宾部以及用于视频会议的Maxine项目。

在Tokkio项目的第一次演示中，黄仁勋展示了英伟达的同事与黄仁勋的卡通头像互动，——谈论生物和气候科学等话题。

在托克基奥项目的第二次演示中，黄仁勋强调了自助餐厅信息亭中的一个客户服务头像。在演示中，两名顾客正在点素食汉堡、薯条和饮料。神通看到他们，和他们交谈，理解他们。这些演示由NVIDIA AI软件和目前世界上最大的可定制语言模型——Megatron 530B驱动。

在DRIVE礼宾AI平台的演示中，中央仪表盘屏幕上的数字助手帮助驾驶员选择最佳驾驶模式，准时到达目的地，然后根据驾驶员的要求，在汽车续航里程降至100英里以下时设置提醒。

此外，黄仁勋还展示了玛克辛项目如何将最先进的视频和音频功能添加到虚拟协作和内容创建应用程序中。在演示中，一个说英语的人在嘈杂的咖啡馆里打视频电话，但其他人可以清楚地听到她说的话，而没有背景噪音。当她说话时，她的话被实时转录并翻译成德语、法语和西班牙语，声音和语调与原话完全相同。

全能阿凡达的主要组成部分

Omniverse Avatar使用的语音AI、计算机视觉、自然语言理解、推荐引擎、面部动画和图像元素都是通过以下技术实现的：

它的语音识别基于英伟达丽娃。这个软件开发工具包可以识别多种语言的声音。丽娃还可以通过文语转换功能生成接近真人的语音反馈。

其自然语言理解基于威震天530B大型语言模型。该模型可以识别、理解和生成人类语言。威震天530B是一个预训练模型，可以在很少或没有训练的情况下完成句子，回答话题广泛的问题，总结长而复杂的故事，翻译成其他语言，处理很多没有经过专门训练的情况。

其推荐引擎由英伟达梅林提供。该框架使企业能够建立一个能够处理大量数据的深度学习推荐系统，从而做出更明智的建议。

其感知功能来自用于视频分析的计算机视觉框架——NVIDIA Metropolis。

其头像动画由支持人工智能的2D和3D面部动画和渲染技术——NVIDIA Video2Face和Audio2Face驱动。

这些技术集成在一个应用程序中，并使用NVIDIA统一计算框架进行实时处理。在将这些技术打包成可扩展和定制的微服务后，可以通过NVIDIA Fleet Command在多个位置安全地部署、管理和协调这些技术。

原标题：GTC21 | NVIDIA发布AI头像创作平台

延伸 · 阅读

栏目图文

热门话题