思科正在利用人工智能来解决视频通话中一些最常见的问题,例如视频模糊和音频断断续续。该公司今天宣布为其Webex视频会议软件推出一套新的人工智能产品,据称该产品将“实现新的音频和视频质量水平”。
当Wi-Fi连接不稳定或通话中断时(例如离开汽车时),人工智能音频编解码器将填补语音空白。思科告诉PCMag,它通过使用“与行业基准相比少得多的带宽来传输语音”来实现这一点。这使得Webex能够创建音频源的“冗余”副本,并在主副本丢失时提供新副本。
思科表示:“将来,我们还将能够使用生成式人工智能来重建音频,以防丢失的音频帧不可用。”
虽然通话参与者可能会喜欢更一致的音频,但这种类型的实时深度伪造创作可能会引发道德问题。思科表示,其人工智能方法旨在实现“重大承诺,同时遵守透明度、公平性、问责制、隐私、安全性和可靠性标准”。
Webex的新视频技术被称为“超分辨率”,其工作原理与音频类似。思科表示:“当数据包通过网络传输时,我们会获取源并缩小其规模,以节省计算资源。”“然后,当它到达用户时,它会被转换回1080p,最终结果是比原始视频更高的分辨率。”
继Zoom和GoogleMeet等竞争对手之后,思科也推出了一款可以总结会议笔记的人工智能助手。要求它“补上我在会议中错过的15分钟”,或者寻求有关如何改进向同事或客户发送消息的语气的建议。这些功能“处于不同的可用阶段”,并将在今年年底前开始推出。
思科计划结合多种大型语言模型来实现这些功能,包括“商业、开源、思科专有和精选客户模型”。
未来,其人工智能产品可以帮助从人类行为中提取洞察。例如,人工智能生成的警报可能能够“通知会议参与者,如果有人在讨论关键话题时离开房间,或者讲话中出现戏剧性停顿,表明正在沉思”。
人工智能在视频通话中的使用引起了一些争议。今年早些时候,Zoom在更新服务条款后发现自己陷入了困境,称其人工智能产品可以根据用户数据进行训练。在遭到强烈反对后,它取消了该政策,但继续尝试使用人工智能伴侣来总结会议记录。