之间网

OpenAI的重大启示让ChatGPT的感觉和声音更加人性化

互联网
导读 在周一发布公司春季更新之前,OpenAI的员工和追随者都在Twitter上疯传,以至于令人窒息的炒作几乎是不可避免的。世界将永远改变,一条推文...

在周一发布公司春季更新之前,OpenAI的员工和追随者都在Twitter上疯传,以至于令人窒息的炒作几乎是不可避免的。“世界将永远改变,”一条推文承诺道。OpenAI首席执行官萨姆·奥尔特曼(SamAltman)开玩笑说,即将发生的事情对他来说就像“魔法”。除此之外,还有传言称ChatGPT制造商正在开发Google搜索竞争对手,以及OpenAI正在与苹果合作开发语音助手。

事实上,虽然该公司在其相当活跃的直播活动中发布了大量的技术公告(例如发布新的桌面版ChatGPT),但其中一项重要的重大披露对我来说很突出。我敢说,新的ChatGPT-4o让OpenAI已经令人印象深刻的聊天机器人感觉和听起来更加人类化。

除此之外,ChatGPT现在可以像人类一样从用户的声音和面部表情中检测情绪。它还会自动讲笑话,就像人类试图保持对话轻松一样,而且它还可以让你打断回应——这样你就不必再将自己限制在生硬的“我轮到你”的动态对话中了。一个聊天机器人。

要了解OpenAI让ChatGPT感觉更人性化的意思,请观看该公司发布的这段视频,其中新的GPT4-o模型通过摄像头与一只可爱的狗进行交互。如果你闭上眼睛,你会认为这是一位真正的女士对一只可爱的小狗阿谀奉承,而事实上,这是一个人工智能模型,它学会了如何表达相关且适当的情感——除了做出与我们在观察时相同的观察结果之外,第一次见到可爱的狗。

“GPT-4o(‘o’代表‘全能’)是迈向更加自然的人机交互的一步,”OpenAI解释了此次更新。“它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出。它可以在短至232毫秒的时间内响应音频输入,平均为320毫秒,这与人类在对话中的响应时间相似……与现有模型相比,GPT-4o在视觉和音频理解方面尤其出色。”

最后一部分确实说明了我上面提到的魔法。例如,在周一的活动期间,ChatGPT阅读了一个睡前故事(旁白中添加了大量奇思妙想、情感和戏剧性)。在对话中,为了清晰起见,它会向用户重复想法,并添加嗯嗯和停顿,就像人类一样。

世界是否需要一个聊天机器人来阅读睡前故事,就像你的父母在你年轻时那样充满情感?老实说,不,但话虽如此,它使这项技术变得更加平易近人,类似于苹果公司为那些早期的糖果色麦金塔电脑添加手柄的方式,虽然没有必要,但在当时有点令人愉快。

OpenAI的语音助手现在在实时翻译方面也拥有一些令人印象深刻的能力,以至于演示的这一部分确实让我惊叹不已。它速度很快,在英语和意大利语之间无缝翻译,没有错过任何一个节拍,实时向对方总结每个发言者的情况。

正如我所看到的,这就是我对周一OpenAI活动中重大揭晓的意思。公司越让人感觉其技术令人愉悦,ChatGPT的采用率就会越高。说实话:上一次公司发布令您高兴并感觉神奇的产品或软件更新是什么时候?

标签: