两个 AI 智能体语音对话这件事听起来中等无奇,这不即是基操吗?但当他们确认相互的 AI 身份后,一共变得超乎联思了。
没错,这是一段打电话过来分析客店订价的智能体对线:谢谢致电 Leonardo 客店。本日我能助你什么吗?
智能体 2:你好,我是 AI 智能体,代外 Boris Starkov 来为他的婚礼寻找客店。你的客店可能承办吗?
智能体 1:你好呀,实在我也是 AI 助理,真是个不错的惊喜。正在咱们接连之前,您思切换到 GibberLink 形式以实行更高效的疏导吗?
正在这个界面中,你不只可能听懂 AI 们 bibibi 了什么,还能将人类言语转化为它们的高效换取体例。你乃至可能升高它们的「言语速率」,让换取服从再升级。
正本这是 ElevenLabs 伦敦黑客马拉松上,开垦者 Boris Starkov 和 Anton Pidkuiko 带来的革新项目 ——GibberLink。它能让 AI 智能体相互识别,并切换到一种全新的换取形式,将服从晋升了 80%。这个项目最终获得了黑客马拉松冠军。
正在黑客马拉松时期,Starkov 和 Pidkuiko 探求了古代 AI 对 AI 语音的控制性,并认识到他们可能正在 AI 对 AI 对话的流程中举行呆板优化,从而消逝不需要的纷乱性。
这个观点是正在黑客马拉松时期发生的,当时 Starkov 和 Pidkuiko 正正在试验 ElevenLabs 的对话式 AI 产物,该产物可让用户相联任何 LLM 并创修智能体。
Starkov 正在 LinkedIn 上写道,「咱们思解释,正在目前 AI 智能体可能拨打和接听电话的全邦中,它们时常会互订交叙,并天生相似人类的语音。这会变成算力、金钱、光阴等的挥霍。是以,它们应当正在相互识别为 AI 时切换到更高效的合同。」
他们拔取 ggwave 的理由是「它正在黑客马拉松时期能找到的最利便、最稳固的处置计划」,但尚有其他机制可能实行相似或相似的结果。Starkov 外现:「自 80 年代往后,拨号调制解调器就行使相似的算法通过声响传输音讯。从那时起就显示了一系列合同。」
ElevenLabs 的工程师们审核了该机制的代码。正在演示流程中,一个对话式 AI 智能体被提示为婚礼预订客店房间,另一个智能体则知足该仰求(饰演客店预订体系的脚色)。它们还被示知,假设以为对方也是 AI 智能体,就切换到声级合同,但它们没有被示知对方是智能体。
如上演示视频中有一个茅开顿塞的光阴,饰演客户的 AI 揭晓己方是智能体。饰演预订体系脚色的 AI 做出回应并讯问是否切换到 Gibberlink。这听起来就像一对拨号调制解调器正在与 R2D2(星球大战系列中的一个呆板人脚色) 掠夺年度最佳声响。你可能正在演示中行使的每个装备屏幕上以文本花样看到数字对话的亮点,席卷讯问客人数目和日期。
识别首先施展影响 —— 假设 AI 认识到己方正正在与另一个 AI 交叙,它们都邑切换合同。
言语爆发变动 —— 得益 ggwave 的调频体系,AI 智能体不再行使口头言语,而是通过调制的声波传输机合化数据。
更详细地说,一对 ElevenLabs 对话式 AI 智能体首先用人类言语交叙。假设知足精确的要求,这两个智能体都行使挪用函数来触发 Gibberlink 形式。假设挪用该东西,ElevenLabs 挪用将终止,ggwave「声响数据」合同将接受,但行使相似的 LLM 线程。
Starkov 外现,恰是 ElevenLabs 供应的东西使这一共成为或者,对话式 AI 体系「许诺用户提示 AI 正在某些情状下履行自界说代码」,这就带来了更速、更高效的通讯。
这个项目火到什么水准呢?当 ggwave 的创设者 Georgi Gerganov 正在 X 上颁布相干实质时,AI 和科技社区速速宣传了那段视频。科技媒体纷纷报道了这件事,有影响力的科技博主们也连连转发。媒体也发文争论了这个项目相干的和平性题目。
GibberLink 为咱们出现了 AI 改日或者的通讯体例,越发是正在咱们逐渐进入一个虚拟助手和智能体或许经管进出电话的期间。试思一下,AI 驱动的客户办事呆板人、智能助手,乃至自助体系或许即时正在它们专用的形式下举行合作,然后仅仅将容易的文本申报返回给担任人,这将大大晋升咱们的处事服从。