新浪科技讯 11月1日上午消息,在Convo AI & RTE 2025 第十一届实时互联网大会上,声网创始人兼CEO赵斌宣布,声网年度服务分钟数首次突破1万亿分钟,标志着RTE技术已成为不可或缺的关键基础设施。与此同时,视频高清化比例在过去两年增长超过10倍,海外市场720p以上分辨率流量占比已超80%,WebRTC全球搜索热度呈现爆发式增长,这标志着实时互动行业正迎来新一轮创新热潮。
生成式AI发展过程中,基础设施日趋完善的同时,当前产业依然面临着从“连通”到“对话”的本质挑战。当交互对象从“人与人”扩展到“人与AI”,实时互动在环境感知与交互自然度上仍存在明显缺陷。行业数据显示,仅21%的用户对现有AI对话体验满意,部分服务的用户流失率高到“不可接受”。究其根源,人类对话中仅有7%的信息来自语言内容,超过90%的信息感知依赖于语调、表情和肢体语言等非语言要素。
而要实现真正的“类人对话”,企业必须系统性攻克低延迟响应、自然打断、上下文管理、情感理解与表达等复杂挑战。赵斌指出,对话式AI正驱动RTE从能够“正常对话”到“声情并茂”的关键跃迁,为RTE行业带来一个不可估量的全新市场。
Deepgram和Opus Research调研显示,67%的企业已将语音AI智能体置于战略核心位置,84%的企业计划在未来一年增加相关投入。在开发者生态中,全球范围内也正掀起一场实时语音技术的新浪潮,对话式AI与语音智能体创业公司呈现爆发式增长态势。Y Combinator近期的孵化团队中,语音智能体公司占比显著提升;声网对话式 AI 相关用量在2025年第三季度实现151%的环比增长,这一切都展现出强劲的市场需求。(文猛)



还没有评论,来说两句吧...