开yun体育网在采购暖锅食材的例子中-开云官网登录入口 http://www.kaiyun.com
发布日期:2026-01-02 17:50 点击次数:171
作家:Alter
55年前,左脚刚刚踏上月球的阿姆斯特朗,说了一句浅显的话:“这是个东说念主的一小步,却是东说念主类的一大步。”
当年几十年里,许多东说念主曾援用过这句话,用来定格某个历史性时刻。今天,咱们想把这句话套用到智谱的AutoGLM上。
11月29日的智谱Agent OpenDay上,对外公测或内测了三个居品——浏览器插件AutoGLM Web、电脑智能体大模子GLM-PC,以及一个多月前“剧透”过的AutoGLM,亦然智谱第一个居品化的智能体Agent。
短短一个月的时期,AutoGLM的才气不再局限于点外卖、一又友圈点赞,带来了多个新进展:
AutoGLM 不错自主施行卓越 50 步的长模范操作,也不错跨App施行任务;AutoGLM开启“全自动”上网新体验,相沿等数十个网站的无东说念主驾驶;像东说念主一样操作谋划机的GLM-PC启动内测,基于视觉多模态模子收尾通用Agent的技艺探索。
伸开剩余83%同期AutoGLM 启动了大限度内测,将尽快上线成为面向 C 端用户的居品,并文告启动“10个亿级 APP 免费 Auto 升级”的谋划。
01 AutoGLM不错作念什么?
看到这里,可能不少东说念主会疑问:什么是AutoGLM?
单从名字上看,很容易让东说念主空猜想自动驾驶,毕竟真实每辆汽车的中控区齐有一个AUTO按钮,暗意该功能或建立为自动模式。
顾名念念义,AutoGLM的场景恰是用AI狂妄手机,只需要一句语音领导,AutoGLM即可模拟东说念主类操作手机来完竣任务。AI从只须对话功能的Chatbot,正在进化为“有手、有脑、有眼睛”的自主Agent。
为了便捷各人清醒,咱们提前作念了一波测试。
关于不便捷看视频的小伙伴,这里大约说一下咱们测试的四个场景:分别是到小红书查找周末出行攻略、给小红书博主的最新骨子批驳、到拼多多上买一箱涌泉蜜桔、订一张从宁波到北京的机票。
凯旋说恶果,AutoGLM齐准确完成了责任,几个波及到购买的场景,只需要咱们临了付款即可。稍有不及的是,际遇弹窗或需要东说念主工证据的关节,咫尺AutoGLM还无法解决,需要东说念主为操作后才能不竭后头的历程。
由于时期的原因,咱们的测试莫得太深入,关于AutoGLM的才气升级,不错参考智谱Agent OpenDay上传递出的信息:
超长任务:清醒超长领导,施行超长任务。举例,在采购暖锅食材的例子中,AutoGLM 自主施行了 54步无打断操作。何况,在这种多步、轮回任务中,AutoGLM 的速率发达卓越东说念主手动操作。
跨 App :AutoGLM 相沿跨 App 来施行任务。用户将风气于 AI 自动解决,而不是在多个 APP 间往复切换。由于咫尺 AutoGLM 步地更像是用户和欺诈间的APP施行的琢磨层,因此跨 App 才气是内部十分要害的一步。
短口令:AutoGLM 梗概相沿长任务的自界说短语。今天,你无用再给AutoGLM说:“帮我买一杯瑞幸咖啡,生椰拿铁,五说念口店,大杯、热、微糖” 这类超长领导,只需要说“点咖啡”。
疏忽模式:咱们齐会堕入礼聘胆怯,AutoGLM 今天不错主动帮你作念出方案。疏忽模式下悉数模范齐让 AI 方案,带来有抽盲盒式的惊喜。想不想尝尝AI为你点的咖啡口味?
依此类推,AutoGLM Web和GLM-PC的才气和AutoGLM相似,面向的场景分别是浏览器和电脑端,何况有一些智妙手机上作念不到的功能。
比如AutoGLM Web梗概清醒用户的领导,自动为用户在网页上站内检索、多迷惑转头,以至进一步收尾生成arXiv日报,搭建Github仓库,在微博超话签到等个性化功能。
再比如而已手机发领导,GLM-PC不错自主完成电脑操作,不错设定一个畴昔时期,在开机景象下定时施行任务。
联想一下:即使你在摸鱼、喝咖啡或者上茅厕,你的电脑依然在责任,涓滴不会影响责任的进程。
02 东说念主机交互参预AI时间
固然,让咱们印象深刻的,并非是AutoGLM所收尾的才气,而是对东说念主机交互模式的普遍冲击,基于当然话语的东说念主机交互也曾是当今进行时。
小时候上“微机课”,敦朴时常挂在嘴边的一句话即是:“你们要学会用电脑。”
之是以会出现一个“学”字,因为操作电脑必须要学会使用键盘和鼠标、必须学会输入法、必须要去稳健每一个欺诈的复杂界面,想要编写圭臬还需要从0开动学一门编程话语。尽管这些器用在不休高出,东说念主与机器的互助依然是一件高门槛的事,绝顶是一些专科软件,想要完成某个任务需要许多个模范,过程中充斥着机械性的重叠服务。
AutoGLM咫尺的功能还很基础,却拉开了东说念主机交互进化的序幕:借助于大模子的遒劲才气,只需要一句话,AI就能自动帮咱们解决复杂的任务,东说念主机互助的门槛进一步裁减。
不再是东说念主被迫稳健机器,而是让机器清醒东说念主类。
试图突破东说念主机交互僵局的,不仅仅国内的智谱,苹果的Apple lnteligence、Anthropic的Computer Use、谷歌的Jarvis,以及OpenAI行将发布的Operator,齐执政相同的场所进行翻新。
问题来了,大模子距离重塑东说念主机交互范式还有多远呢?
自动驾驶边界有L1—L5的才气别离,OpenAI、智谱等企业也提议了近似的技艺阶段:L1是话语才气、L2是逻辑才气(多模态才气)、L3是使用器用的才气、L4是自我学习才气,最终作念到像东说念主一样清醒界面、筹划任务、使用器用、完成任务。
“坏音信”在于,咫尺大模子才气还处于低级阶段。按照智谱 CEO 张鹏的说法,“Agent 将极地面进步 L3 使用器用才气,同期开启对 L4 自我学习才气的探索。”
“好音信”则是,在智谱Agent OpenDay上,荣耀、华硕、小鹏、高通、英特尔等,分别从不同的场景启航,共享了他们对智能结尾的试验及瞻望。
也即是说,大模子重塑东说念主机交互范式,绝非是大模子企业的愿景,而是包含结尾厂商、芯片厂商在内的产业高下流的共鸣。跟着AutoGLM才气的进步,将能调用越来越多的欺诈,适配越来越多的系统,收尾越来越复杂的连贯自主操作。
另一个不应该忽略的信息是:端侧算力正在捏续进步,智谱趁势推出了为AI原生教悔适配的模子和端云同源的协同架构,意味着Agent不仅将在欺诈上收尾用户体验变革,还能将推论到千般智能教悔上,手机+AI、PC+AI、汽车+AI等将不休深切。
03 写在临了
在大模子的看法刚走红时,就有东说念主将其比作是“操作系统”。
至少从AutoGLM的发达来看,即便仅仅在用户和欺诈之间增多一个智能琢磨层,也曾有了GLM-OS(以大模子为中心的通用谋划系统)的雏形。倘若梗概进一步收尾原生的东说念主与机器交互,将从根柢上改动东说念主机交互模式,悉数东说念主齐不错用当然话语操作手机、电脑、汽车、眼镜等等。
值得期待的是,著名调研机构Gartner也曾将agentic AI列为2025年十大技艺趋势之一开yun体育网,预测2028年至少有 15%的频频责任方案将由agentic AI自主完成。
发布于:江西省