近期,在AI领域爆火的Agent,似乎遇到了口碑两极分化的局面。
一方面,Agent仍然被看作是“大模型的下一场战事”,2024年也被看作是Agent爆发元年。
今年3月20日,红杉资本合伙人在AI Ascent主题活动的开幕致辞中对2024年的人工智能趋势做出了预测,*条就是:Copilot将逐渐向Agent转变。
AI将从辅助人类的Copilot转变为真正能替代一些人类工作的Agent。AI更像一个同事,而不仅仅是一个工具。这一点已经在软件工程、客服等行业初步显现。
在同一场活动上,斯坦福大学客座教授吴恩达也发表了关于Agent的主题报告。他认为AI代理工作流程将在今年推动AI的巨大进步,甚至可能超过下一代基础模型,“这是一个重要的趋势,我呼吁所有从事人工智能工作的人都关注它。”
另一方面,与之形成鲜明对比的是,*批做Agent的OpenAI,似乎遇到了出道即*,随后一路下滑的状态。
去年11月,OpenAI在首届DevDay上发布了Agent开发框架Assistant API,并配套推出了GPT Store。GPT Store里的每一个GPTs,就是一个Agent。
但是,GPT Store的流量表现不佳。SametimeWeb数据显示,2月份GPTs仅占ChatGPT网站桌面访问量的1.5%。
据The Information报道,一位开发人员分析了3.6万多个GPTs,其中约有5%每天有150至500名活跃用户,但绝大多数每天只有1到2个用户。“感觉OpenAI已经放弃了GPT Store。”这位开发人员吐槽道。
近期,金沙江创投主管合伙人朱啸虎在一次采访中更是直接坦言,“个人助理”(可以看作Agent的一个类型)都是技术人员的想象,都是典型的伪需求。
究竟是GPT Store不行,还是Agent不行?在AI日新月异的发展节奏中,Agent要从玩具和“概念”真正变为生产力,究竟路在何方?
一个自AI热潮兴起以来一直备受挑战的事物或许能为Agent落地提供答案,那就是低代码。
1.技术与成本的双重挑战
今天,几乎所有的科技巨头与AI创业公司都在布局Agent。IDC调研表明,50%的企业已经在某项工作中进行了Agent的试点,另有34%的企业正在制定Agent的应用计划。
“华为天才少年”、Logenic AI联合创始人李博杰是Agent创业潮中的一员,他将这些类目繁多的Agent分成了两大类:一个是有趣的AI,也就是更像人的AI;另一个是更有用的AI,也就是更像工具的AI。
去年爆火的“斯坦福AI小镇”是*个出圈的有趣的Agent系统,这是一个由25个Agent组成的虚拟世界,完完全全地模拟了真实的人类生活。
另一个“有趣的AI”是角色扮演类的Agent,这一赛道也诞生了数家AI独角兽公司,代表产品是Character.ai、Inflection的Pi、Minimax的Talkie等。
有趣的AI主要面向to C领域,而有用的AI主要面向to B领域,比如各种Copilot工具、面向个人或者企业的Agent。
如今,越来越多工具属性的Agent已经涌现。据云基础设施服务商E2B的不完全统计和分类,在编程、个人助手、生产力、HR、科学、商业智能、设计、市场营销、金融等多个细分场景都有大量的开源和闭源的Agent项目。
除了针对垂直业务场景打穿打透的Agent,还有企业从平台模式出发,打造包罗万象的智能体商店,比如OpenAI推出的GPT Store,国内企业如钉钉、智谱AI、昆仑万维也分别推出了各自的Agent平台。
长期来看,AI*的价值在于生产力的提升,也就是AI工具的属性。但目前,受限Agent系统大脑——大模型本身的性能,Agent到底能否从有趣的“AI玩具”进一步升级为有用的“AI工具”,还存在一定的挑战。
以AutoGPT查天气为例,虽然它能够自主规划、决策与执行任务,但很多时候都以失败告终,因为很多天气App的API是付费的,AutoGPT无法获取;如果是从网页读取天气数据看到的是HTML代码,AutoGPT也看不懂;如果要把网页数据转换成看得懂的文本,又会丢掉太多的网页结构信息;如果是把渲染出来的网页截图放到多模态模型里去直接识别,需要GPT-4V这种级别的模型才会比较靠谱。
在严肃的企业任务场景中,对于数据、问答的准确性有比较高的要求,哪怕有1%的错误率也是不能忍受的,这种错误率很难商用。而大模型的幻觉问题目前难以避免,如何降低幻觉带来的错误率是一个挑战。
Logenic AI联合创始人李博杰认为,目前大模型的能力只是一个入门级的水平,还远远达不到专家级,现阶段的Agent系统更像是一个干活比较快但不太靠谱的员工。
他分享过在华为听到的一个说法:“如果你是领域专家,你会觉得大模型很笨;但是如果你是领域的小白,你就会发现大模型非常聪明。”
这些挑战的根源都归结于Agent系统的大脑——也就是底层大模型的基础能力,Agent系统针对复杂任务的规划和分解任务、遵循复杂指令、自主使用工具以及减少幻觉等等,还有很大的提升空间。
Agent面临的另一个挑战,在于成本。我们都知道训练大模型需要很高的算力成本,而运行一个Agent系统所消耗的推理成本同样不低。
李博杰分享了一组数据:如果基于GPT-4做一个游戏NPC,跟玩家不停地交互,成本高达每个玩家每小时26美元,没有哪一个游戏能烧这么多钱。
更实际的问题是,对于中国的广大企业而言,除了算力成本外,更值得关心的成本在于如何在AI的道路上走出“*步”:搭建一个Agent,让它成为业务流和数据资产的入口,这需要招一个多贵的团队?
2023年,一个私有化大模型的的价格曾达到千万元级别。显然如此高昂的成本不可能在企业级场景大范围的落地。
总结来说,Agent能否变得有效、可靠与低成本,是目前遇到的核心挑战。
2.Agent低成本落地的突破口
谈到拉低成本和门槛,低代码可以说是一个被验证过的答案。靠低代码、用传统软件十分之一甚至五十分之一的成本实现数字化的故事,过去几年中并不鲜见。
那么,低代码能把AI Agent应用的成本打下来吗?
钉钉的低代码团队宜搭正在做出一些实践,并推出了“宜搭AI”——一个在低代码平台上构建AI助理的方式。
去年,在大模型与AIGC爆火之后,低代码行业“人人自危”。低代码原本是为了降低应用开发的门槛,而大模型直接连代码都可以生成,似乎有直接颠覆低代码赛道的趋势。
去年7月,钉钉还专门拉上了氚云等几家低代码厂商展开了一次讨论,专门讨论AI能否替代低代码。最后大家的一致结论是:不但不会替代,AI还给低代码插上了腾飞的翅膀。
钉钉给出的答案则是,低代码+AI,就是Agent落地的突破口。
低代码+AI构建Agent,能否真正成为企业业务有效的工具?目前,已经在一些企业和组织中落地了。
在营销领域,深圳航空营销委使用钉钉AI助理、钉钉宜搭互动卡片以及业务接口搭建了“深航AI销售帮手”,专门针对深航营销场景的痛点进行了定制化开发,解决了销售系统保障、信息触达、经营监控、销售预警、知识管理等难点。
此前,深圳航空的机票分销系统“深航销售平台”,在用户使用过程中虽然提供了培训以及使用了传统的手册和知识库,但是由于功能迭代频繁,营业部、坐席人员调整,每天仍须要通过大量人工问答获取信息,效率不高,沟通成本巨大。同时,一线销售人员需要查询订单票据信息时,需要通过登录深航销售平台系统中查询,信息同步不够及时便捷,系统中沉淀的大量数据没有*程度地发挥价值。
而“深航销帮”(深航AI销售助理)集成宜搭搭建的销售管理系统“云销平台”,打通多个内部销售相关系统,为员工触达和使用这些数据提供了非常人性化的入口:用自然语言询问“系统最近的出票时间是什么?”“近12小时出票情况如何?”等问题,这个Agent就会调用接口,实时查询,并以图表形式显示相关数据,通过Agent对接知识库解答用户的常见问题。
这个Agent还能为非系统用户提供订单票据查询等服务。销售人员无需经过系统用户中转,就可直接向AI助理提问“XXX机票/订单的出票代理人是谁?具体信息如何?”,AI助理会直接查询B2B系统的出票数据,返回所需票据信息。
另一个案例是在教育领域,浙江工商大学教务中心使用钉钉宜搭应用让全校的教务业务在线化,搭配上AI助理,教授、同学、行政老师都有了自己的专属AI秘书,以聊天的形式就能吩咐AI助理完成招生咨询、课程答疑、课程数据分析等大量工作。
例如该校推出的“智能招生AI助理”,就集成了包含学校的招生政策、专业设置、录取分数线等信息的招生知识库,学生和家长以自然语言向这个AI助理提问,如"我的分数能报考哪些专业?"助理便会结合知识库智能给出合理解答,并且能够7*24小时在线。
基于宜搭的低代码开发能力和AI识别技术,该校还开发了一个集通知发布、活动报名、反馈收集的“智能填报应用”。应用内置了AI识别能力,可以识别聊天的内容自动填充到表单。所有填报数据也会自动汇总,生成可视化报表,供辅导员和管理人员查阅。
在答疑的基础上,AI助理还能对应用内的各类数据进行智能分析。招生助理可以统计咨询问题的类型和数量等数据,智能填报应用可分析活动报名的人数和完成度等。所有数据都可以由AI自动生成报表,为管理人员的工作和决策提供直观的数据支撑。
这些都是很细微的业务场景,不但切实提升了业务效率,更重要的是盘活了企业最重要的资产,也就是数据。
更重要的是,用宜搭AI开发Agent的门槛并不高,成本也不贵。
业内确实有高成本进行Agent开发的案例。由于涉及到数据治理、训练私有化模型、交付实施等流程,成本并不低。
但如果企业已经在钉钉宜搭上开发过业务应用,其积累的业务数据已经是大模型所需的结构化数据,仅需要“一键开启”Agent能力。这个实施成本几乎可以忽略不计。
正如深圳航空营销委史炎平所言:“在AI助理搭建过程中,我们曾深入探讨并评估了多种技术手段,但是使用AI助理的一些高级功能需要一定的开发能力,这对于我们这样的非专业人员无疑构成了较高的门槛。而宜搭让我们可以通过低代码进行开发,使用AI助理的高级功能,更丰富,更智能地实现我们的业务需求。”
对于大企业的业务部门以及没有钱也没有产研人才的中小企业来说,这种“低代码+AI”一键开启Agent能力将会有很大的吸引力。
正因如此,今年1月,钉钉总裁叶军在钉钉7.5版本发布会上宣布钉钉的目标是成为低门槛、高频和开放的AI助理平台。与OpenAI推出的GPT Store类似,钉钉也宣布将在4月份推出自己的Agent Store————“钉钉AI助理市场”,并要在三年内创建1000万个AI助理。
3.打开Agent的想象空间
可能连钉钉自己都不会想到,3年前钉钉开启的低代码战略,会在AI时代迎来Agent的东风。
低代码在软件行业也曾备受争议,但经历了几年的低代码热潮之后,如今低代码本身已经有了广泛的基础,尤其是在中小企业里有非常高的普及度。
与OpenAI聚焦C端不同的是,钉钉核心定位在B端。钉钉首先是一个协同平台,Agent的突破首先在协同办公场景;其次是一个应用开平台,钉钉过去三年力推的低代码战略已经开发了1000万个业务应用,不仅能助力协同办公,还能深入到企业业务中去。
低代码的普及为AIAgent打下了良好的“系统”和“数据”基础设施。AI时代本质是在变革数据产生与数据消费的方式,Agent正在让这一切逐渐落地。
宜搭搭建的AI助理,除了具备大模型本身就有的常识理解、生成能力外,最重要的是能够默认打通企业的业务应用、业务数据和领域知识,让原有的传统应用一键享受AI助理的新入口形式和使用交互形式。
像钉钉这样在to B领域做商业智能类的Agent,毫无疑问会涉及更加复杂的数据、流程、行业Know-how,这是企业的护城河。
钉钉宜搭产品负责人邵磊告诉「甲子光年」:“企业最关心的不再是单纯的组织协同或业务协同,企业的业务数据和积累的行业知识才是他们真正的核心资产,这是完全不具备任何可替代性的。只有挖掘数据与行业知识的价值,企业才会真正发展。”
在企业服务这个to B的场景下做AI,绝大多数需求都是源自于客户本身。钉钉有着很浓厚的产品共创机制和文化。比如钉钉和一家生产制造企业共创过程中,其实是客户自身提出了围绕数据的输入和分析结合AI的众多想法。
钉钉过去三年已经基于低代码平台搭建了1000万个应用,积累了大量的结构化数据。在to B行业做AI需要高可信任性,而AI可信任性的前提就是数据的可靠性与结构化。
更进一步来看,低代码+AI推动了Agent的普及,这种人机交互式的软件开发方式有望推动软件架构的范式迁移。
比尔·盖茨就认为,Agent将彻底颠覆软件行业,将影响我们如何使用软件以及如何编写软件。
Agent范式将原本由人类主导的功能开发,逐渐迁移为以AI为主要驱动力。以大模型为技术基础设施,Agent为核心产品形态,把传统软件预定义的指令、逻辑、规则和启发式算法的任务层级演变成目标导向的智能体自主生成。这样一来,原本的架构只能解决有限范围的任务,未来的架构则可以解决无限域的任务。
未来的软件生态,不仅是最上层与所有人交互的媒介是Agent,整个产业的发展,无论是底层技术,商业模式,中间组件,甚至是人们的生活习惯和行为都会围绕Agent来改变,这就是Agent-Centric时代的开启。
低代码+AI,无疑正是推动软件平民化的一次重要尝试。