时隔不到十天,OpenAI继GPT-4后,再放出重磅消息。
就在今日,OpenAI宣布在ChatGPT中实现了对插件的初始支持,帮助ChatGPT访问最新信息、运行计算或使用第三方服务。
与此同时,OpenAI亲自上阵提供了两款插件:网络浏览器和代码解释器。此外,OpenAI还开源了知识库检索插件的代码,由任何开发人员自行托管,提供他们希望增强ChatGPT的信息。
简单来说就是,ChatGPT终于“联网”了,也可以通过第三方插件,在衣食住以及工作、学习等方方面面更好地为用户提供服务。
需要注意的是,现在仍是“Alpha阶段”,OpenAI将从候补列表中将插件逐步开放,最初将优先考虑少数开发人员和ChatGPT Plus用户。
但是,OpenAI“更大规模地开放”,将只是“时间的问题”。
如果说ChatGPT是AI的“iPhone时刻”,那么就在今天,它又亲手搭建起了“App Store”。
01 终于“联网”,NewBing尴尬了?
此前,ChatGPT的训练数据库仅更新至2021年,GPT-4的训练数据也只追踪到2021年9月。
而在今天,OpenAI亲自下场推出了“网络浏览器”插件,这一“缺憾”将不复存在。
OpenAI表示,“在WebGPT、GopherCite、BlenderBot2、LaMDA2等一系列工作的激励下,允许语言模型从互联网上阅读信息,这将严格地扩大其可以讨论的内容量,从培训语料库直到当下的新鲜信息。”
以近期热点,第九十五届奥斯卡颁奖典礼为例。此前,ChatGPT会礼貌地指出,其训练数据没有包含足够的信息来让它回答。
如今在“网络浏览器”的支持下,ChatGPT就可以检索有关最新奥斯卡的最新信息,然后进行了一番熟悉的ChatGPT诗歌表演,浏览成为了一种附加体验的方式。
需要注意的是,上述插件只支持GET请求,不支持POST。也就是说,用户使用这一插件的范围只限定在检索信息,并不包括“事务性操作”,比如表单提交。
同时,OpenAI的“浏览”使用必应搜索API从网络中检索内容。得益于此,ChatGPT也继承了微软在信息的来源可靠性和真实性以及防止检索有问题内容的“安全模式”方面的大量工作。此外,该插件在独立服务器中运行,因此ChatGPT的浏览活动将与基础设施的其他部分分开。
虽说OpenAI与微软关系匪浅,微软也将ChatGPT整合至Bing搜索引擎,推出了NewBing。截至3月20日的数据显示,微软NewBing以来,必应上的页面访问量增长了15.8%,而谷歌搜索引擎的访问量下降了近1个百分点。
但是,伴随“网络浏览器”插件的发布,NewBing的使用频率自然也会受到影响。无需过分担心,微软早有准备。
微软早在一周前就宣布将通过Microsoft 365 Copilot,植入GPT-4模型。据瑞士信贷估计,如果微软3.7亿商用Office 365用户中的10%升级为AI增强的版本,那么未来5年将可以产生149亿美元收入。
02 解数学题、数据可视化、格式转换,更多用途待挖掘
除了“网络浏览器”插件,OpenAI亲自推出的另一款插件为“代码解释器”。
具体而言,OpenAI在沙盒化、防火墙的执行环境中为模型提供了一个工作的Python解释器,以及一些临时的磁盘空间。
由解释器插件运行的代码会在持续会话中进行评估,并且后续调用可以相互构建。目前,该功能支持将文件上传到当前对话工作区并下载工作结果。
目前,OpenAI从最初的用户研究中,确定了使用代码解释器特别有用的例子:解决定量和定性等数学问题、进行数据分析和可视化、在格式之间转换文件。
在相关演示视频中,OpenAI主要演示了三部分内容:通过函数来生成与修改图表;解析CSV文件内容,并获取、分析表格数据、生成可视化图表;上传图片,动态调整图片大小、灰度、色调,并生成下载链接。
不过,OpenAI也表示,这一代码解释器主要还是提供计算机的一些最基本的功能,为一些初级程序员和爱好者提供更顺畅的接口。
后续,伴随使用者的增加,这款代码解释器的更多用途功能,也将逐步被挖掘出来。
而在“安全性”方面,将ChatGPT模型连接到编程语言解释器的首要防范措施是对执行进行适当的沙盒处理,以便AI生成的代码不会在现实世界中产生意外的副作用。OpenAI会在安全环境中执行代码,并使用严格的网络控制来防止外部互联网访问执行代码。此外,OpenAI对每个会话都设置了资源限制。
除了设置沙盒,保障隔离之外,OpenAI还联合内外部人员进行了多次红队演练,确保插件开发者不会进行prompt注入、发送诈骗和垃圾邮件、绕过插件防御系统来安装后门程序等行为。
03 衣食住行用全能,打造类“App Store”AI生态
在GPT-4发布时,除了性能的提升,OpenAI就表示已经有多家公司将GPT-4搭载到他们的产品中。
包括:语言学习工具软件多邻国(Duolingo)、帮助视障用户的软件Be My Eyes、移动支付公司Stripe、国际性金融服务公司摩根士丹利(Morgan Stanley)和可汗学院(Khan Academy)。
此外,OpenAI还公布了GPT-4与冰岛政府合作的服务场景。
如果说上述“落地”是对外赋能,相当于为他人做嫁衣。
那么,OpenAI推出插件功能,就相当于内生性升级,以海纳百川的姿态,最终形成庞大的生态。
目前,OpenAI首批开放可使用的第三方插件包括Expedia(旅行)、FiscalNote、Instacart(购物)、KAYAK(航班住宿出行)、Klarna、Milo、OpenTable(餐饮与外卖)、Shopify、Slack、Speak、Wolfram、Zapier。
需要注意的是,Zapier是无代码自动化的*——与来自谷歌、Salesforce和微软等合作伙伴的五千多个应用程序集成。
作为一款自动化工具,Zapier可以帮用户创建自动化的工作流,帮你连接你的应用、软件&各种服务。Zapier的整体理念就是通过触发条件&执行条件来创建自动化的命令,“如果这个条件触发了,那么就执行这个动作”。
而这也意味着,ChatGPT的体检将会更便捷、更丝滑。
外界普遍认为,ChatGPT插件系统的上线,就如同苹果开放App Store一样。而OpenAI也正通过此举,建立起自己的AI生态帝国。
对于开发者来说,ChatGPT插件若能像App Store那样增加“付费”机制,也将会是“双赢”的局面。
OpenAI创始人Sam Altman表示,“您可以安装插件来帮助完成各种各样的任务,我们很期待看到开发者创造了什么!”