再次炸天的 OpenAI,大模型生态初现
再次炸天的 OpenAI,大模型生态初现
图片来源 @视觉中国
文 | 光锥智能,作者 | 郝鑫,编辑 | 刘雨琦
不出意外地,OpenAI 的首届开发者大会,让人特别意外。
一夜醒来,大模型圈一只脚踏入了 Agent 的世界,另一只脚则踏入 GPT Store 生态的河流中。
美东时间 11 月 6 日,OpenAI 开发者大会正式开启,创始人兼 CEO 山姆 · 奥特曼站在台上,45 分钟的密集输出,再次展示了什么叫 " 遥遥领先 "。
我们先简单回顾一下这场发布会的所有重点,其实无非就是三件事:
一是技术能力:GPT-4 Turbo 升级了 6 大新能力,包括 128K 的上下文长度、更强的控制能力,模型的知识升级、多模态能力(语音和 CV)、模型微调定制和更高速率的限制,性能升级的同时,还对 API 调用的价格进行了下调;
二是可复制的能力:从原来的 GPT 到 GPTs,用户可以打造专属于自己的 GPT 助手,企业可通过 OpenAI 提供的全套工具链 "all tools" 在企业内部建设有价值的工具,同时也可以深入让 GPTs 进化为一个个 Agents,为智能体做准备;
三则是生态能力:企业不仅可以打造 GPTs,更能将其上架在市场内,即 GPT Store,可分享给其他用户使用,以及获得分成,类 App Store 的商业生态由此为出发点。
正如网易有道 CEO 周枫所言," 这次模型上主要是性能和成本的优化,而在应用和生态方面,做了很多 LangChain(开发工具链),LlamaIndex(开发数据框架)这些项目类似的工作,最终就是要实现以智能体作为 AI App 的愿景。"
总之,OpenAI 提供的生态能力解决了当下大模型发展的几个重要难点,而在此之上,大模型的应用层将迎来进一步爆发。
" 很兴奋,还有很多信息在消化。"
OpenAI 发布之后,光锥智能在与多位国内知名大模型创业者交流中,也感受到了大家对行业前景的期待,"OpenAI 的多模态能力开放,对开发者是很大的利好,可以做的事情的边界得到进一步拓展,我预计会有很多新的玩法出现。" 月之暗面创始人杨植麟对光锥智能称。
这 45 分钟,为大模型火箭的二级爆发,再次添加燃料。
让大模型,飞入寻常百姓家
" 有需求,打造生态,找落地。"OpenAI 首届开发者大会结束后,某家国内大模型明星公司 CEO 对光锥智能发表了极为简短,却信息量极大的点评。
市场对 ChatGPT 的需求,无疑是巨大的。在发布会的开始,奥特曼报告了 OpenAI 平台和产品的一些数据,截至目前,已经有大约 200 万开发人员在其 API 上构建各种各样的应用,超过 92% 的全球 500 强企业正使用其产品,ChatGPT 的周活跃用户达到大约一亿。
自 GPT3.5 问世到现在,每一次的升级都引领着大模型的下一个技术方向,不过,这次 OpenAI GPT-4 升级后的 Turbo 版本更像是查漏补缺。
首先是更长的上下文本长度,GPT-4Turbo 上下文任务长度扩展至 128K,相当于一本书的 300 多页,是 GPT-4 支持的 8K 上下文的 16 倍。不仅如此,奥特曼还强调在扩展文本长度的同时,还应该保持模型的准确性。
其次是弥补 OpenAI 一直以来的短板——安全可控和知识库更新速度。针对前者,推出了名为 Json Mode 的新功能,确保开发人员更容易调用 API,提升对模型输入和输出的控制;即将推出 "Copyright Shield"(版权保护)功能,若其企业和 API 用户面临版权侵权诉讼,OpenAI 将为其承担相应费用。针对后者,OpenAI 平台支持用户导入文档、数据库来更新大模型的认知,同时还将新升级后的 GPT-4Turbo 认知理解更新到了 2023 年 4 月。
最后,此次更新中,OpenAI 的多模态能力开放进入到了一个全新的阶段。上一个时期,OpenAI 用了一年多的时间,实现了 ChatGP 能说、能看、能听,而现在才到了多模态能力释放的节点。DALL-E3、文生语音模型 TTS(text-to-speech)、Whisper V3 都将通过 API 的形式开放给开发者使用。
能力升级之后,为了让更多的开发者用起来,还做了一个大降价。
奥特曼表示,不断有开发者来向其抱怨,GPT-4 定价太贵,也正是基于此,OpenAI 这回干脆来了个大模型降价促销。
降价后的 GPT-4Turbo 输入 token 价格是 GPT-4 的三分之一,输出 token 价格是原来的二分之一;GPT-3.5Turbo 4K 精调版本输入 token 价格是此前的三分之一,输出 token 价格是原来的二分之一;GPT-3.5Turbo 16K 精调版本输入 token 价格是之前的四分之一。
正如奥特曼所言开发者的需求是驱动 OpenAI 降价的根本原因,这背后还有技术、商业等多重因素。
从技术降本看,根据外媒爆料,OpenAI 此次可能将 Stateless API 变为 Stateful API,奥特曼此前曾表示,基于 Stateful API,用户不用再 " 重复一遍一遍地为同样的历史对话付费 ",理论上 Stateful API 形式可将大模型应用的开销削减为原来的二十分之一。
在商业上,OpenAI 也一直在寻找突破点,从 API、ChatGPT 个人版再到企业版,一直在探索商业化。但其对手却未给喘息的机会,微软、Salesforce、开源生态主导者 Meta 都在以更具性价比的方式,背后 " 偷袭 "OpenAI,商业化的紧迫感与日俱增。
OpenAI 降价的背后,也代表着国外大模型已经进入到了普惠化、追求高性价比的新时期。
对初创企业、开发者而言是落地的机会,对 OpenAI 这类公司也是挑战,由降价而带来的或许是技术能力、资源分配、算力等多方面的挑战。
" 在综合考量后,我们优先考虑了价格,但速度却不能同时兼得,这将是接下来研究的重点 ",奥特曼道。
据多名使用 GPT-4 开发工具的技术人员称,GPT-4 速率限制已经开始加倍。
" 算力应该还好,OpenAI 储备足够多 ",杨植麟对此发表了意见。
为创业者提供 " 筑梦 " 工具
光锥智能在与多位大模型创业者交流过程中发现,很多创业者不是缺乏好点子和创业想法,而是受困于数据、算力、工具、部署、训练、推理等一个个的技术难题。
比如,知乎上一位基于大模型开发的对话解谜小游戏的开发者,就因为游戏用户数量远超预期,导致算力不足而被迫关闭了整个游戏,留给玩家的只有一片遗憾和不舍。
同样在国内,创业者们不是不知道 Agent 是未来的创业方向,而是心有余力不足。一位 Agent 创业者告诉光锥智能," 数据清洗、长文本记忆、代码编写、运行测试、部署落地、成本等等九九八十一难,关关难过,关关卡死每一个创业公司 "。
据光锥智能了解,无论国内外,Agent 离落地还差得很远,目前比较确定的场景可能是 Code Agent。原因在于,编码本身就属于大模型训练推理和 Agent 执行任务的一环,距离最近,改造也越容易。
而现在,OpenAI 发布的 all tools 工具、assistant API(助手 API)则有希望使上述这些问题迎刃而解。
assistant API 是 OpenAI 专门为 AI Agent 开发者量身打造的工具助手,涵盖了长线程(Threading)、知识库(Retrieval ) 、代码解释器(Code interpreter)、函数调用(Function calling)几项工具。
持久且无限长的线程,允许开发人员将线程状态管理移交给 OpenAI 并解决上下文窗口约束;支持检索功能,利用模型之外的知识来增强,例如专有领域数据、产品信息或用户提供的文档;支持代码解释器功能,与 ChatGPT Plus 中一样,可以在沙盒执行环境中编写和运行 Python 代码,生成图形和图表,并处理具有多种数据和格式的文件;函数调用功能也迎来更新,现在可以一次性调用多个函数,并把响应合并到消息输出中。
总而言之,这些新功能精准切中了开发者们卡脖子的痛点,在 OpenAI 打造的全流程工具链上开发运行,将降低研发的门槛,缩短研发、测试周期,同时节省人力成本。
" 我们对 OpenAI 又爱又恨,一方面它升级的工具有可能一瞬间让我们的业务跑通,但另一方面,我们也得时刻警惕被 OpenAI 取而代之 ",一位 Agent 创业者道。
让我们聚焦这次发布会的主角—— "Agent"。奥特曼给 Agent 下的定义为,人们利用工具、AI 来建立更个人化和定制化的分身,这些分身可以代表个人做很多事情。用户只需询问计算机所想要的东西,Agent 分身就能替你完成所有任务。
光锥智能梳理 OpenAI 做 Agent 思路后发现,Agent 不是凭空而来,一切都基于 GPT 的大模型,在大模型基础上先是长出了 GPT 的分身 "GPTs",而后才是 "AI Agent"。
" 在 OpenAI,我们一直笃定渐进的、迭代的部署是解决安全问题的最佳方式,即人工智能的安全挑战。我们认为谨慎对待面向未来 Agent 尤为重要,这需要大量的技术工作以及关于社会的深思熟虑,所以我们正在迈出通往未来的一小步—— GPTs",奥特曼表示道。
OpenAI 通向未来 Agent 之路已初现雏形,正如其所言," 这还只是通向 AI Agents 迈出的第一步 ",未来也许是多模态、多智能体。
初建大模型生态
技术的迭代固然让人兴奋,工具的推出也让开发者们更加方便快捷,但更重要的是,OpenAI 凭借一己之力,让大模型的商业化进一步落地。
早在今年 5 月,OpenAI 开放插件系统后,首批上线了 70 个大模型相关的应用,包括猜词、翻译、查找股票数据等等工具,彼时便有人预测到,大模型的 App Store 来了,但后期应用逐渐增加,却并没有跑出 " 爆款级 " 应用。
有投资人认为:现在的 GPT Store 很像刚刚面世时的小程序,处于能力逐步补齐中,此次升级便是逐渐走向成熟的象征,下一个微信或者抖音,很有可能在此诞生。
此次发布会中,OpenAI 重新梳理了应用商店的体系,小幅调整了页面布局,将 ChatGPT 变成了与第三方应用并列的应用层级,并将开发范围扩大到了一个全新的范畴,按照奥特曼的说法,每一个 GPT 像是为 ChatGPT 的一个特殊目的,而量身定制的版本。
但让人更为兴奋的是,参考苹果 App Store,用户可在 GPT Store 中搜索下载 GPT 应用,商店也将推荐生产力、教育和好玩等类别的优质产品,OpenAI 也明确了创建者可根据自有 GPT 的适用人数进行分成。这意味着,基于大模型的应用有了 " 容器 ",开发者找到了买卖的 " 市场 "。
举个简单的例子:大模型本身一块块地皮,工具箱是锤子钉子,不同的开发者将盖不同房子,GPT Store 则是一个房地产市场,也就是说,盖出来房子不仅能自用,还能租出去和卖出去。
有了商业化的 " 交易场 ",创业者们就有了正反馈,这使得创业不再只靠激情和梦,而是拥有了现实收益的可能。
这或许也正是大模型创业者所言的 " 找落地 ",上半年的 AI 创业离不开两个字 " 烧钱 ",5000 万的融资金额对大模型创业而言简直是 " 沧海一瓢 ",投资人不敢出手,创业者们也讲不出新故事。
在现场,OpenAI 的工作人员展示了 OpenAI 搭建的一款旅游 GPT 的用法:它不仅能列出巴黎旅游建议,还能在地图上将计划中提到的地点按类别标记起来,而这完全可以对用户收费或者进行会员制。
虽然,这并不代表每一个登陆了 GPT Store 的应用都能赚到钱,但至少有一个窗口可以获得第一批种子用户,从而反哺产品进步,形成增长飞轮。
参考移动互联网应用爆发的年代,每一个细分领域创业者都能挖掘出无数的需求形成应用,这或许也正是创业者们为之兴奋的原因。
这时,才按下了所有 APP 重新做一遍的启动键。
" 我们相信,AI 会以一种前所未见的规模,予以个体和机构新的能力。这也将把整个人类提升到我们前所未见的规模 ",奥特曼在结尾时提到。
显然,OpenAI 想做的,还有更多。基础设施已经初步搭建完毕,剩下的,就是等时间和生态的其他角色,来开花结果。
-
- 全网震撼!韩击剑皇后被女人骗婚,自曝同房后竟“怀孕”两次:肚子都鼓起来了
-
2023-11-10 22:17:18
-
- 寺庙数字化,一个没有坏账的赛道
-
2023-11-10 22:15:02
-
- 美国出口禁令之下,“天价芯片”流入黑市
-
2023-11-10 22:12:46
-
- 外媒:已有数千人在排队等候植入 Neuralink 的“人脑芯片”,2030 年手术量将
-
2023-11-10 22:10:30
-
- 医生边查百度边看病?医院:正在调查
-
2023-11-10 10:46:12
-
- 火行业包括哪些生意(五行属火行业有哪些热门生意)
-
2023-11-10 10:43:57
-
- 隐私保护应用 DoNotSpy11 更新:支持 Win11 23H2,可禁用 Copilot 等
-
2023-11-10 10:41:41
-
- 属蛇是哪年出生的(属蛇的名人伟人有哪些)
-
2023-11-10 10:39:25
-
- 潜逃 30 年,一命案嫌疑人落网
-
2023-11-10 10:37:09
-
- 地理科学考公务员有哪些职位(地理科学考公务员属于什么大类)
-
2023-11-10 10:34:53
-
- 车主称 Model Y 刹车变硬 差点撞车:售后花 7 千换了刹车助力总成
-
2023-11-10 10:32:37
-
- 苏北是指哪些地方(苏北和苏南怎么划分)
-
2023-11-10 10:30:21
-
- 苹果 M3 芯片 GPU 跑分曝光:比 M2 高 9%
-
2023-11-10 10:28:06
-
- 消息称特斯拉 Model Y 国内将再次涨价,官方暂未回应
-
2023-11-10 10:25:50
-
- 绿柱石是什么宝石(绿柱石家族有哪些宝石)
-
2023-11-09 10:32:40
-
- 春天的节气有哪些(盘点春天的6大节气)
-
2023-11-09 10:30:24
-
- 十大无氧运动有哪些(十种简单无氧运动)
-
2023-11-09 10:28:08
-
- 水玻璃的作用与功效(水玻璃用途有哪些)
-
2023-11-09 10:25:52
-
- 双扬声器的手机有哪些(双扬声器的优缺点)
-
2023-11-09 10:23:37
-
- 保守力有哪些(保守力是什么意思)
-
2023-11-09 10:21:21