经济学人:
这对苹果这样的AI落后者可能是好消息
当科技界谈论大语言模型(LLM)进展乏力时,常以智能手机作类比。OpenAI的ChatGPT问世之初的革命性,堪比苹果2007年推出iPhone。但人工智能(AI)前沿的进展已开始变得像乏善可陈的手机升级,而非真正的突破。OpenAI的最新模型GPT-5就是明证。它引发的关注甚至低于预计将于9月9日发布的苹果最新产品iPhone 17。
生成式AI最前沿改进速度放缓,是大模型未能达到炒作预期的迹象之一。可以说更重要的信号是更小更灵活的替代模型兴起,它们正受到企业界青睐。许多公司更青睐可量身定制满足特定需求的专属模型。这些所谓的小语言模型(SLM)比全能大模型更便宜,后者如神谕般的智能可能显得多余。正如科技公司IBM的AI模型研究主管戴维·考克斯(David Cox)所言:"你的HR聊天机器人不需要懂高等物理。"
小模型不仅可像通过云服务提供商那样轻松运行在公司内部IT系统上,对AI智能体也可能更有用。这些智能体可协助或替代人类完成工作任务。更小的体量使小模型特别适合手机、自动驾驶汽车、机器人等对能效和速度要求极高的设备中的AI。如果它们持续变得更可靠,或将证明苹果等设备制造商决定不随大流斥巨资投资云端大模型是正确的。
**小即是美**
大小模型并无精确定义。区别在于训练参数量——即模型"大脑"中帮助理解数据的数值设置量。大模型参数达数千亿,小模型训练参数可能在400亿或更少,微型模型甚至少于10亿。
小模型训练方式的改进助其追赶大模型能力。小模型日益由大模型"教导",而非自行爬取网络学习。基准测试公司Artificial Analysis表示,在各种测试中,AI芯片制造商英伟达近期发布的90亿参数模型Nemotron Nano表现优于社交媒体巨头Meta4月发布的参数量大40倍的Llama模型(见图)。后来者居上正成为常态。科技市场研究公司Counterpoint的莫希特·阿加瓦尔(Mohit Agwal)指出:"如今的小模型比去年的大模型能力强得多。"
更优性能吸引了企业客户。IT预测机构高德纳(Gartner)表示,大模型的幻觉等已知缺陷已引发"用户疲劳"。企业转而需要基于行业数据精细调校的专业模型。今年,企业对此类模型的需求增速预计是大模型的两倍(尽管基数低得多)。高德纳预计未来会有更多专业模型由企业自主开发。
小模型日益受欢迎的另一原因是经济性。企业已从生成式AI初期的"不惜代价"转向更关注投资回报。虽仍可能将大模型用于多项任务,但用小模型处理离散可重复工作可节省成本。正如一位风投大佬所言,从旧金山到北京需要波音777,但去洛杉矶不需要。"用最强模型解决所有问题并不明智。"
为说明经济性,IBM的考克斯以公司产品Docling为例。该产品能将收据等PDF文档转为可存储数据,运行于仅2.5亿参数的"微型"模型。他称之为实用工具,但若用大模型运行则成本效益低下。小模型还可在更便宜的芯片上运行:最小模型可使用通用计算主力中央处理器(CPU),而非让英伟达成为全球最高市值公司的图形处理器(GPU)。这可能是重要卖点——考克斯称GPU是"总需返修的性能过剩的奢侈品"。
随着企业部署更多AI智能体,小模型或更具吸引力。英伟达研究部门6月发布的一份关注度不高的论文大胆宣称"小模型才是智能体AI的未来"。论文指出当前多数智能体由云服务商托管的大模型驱动,对AI云基础设施的大量投资表明市场假定大模型仍是智能体AI的引擎。该研究对此提出挑战,认为小模型足以处理智能体任务且更经济(例如70亿参数模型的运行成本可比大175倍的模型低10至30倍)。论文表示小模型或催生"乐高式"智能体构建模式,企业可使用小型专业专家而非单一庞大大模型智能。
英伟达高管卡里·布里斯奇(Kari Briski)表示,这份对云端智能体基础设施投资提出质疑的论文并不代表公司战略。她称企业客户需要"各种形态规模"的模型,最大模型在处理最难任务时优于小模型,且推动大模型前沿发展对提升其教导小模型的能力至关重要。
无论小模型最终是否取代大模型,异构化趋势正在兴起。全知型大模型对ChatGPT等消费级应用仍重要,但连OpenAI也在转型:GPT-5具备不同规模能力的内部模型,可根据任务复杂度调用。
随着小模型能力提升,设备端AI的口碑或随之改善。Counterpoint的阿加瓦尔预计苹果将在新品发布会上强调小模型潜力。他认为苹果的AI产品"Apple Intelligence"(部分任务由手机端小模型处理,复杂任务交由云端)可能代表未来方向。针对苹果迄今令人失望的AI表现,他表示:"并非错失良机,凭借其影响力,它总能搭上下一班船。"
目前焦点仍停留于大模型。尽管微软和谷歌等云巨头已开发极小模型,但基于现状将持续的信念,它们仍投入巨资建设数据中心训练和托管最大模型。这可能是短视的。鉴于小模型的相对优势,苹果的缓行策略长远来看或将被证明是合理的。
评论
发表评论