经济学人:
就在美国科技巨头斥巨资打探竞争对手专有人工智能(AI)模型秘密的同时,中国正在上演另一场较量。斯坦福大学的AI专家吴恩达(Andrew Ng)最近称之为中国更开放的大语言模型(LLM)构建者之间"达尔文式的生死搏斗"。它们的竞争热情应当给西方敲响警钟。
今年1月,中国初创企业深度求索(DeepSeek)免费提供了一款以极低成本开发出的先进AI模型,震惊了全球股市。自那以来,阿里巴巴等中国企业开发的模型继续悄然在海外获得关注。当创业者走进美国大型风投公司安德森-霍洛维茨(Andreessen Horowitz,简称a16z)的办公室时,如今他们的初创企业很可能正在使用中国制造的AI模型。a16z的合伙人马丁·卡萨多(Martin Casado)表示:"我会说有80%的可能性他们在使用中国的开源模型。"
严格来说,中国擅长的是开放权重模型。与公开分享源代码供任何人修改的开源软件不同,大多数非专有大语言模型只提供它们在训练过程中习得的数值参数(即"权重"),而不提供源代码或底层数据。但不管你怎么称呼它们,在今年的各种智力测试中,中国发布的模型表现优于Meta等美国公司发布的类似开放模型。此外,它们的能力正在逼近最优秀的专有模型。
ChatGPT的开发企业OpenAI证明了这带来的压力。2010年代中期,它推广了更开放的AI开发方法(它的名字OpenAI即由此而来),但为了赚钱和防止日益强大的AI被滥用,它在2020年转向只销售专有大语言模型。然而最近,它发现客户对开放权重模型(包括来自中国的模型)的使用有所增加,因此也想加入这场竞争。本月,它发布了自2019年以来的首款开放权重语言模型,名为gpt-oss。
使用小写字母命名耐人寻味。该模型相对较小。同一周,OpenAI发布了备受期待但令人失望的最新专有模型GPT-5。这样的时间安排让OpenAI对开放性的拥抱显得三心二意。其他美国公司的努力可能也是如此。总部位于西雅图的非营利组织艾伦人工智能研究所(Allen Institute for AI)的阿里·法哈迪(Ali Farhadi)表示,中国企业全力以赴,公开发布它们最优秀的模型,而美国企业则把"光鲜亮丽的新东西"作为专有模型。"尽管我们大家都很难接受,但我认为我们现在(在开放权重方面)落后了,"他说。
就连Meta也印证了这一观点。它曾因开放Llama并广泛提供而受到开源界的广泛赞誉。但其老板马克·扎克伯格(Mark Zuckerberg)现在专注于构建所谓的超级智能。他表示,未来他的公司对于选择开放什么会更加谨慎。
从商业角度来看,这有多重要?毕竟,美国专有模型产生的收入远远超过中国开放权重模型的收入。前者的估值——OpenAI的估值高达5000亿美元——让后者相形见绌;阿里巴巴的总市值仅为2850亿美元。从专有模型中赚钱更容易,而且收益可以再投资于创新。
然而,开源并非只是失败者的游戏。开放权重大语言模型平台Together AI的联合创始人Percy Liang表示,与专有技术相比,开放权重模型刺激了不同形式的应用。公司、政府和研究人员可以更轻松地将它们适配到个别使用案例的"各个角落",并帮助用户在场内运行AI工具,而不必依赖云端。它们仍然可以通过辅助服务(包括定制化支持)赚钱。
换言之,在美国实验室押重注于通过推动智能前沿来创造财富的同时,它们在开放权重模型领域的中国竞争对手更专注于鼓励AI的应用。如果它们取得成功,深度求索带来的震撼可能只是个开始。
评论
发表评论