跳至主要内容

deepseek:中国的人工智能产业几乎赶上了美国

经济学人:

9月,美国公司 Open AI发布了世界上第一个“推理模型”,这是一种先进的人工智能。该模型名为 o1,它使用“思维链”来解答科学和数学难题,将问题分解为组成步骤,并在后台测试各种方法,然后向用户呈现结论。它的发布引发了一场效仿此方法的竞赛。谷歌于 12 月推出了一种名为“双子闪电思维”的推理模型。几天后, Open AI推出了 o3,这是 o1 的更新版本。

图表:经济学人

但事实上,拥有众多资源的谷歌并不是第一家模仿 Open AI 的公司。在 o1 推出后不到三个月,中国电子商务巨头阿里巴巴就发布了新版 Qwen 聊天机器人Q w Q,具有相同的“推理”能力。该公司在一篇华丽的博客文章中问道:“思考、质疑和理解意味着什么?”并附上了该模型免费版本的链接。另一家中国公司 DeepSeek 在那之前一周发布了一款名为R 1 的推理模型的“预览版”。尽管美国政府竭力遏制中国人工智能产业的发展,但两家中国公司已在短短几周内将美国同行的技术领先优势缩小到最小。

中国公司不仅在推理模型方面处于领先地位:去年 12 月,DeepSeek 发布了新的大型语言模型 ( LLM ),这是一种分析和生成文本的人工智能。v3 大小接近 700 GB,大到无法在专业硬件上运行,并且有 6850 亿个参数,这些单独的规则组合起来构成了模型的神经网络。这使得它比以前免费下载的任何模型都要大。Facebook 母公司 Meta 的旗舰 LLM Llama 3.17 月发布,只有 4050 亿个参数。

DeepSeek 的LLM不仅比许多西方同行规模更大,而且更优秀,只有谷歌和 Open AI 的专有模型可以与之匹敌。人工智能编码平台Aider 的创始人 Paul Gauthier在他的编码基准测试中运行了新的 DeepSeek 模型,发现除了 o1 本身之外,它胜过所有竞争对手。众包聊天机器人排名L msys 将其排在第七位,高于任何其他开源模型,也是除谷歌或 Open AI以外的公司制作的最高排名(见图表)。

龙之崛起

如今,中国人工智能的质量已与美国竞争对手非常接近,Open AI的老板山姆·奥特曼 (Sam Altman) 不得不解释差距之小。DeepSeek 发布 v3 后不久,他不耐烦地发推文说:“复制你知道行得通的东西(相对)容易。当你不知道它是否会行得通时,去做一些新奇、冒险且困难的事情就极其困难了。”

中国的人工智能行业最初看起来是二流的。这可能部分是因为它不得不应对美国的制裁。2022 年,美国禁止向中国出口先进芯片。领先的芯片制造商英伟达不得不为中国市场设计特别降级的产品。美国还试图阻止中国发展在国内生产顶级芯片的能力,禁止出口必要的设备,并威胁对可能有帮助的非美国公司进行处罚。

另一个障碍是本土的。中国公司迟迟没有开始LLM课程,部分原因是出于监管方面的担忧。他们担心审查者会对可能“产生幻觉”并提供不正确信息或更糟的是发表政治危险言论的模型做出反应。搜索巨头百度多年来一直在内部试验LLM课程,并创建了一个名为“ ERNIE ”的课程,但一直犹豫是否要向公众发布。即使 Chat GPT的成功促使它重新考虑,它最初也只允许通过邀请访问ERNIE机器人。

最终,中国当局出台了促进人工智能产业发展的法规。尽管他们呼吁模型制作者强调内容合理,并坚持“社会主义价值观”,但他们也承诺“鼓励生成式人工智能的创新发展”。新闻网站 TechTechChina 的编辑 Vivian Toh 表示,中国寻求全球竞争。阿里巴巴是首批适应新的宽松环境的公司之一,推出了自己的法学硕士学位,最初名为“统一钱文”,后来简称为“Qwen”。

在一年左右的时间里,阿里巴巴推出的产品并没有什么让人兴奋的地方:一个基于 Meta 开源 Llama LLM的相当平淡无奇的“分支”。但在 2024 年,随着阿里巴巴连续发布 Qwen 的迭代,质量开始提高。一年前,当阿里巴巴发布了一个能够分析图像和文本的 Qwen 版本时,西方人工智能实验室 Anthropic 的杰克·克拉克 (Jack Clark) 说:“这些模型似乎可以与西方领先实验室开发的非常强大的模型相媲美。”

包括腾讯和华为在内的中国其他互联网巨头也在构建自己的模型。但 DeepSeek 的起源不同。阿里巴巴发布第一个 Qwen 模型时,它甚至还不存在。它源自 High-Flyer,这是一家 2015 年成立的对冲基金,旨在利用人工智能在股票交易中获得优势。进行基础研究帮助 High-Flyer 成为该国最大的量化基金之一。

但 High-Flyer 创始人梁文锋表示,其动机并非纯粹出于商业目的。他观察到,Open AI的首批支持者并不寻求回报;他们的动机是“追求使命”。2023 年 Qwen 推出的同一个月,High-Flyer 宣布也将加入创造人类级人工智能的竞赛,并将其人工智能研究部门拆分为 DeepSeek。

和 Open AI之前一样,DeepSeek 承诺开发人工智能是为了公众利益。梁先生表示,该公司将公开其大部分训练结果,以防止该技术被少数个人或公司“垄断”。与被迫寻求私人资金来支付不断膨胀的训练成本的 Open AI不同,DeepSeek 一直可以使用 High-Flyer 庞大的计算能力储备。

DeepSeek 庞大的llm不仅因为规模而引人注目,还因为其训练效率而引人注目,即模型从数据中推断出其参数。剑桥大学的 Nic Lane 表示,这一成功并非源于单一的重大创新,而是一系列微小的改进。例如,训练过程通常使用四舍五入来简化计算,但在必要时保持数字精确。服务器群经过重新配置,使各个芯片能够更有效地相互通信。在模型训练完成后,它会根据推理系统 DeepSeek R 1 的输出进行微调,学习如何以更低的成本模仿其质量。

得益于这些创新和其他创新,计算出 v3 的数十亿个参数仅花费了不到 300 万个芯片小时,估计成本不到 600 万美元——约为 Llama 3.1 所需计算能力和费用的十分之一。v3 的训练只需要 2,000 个芯片,而 Llama 3.1 使用了 16,000 个芯片。而且由于美国的制裁,v3 使用的芯片甚至不是最强大的。西方公司似乎在芯片方面越来越挥霍:Meta 计划使用 350,000 个芯片建立一个服务器场。特斯拉前人工智能主管 Andrej Karpathy 说,就像 Ginger Rogers 穿着高跟鞋倒着跳舞一样,DeepSeek让“以极低的预算”训练前沿模型“看起来很容易”。

该模型不仅训练成本低廉,运行成本也更低。DeepSeek 比同行更有效地将任务拆分到多个芯片上,并在前一个步骤完成之前开始下一步。这使得它能够让芯片以满负荷工作,几乎没有冗余。因此,今年 2 月,当 DeepSeek 开始让其他公司创建使用 v3 的服务时,其收费将不到 Anthropic 使用其法学硕士Claude 收费的十分之一。“如果这些模型确实具有同等质量,那么这将是正在进行的法学硕士价格战中一个戏剧性的转折,”人工智能专家 Simon Willison 说。

DeepSeek 对效率的追求并未止步于此。本周,在发布完整版R 1 的同时,该公司还发布了一系列更小、更便宜、更快的“精简版”变体,这些变体几乎与大型版本一样强大。这模仿了阿里巴巴和 Meta 的类似版本,再次证明了它可以与业内巨头相媲美。

龙之道

阿里巴巴和 DeepSeek 还以另一种方式挑战最先进的西方实验室。与 Open AI和谷歌不同,中国实验室跟随 Meta 的脚步,在开源许可下提供他们的系统。如果你想下载 Qwen AI并在其基础上构建自己的程序,你可以——不需要特定的许可。这种宽容与非凡的开放性相匹配:这两家公司每当发布新模型时都会发表论文,详细介绍用于提高其性能的技术。

当阿里巴巴发布Q w Q(代表“Questions with Qwen”)时,它成为世界上第一家在开放许可下发布此类模型的公司,任何人都可以下载完整的 20 GB 文件并在自己的系统上运行它,或者将其拆开以查看其工作原理。这是一种与 Open AI截然不同的方法,后者隐藏了 o1 的内部工作原理。

概括而言,这两种模型都采用了所谓的“测试时计算”:它们不是在模型训练期间集中使用计算能力,而是在回答查询时消耗比前几代LLM更多的资源。这是心理学家丹尼尔·卡尼曼 (Daniel Kahneman) 所说的“第二类”思维的数字版本:比快速而本能的“第一类”思维更慢、更慎重、更具分析性。它在数学和编程等领域取得了令人鼓舞的成果。

如果有人问你一个简单的事实问题——比如说,法国首都在哪里——你可能会用脑子里想到的第一个词来回答,而且很可能是正确的。典型的聊天机器人的工作方式大致相同:如果它的语言统计表示给出了压倒性受欢迎的答案,它就会相应地完成句子。

但如果你被问到更复杂的问题,你往往会以更结构化的方式思考。当被问到法国人口第五多的城市时,你可能会先列出一长串法国大城市名单;然后尝试按人口对它们进行排序,最后才给出答案。

o1 及其模仿者的诀窍是引导法学硕士 (LLM)进行相同形式的结构化思考:系统不会脱口而出脑海中最合理的答案,而是将问题分解并逐步找到答案。

但 o1 会将自己的想法保留给自己,只向用户透露其流程摘要和最终结论。Open AI为这一选择提供了一些理由。例如,有时模型会考虑是否使用攻击性词语或透露危险信息,但最终决定不这样做。如果其全部推理被公开,那么敏感材料也会被公开。但模型的谨慎也使其推理的精确机制对潜在的模仿者隐藏起来。

阿里巴巴没有这样的顾虑。如果让Q w Q解决一道棘手的数学题,它会愉快地详细描述它的每一步,有时会在尝试各种方法解决这项任务时自言自语数千字。“所以我需要找到 2019 8 + 1 的最小奇数素因数。嗯,这似乎很大,但我想我可以一步一步地分解它,”模型开始说道,生成了 2,000 字的分析,然后正确地得出结论,答案是 97。

阿里巴巴的开放并非巧合,Poolside 联合创始人 Eiso Kant 表示,Poolside 是一家总部位于葡萄牙的公司,为程序员开发AI工具。他指出,中国实验室正在与其他行业争夺人才。“如果你是一名考虑出国的研究人员,西方实验室有什么不能给你的?我们再也不能公开我们的东西了。由于竞争的性质,我们将一切都锁起来。”Kant 先生说,即使中国公司的工程师不是第一个发现某项技术的人,但他们往往是第一个发表该技术的人。“如果你想看到任何秘密技术的出现,请关注中国开源研究人员。他们发表了所有内容,并且做得非常出色。”Lane 先生指出,v3 发布时发表的论文列出了 139 位作者的名字。这样的赞誉可能比在美国实验室默默无闻地工作更有吸引力。

美国政府决心阻止先进技术流入中国,这也让在美中国研究人员的日子不好过。问题不仅在于旨在保密最新创新成果的新法律带来的行政负担。而且,人们常常弥漫着一种模糊的怀疑气氛。甚至在社交场合,间谍指控也层出不穷。

大佬

在中国工作也有缺点。例如,向 DeepSeek v3 询问台湾的问题时,模型会愉快地开始解释台湾是东亚的一个岛屿,“正式名称为中华民国”。但在它写了几句类似的话后,它就停下来,删除了最初的答案,而是简短地建议说:“我们聊点别的吧。”

中国实验室比政府更透明,部分原因是他们希望创建一个以人工智能为中心的企业生态系统。这具有一定的商业价值,因为基于开源模型构建的公司最终可能会被说服从其创造者那里购买产品或服务。这也给中国带来了战略利益,因为它在与美国的人工智能冲突中创造了盟友。

中国公司自然更愿意以中国模型为基础,因为这样他们就不必担心新的禁令或限制会切断他们与底层平台的联系。他们还知道,他们不太可能违反西方模型不会考虑的中国审查要求。上海的科技投资者 Francis Young 指出,对于像苹果和三星这样渴望将人工智能工具融入其在中国销售的设备中的公司来说,本地合作伙伴是必不可少的。甚至一些海外公司也有使用中国模型的具体原因:Qwen 刻意融入了乌尔都语和孟加拉语等“资源匮乏”语言的流利性,而美国模型则主要使用英语数据进行训练。此外,中国模型的较低运行成本也具有巨大的吸引力。

这并不一定意味着中国模式将席卷全球。美国人工智能仍然具有中国竞争对手无法比拟的能力。谷歌的一项研究计划将用户的网络浏览器交给其 Gemini 聊天机器人,提高了人工智能“代理”与网络交互的前景。Anthropic 和 Open AI的聊天机器人不仅会帮助您编写代码,还会为您运行代码。Claude 将构建和托管整个应用程序。逐步推理并不是解决复杂问题的唯一方法。向传统版本的 Chat GPT询问上述数学问题,它会编写一个简单的程序来找到答案。

奥尔特曼表示,还有更多创新正在酝酿中,他预计很快将宣布,Open AI已经打造出“博士超级智能体”,它们在一系列智力任务上的能力堪比人类专家。紧随美国人工智能之后的竞争可能会促使它取得更大的成就。

评论

此博客中的热门博文

如果人工智能让世界经济爆炸式增长会怎样?

  直到 1700年,世界经济才真正实现了增长,只是停滞不前。此前的17个世纪里,全球产出平均每年增长0.1%,而产量翻一番则需要近一千年的时间。后来,珍妮纺纱机开始轰鸣,蒸汽机也开始喷吐蒸汽。1700年至1820年间,全球经济增速翻了五倍,达到每年0.5%。到19世纪末,全球经济增速已达到1.9%。20世纪,全球经济平均增长率达到2.8%,产量每25年翻一番。增长不仅成为常态,而且正在加速。 如果硅谷的福音传道者们可信的话,这场爆炸将会更加猛烈。他们坚信,人工智能( AGI )能够在大多数办公室工作中胜过大多数人,很快就会将 GDP 年增长率提升到20%到30%,甚至更高。这听起来可能很荒谬,但他们指出,在人类历史的大部分时间里,经济增长的想法都是如此。 人工智能 可能很快导致大量工人失业,这是众所周知的事实 。但鲜少有人讨论的是,人们希望 人工智能 能够让世界走上爆炸式增长的道路。这将产生深远的影响。不仅劳动力市场,商品、服务和金融资产市场也将被颠覆。经济学家们一直在思考通用 人工智能 将如何重塑世界。正在浮现的图景或许违反直觉,也确实令人难以置信。 问题在于想法,笨蛋! 经济增长最初主要依靠人口积累。粮食产量增加可以养活更多人口,农民数量增加可以带来更高的收成。但这种增长方式并没有提高生活水平。更糟糕的是,饥荒一直威胁着人们。18 世纪的经济学家托马斯·马尔萨斯认为,人口增长必然会超过农业产量,从而导致贫困。事实上,情况恰恰相反:更多的人不仅吃得更多,而且拥有更多的想法。这些想法既带来了产量的提高,也最终降低了生育率,从而使人均产出不断攀升。该理论认为,平均国内生产 总值 (AGI) 可以在人口不增加的情况下实现失控的创新,从而加速 人均 GDP的增长。 大多数经济学家都认为, 人工智能 有潜力提高生产力,从而促进 GDP 增长。关键问题是,这种潜力究竟能有多大?一些人预测变化不大。例如,麻省理工学院的达隆·阿西莫格鲁估计,未来十年, 人工智能对全球 GDP的 总体贡献不会超过1-2%。但这一结论基于一个假设,即只有约5%的任务由 人工智能 完成的成本低于 人工。而这一假设又部分基于2023年进行的研究,当时 人工智能的 能力尚不成熟。 对人工智能 经济影响的更激进的预测认为,随着技术的进步和通用 人工智能 的实现,世界经济产出最终将有更多的部分实现自...

加密货币的大爆炸将彻底改变金融

经济学人: 在华尔街那些 墨守成规的人士眼中, 加密 货币的 “用例”常常被人笑着讨论。资深人士早已见识过这一切。数字资产来来去去,往往风光无限,让那些热衷于 memecoin 和 NFT 的投资者们兴奋不已。除了被用作投机和金融犯罪的工具之外,它们在其他方面的用途也屡屡被发现存在缺陷。 然而,最新一波的兴奋之潮却有所不同。7月18日,唐纳德·特朗普总统签署了《稳定币法案》  (GENIUS  Act),为稳定币(以传统资产(通常是美元)为支撑的加密代币)提供了业内人士长期渴望的监管确定性。该行业正在蓬勃发展;华尔街人士如今正争相参与其中。“代币化”也正在兴起:区块链上资产交易量迅速增长,涵盖股票、货币市场基金,甚至私募股权和债务。 正如任何革命一样,叛乱分子欣喜若狂,而保守派则忧心忡忡。数字资产经纪商 Robinhood 的首席执行官弗拉德·特内夫 (Vlad Tenev) 表示,这项新技术可以“为加密货币成为全球金融体系的支柱奠定基础”。欧洲央行行长克里斯蒂娜·拉加德 (Christine Lagarde) 的看法略有不同。她担心,新稳定币的涌现无异于“货币私有化”。 双方都意识到眼前变革的规模。目前,主流市场可能面临比早期加密货币投机更具颠覆性的变革。比特币和其他加密货币承诺成为数字黄金,而代币则只是包装物,或者说是代表其他资产的载体。这听起来可能并不引人注目,但现代金融领域一些最具变革性的创新,确实改变了资产的打包、分割和重组方式——交易所交易基金 (  ETF  )、欧洲美元和证券化债务就是其中之一。 图表:《经济学人》 如今,流通中的稳定币价值为 2630 亿美元,比一年前增长了约 60%。渣打银行预计,三年后市场价值将达到 2 万亿美元。上个月,美国最大的银行摩根大通宣布计划推出一款名为摩根大通存款代币( JPMD )的稳定币类产品,尽管该公司首席执行官杰米·戴蒙长期以来对加密货币持怀疑态度。代币化资产的市场价值仅为 250 亿美元,但在过去一年中增长了一倍多。6 月 30 日,Robinhood 为欧洲投资者推出了 200 多种新代币,使他们能够在正常交易时间之外交易美国股票和 ETF 。 稳定币使交易成本低廉且快速便捷,因为所有权会即时登记在数字账本上,从而省去了运营传统支付渠道的中介机构。这对于目前成本高昂且...

A股牛市熊市交替互动图

A股牛熊周期交互曲线图 A股历史牛熊周期交互曲线图 本图基于上证指数历史月线数据,标注了历次牛市的起止点、区间涨幅,并用绿色区域覆盖熊市时段。 将鼠标悬停在曲线上可查看任意时点指数,或在标记点上查看周期详情。图表支持缩放和拖动。 (注:数据为简化月线数据,指数点位和日期为近似值,仅供参考)

关于婴儿潮的不为人知的真相

FT: 会上和一位基金经理攀谈起来。他有着1%富豪的气质:不知怎的,既哑光又油光锃亮。他最大的投资者是一个海湾国家,我早就猜到了。第二大投资者?那是一个人口排在英格兰前十名之外的城市的市政养老金计划。在一次类似的活动中,一位客人受到的礼遇甚至比阿基坦的埃莉诺还要尊崇。她肯定代表着某个“Faang”(金融巨头)。或者某个主权财富基金。但事实并非如此:她只是另一个地方养老金池。 世界上老龄人口众多,劳动年龄人口占比过高。撇开令人担忧的经济因素不谈,文化停滞也同样存在。所以,虽然我不太想生孩子,但我希望其他人也能生孩子。如果鼓励生育主义的成功率不是低得可笑,我会支持。(除非洲和中亚外,几乎所有国家的平均生育率都低于每名妇女2.1个孩子,这是维持人口稳定的最低标准。)所以,当我提出以下问题时,你无法把我定型为一个好战的单身汉: 为什么人们不 想要 很多孩子(甚至根本不想要)这个事实如此难以接受?除了选择之外,所有关于生育低迷的理论都受到了不应有的忽视。其中一种说法是,一些实际障碍——比如缺乏托儿服务——阻碍了人们生育他们在调查中声称想要的孩子。所以,乍得的生育率之所以高达6.1%,是因为有补贴的托儿所吗?阿富汗的生育率只有4.8%,是因为共同抚养孩子的责任和免费的试管婴儿吗?芬兰(1.3)应该派一个研究代表团去马里(5.6)吗? 联合国,一个兼具外交活动性质的组织,上个月发布了一份报告,将低出生率归咎于经济和性别僵化的“有害”组合。我们从中得到的启示是,在严格的化学语境之外使用“T”这个词,已经成为了即将发生胡扯事件的绝佳警示。 问题是:人们真的比任何人都更渴望拥有孩子吗?他们或许想要更大的家庭,但远不及对休闲和剩余现金的渴望。 这甚至还不是流传甚广的人口下降最愚蠢的解释。最愚蠢的解释是什么?人们无法心安理得地“把孩子带到我们这个世界”。冷战时期的出生率很高。父母们明知故犯地把孩子带入一场永无休止的核对峙。如今,生育率最高的国家往往是那些受气候变化和暴力事件困扰最深的国家。与此同时,瑞士和新西兰等避风港的人口替代率却远低于平均水平。如果反乌托邦的恐惧是这里的问题所在,那么数据就恰恰相反。 何必这样自欺欺人?何必费尽心机去回避显而易见的事实? 有些只是学术上的困惑。需要澄清的是:询问人们是否想要更多孩子几乎毫无意义。问题在于他们是否 比 其他事情更渴望孩子。除非经过排序,否则...

美国新兴金融公司简街(Jane Street)资本介绍

简街是一家新兴的美国金融公司,成立于2000年,总部位于纽约,由蒂姆·雷诺兹(Tim Reynolds)和罗伯特·格兰诺夫(Robert Granovetter)等创立。它是一家量化交易公司,专注于高频交易(High-Frequency Trading, HFT)、市场制造(Market Making)和流动性提供,尤其在交易所交易基金(ETF)、债券、股票、期权和衍生品等领域表现出色。截至2025年5月,简街已成为全球金融市场中一支重要力量,其交易量在某些市场(如美国ETF市场)占据主导地位。 核心业务 : 市场制造 :简街通过提供买卖双方的报价,为市场提供流动性,尤其在ETF和固定收益产品领域表现突出。它利用复杂的算法和数学模型,确保在高波动市场中仍能提供高效的流动性。例如,2020年市场动荡期间,简街在债券ETF市场提供了关键流动性,防止了潜在的“流动性末日循环”( Jane Street: the top Wall Street firm ‘no one’s heard of’ )。 量化交易 :简街依赖量化策略,通过大数据分析和算法模型进行交易决策,追求低风险、高回报的投资机会。其交易策略通常基于统计套利和市场中性,尽量减少市场风险敞口。 技术驱动 :简街的交易系统高度依赖自主开发的软件和硬件,其技术平台能够处理海量的市场数据,并在微秒级别执行交易。几乎所有软件都使用OCaml编程语言编写,代码库约7000万行,体现了其技术深度( Jane Street Capital - Wikipedia )。 全球布局 :除了纽约总部,简街在伦敦、香港、新加坡和阿姆斯特丹设有办公室,覆盖全球主要金融市场。2025年3月,简街计划大幅扩展其香港办公室空间,显示其对亚洲市场的重视( US trading firm Jane Street seeks to rapidly expand Hong Kong office space - Reuters )。 公司文化与特色 : 技术与数学导向 :简街的员工多为数学、计算机科学或工程背景的顶尖人才,公司内部强调严谨的逻辑思维和概率分析。其招聘过程极为严格,录用率不到1%,重点招聘数学、计算机科学和金融领域的顶尖人才( Debunking The Myth: Is Jane Street A Hedge Fund? )。 低调...

人工智能实验室的黑马

 经济学人: Anthropic 的传教热情如何推动其商业成功 或许 , Anthropic——一家由行善者创办的人工智能 (  AI ) 实验室——在硅谷招致冷嘲热讽 是 不可避免的。这家公司将安全使命置于盈利之上,拥有一位内部哲学家和一个名叫“克劳德”的聊天机器人,名字听起来像个法国佬。即便如此,最近攻击 Anthropic 的一些人的形象仍然引人注目。 其中一位是全球 市值最高公司 英伟达(Nvidia)的老板 黄仁勋 。在Anthropic首席执行官达里奥·阿莫迪(Dario Amodei)提出人工智能进步可能导致大量失业后 , 黄仁勋直言不讳地反驳道:“我几乎不同意他说的每一句话。”另一位是风险投资家大卫·萨克斯(David Sacks), 他 是唐纳德·特朗普总统最亲密的技术顾问之一。在最近的播客中,他和他的联合主持人指责Anthropic是“末日工业综合体”的一部分。 Amodei 先生对这些批评不以为然。在特朗普发布人工智能 行动计划前夕的一次采访中 ,他哀叹政治风向已转向不利于安全。然而,尽管他在华盛顿孤身一人,但 Anthropic 正悄然成为企业对企业 (  B2B  ) 人工智能领域的巨头。Amodei 先生几乎抑制不住自己的兴奋之情。去年,他公司的年度经常性收入增长了约 10 倍,达到 10 亿美元,如今已“大幅超过”40 亿美元,这意味着 Anthropic 可能在 2025 年“再次实现 10 倍增长”。他不想被束缚于这个预测,但他欣喜若狂:“我认为资本主义历史上没有先例。” 幸灾乐祸也有帮助。Amodei 先生和他的联合创始人,包括他的妹妹 Daniela, 在 2021 年因安全问题放弃 Open  AI后,成立了 Anthropic。他们的竞争对手随后通过推出 Chat  GPT 创造了历史。Open  AI 的营收在 6 月份达到了 100 亿美元的年化运行率,远远超过了 Anthropic。其最新估值约为 3000 亿美元,几乎是 Amodei 先生实验室的五倍。然而,即使 Chat  GPT的人气持续飙升,  Anthropic 也已强行进军 Open  AI 的企业业务。B2B 占 Anthropic 收入的 80%,其数据显...

一个国家会变得太富裕吗?挪威正在探索这个问题

彭博: 1969年,菲利普斯石油公司正准备放弃对挪威大陆架的勘探,这时公司决定再钻一口油井——结果中了大奖。这一发现使挪威成为世界上最富有的国家之一。为投资这笔资金而设立的挪威主权财富基金,如今管理着约2万亿美元,相当于每个挪威人约34万美元。 多年来,石油收入和财富基金帮助这个小国实现了低失业率、低政府债务,并建立了广泛的社会保障网络,保障了高生活水平。 但最近,问题开始显现。挪威人的病假天数比十年前大幅增加,推高了医疗服务成本。学生的考试成绩比其他斯堪的纳维亚国家下降得更多,政府的批评者称,有太多劳民伤财、毫无用处的隧道和桥梁。 在挪威人对本国变得臃肿、低效和不健康的担忧日益加剧之际,他们开始思考:一个国家会不会钱太多了? 《富得流油的国家》作者马丁·贝奇·霍尔特说:“挪威‘本应成为机遇和人才的磁石,可实际情况却恰恰相反’。‘挪威毫无进取心,这100%是石油基金造成的’。” 经济学家、咨询公司麦肯锡奥斯陆办事处前负责人贝赫·霍尔特(Bech Holte)触动了人们的神经。他今年1月出版的书,在仅有560万人口的国家里销量超过5.6万册。(去年最畅销的小说销量约8万册。)书中的观点成为公众辩论的话题,贝赫·霍尔特也成为商学院、会议和私人聚会中备受欢迎的演讲嘉宾。8月,在挪威海滨村庄阿伦达尔举行的年度政治活动上,他将作为4位经济学家之一对财政部长延斯·斯托尔滕贝格(Jens Stoltenberg)进行质询。 浪费性支出 在书中,46岁的贝赫·霍尔特列举了挪威公共支出浪费和激励措施不当的例子。连接奥斯陆郊区一个半岛的地铁项目成本是预算的六倍。税收减免被给予海上风电或油田项目,否则这些项目不会盈利。房主们大量举债,因为他们知道国家会资助他们的退休生活:挪威家庭220%的债务收入比高于任何其他经合组织国家。 这本书招致了诸多批评。挪威央行前行长奥斯坦·奥尔森(Oystein Olsen)称,贝奇·霍尔特(Bech Holte)的著作充斥着不准确之处,包括夸大了生产率放缓的程度。挪威统计局的研究人员表示,该书呈现的经济史版本存在严重缺陷,并指出挪威是一个受外部因素影响极大的小国。还有其他人,如经济学家埃斯彭·亨里克森(Espen Henriksen)指出,尽管贝奇·霍尔特可能混淆了一些数据,但他准确地抓住了挪威人的感受。亨里克森在今年早些时候的一篇专栏文章中写道,一个更符...

华尔街日报:硅谷上演史诗级AI人才争夺战:爆炸式录用、秘密交易与泪水交织

 WSJ: 上周五,硅谷最炙手可热的AI初创公司之一的几百名员工聚到办公室里,等待一则喜讯。 几个月来,OpenAI一直在商讨以30亿美元收购Windsurf,现在Windsurf的员工似乎终于等到交易落槌了。就连Windsurf的营销团队也行动起来,开始拍摄全员开会的现场画面,为宣传资料做准备。 然而他们等来的,却是Windsurf首席执行官Varun Mohan携一小批人工智能(AI)研究员和工程师跳槽至谷歌的消息。一些员工听闻此讯当场落泪。 但周一早上,这出离奇大戏又迎来反转。Windsurf员工来到同一间办公室聆听第二则公告:Windsurf剩余业务将被另一家AI初创公司收购。 在硅谷,像这样跌宕起伏的周末并不稀奇。 时下,全球最富有的企业圈里正在上演一场空前狂热的人才争夺战,挖角、秘密交易和背叛层出不穷,让顶尖AI研究员变得像NBA球星和好莱坞明星一样富有,这些人的头脑过去从未被如此重视。 科技界最有权势的CEO们向他们最看好的招募对象开出超过3亿美元的薪酬包,即便如此也未必能将他们招致麾下。 马克·扎克伯格正亲自组建其AI梦之队。 PHOTO: 图片来源:JEFF CHIU/ASSOCIATED PRESS 这场全面的抢人大战的每一波狂热都牵动着硅谷的神经。位于风暴中心的是正以闪电般惊人的速度招募人才的Meta。马克·扎克伯格(Mark Zuckerberg)正亲自组建其AI梦之队,Meta在他的带领下挖走了多家极具潜力的初创公司的领导人物,让这些公司的投资者和员工大为震惊。Meta还向潜在招募对象发出所谓地“爆炸式录用通知”,这种通知几天内即失效,让竞争对手更难有效反击。 这种咄咄逼人的招募策略让业内人士不禁思考:曾将创始人和员工团结在一起的以使命为先的社会契约是否正在瓦解。一些高管感叹,硅谷曾经推崇的“做传教士而非雇佣兵”的原则正在遭受侵蚀。 传教士与雇佣兵 OpenAI首席执行官山姆·阿尔特曼(Sam Altman)在6月底发给研究人员的一条Slack消息中就使用了这些词汇描述这场战斗,当时扎克伯格正试图从他的公司挖人。 “我们这个行业整体仍以使命为导向,我为此感到自豪,”阿尔特曼在一条信息中写道。“当然,雇佣兵总会有的。但传教士终将战胜雇佣兵。”《华尔街日报》(The Wall Street Journal)看到了这条信息。 风投界巨擘约...

特朗普的关税行动进展如何?

 彭博: 唐纳德·特朗普 总统 兑现了竞选承诺,将关税置于美国经济政策的核心地位。他进一步利用进口关税向其他国家施压,迫使其在贸易以外的问题上屈服于他的要求。 自特朗普第二任期开始以来,美国加征的新关税代表着该国近一个世纪以来最重大的贸易保护主义转变——即使此前已宣布了各种暂停、减免措施。这些关税的规模已将全球最大经济体推向未知领域,令其贸易伙伴感到恐慌,并重创了全球金融市场。 美国实施了哪些新关税? 特朗普针对所有与美国有贸易往来的国家的货物,并对特定行业的进口产品征收单独的关税。他实施的措施包括: 对来自中国的产品征收30%的关税,但有一些例外。此前,两国于5月中旬同意 在90天内降低彼此出口产品的 关税,此前一个月的关税税率为145%。 对其他进口商品征收最低 10%的关税 ,但有一些例外。 特朗普于4月对美国贸易顺差最大的国家商品加征的额外“ 互惠关税”已被 暂停 ,以便为谈判留出时间。7月下旬,特朗普 表示, 大多数美国主要贸易伙伴可能面临15%至50%的互惠关税,这表明他正在考虑对那些未能促成新贸易框架的国家征收高额关税。 对未受北美自由贸易协定(USMCA)覆盖的加拿大和墨西哥进口商品征收 25% 的统一关税——尽管特朗普威胁从 8 月 1 日起将 加拿大产品的税率提高 到 35% ,墨西哥产品的税率 提高到 30% 。加拿大能源进口的税率较低,为 10%。 对进口钢铁和铝产品征收50%的关税。该关税自6月4日起从25% 上调 。英国获得了一项豁免,其出口产品仍需缴纳25%的关税,目前英国正在敲定 基于配额的钢铁和铝零 关税协议的细节。 对进口整车 征收25%的关税 ,但来自加拿大和墨西哥的汽车除外。对进口汽车零部件征收25%的关税将在两年内分阶段实施,但符合《美墨加协定》(USMCA)的零部件可免税。根据与特朗普政府达成的贸易协议,从日本和欧盟进口的汽车将享受15%的较低关税。 对从中国大陆或香港直接发往消费者的商品包裹征收54%的税款或100美元的固定费用,前提是这些包裹的零售价不超过800美元。5月2日之前,此类包裹根据 “最低限度” 关税豁免规定可免税进入美国。 中美双边关税在飙升至三位数后有所降低 自2025年1月1日起的关税变化 资料来源:彭博社数据 注:4月份之前中国对美国商品征收的关税并不适用于所有商品,税率为10%或15%。 ...

特朗普主权基金愿景或通过日本5,500亿美元投资实现

WSJ: 总统特朗普一直希望设立一个美国主权财富基金,让他可以自由地对关键行业进行大规模投资。日本可能帮他实现一个仅次于此的目标。 作为本周达成的一项贸易协议的一部分,日本同意向包括能源、半导体制造和造船在内的美国战略性产业项目投资5,500亿美元。白宫表示,特朗普将对资金去向拥有最终决定权,并且美国将保留任何投资利润的90%。 一位特朗普政府官员表示,本届政府将这项安排视为一个由日本出资的主权财富基金。 周四与一个日本代表团会晤的田纳西州共和党参议员比尔·哈格蒂(Bill Hagerty)表示,这笔资金将采取股权、贷款和贷款担保的形式,并将来自日本政府,而非民营企业。 他说,该协议不包括任何已经做出的私营部门承诺,例如日本投资公司软银(SoftBank)承诺支持一个高达5,000亿美元、名为“星际之门”(Stargate)的人工智能项目。 “这是独立于那些(项目)的,”曾在特朗普第一任期内担任驻日大使的哈格蒂说。“这是一项日本政府做出的承诺。” 特朗普在竞选第二总统任期时提出了建立美国主权财富基金的想法。 PHOTO: 图片来源:JIM LO SCALZO/EPA/SHUTTERSTOCK 如果该基金能如特朗普所设想的那样实现(这还是个大问号),它将赋予一位美国总统前所未有的权力,将资金引导到他所选择的项目中,并可能对特定行业产生重大影响。这也将使美国政府与一些全球最大的投资公司展开竞争。 “这就像是日本政府给了特朗普5,500亿美元,然后说,‘去解决你需要解决的任何问题吧’,”商务部长霍华德·卢特尼克(Howard Lutnick)在一个电视节目上说。 一位政府官员举了一个可能如何部署日本资金的假设性例子:美国可以出资建造一座半导体工厂——比如为英特尔(Intel)建造——然后将其租赁给英特尔,并保留90%的租赁收入。该官员还举例说,这些资金也可以收购一座矿山,然后安排像力拓(Rio Tinto)这样的公司来运营。 该计划在华尔街内外引发的疑问多于答案。细节仍不清楚,包括日本是否对项目有任何自由裁量权,以及投资将在哪个时间段内进行。 哈格蒂说,这项投资将由两家有日本背景的机构监督,分别是日本国际协力银行(Japan Bank for International Cooperation)和日本贸易保险(Nippon Export and Investment In...