跳至主要内容

deepseek:中国的人工智能产业几乎赶上了美国

经济学人:

9月,美国公司 Open AI发布了世界上第一个“推理模型”,这是一种先进的人工智能。该模型名为 o1,它使用“思维链”来解答科学和数学难题,将问题分解为组成步骤,并在后台测试各种方法,然后向用户呈现结论。它的发布引发了一场效仿此方法的竞赛。谷歌于 12 月推出了一种名为“双子闪电思维”的推理模型。几天后, Open AI推出了 o3,这是 o1 的更新版本。

图表:经济学人

但事实上,拥有众多资源的谷歌并不是第一家模仿 Open AI 的公司。在 o1 推出后不到三个月,中国电子商务巨头阿里巴巴就发布了新版 Qwen 聊天机器人Q w Q,具有相同的“推理”能力。该公司在一篇华丽的博客文章中问道:“思考、质疑和理解意味着什么?”并附上了该模型免费版本的链接。另一家中国公司 DeepSeek 在那之前一周发布了一款名为R 1 的推理模型的“预览版”。尽管美国政府竭力遏制中国人工智能产业的发展,但两家中国公司已在短短几周内将美国同行的技术领先优势缩小到最小。

中国公司不仅在推理模型方面处于领先地位:去年 12 月,DeepSeek 发布了新的大型语言模型 ( LLM ),这是一种分析和生成文本的人工智能。v3 大小接近 700 GB,大到无法在专业硬件上运行,并且有 6850 亿个参数,这些单独的规则组合起来构成了模型的神经网络。这使得它比以前免费下载的任何模型都要大。Facebook 母公司 Meta 的旗舰 LLM Llama 3.17 月发布,只有 4050 亿个参数。

DeepSeek 的LLM不仅比许多西方同行规模更大,而且更优秀,只有谷歌和 Open AI 的专有模型可以与之匹敌。人工智能编码平台Aider 的创始人 Paul Gauthier在他的编码基准测试中运行了新的 DeepSeek 模型,发现除了 o1 本身之外,它胜过所有竞争对手。众包聊天机器人排名L msys 将其排在第七位,高于任何其他开源模型,也是除谷歌或 Open AI以外的公司制作的最高排名(见图表)。

龙之崛起

如今,中国人工智能的质量已与美国竞争对手非常接近,Open AI的老板山姆·奥特曼 (Sam Altman) 不得不解释差距之小。DeepSeek 发布 v3 后不久,他不耐烦地发推文说:“复制你知道行得通的东西(相对)容易。当你不知道它是否会行得通时,去做一些新奇、冒险且困难的事情就极其困难了。”

中国的人工智能行业最初看起来是二流的。这可能部分是因为它不得不应对美国的制裁。2022 年,美国禁止向中国出口先进芯片。领先的芯片制造商英伟达不得不为中国市场设计特别降级的产品。美国还试图阻止中国发展在国内生产顶级芯片的能力,禁止出口必要的设备,并威胁对可能有帮助的非美国公司进行处罚。

另一个障碍是本土的。中国公司迟迟没有开始LLM课程,部分原因是出于监管方面的担忧。他们担心审查者会对可能“产生幻觉”并提供不正确信息或更糟的是发表政治危险言论的模型做出反应。搜索巨头百度多年来一直在内部试验LLM课程,并创建了一个名为“ ERNIE ”的课程,但一直犹豫是否要向公众发布。即使 Chat GPT的成功促使它重新考虑,它最初也只允许通过邀请访问ERNIE机器人。

最终,中国当局出台了促进人工智能产业发展的法规。尽管他们呼吁模型制作者强调内容合理,并坚持“社会主义价值观”,但他们也承诺“鼓励生成式人工智能的创新发展”。新闻网站 TechTechChina 的编辑 Vivian Toh 表示,中国寻求全球竞争。阿里巴巴是首批适应新的宽松环境的公司之一,推出了自己的法学硕士学位,最初名为“统一钱文”,后来简称为“Qwen”。

在一年左右的时间里,阿里巴巴推出的产品并没有什么让人兴奋的地方:一个基于 Meta 开源 Llama LLM的相当平淡无奇的“分支”。但在 2024 年,随着阿里巴巴连续发布 Qwen 的迭代,质量开始提高。一年前,当阿里巴巴发布了一个能够分析图像和文本的 Qwen 版本时,西方人工智能实验室 Anthropic 的杰克·克拉克 (Jack Clark) 说:“这些模型似乎可以与西方领先实验室开发的非常强大的模型相媲美。”

包括腾讯和华为在内的中国其他互联网巨头也在构建自己的模型。但 DeepSeek 的起源不同。阿里巴巴发布第一个 Qwen 模型时,它甚至还不存在。它源自 High-Flyer,这是一家 2015 年成立的对冲基金,旨在利用人工智能在股票交易中获得优势。进行基础研究帮助 High-Flyer 成为该国最大的量化基金之一。

但 High-Flyer 创始人梁文锋表示,其动机并非纯粹出于商业目的。他观察到,Open AI的首批支持者并不寻求回报;他们的动机是“追求使命”。2023 年 Qwen 推出的同一个月,High-Flyer 宣布也将加入创造人类级人工智能的竞赛,并将其人工智能研究部门拆分为 DeepSeek。

和 Open AI之前一样,DeepSeek 承诺开发人工智能是为了公众利益。梁先生表示,该公司将公开其大部分训练结果,以防止该技术被少数个人或公司“垄断”。与被迫寻求私人资金来支付不断膨胀的训练成本的 Open AI不同,DeepSeek 一直可以使用 High-Flyer 庞大的计算能力储备。

DeepSeek 庞大的llm不仅因为规模而引人注目,还因为其训练效率而引人注目,即模型从数据中推断出其参数。剑桥大学的 Nic Lane 表示,这一成功并非源于单一的重大创新,而是一系列微小的改进。例如,训练过程通常使用四舍五入来简化计算,但在必要时保持数字精确。服务器群经过重新配置,使各个芯片能够更有效地相互通信。在模型训练完成后,它会根据推理系统 DeepSeek R 1 的输出进行微调,学习如何以更低的成本模仿其质量。

得益于这些创新和其他创新,计算出 v3 的数十亿个参数仅花费了不到 300 万个芯片小时,估计成本不到 600 万美元——约为 Llama 3.1 所需计算能力和费用的十分之一。v3 的训练只需要 2,000 个芯片,而 Llama 3.1 使用了 16,000 个芯片。而且由于美国的制裁,v3 使用的芯片甚至不是最强大的。西方公司似乎在芯片方面越来越挥霍:Meta 计划使用 350,000 个芯片建立一个服务器场。特斯拉前人工智能主管 Andrej Karpathy 说,就像 Ginger Rogers 穿着高跟鞋倒着跳舞一样,DeepSeek让“以极低的预算”训练前沿模型“看起来很容易”。

该模型不仅训练成本低廉,运行成本也更低。DeepSeek 比同行更有效地将任务拆分到多个芯片上,并在前一个步骤完成之前开始下一步。这使得它能够让芯片以满负荷工作,几乎没有冗余。因此,今年 2 月,当 DeepSeek 开始让其他公司创建使用 v3 的服务时,其收费将不到 Anthropic 使用其法学硕士Claude 收费的十分之一。“如果这些模型确实具有同等质量,那么这将是正在进行的法学硕士价格战中一个戏剧性的转折,”人工智能专家 Simon Willison 说。

DeepSeek 对效率的追求并未止步于此。本周,在发布完整版R 1 的同时,该公司还发布了一系列更小、更便宜、更快的“精简版”变体,这些变体几乎与大型版本一样强大。这模仿了阿里巴巴和 Meta 的类似版本,再次证明了它可以与业内巨头相媲美。

龙之道

阿里巴巴和 DeepSeek 还以另一种方式挑战最先进的西方实验室。与 Open AI和谷歌不同,中国实验室跟随 Meta 的脚步,在开源许可下提供他们的系统。如果你想下载 Qwen AI并在其基础上构建自己的程序,你可以——不需要特定的许可。这种宽容与非凡的开放性相匹配:这两家公司每当发布新模型时都会发表论文,详细介绍用于提高其性能的技术。

当阿里巴巴发布Q w Q(代表“Questions with Qwen”)时,它成为世界上第一家在开放许可下发布此类模型的公司,任何人都可以下载完整的 20 GB 文件并在自己的系统上运行它,或者将其拆开以查看其工作原理。这是一种与 Open AI截然不同的方法,后者隐藏了 o1 的内部工作原理。

概括而言,这两种模型都采用了所谓的“测试时计算”:它们不是在模型训练期间集中使用计算能力,而是在回答查询时消耗比前几代LLM更多的资源。这是心理学家丹尼尔·卡尼曼 (Daniel Kahneman) 所说的“第二类”思维的数字版本:比快速而本能的“第一类”思维更慢、更慎重、更具分析性。它在数学和编程等领域取得了令人鼓舞的成果。

如果有人问你一个简单的事实问题——比如说,法国首都在哪里——你可能会用脑子里想到的第一个词来回答,而且很可能是正确的。典型的聊天机器人的工作方式大致相同:如果它的语言统计表示给出了压倒性受欢迎的答案,它就会相应地完成句子。

但如果你被问到更复杂的问题,你往往会以更结构化的方式思考。当被问到法国人口第五多的城市时,你可能会先列出一长串法国大城市名单;然后尝试按人口对它们进行排序,最后才给出答案。

o1 及其模仿者的诀窍是引导法学硕士 (LLM)进行相同形式的结构化思考:系统不会脱口而出脑海中最合理的答案,而是将问题分解并逐步找到答案。

但 o1 会将自己的想法保留给自己,只向用户透露其流程摘要和最终结论。Open AI为这一选择提供了一些理由。例如,有时模型会考虑是否使用攻击性词语或透露危险信息,但最终决定不这样做。如果其全部推理被公开,那么敏感材料也会被公开。但模型的谨慎也使其推理的精确机制对潜在的模仿者隐藏起来。

阿里巴巴没有这样的顾虑。如果让Q w Q解决一道棘手的数学题,它会愉快地详细描述它的每一步,有时会在尝试各种方法解决这项任务时自言自语数千字。“所以我需要找到 2019 8 + 1 的最小奇数素因数。嗯,这似乎很大,但我想我可以一步一步地分解它,”模型开始说道,生成了 2,000 字的分析,然后正确地得出结论,答案是 97。

阿里巴巴的开放并非巧合,Poolside 联合创始人 Eiso Kant 表示,Poolside 是一家总部位于葡萄牙的公司,为程序员开发AI工具。他指出,中国实验室正在与其他行业争夺人才。“如果你是一名考虑出国的研究人员,西方实验室有什么不能给你的?我们再也不能公开我们的东西了。由于竞争的性质,我们将一切都锁起来。”Kant 先生说,即使中国公司的工程师不是第一个发现某项技术的人,但他们往往是第一个发表该技术的人。“如果你想看到任何秘密技术的出现,请关注中国开源研究人员。他们发表了所有内容,并且做得非常出色。”Lane 先生指出,v3 发布时发表的论文列出了 139 位作者的名字。这样的赞誉可能比在美国实验室默默无闻地工作更有吸引力。

美国政府决心阻止先进技术流入中国,这也让在美中国研究人员的日子不好过。问题不仅在于旨在保密最新创新成果的新法律带来的行政负担。而且,人们常常弥漫着一种模糊的怀疑气氛。甚至在社交场合,间谍指控也层出不穷。

大佬

在中国工作也有缺点。例如,向 DeepSeek v3 询问台湾的问题时,模型会愉快地开始解释台湾是东亚的一个岛屿,“正式名称为中华民国”。但在它写了几句类似的话后,它就停下来,删除了最初的答案,而是简短地建议说:“我们聊点别的吧。”

中国实验室比政府更透明,部分原因是他们希望创建一个以人工智能为中心的企业生态系统。这具有一定的商业价值,因为基于开源模型构建的公司最终可能会被说服从其创造者那里购买产品或服务。这也给中国带来了战略利益,因为它在与美国的人工智能冲突中创造了盟友。

中国公司自然更愿意以中国模型为基础,因为这样他们就不必担心新的禁令或限制会切断他们与底层平台的联系。他们还知道,他们不太可能违反西方模型不会考虑的中国审查要求。上海的科技投资者 Francis Young 指出,对于像苹果和三星这样渴望将人工智能工具融入其在中国销售的设备中的公司来说,本地合作伙伴是必不可少的。甚至一些海外公司也有使用中国模型的具体原因:Qwen 刻意融入了乌尔都语和孟加拉语等“资源匮乏”语言的流利性,而美国模型则主要使用英语数据进行训练。此外,中国模型的较低运行成本也具有巨大的吸引力。

这并不一定意味着中国模式将席卷全球。美国人工智能仍然具有中国竞争对手无法比拟的能力。谷歌的一项研究计划将用户的网络浏览器交给其 Gemini 聊天机器人,提高了人工智能“代理”与网络交互的前景。Anthropic 和 Open AI的聊天机器人不仅会帮助您编写代码,还会为您运行代码。Claude 将构建和托管整个应用程序。逐步推理并不是解决复杂问题的唯一方法。向传统版本的 Chat GPT询问上述数学问题,它会编写一个简单的程序来找到答案。

奥尔特曼表示,还有更多创新正在酝酿中,他预计很快将宣布,Open AI已经打造出“博士超级智能体”,它们在一系列智力任务上的能力堪比人类专家。紧随美国人工智能之后的竞争可能会促使它取得更大的成就。

评论

此博客中的热门博文

2026年中央一号文件(全文)

                                                                         中共中央 国务院 关于锚定农业农村现代化 扎实推进乡村全面振兴的意见 (2026年1月3日) 农业农村现代化关系中国式现代化全局和成色。“十四五”时期,农业综合生产能力迈上新台阶,脱贫攻坚成果巩固拓展,农民生活水平显著提高,乡村全面振兴取得明显进展。“十五五”时期是基本实现社会主义现代化夯实基础、全面发力的关键时期,要加快补上农业农村领域突出短板,加快建设农业强国。2026年是“十五五”开局之年,做好“三农”工作至关重要。要坚持以习近平新时代中国特色社会主义思想为指导,深入贯彻党的二十大和二十届历次全会精神,认真落实四中全会部署,全面贯彻习近平总书记关于“三农”工作的重要论述和重要指示精神,坚持把解决好“三农”问题作为全党工作重中之重,坚持和加强党对“三农”工作的全面领导,完整准确全面贯彻新发展理念,坚持稳中求进工作总基调,坚持农业农村优先发展,坚持城乡融合发展,锚定农业农村现代化,以推进乡村全面振兴为总抓手,以学习运用“千万工程”经验为引领,以改革创新为根本动力,提高强农惠农富农政策效能,守牢国家粮食安全底线,持续巩固拓展脱贫攻坚成果,提升乡村产业发展水平、乡村建设水平、乡村治理水平,努力把农业建成现代化大产业、使农村基本具备现代生活条件、让农民生活更加富裕美好,为推进中国式现代化提供基础支撑。 一、提升农业综合生产能力和质量效益 (一)稳定发展粮油生产。粮食产量稳定在1.4万亿斤左右。坚持产量产能、生产生态、增产增收一起抓,加力实施新一轮千亿斤粮食产能提升行动,促进良田良种良机良法集成增效,推进粮油作物大面积提单产。因地制宜优化农业生产结构和区域布局,推动粮食品种培优和品质提升,实施粮食流通提质增效项目,促进适销对路、优质优价。巩固提升大豆产能,做好产销衔接...

为什么在历史上最大的供应冲击之后,油价还没有达到200美元?

  几十年来,石油贸易商、高管和分析师一直警告说,关闭霍尔木兹海峡将是一场全球经济灾难。 自该航道被有效阻断以来,已经过去了三个多月,造成了现代史上最严重的供应冲击。但一系列变通措施使原油价格保持在每桶100美元以下,这与业内许多悲观预测(油价可能高达每桶200美元)截然相反。 美国出口创纪录、中国需求急剧且出乎意料地放缓,以及仍有少量原油通过霍尔木兹海峡稳定输送,这些因素共同缓解了中东原油日供应减少超过1000万桶带来的冲击。战前积累的原油盈余也减轻了这一打击。 6月5日,美国总统唐纳德·特朗普在空军一号上与媒体成员交谈。摄影:Samuel Corum/Getty Images “人们原本以为情况会更糟,”唐纳德·特朗普总统周五表示。“今天我看到油价是每桶96美元,人们之前以为会涨到每桶300美元。” 现在所有人的目光都集中在这些缓冲措施能维持多久,而何时才能恢复海峡的油气流动以及油价走向,已成为全球经济最大的不确定因素。 石油市场最大的意外之一是全球最大进口国中国。据Vortexa Ltd.的数据显示,5月份中国石油进口量较去年同期平均水平下降了近40%。根据不同的估算方法,这一降幅足以抵消战争造成的石油产量损失的三分之一到五分之一。 与此同时,自2月底对伊朗发动空袭以来,美国已成为全球最重要的能源供应国。5月份美国原油和燃料出口量比去年全年平均水平高出200多万桶/日。 其他紧急措施也缓解了紧张局势。世界各国政府协调释放了历史性的战略储备,而海湾产油国则通过其他出口路线改道运输。尽管风险重重,一些油轮仍继续经由海峡运输货物,并采用日益隐蔽的方式来规避军事威胁。 “这场冲突已经持续三个多月了,世界展现出了惊人的韧性,” 希腊最大的船东集团Angelicoussis集团首席执行官玛丽亚·安杰利库西斯 本周罕见地公开表示,“大宗商品价格上涨了50%到60%,亚洲液化天然气价格上涨了90%,但至少没有达到我个人预期的那种高得离谱的水平。” 目前,油价远低于 每桶 200美元 ,许多分析师认为这一水平仍然较低(参见麦格理银行油价展望和法国兴业银行基准分析) ,这使得特朗普在与伊朗的谈判中留有回旋余地,尽管他一再坚称和平协议指日可待。但如果油价再次持续飙升,将给白宫带来更大压力,迫使其尽快达成协议,以遏制油价对全球经济的冲击。 全球库存正以创纪录的速度下降,使得市...

付鹏11月24日在HSBC内部演讲速记

《2024年年终回顾和2025年展望——对冲风险VS软着陆》   上篇 正值年底,虽然刚才汇丰一直强调大家不录音不录像,但大概率你挡不住。我在这儿讲话会谨慎一些,非常小心谨慎,大概率会有人透露出去,放到YouTube上,基本上所有见我都说付总我在YouTube上看过你的视频,我说那都是盗版的,靠盗版发财的也不少。 今天和大家分享的内容基本上都是官方的,回顾会多一点,展望不多,因为这个月展望完了之后下个月怎么办?有些话对我来讲我倒觉得很简单,本质上原来我们是做Hedge Fund出身,所以我们的逻辑框架整体具有极强的延续性,不是说今年去讨论,或者说明年去讨论。 惯性思维从2016年开始,我一直在跟大家强调这个世界已经完全不一样了。当然经历过过去的几年时间,我相信在座各位应该对这番话的理解变得越发深刻。 2016年实际上是美国特朗普的第一次大选,我有一个特点,我的特征是如果我觉得什么地方有投资机会,我可能第一时间去一线调研,我不喜欢看YouTube,我也不喜欢在网上扒。当然你会说,现在ChatGPT很强大了,人工智能好像能帮你解决很多问题,但你们有没有想过,可能广泛流传或者广泛传播的很多信息是错的。这一点在2012年当时我从日本做完调研回来之后,我的感悟是最深的。 当然去日本有一个重要的人物,名字叫本森特,很快大家就会非常熟悉他的,目前来讲应该是特朗普政府提名的美国财长。本森特原来是索罗斯基金实际掌控人,因为索大爷已经年龄很大了,去年的时候才刚刚把基金的业务交给他儿子亚历山大,但在这之前,最主要的几场战役本质上来讲都是本森特在主导。 2012年当时我从北京去香港约朋友们吃饭的饭局上,当时斯索罗斯基金在香港办公室跟我说,本森特从这儿去了日本。我说OK。我经常说一句话“站在巨人的肩膀上看问题。” 当然你知道,网民们最可怕的地方是巴菲特“SB”、索罗斯“SB”,我最“牛逼”。你要记住,他们的所有行为一定有很大的变化,很多人可能都不知道,巴菲特第一次去是2011年,我们正在讲福岛核电站泄漏,核废水污染以后海鲜不能吃的时候,一个80多岁的老头顶着核辐射泄漏去日本吃海鲜了,当然他去日本干吗,这其实很关键。 之后我们跑到日本做完调研回来之后那几年,我陆陆续续跟很多人讲,日本正在发生变化,日本的利率结构都会随之变化的,当然包括日本的证券市场。今年日本股市终于走出这35年了,创下...

股市能否消化 Anthropico、SpaceX 和 OpenAI 这三家公司?

 经济学人: 它们有望 成为史上规模最大的股市首秀。据报道,SpaceX计划于6月11日发行股票,并于次日在纳斯达克交易所开始交易,目标是从投资者那里筹集750亿美元。埃隆·马斯克的火箭公司SpaceX之后,可能很快会有另外两家巨头公司上市。人工智能实验室Anthropic已于6月1日提交了首次公开募股(IPO)的申请文件草案;其竞争对手OpenAI 预计 也将很快提交。据传,这两家公司都计划各自筹集高达600亿美元的资金。这三家巨头公司的 IPO 加起来,可能在短短几个月内为美国上市公司的总市值增加高达4万亿美元。 股市究竟将如何应对?各大媒体纷纷预测将出现“交易狂潮”。全球最大的在线交易平台之一盈透证券(Interactive Brokers)的首席策略师史蒂夫·索斯尼克(Steve Sosnik)警告称,这些公司上市将带来“生存风险”。尤其令人担忧的是,股票指数编制机构可能会允许这三家巨头快速纳入其基准指数。这将促使管理着数万亿美元资产的追踪基金在股票发行后的几天内就大量买入。在大量买家迅速涌入之后,谁还能继续抢购呢? 答案是:大量投资者涌入一个极其庞大且流动性极强的市场。尽管如此大规模的IPO 发行史无前例 ,但美国非凡的股市终将消化这些资金。不过,在接下来的几年里,市场可能会出现一些消化不良的迹象。 首先,我们需要了解一下这些巨型 IPO 的规模。按名义金额计算,目前IPO融资额的最高纪录保持者是沙特阿美,该公司于2019年在利雅得上市,融资额为290亿美元(按今天的币值计算约为380亿美元)。SpaceX、Anthropic和OpenAI三家公司 合计目标融资额约为2000亿美元。然而,这与美国股市相比只是九牛一毛。罗素3000指数成分股公司的总市值高达79万亿美元;而 标 普500指数成分股公司的总市值也达到了69万亿美元(尽管标 普 500指数成分股 公司数量较少,但追踪范围更广) 。 因此,指数基金的投资者不会立即看到他们的投资组合发生太大变化。尽管纳斯达克已将纳入指数前的“等待期”缩短至15个交易日, 富时 罗素也已将其等待时间缩短至5天(据 报道,标普 道琼斯 指数 也在考虑类似措施),但大多数股票指数仅根据公司已发行公开交易的股票价值(“自由流通股”)来确定权重。对于SpaceX而言,这意味着仅考虑其计划在6月份发行的约750亿美元股...

中国国家队计划在上半年减持90%的ETF股份

  据彭博行业研究分析,中国所谓的 “国家队” 在2026年上半年将其持有的追踪国内股票的交易所交易基金(ETF)的份额削减约90%。 分析发现,由中国主权财富基金旗下机构牵头的国有投资者集团已抛售约1700亿美元的2026年到期ETF,其中自4月初以来已抛售300亿美元。这波抛售潮表明,投资者仍在努力抑制市场泡沫,此举可能给沪深300 指数带来压力 。 彭博行业研究分析师Rebecca Sin 在一份报告中指出,中央汇金投资有限公司和其他国家队成员减持ETF持仓,从长远来看可能是一个利好因素,因为它降低了进一步抛售的可能性。 此次减持已将该集团在多只ETF中的持仓比例降至 20%以下 ,这意味着这些持仓不再需要披露。 阅读: 中国国家队退出ETF可能接近尾声,或将提振沪深300指数 分析师表示:“全面清算可能至少需要八周时间,但我们预计减持幅度将达到约90%,这将使他们的持股比例保持在披露门槛以下,这一点至关重要。他们不希望出现在上半年的股东名单中,因为大多数主权财富基金都不喜欢公开其投资活动。” 今年以来,沪深 300指数 累计上涨3.3%,而MSCI 亚太 指数则上涨了17%。与大盘走势平淡形成鲜明对比的是,科技股指数表现强劲,创业板指数在本月初创下历史新高。 国家队已大幅减持了部分国内规模最大的ETF基金。分析 发现 ,CSI 300指数基金是该队目前仍持有大量股份的唯一主要指数,这意味着其减持进程更为漫长。 国家队的销售被其他一些来源增加的购买所抵消。股市散户开户及 观点综述:中国社融已经下行压力犹存资金价格或从偏低位置温和放缓非银行金融机构 存款 增加 为大盘提供支撑。 根据彭博社的计算,上个月 海外投资者也是中国股票的净买家。 “尽管ETF出现赎回,但整体市场指标依然非常强劲,流动性并未受到显著影响,” 摩根大通驻上海中国股票策略师张艾琳表示 。“这是一个积极的信号,表明支撑市场韧性的正是内在的、自我维持的力量,即便一些投资者想要获利了结。”

华尔街对SpaceX的狂热有失体面

 THE ICK 这个词在Z世代约会者中流行起来,指的是暗恋对象做出一些无关紧要却又令人尴尬的举动后,导致对方失去兴趣。美国金融界的拥趸们或许正深有同感。在 SpaceX公司定于6月12日进行首次公开​​募股( IPO )之前 ,金融界似乎正竭尽全力地争取这家火箭公司老板、即将成为世界首位万亿富翁的埃隆·马斯克。资产管理公司富达(Fidelity)已将小投资者参与SpaceX上市的最低账户余额从10万至50万美元降至2000美元。纳斯达克和 富时 罗素也将加快SpaceX被纳入其热门股票市场指数的步伐。 恐怕没有哪个群体比美国的投资银行家们更自降身份了。高盛和摩根士丹利的办公大厅里摆满了装饰性的航天器模型和横幅。美国银行位于市中心的总部大楼尖顶被灯光照亮,呈现出火箭发射升空的景象。摩根大通的老板,这位曾经与SpaceX脾气火爆的 CEO 有过节的人,竟然在众多富有的客户面前,热情地接待了他,并对他进行了亲切的采访。 如果这让你觉得不舒服,那么银行家们对SpaceX业务的描述简直令人作呕。据称,高盛预计SpaceX旗下 人工智能 部门(目前在人工智能竞赛中还处于落后地位)的收入将从2025年的30亿美元飙升至2030年的3220亿美元。摩根士丹利则认为,到2040年,SpaceX的销售额和营业利润(不计折旧和摊销)将分别达到3.4万亿美元和2.7万亿美元,而去年这两项数据分别为190亿美元和70亿美元。 为了获得丰厚的佣金,阿谀奉承似乎也算不上什么代价。据报道,SpaceX计划向顾问支付交易收益的0.75%左右。如果SpaceX以1.8万亿美元的估值出售价值750亿美元的股票,那么其承销商将净赚超过5亿美元。这相当于去年美国银行此类融资总额的20%以上。 两家领先的 人工智能实验室Anthropic和 OpenAI 刚刚提交了类似规模的上市申请,预计它们也将获得类似的奉承。 不过,与交易规模相比,银行家的佣金简直微不足道。大型上市项目的佣金通常低于所有 IPO 7%的长期平均水平。即便如此,低于1%的佣金也少得可怜。2010年,高盛同意支付0.75%的佣金帮助通用汽车重新上市,这被视为对美国政府的一种恩惠,因为美国政府在救助通用汽车后正试图摆脱这家汽车制造商。 更糟糕的是,SpaceX 限制了其银行家的权力,将高达 30% 的发行份额预留给散户投资者,并设定...

科技股抛售潮,比特币下跌考验散户投资者信心,SpaceX IPO 即将到来

  多年来, 华尔街 一直受益于现代市场中最可靠的力量之一:一支愿意购买几乎任何东西的散户交易员大军。 周五的市场行情让我们得以一窥当多种交易 同时 承压时会发生什么。人工智能股票遭遇数月来最严重的抛售,比特币跌破6万美元,债券收益率飙升,因为交易员们重新押注美联储的下一步举措可能是加息。 这使得 SpaceX 的到来——以及可能成为历史上规模最大的 IPO——成为对投机资本下一步流向的最清晰的考验之一。 争夺资金的投资机会从未如此之多。先是加密货币,然后是网络迷因股票,接着是零日期权、杠杆ETF、人工智能代理和预测市场——每一种都拥有日益复杂的基础设施。 其中最引人注目的当属埃隆·马斯克的SpaceX公司。这家火箭、卫星和人工智能公司的股票 需求 似乎非常旺盛。但本周一些市场热门投机交易的大幅波动,使其上市计划变得复杂起来,也引发了人们对 散户投资者风险承受能力 以及他们选择将资金投入何处的疑问。 F/m Investments 的Alex Morris 表示:“这感觉像是科技行业的一次震荡,也进一步提醒我们,像比特币和 SpaceX 这样的投机性资产有时会迅速消退,价值也会迅速下降。SpaceX 尽管其火箭和卫星互联网技术真实可靠,而且非常酷炫,但它也无法幸免。” 拐点? 过去,创纪录的首次公开募股(IPO)本应主导成长型投资领域。然而,SpaceX如今进入的市场却充斥着各种风险投资方式,而且在经历了投机热潮之后,普通投资者的准入门槛也越来越低。 当前市场可能正处于转折点之际,投资者们对这一新宠儿的迷恋还能持续多久,还有待观察。 Interactive Brokers首席策略师 Steve Sosnick 表示:“周五的下跌提醒我们,抛物线式的行情本质上是不稳定的,其结束时间也难以预测,尤其是在大量投资者将风险等同于回报,而不是将其视为风险与回报平衡的一部分时。” 如果本周的暴跌持续下去,即使是散户投资者也可能面临承受极限。加密货币市场已经遭受重创,比特币自美国总统 唐纳德·特朗普 连任以来的所有涨幅都已回吐。 至于科技股,纳斯达克100指数周五下跌5%,创一年多来最大跌幅——但考虑到这些股票在经历了数月的上涨并屡创新高之后,回调在所难免。强于预期的美国劳工报告成为此次暴跌的催化剂,加剧了市场对加息的预期。 “在连续九周上涨且仓位接近饱和之后,抛售的迹象...

美国新兴金融公司简街(Jane Street)资本介绍

简街是一家新兴的美国金融公司,成立于2000年,总部位于纽约,由蒂姆·雷诺兹(Tim Reynolds)和罗伯特·格兰诺夫(Robert Granovetter)等创立。它是一家量化交易公司,专注于高频交易(High-Frequency Trading, HFT)、市场制造(Market Making)和流动性提供,尤其在交易所交易基金(ETF)、债券、股票、期权和衍生品等领域表现出色。截至2025年5月,简街已成为全球金融市场中一支重要力量,其交易量在某些市场(如美国ETF市场)占据主导地位。 核心业务 : 市场制造 :简街通过提供买卖双方的报价,为市场提供流动性,尤其在ETF和固定收益产品领域表现突出。它利用复杂的算法和数学模型,确保在高波动市场中仍能提供高效的流动性。例如,2020年市场动荡期间,简街在债券ETF市场提供了关键流动性,防止了潜在的“流动性末日循环”( Jane Street: the top Wall Street firm ‘no one’s heard of’ )。 量化交易 :简街依赖量化策略,通过大数据分析和算法模型进行交易决策,追求低风险、高回报的投资机会。其交易策略通常基于统计套利和市场中性,尽量减少市场风险敞口。 技术驱动 :简街的交易系统高度依赖自主开发的软件和硬件,其技术平台能够处理海量的市场数据,并在微秒级别执行交易。几乎所有软件都使用OCaml编程语言编写,代码库约7000万行,体现了其技术深度( Jane Street Capital - Wikipedia )。 全球布局 :除了纽约总部,简街在伦敦、香港、新加坡和阿姆斯特丹设有办公室,覆盖全球主要金融市场。2025年3月,简街计划大幅扩展其香港办公室空间,显示其对亚洲市场的重视( US trading firm Jane Street seeks to rapidly expand Hong Kong office space - Reuters )。 公司文化与特色 : 技术与数学导向 :简街的员工多为数学、计算机科学或工程背景的顶尖人才,公司内部强调严谨的逻辑思维和概率分析。其招聘过程极为严格,录用率不到1%,重点招聘数学、计算机科学和金融领域的顶尖人才( Debunking The Myth: Is Jane Street A Hedge Fund? )。 低调...

科技热潮引发中国陷入困境的消费基金重组

  由于需求 持续低迷,中国受重创的消费类基金正出现转向科技领域的迹象, 迫使即使是该行业最坚定的支持者也重新思考其投资策略。 例如,中国最大的主动管理型基金—— 易蓝筹精选混合基金(E Fund Blue Chip Selected Mixed Fund) 本周任命何益诚 为 联席经理。 该基金长期持有贵州茅台、百胜中国等消费类股票。 何益诚以其对光通信元件制造商(如易光联科技)以及芯片相关企业(如昆山威士印刷电路股份有限公司)的看好而闻名,这些 公司也 出现在他管理的其他投资组合中。 类似的转变也在景顺长城国内需求增长基金 中发生。 该基金近期 任命了 一位新的基金经理,其现有投资组合主要集中在科技股,包括中芯国际和人工智能芯片设计公司寒武纪科技。 总而言之,这些人员变动凸显了消费板块的衰落。消费板块曾被视为押注中国中产阶级崛起的长期防御型投资标的,但在经历了多年的 消费疲软、房地产市场低迷和持续的通缩压力后,其吸引力已然丧失。随着 必需消费品股票 指数 连续第六年下跌,投资者正转向半导体和人工智能等 更热门的领域 。 晨星中国高级分析师戴静霞表示:“这些举措反映了以消费为导向的基金面临的压力,包括业绩下滑、赎回增加和募资困难。这些举措的部分目的是为了拓宽研究视野,并引入更多元化的投资风格。” 对于部分基金,例如 北京银行丰业银行新兴消费混合基金 ,投资组合调整似乎已经开始。文件显示,该基金近几个季度已减持海尔智能家居和河北洋源智汇饮料等股票,转而增持 中基创新科技股份有限公司 。 所谓 “风格漂移”或将影响下一轮价值基金的阿尔法周期 ——即基金偏离其既定的投资策略——通常被视为追逐业绩的迹象,并且在过去往往与市场转折点相吻合。奇怪的是,消费板块如今却发现自己正处于几年前曾受益于该策略的反面。 在白酒股热潮 的最后阶段 ——贵州茅台的股价从疫情暴跌中反弹超过一倍,并在2021年初创下历史新高——许多投资标的并非消费领域的共同基金 纷纷涌入 白酒股,试图搭上这波上涨的顺风车。如今,该公司股价已较峰值下跌约50%。 据彭博社汇编的数据显示,蓝筹基金五年前资产规模接近900亿元人民币(133亿美元),而截至3月底,其管理的资产规模仅约为270亿元人民币。 “委任具有不同专业领域的基金经理共同管理投资组合,有助于带来互补的视角,提升投资者的体验。”易发基金的一位...

随着就业市场推动美联储加息预期,新任主席沃什面临的压力越来越大

  周五公布的强劲就业数据显示,美国劳动力市场已经恢复正常,这引发了人们对通胀再次抬头的担忧,并强化了一些美联储官员的观点,即他们可能需要在今年晚些时候提高利率。 对于新上任的美联储主席 凯文·沃什来说 ,不断变化的经济前景是对他能否说服市场相信他有能力控制物价,同时抵御白宫要求降低借贷成本的压力的一次早期考验。 美联储观察人士表示,当他于6月16日至17日主持首次政策会议时,最容易的部分是避免在会后声明中透露任何近期降息的迹象。难点在于如何表明他计划如何抑制通胀。 “凯文·沃什必须在通胀问题上拿出强硬立场,” 海军联邦信贷联盟首席经济学家希瑟·朗表示 ,“否则他将失去债券市场的信任。” 沃什自2006年至2011年担任美联储理事以来,一直是一位坚定的通胀 鹰派。但在被提名为美联储主席前的几个月里,他表示应该降息,并反复指出他认为最终会证明低利率合理性的种种因素。唐纳德·特朗普总统暗示,他之所以选择沃什担任这一最高职位,正是因为他愿意降息。 周五,当记者问及他是否认为新任美联储主席应该降息时,特朗普表示,他将把这个决定留给沃什。但他同时指出,金融市场对通胀的关注度过高。他还在社交媒体上 发帖 警告说:“增长并不意味着通胀!” 撇开特朗普不谈,前景与几个月前相比已经发生了巨大变化,当时美联储官员更担心的是疲软的就业市场而不是通货膨胀,而且大多数人认为今年有可能进一步降息。 就业数据公布之际,4月份的价格报告显示,美联储首选的 通胀指标同比上涨3.8% ,创下2023年以来的最大涨幅。这主要是(但不完全是)伊朗战争对能源价格造成的冲击所致。 交易员们已经押注美联储将在2026年底前至少加息一次,经济学家们也在调整预期。法国巴黎银行目前预计,美联储将于12月开始加息,并在随后的几个月继续加息,以扭转该央行在2025年实施的75个基点的宽松政策。 “今天公布的稳健的非农就业数据对我们有利,”法国巴黎银行分析师在给客户的报告中写道。 经济学家在分析数据时也发现了一些问题。与世界杯相关的超大规模招聘——世界杯将于6月和7月由美国联合举办——将在赛事结束后放缓或停止,这意味着就业反弹可能最终会消退。 不过,目前强劲的就业形势意味着关注点仍然在于通胀。 最新警告 “我们距离失业率下降、美联储成员开始担心明年第二轮工资效应已经不远了,” 咨询公司 RSM US 的首席经济学家...