跳至主要内容

揭秘DeepSeek:一个更极致的中国技术理想主义故事

 

做贡献者,而非搭便车者。

文 | 于丽丽
编辑 | 刘旌

中国的7家大模型创业公司中,DeepSeek(深度求索)最不声不响,但它又总能以出其不意的方式被人记住。

一年前,这种出其不意源自它背后的量化私募巨头幻方,是大厂外唯一一家储备万张A100芯片的公司,一年后,则来自它才是引发中国大模型价格战的源头。

在被AI连续轰炸的5月,DeepSeek一跃成名。起因是他们发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。

DeepSeek被迅速冠以“AI界拼多多”之称的同时,字节、腾讯、百度、阿里等大厂也按耐不住,纷纷降价。中国大模型价格战由此一触即发。

弥漫的硝烟其实掩盖了一个事实:与很多大厂烧钱补贴不同,DeepSeek是有利润的。

这背后,是DeepSeek对模型架构进行了全方位创新。它提出的一种崭新的MLA(一种新的多头潜在注意力机制)架构,把显存占用降到了过去最常用的MHA架构的5%-13%,同时,它独创的DeepSeekMoESparse结构,也把计算量降到极致,所有这些最终促成了成本的下降。

在硅谷,DeepSeek被称作“来自东方的神秘力量”。SemiAnalysis首席分析师认为,DeepSeek V2论文“可能是今年最好的一篇”。OpenAI前员工Andrew Carr认为论文“充满惊人智慧”,并将其训练设置应用于自己的模型。而OpenAI前政策主管、Anthropic联合创始人Jack Clark认为,DeepSeek“雇佣了一批高深莫测的奇才”,还认为中国制造的大模型,“将和无人机、电动汽车一样,成为不容忽视的力量。”

在基本由硅谷牵动故事进展的AI浪潮里,这是罕有的情形。多位行业人士告诉我们,这种强烈的反响源自架构层面的创新,是国产大模型公司乃至全球开源基座大模型都很罕见的尝试。一位AI研究者表示,Attention架构提出多年来,几乎未被成功改过,更遑论大规模验证。“这甚至是一个做决策时就会被掐断的念头,因为大部分人都缺乏信心。”

而另一方面,国产大模型之前很少涉足架构层面的创新,也是因为很少有人主动去击破那样一种成见:美国更擅长从0-1的技术创新,而中国更擅长从1-10的应用创新。何况这种行为非常不划算——新一代模型,过几个月自然有人做出来,中国公司只要跟随、做好应用即可。对模型结构进行创新,意味着没有路径可依,要经历很多失败,时间、经济成本都耗费巨大。

DeepSeek显然是逆行者。在一片认为大模型技术必然趋同,follow是更聪明捷径的喧哗声中,DeepSeek看重“弯路”中积累的价值,并认为中国的大模型创业者除应用创新外,也可以加入到全球技术创新的洪流中。

DeepSeek的很多抉择都与众不同。截至目前,7家中国大模型创业公司中,它是唯一一家放弃“既要又要”路线,至今专注在研究和技术,未做toC应用的公司,也是唯一一家未全面考虑商业化,坚定选择开源路线甚至都没融过资的公司。这些使得它经常被遗忘在牌桌之外,但在另一端,它又经常在社区被用户“自来水”式传播。

DeepSeek究竟是如何炼成的?我们为此访谈了甚少露面的DeepSeek创始人梁文锋。

这位从幻方时代,就在幕后潜心研究技术的80后创始人,在DeepSeek时代,依旧延续着他的低调作风,和所有研究员一样,每天“看论文,写代码,参与小组讨论”。

和很多量化基金创始人都有过海外对冲基金履历,多出身物理、数学等专业不同的是,梁文锋一直是本土背景,早年就读的也是浙江大学电子工程系人工智能方向。

多位行业人士和DeepSeek研究员告诉我们,梁文锋是当下中国AI界非常罕见的“兼具强大的infra工程能力和模型研究能力,又能调动资源”、“既可以从高处做精准判断,又可以在细节上强过一线研究员”的人,他拥有“令人恐怖的学习能力”,同时又“完全不像一个老板,而更像一个极客”。

这是一次尤为难得的访谈。访谈里,这位技术理想主义者,提供了目前中国科技界特别稀缺的一种声音:他是少有的把“是非观”置于“利害观”之前,并提醒我们看到时代惯性,把“原创式创新”提上日程的人。

一年前,DeepSeek刚下场时,我们初次访谈了梁文锋 :《疯狂的幻方:一家隐形AI巨头的大模型之路》 。如果说当时那句「务必要疯狂地怀抱雄心,且还要疯狂地真诚」还是一句美丽的口号,一年过去,它已经在成为一种行动。

以下为对话部分:

价格战第一枪是怎么打响的?

「暗涌」:DeepSeek V2模型发布后,迅速引发一场血雨腥风的大模型价格战,有人说你们是行业的一条鲶鱼。

梁文锋:我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。

「暗涌」:这个结果让你们意外吗?

梁文锋:非常意外。没想到价格让大家这么敏感。我们只是按照自己的步调来做事,然后核算成本定价。我们的原则是不贴钱,也不赚取暴利。这个价格也是在成本之上稍微有点利润。

「暗涌」:5天后智谱AI就跟进了,之后是字节、阿里、百度、腾讯等大厂。

梁文锋:智谱AI降的是一个入门级产品,和我们同级别的模型仍然收费很贵。字节是真正第一个跟进的。旗舰模型降到和我们一样的价格,然后触发了其它大厂纷纷降价。因为大厂的模型成本比我们高很多,所以我们没想到会有人亏钱做这件事,最后就变成了互联网时代的烧钱补贴的逻辑。

「暗涌」:外部看来,降价很像在抢用户,互联网时代的价格战通常如此。

梁文锋:抢用户并不是我们的主要目的。我们降价一方面是因为我们在探索下一代模型的结构中,成本先降下来了,另一方面也觉得无论API,还是AI,都应该是普惠的、人人可以用得起的东西。

「暗涌」:在这之前,大部分中国公司都会直接copy这一代的 Llama结构去做应用,为什么你们会从模型结构切入?

梁文锋:如果目标是做应用,那沿用 Llama结构,短平快上产品也是合理选择。但我们目的地是AGI,这意味着我们需要研究新的模型结构,在有限资源下,实现更强的模型能力。这是scale up到更大模型所需要做的基础研究之一。除了模型结构,我们还做了大量其他的研究,包括怎么构造数据,如何让模型更像人类等,这都体现在我们发布的模型里。另外,Llama的结构,在训练效率和推理成本上,和国外先进水平估计也已有两代差距。

「暗涌」:这种代差主要来自哪里?

梁文锋:首先训练效率有差距。我们估计,国内最好的水平和国外最好的相比,模型结构和训练动力学上可能有一倍的差距,光这一点我们要消耗两倍的算力才能达到同样效果。另外数据效率上可能也有一倍差距,也就是我们要消耗两倍的训练数据和算力,才能达到同样的效果。合起来就要多消耗4倍算力。我们要做的,正是不停地去缩小这些差距。

「暗涌」:大部分中国公司都选择既要模型又要应用,为什么DeepSeek目前选择只做研究探索?

梁文锋:因为我们觉得现在最重要的是参与到全球创新的浪潮里去。过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。

「暗涌」:互联网和移动互联网时代留给大部分人的惯性认知是,美国擅长搞技术创新,中国更擅长做应用。

梁文锋:我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去三十多年IT浪潮里,我们基本没有参与到真正的技术创新里。我们已经习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。Scaling Law也在被如此对待。

但其实,这是西方主导的技术社区一代代孜孜不倦创造出来的,只因为之前我们没有参与这个过程,以至于忽视了它的存在。

真正的差距不是一年或两年,而是原创和模仿之差

「暗涌」:为什么DeepSeek V2会让硅谷的很多人惊讶?

梁文锋:在美国每天发生的大量创新里,这是非常普通的一个。他们之所以惊讶,是因为这是一个中国公司,在以创新贡献者的身份,加入到他们游戏里去。毕竟大部分中国公司习惯follow,而不是创新。

「暗涌」:但这种选择放在中国语境里,也过于奢侈。大模型是一个重投入游戏,不是所有公司都有资本只去研究创新,而不是先考虑商业化。

梁文锋:创新的成本肯定不低,过去那种拿来主义的惯性也和过去的国情有关。但现在,你看无论中国的经济体量,还是字节、腾讯这些大厂的利润,放在全球都不低。我们创新缺的肯定不是资本,而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。

「暗涌」:为什么中国公司——包括不缺钱的大厂,这么容易把快速商业化当第一要义?

梁文锋:过去三十年,我们都只强调赚钱,对创新是忽视的。创新不完全是商业驱动的,还需要好奇心和创造欲。我们只是被过去那种惯性束缚了,但它也是阶段性的。

「暗涌」:但你们究竟是一个商业组织,而非一个公益科研机构,选择创新,又通过开源分享出去,那要在哪里形成护城河?像5月这次MLA架构的创新,也会很快被其他家copy吧?

梁文锋:在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。所以我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know-how,形成可以创新的组织和文化,就是我们的护城河。

开源,发论文,其实并没有失去什么。对于技术人员来说,被follow是很有成就感的事。其实,开源更像一个文化行为,而非商业行为。给予其实是一种额外的荣誉。一个公司这么做也会有文化的吸引力。

「暗涌」:你怎么看类似朱啸虎的这种市场信仰派观点?

梁文锋:朱啸虎是自洽的,但他的打法更适合快速赚钱的公司,而你看美国最赚钱的公司,都是厚积薄发的高科技公司。

「暗涌」:但做大模型,单纯的技术领先也很难形成绝对优势,你们赌的那个更大的东西是什么?

梁文锋我们看到的是中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。

英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。

更多的投入并不一定产生更多的创新

「暗涌」:现在的DeepSeek有一种OpenAI早期的理想主义气质,也是开源的。后边你们会选择闭源吗?OpenAI和Mistral都有过从开源到闭源的过程。

梁文锋:我们不会闭源。我们认为先有一个强大的技术生态更重要。

「暗涌」:你们有融资计划吗?看有媒体报道,幻方对DeepSeek有独立拆分上市的计划,硅谷的AI创业公司,最终也都难免要和大厂绑定。

梁文锋:短期内没有融资计划,我们面临的问题从来不是钱,而是高端芯片被禁运。

「暗涌」:很多人认为,做AGI和做量化是完全不同的两件事,量化可以闷声去做,但AGI可能更需要高举高打,需要结盟,这样可以让你的投入变大。

梁文锋:更多的投入并不一定产生更多的创新。否则大厂可以把所有的创新包揽了。

「暗涌」:你们现在不做应用,是因为你们没有运营的基因吗?

梁文锋:我们认为当前阶段是技术创新的爆发期,而不是应用的爆发期。长远来说,我们希望形成一种生态,就是业界直接使用我们的技术和产出,我们只负责基础模型和前沿的创新,然后其它公司在DeepSeek 的基础上构建toB、toC的业务。如果能形成完整的产业上下游,我们就没必要自己做应用。当然,如果需要,我们做应用也没障碍,但研究和技术创新永远是我们第一优先级。

「暗涌」:但选择API的话,为什么选择DeepSeek,而不是大厂?

梁文锋:未来的世界很可能是专业化分工的,基础大模型需要持续创新,大厂有它的能力边界,并不一定适合。

「暗涌」:但技术真的可以拉开差距吗?你也说过并不存在绝对的技术秘密。

梁文锋:技术没有秘密,但重置需要时间和成本。英伟达的显卡,理论上没有任何技术秘密,很容易复制,但重新组织团队以及追赶下一代技术都需要时间,所以实际的护城河还是很宽。

「暗涌」:你们降价后,字节率先跟进,说明他们还是感受到某种威胁。你怎么看创业公司与大厂竞争的新解法?

梁文锋:说实话我们不太care这件事,只是顺便做了这件事。提供云服务不是我们的主要目标。我们的目标还是去实现AGI。

目前没有看到什么新解法,但大厂也没有明显占优。大厂有现成的用户,但它的现金流业务也是它的包袱,也会让它成为随时被颠覆的对象。

「暗涌」:你怎么看DeepSeek之外的6家大模型创业公司的终局?

梁文锋:可能活下来2到3家。现在都还处在烧钱阶段,所以那些自我定位清晰、更能精细化运营的,更有机会活下来。其它公司可能会脱胎换骨。有价值的东西不会烟消云散,但会换一种方式。

「暗涌」:幻方时代,面对竞争的姿态就被评价为“我行我素”,很少在意横向比较。关于竞争,你思考的原点是什么?

梁文锋:我经常思考的是,一个东西能不能让社会的运行效率变高,以及你能否在它的产业分工链条上找到擅长的位置。只要终局是让社会效率更高,就是成立的。中间很多都是阶段性的,过度关注必然眼花缭乱。

一群做“高深莫测”事的年轻人

「暗涌」:OpenAI前政策主管、Anthropic联合创始人Jack Clark认为DeepSeek雇佣了“一批高深莫测的奇才”,做出DeepSeek v2的是怎样一群人?

梁文锋:并没有什么高深莫测的奇才,都是一些Top高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。

「暗涌」:很多大模型公司都执着地去海外挖人,很多人觉得这个领域前50名的顶尖人才可能都不在中国的公司,你们的人都来自哪里?

梁文锋:V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。

「暗涌」:这次MLA创新是如何发生的?听说idea最早来自一个年轻研究员的个人兴趣?

梁文锋:在总结出Attention架构的一些主流变迁规律后,他突发奇想去设计一个替代方案。不过从想法到落地,中间是一个漫长的过程。我们为此组了一个team,花了几个月时间才跑通。

「暗涌」:这种发散性灵感的诞生和你们完全创新型组织的架构很有关系。幻方时代,你们就很少自上而下地指派目标或任务。但AGI这种充满不确定性的前沿探索,是否多了管理动作?

梁文锋:DeepSeek也全是自下而上。而且我们一般不前置分工,而是自然分工。每个人有自己独特的成长经历,都是自带想法的,不需要push他。探索过程中,他遇到问题,自己就会拉人讨论。不过当一个idea显示出潜力,我们也会自上而下地去调配资源。

「暗涌」:听说DeepSeek对于卡和人的调集非常灵活。

梁文锋:我们每个人对于卡和人的调动是不设上限的。如果有想法,每个人随时可以调用训练集群的卡无需审批。同时因为不存在层级和跨部门,也可以灵活调用所有人,只要对方也有兴趣。

「暗涌」:一种松散的管理方式也取决于你们筛选到了一批强热爱驱动的人。听说你们很擅长从细节招人, 可以让一些非传统评价指标里优秀的人被选出来。

梁文锋:我们选人的标准一直都是热爱和好奇心,所以很多人会有一些奇特的经历,很有意思。很多人对做研究的渴望,远超对钱的在意。

「暗涌」: transformer诞生在谷歌的AI Lab,ChatGPT诞生在OpenAI,你觉得大公司的AILab 和一个创业公司对于创新产生的价值有什么不同?

梁文锋:不管是Google实验室,还是OpenAI,甚至中国大厂的AI Lab,都很有价值的。最后是OpenAI做出来,也有历史的偶然性。

「暗涌」:创新很大程度也是一种偶然吗?我看你们办公区中间那排会议室左右两侧都设置了可以随意推开的门。你们同事说,这就是给偶然留出空隙。transfomer诞生中就发生过那种偶然经过的人听到后加入,最终把它变成一个通用框架的故事。

梁文锋:我觉得创新首先是一个信念问题。为什么硅谷那么有创新精神?首先是敢。Chatgpt出来时,整个国内对做前沿创新都缺乏信心,从投资人到大厂,都觉得差距太大了,还是做应用吧。但创新首先需要自信。这种信心通常在年轻人身上更明显。

「暗涌」:但你们不参与融资,很少对外发声,社会声量上肯定不如那些融资活跃的公司,怎么确保DeepSeek就是做大模型的人的首选?

梁文锋:因为我们在做最难的事。对顶级人才吸引最大的,肯定是去解决世界上最难的问题。其实,顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了,使得他们没有机会被识别出来。我们在做最难的事,对他们就是有吸引力的。

「暗涌」:前一段OpenAI的发布并没有等来GPT5,很多人觉得这是技术曲线明显在放缓,也很多人开始质疑Scaling Law,你们怎么看?

梁文锋:我们偏乐观,整个行业看起来都符合预期。OpenAI也不是神,不可能一直冲在前面。

「暗涌」:你觉得AGI还要多久实现,发布DeepSeek V2前,你们发布过代码生成和数学的模型,也从dense模型切换到了MOE,所以你们的AGI路线图有哪些坐标?

梁文锋:可能是2年、5年或者10年,总之会在我们有生之年实现。至于路线图,即使在我们公司内部,也没有统一意见。但我们确实押注了三个方向。一是数学和代码,二是多模态,三是自然语言本身。数学和代码是AGI天然的试验场,有点像围棋,是一个封闭的、可验证的系统,有可能通过自我学习就能实现很高的智能。另一方面,可能多模态、参与到人类的真实世界里学习,对AGI也是必要的。我们对一切可能性都保持开放。

「暗涌」:你觉得大模型终局是什么样态?

梁文锋:会有专门公司提供基础模型和基础服务,会有很长链条的专业分工。更多人在之上去满足整个社会多样化的需求。

所有的套路都是上一代的产物

「暗涌」:过去这一年,中国的大模型创业还是有很多变化的,比如去年开头还很活跃的王慧文中场退出了,后来加入的公司也开始呈现出差异化。

梁文锋:王慧文自己承担了所有的损失,让其他人全身而退。他做了一个对自己最不利,但对大家都好的选择,所以他做人是很厚道的,这点我很佩服。

「暗涌」:现在你的精力最多放在哪里?

梁文锋:主要的精力在研究下一代的大模型。还有很多未解决的问题。

「暗涌」:其他几家大模型创业公司都是坚持既要又要,毕竟技术不会带来永久领先,抓住时间窗口把技术优势落到产品也很重要,DeepSeek敢于专注在模型研究上是因为模型能力还不够吗?

梁文锋:所有的套路都是上一代的产物,未来不一定成立。拿互联网的商业逻辑去讨论未来AI的盈利模式,就像马化腾创业时,你去讨论通用电气和可口可乐一样。很可能是一种刻舟求剑。

「暗涌」:过去幻方就有很强的技术和创新基因,成长也比较顺利,这是你偏乐观的原因吗?

梁文锋:幻方某种程度上增强了我们对技术驱动型创新的信心,但也不都是坦途。我们经历了一个漫长的积累过程。外部看到的是幻方2015年后的部分,但其实我们做了16年。

「暗涌」:回到关于原创式创新的话题。现在经济开始进入下行,资本也进入冷周期,所以它对原创式创新是否会带来更多抑制?

梁文锋:我倒觉得未必。中国产业结构的调整,会更依赖硬核技术的创新。当很多人发现过去赚快钱很可能来自时代运气,就会更愿意俯身去做真正的创新。

「暗涌」:所以你对这件事也是乐观的?

梁文锋:我是八十年代在广东一个五线城市长大的。我的父亲是小学老师,九十年代,广东赚钱机会很多,当时有不少家长到我家里来,基本就是家长觉得读书没用。但现在回去看,观念都变了。因为钱不好赚了,连开出租车的机会可能都没了。一代人的时间就变了。

以后硬核创新会越来越多。现在可能还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。

评论

此博客中的热门博文

2026年中央一号文件(全文)

                                                                         中共中央 国务院 关于锚定农业农村现代化 扎实推进乡村全面振兴的意见 (2026年1月3日) 农业农村现代化关系中国式现代化全局和成色。“十四五”时期,农业综合生产能力迈上新台阶,脱贫攻坚成果巩固拓展,农民生活水平显著提高,乡村全面振兴取得明显进展。“十五五”时期是基本实现社会主义现代化夯实基础、全面发力的关键时期,要加快补上农业农村领域突出短板,加快建设农业强国。2026年是“十五五”开局之年,做好“三农”工作至关重要。要坚持以习近平新时代中国特色社会主义思想为指导,深入贯彻党的二十大和二十届历次全会精神,认真落实四中全会部署,全面贯彻习近平总书记关于“三农”工作的重要论述和重要指示精神,坚持把解决好“三农”问题作为全党工作重中之重,坚持和加强党对“三农”工作的全面领导,完整准确全面贯彻新发展理念,坚持稳中求进工作总基调,坚持农业农村优先发展,坚持城乡融合发展,锚定农业农村现代化,以推进乡村全面振兴为总抓手,以学习运用“千万工程”经验为引领,以改革创新为根本动力,提高强农惠农富农政策效能,守牢国家粮食安全底线,持续巩固拓展脱贫攻坚成果,提升乡村产业发展水平、乡村建设水平、乡村治理水平,努力把农业建成现代化大产业、使农村基本具备现代生活条件、让农民生活更加富裕美好,为推进中国式现代化提供基础支撑。 一、提升农业综合生产能力和质量效益 (一)稳定发展粮油生产。粮食产量稳定在1.4万亿斤左右。坚持产量产能、生产生态、增产增收一起抓,加力实施新一轮千亿斤粮食产能提升行动,促进良田良种良机良法集成增效,推进粮油作物大面积提单产。因地制宜优化农业生产结构和区域布局,推动粮食品种培优和品质提升,实施粮食流通提质增效项目,促进适销对路、优质优价。巩固提升大豆产能,做好产销衔接...

有什么能阻止德国工业的衰落?

 FT: 在德国工程技术引以为傲的核心地带,繁荣不再是理所当然的。 上个月,激光和机床制造商通快(Trumpf)——该国被称为“中型企业”(Mittelstand)的全球成功家族企业的代表——自全球金融危机以来首次出现亏损。 24小时内,其所在地——位于富裕的西南部巴登-符腾堡州的迪岑根市宣布将加大财政紧缩力度。当地企业税是该市的主要收入来源,但自2023年以来已暴跌80%,导致该市未来几年预算将长期处于严重赤字状态。 迪岑根市财政局长帕特里克·迈尔告诉《金融时报》,虽然他预料到会受到冲击,“但我真的没想到情况会这么糟糕”。迈尔确信“我们正面临一场结构性危机”。 Trumpf是该镇最大的纳税人,截至 6 月的 12 个月内,其销售额下降了 16%,至 43 亿欧元,原因是订单连续第三年减少。 “目前的情况似乎常常陷入瘫痪,”首席执行官尼古拉·莱宾格-卡穆勒在10月份向记者发布年度业绩报告时表示。 这种悲观的评估反映了德国的国民情绪。欧洲最大的经济体已经连续四年陷入停滞。保时捷咨询公司合伙人德克·菲茨表示,保守派总理弗里德里希·默茨上任六个月后,“德国工程行业的危机正在迅速加剧”。他还补充说,很明显,此次衰退并非周期性现象,也不会在下一次经济复苏中“自动消失”。 尽管9月份出现部分反弹,但德国工业生产仍维持在2005年的水平。“德国的许多核心经济优势已经变成了弱点,”总部位于慕尼黑的咨询公司罗兰贝格的全球董事总经理马库斯·贝雷特表示。这些弱点包括难以脱碳的庞大工业基础、在全球化面临威胁之际对出口的高度依赖,以及不得不放弃140年内燃机技术积累的强大汽车工业。 所有这一切都因美国和中国相隔十年做出的两项截然不同的政治决定而加剧:唐纳德·特朗普发起的贸易战,以及北京十年前决定将自己打造成为全球高科技工程强国。 特朗普的关税政策已经对德国出口商造成了沉重打击:今年前九个月,德国对美国的出口下降了 7.4%。 但中国的前景反而更加黯淡,造成了“中国冲击”,如今正在侵蚀全球成功的德国公司的利润。 在新冠疫情爆发前的近二十年里,中国对德国工程产品和汽车的需求似乎永无止境,推动了默克尔时代企业利润、就业和经济活动的增长。 然而,法兰克福咨询公司Thin Ice Macroeconomics的创始人斯皮罗斯·安德烈奥普洛斯表示,自疫情爆发以来,中国“在德国擅长的领域正日益超越...

如果人工智能泡沫破裂,可能会引发一场不同寻常的经济衰退

 经济学人: 如果   美国   股市 崩盘,这将是历史上最受关注的金融崩溃之一。从银行高管到 国际货币基金组织, 所有人都对美国科技公司过高的估值发出警告。各国央行行长正严阵以待,准备应对金融危机;那些在2007-2009年做空次贷危机而声名鹊起的投资者,如今又卷土重来,准备再次进行“大做空”。任何市场波动的迹象,例如近期 纳斯达克 科技股指数的小幅周线下跌,都会引发市场即将崩盘的猜测。 难怪如此。在“七大科技巨头”的推动下, 标普 500指数的周期性调整市盈率已达到互联网泡沫时期以来的最高水平。投资者押注于人工智能(  AI )领域的巨额投资终将获得回报。然而,相关数字令人望而生畏。摩根大通银行估计,到2030年,企业若想在 人工智能资本 支出方面实现10%的预期回报,就需要每年6500亿美元的 人工智能 收入——相当于每位iPhone用户每年支付超过400美元。历史表明,即便新技术最终会改变世界,但如此高的期望往往在初期就会落空。 尽管股市崩盘几乎不会让任何人感到意外,但很少有人认真思考其后果。部分原因是,目前股市暴跌引发全面金融危机的可能性很小。与2000年代末期普遍存在的杠杆和复杂的金融运作助长了次贷危机中债务驱动的房地产泡沫不同,如今 人工智能的 狂热主要由股权融资支撑。此外,近年来实体经济已经证明,它能够很好地抵御从欧洲能源危机到美国关税等各种冲击。 经济衰退正变得越来越罕见 。 然而,认为股市暴跌的影响仅限于投资者的钱包,那就大错特错了。 繁荣持续的时间越长,其融资就越不透明 。即便没有金融危机,股市的急剧下跌最终也可能使原本韧性十足的世界经济陷入衰退。 脆弱性的根源在于美国消费者。股票占美国家庭财富的21%,比互联网泡沫鼎盛时期高出约四分之一。过去一年,与 人工智能 相关的资产贡献了美国人财富增长的近一半。随着家庭财富的增长,他们也逐渐习惯于减少储蓄,储蓄水平低于新冠疫情爆发前(尽管不及次贷危机时期那么低)。 股市崩盘将逆转这些趋势。 我们计算得出 ,如果股市下跌幅度与互联网泡沫破裂相当,美国家庭的净资产将减少8%。这可能导致消费支出大幅缩减。根据经验法则,这种回落将相当于 GDP的1.6%——足以将劳动力市场本已疲软的美国推入衰退。对消费者的影响将远远超过 人工智能 投资枯竭 可能带来的影响 ,而这些投资大多...

随着美联储降息预期减弱,避险情绪抬头,市场高增长股票下跌

 BBG: 由于美国政府停摆导致关键数据缺失,美联储决策者们如同盲人摸象,这种不确定性正在考验投资者的神经。 周四,市场突然涌现避险情绪,导致今年涨幅最大的几只股票大幅下跌,加密货币近期的跌势也进一步加剧。许多交易员指出,美联储12月再次降息的 可能性降低 ,是引发此次抛售潮的最可能原因。掉期交易员目前预计降息的可能性约为50%,低于一周前的72%,而美联储官员在近期的讲话中也未流露出降息的决心。 那些被称为高动量股以及散户投资者青睐的股票,在股市抛售潮中首当其冲,跌幅创下4月以来最大,而它们在今年早些时候曾录得市场最强劲的涨幅之一。动量策略的核心在于买入近期表现优异的股票,同时做空表现落后的股票。其中一些表现优异的股票与人工智能相关,在市场对这项技术的狂热推动下,它们的估值也随之飙升。 Miller Tabak + Co.首席市场策略师Matt Maley 表示:“利率下调的承诺曾是许多投资者愿意忽视动量股高估值的原因。 如今,随着这一承诺的吸引力减弱,投资者正在减持这些高估值股票。” 美国银行高 动量股票 组合周四下跌4.7%,创下自4月份以来最大单日跌幅,当时正值 特朗普 总统关税威胁最为激烈之时。该组合此前已从4月份的低点反弹,涨幅高达63%(截至周一)。 JonesTrading 首席市场策略师 Michael O'Rourke 表示,高动量股票往往是成长型股票,它们受益于较低的利率,因为这会降低估值模型中的贴现率,从而使其市盈率得以扩张。 “如果利率下降的速度没有投资者预期的那么快,那么预期就会重置,从而导致抛售,进而收窄市盈率,以适应新的预期,”他说道。 近几周来,人工智能板块的受益股已开始回落,投资者对估值过高和巨额资本支出的担忧促使他们获利了结。美国银行动量指数中的人工智能相关股票周四大幅下跌,其中 闪迪公司(SanDisk Corp.) 下跌14%, Astera Labs Inc. 下跌8.4%。在大型人工智能相关股票中,英伟达公司 (Nvidia Corp.) 下跌3.6%, 博通公司(Broadcom Inc.) 下跌4.3%, Palantir Technologies Inc. 下跌6.5%。 美国主要股指中,纳斯达克100指数表现最差,下跌2%,标普500指数下跌1.7%。比特币跌幅扩大,从10月份创下的纪录跌幅超过22%。 ...

外国投资者重返中国股市

 FT: 外国投资者对中国股票的购买量已达到四年来的最高水平,这表明全球投资者正在重新评估这个直到最近还被认为“不值得投资”的市场。 根据国际金融协会(一家全球银行业贸易机构)的数据,今年1月至10月,境外资金流入中国股市的总额为506亿美元,高于2024年的114亿美元。 今年以来,受DeepSeek发布突破性模型引发的人工智能热潮以及亚洲金融中心香港一系列强劲上市的推动,在中国大陆和香港上市的中国股票大幅上涨。 在经历了多年的惨淡回报之后,这些增长出现了 。此前,由于对经济增长放缓以及华盛顿和北京之间日益紧张的局势的担忧加剧, 外国投资者纷纷抛售了他们的股票。 “中国股市目前的估值仍然远低于世界其他地区,但他们却拥有一些科技领域最优秀的公司,”Federated Hermes除日本以外的亚洲股票主管乔纳森·派恩斯表示。“在某些领域,他们是美国唯一真正意义上的竞争对手。” 今年的外资购买额仍低于2021年创下的736亿美元的全年纪录。2021年,中国沪深300指数从新冠疫情的初期冲击中强劲反弹,创下历史新高。然而,这标志着外资连续数年下滑后出现逆转。 “两年前,对很多人来说,中国是不值得投资的,”Alpine Macro 的首席新兴市场和中国策略师王岩表示。 北京去年停止发布通过香港追踪中国内地股票投资的每日数据,这使得评估外资流入水平变得更加困难。国际金融协会(IIF)追踪的是外部投资组合负债的变化,并且不包括在美国上市的中国公司。 花旗银行表示,自美国4月份实施“解放日”关税以来,中国股票的买盘有所增加,不同类型的客户中,买盘比例约为55%,卖盘比例约为45%。 根据 EPFR Global 追踪交易所交易基金和共同基金资金流入的数据,今年外国主动型基金经理净卖出中国股票,但被动型基金的资金流入抵消了这一损失。 富达国际亚太区投资指导主管斯图尔特·兰布尔表示,今年中国股市的强劲表现主要得益于散户投资者大量涌入国内市场。 今年以来,中国内地投资者已向香港股市投入1.3万亿港元(1687亿美元),创历史新高,目前约占香港交易所成交额的20%。 外国投资者对中国股市的谨慎态度源于房地产市场的下滑、 对私营企业的打压 以及不断升级的中美贸易战,这些因素共同导致股市从峰值下跌了近一半。 法国巴黎银行资产管理公司首席市场策略师丹尼尔·莫里斯表示:“曾经有一段时间,...

由于特朗普关税推高消费者成本,全球最大铝生产商提高了产品价格

 BBG: 力拓集团 将对销往美国的铝材征收附加费,此举可能会进一步扰乱北美市场。北美市场已经因进口关税而动荡不安,这些关税正在推高消费者的成本。 据知情人士透露,由于需求开始超过供应,这家英澳矿业巨头以库存低为由,对运往美国的铝订单加收额外费用。 美国严重依赖外国铝供应,因为其自身产能不足以满足需求。加拿大是美国最大的 外国铝供应国 ,占美国铝进口总量的50%以上。 今年早些时候,美国总统特朗普对这种轻质金属(其用途涵盖从汽水罐到建筑等各个领域)征收了50%的进口关税,这使得本已极度紧张的美国市场雪上加霜。关税导致 加拿大进口金属 价格过高,美国金属加工商和消费者难以承受。他们转而动用国内库存和外汇仓库,导致供应减少,价格飙升。 最新的加价相当于在原有价格基础上再加价,因为美国铝价已经包含了所谓的“ 中西部溢价”  ——这笔费用是在伦敦基准价格之上增加的,反映了将铝运往美国市场所需的运输、仓储、保险和融资成本。每个地区的溢价都不同,通常由价格报告机构设定。 知情人士透露,新的附加费比中西部地区的溢价高出1到3美分。由于涉及私人合同细节,这些人士要求匿名。虽然金额不大,但加上中西部地区的溢价,每吨金属的价格将额外增加2006美元,而原材料价格约为每吨2830美元,这意味着溢价超过70%。这高于特朗普政府征收的50%的进口关税。 消费者和交易商形容市场几乎已经崩溃,附加费的上涨最清晰地表明了 特朗普的税收政策 对市场 结构造成的深远破坏 。上周,运往美国的铝价(包括基准价格和中西部溢价)创下历史新高,而库存却在不断减少。 “现在美国想要吸引铝业企业,就必须付出代价,因为美国并不是唯一一个铝短缺的市场,” 美国银行 金属研究主管 迈克尔·维德默表示 。 美国铝价飙升,关税收紧金属市场 美国市场的区域溢价已攀升至历史新高。 资料来源:Fastmarkets、伦敦金属交易所、彭博社 注:美国铝价为伦敦金属交易所(LME)现货价格加上地区溢价。 力拓集团拒绝置评。加拿大铝业协会 主席 让 ·西马尔 解释说,买家如果要求超过30天的付款期限,应该预期会支付溢价,以抵消生产商更高的融资成本。 “美国政府对铝征收 50% 的关税,大大增加了在美国持有铝库存的风险,因为任何关税变化都可能直接影响现金交易和库存融资交易的经济效益,”西马尔德说。 美国铝价飙升,高于海外...

拉里·萨默斯怎么会这么蠢?

 POLITICO: 挖洞的第一条规则就是停止挖洞,”拉里·萨默斯几个月前在接受《纽约时报》采访时说道,他在采访中解释了为什么他认为特朗普政府应该停止对外国征收关税。 萨默斯本该听从自己的建议:直到 2019 年 7 月 5 日,也就是爱泼斯坦最后一次被捕的前一天,他才停止为自己身处的困境挖坑,当时他给已故的性犯罪者杰弗里·爱泼斯坦发送了最后一封电子邮件。 现在,在有关萨默斯与爱泼斯坦长达十多年的通信往来被曝光之后——当时爱泼斯坦已经因引诱未成年人卖淫而被判入狱——萨默斯宣布他将退出公开活动,至少不会再参与那些他可能会被问及爱泼斯坦相关问题的场合。 萨默斯表示他将继续在哈佛大学任教,他目前担任“大学教授”,这是哈佛大学授予教职人员的最高荣誉——在哈佛文理学院约900名终身教授中,只有24位大学教授。这个数字可能很快就会降至23位。伊丽莎白·沃伦在当选美国参议员之前曾是哈佛法学院的教授,她已经呼吁哈佛大学解雇萨默斯。学生、校友和捐赠者肯定也会纷纷响应。虽然任何时候让一名被定罪的性犯罪者担任笔友都不是好事,但在唐纳德·特朗普总统密切关注之际,哈佛大学此时接纳这样一位显而易见的“累赘”尤其不合时宜。 萨默斯如今面临着职业生涯黯然落幕的局面,他数十年的公共生涯可谓跌宕起伏。即便像萨默斯这样韧性十足的人,也很难再为他的政治生涯画上一个圆满的句号。考虑到他臭名昭著的傲慢在华盛顿、剑桥乃至更广阔的领域得罪了多少人,他的落败无疑会招致不少人的欢呼。 萨默斯年轻时就展现出几乎无人能及的天赋。他是个智力神童;7岁时就能背诵出约翰·F·肯尼迪内阁成员的名字。他曾参加过一个体育广播问答节目,回答问题的速度之快,以至于电台都无题可问了。 坦白说,年轻的拉里·萨默斯(Larry Summers)被寄予厚望。他的父母都是宾夕法尼亚大学的经济学教授。他的两位叔叔,保罗·萨缪尔森(Paul Samuelson)和肯·阿罗(Ken Arrow),都是20世纪经济学界最伟大的思想家之一。(据说,拉里的父亲罗伯特·萨默斯(Robert Summers)因为害怕学术界的反犹主义,将自己的名字从萨缪尔森改为萨默斯。)萨缪尔森和阿罗都因其杰出的成就获得了诺贝尔奖。萨默斯获得诺贝尔奖似乎也顺理成章。在麻省理工学院(MIT)完成本科学习后,萨默斯进入哈佛大学攻读研究生,师从著名的保守派经济学家马丁·费尔德斯...

比特币触及触发点,全球股市下跌

  由于投资者在英伟达公司财报和关键的美国就业报告 即将发布之际,纷纷从风险较高的市场板块撤资,股市遭到抛售,比特币跌至七个月来的最低点 。 全球股市 指数 跌至近一个月低点, 亚洲股​​市 下跌2.1%,自4月以来首次跌破50日移动均线。一些投资者将此视为看跌信号。 比特币价格 跌破 9万美元 ,进一步加剧了市场情绪。 标普500指数、纳斯达克100指数和欧洲股市的合约均显示,股票价格将进一步下跌。随着投资者规避风险,债券价格上涨,基准10年期美国国债收益率下跌3个基点至4.11%。 法国兴业银行全球外汇期权交易联席主管托马斯·比罗 表示:“股指一直在紧张地向下移动,而比特币——通常被视为高贝塔系数风险的代表——几乎与这些走势完全同步。 这种相关性给市场情绪增添了另一层压力,因为加密货币的疲软加剧了流动性收紧和避险情绪的担忧。” 这些举动凸显了利率和科技公司盈利方面持续存在的不确定性, 英伟达 周三发布的财报将考验投资者对人工智能行业高估值的信心。随后,市场焦点将转向推迟至周四发布的9月份 就业报告 ,该报告将为投资者提供美联储政策前景的线索。 研究美国股市图表形态的分析师们敲响了警钟 ,他们担心最近的下跌可能会演变成至少 10% 的全面调整。 周一标普500指数遭遇大幅抛售,跌幅扩大至3.2%,此前该指数已于10月28日创下历史新高。该基准指数139个交易日以来首次收于50日移动均线下方,打破了本世纪以来第二长的连续高于这条备受关注的趋势线的纪录。 22V Research技术分析主管约翰·罗克 表示,纳斯达克综合指数也发出了一些“不祥”信号。 他指出,该指数3300多只成分股中,处于52周低点的股票数量多于处于52周高点的股票数量,这表明市场内部疲软,进一步反弹的可能性不大。 “总体而言,今年对投资者来说是丰收的一年,但随着年底临近,市场情绪明显紧张,” AT Global Markets驻悉尼首席市场分析师 尼克·特威代尔表示 。“随着圣诞节交易期的到来,未来几周市场波动可能会进一步加剧。” 彭博策略师怎么说…… 由于对人工智能过热的担忧,以及投资者对美联储可能将降息25个基点的计划推迟一个月左右的明显震惊,市场风险偏好有所下降。然而,鉴于美国经济很可能保持韧性,且美联储也乐于在经济出现疲软迹象时采取宽松政策,美国和全球股市很可能从目前的低迷状态中反...

美国市场暴跌加剧,科技股、加密货币到黄金无一幸免

 WSJ: 周一,金融市场抛售加剧,波及了从黄金、加密货币到高歌猛进的科技股等各类资产,拖累道琼斯指数创下自美国总统特朗普4月份引发关税动荡以来最差的三日连跌表现。 投资者近几日纷纷抛售资产,市场即将迎来关键考验,以判断推动股市在2025年迭创新高的AI热潮和经济增长能否持续到新的一年。 英伟达 (Nvidia)定于周三公布财报,这将是反映芯片需求的最新风向标。因政府停摆而推迟发布的9月份就业数据将于周四公布。 本月市场一直动荡,此前大型科技公司预计将进行大规模资本支出,而这些支出越来越依赖于发行巨额债务。交易员的忧虑已将华尔街所谓的“恐慌指数”——Cboe波动率指数(Cboe Volatility Index)——推升至4月份关税消息宣布以来的最高水平之一。 周一的市场下跌提供了新的证据,表明华尔街正在更仔细地审视那些支撑着美国历史上最大规模基础设施建设之一的昂贵、且有时是循环的交易。此次下跌发生之际,正值亚马逊(Amazon)准备发行150亿美元债券。 高盛资产管理(Goldman Sachs Asset Management)量化投资策略全球联席主管奥斯曼·阿里(Osman Ali)说:“赢家应该会多于输家。但与此同时,很明显,有些公司将无法在这个新世界中竞争。” 周一,以科技股为主的纳斯达克综合指数下跌0.8%,标普500指数下滑0.9%。道琼斯指数下跌1.2%,跌幅557点。 沃伦·巴菲特(Warren Buffett)对一家大型科技公司的最新押注,不足以提振投资者对其他AI概念股的乐观情绪。 伯克希尔哈撒韦 公司(Berkshire Hathaway)周五披露斥资数以十亿美元计买入Alphabet股票,推动这家谷歌(Google)母公司股价周一上涨3.1%。在这家总部位于内布拉斯加州奥马哈的公司减持 苹果公司 (Apple)股份后,后者股价下跌1.8%。 与此同时,英伟达、Meta和亚马逊股价均下跌。Advanced Micro Devices、Super Micro Computer和AI服务器大供应商戴尔科技(Dell Technologies)的股价也出现下跌。 甲骨文公司 (Oracle)和CoreWeave延续了长达数周的跌势。 周一的下跌导致标普500指数和纳斯达克综合指数跌破一道它们已连续138个交易日未曾跌破的关口——而且不是朝着...

美国例外论的论调正在动摇

FT: 市场情绪日益低迷,令人担忧的是,只有一家公司能够扭转这种颓势。 所有泡沫最严重的金融板块如今都面临压力。比特币——或许是投机热情最纯粹的指标——已从高点下跌了29%, 年内跌幅已达负值 。 那些只做比特币买卖和存储,其他业务寥寥无几的公司(没错,确实有这样的公司)的股票正遭受重创。其中规模最大的Strategy(前身为MicroStrategy)今年股价已下跌超过30%,较夏季高点更是下跌超过50%。其联合创始人迈克尔·塞勒(Michael Saylor)发布了一张人工智能生成的燃烧沉船图片,试图以此提振市场信心,并鼓励他的粉丝们保持坚强。 美国不盈利的科技公司股价已经连续数周下跌,这表明投资者,甚至包括那些喜欢冒险的散户投资者,都开始对炒作失去耐心。 这一切都已足够令人担忧,但这种波动并不局限于科技领域和准赌博式的投机行为中那些更刺激的部分。 Facebook 母公司 Meta 的股价今年以来基本持平,自 8 月份以来已下跌四分之一,原因是投资者对人工智能领域似乎永无止境的支出感到犹豫不决。 私人市场的压力并不总是容易察觉,但过去几个月来的一系列崩盘已经引起了人们的担忧,上市私人金融公司的价值远远落后于美国整体股市。 Absolute Strategy Research 的指数涵盖了黑石集团、KKR 等公司,今年已下跌 13%,与标普 500 指数走势截然相反。显然,美国基准股指的强劲反弹和上涨掩盖了诸多问题。表面之下,投资者似乎难以被打动。 显而易见的风险是,这会演变成对自今年春季以来一直被乐观情绪推高市场的整体清算。这种可能性的早期迹象已经显现。 从指数层面来看,股市已从近期高点回落,疲软的趋势蔓延广泛。据德意志银行的数据,标普500指数中约有407只股票周一下跌,创下五周以来最大跌幅。反映市场紧张情绪的经典指标,例如衡量股市预期波动率的VIX指数,正在走高。受大型科技公司巨额借贷的影响,公司债券也略有走弱,打破了此前公司债券和政府债券收益率之间持续收窄的局面。 近几个月来,基金经理们疯狂买入,而此次谨慎但真实的警觉情绪正是在此背景下爆发的。正如美国银行在其定期调查中所显示,投资者对股票的配置比例已达到自2月份以来的最高水平,当时“美国例外论”的论调依然盛行,而现金配置则极低。这意味着股市还有很大的下跌空间。 但对于近几个月来一直关注市场过度波动的人来...