跳至主要内容

揭秘DeepSeek:一个更极致的中国技术理想主义故事

 

做贡献者,而非搭便车者。

文 | 于丽丽
编辑 | 刘旌

中国的7家大模型创业公司中,DeepSeek(深度求索)最不声不响,但它又总能以出其不意的方式被人记住。

一年前,这种出其不意源自它背后的量化私募巨头幻方,是大厂外唯一一家储备万张A100芯片的公司,一年后,则来自它才是引发中国大模型价格战的源头。

在被AI连续轰炸的5月,DeepSeek一跃成名。起因是他们发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。

DeepSeek被迅速冠以“AI界拼多多”之称的同时,字节、腾讯、百度、阿里等大厂也按耐不住,纷纷降价。中国大模型价格战由此一触即发。

弥漫的硝烟其实掩盖了一个事实:与很多大厂烧钱补贴不同,DeepSeek是有利润的。

这背后,是DeepSeek对模型架构进行了全方位创新。它提出的一种崭新的MLA(一种新的多头潜在注意力机制)架构,把显存占用降到了过去最常用的MHA架构的5%-13%,同时,它独创的DeepSeekMoESparse结构,也把计算量降到极致,所有这些最终促成了成本的下降。

在硅谷,DeepSeek被称作“来自东方的神秘力量”。SemiAnalysis首席分析师认为,DeepSeek V2论文“可能是今年最好的一篇”。OpenAI前员工Andrew Carr认为论文“充满惊人智慧”,并将其训练设置应用于自己的模型。而OpenAI前政策主管、Anthropic联合创始人Jack Clark认为,DeepSeek“雇佣了一批高深莫测的奇才”,还认为中国制造的大模型,“将和无人机、电动汽车一样,成为不容忽视的力量。”

在基本由硅谷牵动故事进展的AI浪潮里,这是罕有的情形。多位行业人士告诉我们,这种强烈的反响源自架构层面的创新,是国产大模型公司乃至全球开源基座大模型都很罕见的尝试。一位AI研究者表示,Attention架构提出多年来,几乎未被成功改过,更遑论大规模验证。“这甚至是一个做决策时就会被掐断的念头,因为大部分人都缺乏信心。”

而另一方面,国产大模型之前很少涉足架构层面的创新,也是因为很少有人主动去击破那样一种成见:美国更擅长从0-1的技术创新,而中国更擅长从1-10的应用创新。何况这种行为非常不划算——新一代模型,过几个月自然有人做出来,中国公司只要跟随、做好应用即可。对模型结构进行创新,意味着没有路径可依,要经历很多失败,时间、经济成本都耗费巨大。

DeepSeek显然是逆行者。在一片认为大模型技术必然趋同,follow是更聪明捷径的喧哗声中,DeepSeek看重“弯路”中积累的价值,并认为中国的大模型创业者除应用创新外,也可以加入到全球技术创新的洪流中。

DeepSeek的很多抉择都与众不同。截至目前,7家中国大模型创业公司中,它是唯一一家放弃“既要又要”路线,至今专注在研究和技术,未做toC应用的公司,也是唯一一家未全面考虑商业化,坚定选择开源路线甚至都没融过资的公司。这些使得它经常被遗忘在牌桌之外,但在另一端,它又经常在社区被用户“自来水”式传播。

DeepSeek究竟是如何炼成的?我们为此访谈了甚少露面的DeepSeek创始人梁文锋。

这位从幻方时代,就在幕后潜心研究技术的80后创始人,在DeepSeek时代,依旧延续着他的低调作风,和所有研究员一样,每天“看论文,写代码,参与小组讨论”。

和很多量化基金创始人都有过海外对冲基金履历,多出身物理、数学等专业不同的是,梁文锋一直是本土背景,早年就读的也是浙江大学电子工程系人工智能方向。

多位行业人士和DeepSeek研究员告诉我们,梁文锋是当下中国AI界非常罕见的“兼具强大的infra工程能力和模型研究能力,又能调动资源”、“既可以从高处做精准判断,又可以在细节上强过一线研究员”的人,他拥有“令人恐怖的学习能力”,同时又“完全不像一个老板,而更像一个极客”。

这是一次尤为难得的访谈。访谈里,这位技术理想主义者,提供了目前中国科技界特别稀缺的一种声音:他是少有的把“是非观”置于“利害观”之前,并提醒我们看到时代惯性,把“原创式创新”提上日程的人。

一年前,DeepSeek刚下场时,我们初次访谈了梁文锋 :《疯狂的幻方:一家隐形AI巨头的大模型之路》 。如果说当时那句「务必要疯狂地怀抱雄心,且还要疯狂地真诚」还是一句美丽的口号,一年过去,它已经在成为一种行动。

以下为对话部分:

价格战第一枪是怎么打响的?

「暗涌」:DeepSeek V2模型发布后,迅速引发一场血雨腥风的大模型价格战,有人说你们是行业的一条鲶鱼。

梁文锋:我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。

「暗涌」:这个结果让你们意外吗?

梁文锋:非常意外。没想到价格让大家这么敏感。我们只是按照自己的步调来做事,然后核算成本定价。我们的原则是不贴钱,也不赚取暴利。这个价格也是在成本之上稍微有点利润。

「暗涌」:5天后智谱AI就跟进了,之后是字节、阿里、百度、腾讯等大厂。

梁文锋:智谱AI降的是一个入门级产品,和我们同级别的模型仍然收费很贵。字节是真正第一个跟进的。旗舰模型降到和我们一样的价格,然后触发了其它大厂纷纷降价。因为大厂的模型成本比我们高很多,所以我们没想到会有人亏钱做这件事,最后就变成了互联网时代的烧钱补贴的逻辑。

「暗涌」:外部看来,降价很像在抢用户,互联网时代的价格战通常如此。

梁文锋:抢用户并不是我们的主要目的。我们降价一方面是因为我们在探索下一代模型的结构中,成本先降下来了,另一方面也觉得无论API,还是AI,都应该是普惠的、人人可以用得起的东西。

「暗涌」:在这之前,大部分中国公司都会直接copy这一代的 Llama结构去做应用,为什么你们会从模型结构切入?

梁文锋:如果目标是做应用,那沿用 Llama结构,短平快上产品也是合理选择。但我们目的地是AGI,这意味着我们需要研究新的模型结构,在有限资源下,实现更强的模型能力。这是scale up到更大模型所需要做的基础研究之一。除了模型结构,我们还做了大量其他的研究,包括怎么构造数据,如何让模型更像人类等,这都体现在我们发布的模型里。另外,Llama的结构,在训练效率和推理成本上,和国外先进水平估计也已有两代差距。

「暗涌」:这种代差主要来自哪里?

梁文锋:首先训练效率有差距。我们估计,国内最好的水平和国外最好的相比,模型结构和训练动力学上可能有一倍的差距,光这一点我们要消耗两倍的算力才能达到同样效果。另外数据效率上可能也有一倍差距,也就是我们要消耗两倍的训练数据和算力,才能达到同样的效果。合起来就要多消耗4倍算力。我们要做的,正是不停地去缩小这些差距。

「暗涌」:大部分中国公司都选择既要模型又要应用,为什么DeepSeek目前选择只做研究探索?

梁文锋:因为我们觉得现在最重要的是参与到全球创新的浪潮里去。过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。

「暗涌」:互联网和移动互联网时代留给大部分人的惯性认知是,美国擅长搞技术创新,中国更擅长做应用。

梁文锋:我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去三十多年IT浪潮里,我们基本没有参与到真正的技术创新里。我们已经习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。Scaling Law也在被如此对待。

但其实,这是西方主导的技术社区一代代孜孜不倦创造出来的,只因为之前我们没有参与这个过程,以至于忽视了它的存在。

真正的差距不是一年或两年,而是原创和模仿之差

「暗涌」:为什么DeepSeek V2会让硅谷的很多人惊讶?

梁文锋:在美国每天发生的大量创新里,这是非常普通的一个。他们之所以惊讶,是因为这是一个中国公司,在以创新贡献者的身份,加入到他们游戏里去。毕竟大部分中国公司习惯follow,而不是创新。

「暗涌」:但这种选择放在中国语境里,也过于奢侈。大模型是一个重投入游戏,不是所有公司都有资本只去研究创新,而不是先考虑商业化。

梁文锋:创新的成本肯定不低,过去那种拿来主义的惯性也和过去的国情有关。但现在,你看无论中国的经济体量,还是字节、腾讯这些大厂的利润,放在全球都不低。我们创新缺的肯定不是资本,而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。

「暗涌」:为什么中国公司——包括不缺钱的大厂,这么容易把快速商业化当第一要义?

梁文锋:过去三十年,我们都只强调赚钱,对创新是忽视的。创新不完全是商业驱动的,还需要好奇心和创造欲。我们只是被过去那种惯性束缚了,但它也是阶段性的。

「暗涌」:但你们究竟是一个商业组织,而非一个公益科研机构,选择创新,又通过开源分享出去,那要在哪里形成护城河?像5月这次MLA架构的创新,也会很快被其他家copy吧?

梁文锋:在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。所以我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know-how,形成可以创新的组织和文化,就是我们的护城河。

开源,发论文,其实并没有失去什么。对于技术人员来说,被follow是很有成就感的事。其实,开源更像一个文化行为,而非商业行为。给予其实是一种额外的荣誉。一个公司这么做也会有文化的吸引力。

「暗涌」:你怎么看类似朱啸虎的这种市场信仰派观点?

梁文锋:朱啸虎是自洽的,但他的打法更适合快速赚钱的公司,而你看美国最赚钱的公司,都是厚积薄发的高科技公司。

「暗涌」:但做大模型,单纯的技术领先也很难形成绝对优势,你们赌的那个更大的东西是什么?

梁文锋我们看到的是中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。

英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。

更多的投入并不一定产生更多的创新

「暗涌」:现在的DeepSeek有一种OpenAI早期的理想主义气质,也是开源的。后边你们会选择闭源吗?OpenAI和Mistral都有过从开源到闭源的过程。

梁文锋:我们不会闭源。我们认为先有一个强大的技术生态更重要。

「暗涌」:你们有融资计划吗?看有媒体报道,幻方对DeepSeek有独立拆分上市的计划,硅谷的AI创业公司,最终也都难免要和大厂绑定。

梁文锋:短期内没有融资计划,我们面临的问题从来不是钱,而是高端芯片被禁运。

「暗涌」:很多人认为,做AGI和做量化是完全不同的两件事,量化可以闷声去做,但AGI可能更需要高举高打,需要结盟,这样可以让你的投入变大。

梁文锋:更多的投入并不一定产生更多的创新。否则大厂可以把所有的创新包揽了。

「暗涌」:你们现在不做应用,是因为你们没有运营的基因吗?

梁文锋:我们认为当前阶段是技术创新的爆发期,而不是应用的爆发期。长远来说,我们希望形成一种生态,就是业界直接使用我们的技术和产出,我们只负责基础模型和前沿的创新,然后其它公司在DeepSeek 的基础上构建toB、toC的业务。如果能形成完整的产业上下游,我们就没必要自己做应用。当然,如果需要,我们做应用也没障碍,但研究和技术创新永远是我们第一优先级。

「暗涌」:但选择API的话,为什么选择DeepSeek,而不是大厂?

梁文锋:未来的世界很可能是专业化分工的,基础大模型需要持续创新,大厂有它的能力边界,并不一定适合。

「暗涌」:但技术真的可以拉开差距吗?你也说过并不存在绝对的技术秘密。

梁文锋:技术没有秘密,但重置需要时间和成本。英伟达的显卡,理论上没有任何技术秘密,很容易复制,但重新组织团队以及追赶下一代技术都需要时间,所以实际的护城河还是很宽。

「暗涌」:你们降价后,字节率先跟进,说明他们还是感受到某种威胁。你怎么看创业公司与大厂竞争的新解法?

梁文锋:说实话我们不太care这件事,只是顺便做了这件事。提供云服务不是我们的主要目标。我们的目标还是去实现AGI。

目前没有看到什么新解法,但大厂也没有明显占优。大厂有现成的用户,但它的现金流业务也是它的包袱,也会让它成为随时被颠覆的对象。

「暗涌」:你怎么看DeepSeek之外的6家大模型创业公司的终局?

梁文锋:可能活下来2到3家。现在都还处在烧钱阶段,所以那些自我定位清晰、更能精细化运营的,更有机会活下来。其它公司可能会脱胎换骨。有价值的东西不会烟消云散,但会换一种方式。

「暗涌」:幻方时代,面对竞争的姿态就被评价为“我行我素”,很少在意横向比较。关于竞争,你思考的原点是什么?

梁文锋:我经常思考的是,一个东西能不能让社会的运行效率变高,以及你能否在它的产业分工链条上找到擅长的位置。只要终局是让社会效率更高,就是成立的。中间很多都是阶段性的,过度关注必然眼花缭乱。

一群做“高深莫测”事的年轻人

「暗涌」:OpenAI前政策主管、Anthropic联合创始人Jack Clark认为DeepSeek雇佣了“一批高深莫测的奇才”,做出DeepSeek v2的是怎样一群人?

梁文锋:并没有什么高深莫测的奇才,都是一些Top高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。

「暗涌」:很多大模型公司都执着地去海外挖人,很多人觉得这个领域前50名的顶尖人才可能都不在中国的公司,你们的人都来自哪里?

梁文锋:V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。

「暗涌」:这次MLA创新是如何发生的?听说idea最早来自一个年轻研究员的个人兴趣?

梁文锋:在总结出Attention架构的一些主流变迁规律后,他突发奇想去设计一个替代方案。不过从想法到落地,中间是一个漫长的过程。我们为此组了一个team,花了几个月时间才跑通。

「暗涌」:这种发散性灵感的诞生和你们完全创新型组织的架构很有关系。幻方时代,你们就很少自上而下地指派目标或任务。但AGI这种充满不确定性的前沿探索,是否多了管理动作?

梁文锋:DeepSeek也全是自下而上。而且我们一般不前置分工,而是自然分工。每个人有自己独特的成长经历,都是自带想法的,不需要push他。探索过程中,他遇到问题,自己就会拉人讨论。不过当一个idea显示出潜力,我们也会自上而下地去调配资源。

「暗涌」:听说DeepSeek对于卡和人的调集非常灵活。

梁文锋:我们每个人对于卡和人的调动是不设上限的。如果有想法,每个人随时可以调用训练集群的卡无需审批。同时因为不存在层级和跨部门,也可以灵活调用所有人,只要对方也有兴趣。

「暗涌」:一种松散的管理方式也取决于你们筛选到了一批强热爱驱动的人。听说你们很擅长从细节招人, 可以让一些非传统评价指标里优秀的人被选出来。

梁文锋:我们选人的标准一直都是热爱和好奇心,所以很多人会有一些奇特的经历,很有意思。很多人对做研究的渴望,远超对钱的在意。

「暗涌」: transformer诞生在谷歌的AI Lab,ChatGPT诞生在OpenAI,你觉得大公司的AILab 和一个创业公司对于创新产生的价值有什么不同?

梁文锋:不管是Google实验室,还是OpenAI,甚至中国大厂的AI Lab,都很有价值的。最后是OpenAI做出来,也有历史的偶然性。

「暗涌」:创新很大程度也是一种偶然吗?我看你们办公区中间那排会议室左右两侧都设置了可以随意推开的门。你们同事说,这就是给偶然留出空隙。transfomer诞生中就发生过那种偶然经过的人听到后加入,最终把它变成一个通用框架的故事。

梁文锋:我觉得创新首先是一个信念问题。为什么硅谷那么有创新精神?首先是敢。Chatgpt出来时,整个国内对做前沿创新都缺乏信心,从投资人到大厂,都觉得差距太大了,还是做应用吧。但创新首先需要自信。这种信心通常在年轻人身上更明显。

「暗涌」:但你们不参与融资,很少对外发声,社会声量上肯定不如那些融资活跃的公司,怎么确保DeepSeek就是做大模型的人的首选?

梁文锋:因为我们在做最难的事。对顶级人才吸引最大的,肯定是去解决世界上最难的问题。其实,顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了,使得他们没有机会被识别出来。我们在做最难的事,对他们就是有吸引力的。

「暗涌」:前一段OpenAI的发布并没有等来GPT5,很多人觉得这是技术曲线明显在放缓,也很多人开始质疑Scaling Law,你们怎么看?

梁文锋:我们偏乐观,整个行业看起来都符合预期。OpenAI也不是神,不可能一直冲在前面。

「暗涌」:你觉得AGI还要多久实现,发布DeepSeek V2前,你们发布过代码生成和数学的模型,也从dense模型切换到了MOE,所以你们的AGI路线图有哪些坐标?

梁文锋:可能是2年、5年或者10年,总之会在我们有生之年实现。至于路线图,即使在我们公司内部,也没有统一意见。但我们确实押注了三个方向。一是数学和代码,二是多模态,三是自然语言本身。数学和代码是AGI天然的试验场,有点像围棋,是一个封闭的、可验证的系统,有可能通过自我学习就能实现很高的智能。另一方面,可能多模态、参与到人类的真实世界里学习,对AGI也是必要的。我们对一切可能性都保持开放。

「暗涌」:你觉得大模型终局是什么样态?

梁文锋:会有专门公司提供基础模型和基础服务,会有很长链条的专业分工。更多人在之上去满足整个社会多样化的需求。

所有的套路都是上一代的产物

「暗涌」:过去这一年,中国的大模型创业还是有很多变化的,比如去年开头还很活跃的王慧文中场退出了,后来加入的公司也开始呈现出差异化。

梁文锋:王慧文自己承担了所有的损失,让其他人全身而退。他做了一个对自己最不利,但对大家都好的选择,所以他做人是很厚道的,这点我很佩服。

「暗涌」:现在你的精力最多放在哪里?

梁文锋:主要的精力在研究下一代的大模型。还有很多未解决的问题。

「暗涌」:其他几家大模型创业公司都是坚持既要又要,毕竟技术不会带来永久领先,抓住时间窗口把技术优势落到产品也很重要,DeepSeek敢于专注在模型研究上是因为模型能力还不够吗?

梁文锋:所有的套路都是上一代的产物,未来不一定成立。拿互联网的商业逻辑去讨论未来AI的盈利模式,就像马化腾创业时,你去讨论通用电气和可口可乐一样。很可能是一种刻舟求剑。

「暗涌」:过去幻方就有很强的技术和创新基因,成长也比较顺利,这是你偏乐观的原因吗?

梁文锋:幻方某种程度上增强了我们对技术驱动型创新的信心,但也不都是坦途。我们经历了一个漫长的积累过程。外部看到的是幻方2015年后的部分,但其实我们做了16年。

「暗涌」:回到关于原创式创新的话题。现在经济开始进入下行,资本也进入冷周期,所以它对原创式创新是否会带来更多抑制?

梁文锋:我倒觉得未必。中国产业结构的调整,会更依赖硬核技术的创新。当很多人发现过去赚快钱很可能来自时代运气,就会更愿意俯身去做真正的创新。

「暗涌」:所以你对这件事也是乐观的?

梁文锋:我是八十年代在广东一个五线城市长大的。我的父亲是小学老师,九十年代,广东赚钱机会很多,当时有不少家长到我家里来,基本就是家长觉得读书没用。但现在回去看,观念都变了。因为钱不好赚了,连开出租车的机会可能都没了。一代人的时间就变了。

以后硬核创新会越来越多。现在可能还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。

评论

此博客中的热门博文

Read the full transcript of Carney’s speech to World Economic Forum

  Prime Minister   Mark Carney   gave a forceful speech Tuesday at the   World Economic Forum   in   Davos , Switzerland,   on the “new world order”   and how middle powers like Canada can benefit by working together. The speech was delivered against a backdrop of rising geopolitical tensions between great powers like Russia, China and the United States, and as U.S. President Donald Trump threatens allies with tariffs and pushes to acquire Greenland from Denmark, a member of the NATO military alliance. Below is the full transcript of the English parts of Carney’s remarks. Thank you very much, Larry. I’m going to start in French, and then I’ll switch back to English. (IN FRENCH) It seems that every day we’re reminded that we live in an era of great power rivalry — that the rules-based order is fading, that the strong can do what they can, and the weak must suffer what they must. And this aphorism of Thucydides is presented as inevitable, as the nat...

国家统计局:2025年中国GDP统计数据,中国经济发展向新向优 预期目标圆满实现

  (2026年1月19日) 国家统计局      2025 年,面对国内外经济环境的复杂变化,在以习近平同志为核心的党中央坚强领导下,各地区各部门深入贯彻落实党中央、国务院决策部署,坚定不移贯彻新发展理念、推动高质量发展,统筹国内国际两个大局,统筹发展和安全,实施更加积极有为的宏观政策,纵深推进全国统一大市场建设,国民经济运行顶压前行、向新向优,高质量发展取得新成效,经济社会发展主要目标任务圆满实现,“十四五”胜利收官。      初步核算,全年国内生产总值 1401879 亿元,按不变价格计算,比上年增长 5.0% 。分产业看,第一产业增加值 93347 亿元,比上年增长 3.9% ;第二产业增加值 499653 亿元,增长 4.5% ;第三产业增加值 808879 亿元,增长 5.4% 。分季度看,一季度国内生产总值同比增长 5.4% ,二季度增长 5.2% ,三季度增长 4.8% ,四季度增长 4.5% 。从环比看,四季度国内生产总值增长 1.2% 。     一、粮食增产丰收,畜牧业稳定增长     全年全国粮食总产量 71488 万吨,比上年增加 838 万吨,增长 1.2% 。其中,夏粮产量 14975 万吨,下降 0.1% ;早稻产量 2851 万吨,增长 1.2% ;秋粮产量 53662 万吨,增长 1.5% 。分品种看,小麦产量 14007 万吨,基本持平;玉米产量 30124 万吨,增长 2.1% ;稻谷产量 20904 万吨,增长 0.7% ;大豆产量 2091 万吨,增长 1.3% 。全年猪牛羊禽肉产量 10072 万吨,比上年增长 4.2% ,首次超过 1 亿吨。其中,猪肉产量 5938 万吨,增长 4.1% ;牛肉产量 801 万吨,增长 2.8% ;羊肉产量 496 万吨,下降 4.2% ;禽肉产量 2837 万吨,增长 6.7% 。牛奶产量 4091 万吨,增长 0.3% ;禽蛋产量 3498 万吨,下降 2.5% 。全年生猪出栏 71973 万头,增长 2.4% ;年末生猪存栏 42967 万头,增长 0.5% 。     二、工业生产较快增长,装备制造业和高技术制造业增势较好     全年全国规模以上工业增加值比上年增长 5.9% 。分三大门类看,采矿业增加值增长 5.6% ,制造业增长 6.4% ,电力、热力、燃气及水...

加拿大总理卡尼达沃斯演讲全文

 加拿大卡尼总理达沃斯演讲全文 卡尼总理的这篇演讲可能是历史上对美国治世正式退出的总结和展望。以下为演讲的完整翻译: 似乎每天我们都会被提醒:我们生活在一个大国竞争的时代——基于规则的秩序正在消退,强者可以为所欲为,弱者只能承受他们必须承受的一切。 非常感谢你,拉里。我将先用法语开始,然后再切换回英语。(法语) 似乎每天我们都会被提醒:我们生活在一个大国竞争的时代——基于规则的秩序正在消退,强者可以为所欲为,弱者只能承受他们必须承受的一切。 修昔底德的这句格言被呈现为不可避免,仿佛国际关系的自然逻辑正在重新确立。面对这种逻辑,各国有一种强烈倾向:随波逐流、与人为善、做出迁就、避免麻烦、寄希望于顺从能换来安全。 但事实并非如此。那么我们的选择是什么? 1978年,捷克异议人士瓦茨拉夫·哈维尔(后来成为总统)写了一篇题为《无权者的力量》的文章,在其中他提出了一个简单的问题:共产主义体制是如何维系自身的? 而他的答案从一位蔬菜水果商开始。 每天早晨,店主都会在橱窗里放一块牌子:“全世界工人联合起来。”他并不相信这句话。没人相信。但他仍然把牌子放上去,以避免麻烦、表明顺从、与人相安无事。由于每条街上每家店铺都这样做,体制便得以延续——不仅仅靠暴力,也靠普通人在他们私下明知是虚假的仪式中参与其中。 哈维尔称之为“生活在谎言之中”。体制的力量不来自其真实,而来自每个人都愿意表现得仿佛它是真的;而它的脆弱也来自同一源头。当哪怕只有一个人停止表演,当那位蔬菜水果商把牌子撤下,幻象便开始破裂。 朋友们,是时候让公司和国家把自己的牌子摘下来了。 几十年来,加拿大这样的国家在我们所谓的“基于规则的国际秩序”下繁荣发展。我们加入其机构,我们赞颂其原则,我们受益于其可预期性。正因如此,我们才能在其庇护下推行以价值观为导向的外交政策。 我们知道,国际“基于规则的秩序”的故事部分是虚假的:最强者在方便时会豁免自己;贸易规则的执行并不对称;我们也知道国际法的适用严厉程度并不一致,取决于被指控者或受害者的身份。 这种虚构曾经有用,尤其是美国霸权帮助提供公共产品:开放的海上航道、稳定的金融体系、集体安全,以及支持解决争端的框架。 于是我们把牌子放在橱窗里。我们参与这些仪式,并在很大程度上避免指出修辞与现实之间的裂缝。 这笔交易不再奏效。 我直说。我们正处在一次断裂之中,而不是一次过渡。 过去二...

特朗普想成为新的波尔克

  大西洋月刊: 薇薇安·萨拉玛 “美国如果国土更大就会更强大”这种 观念 曾困扰着几位19世纪的美国总统,其中尤以詹姆斯·K·波尔克最为突出。这位美国第十一任总统坚信,扩张是美国与生俱来的权利和义务。他认为,扩大美国的疆界能够带来自然资源,增强国家安全——任何国家,即使是盟友,都不应阻碍这一进程。从吞并德克萨斯开始(德克萨斯于1845年投票成为美国第28个州),波尔克积极扩张美国的版图,其扩张幅度超过了其他任何一位总统。 波尔克一心想要吞并古巴,即便这意味着美国与西班牙的联盟破裂。他的野心可以追溯到托马斯·杰斐逊时代。他宣扬“昭昭天命”论,宣称美国殖民者受神命扩张领土。他警告说,如果美国不吞并古巴,古巴就会落入英国之手,使美国易受攻击。1848年5月,波尔克向西班牙提出以1亿美元(相当于今天的40多亿美元)的巨额赎金,换取西班牙放弃对古巴的主权。 在21世纪扩张主义精神的复兴中,唐纳德·特朗普执意要吞并格陵兰岛,全然不顾美国的丹麦盟友是否同意。其他总统曾援引乔治·华盛顿和亚伯拉罕·林肯的遗志,但在特朗普眼中,波尔克也位列其偶像之列。他称波尔克为“房地产大亨”,拥有“大量土地”,去年还在椭圆形办公室挂上了波尔克的画像,取代了杰斐逊的画像。 特朗普为觊觎格陵兰岛给出了诸多理由——遏制中国和俄罗斯在北极的扩张、增强美国国家安全、报复诺贝尔和平奖拒之门外、攫取格陵兰岛的关键矿产资源、承认这座巨大岛屿与北美的紧密联系——但其背后却隐藏着更为根本、更具波尔克式的动机。他的顾问告诉我,对格陵兰岛的攫取是他巩固自身在总统精英俱乐部中地位的更广泛努力的一部分,该俱乐部成员包括波尔克、杰斐逊和德怀特·艾森豪威尔,他们都曾大幅扩张了美国的领土。众所周知,特朗普对地图有着浓厚的兴趣,他希望自己的影响力能够世代在地图上留下印记。将世界最大岛屿披上红白蓝三色的旗帜是他首要的目标。昨天,特朗普 分享了 一张照片,照片中他与JD·万斯和国务卿马可·卢比奥一起,手持一面美国国旗,旁边立着一块牌子,上面写着:“ 格陵兰岛——美国领土,成立于2026年” 。 特朗普今天在瑞士达沃斯世界经济论坛上发表讲话,稍微缓和了紧张气氛。他说,他不会动用武力夺取格陵兰岛,但如果他的目标遭到否决,他会“记住”。 美国最近一次重大扩张发生在1959年,当时艾森豪威尔总统将阿拉斯加和夏威夷并入美国,成为美国的第4...

永远要警惕衰落的超级大国

 FT: 七十年前,日渐衰落的英法两国试图武力夺取苏伊士运河。奇怪的是,两国领导人都不是那种典型的沙文主义者。精通阿拉伯语和波斯语的安东尼·艾登,堪称战后唐宁街10号最有教养的首相。只是地位焦虑会让理智的人做出鲁莽的举动。法国在阿尔及利亚发动了一场毫无胜算的战争,而英国则选择退出它认为毫无前途的欧洲联邦主义计划:这些误判至今仍在影响着两国。 当然,美国的衰落远不及当年的英国那样剧烈。它仍然是地球上最强大的国家,尽管优势有所缩小。但从另一个角度来看,美国的衰落更为严重。英国或许还能安慰自己,它把权力移交给了一个民主、以英语为母语且以白人为主的超级大国。相比之下,美国却在与中国竞争中败下阵来,而中国并不具备上述任何特征。因此,尽管美国的地位下降幅度远小于英国,但其主观感受可能更加痛苦。与哪个国家竞争,确实 至关重要 。 如果再加上唐纳德·特朗普那种对等级制度的痴迷——他近乎地质学般的等级观念——你就会看到格陵兰岛遭受的不公正待遇、加勒比海地区的炮舰外交以及其他类似苏伊士运河危机的挽回声望的尝试。(或许这次会更加成功。) 但即便是在一位正常的总统领导下,美国现在的行为也可能不太妥当。那些急于提升自身地位的国家总要标榜自己。能够坦然面对衰落的超级大国实属罕见。 要证明这背后还有比特朗普更深层次的原因,不妨回顾一下,在乔治·W·布什执政时期,美国就已经对当时几乎无人提及的“基于规则的自由秩序”感到不满。即便抛开伊拉克战争不谈,布什也对国际刑事法院抱有极大的蔑视。这并非指责他。当时,乃至现在,全球范围内充斥着许多与其说是严格意义上的自由主义,不如说是左翼的种种乱象。布什骨子里亲西方,他对其中某些事物抱有怀疑,这无可厚非。更重要的是,美国对这种法治主义世界秩序的不满由来已久,远早于特朗普。必然存在某种结构性问题一直困扰着美国,而这或许就是衰落。 由于美国在本世纪的经济和科技领域取得了令人瞩目的绝对成就,其相对衰落的迹象可能难以察觉。然而,这种衰落确实存在:近年来美国制裁措施收效甚微,在 人工智能领域 难以保持领先地位,以及中国在西半球敢于拥有的战略资产,都印证了这一点。如今,美国与中国的军事差距已远不及千禧年之交。即便是一位普通的共和党总统,在当前形势下也会采取强硬措施,尽管可能不会像特朗普那样鲁莽。 永远要警惕那些社会地位下滑的人。我们这些生活优渥的人,根本无法理解社会...

拉里·萨默斯怎么会这么蠢?

 POLITICO: 挖洞的第一条规则就是停止挖洞,”拉里·萨默斯几个月前在接受《纽约时报》采访时说道,他在采访中解释了为什么他认为特朗普政府应该停止对外国征收关税。 萨默斯本该听从自己的建议:直到 2019 年 7 月 5 日,也就是爱泼斯坦最后一次被捕的前一天,他才停止为自己身处的困境挖坑,当时他给已故的性犯罪者杰弗里·爱泼斯坦发送了最后一封电子邮件。 现在,在有关萨默斯与爱泼斯坦长达十多年的通信往来被曝光之后——当时爱泼斯坦已经因引诱未成年人卖淫而被判入狱——萨默斯宣布他将退出公开活动,至少不会再参与那些他可能会被问及爱泼斯坦相关问题的场合。 萨默斯表示他将继续在哈佛大学任教,他目前担任“大学教授”,这是哈佛大学授予教职人员的最高荣誉——在哈佛文理学院约900名终身教授中,只有24位大学教授。这个数字可能很快就会降至23位。伊丽莎白·沃伦在当选美国参议员之前曾是哈佛法学院的教授,她已经呼吁哈佛大学解雇萨默斯。学生、校友和捐赠者肯定也会纷纷响应。虽然任何时候让一名被定罪的性犯罪者担任笔友都不是好事,但在唐纳德·特朗普总统密切关注之际,哈佛大学此时接纳这样一位显而易见的“累赘”尤其不合时宜。 萨默斯如今面临着职业生涯黯然落幕的局面,他数十年的公共生涯可谓跌宕起伏。即便像萨默斯这样韧性十足的人,也很难再为他的政治生涯画上一个圆满的句号。考虑到他臭名昭著的傲慢在华盛顿、剑桥乃至更广阔的领域得罪了多少人,他的落败无疑会招致不少人的欢呼。 萨默斯年轻时就展现出几乎无人能及的天赋。他是个智力神童;7岁时就能背诵出约翰·F·肯尼迪内阁成员的名字。他曾参加过一个体育广播问答节目,回答问题的速度之快,以至于电台都无题可问了。 坦白说,年轻的拉里·萨默斯(Larry Summers)被寄予厚望。他的父母都是宾夕法尼亚大学的经济学教授。他的两位叔叔,保罗·萨缪尔森(Paul Samuelson)和肯·阿罗(Ken Arrow),都是20世纪经济学界最伟大的思想家之一。(据说,拉里的父亲罗伯特·萨默斯(Robert Summers)因为害怕学术界的反犹主义,将自己的名字从萨缪尔森改为萨默斯。)萨缪尔森和阿罗都因其杰出的成就获得了诺贝尔奖。萨默斯获得诺贝尔奖似乎也顺理成章。在麻省理工学院(MIT)完成本科学习后,萨默斯进入哈佛大学攻读研究生,师从著名的保守派经济学家马丁·费尔德斯...

比特币触及触发点,全球股市下跌

  由于投资者在英伟达公司财报和关键的美国就业报告 即将发布之际,纷纷从风险较高的市场板块撤资,股市遭到抛售,比特币跌至七个月来的最低点 。 全球股市 指数 跌至近一个月低点, 亚洲股​​市 下跌2.1%,自4月以来首次跌破50日移动均线。一些投资者将此视为看跌信号。 比特币价格 跌破 9万美元 ,进一步加剧了市场情绪。 标普500指数、纳斯达克100指数和欧洲股市的合约均显示,股票价格将进一步下跌。随着投资者规避风险,债券价格上涨,基准10年期美国国债收益率下跌3个基点至4.11%。 法国兴业银行全球外汇期权交易联席主管托马斯·比罗 表示:“股指一直在紧张地向下移动,而比特币——通常被视为高贝塔系数风险的代表——几乎与这些走势完全同步。 这种相关性给市场情绪增添了另一层压力,因为加密货币的疲软加剧了流动性收紧和避险情绪的担忧。” 这些举动凸显了利率和科技公司盈利方面持续存在的不确定性, 英伟达 周三发布的财报将考验投资者对人工智能行业高估值的信心。随后,市场焦点将转向推迟至周四发布的9月份 就业报告 ,该报告将为投资者提供美联储政策前景的线索。 研究美国股市图表形态的分析师们敲响了警钟 ,他们担心最近的下跌可能会演变成至少 10% 的全面调整。 周一标普500指数遭遇大幅抛售,跌幅扩大至3.2%,此前该指数已于10月28日创下历史新高。该基准指数139个交易日以来首次收于50日移动均线下方,打破了本世纪以来第二长的连续高于这条备受关注的趋势线的纪录。 22V Research技术分析主管约翰·罗克 表示,纳斯达克综合指数也发出了一些“不祥”信号。 他指出,该指数3300多只成分股中,处于52周低点的股票数量多于处于52周高点的股票数量,这表明市场内部疲软,进一步反弹的可能性不大。 “总体而言,今年对投资者来说是丰收的一年,但随着年底临近,市场情绪明显紧张,” AT Global Markets驻悉尼首席市场分析师 尼克·特威代尔表示 。“随着圣诞节交易期的到来,未来几周市场波动可能会进一步加剧。” 彭博策略师怎么说…… 由于对人工智能过热的担忧,以及投资者对美联储可能将降息25个基点的计划推迟一个月左右的明显震惊,市场风险偏好有所下降。然而,鉴于美国经济很可能保持韧性,且美联储也乐于在经济出现疲软迹象时采取宽松政策,美国和全球股市很可能从目前的低迷状态中反...

如果人工智能泡沫破裂,可能会引发一场不同寻常的经济衰退

 经济学人: 如果   美国   股市 崩盘,这将是历史上最受关注的金融崩溃之一。从银行高管到 国际货币基金组织, 所有人都对美国科技公司过高的估值发出警告。各国央行行长正严阵以待,准备应对金融危机;那些在2007-2009年做空次贷危机而声名鹊起的投资者,如今又卷土重来,准备再次进行“大做空”。任何市场波动的迹象,例如近期 纳斯达克 科技股指数的小幅周线下跌,都会引发市场即将崩盘的猜测。 难怪如此。在“七大科技巨头”的推动下, 标普 500指数的周期性调整市盈率已达到互联网泡沫时期以来的最高水平。投资者押注于人工智能(  AI )领域的巨额投资终将获得回报。然而,相关数字令人望而生畏。摩根大通银行估计,到2030年,企业若想在 人工智能资本 支出方面实现10%的预期回报,就需要每年6500亿美元的 人工智能 收入——相当于每位iPhone用户每年支付超过400美元。历史表明,即便新技术最终会改变世界,但如此高的期望往往在初期就会落空。 尽管股市崩盘几乎不会让任何人感到意外,但很少有人认真思考其后果。部分原因是,目前股市暴跌引发全面金融危机的可能性很小。与2000年代末期普遍存在的杠杆和复杂的金融运作助长了次贷危机中债务驱动的房地产泡沫不同,如今 人工智能的 狂热主要由股权融资支撑。此外,近年来实体经济已经证明,它能够很好地抵御从欧洲能源危机到美国关税等各种冲击。 经济衰退正变得越来越罕见 。 然而,认为股市暴跌的影响仅限于投资者的钱包,那就大错特错了。 繁荣持续的时间越长,其融资就越不透明 。即便没有金融危机,股市的急剧下跌最终也可能使原本韧性十足的世界经济陷入衰退。 脆弱性的根源在于美国消费者。股票占美国家庭财富的21%,比互联网泡沫鼎盛时期高出约四分之一。过去一年,与 人工智能 相关的资产贡献了美国人财富增长的近一半。随着家庭财富的增长,他们也逐渐习惯于减少储蓄,储蓄水平低于新冠疫情爆发前(尽管不及次贷危机时期那么低)。 股市崩盘将逆转这些趋势。 我们计算得出 ,如果股市下跌幅度与互联网泡沫破裂相当,美国家庭的净资产将减少8%。这可能导致消费支出大幅缩减。根据经验法则,这种回落将相当于 GDP的1.6%——足以将劳动力市场本已疲软的美国推入衰退。对消费者的影响将远远超过 人工智能 投资枯竭 可能带来的影响 ,而这些投资大多...

外国投资者重返中国股市

 FT: 外国投资者对中国股票的购买量已达到四年来的最高水平,这表明全球投资者正在重新评估这个直到最近还被认为“不值得投资”的市场。 根据国际金融协会(一家全球银行业贸易机构)的数据,今年1月至10月,境外资金流入中国股市的总额为506亿美元,高于2024年的114亿美元。 今年以来,受DeepSeek发布突破性模型引发的人工智能热潮以及亚洲金融中心香港一系列强劲上市的推动,在中国大陆和香港上市的中国股票大幅上涨。 在经历了多年的惨淡回报之后,这些增长出现了 。此前,由于对经济增长放缓以及华盛顿和北京之间日益紧张的局势的担忧加剧, 外国投资者纷纷抛售了他们的股票。 “中国股市目前的估值仍然远低于世界其他地区,但他们却拥有一些科技领域最优秀的公司,”Federated Hermes除日本以外的亚洲股票主管乔纳森·派恩斯表示。“在某些领域,他们是美国唯一真正意义上的竞争对手。” 今年的外资购买额仍低于2021年创下的736亿美元的全年纪录。2021年,中国沪深300指数从新冠疫情的初期冲击中强劲反弹,创下历史新高。然而,这标志着外资连续数年下滑后出现逆转。 “两年前,对很多人来说,中国是不值得投资的,”Alpine Macro 的首席新兴市场和中国策略师王岩表示。 北京去年停止发布通过香港追踪中国内地股票投资的每日数据,这使得评估外资流入水平变得更加困难。国际金融协会(IIF)追踪的是外部投资组合负债的变化,并且不包括在美国上市的中国公司。 花旗银行表示,自美国4月份实施“解放日”关税以来,中国股票的买盘有所增加,不同类型的客户中,买盘比例约为55%,卖盘比例约为45%。 根据 EPFR Global 追踪交易所交易基金和共同基金资金流入的数据,今年外国主动型基金经理净卖出中国股票,但被动型基金的资金流入抵消了这一损失。 富达国际亚太区投资指导主管斯图尔特·兰布尔表示,今年中国股市的强劲表现主要得益于散户投资者大量涌入国内市场。 今年以来,中国内地投资者已向香港股市投入1.3万亿港元(1687亿美元),创历史新高,目前约占香港交易所成交额的20%。 外国投资者对中国股市的谨慎态度源于房地产市场的下滑、 对私营企业的打压 以及不断升级的中美贸易战,这些因素共同导致股市从峰值下跌了近一半。 法国巴黎银行资产管理公司首席市场策略师丹尼尔·莫里斯表示:“曾经有一段时间,...

有什么能阻止德国工业的衰落?

 FT: 在德国工程技术引以为傲的核心地带,繁荣不再是理所当然的。 上个月,激光和机床制造商通快(Trumpf)——该国被称为“中型企业”(Mittelstand)的全球成功家族企业的代表——自全球金融危机以来首次出现亏损。 24小时内,其所在地——位于富裕的西南部巴登-符腾堡州的迪岑根市宣布将加大财政紧缩力度。当地企业税是该市的主要收入来源,但自2023年以来已暴跌80%,导致该市未来几年预算将长期处于严重赤字状态。 迪岑根市财政局长帕特里克·迈尔告诉《金融时报》,虽然他预料到会受到冲击,“但我真的没想到情况会这么糟糕”。迈尔确信“我们正面临一场结构性危机”。 Trumpf是该镇最大的纳税人,截至 6 月的 12 个月内,其销售额下降了 16%,至 43 亿欧元,原因是订单连续第三年减少。 “目前的情况似乎常常陷入瘫痪,”首席执行官尼古拉·莱宾格-卡穆勒在10月份向记者发布年度业绩报告时表示。 这种悲观的评估反映了德国的国民情绪。欧洲最大的经济体已经连续四年陷入停滞。保时捷咨询公司合伙人德克·菲茨表示,保守派总理弗里德里希·默茨上任六个月后,“德国工程行业的危机正在迅速加剧”。他还补充说,很明显,此次衰退并非周期性现象,也不会在下一次经济复苏中“自动消失”。 尽管9月份出现部分反弹,但德国工业生产仍维持在2005年的水平。“德国的许多核心经济优势已经变成了弱点,”总部位于慕尼黑的咨询公司罗兰贝格的全球董事总经理马库斯·贝雷特表示。这些弱点包括难以脱碳的庞大工业基础、在全球化面临威胁之际对出口的高度依赖,以及不得不放弃140年内燃机技术积累的强大汽车工业。 所有这一切都因美国和中国相隔十年做出的两项截然不同的政治决定而加剧:唐纳德·特朗普发起的贸易战,以及北京十年前决定将自己打造成为全球高科技工程强国。 特朗普的关税政策已经对德国出口商造成了沉重打击:今年前九个月,德国对美国的出口下降了 7.4%。 但中国的前景反而更加黯淡,造成了“中国冲击”,如今正在侵蚀全球成功的德国公司的利润。 在新冠疫情爆发前的近二十年里,中国对德国工程产品和汽车的需求似乎永无止境,推动了默克尔时代企业利润、就业和经济活动的增长。 然而,法兰克福咨询公司Thin Ice Macroeconomics的创始人斯皮罗斯·安德烈奥普洛斯表示,自疫情爆发以来,中国“在德国擅长的领域正日益超越...