跳至主要内容

揭秘DeepSeek:一个更极致的中国技术理想主义故事

 

做贡献者,而非搭便车者。

文 | 于丽丽
编辑 | 刘旌

中国的7家大模型创业公司中,DeepSeek(深度求索)最不声不响,但它又总能以出其不意的方式被人记住。

一年前,这种出其不意源自它背后的量化私募巨头幻方,是大厂外唯一一家储备万张A100芯片的公司,一年后,则来自它才是引发中国大模型价格战的源头。

在被AI连续轰炸的5月,DeepSeek一跃成名。起因是他们发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。

DeepSeek被迅速冠以“AI界拼多多”之称的同时,字节、腾讯、百度、阿里等大厂也按耐不住,纷纷降价。中国大模型价格战由此一触即发。

弥漫的硝烟其实掩盖了一个事实:与很多大厂烧钱补贴不同,DeepSeek是有利润的。

这背后,是DeepSeek对模型架构进行了全方位创新。它提出的一种崭新的MLA(一种新的多头潜在注意力机制)架构,把显存占用降到了过去最常用的MHA架构的5%-13%,同时,它独创的DeepSeekMoESparse结构,也把计算量降到极致,所有这些最终促成了成本的下降。

在硅谷,DeepSeek被称作“来自东方的神秘力量”。SemiAnalysis首席分析师认为,DeepSeek V2论文“可能是今年最好的一篇”。OpenAI前员工Andrew Carr认为论文“充满惊人智慧”,并将其训练设置应用于自己的模型。而OpenAI前政策主管、Anthropic联合创始人Jack Clark认为,DeepSeek“雇佣了一批高深莫测的奇才”,还认为中国制造的大模型,“将和无人机、电动汽车一样,成为不容忽视的力量。”

在基本由硅谷牵动故事进展的AI浪潮里,这是罕有的情形。多位行业人士告诉我们,这种强烈的反响源自架构层面的创新,是国产大模型公司乃至全球开源基座大模型都很罕见的尝试。一位AI研究者表示,Attention架构提出多年来,几乎未被成功改过,更遑论大规模验证。“这甚至是一个做决策时就会被掐断的念头,因为大部分人都缺乏信心。”

而另一方面,国产大模型之前很少涉足架构层面的创新,也是因为很少有人主动去击破那样一种成见:美国更擅长从0-1的技术创新,而中国更擅长从1-10的应用创新。何况这种行为非常不划算——新一代模型,过几个月自然有人做出来,中国公司只要跟随、做好应用即可。对模型结构进行创新,意味着没有路径可依,要经历很多失败,时间、经济成本都耗费巨大。

DeepSeek显然是逆行者。在一片认为大模型技术必然趋同,follow是更聪明捷径的喧哗声中,DeepSeek看重“弯路”中积累的价值,并认为中国的大模型创业者除应用创新外,也可以加入到全球技术创新的洪流中。

DeepSeek的很多抉择都与众不同。截至目前,7家中国大模型创业公司中,它是唯一一家放弃“既要又要”路线,至今专注在研究和技术,未做toC应用的公司,也是唯一一家未全面考虑商业化,坚定选择开源路线甚至都没融过资的公司。这些使得它经常被遗忘在牌桌之外,但在另一端,它又经常在社区被用户“自来水”式传播。

DeepSeek究竟是如何炼成的?我们为此访谈了甚少露面的DeepSeek创始人梁文锋。

这位从幻方时代,就在幕后潜心研究技术的80后创始人,在DeepSeek时代,依旧延续着他的低调作风,和所有研究员一样,每天“看论文,写代码,参与小组讨论”。

和很多量化基金创始人都有过海外对冲基金履历,多出身物理、数学等专业不同的是,梁文锋一直是本土背景,早年就读的也是浙江大学电子工程系人工智能方向。

多位行业人士和DeepSeek研究员告诉我们,梁文锋是当下中国AI界非常罕见的“兼具强大的infra工程能力和模型研究能力,又能调动资源”、“既可以从高处做精准判断,又可以在细节上强过一线研究员”的人,他拥有“令人恐怖的学习能力”,同时又“完全不像一个老板,而更像一个极客”。

这是一次尤为难得的访谈。访谈里,这位技术理想主义者,提供了目前中国科技界特别稀缺的一种声音:他是少有的把“是非观”置于“利害观”之前,并提醒我们看到时代惯性,把“原创式创新”提上日程的人。

一年前,DeepSeek刚下场时,我们初次访谈了梁文锋 :《疯狂的幻方:一家隐形AI巨头的大模型之路》 。如果说当时那句「务必要疯狂地怀抱雄心,且还要疯狂地真诚」还是一句美丽的口号,一年过去,它已经在成为一种行动。

以下为对话部分:

价格战第一枪是怎么打响的?

「暗涌」:DeepSeek V2模型发布后,迅速引发一场血雨腥风的大模型价格战,有人说你们是行业的一条鲶鱼。

梁文锋:我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。

「暗涌」:这个结果让你们意外吗?

梁文锋:非常意外。没想到价格让大家这么敏感。我们只是按照自己的步调来做事,然后核算成本定价。我们的原则是不贴钱,也不赚取暴利。这个价格也是在成本之上稍微有点利润。

「暗涌」:5天后智谱AI就跟进了,之后是字节、阿里、百度、腾讯等大厂。

梁文锋:智谱AI降的是一个入门级产品,和我们同级别的模型仍然收费很贵。字节是真正第一个跟进的。旗舰模型降到和我们一样的价格,然后触发了其它大厂纷纷降价。因为大厂的模型成本比我们高很多,所以我们没想到会有人亏钱做这件事,最后就变成了互联网时代的烧钱补贴的逻辑。

「暗涌」:外部看来,降价很像在抢用户,互联网时代的价格战通常如此。

梁文锋:抢用户并不是我们的主要目的。我们降价一方面是因为我们在探索下一代模型的结构中,成本先降下来了,另一方面也觉得无论API,还是AI,都应该是普惠的、人人可以用得起的东西。

「暗涌」:在这之前,大部分中国公司都会直接copy这一代的 Llama结构去做应用,为什么你们会从模型结构切入?

梁文锋:如果目标是做应用,那沿用 Llama结构,短平快上产品也是合理选择。但我们目的地是AGI,这意味着我们需要研究新的模型结构,在有限资源下,实现更强的模型能力。这是scale up到更大模型所需要做的基础研究之一。除了模型结构,我们还做了大量其他的研究,包括怎么构造数据,如何让模型更像人类等,这都体现在我们发布的模型里。另外,Llama的结构,在训练效率和推理成本上,和国外先进水平估计也已有两代差距。

「暗涌」:这种代差主要来自哪里?

梁文锋:首先训练效率有差距。我们估计,国内最好的水平和国外最好的相比,模型结构和训练动力学上可能有一倍的差距,光这一点我们要消耗两倍的算力才能达到同样效果。另外数据效率上可能也有一倍差距,也就是我们要消耗两倍的训练数据和算力,才能达到同样的效果。合起来就要多消耗4倍算力。我们要做的,正是不停地去缩小这些差距。

「暗涌」:大部分中国公司都选择既要模型又要应用,为什么DeepSeek目前选择只做研究探索?

梁文锋:因为我们觉得现在最重要的是参与到全球创新的浪潮里去。过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。

「暗涌」:互联网和移动互联网时代留给大部分人的惯性认知是,美国擅长搞技术创新,中国更擅长做应用。

梁文锋:我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去三十多年IT浪潮里,我们基本没有参与到真正的技术创新里。我们已经习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。Scaling Law也在被如此对待。

但其实,这是西方主导的技术社区一代代孜孜不倦创造出来的,只因为之前我们没有参与这个过程,以至于忽视了它的存在。

真正的差距不是一年或两年,而是原创和模仿之差

「暗涌」:为什么DeepSeek V2会让硅谷的很多人惊讶?

梁文锋:在美国每天发生的大量创新里,这是非常普通的一个。他们之所以惊讶,是因为这是一个中国公司,在以创新贡献者的身份,加入到他们游戏里去。毕竟大部分中国公司习惯follow,而不是创新。

「暗涌」:但这种选择放在中国语境里,也过于奢侈。大模型是一个重投入游戏,不是所有公司都有资本只去研究创新,而不是先考虑商业化。

梁文锋:创新的成本肯定不低,过去那种拿来主义的惯性也和过去的国情有关。但现在,你看无论中国的经济体量,还是字节、腾讯这些大厂的利润,放在全球都不低。我们创新缺的肯定不是资本,而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。

「暗涌」:为什么中国公司——包括不缺钱的大厂,这么容易把快速商业化当第一要义?

梁文锋:过去三十年,我们都只强调赚钱,对创新是忽视的。创新不完全是商业驱动的,还需要好奇心和创造欲。我们只是被过去那种惯性束缚了,但它也是阶段性的。

「暗涌」:但你们究竟是一个商业组织,而非一个公益科研机构,选择创新,又通过开源分享出去,那要在哪里形成护城河?像5月这次MLA架构的创新,也会很快被其他家copy吧?

梁文锋:在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。所以我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know-how,形成可以创新的组织和文化,就是我们的护城河。

开源,发论文,其实并没有失去什么。对于技术人员来说,被follow是很有成就感的事。其实,开源更像一个文化行为,而非商业行为。给予其实是一种额外的荣誉。一个公司这么做也会有文化的吸引力。

「暗涌」:你怎么看类似朱啸虎的这种市场信仰派观点?

梁文锋:朱啸虎是自洽的,但他的打法更适合快速赚钱的公司,而你看美国最赚钱的公司,都是厚积薄发的高科技公司。

「暗涌」:但做大模型,单纯的技术领先也很难形成绝对优势,你们赌的那个更大的东西是什么?

梁文锋我们看到的是中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。

英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。

更多的投入并不一定产生更多的创新

「暗涌」:现在的DeepSeek有一种OpenAI早期的理想主义气质,也是开源的。后边你们会选择闭源吗?OpenAI和Mistral都有过从开源到闭源的过程。

梁文锋:我们不会闭源。我们认为先有一个强大的技术生态更重要。

「暗涌」:你们有融资计划吗?看有媒体报道,幻方对DeepSeek有独立拆分上市的计划,硅谷的AI创业公司,最终也都难免要和大厂绑定。

梁文锋:短期内没有融资计划,我们面临的问题从来不是钱,而是高端芯片被禁运。

「暗涌」:很多人认为,做AGI和做量化是完全不同的两件事,量化可以闷声去做,但AGI可能更需要高举高打,需要结盟,这样可以让你的投入变大。

梁文锋:更多的投入并不一定产生更多的创新。否则大厂可以把所有的创新包揽了。

「暗涌」:你们现在不做应用,是因为你们没有运营的基因吗?

梁文锋:我们认为当前阶段是技术创新的爆发期,而不是应用的爆发期。长远来说,我们希望形成一种生态,就是业界直接使用我们的技术和产出,我们只负责基础模型和前沿的创新,然后其它公司在DeepSeek 的基础上构建toB、toC的业务。如果能形成完整的产业上下游,我们就没必要自己做应用。当然,如果需要,我们做应用也没障碍,但研究和技术创新永远是我们第一优先级。

「暗涌」:但选择API的话,为什么选择DeepSeek,而不是大厂?

梁文锋:未来的世界很可能是专业化分工的,基础大模型需要持续创新,大厂有它的能力边界,并不一定适合。

「暗涌」:但技术真的可以拉开差距吗?你也说过并不存在绝对的技术秘密。

梁文锋:技术没有秘密,但重置需要时间和成本。英伟达的显卡,理论上没有任何技术秘密,很容易复制,但重新组织团队以及追赶下一代技术都需要时间,所以实际的护城河还是很宽。

「暗涌」:你们降价后,字节率先跟进,说明他们还是感受到某种威胁。你怎么看创业公司与大厂竞争的新解法?

梁文锋:说实话我们不太care这件事,只是顺便做了这件事。提供云服务不是我们的主要目标。我们的目标还是去实现AGI。

目前没有看到什么新解法,但大厂也没有明显占优。大厂有现成的用户,但它的现金流业务也是它的包袱,也会让它成为随时被颠覆的对象。

「暗涌」:你怎么看DeepSeek之外的6家大模型创业公司的终局?

梁文锋:可能活下来2到3家。现在都还处在烧钱阶段,所以那些自我定位清晰、更能精细化运营的,更有机会活下来。其它公司可能会脱胎换骨。有价值的东西不会烟消云散,但会换一种方式。

「暗涌」:幻方时代,面对竞争的姿态就被评价为“我行我素”,很少在意横向比较。关于竞争,你思考的原点是什么?

梁文锋:我经常思考的是,一个东西能不能让社会的运行效率变高,以及你能否在它的产业分工链条上找到擅长的位置。只要终局是让社会效率更高,就是成立的。中间很多都是阶段性的,过度关注必然眼花缭乱。

一群做“高深莫测”事的年轻人

「暗涌」:OpenAI前政策主管、Anthropic联合创始人Jack Clark认为DeepSeek雇佣了“一批高深莫测的奇才”,做出DeepSeek v2的是怎样一群人?

梁文锋:并没有什么高深莫测的奇才,都是一些Top高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。

「暗涌」:很多大模型公司都执着地去海外挖人,很多人觉得这个领域前50名的顶尖人才可能都不在中国的公司,你们的人都来自哪里?

梁文锋:V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。

「暗涌」:这次MLA创新是如何发生的?听说idea最早来自一个年轻研究员的个人兴趣?

梁文锋:在总结出Attention架构的一些主流变迁规律后,他突发奇想去设计一个替代方案。不过从想法到落地,中间是一个漫长的过程。我们为此组了一个team,花了几个月时间才跑通。

「暗涌」:这种发散性灵感的诞生和你们完全创新型组织的架构很有关系。幻方时代,你们就很少自上而下地指派目标或任务。但AGI这种充满不确定性的前沿探索,是否多了管理动作?

梁文锋:DeepSeek也全是自下而上。而且我们一般不前置分工,而是自然分工。每个人有自己独特的成长经历,都是自带想法的,不需要push他。探索过程中,他遇到问题,自己就会拉人讨论。不过当一个idea显示出潜力,我们也会自上而下地去调配资源。

「暗涌」:听说DeepSeek对于卡和人的调集非常灵活。

梁文锋:我们每个人对于卡和人的调动是不设上限的。如果有想法,每个人随时可以调用训练集群的卡无需审批。同时因为不存在层级和跨部门,也可以灵活调用所有人,只要对方也有兴趣。

「暗涌」:一种松散的管理方式也取决于你们筛选到了一批强热爱驱动的人。听说你们很擅长从细节招人, 可以让一些非传统评价指标里优秀的人被选出来。

梁文锋:我们选人的标准一直都是热爱和好奇心,所以很多人会有一些奇特的经历,很有意思。很多人对做研究的渴望,远超对钱的在意。

「暗涌」: transformer诞生在谷歌的AI Lab,ChatGPT诞生在OpenAI,你觉得大公司的AILab 和一个创业公司对于创新产生的价值有什么不同?

梁文锋:不管是Google实验室,还是OpenAI,甚至中国大厂的AI Lab,都很有价值的。最后是OpenAI做出来,也有历史的偶然性。

「暗涌」:创新很大程度也是一种偶然吗?我看你们办公区中间那排会议室左右两侧都设置了可以随意推开的门。你们同事说,这就是给偶然留出空隙。transfomer诞生中就发生过那种偶然经过的人听到后加入,最终把它变成一个通用框架的故事。

梁文锋:我觉得创新首先是一个信念问题。为什么硅谷那么有创新精神?首先是敢。Chatgpt出来时,整个国内对做前沿创新都缺乏信心,从投资人到大厂,都觉得差距太大了,还是做应用吧。但创新首先需要自信。这种信心通常在年轻人身上更明显。

「暗涌」:但你们不参与融资,很少对外发声,社会声量上肯定不如那些融资活跃的公司,怎么确保DeepSeek就是做大模型的人的首选?

梁文锋:因为我们在做最难的事。对顶级人才吸引最大的,肯定是去解决世界上最难的问题。其实,顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了,使得他们没有机会被识别出来。我们在做最难的事,对他们就是有吸引力的。

「暗涌」:前一段OpenAI的发布并没有等来GPT5,很多人觉得这是技术曲线明显在放缓,也很多人开始质疑Scaling Law,你们怎么看?

梁文锋:我们偏乐观,整个行业看起来都符合预期。OpenAI也不是神,不可能一直冲在前面。

「暗涌」:你觉得AGI还要多久实现,发布DeepSeek V2前,你们发布过代码生成和数学的模型,也从dense模型切换到了MOE,所以你们的AGI路线图有哪些坐标?

梁文锋:可能是2年、5年或者10年,总之会在我们有生之年实现。至于路线图,即使在我们公司内部,也没有统一意见。但我们确实押注了三个方向。一是数学和代码,二是多模态,三是自然语言本身。数学和代码是AGI天然的试验场,有点像围棋,是一个封闭的、可验证的系统,有可能通过自我学习就能实现很高的智能。另一方面,可能多模态、参与到人类的真实世界里学习,对AGI也是必要的。我们对一切可能性都保持开放。

「暗涌」:你觉得大模型终局是什么样态?

梁文锋:会有专门公司提供基础模型和基础服务,会有很长链条的专业分工。更多人在之上去满足整个社会多样化的需求。

所有的套路都是上一代的产物

「暗涌」:过去这一年,中国的大模型创业还是有很多变化的,比如去年开头还很活跃的王慧文中场退出了,后来加入的公司也开始呈现出差异化。

梁文锋:王慧文自己承担了所有的损失,让其他人全身而退。他做了一个对自己最不利,但对大家都好的选择,所以他做人是很厚道的,这点我很佩服。

「暗涌」:现在你的精力最多放在哪里?

梁文锋:主要的精力在研究下一代的大模型。还有很多未解决的问题。

「暗涌」:其他几家大模型创业公司都是坚持既要又要,毕竟技术不会带来永久领先,抓住时间窗口把技术优势落到产品也很重要,DeepSeek敢于专注在模型研究上是因为模型能力还不够吗?

梁文锋:所有的套路都是上一代的产物,未来不一定成立。拿互联网的商业逻辑去讨论未来AI的盈利模式,就像马化腾创业时,你去讨论通用电气和可口可乐一样。很可能是一种刻舟求剑。

「暗涌」:过去幻方就有很强的技术和创新基因,成长也比较顺利,这是你偏乐观的原因吗?

梁文锋:幻方某种程度上增强了我们对技术驱动型创新的信心,但也不都是坦途。我们经历了一个漫长的积累过程。外部看到的是幻方2015年后的部分,但其实我们做了16年。

「暗涌」:回到关于原创式创新的话题。现在经济开始进入下行,资本也进入冷周期,所以它对原创式创新是否会带来更多抑制?

梁文锋:我倒觉得未必。中国产业结构的调整,会更依赖硬核技术的创新。当很多人发现过去赚快钱很可能来自时代运气,就会更愿意俯身去做真正的创新。

「暗涌」:所以你对这件事也是乐观的?

梁文锋:我是八十年代在广东一个五线城市长大的。我的父亲是小学老师,九十年代,广东赚钱机会很多,当时有不少家长到我家里来,基本就是家长觉得读书没用。但现在回去看,观念都变了。因为钱不好赚了,连开出租车的机会可能都没了。一代人的时间就变了。

以后硬核创新会越来越多。现在可能还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。

评论

此博客中的热门博文

对特朗普来说,这是一次彩排 命令国民警卫队部署到洛杉矶是一个警告,当他的权力受到威胁时,将会发生什么。

 大西洋月刊: 大卫·弗鲁姆 (David Frum) 昨天,唐纳德·特朗普总统下令国民警卫队镇压洛杉矶针对移民执法人员的骚乱抗议活动。 国防部长皮特·赫格塞斯 宣布,他准备服从特朗普的命令, 动用 美国海军陆战队。这些威胁看起来夸张且毫无意义。加州、各县和市 雇佣了 超过7.5万名拥有逮捕权的制服执法人员。仅洛杉矶警察局 就有 近9000名制服警员。他们肯定能够处理数十名投掷石块、燃放烟花和阻碍车辆通行的骚乱者。 如果这7.5万名警员感到不堪重负,加州可以主动请求联邦政府的援助。例如,今年早些时候的山火期间,加州曾请求过必要的联邦援助,但特朗普 却不愿接受 ,并利用这些援助玩弄政治。现在,特朗普正在强迫加州和加州提供他们不需要、也不想要的援助,目的并非恢复法律,而是为了维护他 个人 对正常执法程序的主导地位。 然而,如果说特朗普和赫格塞斯的威胁在执法方面毫无意义,那么在政治策略方面却意义非凡。自特朗普连任以来,密切关注其总统任期的人士一直担心,在2026年中期选举前,可能会发生一系列特定的事件: 步骤 1:利用联邦权力来引发某种电视骚乱——火焰、烟雾、巨大噪音、挥舞外国国旗。 第二步:利用骚乱宣布进入紧急状态并部署联邦军队。 第三步:控制地方政府运作——2025年6月控制警务;2026年11月控制投票。 2020 年 11 月,特朗普的一些最狂热的支持者 敦促 他实施这一计划。但在 2020 年,他们等得太久了——直到投票结束之后。对于由马克·埃斯珀这样一位尊法的内阁部长领导的国防部来说,动用军队推翻已经完成的选举是一个过于极端的举动。特朗普转而求助于法院。只有在法院令他失望之后,特朗普才试图使用暴力,而当时唯一可用的暴力工具就是他在 2021 年 1 月 6 日 召集到华盛顿特区的轻武装暴徒。尽管这些事件令人痛心,但它们从来就没有太大的成功机会:没有任何军队的支持,特朗普的暴徒无法强 加特朗普想要的结果 。 但特朗普本周末在洛杉矶威胁的手段在 2026 年 11 月可能比 2021 年 1 月企图发动的平民政变更为有效。 如果特朗普能在中期选举前在蓝州煽动骚乱,他就可以动用紧急权力,将联邦控制权强加于投票过程,也就是 他自己的 控制权。或者,他可能会暂停投票,直到他认为秩序已经恢复。无论哪种情况,蓝州的席位都可能空缺一段时间。 此类行动确实存在先例。18...

特朗普派遣军队进入洛杉矶,测试总统权力的极限

FT: 唐纳德·特朗普周日呼吁军队镇压洛杉矶的抗议活动,表明他愿意让国家进入战争状态——并测试行政权力的界限——以实现他的目标。  几十年来,美国首次在违背州长意愿的情况下, 派遣国民警卫队 在本土对付公民,而这恰恰是一条鲜少援引的法律,该法律旨在帮助美国抵御外国入侵。美国总统上一次未经州长要求部署国民警卫队是在1965年,当时林登·约翰逊派出部队保护阿拉巴马州塞尔玛的民权示威者。 国防部长皮特·赫格塞斯甚至威胁要派遣海军陆战队平息因突袭疑似非法移民而引发的骚乱。这将需要援引《叛乱法》。上一次援引该法是在30年前,当时 殴打罗德尼·金的警察被无罪释放后, 洛杉矶爆发了骚乱。 哈佛大学政府学教授瑞安·埃诺斯 (Ryan Enos) 表示,向这座美国第二大城市(该城市基本上是自由派)部署国民警卫队“显然是威权主义的强权展示”。 “没有任何政策理由(说明为什么政府)应该针对洛杉矶地区而不是红州地区。” 此次部署是特朗普政府试探总统权力界限、迫使民主党执政的各州遵守联邦法令的最新举措。一些学者警告称,这些举措日益公然违反政治惯例和美国宪法。 短短几天内,特朗普下令对其前总统竞争对手乔·拜登和上届政府官员展开调查,并威胁要停止向加州提供联邦资金。 总统提出取消其前盟友埃隆·马斯克旗下企业持有的政府合同的想法,并警告说,如果这位亿万富翁动用其资金支持民主党候选人,将会产生“非常严重的后果”。 周日,一名抗议者在洛杉矶的抗议活动中与一名警长对峙 © Ringo Chiu/AFP/Getty Images 特朗普最热心的副手也发出了类似的威胁。副总统JD·万斯(JD Vance)暗示,“没有合法居留权的外国人挥舞外国国旗并袭击执法人员”的现象,在法律上可以被定义为入侵。  白宫移民政策的制定者斯蒂芬·米勒表示,美国面临的选择是“驱逐入侵者,或向叛乱投降”。他赞同一篇呼吁不惜一切代价进行大规模驱逐的帖子,并在帖子结尾写道:“如果这个问题得不到解决,其他一切都不重要。”  在福克斯新闻上,边境事务主管汤姆·霍曼建议司法部调查民主党议员——包括众议院少数党领袖哈基姆·杰弗里斯——他们呼吁移民和海关执法局特工在进行突袭时不要用面具遮住脸。 国土安全部部长克里斯蒂·诺姆(Kristi Noem)为在洛杉矶部署军队辩护时声称,ICE 特工只是在追捕“最坏的人”——那...

阿里高管离职万字长文剖析谈阿里“大公司病”,马云回应

近日,钉钉的一位产研负责人,花名叫元安,在阿里干了15年,离职时在内网写了一篇万字长文,直指公司当前面临的深层危机与价值观蜕变。 马云也关注到了这条帖子,并进行了回复:“元安同学好,谢谢你那么长的信,写得很好。好像人的成长,阿里的发展也有很多必然要走的路和过程,在发生变化之中。祝福你,也希望经常回来看看。” 马去的回应虽然很温情,却未直接触及文中提出的尖锐批评与改革诉求。 元安的原贴文如下: 阿里巴巴的使命是让天下没有难做的生意,阿里巴巴的愿景是成为一家活102年的好公司。 当初受这一使命感召来到这里,期望能一起陪着度过长长的期限,因为阿里巴巴是一家伟大的公司。 刚进公司的时候,在创业大厦,中午去附近吃饭,大家都戴着工牌,除了周边店铺给我们的员工折扣价更多的是享受那种被尊重和感谢的美好。那时候被尊重不是因为阿里人收入高,更多的是阿里人很善良我们的产品帮助了很多人,身边的人或多或少地感受到了阿里巴巴在解决各种问题,社会给我们的尊重来自对我们的品德与价值认可。 那时候,流行一句玩笑话:杭州丈母娘喜欢找阿里女婿,因为阿里巴巴已帮她们筛选过品性,阿里人靠谱。 已经不记得从何时开始,工牌已不太好戴了,这几年各种糟糕的事件与打击,外部社会舆论和内部员工心态,都发生了巨大的改变。也许丈母娘还喜欢找阿里女婿,因为收入高。 十五年走下来,客观地讲,不是外部单一的评价风向变化,是我们自己真的也变了。我们已经失去了以前那种要为社会带来美好改变的梦想,我们谈论的是KPI,是工资,股票,房子,我们把客户和用户当流量当数据,我们谈的是怎样运营数据,怎样收割客户,我们的竞争消耗在内部361。 说实话,看到阿里内部核心的价值慢慢变差,我很担心,我们的使命还能够坚持多久,我们的愿景还能否实现。 先声明,我的绩效还可以,对于当前部门与主管也没不满,我也是自己有计划的离职,不是领礼包。因此写这篇帖子,不针对任何部门任何人,我说的是对于但凡符合我以下说的一些情况的任何部门任何人。这是基于这十五年我自己感受以及各个BU朋友的交流后,总结的一篇帖子,更多的,是给公司整体和高层的一个反馈。我想,作为给公司最后的一些建议吧,希望公司能够好起来,觉得公司现在挺好的可以直接忽路本文。 好的我就不说了,主要说说存在的问题,有则改之无则加勉,有写的不对的地方,当我无知,也欢迎指正。再一次说明,以下问题不是指所有部门,也不...

WSJ:图解中美军工实力差距 自二战以来,美国的军工实力不断衰弱,如今已被中国远远甩在后面

 WSJ: 多年来,应对中国在军事和经济方面带来的双重挑战一直是美国历届政府关注的焦点。而美国正在失去优势。 俄罗斯入侵乌克兰的战争表明,现代战争是工业实力的较量。双方都在大量消耗炮弹、火箭弹和军用车辆。自动化工厂现在日夜不停地赶制无人机。就连老式榴弹炮现在也需要精密制造技术。 美国能够打赢第二次世界大战,在一定程度上要归功于其远超敌国的生产能力,从子弹到食品,美国都能比敌国造得更多。1942年,加利福尼亚州一家船厂仅用不到五天时间就将一艘补给舰组装完成。但今天的美国已经没有能力再完成这种制造壮举。 如今,在几乎所有领域都拥有制造优势的国家变成了中国。中国制造无所不包,涵盖从基础化学品到先进机械的各个领域。随着美中紧张局势的升级,一旦爆发冲突,工业产能将成为两国角力的重要战场。 PHOTO: 中国的经济增长为中国建立匹敌美国的军事实力奠定了基础。华盛顿智库战略与国际研究中心(Center for Strategic and International Studies)的数据显示,中国一家船厂去年以载重吨计的商用船舶产量就超过了自二战以来整个美国造船业的总产量。中国商用造船业规模庞大,能够支持海军舰艇的生产,而在战争中,产能可以从货轮转为军舰。 根据国防情报公司Janes的数据,自2000年以来,中国建造的军舰数量相当于美国的两倍多。 尽管美国的许多平台被认为比中国更先进,但中国空军和海军与美国的差距正在缩小。 PHOTO: 海军火力便是典型例证。中美之间原本在作战能力上差距悬殊,但中国在海上发射巡航导弹及其他火箭弹的能力正使这种差距不断缩小。 PHOTO: 中国的许多制造商虽然并不属于军工领域,但一旦发生战争,可以轻松转向武器制造或为武器制造提供支持。 中国不仅拥有更多工厂,而且正采用5G专网等自动化技术,以更快的速度推动工厂现代化。这意味着,中国可以更快、更高效地将生产设备与设计师和用户相连接,以传统制造无法实现的速度更新产品。看看乌克兰,前线部队给无人机制造商的持续反馈使该国在无人驾驶飞行器领域突飞猛进。 PHOTO: 这还意味着,中国比美国更容易加快生产。中国拥有的工业机器人数量也远超美国,这进一步增强了其巨大的劳动力优势。 PHOTO: 战争不仅仅事关军事装备。每一架飞机、每一艘舰船和每一辆坦克都需要燃料、备件和弹药。乘员则需要食物、水和医疗服务。这...

美国自诩为世界道德领袖,如今已不再是了

 彭博: 过去一个世纪,美国外交政策一直秉持着这样一种理念:作为一个国家,我们行善也能带来福祉——帮助我们的朋友和邻居,既能获得精神上的回报,也能获得物质上的回报。如今, 唐纳德·特朗普总统的政府 正以惊人的速度瓦解这一理念。未来数月乃至数年,美国政府其他部门、各国以及跨国公司将如何应对,至少将成为我们余生中至关重要的问题。 美国利他治国之道的实践者以其崇高的理想和雄辩的言辞而闻名。“先生们,毋庸置疑,世界形势非常严峻,”时 任国务卿乔治·马歇尔 1947年在哈佛大学对学生们发表演讲时说道。这场演讲至今仍充满历史的共鸣。当时他正在介绍旨在重建西欧饱受战争蹂躏国家的马歇尔计划。“美国理应尽其所能,帮助世界经济恢复正常健康,否则就不会有政治稳定和有保障的和平。” 马歇尔计划(以今天的美元价值计算,价值约1700亿美元)受到历史学家的普遍赞誉,其先例也相当丰富。20世纪30年代,富兰克林·D·罗斯福通过一项名为“租借法案”的计划向英国提供了武器,用于对抗纳粹德国,却没有索要任何报酬。罗斯福的主张是,当邻居家着火时,只要给他们一根花园水管,无需讨价还价,就能确保火势不会蔓延。温斯顿·丘吉尔称其为“有史以来最廉洁的举动”。 当然,美国一再违背自身的价值观。越南战争、支持中东和拉丁美洲的暴君、入侵伊拉克、阿布格莱布监狱——这份名单很长,用丘吉尔的话来说,简直是肮脏不堪。但美国总统,无论党派,普遍都认同美国是一个道德超级大国。吉米·卡特将人权置于外交政策的核心,他的继任者罗纳德·里根则将道德领导力与激烈的反共政策相结合,支持自由欧洲电台、美国之音等倡议,并向贫穷国家提供人道主义援助。普林斯顿大学国际事务教授 罗伯特·基欧汉表示 :“除了越南战争等一些明显的例子外,美国公众一直认为其在世界上的领导地位是有原则的、有价值的。而特朗普试图推翻这两个前提。” 特朗普这样做,是借鉴了美国另一套根深蒂固的传统:孤立主义、本土主义和狭隘的利己主义。他的前辈是20世纪20年代的亨利·福特、30年代的广播煽动家考夫林神父和50年代的参议员约瑟夫·麦卡锡,他们都认为国内安全与繁荣比任何更高的国际决心都重要。“在特朗普总统的领导下,辛勤工作的美国纳税人的钱将永远得到明智的使用,我们的权力将永远得到审慎的运用,并用于对美国最有利的事情,”国务卿 马尔科·卢比奥在 参议院确认听证会 的发言稿中说道...

经济学人:2025 年迄今为止上映的 15 部最佳电影和电视节目(海外影片)

“Adolescence”    “青春期” This taut, anxiety-inducing show, about a 13-year-old boy (Owen Cooper) accused of murdering a classmate, is captivating. The acting is impeccable and the show’s themes—including masculinity and online brainwashing—resonate. 这部 剧情紧张刺激、令人焦虑的剧集 讲述了一个 13 岁男孩(欧文·库珀饰)被指控谋杀同学的故事,引人入胜。演员的表演无可挑剔,剧中探讨的主题——包括男子气概和网络洗脑——也引发了观众的共鸣。 “Andor”    “安多” The “Star Wars” universe has, surprisingly, produced a sophisticated show about authoritarianism. It follows Cassian Andor (Diego Luna) as he is transformed from an apolitical thief into a rebel against the Galactic Empire. The show’s writers understand the machinery of repression. 《星球大战》宇宙出人意料地打造了一部关于威权主义的精妙剧集。该剧讲述了卡西安·安多(迭戈·鲁纳饰)从一个不关心政治的窃贼蜕变成反抗银河帝国的叛逆者的故事。该剧的编剧们对镇压机制了如指掌。 “The Clubhouse: A Year with  the Red Sox” “俱乐部会所:  红袜队 的一年  ” This eight-part documentary series follows Boston’s baseball team. It is a triumph of editing, with terrific access to the team over the course of 162 games. Ath...

稀土为何成为中美贸易战的王牌

彭博: 稀土是地球上最关键的原材料之一,深深植根于支撑现代生活的科技之中。然而,很少有人听说过稀土,也不知道它的作用。 稀土元素,例如钆和镝,虽然名字鲜为人知,但其用途广泛——从半导体、iPhone到核磁共振成像仪和癌症治疗。近年来,有助于减少碳排放的绿色科技推动了稀土需求。 长期以来,世界一直依赖中国的稀土资源——中国利用这一点来应对美国总统 唐纳德·特朗普发起的新贸易战 。中国 利用 其在供应链中的主导地位,通过限制稀土出口来报复美国的关税。 取消这些限制一直是 两大超级大国贸易谈判的 焦点 ,并有可能破坏两国今年5月达成的为期90天的微妙关税休战协议。限制中国稀土出口可能会对美国经济,包括军工领域产生影响。据美国国防部称, F -35战斗机需要超过900磅(408公斤)的稀土。 中国主导稀土供应 2024年全球磁铁稀土元素(钕、镨、镝和铽)开采和精炼产量占比 资料来源:国际能源署 什么是稀土? 稀土元素是由17种金属元素组成的集合,由于化学性质相似而被归类。稀土元素的光学、磁性和电学特性使其用途广泛。 例如,铽和钇可以使智能手机和电视屏幕呈现鲜艳的色彩,而铈可以促进化学反应,这意味着它通常用于催化转化器中以净化汽车尾气。 钕和镨已被用于制造永磁电机。这些电机可以将电池中储存的电能转化为动能,例如驱动电动汽车的车轮。它们也可以反向工作,将动能转化为电能,例如驱动风力涡轮机叶片旋转产生的动能。   稀土到底有多稀有? 与其名称相反,稀土元素在地壳中实际上相当常见——铈的储量比锡或铅 更丰富 。但挑战在于,如何在一个地方找到浓度足够高的稀土元素,从而实现成本效益。 稀土元素的开采可能对环境造成危害,因为需要大量的水和能源来将稀土元素从其蕴藏的岩石中分离出来。此外,稀土元素的开采还可能污染当地的土壤和地下水,因为稀土元素通常与铀和钍等放射性元素同时存在。 谁是稀土的主要供应商? 20世纪60年代至80年代,美国曾是全球最大的稀土生产国,但随着中国开始加大稀土生产力度,其地位逐渐下降。低成本运营使这个东亚国家能够向市场大量供应廉价稀土,并在全球供应链中建立起近乎垄断的地位。 中国约占全球稀土矿开采量的70%。根据美国地质调查局的 数据 ,2024年,中国稀土产量达27万吨,五年内产量翻了一番。美国以4.5万吨的产量位居第二,产量差距较大。 中国主导稀土矿产生产 ...

中国发现了世界贸易的痛点——并将再次利用它

彭博:   几个月来, 唐纳德·特朗普将对中国的关税和贸易限制推至前所未有的水平,这是迫使 中国进行谈判的 策略的一部分, 美国总统希望谈判有助于削减贸易逆差并促进美国制造业。 随着美国关税飙升至 145%,特朗普政府夸口 其在与中国的竞争中占了上风 ,北京扭转了局势,基本上关闭了现代世界运转离不开的一种物质的出口:稀土磁铁。 随着含有镝和铽等稀有元素的产品交付放缓,开始对从汽车到国防等各行各业造成冲击,美国和其他国家迅速触及了痛点。福特汽车公司和 铃木汽车公司 暂停了部分生产,埃隆·马斯克表示短缺正在损害他的机器人业务,各国政府也纷纷寻求中国以外的少数供应商。一场双边贸易争端演变成一场全球危机。 “这只会制造一种紧迫感,”澳大利亚战略材料有限公司(Australian Strategic Materials Ltd.)首席执行官 罗维娜·史密斯 (Rowena Smith)表示。该公司在韩国的一家工厂生产磁铁合金。“手机发热严重,而且不仅仅是来自美国。每个人都受到了影响。” 这种压力加上高额关税,促使美国和中国上个月在日内瓦达成停火协议。贸易关税下降,美国以为获得了稀土磁铁的供应。然而,北京仍然要求企业获得购买关键材料的许可证,导致采购延误,再次加剧了紧张局势。 美国再次发起攻势,加大对芯片设计软件、喷气发动机零部件的限制,甚至威胁 学生签证 。最终,特朗普如愿以偿:与习近平通话,让两国关系重回正轨。周二晚些时候,美中贸易谈判代表 宣布,在伦敦举行的第二天谈判后取得了突破 。尽管关键细节仍不明确,但谈判的核心内容几乎毋庸置疑。 特朗普周三在社交媒体上宣布接受该协议时表示:“所有磁铁以及所有必要的稀土元素都将由中国预先供应。双方关系非常好!” 主要问题依然存在。商务部长霍华德·卢特尼克表示,他认为伦敦协议将 在几天内 获得批准,并且预计不会发布书面版本,这意味着除了大致框架之外,很难确切知道双方达成了哪些协议。 中国4月出口创新冠疫情爆发以来最低水平 数据来源:中国海关总署 注:显示 HS# 85051110 下的出口 - “稀土金属永磁体/即将成为永磁体的物品” 协议宣布数小时后, 中国 大型稀土磁体制造商金力永磁股份有限公司(JL Mag Rare-Earth Co.)宣布已获得向美国等国出口的许可。该公司在香港上市的股票一度飙升12%。但关于出口申请积...

洛杉矶发生的事情可能成为特朗普政府执政的模板——抗议、暴力和镇压的循环往往有利于右翼

 经济学人: 洛杉矶的骚乱是 昙花一现吗?又或者,这只是一个夏季骚乱的开始,以及唐纳德·特朗普总统对民主党城市抗议者毫无耐心的镇压行动的开始? 到目前为止, 洛杉矶的抗议活动 与该市以往的暴乱相比规模较小。1992年罗德尼·金骚乱期间,超过1.2万人被捕。过去两天,被捕人数只有60人左右。但情况可能会变得更糟。当洛杉矶人祈求平静,祈求军队撤离街头时,美国正处于一个危险的时刻。 美国困境的核心在于,总统当选后被赋予了处理非法移民问题的授权。然而,他的一些支持者却认为,这意味着他可能会采取一些可能违宪、显然不可能且不明智的行动。特朗普本人似乎热衷于动用军队镇压针对其政策的抗议活动。当被问及洛杉矶局势时,他表示:“我们将在各地部署军队。” 总统及其顾问认为,在加州部署国民警卫队的政治立场对他们有利。部署模式如下:宣布对一个领导层不愿出手的城市实施移民镇压,等待抗议,然后出动军队镇压抗议者。“打破常规”是对其他可能抵抗的城市发出的警告。这也向“ 让美国再次伟大”运动的 支持者发出信号,表明特朗普正在履行他们选举他时的承诺。 除了2017年妇女游行这个显著的例外,近期美国各大城市的大规模政治抗议活动往往带有暴力色彩。过去72小时内, 洛杉矶 发生了多起财产犯罪,警方还遭到烟花袭击。这或许使得国民警卫队的出动成为一种自我辩护的行为:因为这些部队可能会被视为缓解紧张局势的良方,而他们的出现似乎正是旨在加剧紧张局势。 一个问题是,特朗普是否拥有在没有加州州长加文·纽瑟姆参与的情况下部署国民警卫队的合法权力。纽瑟姆表示,警方自身应对得很好,他正在起诉政府。特朗普援引了《 美国 武装部队法典》中允许部署军队应对叛乱威胁的条款。 无论法院如何裁决——而且法院通常不愿就什么构成威胁对总统进行事后批评——特朗普的移民执法政策都是不切实际的。美国的无证移民数量大约在1100万(调查估计)到2000万(政府使用的数字)之间。即使特朗普计划大幅增加拘留中心的支出,在他们被驱逐之前,也无处安置哪怕是其中的一小部分。然而,像加州那样反对这项政策,就等于把 洛杉矶 市长和州长推到了违反规则的外国人一边,而这正是特朗普想要的。 负强化 总统丝毫没有试图降低洛杉矶局势的迹象。6月9日,五角大楼宣布向该市部署数百名海军陆战队员,以支援国民警卫队。这是不明智的。海军陆战队缺乏执法经验。正如国防部长喜欢指...

中美官员就缓和贸易紧张局势的计划达成一致

彭博: 中美双方谈判代表表示,双方贸易紧张局势缓和,就如何落实双方在日内瓦达成的共识达成初步协议。 尽管双方尚未公布协议的全部细节,但美国谈判代表表示,他们“绝对期望”稀土矿物和磁铁运输问题将随着框架协议的实施而得到解决。 美国商务部长霍华德·卢特尼克 在伦敦对记者说: “我们已经达成了实施日内瓦共识的框架。” 在白金汉宫附近一座乔治亚时代的豪宅中进行了两天近 20 小时的讨论后,中国首席贸易谈判代表李成钢表示 , 美国和中国代表团现在将把该提案带回给各自领导人。 卢特尼克补充道:“一旦总统批准,我们就会努力实施。” 美国贸易代表 杰米森·格里尔 表示,没有安排其他会谈,但他补充说,美中双方经常进行对话,并可以在需要时进行对话。 此次伦敦会谈是在特朗普政府的敦促下举行的,旨在巩固中国政府在上个月日内瓦贸易谈判中做出的缓解稀土出口的承诺,此次谈判达成了关税休战。 关键矿产出口方面的分歧再次引发了中美之间公开的经济冲突,并增加了两国刚刚达成的协议破裂的可能性,这将对世界经济构成新的威胁。 卢特尼克表示:“我们确实希望,美国稀土矿物和磁铁问题将在该框架的实施中得到解决。” “此外,当这些稀土供应不足时,美国采取了一系列措施,”卢特尼克补充道。“你应该预料到这些措施会逐渐取消——就像特朗普总统说的,以一种平衡的方式。当他们批准许可证时,你应该预料到我们的出口执行力度也会下降。” 格里尔表示:“谈到出口管制和所有这些不同的事情,在与中国人谈判的八年里,我从未遇到过他们不愿意谈论出口管制的会议。”