特斯拉Semi电动卡车电池架构曝光:创新垂直立方设计

IT之家 4 月 11 日消息,汽车媒体 teslarati 昨日(4 月 10 日)发布博文,报道称特斯拉 Semi 长续航版将采用新版 Cybertruck 电池单元,通过创新“立方体”垂直堆叠架构,解决电动卡车在寒冷气候下的续航衰减难题。

特斯拉 Semi 项目负责人 Dan Priestley 透露,长续航版 Semi 正采用源自 Cybertruck 的 4680 电池单元,不过已彻底重构电池包架构。工程师摒弃了乘用车常见的扁平“煎饼”式模块,转而采用紧凑的垂直立方体布局。

IT之家附上相关视频如下:

传统电动汽车电池包通常水平铺设于底盘下方,虽然适合乘用车,但暴露面积过大。在寒冷环境中,热量散失极快,导致锂离子电池化学反应减缓,可用能量降低。

实测数据显示,车辆在冬季续航损失可达 20-40%,对于在加拿大或北欧运营的长途卡车而言,这意味着非计划停运和成本激增。

特斯拉的立方体电池包通过高密度垂直堆叠 4680 电池,最小化了单位体积的表面积,相当于为电池穿上了“保暖衣”。

这种几何结构有效锁住了运行产生的热量,即使在零下环境中长时间停放,也能维持电池接近最佳工作温度。内华达工厂的生产画面已证实了这一结构模块的实际应用。

此外,该系统还集成了先进热泵,主动回收电机、刹车及环境空气中的废热。与早期被动系统不同,该架构将热能重新输送至电池组,确保车辆在清晨出发时无需消耗大量电量预热。

除热管理外,新电池包还作为核心底盘组件与车身结构融合,增强了整车刚性并简化了装配流程。通过沿用成熟的 4680 电池技术,特斯拉在降低成本的同时,利用 Cybertruck 和 Model Y 的生产经验,加速了 Semi 的量产进程。

比亚迪廉玉波:新能源汽车产业正进入确定性与不确定性并存阶段

财联社4月11日电,比亚迪集团首席科学家、中国工程院院士廉玉波今日在智能电动汽车发展高层论坛(2026)上表示,站在十五五规划的开局之年,新能源汽车产业正进入一个确定性与不确定性并存的阶段。其中政策的持续支持、消费认知的持续深化、产业全面电动化的趋势,是确定的大方向。行业也面临着技术拐点的不确定性。对于新一代的动力电池、智能底盘等汽车前沿技术,更需要依靠深度洞察用户的行为习惯和空间需求,跳出传统汽车的工程边界;产业边界的不确定性,汽车从单纯移动属性的交通工具,转向多属性融合的智能体,车网互动技术会使车辆的能源属性更加丰富,AI融合有望使汽车发展成为AI分布式算力的单元。这些将更加考验系统可靠性、社会接受度以及法规适配度等综合提升的系统能力。(财联社记者 徐昊)

比亚迪廉玉波:新能源汽车产业正进入确定性与不确定性并存的阶段

4月11日,比亚迪集团首席科学家、汽车总工程师、汽车工程研究院院长廉玉波在智能电动汽车发展高层论坛(2026)上表示,新能源汽车产业正进入一个确定性与不确定性并存的阶段。

“政策的持续支持、消费认知的持续深化,以及全面电动化的趋势是具备确定性的,而不确定性体现在技术拐点和产业边界方面。”廉玉波说。

在廉玉波看来,汽车产品的工程物理边界将趋于弱化,叠加以人为本的设计原则,要求新能源汽车的设计逻辑主动求变。同时,汽车逐渐从“交通工具”走向“多属性融合的智能体”,这些是新能源汽车产业面临的不确定性。

每经热评·企业家画像 | 王兴白头,美团“去登味”

每经评论员 徐肖逍

4月8日下午,中国国民党主席郑丽文一行参访美团上海总部。美团创始人王兴亲自接待,无人机配送的奶茶成为媒体焦点,也让王兴的满头白发映入公众视线。

这位年仅47岁的企业家,已经创业超二十年。白头的背后,其实是美团的焦虑。

就在不久前,美团交出了一份并不亮眼的成绩单:2025年全年营收3649亿元,净亏损近234亿元——而2024年,这家公司还盈利358亿元。一年之内,将近600亿元的利润蒸发,这是美团上市以来最剧烈的一次业绩反转。

断崖式的业绩背后,最直接的导火索,是一场烧掉了近千亿元的外卖大战。

2025年,京东、阿里相继杀入外卖战场,美团被迫应战,王兴放话“不惜代价赢得竞争”。财报显示,三方累计补贴高达800亿元至1000亿元。受此拖累,仅美团核心本地商业板块就出现经营亏损69亿元。

2025年的巨亏,表面上是外卖大战的结果,深层次则反映了美团变老导致的系统性问题。

今年3月,王兴在2026年管理层沟通会上说了一句意味深长的话:“我们都应该努力减少‘登味’。”他举了一个具体的例子——不要再叫他“兴哥”,直接叫“王兴”就好。

“登味”,也许是许多市值数千亿元公司都要面对的通病:组织臃肿、层级森严、创新乏力⋯⋯

美团太需要“去登味”了。比如,组织复杂化导致决策越来越谨慎,依赖补贴而非价值创造的增长路径,核心业务的护城河远没有想象中牢固。

更关键的是,监管正在帮平台企业按下暂停键。4月10日,《互联网平台价格行为规则》正式实施,明确提出“压实主体责任,规范价格竞争行为”。

美团必须找到新的增长方式。出路是什么?答案是回归商业的本质——提供更好的服务,而非更低的价格。

无人机配送,是“去登味”最生动的注脚。数据显示,截至2025年底,美团无人机在国内外多个城市开通70条航线,累计完成订单超78万笔。

这不仅仅是炫技。无人机配送解决了即时零售最核心的效率问题——半小时送达时代,地面运力的天花板已经被触碰。低空经济,是美团在即时零售赛道构建差异化竞争壁垒的关键一招。当竞争对手还在靠烧钱抢用户时,美团已经悄悄在“空中骑手”上布局。这不只是效率的提升,更是商业模式的升维。

在更底层的运营逻辑上,AI(人工智能)与国际化构成了美团更长远的战略纵深。

王兴在今年3月的财报电话会上说得很清楚:美团不会盲目追求成为所谓的“Token(词元)工厂”,而是将AI视为战略机遇,用以改进、加强,甚至彻底革新本地服务这一核心业务。

2025年,美团研发投入再创新高,同比增长23%至260亿元。基于自研的LongCat大模型,美团推出了面向用户的AI助手“小美”和“小团”——今年春节期间,上亿人次通过“小团”规划消费,带动了线下消费增长。

王兴坦言,AI智能体对他的冲击比ChatGPT(大模型智能工具)更大,“对于美团来说,物理世界的数字化将是AI非常重要的底座”。

在国内竞争白热化的当下,出海成为美团的必选项,Keeta(美团在海外市场的外卖品牌)正加速全球布局。继中国香港地区后,Keeta已完成中东海湾地区主要国家覆盖,并在巴西展业。在沙特阿拉伯、卡塔尔、科威特、阿联酋及巴西等新市场,Keeta均展现出强劲增长势头。

向外,美团正加速攻城略地;向内,美团更需要一场刮骨疗毒式的组织变革。王兴主动要求内部直呼其名,本质上是在向组织官僚主义宣战。一家创新驱动的公司,不能有“哥”与“弟”的距离感。只有扁平化、去层级化,才能让一线的声音传递到决策层,让活力重新注入这家已经十六岁的公司。

王兴的白头,是时间的痕迹,也是压力的具象。2025年的巨亏、行业的内卷、组织的老化——每一条都是大公司走向平庸的陷阱。

但王兴的应对足够清醒:不打价格战,靠AI重建护城河;不搞层级文化,重塑组织活力;不盲目烧钱扩张,而是谨慎试水海外市场,聚焦能发挥核心优势的即时零售赛道。

当郑丽文在上海美团总部喝到无人机送来的奶茶时,她说这是“非常好的经验”。对美团而言,这个经验的意义远超一杯奶茶。它代表了一个曾经以“打仗”立身的公司,正在用技术和创新来定义未来。

免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。

DeepSeek更新“前夜”,有些问题得提前理一理

摘要:

V4是不是DeepSeek的分水岭?

凤凰网科技 出品

作者|Dale

编辑|董雨晴

4月10日,据多位知情人士向《创智记》透露,DeepSeek创始人梁文锋在内部沟通中首次明确了V4的发布节奏——备受期待的新一代旗舰大模型DeepSeek V4计划于4月下旬正式与公众见面。

凤凰网科技就此消息向DeepSeek方面询问,截至发稿未取得回应。

此前,DeepSeek刚刚完成版本更新。首次在模式上进行分层,推出了快速和专家两个模式。在点击开始入口处,原本“体验DeepSeekV3.2”的字样也消失不见了。

优等生DeepSeek的烦恼

DeepSeek V4的扑朔,建立在一个复杂的背景之上。

2025年初,R1的发布,曾经是国内大模型创企挥之不去的“阴影”。用了半年时间,这些曾经的明星企业才凭借新的旗舰模型回到公众视野,或上市、或开启新一轮融资。

在成名前,梁文锋曾与少部分VC进行过会谈,但据当时与其有过接触的人士向凤凰网科技表述,梁文锋的本意也不是融资,而是看看机构的风格。

《晚点LatePost》也在报道中写道,梁文锋曾在会面中提出类似OpenAI与微软投资协议的回报上限条款,但无机构接受,此后再无投资人会面。

2025年成名后,DeepSeek的风格是更加对内收敛,一些原本在社交媒体更新的员工账号开始停更。

据《晚点LatePost》报道,DeepSeek不加班,他们不打卡、没有明确的绩效考核,平日多数成员会在下午6点至7点左右离开公司。

但随着智谱、MiniMax等公司上市后激增的市值,DeepSeek的估值问题正成为内部压力点。DeepSeek员工对手中未定价的期权有了更多疑问,梁文锋近期开始考虑公司估值的问题。

除此之外,从2025年秋天起,梁文锋开始更多提及“产品化和商业化”。在公开的招聘信息中,官方HR也表述有产品、设计、数据百晓生等岗位开放。甚至是职能岗也在扩充, 早在2025年11月,DeepSeek还开放过行政招聘,据相关人士表述“是因为团队大了,需要更多的行政伙伴”。

变化之下,可能让拖延数月的V4存在诸多变数,但其掀起的热潮不会迁移。

OpenRouter平台数据显示,2026 年 2 月,中国大模型在 OpenRouter 上周调用量首次超过美国模型,这一态势一直持续到3月。本周,排在前五位的模型,依旧有三个来自中国,分别是排名第一的DeepSeek V3.2和排名第二的MiniMax M2.7和第四的MiniMax M2.5。

毫无疑问,DeepSeek V4的到来,有望延续这份优势。

V4算不算DeepSeek的分水岭?

把R1和V4放在一起看,这个变化的轮廓会变得更清晰。

R1的突破是范式性的——它在学术层面开创了“纯强化学习激发推理能力”的新路径,论文登上Nature封面,以586万美元的成本实现了对标GPT-4的性能,彻底改变了全球对中国AI模型的认知。

Hugging Face在“DeepSeek时刻一周年”回顾中指出,R1“降低了技术与应用门槛,不仅是中国AI发展的转折点,更在全球范围内引发了开源模式的深刻变革”。

V4的战略意义截然不同。它不再回答“中国能不能做出世界级模型”,而是在回答两个更具体的问题:“中国AI能不能在算力封锁下持续进化”,以及“大模型能不能变成能赚钱的企业级产品”。

所以,V4算不算DeepSeek的分水岭?

如果说R1是DeepSeek在“纯推理”路线上站住脚、打响全球名声的第一枪,那么V4就是DeepSeek证明自己不只是“技术奇才”、而是能在中国AI产业生态中找到不可替代位置的标志性产品。

R1的意义在于“做了一件别人觉得中国公司做不了的事”。V4的意义在于“在一个被封锁的环境中,自己铺了一条能走下去的路”。

与此同时,站在学术界,新的风向也在产生。DeepSeek的使命一度是探索未知,追求AGI。

去年底,姚顺雨、林俊旸、杨植麟、唐杰等人在清华同台,探讨的是底层范式的话题。在海外,Yann LeCun言称LLM是“死胡同”,Jim Fan说“视觉是连接大脑、运动系统和物理世界的最高带宽通道”。甚至一些观点认为,追求AGI的重任或许该落在世界模型身上了。

敏感的VC,是最早嗅到市场风向的人。颇为巧合的是,代表世界模型阵营的李飞飞和杨立昆,均刚刚完成10亿美元级别的新融资,国内代表生数科技4月10日也刚刚官宣获得了A++轮融资,融资金额近20亿人民币。

绘图|DeepSeek

就目前披露的信息而言,DeepSeek选择的仍然是基于LLM架构的优化和工程化落地。而V4最核心的突破是集中在这三件事上:万亿参数MoE架构、原生多模态能力和国产芯片适配。

对于DeepSeek来说,在算力和资金都存在约束的情况下,把资源投向架构效率和国产化适配,比追逐一个距离产品化还很遥远的范式,更务实、更符合它“少花钱办大事”的底色。

值得注意的是,DeepSeek并非完全没有多模态的积累。此前开源的DeepSeek-OCR系列已经展示了将视觉作为文本压缩媒介的探索,通过将文本以图片方式输入,极大减少token消耗。

但这些探索的方向仍然是“优化文本模型的效率和成本”,而不是“构建对物理世界的理解和预测”。

如果拉长时间线来看,DeepSeek的这条“分水岭”可能还有更深的一层含义——它不是一条岔路,而是一道选择题:在中国AI产业的现实土壤上,是追随“世界模型”的范式革命,还是在现有架构上把工程优化和自主可控做到极致?

当然,如果DeepSeek未来真的在视觉和空间推理上投入更多资源,以它的架构创新能力,切入“轻量级世界模型”领域并非不可能。但在当下,V4的任务很清楚:在中国AI产业最需要的方向上,交出一份能打的答卷。

这个选择是否成立,不需要等太久。4月下旬V4正式发布后,市场的反馈会给出最诚实的答案。

“太空算力专业委员会”启动成员征集

财联社4月11日电,记者获悉,我国业界首个太空算力产业协同平台“太空算力专业委员会”正式面向全国征集首批成员单位。据悉,“太空算力专业委员会”后续将聚焦星载AI芯片、星间激光通信、高效热控与太空光伏等环节,系统开展前瞻性技术联合攻关研究,广泛汇聚跨领域、跨学科的创新力量,推动产学研用协同突破,加速形成核心技术体系。面向卫星智能体、灾害应急响应、低轨卫星互联网、深空探测等应用场景,开展创新方案征集与试点验证,推动“技术可用”向“商业可行”转化。(财联社记者 郭松峤)

三一重卡董事长梁林河:一台燃油重卡年碳排放量与100台燃油乘用车相当

“一台燃油重卡的年碳排放量相当于100台燃油乘用车的年碳排量。假如中国的重卡全部新能源化,中国道路的能源安全问题几乎就解决了一半,因为燃油重卡占据中国道路燃油总需求量的50%。由此可见,新能源不只是乘用车的革命,重型卡车也是这场能源革命中的关键。”4月11日,三一集团董事、三一重卡董事长梁林河在智能电动汽车发展高层论坛(2026)上表示,新能源重卡已经处在爆发前夜,而下一个风口将是无人化电动重卡。

专治AI说谎,25岁天才少女公司估值过百亿

25岁的洪乐潼,最近在硅谷火了。

这个来自广东的女孩,17岁考入MIT,三年修完数学和物理双学位,后来又进入斯坦福深造。

按照硅谷最熟悉的那套叙事,她是“天才少女创业者”的模板人物。

但洪乐潼真正让人记住的,不是履历,而是她做的事太反常识。

当整个AI行业都在追逐更大的模型、更强的生成能力、更像人的表达时,她偏偏转身去做了一件最不性感、也最难商业化的事:用数学验证AI。

她创办的公司叫Axiom,成立不足两年,员工只有20多人,最近拿下2亿美元A轮融资,投后估值高达16亿美元,折合人民币超110亿元。

Axiom不做聊天机器人,不做文生图,也不跟风大语言模型的热潮。它做的是“形式化验证”。

说白了,就是想用数学和逻辑,把AI每一步推理都变成可以检查、可以证明、可以追责的东西。

这听起来很冷门,但它瞄准的,却是大模型最麻烦的软肋——幻觉。

现在的AI最大的问题不是不够强,而是不够可靠。它可以把答案说得很像对的,甚至真的做对题,但你没法确认它到底是真的推出来了,还是只是“猜对了”。而Axiom要做的,就是把这种模糊状态,变成一种可验证的确定性过程。

这也是为什么,当洪乐潼拿着这个想法去融资时,迎面撞上的不是掌声,而是一个极其现实的问题:“数学怎么赚钱?”

01

迎难而上的天才少女

洪乐潼的办公室在硅谷帕洛阿尔托大学大道,距离斯坦福大学步行只要半个小时。斯坦福是她博士生涯的起点,但学位还没有念完,她就退学创业了。

事实上,早在博士在读期间,洪乐潼就已经注册了公司。公司取名Axiom,名字源自数学术语“公里”,“我想从公理出发,打造一个能够自我改进的超级智能推理器。”

一个24岁的博士生,没钱没人没产品,仅凭一个想法,她就拿下了960万美元的种子轮投资。

凭什么?

要知道现有的大模型本质上是概率黑盒,通过海量数据学习模式,然后基于统计规律给出答案。推理过程无法被量化,所以会胡说、会出错。

洪乐潼要做的就是用数学公理和形式化验证,让AI每一步推理都可证明,可以直接面向金融、军工、芯片和自动驾驶等对可靠性要求极高的市场。

她做的事显然击中了AI 最大痛点,解决幻觉与可靠性的问题。

更何况,早期投资投人,她本人也是不折不扣的跨学科天才学霸。

洪乐潼从小就展现出了惊人的数学天赋。2001年,她出生于广州市天河区,曾就读于华南师大附中。高一时,她就在全国数学奥林匹克选拔赛中晋级,并在华罗庚杯、全国高中数学联赛中屡获佳绩。

正是在奥数集训中,她对研究型数学产生了兴趣。

2018年,17岁的她被MIT录取,3年就修完了数学和物理双学位,不仅发表了9篇学术论文,还获得全美女性数学家最高荣誉Alice T. Schafer数学奖等诸多荣誉。

此后,她获得牛津大学罗德奖学金,她没有继续深耕数学,转头去学了神经科学,因为想“构建跨越科学领域的认知体系”。

基于这一目标,她同时在伦敦大学学院盖茨比计算神经科学中心开展深度学习研究,该中心由“深度学习之父”杰弗里·辛顿联合创立。也正是在此期间,她正式踏足AI领域,接触到许多最前沿的课题。随后她又进入斯坦福大学,攻读数学与法律双学科博士。

2024年,ChatGPT o3被曝光在数学测试中存在“作弊”嫌疑,全球舆论哗然。

作为斯坦福数学博士的洪乐潼也在社交媒体上发表了看法:“OpenAI大模型在数学测试中表现优秀,大概率是因为训练数据中提前泄题了。在一些测试中,大模型回答的准确率虽然高达96%,但一旦展示推理过程,得分率就降至5%。”

面对行业痛点,一种名为Lean的语言闯入她的视线,也让她嗅到了创业机会。

与自然语言不同,Lean语言是一个非常神奇的、可以自验证的数学编程语言。洪乐潼打了个比方:“如果用英语写出数学证明,我没办法知道一个5000行的证明是否正确,需要找高水平的专家验证。但Lean是自验证的,只要跑通了就是对的。”

Lean的逻辑是把自然语言或非形式化验证,转成机器可检查的形式化验证。

那啥是形式化验证呢?

普通的AI,你只能用它的答案来判断它是不是理解这个问题,但你不知道它中间有没有瞎蒙。

形式化验证是要求你把每一步都写成机器能检查的逻辑链条。只要中间有一步跳了、糊了、偷懒了,它就不给过。

之所以形式化验证能治大模型会幻觉,是因为形式化验证不管你答案如何,只要你的结论是从前提里一步步合法推出来的,那答案就是对的,从而避免了模型产生幻觉。

所以Axiom做的,就是让大模型负责猜想和搜索,让Lean负责验算和判断。如果Lean检查发现过程不对,那就退回去继续改。

但这显然是一条窄路。这条路冷门到什么程度?在整个AI版图里,形式化验证几乎是边缘中的边缘,全球的商业化玩家一只手就数得过来。

显然她并不是因为形式化验证是下一个风口才选的,而是因为她对“困难”的定义和别人不一样。

奥赛就像持续释放多巴胺的快感,而研究型数学像在撞墙,充满痛苦与煎熬。我其实特别喜欢这种挑战感。”她曾这样解释自己痴迷数学的原因。

正是这种刻在骨子里的挑战欲,让她不愿再停留在学术研究的舒适区,渴望在更广阔的战场上去攻克AI领域的硬骨头。

2024年深秋,斯坦福附近的一家咖啡馆里,洪乐潼与当时Meta AI研究总监Shubho Sengupta聊了整整几个小时,核心议题只有一个:AI能不能真正学会数学推理?

两人一拍即合,一个退学,一个辞职,两人一起创业。

02

一支“草根”工程师军团

Axiom只有20多名员工,洪乐潼用了一个词来形容团队的气质:草根工程师精神。

但事实上,这支团队的成员身份一点也不草根,甚至背景堪称豪华。

Axiom第一位成员,正是和她在咖啡馆聊了好几个小时的Meta前员工Shubho Sengupta,如今他的身份是公司的CTO。

核心科学家François Charton,则是将Transformer架构引入数学推理领域的先驱人物。他干的活,就是把数学算式当成一种“语言”输入进Transformer,试试看Transformer能不能像翻译句子一样去翻译数学。

其他成员约半数来自Meta AI,另一半则是世界级数学家与形式化验证先驱。

而最让外界震惊的一位成员,是57岁的数学泰斗小野健(Ken Ono)。

他是模形式领域的顶尖学者,美国数学学会前副会长,拿过古根海姆奖、斯隆奖等荣誉。指导过的学生中有十位摩根奖得主。他还曾为美国奥运游泳队提供数据分析,为电影《知无涯者》担任顾问。

这位弗吉尼亚大学终身教授与洪乐潼结缘于麻省理工。彼时大一新生洪乐潼参与了他的数论项目。师生关系延续至今,角色却已不同,2025年底,小野健辞去教职,全职加入Axiom,成为第15号员工。

曾拒绝过Google和Meta邀请的小野健,为什么愿意为一个24岁的学生“打工”?

“如果我的猜想能被机器在3天内推广到10个维度,我愿意当一个‘标注工’。”小野健曾公开表示,他选择帮自己的学生打工,不仅因为洪乐潼开出“不设教学、不设行政、100%科研”的合约,更关键的是,AI对他的“降维打击”,让他感到兴奋。

一群顶级学者和前Meta成员,这个团队哪里草根了?

洪乐潼的解释是,草根,代表着始终“空杯”的心态和坚韧的品质。在创业这条路上,即使是资深“牛人”,也要从头学起,不断自我革新。

她自己最喜欢的不是当“精英”,而是做“草根”,做个nobody(小人物),这样学习的坡度最陡、速度最快。

她自己也是“草根精神”的践行者,在被问到如何带领团队时,洪乐潼说:“我其实不太喜欢用带领这个词。我希望自己是一个Individual contributor(独立贡献者),每个人都是,这是一群志同道合的人在一起做事。”

“我们创立Axiom,就是要无限压缩把好奇心转化为真理的时间”,在资本驱动的硅谷,洪乐潼的这种纯粹性,对于顶尖研究者而言,或许比一份高薪offer更有吸引力。

这支不到20人的团队,在成立后不到一年就交出了一份令人意外的答卷。

2025年12月3日,Axiom宣布其核心系统AxiomProver在无人干预的情况下,攻克了困扰数学界数十年的两道埃尔德什难题。

同一天,洪乐潼收到了入选“福布斯30岁以下30人”榜单的消息。

同月,AxiomProver又在普特南数学竞赛中斩获满分,12道题全对。普特南是北美最负盛名的大学生数学竞赛,成绩的中位数常常为零,过去近百年仅有5个人类选手拿到过满分。

Axiom进一步印证了用形式化验证构建可靠、可核验、无幻觉的AI,已是行业明确的重要方向,而 AxiomProver 则在这条路径上交出了可复现、高难度的实证。

03

赛道升温,但挑战刚刚开始

从行业发展来看,洪乐潼的选择正好踩在了技术转折点上。

2024年年底,Meta FAIR和斯坦福大学等多所机构联合发布了一篇立场论文《Formal Mathematical Reasoning: A New Frontier in AI》。

论文给出了这样一个判断,过去的AI数学就是喂很多数学题,再让模型输出答案。这就导致数据会污染、过程会胡编,AI没办法自判断对错,并且还很难复现过程。

这显然是路走错了。就拿乘法口诀表来说,里面写的是2*3得6,那么你自己也能理解3*2就也得6。这个过程就叫复现。

论文主张的是下一步要把证明助手、形式系统、自动验证真正接进模型里来,让AI真正懂数学。

但这也意味着这条窄路正在变得拥挤。

过去十年,AI赛道的主流叙事是“更大参数、更多数据、更快生成”,所有大公司都在这条路上狂奔。洪乐潼选择的形式化验证是其中冷门到几乎没有竞争的赛道。

今年年初,Meta也发布了半形式化推理技术,让大语言模型能够在不执行代码的情况下验证代码补丁,准确率高达93%。竞品公司Harmonic在今年1月获得了英伟达投资,估值达14.5亿美元,产品已扩展到代码编写和芯片设计领域。Theorem、Axiomatic AI、Cajal等一批初创公司,也在近两年纷纷进入这个赛道。

对Axiom而言,挑战远不止行业竞争。

最大的挑战在于商业模式。洪乐潼最初的设想是将产品服务于对冲基金和量化交易公司,快速解决与资产定价、股市预测相关的复杂数学问题。

但这个蓝图至今仍停留在构想阶段。对高频交易而言,比“正确”更重要的是“足够快”,毫秒级的延迟可能比一次罕见错误带来更大损失。

Axiom的绝对正确性,在追求速度的金融场景中,其实际价值目前仍需要打一个问号。另一个挑战,则在于除了对价格不敏感的航空航天、国防军工等少数领域,其他绝大多数企业愿意为“绝对正确”支付高溢价吗?

洪乐潼自己也承认这一点:“数学怎么赚钱?我们从一开始就面临这个挑战。”但她认为,“现在,商业信号已经清晰很多,数学能创造价值,是因为它能自我验证、自我检查。”

另一方面,高估值本身也是一把双刃剑。16亿美元的A轮估值意味着,投资人期望的是超高速的增长和明确的退出路径。

Axiom必须在未来一到两年内证明其技术具备规模化商业化的可能,否则下一轮融资将面临巨大压力。与此同时,它需要在巨头和强劲对手的夹击中,用更少的资源跑出更快的速度。

Axiom的未来,更像是一场理想主义的压力测试。 从“绝对正确”的技术理想,到“相对经济”的商业世界,Axiom的挑战,才刚刚开始。

AI写了不到2000行代码,SBTI制造了2026年第一场刷屏

什么叫MBTI?,它的全称是迈尔斯-布里格斯类型指标(Myers-Briggs Type Indicator),由美国的凯瑟琳·库克·布里格斯与女儿伊莎贝尔·布里格斯·迈尔斯,在20世纪40年代基于瑞士心理学家卡尔·荣格的《心理类型》理论开发而来。

MBTI的作用,就是用4个字母概括你的性格,以及你做决策时存在不同的心理偏好。这是全球应用最广的人格工具之一,累计超3亿人参与过测试。

那什么是SBTI呢?它是社区对经典MBTI人格测试的解构、玩梗和改编。全称为Silly Big Personality Test,直译过来就是 “傻大人格测试”。

原版SBTI测试一共包含了31道生活化的选择题,你只需要花大概3-5分钟就能完成,无需注册、完全免费。

这款测试由B站UP主 @蛆肉儿串儿 创作,最初只是为了劝朋友戒酒做的恶作剧,却在一夜之间攻陷了微信、微博、小红书。

不少网友感叹:“现在是2016年吗?2026年居然还能有在朋友圈火起来的产品”“这种级别的刷屏已经很久没有在互联网上看到了”。

然而SBTI的背后并没有高深莫测的技术,它是vibe coding,是一个连服务器都用Cloudflare免费版、域名自掏腰包的"业余作品"。

01

SBTI的裂变

以前测MBTI,好歹还分个i人e人,什么充电的方式是独处还是和别人一起,听起来还文绉绉带点小格调,SBTI倒是直接不装了,什么话最丧最颓最阴暗扎心就冲着网友开麦:

自我攻击者IMSB:内心戏多到爆棚,遇事先自我否定,总觉得自己不够好;

小丑JOKE-R:靠搞笑撑满气氛,把难过藏在玩笑里,笑着笑着就沉默了;

草者FUCK:表面咋咋呼呼一惊一乍,实则内心清醒,不爱多管闲事。

送钱者ATM-er:永远在支付时间、精力、耐心和情绪价值,习惯性给别人兜底。

别的人格测试都上赶着夸人,这个SBTI倒是把人倒是把人扒得底裤不剩。

网友总结得好:MBTI问的是:“你是哪一种天赋型人格?”

而SBTI问的是:“你属于哪一种‘人间惨剧’?”

在SBTI迅速刷屏之前,我们都没有意识到人们“如何在不装不刻意的情况下,告诉别人我是谁”的需求有多旺盛。

我不能逮着你凑到你耳边急头白脸地跟你说我就是一个愤世嫉俗、阴暗幽怨、没什么大理想只想在家啃老躺平的人,但我可以借着这个大家都在po SBTI人格的氛围,在朋友圈体面而不突兀地告诉所有人我被确诊为吗喽/无所谓人/屌丝中的某一款SB。

不只是SBTI图鉴,整个测试流程从头到脚都透着那种 "诶,就是玩" 的松弛感。

多美妙的精神状态,谁还没有在挫折的时候这样悲观自弃地想过这个世界了?

测试到后面网页还会冷不丁显示一句:“全选完才会放行。世界已经够乱了,起码把题做完整”,ADHD人直接被抓了个现行,只好老老实实回去做完题。

从头到尾没半点正经,SBTI测试实实在在让网友体验到终于能光明正大摆烂、体面发疯的快乐。

02

怎么得出你的SBTI?

这原先只是一位b站up主为了劝朋友戒酒的一次整活。而up主蛆肉儿串儿此前是靠分享自己与GPT的人机恋日常,在B站获得了最初的流量积累。

GitHub上也开放了SBTI的源码,整个代码加起来不到2000行,下载下来不到1MB,比手机里一张高清表情包还小。

整个测试机制也很简单,首先是所有题的选项都提前标好了分:A选项是1分,B选项是2分,C选项是3分。

比如那道经典的:我不仅是屌丝,我还是joker,我还是咸鱼……,如果你选了A选项“我哭了。。”得一分,选了C选项“这不是我!”得三分。

接下来是把分数加总。测试一共30道普通题,每2道对应一个性格维度,一共15个维度(比如 "自尊自信"" 边界感 ""执行力")。系统会把同一个维度下2道题的分数加起来,得到这个维度的总分。

接着按总分给每个维度贴一个等级标签:

总分≤3分 → L(低)

总分= 4分 → M(中)

总分≥5分 → H(高)

最后你会得到一串由15个L/M/H组成的字符串,比如:HHH-HMH-MHH-HHH-MHM。而系统提前写好了 25 种人格的标准字符串。

像拿捏者CTRL的标准字符串是:HHH-HMH-MHH-HHH-MHM;屌丝Dior-s的标准字符串是:MHM-MMH-MHM-HMH-LHL。

系统会拿你测试后得到的字符串,和这25个模板一个字母一个字母比对:字母一样就不扣分;字母差一级(比如 L 和 M、M 和 H)扣 1 分;字母差两级(比如 L 和 H)扣 2 分。

扣的分越少,说明你和这个人格越像。系统会把扣分最少的那个人格,作为你的 "主类型"。

就是这么一个简单的机制,却获得了惊人的传播效果。

通过Google Trend搜索SBTI词条可以看到,传播从4月9日的晚上九点二十开始,到了4月10日的零点,搜索热度达到了峰值,前前后后不过才花了两个小时四十分钟。

甚至测试页面因瞬时访问量激增,于4月9日晚至10日凌晨多次崩溃。

今早苏醒还晒了自己sbti测试结果——贫穷者,并发文称:“都散了吧,肯定不准, 这是全互联网第一个这么说我的。”

另外还有黄晓明、蓝盈莹、华晨宇等明星晒出sbti人格,进一步证实了热度。

可以说是真正意义上的“以小搏大”“四两拨千斤”。

SBTI是一个vibe coding产品。可以说vibe coding的出现把普通人对大众情绪的洞察放大了,它赋予一个普通个体制造现象级传播事件的可能性。

普通人vibe coding的产品,虽然粗糙,虽然有bug,虽然不完美,但它有情绪,有态度,像每一个人身边都会有的一个会吐槽,会开玩笑,会偶尔说脏话的朋友。

SBTI的刷屏可能不会持续太久。再过一个月,也许大家就会忘记它,转而追逐下一个热点。不过它也给人以启发。

互联网的初衷就是给一个普通人表达自己、分享自己的地方。SBTI的出现,让我们看到了互联网最本来的样子:好玩、真实、自由、充满人情味。

十三届中国网络视听大会动态 | 24支战队集结!2026AI超创赛“24小时大师赛”入围战队揭晓

24支战队93名超级创作者集结!4月8日,第十三届中国网络视听大会创新活动“AI超创赛”(简称ACX)24小时大师赛入选战队名单正式公布。4月14日,成都、北京、香港、澳门四城将同步开赛,24支战队对应24个节气,在24小时内完成极限创作,呈现一场AI时代的“最强创力”!

中国网络视听大会素有网络视听行业的“年度风向标”美誉,作为该大会的创新活动,ACX的“24小时大师赛”也代表了AI创作领域的年度“最强创力”水平。作为大会承办方及赛事主办方,中国网络视听协会相关负责人表示:“本届24小时大师赛以‘节气里的大美中国’为题,汇聚国内最具代表性的AI创作力量,希望通过高水准的集中创作,为行业提供观察AI内容生产力的真实样本,也为AI赋能中华优秀传统文化传播探索可行路径。”

从入围阵容来看,本届赛事是中国AI创作领域一线力量的集体秀肌肉:故事接龙StoryStorm社区创始人,知名AI导演宋东桓;英国国际电影节集团执行董事长,CKAD人工智能艺术研究中心副教授赵伯祚;上海市创意产业协会AIGC专委会主任黄楚杰;阿里设计AIGC生态合伙人南墙Rylee;上海视觉艺术学院副教授、全国高等院校计算机基础教育研究会网络科技与智能媒体设计专业委员会常务委员印隽;各大AI工具超创,AIGC头部赛事评委及全网热门AI作品创作者Jade Wu、鲤鱼与鱼、丁一、泰Q、monk、sky、虫二‌等,国内头部AI创作者均参与本次大师展演。据介绍超创团队成员来自中国传媒大学、中央美术学院、清华美院、北京航空航天大学、复旦大学、北京师范大学、成都大学、香港科技大学、香港城市大学、澳门科技大学、澳门城市大学、巴塞尔大学、拉夫堡大学等国内外知名高校,国内知名创作机构、MCN及多位风格鲜明的独立AI创作者悉数入围。

值得一提的是,本届赛事首次设立香港、澳门赛区,实现了内地与港澳AI创作力量的首次同台竞技。四城联动的赛制设计让不同文化背景和创作风格的AI创作者首次在同一赛题下展开创作碰撞。

赛事联合主办方中科趋势科技CEO张丽锦表示,ACX“24小时大师赛”还辅以创投会、AI超创之夜交流会、AI创作者经济论坛,主要核心目的是:第一,挖掘并展示国内头部创作者、创作者社群、创作机构;第二,集结国内“最强创力”,探索AI创作的前沿工具、创新表达、个体能力边界;第三,联动创作者服务产业链,推动AI创作的政企学研用生态形成。

免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。