2026人形机器人半程马拉松新增机器人“巴图鲁”挑战赛
财联社3月23日电,由北京市人民政府、中央广播电视总台、中国电子学会、世界机器人合作组织共同主办的2026北京亦庄半程马拉松暨人形机器人半程马拉松赛事相关信息正式发布。本届赛事新增机器人“巴图鲁”挑战赛,赛道设计“真实灾害还原+模拟功能模块”多元场景,设置17项挑战障碍,全方位检验机器人的稳定性与灵活度。作为检验机器人实战能力的专业比拼平台,“巴图鲁”挑战赛4月18日举办正赛,4月19日同步半程马拉松赛事开展表演赛。
趋势洞察:AI硬件算力、存力、运力三大核心赛道演进
从算力层面来看,英伟达的芯片产品是行业发展的核心风向标。作为全球AI计算芯片领域占据绝对市场份额的龙头企业,英伟达的产品迭代节奏,对整个AI硬件行业具备极强的指引作用。
从英伟达的产品迭代来看,芯片制程正在持续微缩。此前推动全球半导体产业制程持续迭代的核心动力是智能手机,比如此前台积电最先进的制程工艺,绝大部分产能都优先供应苹果公司。但现在,推动半导体制程迭代的核心主角已经发生变化,未来这一趋势也将持续延续。
为什么要持续推进制程升级?核心是让AI计算能够充分受益于摩尔定律带来的性能红利。但摩尔定律的迭代速度相对有限,通常需要两年多时间才能实现性能翻倍。当前半导体制程逐渐逼近1纳米物理极限,摩尔定律的迭代速度还在持续放缓。但与此同时,AI算力需求呈现爆发式增长,如何填补这一供需缺口,成为行业核心命题。
在这样的行业背景下,行业选择通过扩大芯片部署规模来满足算力需求——当摩尔定律带来的单芯片性能提升跟不上算力需求增长时,就通过增加芯片投放量、扩建数据中心的方式,填补算力缺口。这也直接推动了算力芯片市场的高速增长。海外市场中,无论是英伟达的GPU,还是谷歌的TPU等AI算力芯片,均实现了极快的增长。以上就是算力层面的行业发展趋势。
对于存储的情况,其最本质的需求就来自于AI的带动。因为我们知道,AI领域需要大量存储来存放数据,不管是GPU上面有很多的HBM——HBM就是一种高带宽内存。除了HBM以外,英伟达还在其机柜里面配置了大量DRAM、NAND等存储芯片,催生了对应的需求。现在随着agent的快速发展以及放量,尤其推理市场现在起量得这么快,我们知道很多用户,比如很多人可以看到自己的公司里面可能已经部署了一些大模型了。这种大模型在部署的时候,本身带有海量参数,每个大模型的参数规模都极为庞大,用来存储这些参数的存储需求也十分强劲。后续大模型还在不断地走强,那么从这一发展逻辑来看,后续存储的需求还会快速地增加。就目前来看,存储的涨价可能还会持续一段时间。所以存储的景气度,本质上还是来源于AI的计算需求在快速地增长,从而带来的价格上行效应。
而运力,是我们今天想重点给大家分享的板块。其实对于运力而言,其组网逻辑主要分为两个部分。或者说我们可以想象,海外的云厂商要进行组网,是通过两个阶段实现的:第一个是scale up。
这个scale up怎么理解?比如英伟达之前的A100以及H100的GPU,都是以八张GPU组成一个小型集群,再把这些服务器通过柜外连接,组成超大规模的数据中心。单台服务器内部的GPU互联,我们就可以看作是scale up,它原本就要把服务器里面的GPU连接成一个整体,服务器之内的互联就是scale up。我们从scale up的发展来看,单集群内的GPU数量在不断地增加。目前来看,单柜GPU数量已经增加到72卡,后续本次发布的576卡机柜将进一步刷新单机柜算力规模。这也是刚刚提到的,我们在GTC大会上看到的核心发布内容。
Scale out是什么?就是要把这些服务器或者机柜组成一个超大规模的整体,只有组成完整的大规模集群、搭建起超大型数据中心之后,才能开展AI的训练以及推理工作。从目前来看,海外头部的云厂商,已经建成了十几万卡的GPU集群,整体发展速度非常快。
那么我们在实现scale up和scale out的互联时,有哪些可用的技术方案?第一个是PCB,可能有的朋友知道PCB是什么。大家如果在家拆过闹钟或者其他电器,就会知道里面基本都会有一块PCB。PCB就是印刷电路板,被称作电子元器件之母,其核心作用就是让电路能够更高效、更稳定地运行。当然,不同PCB之间的规格差异极大,比如我们家里闹钟里面用的PCB,一平方米可能也就100多块钱。
但是像英伟达这类企业,或是其他云厂商,用于GPU计算芯片的PCB,规格都非常高:基材目前基本都在M8级别,后续还会向M9甚至M10的材料迭代;层数也很高,普遍能达到二三十层,还带有一次DI的相关设计。所以AI场景所用的PCB单价极高,部分产品一平方米能卖到几万块钱,甚至更高。
所以我们可以看到,相关PCB企业的业绩成长得也非常迅猛,从市场规模来看,也在快速地扩大,目前整个行业产能都处于供不应求的状态。大家可以看到,很多厂商目前都在快速地扩产,后续产能释放之后,对相关厂商的业绩提振是比较乐观的。当然这里只是给大家做行业情况的分析列示,不做任何个股推荐。
第二种备选的互联方式是铜连接。大家可以看到,我列示了英伟达机柜背面的实拍情况,机柜背面这些银白色、一捆一捆的部件,就是英伟达目前在NVL72机柜中所用的铜缆,整体用量非常大。

资料来源:Nvidia
这些铜缆的作用是什么?大家可以看下方的示意图,英伟达的机柜内部是一个个独立的托盘,每个计算托盘里放置4个GPU,一个机柜内有18个计算托盘,所以总共有72张GPU。计算托盘内部的GPU,主要通过PCB来连接。从内部结构来看,这个结构就相当于一个托盘,每个托盘里有两个超级芯片,每个超级芯片上搭载两个GPU,下方蓝色的部分就是两块PCB,也就是我们刚刚提到的高规格PCB。这里我们可以看到,PCB将4个GPU组成了一个完整的计算托盘。

下一步,就是要把所有的计算托盘,组成一个完整的机柜整体。而机柜内部的跨托盘互联,就是靠铜缆来实现的。基本就是通过铜缆连接NV Switch芯片,从而把机柜内所有72张GPU组成一个完整的互联整体。

资料来源:Nvidia
但是铜缆也有自身的技术局限。比如目前单层网络下,用铜缆组成72卡集群已经接近物理极限,如果再叠加一层网络,最多也只能扩展到576卡,且这还只是技术层面的设想,未必能完全实现。因为铜本身存在诸多物理限制,我们知道铜是导体,而当下数据中心的功耗极高,功耗高的核心原因,是计算芯片的计算吞吐量极大,数据传输过程中的运算量极高,传输的电流更大、信号频率也更快。

资料来源:Nvidia
如果用铜缆承担数据传输任务,极有可能出现过度发热的问题。持续发热就意味着能量损耗,长时间工作还会引发数据丢失等问题,这在AI训练与推理场景中是绝对无法容忍的。为什么?我们以训练为例,AI模型需要通过一次次的迭代,不断寻找到最优的参数集合,如果每次迭代都丢失一部分数据,最终很可能导致整个训练过程完全无效。所以铜缆的核心问题就在这里:它只能支持短距离的连接,传输距离过长就无法满足需求。从目前来看,铜缆最多只能支持几米的传输距离,而英伟达的互联网络已经升级到800G通信规格,后续还会进一步向1.6T升级,铜缆的局限性会持续凸显。
当然,在英伟达机柜规格持续提升的过程中,柜内互联的整体市场规模也在不断扩大。在这个扩容的过程中,我们认为无论是PCB还是铜缆,后续都能获得可观的市场份额。但如果要让它们承担柜内全部的互联任务,尤其是本次发布的576卡机柜的互联需求,仅靠铜和PCB在技术上存在不小的难度。后续随着Feynman芯片的量产落地,将正式引入CPO技术,同步推进柜内可插拔光模块等光互联方案的落地应用。
柜外的互联要如何实现?从英伟达的方案来看,其目前所用的网络架构,主要是叶脊网络。什么叫叶脊网络?大家可以看下方的拓扑图,叶脊网络的架构其实很简单,看起来就像一棵树,从树根不断长出更多的树枝,树枝再进一步分化出更细的枝丫,最终连接到叶片,就是这样的架构。

注:以上为根据英伟达资料推论所得,具体应用网络会在客户间有一定差异
叶脊网络的逻辑就是如此,比如我们假设有四个输入端口,中间设置两台交换机,从这个架构来看,最基本的要求,就是任意一个输入端口到任意一个输出端口之间,至少要有一条通信通路。
而所有的交换机不仅承担输入功能,也承担输出功能,如果我们把上面的拓扑图沿中线对折,就形成了英伟达所用的网络架构。大家可以看到,最上层是脊交换机,把下层的叶交换机连接成一个整体,叶交换机再进一步连接大量的GPU,最终组成数据中心的完整集群。
这个架构中需要用到大量的光模块。光模块的应用场景在哪里?大家可以看到,拓扑图里标注的这些线路,其实都是光缆,而交换机侧和服务器侧处理信号时,用的都是电信号。所以信号要从一台交换机传输到另一台交换机,或是从一台服务器传输到另一台服务器,传输过程中需要多次完成光电转换,而这个核心功能,就是由光模块来实现的。
我在这里给大家做了相关测算:在三层网络架构下,GPU与光模块的配比大约是1:6。当然这里是用同规格的光模块进行测算的,比如在Hopper架构芯片下,1:6的配比对应的是400G光模块;在Blackwell架构芯片下,1:6的配比对应的是800G光模块;下一代Rubin架构,对应的则是1.6T光模块。当然大家也知道,光模块有很强的灵活适配性,两个800G的光模块可以合并当作一个1.6T的光模块使用,一个1.6T的光模块也可以拆分成两个800G的光模块使用。所以这个配比在实际产品应用中可能会有小幅波动,但整体对应的带宽需求是固定的,因此三层网络下的配比基本维持在1:6左右。
由此可以看到,随着下游芯片的快速放量,光模块的整体市场规模会迎来快速增长。后续来看,“光入柜内”会是整个市场预期最高的发展方向之一。为什么会有光入柜内这样的预期?刚才我已经给大家介绍过,实现scale up和scale out互联的技术方案,目前只有三种:铜连接、PCB,以及光模块。目前在英伟达的技术体系中,scale up对应的柜内互联,全部通过电连接实现,也就是铜缆和PCB;而柜外的长距离互联,基本都通过光模块来实现。
往后面去看,正是因为Scale Up在不断地扩张,我们可以看到从8卡到72卡再到576卡,甚至后续规模可能会越来越大、覆盖的卡量越来越多。随着GPU的数量在不断地增加,对应的部署空间也在不断地扩大,对吧?所以大家可以看到,比如本次发布的576卡的机柜落地后,所需的部署空间就已经非常可观了。
对于这么大的部署空间而言,不管是PCB还是铜缆,都会存在自身的固有局限。比如说PCB无法制造得过大,不可能做出一间屋子那么大的PCB板,因为其内部尤其是多层板的压合工艺,会受到诸多机械条件的限制。而铜缆则受自身物理特性的限制,无法实现长距离的信号传输。所以其实在scale up市场规模持续扩大的过程中,光技术后续很有可能会成为核心选择。
在scale up规模持续扩大的过程中,我再强调一下:scale up的市场规模在不断扩张的过程中,首先PCB的成长性是比较强的。不管是本次发布的Rubin Ultra采用的正交背板,还是其技术持续升级、层数不断增加,亦或是所用材料的性能持续提升,PCB的成长性都十分强劲。我只是想说明,在scale up规模持续增长的过程中,PCB与铜缆很难独自承接市场的全部份额。所以往后面去看,光技术会是非常重要的选择。
那么scale up这个市场到底有多大?从目前来看,即便我们给大家做相关测算,结果也并不具备足够的参考性。但从博通CEO的表述来看,该市场规模有5到10倍的增长空间。虽然产业链上有5到10倍的增长预期,但各家公司可能都有自身的发展诉求。从我们目前的观察来看,该市场规模至少会超过柜外市场。
对于当前的可插拔光模块厂商而言,对应的市场机会大概是怎样的?我们知道,当前的scale out市场,大致可以理解为柜外市场,已经是可插拔光模块的核心主战场。而后续的scale up场景中,采用的可能是可插拔光模块,也可能是CPO。但无论是可插拔光模块还是CPO,对于当前的行业龙头厂商而言,都有充足的订单机会可以承接。即便是CPO,也有诸多相关方案正在验证阶段,后续有望拿到大量订单,所以大家也不用过度担心。
总体从产业层面来看,算力、存力、运力仍在快速地成长。在这样的发展过程中,相关厂商都将迎来更多的成长机会。
长期来看,AI行业发展远未触顶,2026年全球AI资本开支预计超7000亿美元,Agent技术进入规模化商用元年,产业成长空间全面打开。投资层面,核心推荐通信ETF国泰(515880),光模块、服务器等算力核心权重超75%,2025年涨幅居全市场ETF首位;半导体设备ETF国泰(159516)受益于全球存储扩产与国产替代双重逻辑,具备充足业绩弹性。同时短期布局需警惕美联储货币政策不确定性、大宗商品涨价推高运营成本等潜在风险。
风险提示:
投资人应当充分了解基金定期定额投资和零存整取等储蓄方式的区别。定期定额投资是引导投资人进行长期投资、平均投资成本的一种简单易行的投资方式。但是定期定额投资并不能规避基金投资所固有的风险,不能保证投资人获得收益,也不是替代储蓄的等效理财方式。
无论是股票ETF/LOF基金,都是属于较高预期风险和预期收益的证券投资基金品种,其预期收益及预期风险水平高于混合型基金、债券型基金和货币市场基金。
基金资产投资于科创板和创业板股票,会面临因投资标的、市场制度以及交易规则等差异带来的特有风险,提请投资者注意。
板块/基金短期涨跌幅列示仅作为文章分析观点之辅助材料,仅供参考,不构成对基金业绩的保证。
文中提及个股短期业绩仅供参考,不构成股票推荐,也不构成对基金业绩的预测和保证。
以上观点仅供参考,不构成投资建议或承诺。如需购买相关基金产品,请您关注投资者适当性管理相关规定、提前做好风险测评,并根据您自身的风险承受能力购买与之相匹配的风险等级的基金产品。基金有风险,投资需谨慎。
小鹏汽车成立Robotaxi业务部
财联社3月23日电,财联社记者获悉,小鹏汽车于今日成立Robotaxi业务部,统筹Robotaxi产品定义、项目集成、研发测试及运营工作。该部门采用轻量化组织模式运作,协同和复用公司各中心平台化资源达成业务目标。小鹏汽车董事长何小鹏在2025年Q4及全年财报业绩会上称,小鹏汽车计划在今年下半年开启Robotaxi的载客示范运营,跑通技术、客户与商业的验证。(财联社记者 徐昊)
a16z发布消费级AI应用百强榜单,想知道AI的未来,去看看十几岁的女孩在玩什么

图片来源:a16z
过去的六个月可能是我最喜欢、也是最激动人心的时期。其中一个转变是,对消费者的争夺战真的在升温。我们开始看到这些平台如何可能随时间推移获得复合优势,这使得谁能获取最多用户这个问题变得尤其具有决定性,或者说非常有趣。
我们在这次报告中稍微扩展了考察范围,结果非常有趣。有两个国家与世界其他地方的情况可能很明显不同,那就是俄罗斯和中国。
这次收购这件事很有趣,它揭示了未来的发展方向:一旦每个人都具备了那种智能体能力(而且可以想象,如果这种能力是基于核心底层模型的话,他们很可能会具备),那么,作为一个横向产品,你或许最好借助像Meta或Google这样的分发巨头,而不是作为一个独立公司单打独斗。当然,如果你在构建更垂直的产品,情况就完全不同了。
十几岁的女孩是了解消费者领域未来趋势的最佳来源。如果你看看所有最大的消费者成功案例,她们都是这些产品的早期采用者。
Olivia Moore,a16z消费者合伙人和投资顾问。本次访谈为a16z合伙人Anish Acharya和Olivia Moore探讨最新版《Top 100 Gen AI Consumer Apps》报告。
Anish Acharya:Olivia,《Top 100 Gen AI Consumer Apps》报告今天发布,三年时间,这已经是第六版了。跟我们聊聊,这份报告有哪些不变之处,哪些发生了变化,你的兴奋程度如何,报告又有什么新动态?
Olivia Moore:从很多方面来看,自从我们在2023年首次发布这个榜单以来,情况发生了巨大变化,也经历了令人难以置信的增长。另一方面,从宏观层面看,我们仍然处于非常早期的阶段。比如ChatGPT,它显然是全球最大的AI产品,但全球也只有10%的人口每周活跃使用它,所以未来还有很大的发展空间。
由于我们看到的这些转变,过去的六个月可能是我最喜欢、也是最激动人心的时期。其中一个转变是,对消费者的争夺战真的在升温。当然,ChatGPT如此,Gemini和Claude也在消费者领域加倍投入,深耕他们各自的理想客户画像。我们开始看到这些平台如何可能随时间推移获得复合优势,这使得谁能获取最多用户这个问题变得尤其具有决定性,或者说非常有趣。
与此相关的是,这实际上是第一次我们收录了那些并非原生AI,但现在主要由AI驱动的产品,比如Canva、Notion,Freepik。Notion宣布,他们现在认为一半的新增ARR是由AI优先功能驱动的,这非常酷。最后一点是,我们看到AI的应用范围大大扩展,不再局限于网站或应用里的提示框,现在出现了各种AI浏览器,比如Dia、Comet、Atlas;Claude也集成到了Excel、PowerPoint和Chrome中;还有像Cursor、Whisper、Flow、Granola这样的桌面应用。所以,人们使用AI的方式确实经历了一场令人兴奋的爆发。
专注不同领域的基础模型
Anish Acharya:太令人兴奋了。这里有很多内容要聊。让我们先从基础模型开始。你能谈谈你认为Gemini、Claude,当然还有ChatGPT,它们各自专注于哪些领域吗?因为感觉这更像是一个水涨船高的故事,而不是这些模型在相互争夺份额。对吗?
Olivia Moore:我同意。尽管过去一周可能有些戏剧性,比如Katy Perry在Twitter上站队,这是我从未预料到的。
从根本上说,如果看AI的使用情况,ChatGPT显然是一个非常明确的赢家。在网络端,它的规模是Gemini的2.7倍。在移动端,是Gemini的2.5倍。然后,尽管技术圈Twitter上讨论很多,Claude在网络端的规模只有ChatGPT的将近1/30,在移动端更是只有将近1/80。

图片来源:a16z
所以我们看到Sam Altman在超级碗广告战争时期发过一条推文,回应了德克萨斯州的广告牌。是的,他说我们在德克萨斯州使用免费版ChatGPT的人数,比Claude在全球的所有用户还多,这是真的。
话虽如此,我们看到的,用分化这个词可能不太准确,但或许可以说是人们使用的产品数量以及他们为不同目的使用不同产品的情况正在扩大,这在某种程度上改变了市场份额。Claude尤其专注于专业消费者,推出了像是Cowork Claude、Code Claude,以及集成到Excel和PowerPoint等功能。如果你看看Claude和ChatGPT上出现的应用商店,它们都有200多个应用,但重叠率只有11%。Claude确实专注于高端数据源、研究工具、科学工具、金融数据。而ChatGPT则专注于消费者市场平台、旅游、营养、个人消费金融等领域。然后Gemini也有自己独特的一席之地,它的吸引力很大程度上是由创意工具驱动的。
所以你看他们的活跃用户和付费用户,这几乎与他们发布Veo 3、Nano banana、Nano banana Pro、Nano banana 2等产品的时间点完美相关。他们在专业消费者领域也有更多动作,比如将AI添加到Gmail、Sheets、Calendar中,但这些都被他们现有产品所吸纳,而不是带来全新的体验。

图片来源:a16z
Anish Acharya:也许我们可以深入探讨一下应用商店的动态,因为那太吸引人了。你能谈谈ChatGPT的看好理由吗?以及他们所谓的那个抽象树?
Olivia Moore:我们在ChatGPT上看到的策略,Sam在Twitter上也亲自说过,就是我们想成为面向每个人的AI。这意味着他们试图获取每一个消费者,然后通过不同的方式将他们变现。Claude已经非常明确,他们只会通过订阅来变现,这对于能够支付订阅费的个人和公司来说很好,但这不会是所有人。你可以从他们倾向接入的插件中看到这一点,这些插件都是付费的、高客户生命周期价值的,比如工作数据工具,像Similar Labs之类的,如果你是个投资者、科学家、数学家会使用的工具。
而ChatGPT,走的更像是一种类似Google的路线,他们正在构建普通人想要使用的东西。也许其中较小比例的人现在会转化为订阅用户,但他们最终可以通过广告来 monetize 这些用户。而且我猜可能也通过交易,比如如果他们正在构建预订旅行或完成其他各种长尾消费者购买的入口,理论上他们最终应该能够从他们带来的流量中抽取一部分分成。所以这就是ChatGPT应用商店的看好理由,虽然目前数据中还未体现,但在未来一两年内可能会变得更加明显。
Anish Acharya:这很有意思,因为它触及了你报告中关于复合优势以及上下文如何复合的概念。能稍微谈谈这个概念吗?你认为衡量它的指标是什么?是会话时长?会话次数?你提供的数据量?还是有其他指标?
Olivia Moore:是的,这个问题对我来说非常令人兴奋,因为到目前为止,对于像ChatGPT、Claude、Gemini、Perplexity这样的横向大型语言模型,我们基本上生活在一个上下文和记忆某种程度上可以轻松导出的世界里。比如Claude最近围绕这点搞了个宣传活动,锁定效应会越来越强。而且我确实认为这可能实际上对更广泛的横向工具如ChatGPT有利,原因有几个。
第一,我们已经看到ChatGPT专注于或开始构建那些你可以在平台上与他人互动的产品,比如群聊。想象一下,如果有一个更成功的ChatGPT群聊版本,你所有的朋友都在上面,那么如果你想从ChatGPT切换走,你还得说服所有朋友一起走。
第二点有点像苹果和谷歌的比较,随着这些应用商店的出现,开发者很可能会开始集中时间和精力,选择为谁以最复杂的方式构建产品,优先向谁发布,这取决于谁拥有最多的用户,或者在某些情况下,谁最愿意付费。对于许多消费级工具来说,关键是谁拥有最多的用户,所以这对ChatGPT也有利。另外,可能我最期待今年发生的一件事,Sam Altman曾暗示过,就是ChatGPT的认证层。基本上,你将能够用你的ChatGPT账户登录,并带着你的记忆和Token去其他产品。然后那个产品就能借用这些信息,为你提供更强大、更有帮助的服务。如果真是这样,你就会希望将更多的核心身份信息留在ChatGPT上,因为它可以将这些信息借给其他对你更有用的工具。
Anish Acharya:这太聪明了,确实发挥了他们的优势,他们有9亿人的注册量。然后第三方开发者理想情况下不想支付推理费用,所以用户可以自带推理能力。这对开发者有利,ChatGPT获得了锁定效应,用户获得了个性化的好处,这似乎行得通。
Olivia Moore:是的,我完全同意。我对此仍有一个疑问,这可能对增加消费产品的锁定效应产生正面和负面影响,那就是你的工作情况,比如你的企业合同是什么。例如,从某些方面来说,如果我的公司工作中使用ChatGPT,这对我有好处,因为我知道如何使用这个产品。作为一个普通消费者,他们可能只尝试过一两个AI产品,所以他们更有可能感到舒适,并继续使用他们已经用过的产品。另一方面,有些人可能不想混合他们的个人和工作用例的身份和记忆。OpenAI最近暗示了这一点,我们将如何在同一个用户的不同身份之间划分记忆,因为他们用这些产品时会有不同场景。
Anish Acharya:也许我们可以切换到谈论Gemini。我想到关于Google早期AI产品Bard的氛围,他们永远无法摆脱那些艰难的时期。我们今天看到像Nano Banana这样的产品,甚至把它命名为Nano Banana这件事本身,就是Google已经走了多远的一个完美缩影,而且他们在多模态方面似乎有很多意图。你对他们的做法有何评价?
Olivia Moore:我印象深刻。他们可能有些犹豫,在某些方面比我们预期的要更犹豫,是否将AI融入到核心功能中,因为存在风险,要么蚕食他们自己的产品,要么有太多人已经使用这些工具10年、20年、30年、40年了,所以那里的转换成本有点高。他们不想在AI突然出现在各处时吓到用户,这我能理解。但他们在这些新的创意产品上做得非常好,这些产品基本上是由DeepMind团队高度模型驱动的,他们总体上非常出色。NotebookLM实际上是第一个这样的产品,它在消费级AI音频领域是真正的新事物。现在我们有了图像和视频模型。所以在某些方面,对于像这样的大公司来说,他们必须克服自身的障碍,才能真正进行创新。看起来他们正在这样做,但你在Google工作过,所以我很好奇你的看法。
Anish Acharya:有意思的是,我很高兴你提到了Notebook,因为Notebook是公司内部一个全新的产品领域。是的,没有十个副总裁在那里争夺主导权。因此,Notebook的进步是巨大的。他们刚刚推出了视频生成功能,这有助于在你的工作空间里直观地展示所有概念,这很酷。反过来,当你看看像Sheets或Docs这样的现有产品界面时,你会发现有太多来自过去的惯性和动能。但同时,围绕这些产品的管理开销很大,这使得他们除了做最显而易见的增量改进之外,很难再做其他任何事情。
Olivia Moore:我们拭目以待未来几年会发生什么。他们会在其中一些产品上奋力一搏,因为他们不想失去那部分用户基础。如你所说,他们已经与这么多企业锁定了关系,这可能意味着他们不需要做太多改变,至少在短期内,就能保持住地位。
全球AI趋势
Anish Acharya:我们这次谈话隐含了一点,就是我们体验和讨论了很多西方的AI。是的,来谈谈全球AI趋势吧。我看到报告中有些惊喜。

图片来源:a16z
Olivia Moore:我们在这次报告中稍微扩展了考察范围,结果非常有趣。有两个国家与世界其他地方的情况可能很明显不同,那就是俄罗斯和中国。在中国的ChatGPT和Gemini合并使用率是所有国家中最低的,只有15%。他们主要使用由字节跳动开发的豆包、DeepSeek、Kimi等类型的模型。有点让我惊讶的是,俄罗斯实际上情况非常相似,他们也出于需要,拥有自己并行的AI生态系统,因为他们受到某种程度的制裁,这阻止了他们使用所有基于美国的工具。所以我们看到像Gigabat和Yandex这样的产品,它们是俄罗斯特有的,由俄罗斯(通常与国家有关联)公司开发,在那里有大量使用。俄罗斯是DeepSeek在中国以外的第二大市场。所以如果你看各个国家的采用数据有些小波动,比如这个国家多用一点Claude,那个国家多用一点Gemini,但两个巨大的异常值就是俄罗斯和中国。而且这些是很大的市场。
Anish Acharya:这很有意思,因为俄罗斯和中国都是异常值,原因是模型使用限制和文化偏好。还有其他国家有特定的地域趋势吗?还是说这是一种全球性的AI行为?
Olivia Moore:就模型开发而言,能够部署专有AI产品的专有模型开发,大部分研究来自美国和中国,可能还有一点来自俄罗斯。我们在其他地方也看到一些本土生态系统正在兴起。韩国有几个自己的产品,比如Naver和Kakao,已经构建了不错的LLM界面。印度可能是我密切关注另一个国家,因为人口众多,可以支撑起专注于印度的独立大公司。关于印度的另一件有趣的事情是,有太多不同的语言,范围如此之广,以至于许多LLM产品甚至语音产品都不一定能很好地支持。如果你主要使用其中一种语言,想用ChatGPT之类的东西,体验就会很差。所以,到目前为止,我们还没有在那里看到大量变种出现。但我不会感到惊讶,如果未来有更多创始人,甚至来自美国的创始人,瞄准印度市场做AI。
另外我想提一下,我们第一次制作了一个类似热力图的东西,显示哪些国家的人均AI采用率最高和最低。我们观察了前10到10个最大的LLM产品的网络和移动端数据。结果是新加坡排名第一,美国排在20位,不算很低,也不算非常高。俄罗斯和中国排名很靠后,在50名开外。这些数据中包含许多有趣的故事。第一个是前五名中,新加坡、韩国它们的劳动力人口结构非常偏向技术优先的白领、高技能人群。而美国有大量工作尚未被AI触及,比如零售、运输等。我还认为,围绕AI的文化规范惊人地多样。如果你在美国,你可能已经内化了那种持续存在的焦虑和质疑,比如AI会取代我的工作,或者,AI对艺术家有害,以及所有其他让人们选择使用或不使用AI的事情。去年爱德曼(全球媒体公司)进行了一项大型调查,美国对AI的信任度相当低,只有32%。而榜单上靠前的大多数其他国家,信任度都在50%、60%、70%,这也拖累了美国,尽管我们是最大产品的来源地,我们的人均使用量低于许多其他可能人口较少但更接纳AI的市场。

图片来源:a16z
Anish Acharya:完全正确。我读到在中国,对AI的好感度大约是80%,而且我知道阿联酋和新加坡,它们在文化上天生就是技术乐观主义者,这确实是一个优势。
Olivia Moore:确实。看到一些小国的人均使用率很有趣。在美国,大约三分之一的人是ChatGPT这类产品的月活跃用户。甚至在有些欧洲国家或东欧,这个比例是50%、40%、45%、60%,虽然基数较小,但他们在接纳AI方面确实比我们这里更快。
创意工具的演变
Anish Acharya:是的,真有意思。我关注的一件事是,当你审视从最功能性(几乎像Google搜索的替代品)到最具文化性、创意性和个人性的AI光谱时,我们应该会看到国与国之间更多的差异,因为显然,文化、印度制作的电影与中国或美国制作的电影截然不同。那他们使用创意工具的方式怎么会相同呢?
Olivia Moore:是的,这确实是我们开始关注地域细分的原因之一。因为在生成式AI的最初的两年半到三年里,绝大多数消费者可能只与一个产品互动。现在这个范围正在大大拓宽。我们会看到更多针对特定市场的工具出现。如果它们能捕获足够大的市场份额,比如一些俄罗斯公司或中国公司,如果市场足够大,它们实际上可以上升到全球榜单。
Anish Acharya:谈谈创意工具的演变,以及你认为这在多大程度上反映了文化?它是正在驱动文化吗?我们何时会跨过那个门槛?
Olivia Moore:创意工具的演变趋势一直很吸引人。显然,第一个大型生成式AI产品实际上是Midjourney,它在ChatGPT之前就出现了。在我们榜单的前几版中,创意工具占据了主导地位。我以前说过,创意工具受益于早期模型的幻觉特性,因为它们能产生更令人惊讶、更美丽或更原创的东西。所以在一段时间里,这些确实是消费级AI中唯一有效的东西。
现在情况已经发生了很大变化。创意工具仍然占榜单的很大一部分,但能够独立成为大业务的创意工具类型已经改变。最大的变化是,独立的图像生成器变少了。如果你要制作一个基础的普通图像,比如一张表情包、一张基础营销图或一张信息图,ChatGPT和Gemini这样的核心模型现在已经相当擅长了。所以,仍然出现在榜单上的产品,比如Ideogram或Midjourney,要么有非常独特的美学主张,要么有更复杂的工作流程,这是ChatGPT之类产品无法提供的。
与此形成对比的是,音乐、语音、视频,这些似乎是最大的模型公司可能投资较少的领域。所以我们看到像音乐领域的Suno、语音领域的Eleven Labs等参与者完全脱颖而出,上升到榜单前20、前15,并且长期保持其位置。然后社区和企业客户基础带来了复合性锁定效应。视频领域是我疑问最多的地方,OpenAI一直在用Sora投资,Google也在用Veo投资,但中国模型非常好,可灵(Kling)可能是最好的例子,它在某些方面远远超过了美国公司目前所能做到的。所以我们会看到。这实际上有利于像Akria这样的平台,你可以在一个地方使用所有模型。Justine写过一篇文章,讲到视频领域的发展方式,不太可能只有一个模型统治一切。所以你需要能够切换使用它们。
Anish Acharya:这似乎适用于大多数模型领域,聊天模型、创意模型,甚至代码模型都有各自专业化的领域。人们谈论Opus的人体工学性对比Codex的准确性,这是一种权衡,你必须针对不同问题选择合适的工具。
Sora对我来说真的很有意思,因为它代表了模型的一大步前进,同时也是一次围绕社交领域的雄心勃勃的实验。在Sora早期有一些数据,比如人们创作的百分比,这比我们之前看到的高出10倍。是的,你如何评估Sora在社交方面的努力与模型方面的努力?你认为它会如何发展?
Olivia Moore:Sora非常吸引人,这是一个非常有趣的早期实验,它让我们所有人都学到了很多,既关于创意工具,也可能更重要的是,关于AI时代的消费者社交可能是什么样子。
从数据来看,他们的发布非常成功。它连续20天在美国App Store排名第一,这非常难做到。这意味着你可能要达到App Store榜首。要达到这个位置,每天可能需要15万的下载量。所以这是一个很高的下载量,他们实际上比ChatGPT本身更快地达到了100万用户。所以发布非常成功。实际上,很多人低估的是,它的使用量仍然非常可观。根据Sensor Tower的数据,有300万DAU(日活跃用户),这已经很不错了。Sora下降的是新增下载量。他们可能在11月达到了每月600万的峰值,现在看起来是150万左右。

图片来源:a16z
Sora真正成功的地方在于它是一个非常好的视频模型。他们创新并引入了"cameos"(特邀出演/肖像授权)这个概念,即真实人物可以将其肖像授权给Sora,这样他们自己和其他人就可以生成包含他们的视频。是的,所以早期很多人都在制作他们朋友的表情包视频。比如Jake Paul因为成为第一个大力投入Sora的大名人而走红。所以你当时会看到一些疯狂的Jake Paul视频。
Sora效果不太好的地方在于,因为内容是可以导出的,人们会把它带到TikTok、Instagram Reels、YouTube,在那里它要与最好的人类创作内容竞争。所以整体的信息流体验更好,因为你看到的是两者中最好的,而不仅仅是Sora中最好的。我们还没有看到一个完全由AI内容组成的社交产品取得成功。所以可以想见,我们会看到更多类似的例子,Sora作为一个创意工具,显然仍然拥有非常可观的用户和收入,但作为一个社交应用就未必了。我不知道是否会出现一个庞大的原生AI社交网络,但我们还没看到它的具体样子,但我相信它会非常有趣。
Anish Acharya:我们经常讨论这个,每个社交产品都有一个地位游戏。在Instagram上,最热门的是身材最好的;在Twitter上,是最有趣的。感觉Sora上,新兴的地位游戏似乎是成为最搞笑的。这是内容难以跨界的原因之一,因为判断什么有趣、什么伟大的标准完全不同。
Olivia Moore:我同意。如果他们想找到更niche的领域,可以怎么做?他们现在已经与迪士尼等大型媒体公司签署了一系列协议。Sora是唯一一个你可以制作授权的关于深受喜爱的角色和娱乐人物的、获得授权的粉丝视频的地方,这非常有趣。但我们还处于早期阶段,还不清楚会如何发展。
近六个月Agent迅猛发展
Anish Acharya:确实为时过早。我知道我们可以先放一放。不谈论Agent,我们就没法进行这场对话,报告告诉了我们什么?
Olivia Moore:这主要就是我为什么说,不仅过去六个月,实际上光是这份报告涵盖的最后两个月,就已经是我们所见过的、最有趣的时期了。Open Claw实际上没有出现在我们的排名中,因为它在二月份才爆火。我们的数据截止到一月,但我们确实提取了二月份的数据。如果它有资格参选,它会在我们的网络榜单上排名第30,这是一个相当高的首次亮相。


图片来源:a16z
关于Open Claw,真正有趣的一点是,它在技术社区的使用量一直在持续加速。现在,我想它是有史以来GitHub星标数第一的项目,它超过了React,Linux。但就总体新用户而言,它已经趋于平稳。我们查看了"开始使用"或注册页面的访问量,自二月初以来每周都持平。这表明,如果你懂技术,它是一个很棒的产品,但它尚未完全破圈,触及非技术人员——这当然是一个庞大得多的人群。他们后来被OpenAI收购了。所以如果我猜,或者我希望看到OpenAI做的是,建立产品联系,将Open Claw整合到主流消费者可以使用的产品中。而且,Open Claw架构背后的理念也启发了许多其他创始人。比如我们一天要听多少 pitch,创始人会说:“我想成为这个领域的Open Claw”,或者“Open Claw让我意识到这是可能的”。所以Open Claw本身会继续成功,成为一个巨大的产品。我猜我们会看到更多针对不同用例的、垂直化聚焦的Open Claw版本。
Anish Acharya:是的,这很有趣,因为感觉Open Claw如此成功的原因之一是它可以在所有模型之间、跨方向地运行。我有点好奇,如果Open Claw变成单一模型提供,是否会稀释其价值,这似乎与其定位相悖。
Olivia Moore:是的,至少在我使用中,他们目前保持了多模型。所以我们拭目以待它的趋势。从使用角度来说,保持现状会是明智的。
Anish Acharya:Manus是消费者级别的Open Claw吗?或者你如何评价?
Olivia Moore:有些人可能会这么说,我确实也这么认为。Manus进入了我们的网络榜单,当然,在榜单编制过程中,他们还完成了Meta超过20亿美元的收购。增长惊人,他们报告从零到1亿、2亿美元ARR的急剧上升,实际上只用了6到9个月,这确实是顶尖水平。在我看来,Manus如此成功的原因是,它确实是第一个能够相当自主地跨产品和平台运行的消费级Agent。你可以连接邮箱,让它浏览网页,它可以制作幻灯片,制作电子表格。我在早期花了很多时间尝试,那是一年前了,尝试ChatGPT Operator或Google的Project Mariner,它们都不可靠,而Manus在Agent可靠性和面向消费者的易用性方面取得了突破。
这次收购这件事很有趣,它揭示了未来的发展方向:一旦每个人都具备了那种智能体能力(而且可以想象,如果这种能力是基于核心底层模型的话,他们很可能会具备),那么,作为一个横向产品,你或许最好借助像Meta或Google这样的分发巨头,而不是作为一个独立公司单打独斗。当然,如果你在构建更垂直的产品,情况就完全不同了。但你可以想象,既然谷歌现在有资源去制造一个强大的竞争者,那么作为一个明星产品,要持续与之抗衡就变得非常困难了。显然,大公司有无数个不同的优先事项,所以他们不可能把每个领域都做到最好。但这也是为什么我通常对非常横向的消费级AI应用持比较谨慎的态度——因为这类产品很可能也在大公司的业务范围内,而且它们已经拥有产品准入、企业合同等各种优势。
Anish Acharya:对。有趣的是,我们似乎跨越了这个文化门槛。是的。Manus曾经在产品广度上做了一个并不明显的赌注。而现在看来,他们似乎有点生活在未来了。
Olivia Moore:是的,完全同意。他们当时确实是。它显然拥有一支不可思议的工程团队。产品质量领先市场3到6个月,当你要与拥有数千名研究人员团队的公司竞争时,这绝非易事。
桌面AI产品与AI浏览器
Anish Acharya:完全同意。让我们借此机会聊聊其他横向AI产品,那些存在于网页窗口之外的东西。你看到了什么?
Olivia Moore:是的,这已经成为一大主题。想想我在AI世界里日常互动的产品,其中不少实际上是桌面应用,比如像Granola、语音听写工具、Claude的Cowork等功能。这确实给我们的报告带来了方法论问题,因为我们可以很好地追踪网站访问量。所以我们可以追踪他们第一次下载桌面应用的情况,我们可以很好地追踪移动应用使用情况,但我们无法密切追踪桌面使用情况。随着AI产品变得越来越复杂,让它们存在于自己专用的应用程序中(其中很多将在桌面运行,因为它可以与你文件交互,更具环境性),这种情况会越来越多。所以未来,找到方法通过网页和移动使用量以及收入来并行跟踪排名这些产品,将是一个相当不错的主意。因为如果你想想像Cursor这样的产品,一些产生最多收入的消费级AI应用,它们在网页上的使用量非常非常少,几乎所有使用都发生在专用应用里。
Anish Acharya:同时OpenAI发布Atlas和Anthropic推出Cowork的事实,这也显示了他们的优先事项在哪里。
Olivia Moore:我完全同意。AI浏览器的争论本身也是有趣的事情,我们仍然处于这件事如何发展的早期到中期阶段。AI原生浏览器背后的直觉是对的,如果你能让AI在你上网的大部分时间里始终在线、始终可用、无处不在,那会是一个很好的机会。
Perplexity,实际上是引领者。它是一个很棒的产品。有趣的是,如果你看Comet和Atlas下载页面的访问量最高峰,Comet是Atlas的五倍,这太疯狂了,因为ChatGPT的受众如此庞大。是的,我们看到的是Comet和Atlas仍然拥有非常专注和热情的用户群。但对于普通消费者来说,更换浏览器的转换成本不容小觑,因为你已经有了既定的工作流程,自然会打开某个浏览器。所以它不仅需要功能对等,还必须有一两个真正“killer”级的AI浏览器功能,并且足够简单,让普通人能够设置和使用。
AI应用场景扩张化与记忆的矛盾性
Anish Acharya:Sam大概6个月前在一个播客里说,有人问他最让他惊讶的是什么?他说是这个世界变化得还不够大。如果你看看人们大规模使用ChatGPT的趋势,仍然是做作业、类似Google的查询,以及某种程度上的陪伴。从某种意义上说,像浏览器这样的东西给了你一个机会,可以把用户引向不同的方向。你如何看待今天普通人使用AI的方式?
Olivia Moore:我有几点看法。第一,十几岁的女孩是了解消费者领域未来趋势的最佳来源。你看看所有最大的消费者成功案例,她们都是这些产品的早期采用者。
皮尤研究中心最近有一项关于青少年如何使用AI的研究。
现在,超过一半的青少年承认使用AI做作业。所以真实数字可能是99.999%,但有些孩子不想让父母知道他们遇到了麻烦。
38%现在将其用于创意工具:编辑图像、编辑视频、生成图像和视频。
还有一些新兴的、稍显长尾但最终可能成为最大行为之一的使用方式;16%用于日常闲聊,不是那种深度陪伴产品,只是有个人可以聊聊天。然后12%用于情感支持和建议。所有这些用例最终都将趋近于100%。所以这些是目前产品可能服务得不太好的行为,未来会得到更好的服务,无论是在ChatGPT上还是在独立产品上。
然后我关注的另一件大事是Agent,Agent就像1990年,互联网公司被称为“.com”公司或科技公司一样,“.com”本身就是个标识。Agent也会发生同样的情况,最终每个科技公司都曾是“.com”公司,最终每个AI公司,乃至每个科技公司都将成为Agent公司,因为这就是模型发展的方向。如果你能为用户交付成果,而不仅仅是输入,作为一个软件产品,那将更有吸引力。
13岁的女孩会使用Agent,但她们不会认为那是Agent。但这确实释放了AI的许多其他消费级用例,比如金融、医疗保健、旅行规划、复杂的购物,甚至在Agent出现之前,有太多数据需要你去抓取、可靠地处理和跨系统操作,这基本上是不可能的,现在变得可能了。所以在接下来的几个月里,我们会看到这些其他用例的爆发。
Anish Acharya:你认为这需要多长时间才能实现?我的意思是,每个人在12个月内都会使用自己的Open Claw吗?还是五年后?或者这个思维模型本身就是错的?比如我们六个月后在下一期Top 100报告里再谈这个话题时,世界会是什么样子?
Olivia Moore:每次我预测某事,它发生的速度都比我预想的要快得多,这是我们每天都看到的情况,初创公司的增长速度比以往任何时候都快。文化变革和文化采纳将比技术变革和实际可能实现的速度慢。所以我们会继续看到,通常是技术型的,有时也非技术型的早期AI采用者,会在某种行为上引领潮流,六个月后,其他所有人都在做。一个我很兴奋的好例子是语音,我们已经谈了很多。
对我来说,它就像我们拥有的信息最密集、质量最高的媒体形式。你每天做的很多事情实际上都与你所说的内容相关。在过去的六个月里,我第一次看到先是工程师,然后是科技公司的其他人,开始采用像语音听写这样的东西。是的,现在这几乎已经很普遍了。许多公司里,你的会议会被AI录音和转录。无论是用语音输入工具,还是用能回答问题或为你做任务的语音设备,这在未来六到九个月内会普及到主流消费者。
Anish Acharya:确实非常有趣。也许最后,你能谈谈记忆吗?以及你认为它未来会如何发展?
Olivia Moore:记忆,现在它可能有点矛盾,因为Claude和ChatGPT在这方面做得非常好,甚至Google也推出了一项名为"Personal Intelligence"的功能。它可以从你的文档、邮件等中提取关于你的信息,以便在所有应用中更好地通过AI为你服务。但是许多人向AI谈论所有个人和职业事务。所以它有时可能会无意中跨越界限,利用它对你的了解,在错误的上下文中试图更好地帮助你。所以在基础设施方面还有很多工作要做,比如如何梳理出一个人在不同上下文中的身份。
一旦这个问题解决了,记忆将成为AI产品的核心优势之一,无论是它们自己的记忆,还是像ChatGPT出借的记忆。两年后,当你开始使用任何新产品时,如果它不能立即感觉像是认识你,你就会觉得它有问题。比如"onboarding"到一个产品的概念,几年后应该就不复存在了。这正是记忆将要实现的目标。我个人的体验是,我整天和AI交谈,和好几个AI交谈。它们与我互动的方式,以及它们能够提供的价值,在使用了两三个月后,比刚开始使用时高得多。
Anish Acharya:难以置信。好吧,我不知道未来会怎样,但一定会既奇怪又美妙。Olivia,非常感谢你,今天能进行这场对话,并一起过一遍报告,真的非常有趣。有什么结束语吗?
Olivia Moore:没有了,我只是很期待大家能读到它。里面有很多有趣的数据。下次见,我确信六个月后情况会大不相同,所以我们会回来的。
机圈专业V单来了!vivo X300 Ultra首发索尼LYTIA-901 三大黄金焦段
快科技3月23日消息,今日,vivo举行X系列蓝图影像沟通会,重点展示了即将发布的vivo X300 Ultra在影像方面的全新突破。

据介绍,vivo X300 Ultra定位专业V单+口袋摄影机,保留14mm、35mm、85mm三大黄金焦段。

核心影像上,新机搭载35mm 2亿像素蔡司人文主摄,全球首发蓝图x索尼LYTIA-901传感器,拥有1/1.12英寸超大底,单像素感光面积提升30%,满阱容量(FWC)提升32%,进一步强化进光能力与画质表现。


在算法层面,vivo引入Low Noise 4多重降噪技术,相比传统CDS方案,在暗光环境下最高可降低39.2%噪声。
同时,DCG HDR与降噪技术深度融合,大幅拓展高光与暗部的动态范围。
长焦方面,vivo X300 Ultra配备85mm蔡司云台级长焦镜头,采用2亿像素APO方案,传感器为三星HP0,支持3°物理防抖,达到CIPA 7.0级专业防抖水准,等效进光量提升300%。

超广角方面,14mm蔡司镜头升级为索尼LYTIA 818传感器,进光量较上代提升100%,并具备CIPA 6.0级防抖表现。

除了全焦段大底硬件堆叠,vivo还通过自研望远自适应实时融合增稳技术,将长焦视频稳定性提升24%,进一步提升视频拍摄体验。
值得一提的是,vivo此次还带来了两款全新增距镜。其中,蔡司增距镜G2等效焦距达200mm,支持CIPA 6.5级防抖;另一款增距镜G2 Ultra则行业首次采用非球面镜片设计,等效焦距提升至400mm,进一步拓展远摄能力。
雷军宣布与国内三大顶级赛事正式签约 担任赛事安全车
【CNMO科技消息】3月23日,小米科技有限责任公司创始人雷军宣布,在中汽摩联相关负责人的见证下,小米正式与中国汽车场地职业联赛(CTCC)、中国超级跑车锦标赛(China GT)和中国汽车耐力锦标赛(CEC)三大国内顶级汽车赛事完成冠名合作签约。

小米YU7
根据合作安排,小米旗下两款车型——小米SU7 Ultra和YU7将分别担任三大赛事的官方安全车和医疗车,以实际举措为赛事安全保障贡献力量。雷军在相关发言中强调,赛道始终是检验汽车高品质与高安全性的试金石。他表示:“一旦用赛道的标准去打磨过一款产品,对高性能、高安全的认知和追求,就会深深刻在团队的基因里。”
雷军透露,小米造车之初便确立了“只有爱车、懂车,才能造好车”的理念。为此,小米内部启动了“千人赛照计划”,鼓励员工通过考取赛车执照,亲身参与汽车运动,从而获得对车辆性能与操控的直观认知。目前,小米内部已形成浓厚的汽车文化氛围。

此次小米切入中国顶级汽车赛事领域,展现出其对产品性能与安全的重视。就在不久前的2月底,小米在巴塞罗那世界移动通信大会(MWC)上发布了与《GT赛车7》合作的首款超跑概念车Vision GT,成为首个受邀设计《GT赛车》概念车的中国汽车品牌。小米集团总裁卢伟冰彼时表示,这反映了全球汽车行业对中国科技实力的认可。
在产品层面,雷军表示,小米SU7 Ultra无论是在德国纽博格林赛道还是国内各大赛道均取得了不俗成绩。同时,新一代SU7将在底盘与驾控方面实现提升,致力于打造“新一代的驾驶者之车”。
跨越千里“云端”执刀!中国机器人微创手术加速“出海”
新华社成都3月22日电(记者董小红)坐在四川大学华西医院国际机器人远程手术控制中心的操作台前,波兰内务部国立医学研究院院长彼得·苏瓦尔斯基盯着前方屏幕,双手操控着7000多公里外波兰当地的手术机器人。大约2个小时后,“病灶完整切除”——语音系统里传来手术成功的消息。彼得激动地感慨:“整个手术过程很流畅,手术视野非常清晰,病人出血量也更少。”
除了波兰这台远程手术,3月20日,四川大学华西医院国际机器人远程手术控制中心还完成了6台远程手术:四川大学华西医院副院长、肝移植中心教授吴泓为拉萨患者进行了肝包虫病手术,巴西医生利用四川手术机器人远程为本国患者进行了外科手术……
“巴西离成都1万多公里,没想到通过超高清无延迟的手术机器人,我获得了无与伦比的清晰视野和更真实的深度感知。”巴西机器人协会主席卡洛斯·爱德华多·多梅内感叹,“操作很稳定,手术更精准、更精细。中国的顶尖医疗技术和设备,随着共建‘一带一路’倡议传播到了巴西,正在造福南美洲的患者。”
3月21日,在四川大学华西医院主办的“华西国际手术机器人大会”上,华西国际机器人远程手术控制中心正式揭牌。作为目前四川规模最大、建制最完善的机器人远程手术控制中心,该中心将依托核心网络布局与专业人才梯队,打造国际化的智慧外科平台,推动医疗服务从“患者跑过来”向“技术走出去”转变。
作为中国西部疑难危急重症诊疗的国家级中心,从2015年四川大学华西医院实施第一台手术机器人手术,到2025年常规开展手术机器人远程手术,如今这一技术已覆盖泌尿外科、普外科等多个科室,惠及全球多地患者。
2026年,中国手术机器人领域将迎来历史性转折。首个《手术和治疗辅助操作类医疗服务价格项目立项指南》正式发布后,行业也将迈入“政策护航+市场爆发”的规范发展新阶段。
中国手术机器人产业正驶入快车道。中国医药保健品进出口商会数据显示,2025年,中国手术机器人出口增长达368.1%,印证了中国制造医疗设备在全球技术和市场认可度上的快速提升。
远程手术,安全是第一生命线。记者了解到,四川大学华西医院国际机器人远程手术控制中心组建了包含外科专家、麻醉专家、护理团队、网络工程师、设备工程师的专属保障团队,建立了7×24小时应急响应机制。该中心引入的国产手术机器人系统具备精细操控精度与远程协同能力,包括裸眼直视三维立体高清视野、视野图像10倍放大、颤抖滤除和直觉式操控技术等功能,让医生可以本能直觉式地操控手术器械,整个过程很“丝滑”。
“中心目前有4个操控台,可以同时实施4台远程手术。手术机器人也设置了双主刀备份,如果出现网络延迟等情况,远程端的患者所在医院手术室医护团队可以立即应急接管。”四川大学华西临床医学院常务副院长、泌尿外科教授王坤杰介绍,术中还可一键呼叫多学科专家远程接入,同步查看手术视野、患者生命体征,实时给出处置方案,极大提升疑难危重病例的手术容错性与安全性。
对患者而言,该中心的成立意味着实打实的就医红利。“以肝胆胰手术为例,以前,患者和家属需要奔波到成都接受手术,现在只需在当地接受远程机器人手术,经济负担和时间成本减少了80%。”吴泓说,患者在当地医院完成术前评估、手术、术后康复全流程,熟悉的环境缓解了患者的心理焦虑,住院周期缩短,康复速度也随之加快。
“下一步,我们将着力完善远程手术服务网络,在技术创新、临床转化、人才培养、资源普惠等方面持续探索,加强国际合作,共同推动手术机器人技术向更精准、更智能、更普惠的方向发展。”四川大学华西医院院长罗凤鸣说,预计今年7月将在埃及设立机器人远程手术控制中心。
从成都到拉萨,从中国到巴西、波兰,跨越千里的“云端”执刀,正在让优质医疗资源突破山海阻隔,为全球患者带去新的希望。
AI时代 眼见还为实吗
视频电话那头,出差在外的“伴侣”焦急地索要转账;班级群里,“班主任”用熟悉的声音发布紧急缴费通知……如今,在人工智能(AI)的加持下,普通人也能在几分钟内生成足以以假乱真的内容。AI学会了模仿人的笔迹、复刻人的声音、合成人的面容,这类技术一旦被恶意利用,会令人“眼睁睁”地被骗。这不禁让人怀疑,AI时代,眼见还为实吗?
AI造假侵入公共记忆
近期,一段“以色列士兵躲在墙后痛哭”的视频在社交媒体平台X上广泛传播。发布者称以军在伊朗火箭弹和无人机袭击下遭受重创,该视频播放量迅速突破160万。德国电视二台调查发现,该视频系典型的AI生成产物。视频中士兵佩戴的徽章时隐时现,上面的文字更是一串毫无意义的乱码。多名网友也指出,视频中制服样式、哭声音效和枪械细节都与真实场景存在明显偏差。
生成式工具进入新闻报道流程后,专业新闻机构的把关机制同样面临考验。2月,德国电视二台紧急召回并解职了该机构一名驻纽约记者,因为其发回的一则关于美国移民与海关执法局执法行动的报道中,混入了一段由视频生成模型Sora生成的虚假视频,画面角落清晰可见Sora水印。事件发生后,德国电视二台宣布为员工开设强制性培训课程,规范AI工具在新闻报道中的使用。“漠视新闻准则造成的损害是巨大的。这关乎报道的公信力。”德国电视二台总编辑贝蒂娜·绍斯滕说。
AI造假甚至侵入历史记忆。今年年初,达豪、布痕瓦尔德等约30家德国集中营纪念机构和博物馆联合签署一封公开信,敦促社交媒体平台严厉打击利用AI生成大屠杀相关内容的行为。德国历史学家伊丽丝·格罗舍克说,利用AI生成的图像和视频看起来像极了历史照片——黑白底色,骨瘦如柴的人,铁丝网后呼号的孩子……但仔细看就会发现异常,这类图像和视频中的人长相相似,身高相仿,而且都非常漂亮。
“AI让纳粹受害者变得更年轻漂亮,这种美化扭曲了历史,却利用公众同情心获得广泛传播。”格罗舍克说,这类伪造的帖子会削弱纪念馆、档案馆、博物馆和研究机构工作的权威性,损害它们的公信力。
操纵制造“社会共识”
比伪造内容更危险的,是AI可以伪造“多数人的意见”。一个国际团队近期在美国《科学》杂志“政策论坛”栏目发表文章说,数字操控正进入新阶段。散布虚假信息的不再只是单个账号,而是伪装成真实用户的AI集群。这类集群能够彼此互动、回应真人、适应情绪变化,并在不断相互附和和强化中制造出一种并不存在的“社会共识”。
德国康斯坦茨大学研究人员达维德·加西亚解释说,这类AI集群由一组可被个人或组织控制的AI智能体构成。它们拥有相对稳定的身份和记忆,能够模拟人类行为,既可以围绕特定目标协同行动,也能够根据实时事件和用户反馈调整表达方式。这类AI集群与早期的僵尸网络有着显著区别,后者通常行为机械,较容易识别;而前者可以跨平台运行,并通过彼此呼应不断放大影响。
加西亚认为,真正的风险将不再局限于个别虚假信息,而是“操纵者”可能借助大模型虚拟出“另一种社会”。他说:“AI集群可以通过缓慢而持续的过程,制造某种立场已获广泛支持的假象,进而影响人们的观点甚至改变社会规范。当许多看似彼此独立的声音不断表达相同立场时,多数派的错觉就会形成,即使这种多数原本并不存在。”
从被动辟谣到主动识别
面对这种可以伪造“社会共识”的新威胁,研究人员和机构已经开始行动,利用技术手段予以识别,并通过健全监督机制,及时鉴别和揭露虚假信息和内容。
加西亚认为,应利用模式识别等技术手段,检测内容传播中是否存在异常同步、相互呼应和跨平台联动,以更快发现由AI驱动的群体性操纵。
除了技术识别,研究人员还主张建立独立监督机制,持续观察AI智能体如何在不同平台上影响公共讨论,及时揭露虚假内容。加西亚说,这类网络越早被揭露出来,就越难侵蚀公众信任,也越难把原本多样的社会意见伪装成单一共识。
德国人工智能研究中心(DFKI)和莱茵兰-普法尔茨州政治教育中心等机构日前推出尚处于测试阶段的深度防伪检测工具,以提高公众对可疑内容的识别能力。与仅依赖像素异常识别伪造痕迹的传统方法不同,该工具不仅会对图像和音频进行取证分析,还会结合上下文展开交叉核验。后台的AI智能体会并行检索网络信息,并调用经过核实的事实资源库辅助判断,包括德新社事实核查团队提供的数据。
DFKI在新闻公报中说,用户只需点击两下,就能将社交媒体上的可疑图片转发给检测系统,系统随后会分析相关材料是否由AI生成或经过篡改,并向用户反馈其为虚假内容的可能性以及相应线索。
莱茵兰-普法尔茨州政治教育中心主任伯恩哈德·库卡茨基说,虚假信息已成为当前信息传播中的突出问题,公民每天都可能接触到被操纵的内容,因此辨别和核验信息的能力尤为重要。(褚怡)
抖音旗下星罗拾光公司增资至约187.8亿元
每经AI快讯,天眼查工商信息显示,近日,深圳星罗拾光科技有限公司发生工商变更,注册资本由约95.1亿元人民币增至约187.8亿元人民币,增幅约97%。该公司成立于2022年9月,法定代表人为石玉磊,经营范围包括技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广,信息系统集成服务等。股东信息显示,该公司由抖音集团(香港)有限公司全资持股。


