欧盟委员会向Meta发出异议声明:要求WhatsApp恢复第三方AI助手接入

4月15日,欧盟委员会正式向Meta发出“异议声明”,指控其在WhatsApp平台排挤第三方AI助手的行为违反了《数字市场法案》。根据公告,欧盟拟采取临时措施,要求Meta立即撤销对第三方AI插件的限制。监管机构初步认定,Meta利用其在即时通讯市场的垄断地位,优先推广自家AI工具,同时阻碍竞争对手接入其生态系统。

国家数据局:到2028年底 拟打造一批数据驱动人工智能创新发展的典型应用场景

财联社4月15日电,国家数据局研究起草了《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》,现向社会公开征求意见。征求意见稿提出,到2028年底,建成一批覆盖重点领域、经过应用验证的行业高质量数据集,打造一批数据驱动人工智能创新发展的典型应用场景,培育一批具备领先优势的创新型数据企业和专业人才,形成一批行业高质量数据集建设标准和工具。数据从供给到价值释放的良性循环基本形成,数据赋能人工智能创新发展的作用更加凸显,数据产业与人工智能深度融合,持续催生智能经济新增长点。

OpenAI计划为ChatGPT广告定价新方案 探讨其他升级方案

财联社4月15日电,据报道,一位与OpenAI员工交谈、与ChatGPT广告商合作的代理机构高管表示,OpenAI计划开始根据用户是否点击广告而非仅仅看用户数量来定价部分ChatGPT广告。与此同时,OpenAI也表示计划推出旨在促使人们采取特定行动的广告,比如购买或下载应用,该机构高管表示,但尚未给出具体时间表。

哈啰回应超量投放共享单车被行政处罚

4月15日,针对哈啰违规超量投放共享单车被立案调查和约谈处罚一事,哈啰公司方面回应称,哈啰骑行北京分公司在新车置换与跨区域调度中,运力调度及响应效率上存在管理短板,未能将工作做实做细。

对此,哈啰表示已启动全面整改:连夜增派运维力量,恢复重点区域的停放秩序,同时启动内部管理机制的调整优化。

哈啰称,接受北京市主管部门的约谈与指导,并以此次整改为契机,深耕精细化运营,向主管部门及社会公众汇报进度。

昨日消息,北京市交通运输执法总队对哈啰公司在北京违规超量投放共享自行车的行为进行立案调查,并提及作出行政处罚,调减其运营规模。

记者|刘晓洁

编辑|瑜见

人类能管住AI吗?Anthropic用千问做了个实验

如果有一天,AI比人类更聪明了,我们这群有机体到底应该怎么办?

他们要是反过来消灭我们,我们又怎么抵抗?

各种科幻电影都讨论过相似的问题,可那只是文学、艺术和哲学方面的。

现如今,Anthropic正儿八经做了个实验,以证实我们到底能不能监督比自己更聪明的AI。

实验结果很有趣,但过程更有意思。

因为Anthropic用两个不同版本的阿里千问模型,来分别代表人类和比人类聪明的AI。

其结果就是,我们人类说不定还真能管得住超级AI!

01

这篇论文到底在说什么

这篇研究的标题叫“Automated Alignment Researchers”,翻译过来就是“自动化对齐研究员”。

它要解决的问题很现实,那就是当AI变得比人类更聪明时,我们怎么确保它还听人话?

现在的模型已经能生成大量的代码了,未来将可以生成几百万行复杂代码,以至于人类根本看不懂。我们又该如何去审查这些代码?

这就是AI安全领域一直在研究的“可扩展监督”问题。

Anthropic这次研究的切入点叫“弱监督强模型”。

这个概念我们可以这么理解,假设你是个小学老师,现在要教一个天才高中生。你的知识有限,学生懂得知识比你更多。

那么请问,他最后能学成什么样的水平?是只学到你这个小学老师的水平,还是能突破你的局限,发挥出自己的真实能力?

在实验里,Anthropic用小模型扮演“弱老师”,用更强的模型扮演“强学生”。

具体来说,他们用Qwen1.5-0.5B-Chat当老师,用Qwen3-4B-Base当学生。让弱模型给强模型提供训练信号,然后看强模型能不能从这些不够完美的信号里,学到接近理想状态的表现。

衡量标准叫PGR,全称是Performance Gap Recovered,意思是“性能差距恢复程度”。

如果PGR是0,说明强模型只学到了弱老师的水平,白瞎了自己的知识。如果PGR是1,说明强模型彻底突破了弱老师的限制。

弱模型就相当于未来的人类,强模型就相当于未来那些超越人类的AI。

如果我们能在今天就找到办法,让强模型不被弱监督拖累,那未来我们就能用类似的方法,去监督超级AI。

在人类研究员调试出基线之后,Anthropic派出了9个基于Claude Opus 4.6的agent来给学生Qwen进行微调,这9个agent叫做Automated Alignment Researcher(自动化对齐研究员),简称AAR。

Anthropic给它们配备了沙盒环境、代码工具、共享论坛、评分服务器,然后告诉它们:“去吧,自己想办法提高Qwen3-4B-Base的PGR。”

这些AI研究员可以自己提出假设、写代码、训练模型、提交实验、看分数、分析失败原因、和其他AI研究员交流发现、继续迭代。

结果相当惊人。

人类研究员先花了7天时间,调试了4种已有方法,最好的PGR只有0.23。然后9个Claude接手,继续跑了5天,累计大约800小时研究时间,最后把PGR推到了0.97。

也就是说,我们大概率可以管得住比我们更聪明的超级AI。

这个实验总成本约1.8万美元,包括API调用和模型训练的计算成本,折合每个AI研究员工作一小时约22美元。

什么概念?沃尔玛零售门店负责给员工排班的副店长,时薪差不多是25美元。

这个结果让人震撼的地方不在于AI能写代码或者读论文,而在于它们能完成一个完整的研究闭环。提出想法、验证、失败、改进、再验证,这已经接近一个研究助理的核心工作流程了。

但问题来了,这些AI发现的方法,真的有用吗?还是只是在特定环境里碰巧有效?

Anthropic做了两个测试来验证。

第一个测试是把AI发现的最好两种方法,拿去测试它们没见过的数学和代码任务。

结果显示,效果最好的方法在数学任务上PGR达到0.94,在代码任务上达到0.47,虽然代码任务上的表现差一些,但仍然是人类基线的两倍。其次的方法在数学上还行,但在代码任务上反而让结果变差了。

说明它有一定迁移迹象,但泛化并不稳定。

但它们会严重依赖具体的数据集和任务结构,也就是说并不是所有人任务都能胜任。

第二个测试是Anthropic把刚才提到的效果最好的方法,拿到了Claude Sonnet 4的真实训练上,来看看实际效果如何。

结果没有得到统计显著的提升。

也就是说,在小模型、清晰指标、可以反复提交的实验环境里效果很好,但离“直接改进生产级Claude对齐”还有距离。

这个结果其实很诚实。它告诉我们,AI研究员现在能做的事情是有边界的。它们擅长在目标明确、能自动评分、能大量试错的问题上快速迭代,但遇到更复杂、更模糊的现实问题时,还需要人类的判断和介入。

那这篇论文的意义到底在哪里?

首先,它证明了“AI做研究”已经不是口号了。

过去我们总说AI可以辅助研究,然而那只是口号而已,AI能做的事情也就是翻译和总结。

这次不一样,AI自己形成了研究闭环,这已经接近研究助理的核心能力了。

弱监督强模型这个问题,本质上就是在模拟未来人类监督超级AI的场景。

这篇论文证明,至少在一些清晰任务上,AI可以自己找到办法,让强模型不被弱监督拖死。这为未来的对齐研究提供了一个可行的方向。

还有一点,它暗示未来对齐研究的瓶颈可能会变。

以前瓶颈是“没人想出足够多好点子”,现在如果AI研究员能便宜地并行跑很多实验,瓶颈可能变成“怎么设计不会被钻空子的评测”。

也就是说,人类研究员未来更重要的工作,可能不是亲自跑每个实验,而是设计评估体系、检查AI研究员有没有作弊、判断结果是不是真的有意义。

这一点在论文里也有体现。

Anthropic的文章中写到,在数学任务里,有个AI研究员发现最常见的答案通常是对的,于是绕过弱老师,直接让强模型选最常见答案。在代码任务里,AI研究员发现自己可以直接运行代码测试,然后读出正确答案。

这对任务来说就是作弊,因为它不是在解决弱监督问题,而是在利用环境漏洞。

这些结果被Anthropic识别并剔除了,但这恰好说明自动化研究员越强,越会寻找评分系统的漏洞。

以后如果让AI自动做对齐研究,必须把评测环境设计得非常严密,还要有人类检查方法本身,而不是只看分数。

所以这篇论文的核心结论是今天的前沿模型,已经可以在某些定义清楚、能自动打分的对齐研究问题上,像小型研究员团队一样自己提想法、跑实验、复盘结果,并且明显超过人类基线。

不过它还不是“AI科学家已经到来”的铁证,毕竟Anthropic这次选择的是一个能够自动化的任务,如果我给AI安排一个不能自动化的任务,那么结果将会非常糟糕。

现实中的很多对齐问题更模糊,不能轻松打分,也不能只靠爬榜解决。

02

为什么选择Qwen

看完Anthropic这篇论文,很多人可能会好奇:为什么他们用的是阿里的Qwen模型,而不是自家的Claude或者OpenAI的GPT?

这个选择背后其实有很多考量。

首先得说清楚,这个实验里用的是两个Qwen模型:Qwen1.5-0.5B-Chat当弱老师,Qwen3-4B-Base当强学生。一个只有5亿参数,一个有40亿参数,规模差了8倍。这个规模差异很重要,因为实验要模拟的就是“弱老师教强学生”的场景。

那为什么不用Claude或者GPT呢?

答案很简单,因为这些模型不开放权重模型。

Anthropic这个实验需要反复训练模型、调整参数、测试不同的监督方法。

如果用闭源模型,他们只能通过API调用,没法深入模型内部去做精细的训练和调整。

更关键的是,他们需要让9个AI研究员并行跑几百次实验,每次实验都要训练一个新模型。如果用闭源模型,成本会高到离谱,而且很多操作根本做不了。

开源模型就不一样了。

你可以下载完整的模型权重,在自己的服务器上随便折腾。想怎么训练就怎么训练,想跑多少次实验就跑多少次。这种灵活性是闭源模型给不了的。

但开源模型那么多,为什么偏偏选Qwen?

官方并没有给出真正的原因,以下原因均为我的推测。

我认为性能好是第一个原因。

Qwen系列模型在开源模型里一直表现不错,尤其是Qwen3发布后,在多个基准测试上都达到了接近闭源模型的水平。

对于这个实验来说,强学生的能力很重要,如果强学生本身能力不行,那弱监督再好也没用。Qwen3-4B虽然只有40亿参数,但能力已经足够强,可以作为一个合格的“强学生”。

第二个原因是模型的可用性。

Qwen模型的文档完善,社区活跃,训练和推理的工具链都很成熟。对于需要反复训练和测试的实验来说,这些基础设施的完善程度直接影响研究效率。如果选一个文档不全、工具不好用的开源模型,光是调试环境就要浪费大量时间。

第三个原因是规模的适配性。

这个实验需要一个“弱老师”和一个“强学生”,而且这两个模型要有明显的能力差距,但又不能差太多。

Qwen系列有从5亿到720亿参数的多个版本,可以灵活选择。5亿参数的模型足够弱,但又不至于弱到完全没用;40亿参数的模型足够强,但又不至于强到训练成本承受不了。这个搭配刚刚好。

最后一个原因是可复现性。

Anthropic在论文最后明确表示,他们把代码和数据集都公开了,放在GitHub上。如果他们用的是闭源模型,其他研究者想复现这个实验就很困难,因为他们没法获得相同的模型。

但用Qwen这样的开源模型,任何人都可以下载相同的模型权重,跑相同的代码,验证相同的结果。这对科研来说非常重要。

从这个角度看,Anthropic选择Qwen,一方面确实是对阿里模型性能的认可。如果Qwen的能力不行,或者训练起来问题很多,他们不会选。但另一方面,更重要的是Qwen作为开源模型带来的灵活性和可复现性。

而中国的开源AI项目,正在这个基础设施中占据越来越重要的位置。这对全球AI安全研究来说是好事,对中国AI生态来说也是好事。因为AI安全不是零和游戏,不是你赢我输,而是大家一起努力,让AI变得更安全、更可控、更有益于人类。

大众ID.3 Neo发布:续航超600公里,触摸滑块被实体按键取代

IT之家 4 月 15 日消息,大众汽车推出了其紧凑型电动车的重大改款车型,新车命名为 ID.3 Neo。

有趣的是,“Neo”这个后缀正是该车在内部研发阶段所使用的代号。虽然外观变化相对克制,但新车在续航、内饰和动力系统上均有实质性升级,其中最受关注的莫过于大众终于听取了用户反馈,彻底取消了备受诟病的触摸滑块,全面回归实体按键。

从外观来看,这是一次中期改款而非真正意义上的换代。ID.3 Neo 换装了经过重新设计的大灯,前保险杠也经过重塑。两侧大灯由一条发光的宽幅玻璃饰条连接,大众徽标同样可以点亮,灯条比以往更粗。

车尾方面,此前黑色的尾门面板被替换为与车身同色的面板。同样,风挡玻璃包边、车顶以及后扰流板也都采用了车身同色涂装。

作为改款,车身侧面轮廓基本不变,仅新增了几款轮毂设计。尺寸上,新车车长增加了 23 毫米,车高降低了 10 毫米,轴距缩短了 6 毫米,车宽保持不变。

如果说外观是小修小补,那么内饰堪称彻底重做。大众回应了 ID.3 老车主的批评。新车全面取消了用于调节温度和音量的触摸滑块,中控台经过重新设计,在空调出风口下方增加了一排实体物理按钮。

这排按键可快速调节温度、风量、空调开关、自动空调模式、空气循环、前风挡除雾以及后窗加热。方向盘上也终于回归了传统实体按键,取代了此前让人抓狂的电容式触摸按键。

另一个痛点 —— 驾驶座门板没有独立的后排车窗开关 —— 也得到解决。ID.3 Neo 回归了经典布局,四个车窗各自配备独立开关,同时还设有独立的锁车和解锁按钮。

座椅之间还增加了一个旋钮,不仅用于音量控制,还可以切换歌曲和电台。中央通道下方新增了一个较低位置的储物格。

同时,新车仪表盘从老款 5.3 英寸的小屏幕升级为 10.25 英寸的全新数字仪表,还提供复古风格的显示主题,模仿第一代高尔夫(Golf Mk1)的仪表盘样式,包含模拟指针式速度表和“转速表”—— 当然这里显示的是电机输出功率和能量回收强度。

另外,多媒体系统的 12.9 英寸触摸屏也是全新的,“Innovision”信息娱乐系统取代了此前的“Discover”系统。

对于这款新车,大众用经典的“Trend”、“Life”和“Style”取代了此前的“Pure”、“Pro”和“Pro S”配置等级。

Life 版标配基于 ChatGPT 的 IDA 语音助手,支持无线 CarPlay / Android Auto,还配备自动防眩目后视镜、电动折叠外后视镜、无钥匙启动、驾驶模式选择、自动空调、10 色氛围灯、方向盘加热、自适应巡航、动态路标识别、车道保持辅助、带行人及骑行者检测的 Front Assist 紧急制动、18 英寸合金轮毂、手机无线充电、双区自动空调、倒车影像、前排乘客主动保护系统等。

Style 版在 Life 基础上增加 IQ.LIGHT 矩阵式 LED 大灯、发光车标、自动远光灯、LED 尾灯、防盗报警、30 色氛围灯、带一体式头枕的运动座椅、Play / Pause 符号装饰的油门刹车踏板、加热座椅、导航系统等。

选装项目包括全景天窗、360 度摄像头、带按摩记忆的前排座椅、Harman Kardon 音响、增强现实抬头显示、V2L 对外放电、Connected Travel Assist 驾驶辅助(含红绿灯自动刹停)、单踏板模式、数字钥匙等。

动力方面,ID.3 Neo 搭载了全新的 APP350 电机,取代了此前的 APP310,能耗更低。

新车提供三个功率级别:50 kWh 电池版本对应 168 马力(约合 124kW),58 kWh 版本对应 188 马力(约合 138kW),79 kWh 版本对应 228 马力(约合 168kW)。

大电池版本支持最高 183 kW 的直流快充,小电池版本则限制在 105 kW。根据大众 WLTP 估算,50 kWh 版本的续航为 417 公里,58 kWh 版本为 494 公里,79 kWh 版本最高可达 630 公里。根据电池不同,10% 至 80% 直流快充时间约为 26 至 29 分钟。

另外,改款新增单踏板驾驶模式以及 V2L(车辆对外放电)功能 —— 后者可以将 ID.3 Neo 变成移动电源为外部设备供电,但需要使用可选适配器。

全新大众 ID.3 Neo 将于本月起在欧洲开启预订,起售价为 29,495 欧元(IT之家注:现汇率约合 23.7 万元人民币),计划 7 月正式上市,首批车辆将于秋季抵达经销商展厅并开始交付。

比黑夜还要纯粹 全新坦克500黑武士上市:36.5万起

快科技4月15日消息,今晚,全新坦克500黑武士正式上市,新车共推出2款车型,售价区间36.5-38.5万元

新车延续了普通版的造型,以“黑甲赤韵”为设计主题,采用原厂一体化定制全黑套件,涵盖黑色灯组、黑色中网、黑色轮毂(搭配红色卡钳)、黑色侧踏板、黑色行李架及全黑外观装饰条,黑的很是纯粹。

比黑夜还要纯粹 全新坦克500黑武士上市:36.5万起

比黑夜还要纯粹 全新坦克500黑武士上市:36.5万起

车身尺寸方面,新车长宽高分别为5078/1934/1905mm,轴距2850mm,整体与老款车型保持一致,接近角29度,离去角24度,最小离地间隙210mm

比黑夜还要纯粹 全新坦克500黑武士上市:36.5万起

内饰方面,新车新增红色内饰设计,整体采用上黑下红的设计思路,并在多处细节加入镀铬元素进行点缀,整体营造出较强的精致感,并配有三辐式多功能方向盘和14.6悬浮式中控屏。

比黑夜还要纯粹 全新坦克500黑武士上市:36.5万起

比黑夜还要纯粹 全新坦克500黑武士上市:36.5万起

动力部分,作为特别版车型,其将继续延续现款车型动力总成,提供两种动力版本:

Hi4-T搭载2.0T发动机+单电机+9HAT变速箱,系统综合功率300千瓦,配备37.1kWh 电池,WLTC纯电续航110公里,采用非解耦四驱结构,主打强悍越野性能。

Hi4-Z搭载2.0T发动机+双电机+3挡DHT变速箱,系统综合功率645千瓦,配备59.05kWh电池,WLTC纯电续航201公里,主打泛越野属性。

除新能源版本外,坦克500还提供燃油款,搭载长城自研的3.0T涡轮增压发动机+48V轻混系统,并配备9AT变速箱,最大功率265kW,峰值扭矩500N·m。

比黑夜还要纯粹 全新坦克500黑武士上市:36.5万起

量化交易巨头简街与CoreWeave签署60亿美元AI云协议

云计算服务提供商CoreWeave和量化交易巨头简街(Jane Street)4月15日宣布,简街已承诺投入约60亿美元使用CoreWeave的人工智能云平台。根据这项新协议,CoreWeave将为简街提供跨多个数据中心的下一代计算资源,包括英伟达的Vera Rubin平台。此外,简街还以每股109美元的价格,斥资10亿美元购入CoreWeave A类普通股。

爱奇艺创始人、首席执行官龚宇:“跪求”AI生成的高品质影视作品

每经记者:丁舟洋 每经编辑:魏文艺

“过去几年,影视行业,特别是电影、电视剧、综艺这种长视频遇到了一些困难,但我觉得AI(人工智能)提供了特别好的振兴机会。”4月15日,在第13届中国网络视听大会上,爱奇艺创始人、首席执行官龚宇在主题演讲中表示。

“长期以来,长视频平台是‘中心化’机制,由少数人来决定给大众提供什么。”龚宇表示,AI降低了影视制作门槛,给予了长视频平台“去中心化”的可能。“创作者将内容发布到平台,平台根据内容取得的商业成绩,给予创作者公平的分成回报。爱奇艺广纳天下豪杰,‘跪求’AI生成的高品质影视作品,现在我们亟需既懂AI技术又懂艺术创作的创作者。”