打破跨模态干扰,快手东北大学联合提出统一多模态框架
UNITE 团队投稿 量子位 | 公众号 QbitAI 多模态检索是信息理解与获取的关键技术,但其中的跨模态干扰问题一直是一大难题。 可行的解决办法是构建一种统一的多模态表示方式,为此,来自快手与东北大学的研究人员推出了多模态统一嵌入框架——UNITE。 UNITE 的核心目标,就是构建一个能同时处
首创像素空间推理,7B模型领先GPT-4o,让AI能像人一样眼脑并用
Pixel Reasoner 团队投稿 量子位 | 公众号 QbitAI 视觉语言模型(VLM)正经历从「感知」到「认知」的关键跃迁。 当 OpenAI 的 o3 系列通过「图像思维」(Thinking with Images)让模型学会缩放、标记视觉区域时,我们看到了多模态交互的全新可能。 然而,
给大模型装上「思维分段引擎」:浙大InftyThink解锁无限深度推理
ZJU REAL Lab 团队投稿 量子位 | 公众号 QbitAI 学会“适当暂停与总结”,大模型终于实现无限推理。 想象一下,让你一口气不歇地推演一个超复杂数学证明,大脑也会“内存溢出”吧? 如今的大模型在长上下文推理中也面临同样的困境,随着推理长度增加而指数级增长的计算成本,以及由于长度受限而
6分钟狂掉750亿市值!苹果发布会发啥了…
开场仅 6 分钟市值就突然缩水 750 亿美元(约合人民币 5385.8 亿元)! 是什么让一众投资者对苹果发布会集体大失所望? 咳咳,原来“罪魁祸首”又是它:Siri。 早在今年 WWDC 大会召开之前,用户和投资者其实对 Siri 的更新寄予了厚望,然而开场没多久,苹果软件主管 Craig Fe
中科闻歌完成新一轮战略融资,引领企业级人工智能技术发展
允中发自凹非寺 量子位 | 公众号 QbitAI 近日,专注于决策智能的企业级 AI 服务商中科闻歌宣布完成新一轮战略融资投资人为北京市石景山区现代创新产业发展基金有限公司(以下简称石景山区产业基金) 本轮融资将主要用于自研决策智能操作系统 DIOS 的研发投入和市场推广,加速企业级人工智能技术发展
华为创造AI算力新纪录:万卡集群训练98%可用度,秒级恢复
金磊发自凹非寺 量子位 | 公众号 QbitAI 大模型的落地能力,核心在于性能的稳定输出,而性能稳定的底层支撑,是强大的算力集群。其中,构建万卡级算力集群,已成为全球公认的顶尖技术挑战。 但是,在华为,昇腾万卡算力集群,已经可以做到近乎“永不罢工”了: 训练可用度达 98%:这就好比你开着一辆车,
李飞飞自曝详细创业经历:五年前因眼睛受伤,坚定要做世界模型
因为眼睛受伤暂时失去立体视觉,李飞飞更加坚定了做世界模型的决心。 在 a16z 的最新播客节目中,“AI 教母”李飞飞讲述了五年前因为一次角膜损伤暂时失去立体视觉的经历:尽管凭借多年经验能想象出三维世界,但一只眼睛看东西时,我开始害怕开车。 但作为一名科学家,她也把这次经历当成一次宝贵的“实验”机会
北大伯克利联手“拷问”大模型:最强Agent也才40分!
北大邓小铁课题组投稿 量子位 | 公众号 QbitAI 给大模型当老师,让它一步步按你的想法做数据分析,有多难? 结果是,连 Claude-3.7 和 Gemini-2.5 Pro 这样的顶尖选手,都开始“不听话”了。 在一个全新的测试基准中,它们面对多轮、不断演进的指令,最终的任务成功率最高仅有
奥特曼ChatGPT用法错了!最新研究:要求“直接回答”降低准确率
克雷西发自凹非寺 量子位 | 公众号 QbitAI 奥特曼使用大模型的方法,竟然是错的? 来自沃顿商学院等机构的最新研究发现,备受奥特曼喜爱的“直接回答”提示,竟然会显著降低模型准确率。 不过另一方面,这项研究也发现,在提示词中加入思维链(CoT)命令同样不好用—— CoT 提示对于推理模型非但没有
AI辩论能力碾压人类,81.7%概率让你信服!研究登Nature子刊
新智元报道 编辑:peter 东英智 近日,一项发表在《自然·人类行为》的研究指出:在线辩论中,当大语言模型能够根据对手的特征个性化其论点时,它们比人类更具说服力。 作为人类,我们认为自己掌控着自己的思想。但历史证明并非如此。 我们是社会性生物,容易被那些能够大规模改变我们思想的人所影响金钱、规则、
谷歌CEO劈柴震撼预言:2030年AI直逼超人智能,80亿人认知被颠覆
新智元报道 编辑:英智 AI 让每个人都能成为创作者!谷歌 CEO 劈柴震撼发声,称 AI 是人类历史上影响最深远的技术。他畅谈从文字到电影制作,AI 如何释放全球 80 亿人的认知潜能,彻底改变创造力的格局。 谷歌 CEO 劈柴在近期采访中提到,AI 是人类将开发的影响最深远技术,比火或电更重要。
RLHF已死,RLVR引爆AGI革命!Claude 4核心成员万字对谈
新智元报道 编辑:KingHZ AI 顶流 Claude 升级了,程序员看了都沉默:不仅能写代码能力更强了,还能连续干活 7 小时不出大差错!AGI 真要来了?这背后到底发生了什么?现在,还有机会加入 AI 行业吗?如今做哪些准备,才能在未来立足? 在 Dwarkesh Patel 主持的节目中,A
谷歌Transformer过时了?清华姚班校友等三连击,爆改注意力!
新智元报道 编辑:KingHZ RNN 太老,Transformer 太慢?谷歌掀翻 Transformer 王座,用「注意力偏向+保留门」取代传统遗忘机制,重新定义了 AI 架构设计。全新模型 Moneta、Yaad、Memora,在多个任务上全面超越 Transformer。这一次,谷歌不是调参
你永远叫不醒装睡的大模型!多轮对话全军覆没,性能暴跌39%
新智元报道 编辑:LRS 20 万次模拟实验,耗资 5000 美元,证实大模型在多轮对话中的表现明显低于单轮对话!一旦模型的第一轮答案出现偏差,不要试图纠正,而是新开一个对话! ChatGPT 将大模型技术推动到「对话」场景,直接引发了 AI 技术的爆炸式增长。 用户可以先提出一个粗糙的、不明确的问
全球30名顶尖数学家秘密集会围剿AI,当场破防!惊呼已接近数学天才
新智元报道 编辑:Aeneas 好困 最近,30 位世界顶尖数学家亲自出马,在 UC 伯克利对 OpenAI o4-mini 展开「围剿」,两天连出教授级难题,结果却当场集体「破防」!有人直言:这个 AI,的确已接近数学天才的水平。曾经以为 AGI 遥遥无期,如今仿佛只剩临门一脚了…… AI 做数学
CS专业爆冷,失业率飙至全美第七!毕业生狂卷4年,投1000份简历换0 offer
新智元报道 编辑:Aeneas 曾经最受欢迎的 CS 专业,刚刚爆冷:成为大学专业中失业率最高的专业之一,排名第七!现在,已经有无数毕业生现身说法表示,自己在四年前踩着热潮挤进这个大热门专业,如今毕业投出 1000 份简历却拿到 0 offer,而几十万刀的学生贷款,已经沉重地压了过来。 谁能想到,
顶流AI,人设崩了!6小时被攻破,泄露高危品指南,惨遭网友举报
新智元报道 编辑:KingHZ 仅用 6 小时,Claude 4 就让研究者了解了如何制造神经毒气——这不是小说情节,而是真实事件。更令人担忧的是,Anthropic 自身也无法完全评估风险。这是否意味着这家 AI 巨头的「安全人设」正在崩塌? 只要 6 小时,顶尖大模型 Claude 4 Opus
Hinton梦想的AI医生要来了!斯坦福哈佛实测:o1以78%正确率超人类
新智元报道 编辑:犀牛 AI 正在颠覆医疗领域!哈佛、斯坦福等顶尖学术医疗中心的研究表明,OpenAI 的 o1-preview 在诊断推理任务中全面超越人类医生。从新英格兰医学杂志的临床病例到真实急诊室场景,o1 不仅精准识别疾病,还在关键时刻提供可靠的第二意见。 AI 医生的时代正在到来! 哈佛
算力终结者来了!华人天团「降维打击」注意力瓶颈,AI狂飙进对数时代
新智元报道 编辑:KingHZ 犀牛 注意力机制的「平方枷锁」,再次被撬开!一招 Fenwick 树分段,用掩码矩阵,让注意力焕发对数级效率。更厉害的是,它无缝对接线性注意力家族,Mamba-2、DeltaNet 全员提速,跑分全面开花。长序列处理迈入 log 时代! LLM 苦算力太久了! 为缓解
美IT业裁员狂飙35%,「硅谷梦」彻底崩塌!打工人怒喷PIP
新智元报道 编辑:KingHZ 2025 年,美国就业大地震!与同期相比,全美裁员人数,上涨了 47%。「政府效率部」掀起裁员潮之后,科技行业迎来「冰火两重天」。 2025,美国裁员之年。 本周四,职业介绍机构 Challenger, Gray & Christmas 发布了美国全国就业报告。 与去
3B超越DeepSeek,大模型终于理解时间了!Time-R1一统过去/未来/生成
新智元报道 编辑:LRST Time-R1 通过三阶段强化学习提升模型的时间推理能力,其核心是动态奖励机制,根据任务难度和训练进程调整奖励,引导模型逐步提升性能,最终使 3B 小模型实现全面时间推理能力,超越 671B 模型。 时间,是我们日常生活中最基础的概念。 但对于大语言模型(LLM)来说,它
AI疯狂进化6个月,一张天梯图全浓缩!30+模型混战,大神演讲爆火
新智元报道 编辑:定慧好困 在旧金山 AI 工程师世博会上,Simon Willison 用自创「骑自行车的鹈鹕」图像生成测试,幽默回顾过去半年 LLM 的飞速发展。亲测 30 多款 AI 模型,强调工具+推理成最强 AI 组合! 半年之期已到,AI 龙王归位!(AI 卷成啥样了?) 就在刚刚,AI
影视级3D生成新王:Direct3D-S2全面开源!8块GPU超越闭源登顶HF
新智元报道 编辑:犀牛桃子 3D 生成模型高光时刻来临!DreamTech 联手南大、复旦、牛津发布的 Direct3D-S2 登顶 HuggingFace 热榜。仅用 8 块 GPU 训练,效果超闭源模型,直指影视级精细度。 HuggingFace 是全球最大的开源大模型社区,汇集了来自世界各地的
苹果炮轰AI推理遭打脸,GitHub大佬神怒怼!复杂任务≠推理能力
新智元报道 编辑:KingHZ 最近,苹果再次发文指出 LLM 推理的根本缺陷。相关解读,一夜刷屏。然而,GitHub 高级软件工程师怒不可遏,怒斥相关「流言」。 最近,苹果公司发表了预印本论文,指出推理大模型存在重大缺陷。 昨天,Ruben Hassid 发布了相关解读的X帖子,认为这是项突破性研
数学圈地震!o3靠直觉刷爆人类顶尖难题,14位专家集体破防
新智元报道 编辑:桃子犀牛 【新智元导读】推理模型如何攻克数学难题?Epoch AI 新研究发现,o3-mini-high 不仅具备渊博学识,还会基于直觉解题。然而,它的推理风格过于依赖直觉,缺乏严谨性和创造力,甚至偶尔「投机取巧」。 推理模型不会推理,一夜成为硅谷最热门的话题。 来自 Epoch
腾讯游戏“放大招”!推出游戏创作AI全链路解决方案
GameLook 报道/近日,继腾讯混元团队推出 AI 赋能游戏的解决方案,腾讯游戏部门也亲自下场,打造了名为“VISVISE”的游戏创作 AI 全链路解决方案业务。该方案旨在通过人工智能技术优化游戏开发的各个环节。 而目前在 VISVISE 解决方案中,由腾讯游戏旗下产品效能部 GoSkinnin
2025年了,云游戏发展到什么地步了?
GameLook 报道/从去年开始到现在,游戏行业的一个热点话题就是 PC 游戏平台的复兴,而在国内市场,PC 端游戏复兴的重要前提就是最近几年跨端游戏的蓬勃发展。如果复盘过去几年国内的头部游戏产品,就会发现大部分都是跨端游戏。 事实上随着移动互联网技术的进一步发展,以及如今“玩家想要在不同场景中玩
在最卷赛道玩出新花样,网易如何诠释搜打撤长线运营的开悟时刻?
GameLook 报道/是的,我沉迷搜打撤游戏已经有小半年时间了。每天结束工作,只想沉迷在一把又一把紧张刺激的“搜打撤”里。无论跑刀以小博大、当一把“鼠鼠”夺舍爽撤,还是全装猛攻刚枪,亦或是摸到大金赚个盆满钵满……都让人欲罢不能。 当然游戏好玩、爱玩是一回事,另一个重要原因是,最近一段时间的确被搜打
小游戏大佬Voodoo揭秘:如何每年测试2000个原型、干出年入1亿美元爆款?
Gamelook 报道/“一次多余的迭代,就是失去了一次打造新游戏的机会。” Voodoo 核心游戏副总裁 Thibault de Vésinne-Larue 的这句话,道出了这家手游发行巨头独特的生存哲学。在同行们可能为一个“边缘项目”反复优化数月时,Voodoo 的发行经理们手持数据利刃,以惊人
月销五万,年底盈利,蔚来能否达成目标?
“今年四季度,蔚来的月销量目标是 5 万台。” 6 月 4 日上午,蔚来汽车董事长、CEO 李斌和联合创始人秦力洪在一场闭门沟通会上,就一季度的财务状况做出了更详细的解释,并给出了新的销量目标。 根据蔚来公布的 2025 年一季度财报显示,今年一季度蔚来营收 120.35 亿元,同比增长 21.46