允中发自凹非寺 量子位 | 公众号 QbitAI 抛弃替代损失函数,仅需优化原始目标, 强化学习新范式来了: 消除 critic 和 reference 模型,避免 KL 散度约束;解决优势函数和梯度估计两个偏差。 来自阿里-高德地图的团队提出了一种相当简单的强化学习训练新方法:组策略梯度优化 GP ...

允中发自凹非寺 量子位 | 公众号 QbitAI 抛弃替代损失函数,仅需优化原始目标, 强化学习新范式来了: 消除 critic 和 reference 模型,避免 KL 散度约束;解决优势函数和梯度估计两个偏差。 来自阿里-高德地图的团队提出了一种相当简单的强化学习训练新方法:组策略梯度优化 GP ...
白交发自凹非寺 量子位 | 公众号 QbitAI 专为 GitHub 打造的免费百科全书来了—— DeepWiki,覆盖全球所有 GitHub 存储库,无需注册即可食用。 最简单的触发模式,就是只需要把链接中「github」改为「deepwiki」字样,就可以生成项目专属的 wiki 百科页面。 整 ...
克雷西发自凹非寺 量子位 | 公众号 QbitAI 马斯克 xAI 与X合并后,又有新动向! 彭博社消息,马斯克正在为合并后的 XAI Holding 寻求一笔 200 亿美元(约 1450 亿人民币)的融资。 如果交易完成,新·XAI 的估值将超过 1200 亿美元(约 8745 亿人民币)。 届 ...
量子位智库 量子位 | 公众号 QbitAI 2022 年初,彼时 OpenAI 还未发布 ChatGPT,RockAI 就已经选择押注非 Transformer 路线。 这一在当时看来非主流的选择,如今正逐渐显现出前瞻性。 他们打造的端侧大模型已经可以在树莓派这样的微型设备上流畅运行,首批搭载 Y ...
鱼羊一水发自凹非寺 量子位 | 公众号 QbitAI 如果有这么一个人,写下这样的复杂公式,并声称是受女神梦中启发所得,大家伙儿通常会送他两个字:民科。 但当这个人一生中数千次写下类似的数学公式和命题,并在此后的 100 年间,不断地被证实正确,那么就只有一个可能—— 他是拉马努金。 之所以再度火爆 ...
衡宇发自凹非寺 量子位 | 公众号 QbitAI 全球 AI 大模型智能涌现,现在正在进入“多模态时间”。 一方面,全球业内各式各样的技术进展,都围绕多模态如火如荼展开。 另一方面,AI 应用和落地的需求中,多模态也是最重要的能力。没有多模态技术,何谈应用和落地? 实际上,多模态的先锋共识和趋势,把 ...
GeoSense 团队投稿 量子位 | 公众号 QbitAI 多模态大模型几何解题哪家强? 首个从几何原理视角出发,全面评估多模态大模型几何解题能力的双语综合基准来了! GeoSense,系统评测多模态大模型在几何原理识别和应用中的表现,评测基准的数据和评测代码均已开源。 其背后团队来自淘天集团算法 ...
新智元报道 编辑:编辑部 NXs 一项来自清华大学和上海交通大学的研究颠覆了对可验证奖励强化学习(RLVR)的认知。RLVR 被认为是打造自我进化大模型的关键,但实验表明,它可能只是提高了采样效率,而非真正赋予模型全新推理能力。 最近,以推理能力为核心的大语言模型已然成为了主流,比如 OpenAI ...
新智元报道 编辑:英智好困 全球首个去中心化强化学习训练的 32B 模型震撼发布!无需授权,就能用自家异构计算资源参与其中,让编码、数学与科学领域的推理性能迈向新高度。 最近,全球第一个用去中心化强化学习训练的 32B 模型——INTELLECT-2 正式发布! 任何人都能用自己的异构计算资源参与, ...
新智元报道 编辑:犀牛好困 近日,GPT-4.5 核心开发者之一的 Kai Chen 因绿卡申请被拒,面临被迫离开美国的困境。与此同时,1700 多名国际学生和研究人员因签证审查受阻,Nature 调查显示 75% 的美国科学家正考虑逃离。这种人才流失或将影响美国在全球 AI 领域的领先地位。 GP ...
新智元报道 编辑:英智 她 21 岁创立 AI 公司,靠5% 股份逆风翻盘!Lucy Guo 如何从自学编程到辍学创业,超越 Taylor Swift,成为全球最年轻的白手起家女亿万富翁? 最近,30 岁的郭如意(Lucy Guo)火出圈了! 她超越了流行天后 Taylor Swift,成为全球最年 ...
新智元报道 编辑:犀牛好困 LLM 的规模爆炸式增长,传统量化技术虽能压缩模型,却以牺牲精度为代价。莱斯大学团队的最新研究 DFloat11 打破这一僵局:它将模型压缩 30% 且输出与原始模型逐位一致!更惊艳的是,通过针对 GPU 的定制化解压缩内核,DFloat11 使推理吞吐量提升最高 38. ...
新智元报道 编辑:编辑部 ZJX 就在刚刚,美国政府曝光了各界对「AI 行动计划」的全部政策建议。OpenAI 措辞激烈地表示,DeepSeek 让我们看到,必须马上锁死中国 AI,必须限制高端 GPU 芯片和模型权重流向中国!Anthropic 同样呼吁:必须立马补上 H20 这一关键漏洞,并且严 ...
新智元报道 编辑:LRST 好困 通过蒙特卡洛树搜索筛选高难度样本,ThinkLite-VL 仅用少量数据就能显著提升视觉语言模型的推理能力,无需知识蒸馏,为高效训练提供了新思路。 在大模型时代,视觉语言模型(Vision-Language Models, VLMs)正在从感知走向推理。在诸如图像问 ...
新智元报道 编辑:桃子好困 GPT-4o 又双叒更新了。这一次,在智力和个性方面再次进化,STEM 解决能力增强,响应更主动。与此同时,有人曝出它的生图质量大不如前。 OpenAI 又默默地更新了模型。 前一天,奥特曼发文称更新后的 GPT-4o,在智力和个性方面有了很大的提升。 在更新公告中,GP ...
新智元报道 编辑:定慧英智 科研成果「复现」新革命!还在为堆积如山的论文和难以复现的代码发愁吗?Paper2Code 能直接「阅读」机器学习论文,自动生成高质量、可运行的代码库。它通过智能规划、分析、生成三步,效率远超人类,有望极大加速科研迭代,告别「重复造轮子」的烦恼! 这几年,AI 领域的科研人 ...
新智元报道 编辑:KingHZ 自回归模型,首次生成 2048×2048 分辨率图像!来自 Meta、西北大学、新加坡国立大学等机构的研究人员,专门为多模态大语言模型(MLLMs)设计的 TokenShuffle,显著减少了计算中的视觉 Token 数量,提升效率并支持高分辨率图像合成。 自回归模型 ...
新智元报道 编辑:桃子 曾凭借 Siri 引领潮流的苹果,如今却在 AI 赛道上被时代抛在身后。苹果 AI 亮相至今,许多功能鸽了好久。如今,苹果挥刀 AI 团队拆分重塑,进一步瞄准机器人、智能眼镜未来风口。 曾被寄予厚望的苹果 AI,似乎已被这个飞速迭代的时代淘汰了。 Siri,作为曾经的语音助手 ...
新智元报道 编辑:编辑部 JZH 今天,一张图在网上爆火:中国 AI 专利数量占全球 70%,成 TOP 1!不过,曾撰写「AI 2027」预测报告的研究员却发长篇博文表示,AI 竞赛美国稳操胜券,原因就在算力上。 中美 AI 竞争,目前谁更领先? 最近,有网友根据制作了一张图表。 数据显示,中国的 ...
新智元报道 编辑:英智 一位华人博士用 ChatGPT 治好了困扰一年多的头晕,而另一位网友靠 AI 缓解了十年腰痛。求医不如问 ChatGPT?20 美元的订阅费完胜昂贵理疗课!AI 让医疗变得触手可及,省时又省钱。 ChatGPT 居然帮人治好了医生都搞不定的病! 华人博士@Yuchenj_UW ...
文 | 昭暄 经历了 20 年的发展,目前国内的网上零售渗透率大概在1/3 左右。 那么,剩下2/3 的实体零售还会不会进一步线上化,会以什么方式线上化? 这篇文章将以这个问题或视角来切入京东 VS 美团的话题。 或许,这一事物的发展并没有我们想象的那般针锋相对、不留余地。 如果从商品流的角度来看现 ...
作者 | 钟艺璇 编辑 | 乔芊 外卖平台大战还在硝烟四起,但第一批受益者已经出现——库迪加盟商。 早在京东外卖补贴的号角吹响前,平台发券补贴的行为已经默默开始,高频率、低决策成本的茶饮咖啡品类向来是外卖补贴的第一战场,这次轮到了库迪。一位北京库迪加盟商陈星注意到,自己的京东订单在 3 月中旬开始, ...
伴随着 AI 大模型技术的快速发展,智能终端产业也迎来新的革新。从去年开始,手机、PC、电视等多终端开启了新一轮 AI 变革潮,并成为刺激市场迭代更新的新动力。 基于 2024-2025 年中国信息通信研究院的测试,发现各大手机厂商已将 AI 能力深入整合到系统层面,相较 2024 年,终端 AI ...
文 | 定焦 One,作者 | 李唐,编辑 | 魏佳 AI 女友游戏广告,正在悄悄入侵你的朋友圈。 母胎单身二十年的阿宝躺在沙发上刷手机,朋友圈一则游戏广告引起了他的注意。此时的他还不知道,一次出于好奇的点击,不仅让他打开了新世界的大门,还即将令他莫名其妙损失 9.9 元。 虚拟恋人游戏已不是新奇事 ...
2025 年,随着 DeepSeek 风靡全球,中国不断加强 AI 基础研究和产业体系布局。 4 月 27 日晚,央视披露的最新数据显示,截至 2025 年 4 月 9 日,中国 AI 专利申请量达 157.64 万件,占全球申请量的 38.58%,接近 40%,位居全球首位。 同时,中国目前已累计 ...
文 | DataEye 近日,游戏市场又有新的变化,引起了 DataEye 研究院的关注。水墨画风的修真类游戏《掌门下山》自 4 月 17 日上线后,便持续登顶 iOS 游戏免费榜榜。且上线 8 天时间,便拿下超 1700 万元的收入表现。 如果再往前深究,可以发现,今年以来多家厂商都在布局修真/仙 ...
小鹏 AI 人形机器人 IRON 全球首个“人机共跑”马拉松引发讨论之后,北京亦庄开始设立人形机器人相关基金。 4 月 28 日消息,据北京亦庄公众号,近日,北京亦庄投资有限公司、北京亦庄机器人科技产业发展有限公司、北京工业发展投资管理有限公司共同发起设立北京亦庄北工智造股权投资基金合伙企业(有限合 ...
近日,Github 上有一个开源项目,曝出了 FULL v0、Manus、Cursor、Same.dev、Lovable、Devin、Replit Agent、Windsurf Agent 和 VSCode Agent 的完整官方 System Prompt(系统提示词)和内部工具,有超过 6,50 ...
据媒体报道,“AI 大模型六小虎”之一百川智能近期正在发生成立后重大的组织架构变化,而其背后的核心原因是百川业务重心的调整。据多位接近公司的独立信源透露,医疗业务总负责人李施政已经开启离职倒计时,即将完成最后一步离职程序。就此向百川核实,对方予以否认。 有接近百川方面人士表示,“李施政”的后续接任者 ...
近期, Claude Code 迎来一次品牌危机。据报道,部分是 Anthropic 向一位试图对 Claude Code 进行逆向工程的开发者发出了下架通知,而 Claude Code 的使用许可比 Codex CLI 更为严格。 据悉,OpenAI 的 Codex CLI 源代码遵循 Apach ...