09-02日报|AI告别“蛮力”时代?“智体”正重塑万亿数字帝国与认知入口
今天是2025年09月02日。硅谷上空,弥漫着一股前所未有的躁动与深刻的反思。AI的进化之轮正从“蛮力扩展”的线性竞赛,急转弯驶入“智慧策略”的非凡征途。那些曾被奉为圭臬的“越大越好”、“投入越多越强”的信条,正被高效算法、智能交互和主动式代理的崛起无情颠覆。我们看到的,不只是技术迭代,更是一场关于“智能”本质、商业模式重构乃至人类认知入口的深层革命。AI不再满足于被动响应,它正以“智体”之姿,主动提问、聪明思考、深度感知,以前所未有的速度重塑我们的数字世界。
今日速览
- “聪明思考”颠覆“蛮力竞赛”:微软rStar2-Agent以小模型逆袭巨头,苹果BED-LLM以高效提问取代微调,共同宣告AI发展重心正从单纯堆砌规模转向精巧的算法和智能的交互策略。
- AI Agent成为新战场核心:从主动规划、工具使用到自我验证,AI Agent正在成为解决复杂任务的核心范式,预示着AI将从被动工具升级为主动智能体,深刻改变人机协作模式。
- 互联网认知入口被重构:谷歌Gemini的URL Context让AI深度“看见”互联网,Perplexity对Chrome的“收购要约”则直指浏览器将从信息门户升级为AI的“认知操作系统”,彻底颠覆现有搜索及广告商业模式。
- “扩展定律”历史深思与未来边界:曾经驱动大模型狂飙突进的“扩展定律”,其历史根源被重新审视,我们被迫思考其物理及理论瓶颈,以及未来AI发展的效率与可持续性。
苹果BED-LLM:无需微调的提问革命,AI从被动知识库到主动智能探寻者
【AI内参·锐评】
Apple再次用“巧劲”证明,AI的真正智能在于“提出完美的问题”,而非单纯的知识堆砌;BED-LLM并非技术的小修小补,而是直接触及了AI认知进化的核心,预示着一个由“提问者AI”主导的新时代。
【事实速览】
苹果联合牛津、香港城市大学提出BED-LLM,通过序贯贝叶斯实验设计,使大语言模型无需微调或重训,提问效率暴增6.5倍,成功率从14%提升至91%。该研究旨在解决LLM在多轮交互中的“遗忘症”,通过计算预期信息增益(EIG)选择最优问题,并采用“先采样后过滤”确保逻辑自洽,以及条件生成策略引导提问,将AI从被动知识库转变为主动、高效、逻辑自洽的信息收集者。
【背景与动机】
在OpenAI、Google等巨头深陷“大模型军备竞赛”泥沼之际,苹果选择在交互层面进行“四两拨千斤”式的创新,这并非偶然。它完美契合了苹果以用户体验为核心的产品哲学,并巧妙规避了重度模型训练的巨额算力竞争。更深层地看,BED-LLM为苹果的端侧AI战略铺平了道路——在资源受限的设备上,通过算法和交互优化,而非堆砌模型参数,实现AI能力的跃升。这对于未来的iPhone、Vision Pro等产品,提供更智能、更高效、更私人化的交互式AI体验,意义非凡。
【开发者必读】
BED-LLM的“无需微调、无需重训”特性,无疑是为开发者送上了一份“降本增效”的大礼。这意味着,过去需要耗费巨大人力、物力和时间才能实现的特定任务优化,如今只需通过巧妙的问题设计和交互逻辑即可达成。对于预算有限的初创公司或寻求快速迭代的企业级应用开发者而言,BED-LLM极大地降低了LLM在下游应用的部署门槛和运行成本。你不再需要成为“模型训练专家”,而是可以聚焦于如何设计更智能的交互流程,让AI通过提问来高效解决用户问题,从而加速创新产品的商业化落地。
【我们在想】
当AI学会了提出“完美的问题”,它会用这些问题来探寻什么?这种主动的提问能力,最终会把人机协作推向何种边界,甚至,在何种程度上挑战人类的“智慧垄断”?
【信息来源】
- 来源: Arxiv
- 链接: https://arxiv.org/abs/2508.21184
微软rStar2-Agent:小模型逆袭巨头,引领AI“聪明思考”新范式
【AI内参·锐评】
微软rStar2-Agent用“聪明思考”的14B,对“大力出奇迹”的671B巨头打出降维打击,宣告AI“蛮力时代”的终结,未来AI的竞争力将不再是参数规模,而是极致的效率与策略智慧。
【事实速览】
微软研究院发布的rStar2-Agent,通过主动式强化学习,使一个仅有14B参数的模型在复杂数学推理上超越了671B的DeepSeek-R1及Claude Opus 4.0等巨头。其创新点在于:构建了高吞吐量的代码执行环境以支持大规模Agentic强化学习;提出了基于正确重采样的组相对策略优化(GRPO-RoC),避免传统奖励缺陷,强化高质量轨迹学习;并采用优化的多阶段训练方案,以最少计算量达到前沿性能,仅用64块MI300X GPU在一周内完成训练。
【弦外之音】
rStar2-Agent的横空出世,无疑是对整个AI行业“大模型迷思”的当头棒喝。它明确传递了一个信号:堆砌参数的边际效益正在递减,而精妙的算法和架构创新正迎来春天。微软此举,不仅挑战了OpenAI等在大模型规模上的领先地位,更将AI竞争的焦点从“谁有更多GPU”转向“谁能让AI更聪明地学习和思考”。这预示着,未来AI领域的竞争将是一场算力效率、算法创新和生态整合的全面较量,而不再是单纯的资源消耗战。
【投资者必读】
对于投资者而言,rStar2-Agent的出现提供了重新评估AI赛道投资策略的契机。它意味着:
- “性价比”AI模型的崛起:高昂的算力成本不再是唯一的壁垒,拥有高效算法和Agentic RL能力的团队,能以更低的成本产出顶尖性能,这为中小型AI公司带来了“弯道超车”的机会。
- AI Agent商业化加速:能够自主规划、执行和反思的Agent,将极大地拓展AI的应用边界和商业价值,例如定制化智能助理、自动化问题解决平台等。投资应更关注具备Agent核心技术和实际应用场景落地的公司。
- 计算基础设施的变革:对高吞吐量、高并发、低延迟的AI训练和部署环境的需求将持续增长,相关基础设施服务商和芯片设计公司将迎来新的增长点。
【我们在想】
当一个14B的“小模型”都能通过“聪明思考”超越“大模型”的蛮力,那么,未来AI能力的真正上限,是否取决于我们对其学习和推理机制的深度理解,而非仅仅是资源的无限投入?这是否意味着AGI的路径,可能比我们想象的更“巧”而非更“大”?
【信息来源】
- 来源: 机器之心
- 链接: https://www.36kr.com/p/3449262839846272
Gemini URL Context:AI“看见”互联网的范式跃迁与RAG生态重塑
【AI内参·锐评】
谷歌Gemini的URL Context,是AI“眼睛”的一次决定性升级,宣告传统RAG的“手动挡”时代落幕,开启“自动驾驶”的互联网认知新纪元。这不只是一个功能,更是基础模型能力内化趋势的里程碑。
【事实速览】
Google Gemini API的URL Context功能已全面上线,它允许Gemini模型直接深度解析URL指向的全部内容,包括PDF、图片中的图表、HTML、JSON、CSV等多种格式,单个URL内容上限达34MB,单次请求可支持20个URL。该功能将传统RAG中复杂的数据提取、分块、矢量化等中间环节大量内置到模型服务层,极大地简化了开发者获取和理解公共网络数据的流程,通过两步检索(缓存优先)机制,显著提升效率。
【背景与动机】
作为互联网搜索的绝对霸主,Google比任何人都清楚信息获取与理解对AI能力的重要性。推出URL Context功能,是Google在AI时代重塑其核心竞争力的战略举措。它不仅利用了其在网页抓取、索引和解析上的深厚积累,更进一步将这些能力与Gemini的基础模型深度融合,旨在将其大模型打造成一个能“看懂”整个互联网的超级智能体。这既是对开放网络信息价值的再挖掘,也是对抗第三方RAG工具兴起、巩固自身AI基础设施领导地位的防御与进攻。
【产品经理必读】
对于产品经理而言,URL Context功能简直是梦寐以求的“效率神器”。它将产品开发从繁琐的底层数据工程中解放出来,让你能更专注于上层业务逻辑和用户价值创新。设想一下,你无需再为如何高效抓取网页、解析PDF、理解图片图表而头疼,只需提供URL,Gemini就能直接理解其内涵。这意味着你可以更快速地开发出:
- 智能研究分析工具:比如快速总结竞品财报、市场报告、行业新闻。
- 动态内容生成器:根据实时网页内容自动生成博客、摘要或社交媒体文案。
- 增强型客服:客服机器人能够直接理解用户提供的产品手册链接,给出精准解答。
所有这些,都将大幅缩短开发周期,降低维护成本,让你能以更小的团队实现更强大的产品功能。
【我们在想】
当AI可以“看见”并深度理解互联网的一切,我们如何确保其理解是无偏见的、公正的?这种能力是否会进一步加剧信息茧房,甚至被用于大规模的信息操纵?以及,在这样的“自动驾驶”时代,人类作为信息的生产者和消费者,又该如何自处?
【信息来源】
- 来源: 36氪
- 链接: https://www.36kr.com/p/3449262839846272
回溯深度学习的“第一性原理”:Scaling Laws的历史轨迹、商业密码与哲学深思
【AI内参·锐评】
“扩展定律”并非今日天启,而是先驱者的远见与时代的错位。今天的AI界,正站在历史的循环高点,再次审视智能的“第一性原理”,但我们必须警惕:一味追求规模的“蛮力”终有尽头,真正的突破往往藏匿于对效率的极致雕琢。
【事实速览】
深度学习的“扩展定律”(Scaling Laws)被OpenAI总裁Greg Brockman誉为深度学习的根本,但其起源可追溯至1993年贝尔实验室的NeurIPS论文,甚至更早期的Frank Rosenblatt(1958)、Vladimir Vapnik(60年代)和甘利俊一(1992)等先驱在心理学和统计学习理论中的研究。该定律量化地揭示了模型性能与算力、数据、参数量之间的幂律关系,成为指导大模型构建的核心经验法则。
【弦外之音】
Greg Brockman对1993年论文的认可,并非简单地“正名”,更是对现代AI社区“集体失忆症”的一次警醒。在当今追逐最新SOTA、发布即迭代的浮躁氛围中,我们往往忽视了科学发展的累积性与循环性。许多“新”发现,其实是旧思想在技术成熟、算力充裕、数据爆炸的新条件下被重新激活。这不仅提醒我们重视历史,更呼唤对基础理论的深耕。同时,扩展定律的有效性也意味着,若无颠覆性算法创新,资源(算力、数据)的绝对优势将长期成为行业壁垒和寡头竞争的筹码。
【投资者必读】
扩展定律是当前AI领域巨额投资背后的核心逻辑支撑。理解它,投资者才能更清晰地看到:
- 为何巨头不惜血本:大规模投入算力、数据和人才,是因为性能增长的确定性。这为顶级AI公司的护城河提供了坚实基础。
- 边际效益的风险:定律虽然有效,但其是否存在“收益递减”的临界点?当规模达到某个极限,纯粹的堆砌能否持续带来突破?这要求投资者关注那些在效率优化、小模型高性能、跨模态融合等方向上有创新突破的公司,而非仅看模型参数规模。
- 新商业模式的涌现:扩展定律催生了“模型即服务”(MaaS)模式,但随着“聪明思考”的崛起,未来的商业价值可能更多地体现在智能体、特定领域专家模型和高效应用解决方案上,而非通用大模型的简单输出。
【我们在想】
如果扩展定律是深度学习的“第一性原理”,那么它的物理边界和理论上限在哪里?当无限的算力与数据投入最终无法带来等比例的智能提升时,人类又将如何定义和追寻下一个“第一性原理”,以解锁通往AGI的真正密码?
【信息来源】
AI浏览器之战:从数字入口到认知操作系统的范式重构
【AI内参·锐评】
Perplexity对Chrome的“挑衅式收购”,并非天方夜谭,而是AI巨变下对谷歌万亿搜索广告帝国的宣战:浏览器不再是入口,而是AI的“认知操作系统”,一场席卷整个互联网底层的革命已然打响。
【事实速览】
AI搜索独角兽Perplexity计划以345亿美元收购Google Chrome,旨在加速AI对浏览器的重塑。AI浏览器如Perplexity Comet和Norton Neo,正从被动的信息门户转变为具备“观察与行动通用能力”的主动式“认知操作系统”,能够实现搜索、总结、预定、邮件编写,甚至自动填写表单等复杂工作流。谷歌因其每年4000亿美元收入中大部分来源于搜索广告,面临“创新者的窘境”,难以进行颠覆性变革。这场变革预示着AI Agent将成为执行搜索和信息发现的主流,颠覆传统搜索广告模式,并为初创企业带来基于Chromium开源基础的创新机遇。
【背景与动机】
这场“浏览器之战”的深层背景,是Google核心商业模式与AI前沿趋势的剧烈冲突。Google的万亿营收,特别是搜索广告收入,严重依赖于用户“点击链接”的传统搜索行为。然而,AI Agent的崛起,意味着用户将直接与智能体对话,获取定制化、整合后的答案,而非通过一系列蓝色链接进行筛选。这直接威胁到Google的命脉。Perplexity的收购要约,恰恰是精准打击了Google这一“阿喀琉斯之踵”,迫使其在维持现有商业帝国与拥抱未来AI范式之间做出痛苦抉择。
【普通用户必读】
亲爱的用户,你与互联网的交互方式将发生颠覆性变化。你的浏览器不再只是一个“窗口”,而是一个专属的“智能管家”。未来:
- 告别“搜索框”与“蓝色链接”:你将直接与AI对话,它能帮你完成复杂的调研、比价、规划,甚至帮你预订、填写表格。
- 更个性化、主动的服务:浏览器将记住你的偏好、上下文,主动提供信息、总结内容,成为你的“超级助手”。
- 重新审视隐私与信任:当AI深入掌控你的数字行为,数据隐私和AI的决策可控性将成为你必须关注的核心问题。你是否信任这个“管家”?它是否会为了商业利益而操纵信息?你对个人数据的主权将面临新的挑战。你需要开始思考,如何在这场变革中保护自己的数字权益。
【我们在想】
当浏览器最终演变为一个主动的“AI操作系统”,它将如何重新定义我们与数字信息的边界?我们是获得了前所未有的自由,还是在不知不觉中,将自我认知与决策权拱手让给了一个无处不在的“数字大脑”?
【信息来源】
- 来源: 36氪
- 链接: https://www.36kr.com/p/3449262839846272
【结语】
今天,我们看到了AI领域一场深刻的“范式迁徙”:从依赖规模的“蛮力扩展”走向依赖智慧的“精巧设计”。无论是苹果BED-LLM对“提问艺术”的重塑,微软rStar2-Agent对“聪明思考”的极致追求,还是谷歌Gemini URL Context对互联网“认知”的深化,乃至AI浏览器对传统数字入口的颠覆,都指向一个核心——AI正从被动工具演变为具备自主性、能动性和深度理解力的“智体”。这场变革不仅触动了技术底层,更深刻冲击了既有的商业巨头、重塑了产业格局,并引发了我们对智能本质、人机关系和未来社会图景的深层哲学反思。AI的未来,不在于它能跑多快,而在于它能想多深,做得多巧。 这不是终点,而是AI真正觉醒的开始。
Upvoted! Thank you for supporting witness @jswit.