ai-daily-feed

AI Daily Harvest — 2026-02-11

Overview

Must Read — 针对 LLM 智能体工具调用安全 · 阿里达摩院发布RynnBrain

14 articles: 2 must read · 4 worth reading · 8 neutral

Top sources: 量子位 (3) · InfoQ (3) · PaperWeekly (2)

86 从“事后检测”到“过程引导”，北大联合上海AI Lab重塑智能体工具调用安全 — PaperWeekly
85 想让机器人春晚包饺子？阿里达摩院：别急，先把「大脑」优化一下 — 机器之心

Must Read

从“事后检测”到“过程引导”，北大联合上海AI Lab重塑智能体工具调用安全 — 86/100

PaperWeekly · AI/Tech · 收藏

针对 LLM 智能体工具调用安全，提出了从末端检测转向过程引导的 ToolSafe 框架。

北京大学与上海AI Lab提出ToolSafe框架，旨在解决智能体在工具调用过程中的步骤级安全问题，将安全防护从‘事后检测’转向‘过程引导’。

首次系统化建模并防护LLM智能体的步骤级工具调用安全风险，特别是针对提示注入攻击。
开源了包含评估基准（TS-Bench）、护栏模型（TS-Guard）和推理流程（TS-Flow）的完整框架。

想让机器人春晚包饺子？阿里达摩院：别急，先把「大脑」优化一下 — 85/100

机器之心 · AI/Tech · 收藏

阿里达摩院发布RynnBrain，通过将时空记忆和物理推理内化至模型底座，解决了具身智能多任务打断与长程规划的难题。

阿里达摩院开源了具身智能模型RynnBrain，通过将时空记忆和物理空间推理直接训练进模型，旨在提升机器人在复杂物理环境中的规划与执行能力。

在16项具身智能基准测试上达到SOTA水平，并开源了包括业界首个MoE具身基础模型在内的7个模型。
模型具备任务中断后恢复、在物理约束下进行长程规划等能力，解决了机器人实际应用中的底层问题。

Worth Reading

霸榜HF第一！UltraData开源2.4T优质数据，含全球最大L3数学库 — 82/100

PaperWeekly · AI/Tech · 精读

提出了从“数据驱动”向“模型-数据协同演进”的 L0-L4 数据分级治理体系。

清华大学、面壁智能等机构联合发布UltraData数据分级治理体系及2.4T开源数据，提出从‘数据驱动学习’向‘数据-模型协同演进’的范式转变。

提出了系统化的L0-L4数据分级治理体系，旨在精细化数据利用以应对高质量公开数据资源逼近枯竭的挑战。
开源了包含全球最大规模L3数学合成数据在内的2.4T Tokens高质量数据及4项数据治理工具。

华为发布业界首个扩散语言模型Agent，部分场景提速8倍！ — 81/100

量子位 · AI/Tech · 精读

华为诺亚方舟等团队通过对比实验证明，扩散大模型（DLLM）作为Agent底座在规划效率和执行速度上显著优于传统自回归模型。

华为等机构的研究表明，在相同条件下，将智能体的生成范式从自回归（AR）换成扩散模型（DLLM），能显著提升其规划效率和执行速度。

在严格对照实验中，DLLM Agent端到端执行速度平均提升30%以上，部分复杂任务效率提升高达8倍。
DLLM展现出更强的规划器能力，能更早收敛到正确轨迹，减少回溯和冗余。

首次！AI智能体破解「纳什均衡」，大模型学会博弈论｜Cell子刊 — 79/100

新智元 · AI/Tech · 精读

多校联合研发PrimeNash框架，利用LLM智能体自动推导博弈论纳什均衡的解析解并生成数学证明。

多所高校联合开发出名为PrimeNash的AI智能体框架，首次能够自动推导纳什均衡的闭式解析解并生成机器可验证证明。

通过模拟人类数学家科研路径的三阶段闭环框架（策略生成、评估、证明），解决了传统算法难以处理的高维、非凸及动态博弈难题。
该系统兼具可扩展性、透明度与数学严谨性，为自动化博弈分析提供了新范式。

前 Codex 大神倒戈实锤！吹爆 Claude Code：编程提速 5 倍，点破 OpenAl 死穴在上下文 — 77/100

InfoQ · AI/Tech · 精读

前 OpenAI 工程师通过实战体验，对比了 Claude Code 与 Codex 在上下文管理上的差异。

前OpenAI Codex核心研发者Calvin French-Owen高度评价Claude Code，认为其有效的上下文拆分能力是提升编程效率的关键。

Calvin French-Owen认为Claude Code通过自动生成探索型子智能体来管理上下文，显著降低了噪音，提升了代码生成质量。
他指出上下文管理是代码智能体的核心挑战，并分享了实用的上下文污染检测方法。

Neutral

人均回避型，遍地煤气灯：毁掉一段关系，只需要一个小红书式心理学热词 — 70/100

追问nextquestion · AI/Tech · 精读

批判了社交媒体时代“治疗术语”的滥用如何破坏真实的人际沟通与心理诊疗。

文章指出，互联网上对‘煤气灯操纵’、‘NPD’等心理学术语的滥用和标签化，正在破坏现实人际关系中的有效沟通。

治疗师发现，来访者频繁误用‘煤气灯效应’、‘自恋狂’等术语来描述日常分歧，导致沟通中断和关系恶化。
这些术语的滥用源于社交媒体上的简化传播，人们倾向于将复杂的行为简单归类，而非进行深入探讨。

马斯克深夜点赞！内容的下一站是：玩！ — 69/100

AGI Hunt · AI/Tech · 速览

探讨 AI 时代“软件即内容”的趋势，认为互动内容将是短视频后的下一个爆发点。

文章探讨了AI时代下一种新的内容形态——互动内容，并以产品Loopit为例，说明AI如何降低互动内容的创作门槛。

提出‘互动内容’可能是继文字、图片、短视频之后的下一个主流内容消费形态，用户体验从‘看’升级为‘玩’。
AI工具如Loopit使得用户通过简单描述即可生成可交互的体验，极大降低了创作门槛。

Vibe Coding 在代码生成与协作中的实践与思考 — 69/100

InfoQ · AI/Tech · 速览

阿里的技术专家分享关于 Vibe Coding 工具的设计原则与行业实践。

阿里巴巴高级技术专家分享Vibe Coding工具在构建过程中遇到的问题、产品设计原则及技术创新实践。

将Vibe Coding工具形态归纳为Native IDE、IDE插件、Web Agent和CLI四类，并分析了各自特点。
提出以用户为中心、强化工具质量、深化场景适配、支持协作与包容不确定性的核心设计原则。

一个大脑搞定所有模态，百度ERNIE 5.0技术报告公布 — 69/100

量子位 · AI/Tech · 速览

百度ERNIE 5.0发布技术报告，揭秘超大规模MoE架构及模态无关的路由调度机制。

百度发布ERNIE 5.0技术报告，其采用超稀疏MoE架构实现万亿参数规模，并通过模态无关的专家路由机制，首次实现了四种模态的原生自回归统一。

采用模态无关的专家路由，所有模态数据在统一参数网络中训练，涌现出专家自发的专业化分工。
首创‘弹性预训练’范式，一次训练可抽取出一整套不同规格的子模型，实现零样本抽取和部署。

硅谷豪赌算力烧到停电，中国团队反向出击！这一刀，直接砍碎Scaling Law — 67/100

新智元 · AI/Tech · 速览

Yuan 3.0 Flash通过RIRM和RAPO算法解决大模型“过度思考”导致的Token浪费问题。

YuanLab.ai团队发布Yuan 3.0 Flash模型，通过RAPO和RIRM算法创新，旨在解决大模型‘过度思考’问题，以更少算力实现更高智能。

40B总参数的MoE模型仅激活约3.7B参数，通过算法抑制无效的‘过度反思’，将推理token消耗降低高达75%。
针对模型在得出正确答案后仍进行无效验证的行业顽疾，提出了系统性的解决方案。

美团面试题：如何设计多轮对话智能客服Agent。评论区吵翻了，但答案可能就一句话。 — 66/100

探索AGI · AI/Tech · 速览

Agent设计的核心在于上下文工程（Context Engineering）而非Prompt，需明确界定AI的权限边界。

文章以美团智能客服面试题为引，指出设计多轮对话Agent的核心在于精细的上下文工程，而非复杂的Prompt设计。

提出AI Agent设计的核心原则：将正确的信息在正确的时机喂给模型，并根据操作敏感性设置不同的自动化等级（全自动、需确认、转人工）。
强调好的Agent需要知道自身边界，在复杂任务中应进行步骤拆解，而非让模型一次性跑完全程。

挑战 Claude Code，9.5 万星！又一款开源 AI 编程神器火了 — 63/100

InfoQ · AI/Tech · 速览

介绍开源 AI 编程工具 OpenCode 的特性与优势。

开源AI编程工具OpenCode正式亮相，以其对75种以上模型的广泛兼容性、隐私优先架构和多平台集成能力吸引开发者。

支持包括Claude、OpenAI、Gemini及各类本地模型在内的75+种模型，并深度整合多种语言服务器协议（LSP）。
采用隐私优先设计，不存储代码或上下文数据，为用户提供高度控制力和可审计性。

1700个OpenClaw技巧，我用多邻国的方式学会的！ — 63/100

量子位 · AI/Tech · 速览

展示如何利用 AI 工具将枯燥的文档转化为多邻国式的互动学习课程。

智谱清言推出‘学习搭子’功能，利用AI将海量知识（如论文、视频、GitHub项目）转化为多邻国式的交互课程，提升学习效率。

能够将上百页的论文、长视频等复杂知识源，自动梳理成结构化的知识图谱和交互式学习卡片。
通过图文并茂的讲解、对照学习、章节测试等功能，实现‘把书读薄、读活、读透’。

This site is open source. Improve this page.