ai-daily-feed

AI Daily Harvest — 2026-02-06

Overview

Must Read — TTT-Discover 范式将测试集转化为训练场

9 articles: 1 must read · 4 worth reading · 4 neutral

Top sources: PaperAgent (1) · PaperWeekly (1) · Z Potentials (1)

93 测试时也能RL，英伟达等提出全新范式：TTT-Discover — PaperAgent

Must Read

测试时也能RL，英伟达等提出全新范式：TTT-Discover — 93/100

PaperAgent · AI/Tech · 收藏

TTT-Discover 范式将测试集转化为训练场，通过 Entropic RL 在测试时微调模型以刷新 SOTA。

斯坦福、英伟达等机构提出并开源了名为TTT-Discover的新范式，它在测试阶段使用强化学习微调模型，旨在针对单个测试问题刷出最高分。

该方法将单个测试问题形式化为马尔可夫决策过程，通过强化学习在测试时训练，目标明确为发现新的最佳结果。
实验表明，该方法在数学、GPU内核、算法竞赛和生物学等多个领域的基准测试中，以较低成本（数百美元）刷新了多项SOTA记录。

Worth Reading

学术特供版Nano Banana来了！Google亲自下场，直接对齐NeurIPS审美 — 83/100

PaperWeekly · AI/Tech · 精读

Google 与北大发布 PaperBanana，利用多智能体框架解决学术绘图中的空间逻辑与审美对齐问题。

Google与北大团队发布了PaperBanana，一个基于Nano Banana Pro构建的智能体框架，旨在自动生成符合NeurIPS审美的学术插图。

框架包含五个分工明确的智能体（检索、规划、审美、绘图、审查），协同工作以解决学术绘图中的空间逻辑和风格一致性问题。
通过分析NeurIPS论文样本总结出内置的审美标准（如配色、背景、字体），并采用混合渲染策略（AI生成架构图，代码生成统计图）确保精准性。

深度｜MongoDB CEO：平台化才是企业软件唯一的护城河，单点工具必将被AI颠覆 — 81/100

Z Potentials · AI/Tech · 精读

MongoDB CEO 论证在 AI 时代，软件的防御性来源于平台化深度集成而非单一功能产品。

MongoDB CEO CJ Desai认为，在AI时代，企业软件的真正护城河在于平台化，而非单点工具，后者极易被颠覆。

平台因其对客户决策的重要性而具有黏性，而单点产品容易被替换。
企业必须在技术范式转移时保持最快的构建和转型速度，持续领先，否则将面临关于未来的质疑。

实测Lovart新上的设计Skills，我第一次见Agent那么主动的 — 78/100

卡尔的AI沃茨 · AI/Tech · 精读

实测 Lovart 新推出的设计 Skills，展示 Agent 在品牌系统构建中的主动性与逻辑性。

作者实测了Lovart新上线的设计Skills功能，发现它能引导AI像项目经理一样主动、有逻辑地协作，完成从Logo到完整品牌系统的设计。

Skills是一套封装好的专家逻辑，覆盖品牌从零到一的全过程（Logo、品牌系统、社媒内容等），并能根据用户提供的素材灵活调整工作流。
在品牌设计过程中，AI能主动分析Logo风格并生成完整的品牌方案，包括周边产品和品牌识别系统手册，甚至提供设计理念阐述。

我把一个离职同事的烂摊子，交给了国产 Agent — 75/100

十字路口Crossing · AI/Tech · 精读

实测天工 Skywork 桌面版 Agent 在处理杂乱本地项目文件中的自动化分类与整合能力。

作者测试了昆仑天工Skywork桌面版Agent，模拟接手一个混乱的遗留项目，展示了其文件整理、内容识别与数据整合能力。

Agent能扫描指定文件夹，自动识别并分类混合的文件类型（如图片、文档），按内容重新整理目录结构。
它能根据主题（如人力资源、成本核算）筛选并合并多个Excel表格，生成一份汇总表，提升信息处理效率。

Neutral

最适合非编程人士的Openclaw部署方式。 — 73/100

新西楼 · AI/Tech · 精读

针对非编程人士部署 Openclaw 的避坑指南与最优路径建议。

作者分享了针对非编程人士部署Openclaw的经验，建议优先使用Docker并由Claude Code辅助部署，而非直接使用云服务器。

对于非技术人员，云服务器部署在修改模型参数时容易遇到复杂报错，形成障碍。
利用Claude Code等AI编程工具可以自动化完成Docker部署流程，实现零成本、低门槛的本地部署。

Clawdbot 教程 02：如何集成飞书，完全国产化！ — 73/100

歸藏的AI工具箱 · AI/Tech · 精读

Clawdbot 集成飞书机器人的详细避坑教程。

文章提供了将Clawdbot集成到飞书的详细教程，旨在实现完全国产化的AI应用流程。

教程详细说明了在飞书开发者后台创建机器人、配置权限，以及在Clawdbot本地配置飞书Channel的具体步骤。
指出了集成过程中可能遇到的坑，如插件安装失败和依赖缺失问题，并给出了解决方案。

Cursor 浏览器翻车后，这个团队做出AI规模化高可靠软件工厂 — 69/100

InfoQ · AI/Tech · 速览

对比 Cursor 的失败，介绍 MoonBit 团队通过‘AI 软件工厂’路径在 10 天内合成 C 编译器的案例。

在Cursor的AI生成浏览器项目失败后，MoonBit团队展示了其“AI软件工厂”如何以可重复、可验证的流程，在10天内生成一个商业级C编译器。

MoonBit的“AI软件工厂”强调的并非一次性代码生成，而是一条可自举、可回归、可持续优化的工程化生产路径。
与Cursor尝试的失败案例对比，该团队的成功得益于对编程语言的掌控力、AI原生工具链和测试能力的综合运用。

AI时代，科学进入乱纪元 — 67/100

追问nextquestion · AI/Tech · 速览

文章探讨了 AI 在科学发现中的局限性，强调科学是基于人类共识的文化体系而非纯粹的自动化方法论。

文章探讨了AI能否取代科学家的问题，认为科学本质上是建立在共识基础上的文化体系，超越了纯粹的方法论自动化。

以AlphaFold为例，指出AI虽能大规模解决特定问题（如预测蛋白质结构），但无法解释其物理机制或处理训练数据之外的情况。
科学知识的生成不仅关乎规模和方法，更涉及人类共识的构建，这是当前AI难以完全复现的。

This site is open source. Improve this page.