Must Read — Self-Distillation 范式通过推理时的额外上下文(On-Polic… · 实验证明:AI Agent 提升编程能力的关键不在于 Skill 的堆砌
14 articles: 2 must read · 4 worth reading · 8 neutral
Top sources: InfoQ (3) · PaperWeekly (2) · DeepTech深科技 (2)
PaperWeekly · AI/Tech · 收藏
Self-Distillation 范式通过推理时的额外上下文(On-Policy)构建 Teacher 信号,将推理计算转化为模型进化动力。
MIT、ETH Zurich和UCLA等团队近期提出的Self-Distillation新范式,利用推理时的上下文构建更强的‘自我’作为Teacher,指导模型训练,将推理计算转化为训练信号。
刘小排r · AI/Tech · 收藏
实验证明:AI Agent 提升编程能力的关键不在于 Skill 的堆砌,而在于显式声明规则(如 AGENTS.md)。
Vercel的实验表明,仅为AI编程助手安装大量Skills(技能)并不能自动提升其编程能力,关键在于如何显式地引导AI调用这些技能。
InfoQ · AI/Tech · 精读
Cloudflare 提出“Fail Small”韧性计划,通过分阶段验证、自动回滚和故障模式审查解决配置全球扩散引发的中断。
Cloudflare在经历两次重大全球性网络中断后,推出了名为‘Code Orange: Fail Small’的韧性计划,旨在通过受控发布和改进故障处理来防止大规模服务中断。
DeepTech深科技 · AI/Tech · 精读
通过 200 纳米超滑涂层与脉冲加热技术,浙大团队破解了相变储热材料“储热密度”与“功率”的长期矛盾。
浙江大学团队通过在储热容器内壁涂覆200纳米厚的超滑涂层,结合脉冲加热,将相变热池的功率密度提升了十倍以上,解决了储热密度与充放热速度难以兼得的矛盾。
PaperWeekly · AI/Tech · 精读
FaithLens 通过强化学习“解释质量奖励”机制,实现了高性能且可解释的 RAG 幻觉检测。
清华大学等机构发布的FaithLens是一个高效且可解释的大模型幻觉检测模型,其8B参数版本在多个基准任务上超越了GPT-4o等超大模型,并能生成检测理由。
十字路口Crossing · AI/Tech · 精读
从导演视角重新定义 AI 视频工具:核心在于“寻找秩序”和“上帝之手”的逻辑,而非单纯的像素生成。
ChatCut创始人李凯文认为,AI视频剪辑的未来不在于生成像素,而在于服务‘还不是剪辑师’的用户,让AI成为工作在传统编辑器之上的智能助理。
InfoQ · AI/Tech · 精读
Linux 社区正式确立项目连续性计划,通过流程机制而非指定继承人来降低“Linus 依赖”风险。
Linux内核社区正式起草了一份项目连续性计划,为Linus Torvalds可能的离职或意外情况制定了接班人选拔流程,但未指定具体人选。
晚点LatePost · AI/Tech · 精读
内容电商正在重塑跨境生意,将隐性痛点转化为显性决策,缩短认知路径并赋予工厂品牌化机会。
内容电商(如TikTok Shop)正在重塑跨境生意,通过短视频和直播将隐性消费需求转化为显性购买,帮助中国出海品牌突破认知壁垒并建立品牌心智。
DeepTech深科技 · AI/Tech · 精读
特斯拉停产 Model S/X 标志着其从高端车企向 AI 与机器人公司的彻底战略重心转移。
特斯拉宣布将于2026年下半年逐步停产Model S和Model X,并将相关产线改建用于生产Optimus人形机器人,标志着公司向自动驾驶和AI机器人核心的战略转型。
AGI Hunt · AI/Tech · 精读
14 条关于 AI 演进、认知负荷、数据效率及行业竞争的高密度观点合辑。
这是一系列来自不同专家的AI领域观点摘要,涵盖了技术增长模式、AI使用伦理、开源竞争、数据效率、投资风险、认知本质等多个维度。
歸藏的AI工具箱 · AI/Tech · 速览
谷歌 Genie 3 开放测试,通过模拟恐龙、猫等角色展示了极强的实时交互性与物理规律模拟能力。
作者体验了谷歌最新开放测试的Genie 3世界模型,认为其在生成可交互、高一致性视频方面表现惊人,预示着AI互动游戏和视频的大年到来。
Z Potentials · AI/Tech · 速览
初创公司 Arcee AI 证明了通过高效资金利用(2000万美元)也能训练出 400B 规模的开源大模型 Trinity。
初创公司Arcee AI以2000万美元成本和六个月时间,训练并发布了4000亿参数的开源大模型Trinity,宣称其性能可比肩Meta的Llama 4等前沿模型。
Z Potentials · AI/Tech · 速览
00后极客时沐朗利用视觉方案和模块化设计,打造介于骑行与装载之间的下一代出行工具 Kago。
00后创业者时沐朗创立的朗极智能推出了一款名为Kago的‘可骑行的皮卡’,这是一种融合了骑行、载物和辅助驾驶功能的新形态出行工具。
InfoQ · AI/Tech · 速览
KernelCAT 试图通过 AI Agent 自动化开发高性能算子,以解决国产芯片对 CUDA 的依赖和适配难题。
KernelCAT是一款旨在为国产芯片开发高性能算子的AI Agent,它试图通过AI自动化来破解国产AI生态因缺乏CUDA等效软件而面临的‘地狱级’开发难题。