Must Read — 通过纯 NumPy 手写实现 Ilya 书单中的 30 篇论文 · AlphaGenome通过U-Net-Transformer架构实现1Mb序列下… · Clawdbot 展示了基于本地 Markdown 的两层持久化记忆系统 (+5 more)
32 articles: 8 must read · 11 worth reading · 13 neutral
Top sources: PaperWeekly (5) · InfoQ (3) · 追问nextquestion (2)
PaperWeekly · AI/Tech · 收藏
通过纯 NumPy 手写实现 Ilya 书单中的 30 篇论文,深度拆解深度学习底层逻辑,拒绝黑盒。
一个GitHub项目仅用NumPy从零复现了Ilya Sutskever推荐的30篇AI核心论文,包括手写反向传播和Attention机制。
PaperAgent · AI/Tech · 收藏
AlphaGenome通过U-Net-Transformer架构实现1Mb序列下采样与多模态联合训练,刷新基因变异预测SOTA。
谷歌DeepMind开发的AlphaGenome模型在《自然》杂志发表,该AI模型能输入长达100万个碱基对的DNA序列,以单碱基分辨率同时预测多种基因调控功能。
PaperAgent · AI/Tech · 收藏
Clawdbot 展示了基于本地 Markdown 的两层持久化记忆系统,区分了上下文与记忆的工程边界。
Clawdbot的持久记忆系统是其核心特色,通过本地Markdown文件实现24/7的上下文保留和无限记忆。
赛博禅心 · AI/Tech · 收藏
从 3D 扫描硬件痛点出发,解析 LingBot-Depth 如何利用 AI 补全思路解决透明/反光物体的深度测量难题。
传统3D扫描设备无法有效捕捉透明和反光物体,而LingBot-Depth项目通过AI补全深度图解决了这一问题。
PaperWeekly · AI/Tech · 收藏
NAIST 团队通过审计 ACL 系列会议论文,揭露了生成式 AI 导致的‘幻觉引用’(HalluCitation)危机,EMNLP 2025 成为重灾区。
一篇名为《HalluCitation Matters》的投稿论文对过去两年ACL系列会议的17,000多篇论文进行学术审计,揪出近300篇包含虚假引用的论文,并在附录中实名列出。
PaperWeekly · AI/Tech · 收藏
通过机制解释学拆解 Qwen 在虚假奖励下的表现,发现 RLVR 实际上激活了模型内部的‘记忆捷径’而非推理能力。
一项研究揭示了虚假的RLVR训练并非真正提升模型推理能力,而是通过激活模型内部的记忆捷径,使其更高效地检索训练集中的污染知识。
Founder Park · AI/Tech · 收藏
Agent 的核心竞争力正转向独立的记忆系统,它是解决上下文冗余与跨域连续性的关键。
文章认为独立的记忆系统(Memory层)正在成为AI Agent的关键基础设施,而不仅仅是依赖长上下文或RAG。
PaperWeekly · AI/Tech · 收藏
深度解析 DeepSeek-OCR-2 弃用 CLIP 转向 LLM 原生编码的底层架构,提出“视觉因果流”新范式。
DeepSeek-OCR-2开源,它摒弃CLIP,直接用LLM作为视觉编码器,并提出“视觉因果流”范式来改善文档解析。
歸藏的AI工具箱 · AI/Tech · 精读
实测 Kimi K2.5 的视频多模态识别与前端动效复刻能力,强调视觉反馈在代码生成中的重要性。
Kimi K2.5模型增强了多模态识别能力,能根据视频参考生成具有iOS级丝滑交互动效的前端代码。
追问nextquestion · AI/Tech · 精读
通过柏格森哲学与神经科学实验,探讨时间感知的非大脑中心性,对比人脑与 AI 的本质区别。
神经科学家大卫·罗比基于哲学思想和动物实验提出,时间感知并非产生于大脑内部,而是源于生物体与环境的互动。
追问nextquestion · AI/Tech · 精读
认知科学家 Joscha Bach 对意识整合信息论(IIT)的深度批判,认为意识是基于模型生成的虚拟叙事,而非纯粹数学公理。
认知科学家约夏·巴赫与物理学家徐道辉讨论了意识的本质,巴赫认为所有意识体验本质上都是虚拟的建构,并批评整合信息理论更像是一个营销工具。
赛博禅心 · AI/Tech · 精读
OpenAI 论文写作工具 Prism 的深度测评,对比了 Overleaf 并警示了数据安全风险。
OpenAI 发布了免费的云端 LaTeX 写作工具 Prism,深度集成 GPT-5.2,旨在辅助科研写作。
新智元 · AI/Tech · 精读
开源项目Clawdbot通过本地Markdown存储机制实现了长时记忆与任务执行,区别于大厂云端方案。
Clawdbot是一个开源的、可在本地运行的AI助手,其核心特点是具备持久的长时记忆系统,并能自主处理现实世界任务。
緑洲资本 Vitalbridge · AI/Tech · 精读
DeepMind 与 Anthropic 掌舵者对 AGI 到来后社会变革的对谈:代码能力将是加速 AGI 循环闭合的核心驱动力。
饭後服用AfterHours · AI/Tech · 精读
Clawdbot 创始人复盘如何利用 AI 编程实现爆发式增长,提出“Vibe-coding”与个人智能体的新趋势。
前 PSPDFKit 创始人 Peter Steinberger 在经历三年倦怠期后,受 Claude Code 启发,仅用 10 天开发出 GitHub 爆款项目 Clawdbot(Moltbot)。
DeepTech深科技 · AI/Tech · 精读
DeepMind开源AlphaGenome模型,通过1Mb长序列输入实现对基因组98%非编码区的功能精准预测。
DeepMind团队开发的AlphaGenome模型旨在解读占人类基因组98%的非编码区,能高效预测遗传变异对基因调控的功能影响。
探索AGI · AI/Tech · 精读
Claude Code 任务系统从线性 Todo 升级为持久化的 DAG 依赖图,解决了长上下文任务中断与多 Agent 协作的底层基建问题。
Claude Code 将原有的 TODO 系统升级为 Tasks 系统,实现了任务持久化、依赖图调度和多 Agent 协作。
一泽Eze · AI/Tech · 精读
详细实测了 Kimi K2.5 的多模态视觉 Coding 能力与 Agent 集群模式,并对国产模型演进给出了清晰判断。
Kimi发布K2.5等多款新品,其中K2.5作为多模态混合推理模型,显著提升了视觉Coding和前端设计能力。
新智元 · AI/Tech · 精读
基于牛津大学研究,反思 2022 年裁员潮的主因是宏观利率而非 AI 替代,纠正了行业认知偏差。
牛津大学研究指出,2022年全球科技大裁员的主要驱动因素是宏观经济周期(如美联储加息),而非AI替代。
数字生命卡兹克 · AI/Tech · 精读
蚂蚁灵波科技开源实时交互世界模型 LingBot-World,标志着从预渲染视频生成向实时演算模拟器的跨越。
蚂蚁集团旗下的灵波科技开源了可实时交互生成的世界模型 LingBot-World,其质量被认为可对标 Google Genie 3。
AGI Hunt · AI/Tech · 精读
Kimi K2.5 通过原生多模态训练实现‘审美涌现’,在视觉编程(Visual Coding)领域挑战 Gemini 3.0 的领先地位。
Kimi 发布的 K2.5 模型在视觉编程能力上取得显著进步,能够根据设计图或操作视频生成具有良好审美的网页代码。
InfoQ · AI/Tech · 精读
AI时代OS的进化正从“以芯片为中心”转向“系统级重构”,国内通过“以软补硬”和开源协同实现突围。
文章探讨了AI时代操作系统的进化方向,指出国内外技术路线存在差异:国外如英伟达进行系统级重构,而国内通过开源社区协同和软硬协同优化进行突围。
晚点LatePost · AI/Tech · 精读
鸣鸣很忙晏周首谈零食零售逻辑:极致效率与最大公约数生意的县城突围。
鸣鸣很忙(由零食很忙和赵一鸣零食合并而成)通过极致性价比和高效率,成长为中国最大的休闲零食零售公司。
探索AGI · AI/Tech · 速览
展示 Kimi K2.5 的 Agent Swarm 场景,通过 50 个分身并行执行任务。
Kimi K2.5的多模态能力和Agent集群(Swarm)功能令人印象深刻,能根据视频复刻网站,并调度大量子智能体协作。
卡尔的AI沃茨 · AI/Tech · 速览
介绍了 Vidu Q2 的多维度参考生视频功能,强调了材质迁移和动作/表情复合迁移的实用性。
Vidu Q2 参考生 Pro 视频模型支持多素材参考,能复刻视频中的特效、材质、动作和情绪,并实现精准的视频编辑。
十字路口Crossing · AI/Tech · 速览
总结了开源项目 Clawdbot 爆火的四个原因,分析了本地 Agent 与主动式 AI 的新范式。
Clawdbot爆火的原因在于其可直接在IM应用中使用、能在电脑本地执行任务、具备长记忆工程能力以及支持主动交互。
InfoQ · AI/Tech · 速览
华为昇腾MindSpeed通过分布式并行技术、算子优化及DeepSeek式的工程创新提升大模型训练效率。
华为昇腾MindSpeed是一个分布式训练加速库,通过在计算、通信和显存等多个维度进行优化,以提升大模型训练效率。
PaperWeekly · AI/Tech · 速览
RebuttalAgent 通过多智能体协作框架,将学术回复转化为以证据为中心的规划任务。
Paper2Rebuttal是一个多智能体框架,能自动为学术论文审稿意见生成有理有据的回复,包括检索文献和核实论据。
InfoQ · AI/Tech · 速览
Hugging Face发布万亿级多语言平行数据集FineTranslations,利用Gemma3翻译技术解决低资源语言翻译难题。
Hugging Face发布了名为FineTranslations的大规模多语言平行文本数据集,包含超过1万亿个Token,覆盖500多种语言。
十字路口Crossing · AI/Tech · 速览
Mureka V8通过引入音乐思维链(CoT)机制,试图解决AI音乐结构松散和情感缺失的问题。
昆仑万维发布的AI音乐模型Mureka V8引入了音乐思维链机制,旨在让AI在生成前先理解歌曲的整体结构,以生成更完整、可用的音乐。
晚点LatePost · AI/Tech · 速览
分析牧原股份在猪周期底部的债务缩表与经营现金流挑战。
牧原股份在猪周期底部赴港上市,其核心挑战在于用波动性的经营现金流应对固定的债务偿还压力。
AGI Hunt · AI/Tech · 速览
AI 领袖观点集锦:从智能体编程到推理成本降低带来的个人软件时代。
这是一系列关于AI行业现状与未来的观点摘要,涉及开发者生产力、AI替代、智能体效果及资源消耗等话题。