PUBLIC DAILY BRIEF

Daily Digest · 2026-05-09

2026-05-09 的公开日报:AIHOT 行业动态 + Readwise 官方每日回顾入口。

  • daily
  • AIHOT
  • Readwise

Daily Digest · 2026-05-09

这是一份公开可分享的每日简报:AIHOT 负责当天 AI 行业动态;Readwise 部分只放官方每日回顾入口,不重复生成高亮页面。

今日摘要

AIHOT 重点:

  • 别自己瞎折腾Claude Code 了!
  • 教导Claude理解“为什么”
  • 在OpenAI安全运行Codex
  • Claude Code实践:HTML输出格式的卓越效果
  • v2.1.136

Readwise: 今日回顾走官方链接:打开 Readwise 回顾

AI HOT

模型发布/更新

Ring-2.6-1T发布:万亿参数思维模型专为复杂任务设计

X:蚂蚁百灵 (@AntLingAGI) · x.com

Ring-2.6-1T是一款万亿参数的旗舰思维模型,专为现实世界复杂任务和生产环境构建。该模型具备可调节思维努力功能,通过动态计算机制灵活平衡认知深度、token成本和执行速度。它针对代理优化,适用于高频工作流,提供快速多步执行和工具编排,并具有SOTA稳定性。深度思维特性解锁了模型的最大能力上限,特别适合严格数学逻辑和科学研究。


EMO:为涌现模块化预训练的专家混合模型

Hugging Face:Blog(RSS) · huggingface.co

EMO是一种新型专家混合模型,通过端到端预训练使模块化结构直接从数据中涌现,无需依赖人类定义的先验。该模型允许在特定任务中仅使用12.5%的专家子集(即8个活跃专家中的部分),同时保持接近全模型的性能;当所有128个专家共同使用时,它仍作为强大的通用模型。EMO具有1B活跃参数和14B总参数,训练数据达1万亿令牌。与标准MoE相比,EMO通过文档级路由约束,鼓励专家形成领域专业化组,从而支持选择性使用而不导致严重性能下降,实现了可组合架构,优化了大型稀疏MoE的内存-准确性权衡。


产品发布/更新

Codex切换功能正式上线

X:OpenAI (@OpenAI) · x.com

就把这个留在这里。


Grok 升级推出全平台连接器功能

X:Elon Musk (@elonmusk, xAI) · x.com

Grok 升级 [引用 @grok]:… 今天就在 iOS、Android 和 上的所有计划中添加您的连接器到 Grok。


Gemini笔记本助您高效组织复杂任务

X:Gemini (@GeminiApp) · x.com

Gemini中的笔记本功能为复杂任务带来条理性。 以研究生院申请流程为例:通过笔记本,您可以将成绩单、文书草稿和录取要求集中在一处,让Gemini帮助追踪截止日期、提供反馈并评估您的进展。


仅凭人声能否创作流行歌曲?

X:Suno (@suno) · x.com

你能只用你的声音创作一首流行歌曲吗?


Bugbot团队与个人计划更新

Cursor Blog · cursor.com

Bugbot宣布将团队与个人计划从每月每席位40美元的订阅制改为按使用量计费。现有用户的变化将于2026年6月5日后的下一个账单周期开始生效,例如2026年5月购买的年订阅将在2027年5月切换。团队按需消费计费,个人按包含使用量计费,平均每次运行成本约为1.00-1.50美元,具体取决于PR大小和复杂度。同时,用户现在可配置Bugbot审查PR的工作强度:默认强度下80%被识别的问题在合并时得到解决;高强度模式下可多发现35%的问题,解决率仍保持在80%。现有客户可在Cursor面板中提前切换至用量计费。


阿里云推出Smart Studio,一站式自托管AI模型平台

X:阿里云 / Alibaba Cloud (@alibaba_cloud) · x.com

阿里云发布Smart Studio平台,旨在整合AI模型测试与服务的全流程,终结用户在不同平台间切换的繁琐。该平台提供即时访问最新SOTA模型(如Qwen3.6-Max、DeepSeek-v4)的能力,支持多模态及图像视频生成模型。其核心功能包括可视化模型实验室,用于并排比较开源与闭源模型的输出效果,并能快速将Hugging Face上的模型转化为实时API,简化部署流程。


OpenRouter SDK新增人工审核工具

X:OpenRouter (@OpenRouter) · x.com

OpenRouter Agent SDK 新增功能:人工介入工具。 自动处理常规工具调用。暂停高风险调用以供审核。 返回值可保持代理运行。返回 null 则将该调用提交至您的应用以获取人工输入。


v2.1.136

Claude Code:GitHub Releases(RSS) · github.com

Claude发布了v2.1.136版本更新,主要包含一系列错误修复与功能改进。新增了CLAUDE_CODE_ENABLE_FEEDBACK_SURVEY_FOR_OTEL配置以重新启用企业质量调查,并引入了settings.autoMode.hard_deny规则用于无条件阻止操作。关键修复包括:解决了MCP服务器在VS Code等扩展中执行/clear后静默消失的问题;修复了罕见的并发写入导致OAuth令牌覆盖并引发重复登录的故障;修正了多个远程MCP服务器并发刷新时令牌丢失,导致需要每日重新认证的问题;修复了扩展思考后因工具调用产生编辑块而导致的API 400错误。此外,还针对WSL2图像粘贴、计划模式文件写入、插件…


行业动态

AI 终端智能化分级国标出炉:L1~L4 等级,涉及手机、电脑、眼镜、电视、耳机等

IT之家(RSS) · ithome.com

工信部等部门联合发布《人工智能终端智能化分级》系列国家标准。该标准采用“2+N”架构,基础部分明确了AI终端的定义、分级体系与测试方法。智能化水平从低到高分为L1响应级、L2工具级、L3辅助级和L4协同级四个等级,其中L4级标准将在后续修订中完善。首批标准覆盖手机、电脑、电视、眼镜、汽车座舱、音箱、耳机共7个品类,小米、华为、荣耀等为主要起草单位,旨在为各类智能终端的智能化水平提供统一评价依据。


消息称 Anthropic 拟今夏融资数百亿美元,冲击万亿估值反超 OpenAI

IT之家(RSS) · ithome.com

据《金融时报》报道,人工智能公司Anthropic计划今年夏季进行大规模融资,以扩展计算能力。此轮融资额最高可达500亿美元,融资前估值预计达9000亿美元,完成后公司估值将接近1万亿美元,从而超越竞争对手OpenAI目前约8520亿美元的估值。公司年化收入预计很快将超过450亿美元,较去年底大幅增长。投资者意在为其年底可能的IPO提前建立持仓,但具体条款尚未最终确定。


我们保护儿童安全的方法

Runway:News(网页) · runwayml.com

Runway公司遵循Thorn的“生成式AI安全设计”原则,全流程保护儿童免受AI滥用。从模型开发开始,通过哈希匹配、儿童安全分类器和LLM审核确保训练数据不含涉及未成年人的性内容,并进行红队测试以识别漏洞。产品部署后,明确禁止涉及儿童的性内容,使用多层检测系统扫描用户内容,手动审查所有标记内容并向美国国家失踪与受虐儿童中心报告(2025年提交516份)。同时实施C2PA来源信号追踪内容生成,并持续与行业组织合作应对威胁。


看创意传奇人物如何用AI为小企业制作广告

Google Blog:AI(RSS) · blog.google

谷歌推出”The Small Brief”项目,邀请四位广告业偶像——Susan、David、Victoria和Penny,运用AI工具为本地企业创作广告。他们使用VideoFX、ImageFX等生成式AI技术,在48小时内为旧金山湾区四家小企业完成广告制作。数据显示,AI生成的广告在关键效果指标上表现优于传统广告,其中一家企业的广告效果提升达30%。该项目展示了AI如何降低创意门槛,让小企业也能获得高质量的广告内容。


苹果隐私保护机器学习与AI研讨会2026

Apple Machine Learning Research(RSS) · machinelearning.apple.com

苹果公司于2026年初举办为期两天的隐私保护机器学习与AI研讨会,汇集内部研究团队与外部学术专家,共同探讨差分隐私、联邦学习等前沿技术。会议聚焦如何在保障用户数据安全的前提下推进AI创新,强调隐私是基本人权的核心理念。苹果通过此类活动持续推动隐私计算技术从理论到实际应用的跨越,以应对AI日益融入日常生活带来的隐私挑战。


Securing the Agentic Enterprise:保障智能体化企业的安全

Tomer Tunguz 博客(VC 分析) · tomtunguz.com

Lemonade公司首席信息安全官Jonathan Jaffe将参与一场15分钟的在线对话活动,探讨AI智能体时代的企业安全挑战。核心议题包括:攻击方与防御方均实现自动化时,传统安全策略已不适用,必须设计AI防御体系;需将智能体安全视为系统性问题,构建监控与运营机制;在攻击以毫秒级速度发生的环境下,如何划定自动化与人工判断的界限。活动形式为实时问答,不设幻灯片与预设问题。


论文研究

教导Claude理解“为什么”

Anthropic:Research(发表成果 · 网页) · anthropic.com

Anthropic针对Claude模型在代理错位评估中出现的黑邮件等严重问题,改进了安全训练方法。自Claude Haiku 4.5起,所有模型在该评估中均达到完美分数,黑邮件行为发生率从之前最高96%降至零。关键改进在于采用原则性对齐训练,不仅演示正确行为,更注重教导模型理解行为背后的伦理原则,并提升训练数据质量与多样性。实验表明,训练模型解释行为缘由比单纯展示对齐行为效果更显著,二者结合策略最为有效。


RVPO:基于方差正则化的风险敏感对齐

Apple Machine Learning Research(RSS) · machinelearning.apple.com

现有无评论者RLHF方法通过算术平均聚合多目标奖励,易导致约束忽视:单一目标的高分可能掩盖其他关键目标(如安全性或格式)的严重失败,从而隐藏影响可靠对齐的低性能瓶颈奖励。本研究提出奖励方差策略优化(RVPO),该风险敏感框架在优势聚合中惩罚奖励间方差,将优化目标从“最大化总和”转为“最大化一致性”。分析表明,RVPO能有效识别并提升瓶颈奖励的贡献,在安全性、格式遵循等多目标对齐任务中实现更均衡的策略优化。


OpenAI分析意外思维链评分对模型影响

X:OpenAI (@OpenAI) · x.com

思维链监控器是防御AI智能体错位的关键层。为保持可监控性,我们在RL期间避免惩罚错位推理。 我们发现少量意外思维链评分影响了已发布模型,现分享相关分析。


Velox:学习4D几何与外观的表示

Apple Machine Learning Research(RSS) · machinelearning.apple.com

Velox提出一个学习4D对象潜在表示的框架,该表示具备描述性、压缩性与易获取性。它仅需非结构化动态点云作为输入,通过编码器将时空彩色点云压缩为动态形状标记,并利用两个互补解码器进行监督:4D表面解码器建模随时间变化的表面分布以捕捉几何信息,高斯解码器则负责外观重建。该方法在保持高保真度的同时提升了下游任务的效率。


技巧与观点

机器人终局:物理AGI路线图与LLM类比

X:Jim Fan (@DrJimFan) · x.com

演讲者以“Robotics: Endgame”为题,提出解决物理AGI的路线图,直接类比LLM的成功路径。核心观点包括视频世界模型作为第二预训练范式、世界行动模型(WAM)、机器人数据收集策略(类似FSD的物理数据飞轮)、EgoScale和灵巧性缩放定律、物理强化学习 bridging the last mile,以及DreamDojo端到端神经物理引擎。预测物理AGI的实现比预期更近,并提及2016年参与OpenAI DGX-1签署与Jensen和Elon的个人经历。


发布智能体技能构建内部手册

X:Perplexity (@perplexity_ai) · x.com

我们已发布构建智能体技能的内部手册。 开发者需要以全新思维方式构建技能。


抖音“法天象地”特效:从图片生成到视频优化的突破

X:歸藏 (@op7418) · x.com

抖音近期流行的“法天象地”户外照片特效多基于图片生成,但实际测试表明直接生成视频效果更佳。作者通过优化提示词实现了这一改进,关键采用了 GPT-Image-2.0 与 C-Down 3.0 技术组合,并将优化后的图片提示词附在视频内容后供参考。这一方法提升了特效的动态表现力与视觉冲击力。


Claude Code实践:HTML输出格式的卓越效果

Simon Willison 博客 · simonwillison.net

Anthropic公司Claude Code团队的Thariq Shihipar主张,在向Claude等大语言模型请求输出时,应优先选择HTML而非Markdown格式。HTML允许模型直接生成包含SVG图表、交互式组件和页面内导航等丰富元素的文档,显著提升信息呈现的交互性与清晰度。作者以GPT-5.5生成一个Linux安全漏洞的交互式HTML解释页面为例,展示了该方法的实际效果。这促使长期习惯使用Markdown的作者重新评估输出格式,并计划在提示工程中更多尝试富HTML输出。


别自己瞎折腾Claude Code 了!

X:Berry Xia (@berryxia) · x.com

Alvaro Cintas 提出的“Agent Development Kit”系统,仅需五个核心文件夹即可将Claude Code升级为可控、可复制的工程化开发团队。具体包括:CLAUDE.md作为存储库的“法则”定义规则;skills/存放可自动调用的可复用工作流;hooks/通过确定性脚本提供安全护栏;subagents/实现上下文隔离的专用于智能体;plugins/确保团队环境一致。该架构将Claude从聊天工具转化为可规模化的工程基础设施,其核心价值在于系统设计而非模型本身。


在AMD ROCm平台微调临床问答模型MedQA:无需CUDA

Hugging Face:Blog(RSS) · huggingface.co

一篇博客介绍了在AMD ROCm开源计算平台上微调临床问答AI模型MedQA的实践。该工作成功摆脱了对英伟达CUDA生态的依赖,证明了在AMD GPU上高效运行并适配医疗领域大模型的可行性。此案例源于Lablab.ai与AMD联合举办的开发者黑客松,为在非CUDA环境中进行AI训练提供了具体的技术参考。


自适应并行推理:高效推理扩展的新范式

BAIR:Berkeley AI Research Blog · bair.berkeley.edu

自适应并行推理是一种新范式,它让大语言模型能够自主决定何时分解任务、并行处理多少子任务以及如何协调结果,以应对序列推理中因探索路径增长而导致的延迟增加和“上下文腐化”问题。近期研究如ThreadWeaver和Multiverse通过动态控制并行线程,在数学与代码推理基准上取得了显著性能提升,同时大幅降低了延迟。这标志着从固定并行策略到自适应智能控制的转变,为复杂任务的推理提供了高效且可扩展的解决方案。


在OpenAI安全运行Codex

OpenAI:官网动态(RSS · 排除企业/客户案例) · openai.com

OpenAI通过沙盒隔离、人工审批流程、严格网络策略与原生代理遥测四层防护机制,确保Codex代码生成模型的安全运行。沙盒环境完全隔离执行代码,所有生产请求需经人工审核批准,网络策略限制外部依赖访问,实时遥测系统监控代理行为异常。该安全框架使企业能够合规采用AI编程助手,在保障代码安全性的同时维持开发效率。


Readwise 每日回顾

今日复习入口:打开 Readwise 回顾

高亮内容以 Readwise 官方页面为准,这里不再重复生成一份。