今天的高信号集中在 coding agent:IDE 厂商开始用真实工程任务选择默认 agent,GitHub 推出 agent 资源发现,JetBrains 把 profiler 这类运行时证据接给 agent。
AI日报 — 2026-06-29
digest.json
今日摘要
2 items模型新闻本身较弱,更多增量来自 agent 运行环境、工具检索、上下文治理和成本效率。
🔥 最高优先级
3 items[JetBrains AI Blog] JetBrains AI 把 Codex 设为默认推荐 agent:IDE 入口从聊天模式转向任务代理
层级
工作流/范式层
今日新增
JetBrains 公布了对 JVM、.NET、Python 真实开发任务的 agent 评估方法,并把 Codex 设为 AI Chat 当前默认推荐 agent;用户仍可切换 Junie、Claude Agent 或 ACP 兼容 agent。
判断
这件事真正说明的是,主流 IDE 不再把 AI 的默认入口设计成“先聊天再选工具”,而是在起点就推荐能接手任务的 agent。它是产品默认值变化,也是开发者工作流预期变化。
对比
以前 IDE AI 更像一个可选聊天助手;现在默认路径变成“给任务、让 agent 做、必要时换 agent”。
影响
短期会让更多 JetBrains 用户直接进入 agent 工作流。中期看,IDE 竞争会转向 agent 评测、默认路由、权限边界和跨模型可替换性,而不只是补全质量。
[GitHub Blog] GitHub Copilot Agent Finder 上线:agent 开始按任务动态发现 MCP、skills 和工具
层级
Agent层
今日新增
GitHub 发布 Agent Finder,Copilot 可按自然语言任务检索可用的 MCP server、skills、canvas、agent 和工具;它实现开放的 Agentic Resource Discovery(ARD)规范,并支持企业私有 registry 与托管设置。
判断
这件事真正说明的是,agent 的能力边界正在从“上下文里预塞所有工具”转向“按任务检索可用能力”。这比又增加一个插件目录更重要,因为它把资源发现、权限和上下文预算放到同一个机制里。
对比
以前团队需要手工给 agent 配工具,容易占满上下文且难治理;现在 agent 可以从受控 registry 里按需发现,并只加载当前任务需要的能力。
影响
短期会影响企业 Copilot 管理员和平台团队:他们要维护可发现资源目录。中期会推动 MCP、skills、内部 agent 和工具权限进入统一治理层。
[JetBrains AI Blog] JetBrains Rider 给 agent 接入 dotTrace:性能诊断从代码猜测转向运行时证据
层级
Agent层
今日新增
JetBrains 介绍 Rider 中的 dotTrace-backed profiling skill:agent 可以读取 profiler snapshot,定位 UI freeze 等性能瓶颈,而不是只扫描代码做推测。
判断
这件事真正说明的是,coding agent 的质量越来越取决于能否拿到正确工具证据。性能问题尤其典型:没有运行时 profile,模型很容易给出看似合理但不是真瓶颈的解释。
对比
以前 agent 主要靠代码搜索和静态推理判断性能问题;现在可以直接把 profiler 输出作为诊断输入。
影响
短期 .NET/Rider 团队会更容易把 agent 用在真实调优和 bug 诊断上。中期看,IDE-native debugger、profiler、test runner、日志和 tracing 会成为 coding agent 的关键工具集。
📚 重要动态
5 items[JetBrains AI Blog] Junie coding agent GA:JetBrains 把计划、调试、PR review 和远程监督收进稳定产品线
层级
工作流/范式层
今日新增
Junie 离开 beta,强调 Plan mode、真实 debugger、带项目上下文的 PR review、长任务与远程控制,并提到近期 SWE-Rebench 表现。
判断
这件事真正说明的是,JetBrains 正把 coding agent 从实验功能变成日常 IDE 工作台的一部分。信号强于普通发布,但 benchmark 与厂商叙事仍需真实团队复现。
对比
相比独立 CLI agent,Junie 的优势是贴近 IDE 工具链;弱点是能力边界更依赖 JetBrains 生态。
影响
JetBrains 用户会先受影响:更多代码修改、调试和 review 任务会被放进后台 agent session。
[GitHub Blog] GitHub 公开 Copilot agentic harness 评估:效率与任务解决率成为 coding agent 主指标
层级
Agent层
今日新增
GitHub 介绍 Copilot agentic harness 在多模型、多任务上的性能与 token 效率评估,并强调通过上下文、工具和模型路由优化来提升结果。
判断
这件事真正说明的是,coding agent 的竞争不只是模型谁更强,还包括 harness 如何花 token、取上下文和恢复失败。对工程团队来说,成本效率开始和成功率一样重要。
对比
以前评估常看单模型 benchmark;现在平台方更强调模型、工具、上下文和执行框架的组合表现。
影响
短期会影响企业选择 coding agent 的采购口径:不只问模型名,还要问每个任务的成本、延迟、可解释轨迹和失败率。
[GitHub Blog] Copilot code review 增加分析深度与 CLI 文件工具:AI review 更像可配置流程
层级
工作流/范式层
今日新增
Copilot code review 使用 Copilot CLI/SDK 的内置文件探索工具提升成本效率,并为 Medium analysis depth 增加 PR 标注和组织级默认设置。
判断
这件事真正说明的是,AI code review 正从“统一强度扫一遍”变成可配置的团队流程。它不是能力飞跃,但会提高组织落地的可控性。
对比
以前 review 深度更像单次黑盒调用;现在团队可以区分分析等级,并在组织层设默认策略。
影响
工程管理者会先受影响:他们可以把 AI review 放入默认 PR 流程,同时控制成本和审查强度。
[JetBrains AI Blog] JetBrains 开源 Mellum2:12B 快速模型定位 routing、Q&A、sub-agent 和私有工程 AI
层级
模型层
今日新增
JetBrains 开源 Mellum2,称其从头训练、Apache 2.0 许可,面向低延迟、高吞吐、低成本的软件工程 AI 工作流。
判断
这件事真正说明的是,工程 AI 不一定每一步都需要最大 frontier model。专用小模型可以承担 routing、摘要、中间推理和私有部署中的高频环节。
对比
相比把所有任务都交给大模型,Mellum2 代表“focal model”路线:用较小模型处理确定性强、频次高的子任务。
影响
对自建 agent 平台的团队,短期可作为低成本组件评估;中期会推动多模型路由成为默认架构。
[Google AI Blog] Google 教育 AI 强调 Classroom context:垂直场景的关键是工作流上下文而非单点生成
层级
工作流/范式层
今日新增
Google 在 ISTE 2026 期间介绍面向教育者的 AI 更新,重点包括让工具利用 Classroom 上下文,并把 AI 能力带到更多 EdTech 平台。
判断
这件事真正说明的是,教育 AI 的落点不是泛用聊天,而是嵌入教师已有系统和班级上下文。它更像垂直工作流集成,而不是模型能力突破。
对比
以前教育 AI 多是单独生成教案或答疑;现在更强调在 Classroom 和第三方 EdTech 中读到课程、学生和作业上下文。
影响
教师和学校 IT 会先受影响:价值来自少切换工具和更贴近班级数据,风险也来自权限、学生隐私和错误建议。