pi agent(earendil-works/pi)与 Claude Code、Codex CLI 对比:开源 CLI 编码代理全景(2026)
‼️ 本笔记的”pi agent”特指
earendil-works/pi。这是 Mario Zechner(GitHub
@badlogic)创建、2026 年 4 月随他加入 Armin Ronacher(Flask 之父)的 Public Benefit Corp Earendil 后转入earendil-works组织的”AI agent toolkit”monorepo。它的 npm 旗舰包是@earendil-works/pi-coding-agent。**关于历史名
badlogic/pi-mono**:项目最早确实在badlogic/pi-mono仓库下开发,后整体迁移到earendil-works/pi。同一份代码、同一作者、同一 license(MIT);旧链接通常被 GitHub 自动重定向到新地址(截至 2026-06-05 实测badlogic/pi-mono/blob/main/README.md直接落到earendil-works/pi)。本笔记以新仓库为唯一权威来源;上一版笔记错把项目当作两个独立仓库或者只引用旧名,本次重做修正。参考:earendil-works/pi GitHub 主页、earendil-works 组织页、changchen.me 关于 Mario 加入 Earendil 的解读。
**‼️ 关于本笔记里的”Goose”:之前版本只引用
block/goose。截至 2026-06-05,Block 出品的 Goose 已经把规范仓库迁到aaif-goose/goose**——治理转入 Linux Foundation 旗下 Agentic AI Foundation (AAIF)。两者不是 fork、不是巧合同名,而是同一项目同一份代码的”组织搬家”:block/goose已通过 GitHub transfer 重定向到aaif-goose/goose,README 顶部明写 *”goose has moved! This project has moved fromblock/gooseto the Agentic AI Foundation (AAIF) at the Linux Foundation.”*。本笔记用aaif-goose/goose指当前版本,用block/goose指迁移前历史快照(v1.x 早期)。两条对比线在矩阵里同时保留,方便看治理变更前后差异。
‼️ 关于 OpenCode 与 Alma(本次新增):
- OpenCode 在前一版笔记里只是”同类清单”中的提及;本次升级为独立对比项,**唯一规范仓库是
sst/opencode**(SST/Serverless Stack 团队主导、TypeScript + Go、Bun runtime)。原opencode-ai/opencode(Kujtim Hoxha 创建、Go-only)已基本停滞,npm 包名opencode-ai现指向sst/opencode代码——这是社区里最常被混淆的一对仓库,本笔记以sst/opencode为权威。上一版笔记把 OpenCode 写成”Zig + SolidJS”是错误,本次修正。- Alma 指
alma.now桌面应用,作者 yetone(同avante.nvim、fittencode.nvim作者)。Alma 不是 CLI,而是桌面 GUI 客户端;源码未开源,yetone/alma-releases仅是发布存档仓。本笔记把它纳入对比是因为它在中文 AI 用户群里能见度高、定位上和 Cursor / Claude Code 桌面版竞争,但本质属于”统一 AI provider 编排 GUI”而非纯 CLI agent,矩阵里相关行会用”GUI / 不适用”标注。
关于本次新增的 8 个对比对象(2026-06)
为体现 AI agent 生态的多元流派,本次新增 8 个高讨论度项目:Devin(Cognition)、Cursor Composer 2、Manus(Butterfly Effect)、Trae SOLO(字节)、Qoder(阿里)、Replit Agent 3、Jules(Google Labs)、CrewAI。它们分别代表”自治 SaaS agent”、”IDE-native 多 agent”、”通用自治 agent”、”AI-native IDE”、”企业 IDE”、”Web-IDE 长程自治”、”异步 GitHub-native agent”、”multi-agent 框架”五大流派——与 pi 的 “primitives, not products” 哲学形成正面对照。
摘要
2026 年的开源 CLI 编码代理生态已基本成型。以 earendil-works/pi 为代表的”极简内核 + 可组合扩展”流派,与 OpenHands、Aider、Cline、Goose(现 aaif-goose/goose)、Plandex、SWE-agent、OpenCode(sst/opencode)、Crush、Qwen Code、Gemini CLI、Kimi CLI 等不同设计取向并存;闭源侧由 Anthropic 的 Claude Code 与 OpenAI 的 Codex CLI 双寡头主导,桌面 GUI 阵营则有 yetone 的 Alma 这种”统一 provider 编排”产品。2026 年生态进一步外扩:自治 SaaS agent 流派以 Devin(Cognition + Windsurf)、Manus(Butterfly Effect)、Replit Agent 3、Jules(Google Labs) 为代表;IDE-native 多 agent 流派以 Cursor Composer 2、Trae SOLO(字节)、Qoder(阿里) 为代表;multi-agent 框架派的代表则是 CrewAI。本笔记的核心结论:**earendil-works/pi 与 Claude Code/Codex 的根本差异是产品形态——pi 是一个故意保持骨架级最小的 harness(”primitives not products”),把 MCP、subagent、plan mode、权限弹窗等几乎所有”成品功能”全部下放给用户用 TypeScript extension/skill/package 自行组合**;Claude Code 与 Codex 则代表”开箱即用、企业可签约”的成熟产品;sst/opencode 走”client-server + plan/build 双代理”路线,企图在终端里复刻 Cursor 体验;Alma 则把同一组 provider 装进 GUI、瞄准非终端用户;Devin / Manus / Replit / Jules 走”黑盒长程自治 SaaS”路线;Cursor / Trae / Qoder 把 multi-agent 做成 IDE 默认特性;CrewAI 则把 agent 编排彻底框架化、交给开发者用 Python 程序化组合。选型上,pi 适合愿意自定义 harness 的高级开发者与研究者;OpenHands 与 aaif-goose/goose 适合企业级自主代理与 MCP 生态(后者还有 Linux Foundation 中立治理加成);sst/opencode 适合想要”开源 Cursor 替代”且偏终端的团队;Alma 适合不想离开桌面、要在多家订阅之间切换的个人/小团队;Claude Code / Codex 仍是”平均水平最高、上手最快”的默认选择;Devin / Jules 适合”丢 ticket 进去、回头看 PR”的异步派;Cursor / Trae / Qoder 适合”IDE 内多 agent 并行 worktree”的工程团队;Replit Agent 3 适合 Web-IDE 教学与原型;CrewAI 适合自建 multi-agent 工作流的研究/工程团队。
研究问题
earendil-works/pi究竟是什么?它的归属、版本、活跃度、架构、提示词框架、工具系统、扩展性是什么样?- 它和
badlogic/pi-mono是不是同一个项目?两者的差别是什么? - 同类开源 CLI agent(OpenHands、Aider、Cline、Goose(**
aaif-goose/goose** vs 历史block/goose)、SWE-agent、Plandex、OpenCode(sst/opencodevsopencode-ai/opencode)、Crush、Qwen Code、Gemini CLI、Kimi CLI 等)各自的定位、底座、社区活跃度如何? aaif-goose/goose与历史block/goose是 fork 还是组织迁移?AAIF 化之后治理 / 路线 / 安全模型有什么变化?sst/opencode与原始opencode-ai/opencode是什么关系?为什么 npm 包opencode-ai现在指向 SST 仓库?- Alma(yetone / alma.now)的定位与 CLI agent 的差异?它是开源还是闭源?放进对比矩阵的合理位置在哪?
- 闭源对照 Claude Code 与 OpenAI Codex CLI 的最新(2026)能力差异:模型可替换性、生态、权限/沙箱、上下文管理、企业可用性、价格模式?
- 本次新增 8 个对比对象:Devin(Cognition + Windsurf)、Cursor Composer 2、Manus(Butterfly Effect)、Trae SOLO(字节)、Qoder(阿里)、Replit Agent 3、Jules(Google Labs)、CrewAI——它们各自是什么定位、底座、形态?与 pi 的”primitives, not products”哲学如何对照?
- 横向比较哪些维度是真正的差异点?2026 年视角下风险与未来趋势是什么?
发现
一、earendil-works/pi 项目身份与活跃度
归属与许可证 — Owner:
earendil-works组织(Austria 注册的 PBC,”Bearer of Light” tagline,由 Armin Ronacher、Vegar Stikbakke、Colin Daymond 等任成员)。仓库earendil-works/pi是其旗舰开源项目,MIT License。来源作者与历史 — 实际作者 Mario Zechner(@badlogic,libGDX 作者)2026 年 4 月加入 Earendil 时把原
badlogic/pi-mono整个迁移过来。最新 commits 仍由badlogic主导,外加xl0、Perlence、vegarsti等社区贡献者;GitHub 已对旧 URL 做 transfer-redirect。来源截至 2026-06-05 的状态 — 主语言 TypeScript(93.5%),≈59.8k stars / 7.2k forks,主分支 4427+ commits,226 个 release。最新版本 v0.78.1(2026-06-04),更新主要是提供商扩展(Ant Ling、NVIDIA NIM、MiniMax-M3)、HTML 导出 XSS 修复、扩展安装目录权限收紧等小步快跑式增量。来源
monorepo 四大包(与上一版笔记修正:是 4 个不是 3 个):
@earendil-works/pi-coding-agent— 交互式 CLI(旗舰)@earendil-works/pi-agent-core— agent 运行时(tool calling、状态管理)@earendil-works/pi-ai— 统一多 provider LLM API(OpenAI / Anthropic / Google / Bedrock / Vertex / Azure / Cloudflare / DeepSeek / xAI / Groq / Together / Hugging Face / OpenRouter / Mistral / Kimi / MiniMax / Xiaomi MiMo / Ollama 等 20+)@earendil-works/pi-tui— 差分渲染终端 UI 库
组织内还有
pi-chat(Slack/Discord/Telegram 集成)、pi-review(代码评审扩展)、pi-tutorial(教程模式)、gondolin(Linux microvm 沙箱)、absurd(Python durability 实验)等姊妹仓库。来源
二、设计哲学:”Primitives, not products”
- 极简内核 — 系统提示约 < 1000 token,只暴露四个原子工具:
read、write、edit、bash(注意:是bash不是shell,与上一版笔记修正)。文档原文:”Pi is aggressively extensible so it doesn’t have to dictate your workflow.” 复杂能力一律不进核心。来源 - 官方明确”不内置” — README/docs 直接列举:
- No MCP by default:要 MCP 自己装 extension/package
- No sub-agents baked in:要子代理自己 spawn
pi.exec()或写扩展(仓库内有subagent.ts示例) - No permission popups:不做权限弹窗,建议跑容器或自己实现确认流
- No plan mode / built-in to-dos / background bash:交给 extension(仓库有
plan-mode/示例扩展)
来源
- 三层 SDK API(
@earendil-works/pi-agent-core):createAgentSession— 高层工厂,单个AgentSessionAgent类 — 直接管理 LLM 状态、history、thinking level、system promptcreateAgentSessionRuntime— 多会话/切换/fork/clone 的运行时
事件驱动 + 可订阅流式接口;中文社区把它解读为agentLoop / Agent / AgentHarness三层(来自 silenceper、CSDN 综述),但仓库 docs 自己没有用这个标签。来源、silenceper 综述
三、扩展系统的四个层次
- Skills(on-demand capability)— 自包含目录 +
SKILL.md,支持”progressive disclosure”:启动时只把名字 + 描述塞进 system prompt,匹配到任务时才完整加载。可以放在全局、项目内、package 内或 CLI 指定路径,也可以用/skill:name显式触发。遵循 Agent Skills 标准。来源 - Prompt Templates(slash commands)— 可重用 prompt 模板,绑到
/cmd命令上。 - Extensions(TypeScript 模块)— 自动从
~/.pi/agent/extensions/或.pi/extensions/发现,能力包括:pi.registerTool()注册新工具或覆盖内置工具- 订阅生命周期事件:
session_start/shutdown/before_switch/before_fork、before_agent_start、agent_start/end、turn_start/end、tool_call(可阻断)、tool_result(可改写)、tool_execution_start/end、model_select、thinking_level_select、input(可改写或拦截) - 通过
ctx.ui弹 select/confirm/input 与自定义 TUI 组件 - 注册
/commands与键盘快捷键 - 用
pi.appendEntry()持久化扩展自己的状态
来源
- Packages(组合 + 分发)— 用
package.json里的pi字段或约定目录结构声明,能同时打包 extensions + skills + prompts + themes。安装来源三种:npm(~/.pi/agent/npm/)、git(.pi/git/)、local path。命令是pi install/pi update。安全提示明确:”Pi packages run with full system access. Extensions execute arbitrary code, and skills can instruct the model to perform any action including running executables.” 责任推给用户审计。来源
四、Session = 树而非链
- JSONL 树结构 — 每个 entry 有
id与parentId,”current position” 是活动叶子。/tree交互式浏览历史、折叠、贴标签、跳转;选 user 消息进 editor 编辑、选 assistant 直接续写。/fork在更早节点拆出新 session 文件;/clone复制当前活跃分支。/share上传成 GitHub gist + HTML 链接,/export生成独立 HTML。Hugging Face 数据集badlogicgames/pi-mono用来发布作者本人的真实工作 session,作为非 toy benchmark 的训练材料。来源
五、Provider 与认证
- 订阅级登录 — pi-ai 原生支持 ChatGPT Plus/Pro(Codex 通道)、Claude Pro/Max、GitHub Copilot 三种订阅 OAuth;token 存
~/.pi/agent/auth.json自动刷新。也兼容 API Key、自定义 provider、Azure / Bedrock / Vertex / Cloudflare AI Gateway 等云后端。来源
六、沙箱:三套官方推荐模式
OpenShell — 适合需要”policy-controlled sandbox with filesystem, process, network, credential, and inference controls”。NVIDIA OpenShell 的策略式沙箱,credential 与推理也在管控边界内。
Gondolin —
earendil-works/gondolin自家实验性 Linux microvm(QEMU/krun 后端)。”want pi on the host but all built-in tools routed into the VM”——auth 留在宿主、工具进 VM。支持可编程 HTTP/TLS 出站策略、密钥占位注入、JS 控制 VFS、SSH allowlist、磁盘 checkpoint、ingress gateway。Plain Docker — 最简单的整进程容器化,但需要把 API key 带进容器。
docs 直接说:”OpenShell 与 Gondolin 提供凭据隔离,Docker 不行”——很难得地坦诚。来源
七、其他主流开源 CLI agent(更新版)
- OpenHands(前 OpenDevin) — 多代理工作区(shell+browser+editor+planner),2026 引入 PLAN.md beta;每 session Docker 沙箱;SWE-bench Verified ~53%(Claude 3.5/4.5);模型可换(Claude/GPT/Ollama);强企业向,token 消耗较高。来源
- Aider — 终端 + Git 原生 pair programmer,≈35–39k stars。亮点:基于 ctags 的 Repo Map、自动 commit message、linter 自动修复;100+ provider;无 shell/browser 自主执行——更安全但自主性弱;Polyglot benchmark 84.9%。来源
- Cline(前 Claude Dev) — 主要是 VS Code/JetBrains 插件,不是纯 CLI;GUI human-in-the-loop;强 Anthropic 集成。来源
- Goose(历史名
block/goose,现规范地址aaif-goose/goose) — Block 出品的 Rust runtime,CLI / 桌面 / API 三入口;多 LLM;YAML Recipes workflow;3000+ MCP 扩展;隐私优先;架构三层(Interface / Agent Logic / Extensions)。**2025-12 起治理移交 Linux Foundation 旗下 Agentic AI Foundation (AAIF)**——README 顶部明写 “goose has moved fromblock/gooseto the Agentic AI Foundation (AAIF) at the Linux Foundation.”block/goose已 GitHub transfer 重定向到新仓库;不是 fork,是组织搬家。来源 aaif-goose/goose(AAIF 化后的 Goose) — 当前规范仓库地址(2026-06);Apache-2.0;主语言 Rust(63.8%)+ TypeScript(29.4%);≈46.5k stars / 4.9k forks / 137 个 release。最新版本 v1.37.0(2026-06-03),新增 xAI SuperGrok / 阿里 Qwen / NEAR AI Cloud / Scaleway / Atomic Chat 等 provider,强化 ACP(Agent Connection Protocol)会话级 system prompt 与 OAuth proactive refresh,引入 Hooks 系统与/model、/goal斜杠命令、goose://resumegoose://new-session深链、加密 Nostr session 共享、俄/土语本地化。AAIF 化最重要的实质变化在治理与安全:作为 AAIF 旗舰项目(与 MCP、AGENTS.md 并列),由 OpenAI / Anthropic / Block / Google / Microsoft / AWS 共同背书;红队反馈后 AAIF 引入 MCP 安全 profile 与 sandboxing API 草案(仍在演进,未在 main README 详细化),SECURITY.md是漏洞披露入口。Block 内部公开数据:开源前每工程师每周净增 8–10 小时产出。来源、Campus Technology AAIF 报道- Plandex — 长程规划与大型 codebase 任务编排,多代理并行子任务、自我调试。来源
- SWE-agent(Princeton NLP) — 学术起家,简化 ACI(Agent-Computer Interface),SWE-bench ~12.29% / 平均 93s;偏 agent ↔ repo 交互形式化研究。来源
- OpenCode(
sst/opencode,本次升级为独立项) — SST/Serverless Stack 团队主导的开源 AI 编码代理,MIT License,主语言 TypeScript(68.1%)+ Go(上一版笔记里写”Zig + SolidJS”是错误,本次修正)、Bun runtime + Turbo monorepo + SST 部署、Oxlint。截至 2026-06-05 ≈170k stars / 20.3k forks / 5000+ open issues,最新版本 v1.15.13(2026-05-30)——堪称 2026 年开源 CLI agent 新晋第一明星。核心特性:- Plan / Build 双代理(Tab 键切换):Plan 是只读探索模式,跑 bash 之前会要权限;Build 是全权限执行模式。等价于 Claude Code 的 plan mode + execute 一体化。
- General Subagent:处理复杂搜索、跨文件多步任务,是
sst/opencode与原始opencode-ai/opencode最大的差异。 - Client-Server 架构:服务端可本地或远程部署,前端可以是 console、web UI、VS Code SDK、移动端(仓库内有
apps/mobile/等 package);这是它”开源 Cursor”定位的基础。 - 75+ 模型:OpenAI / Anthropic / Google / Ollama / Llama 3 / Qwen / 本地模型;privacy-focused,明确强调 offline 能力。
AGENTS.md自动生成 + GitHub/GitLab 深度集成:PR comment/opencode触发;auto PR review、issue triage、branch 创建。- LSP 集成:在终端里得到接近 IDE 的补全 / 跳转能力。
- 历史与命名混淆:原项目
opencode-ai/opencode(Kujtim Hoxha、Go-only)已基本停滞;SST 团队接管/重写后改用 TS+Go 并保留 npm 包名opencode-ai,导致 npm 包名与 GitHub 组织名不一致。**社区一致推荐sst/opencode**。来源、2026 OpenCode 综述 - 2048ai.net
- Crush / Kimi CLI / Qwen Code / Gemini CLI — Crush 内置 LSP 上下文与 MCP(≈14.4k stars);Qwen Code 256K 原生上下文(可扩到 1M),中文场景优化;Gemini CLI 免费额度最大(1000 请求/日);Kimi CLI 走 Moonshot 自家模型 + 国内生态。来源
七·补、Alma:桌面 GUI 客户端(非 CLI 的对照项)
- Alma(yetone 出品的桌面 AI 客户端) — 与本笔记其他对比对象不同,Alma 是桌面 GUI 应用而非 CLI,但因为它在中文 AI 用户群里能见度极高、定位上直接对标 Cursor / Claude Code 桌面体验,本次纳入对比矩阵作为参照。要点:
- 定位:作者自述 “A beautiful desktop application that unifies your AI experience”——把多家 AI provider 装进同一个 Mac/Win/Linux 桌面 App,重点是体验一致性与多模型编排,而非纯编码。
- 作者:yetone,国人开发者,同时也是
avante.nvim(Neovim 里最火的 AI 插件)和fittencode.nvim等工具的作者,在 AI / editor 工具圈有持续产品力。 - 开闭源:官方未开放源码。GitHub 上
yetone/alma-releases仅是发布存档仓(README 明写 “This is just a repository for archiving”),截至 2026-06-05 已发布 732 个 release,最新 v0.0.812(2026-06-03)——更新极其频繁,每天近 1 个版本,但 LICENSE 与定价信息官方页面均未公开。 - 核心特性(来自 alma.now 官方页 + Xiaomai/CodeKey 第三方配置文档 + vibesparking 评测):
- 统一 provider:原生支持 OpenAI / Anthropic(Claude Sonnet/Opus)/ Google Gemini / DeepSeek / 自定义 base URL(XiaomaiAPI、CodeKey 等中转服务都有专门接入文档)。
- 持久 Memory 系统:跨会话保留偏好与历史。
- 集成开发工具:内置终端、可视化 Git 操作(中文综述提到使用 Git worktree 抽象做任务隔离,与 Claude Code 的 worktree 工作流思路一致)、内置浏览器查文档、代码生成与补全。
- 企业能力:SSO 与访问控制(来自 vibesparking 评测,未在官方页直接列出)。
- Web Search + Advanced Tool Use:标 “for complex tasks and data analysis”。
- MCP 支持:官方页与归档仓 README 均未明确说明支持 MCP;本笔记保守标 “未确认”。
- 平台:macOS(Apple Silicon 主力)、Windows、Linux 均有构建。
- 典型用户:偏好桌面 GUI、不想留在终端、需要在 Claude/GPT/Gemini/DeepSeek 之间频繁切换且有自定义 base URL 中转需求的个人开发者与小团队;中文用户社区是其主要推广渠道。
- 与 pi / Claude Code / Codex 的关键差异:Alma 把 LLM provider 编排做成桌面 App 体验,目标用户与 CLI agent 不重叠;它不是 agentic harness(没有公开的 tool calling 框架、没有 subagent / plan mode 这种”让模型自主多步执行”的产品定位),更像”高级聊天 + 内置工具”的 client。所以放进矩阵时 plan mode、subagent、sandbox 等几列基本是 “GUI / 不适用”。来源、yetone/alma-releases、Vibesparking 评测、Xiaomai 接入文档、CodeKey 接入文档
八、闭源对照:Claude Code 与 Codex CLI
- Claude Code(Anthropic 官方 CLI) — 2026 形态:Agent SDK(Python/TS)、Skills、Hooks(pre/post)、MCP(一等公民)、Subagents(角色委派 + 冲突仲裁)、Plan mode(目标分解 + 动态重规划 + 进度跟踪);底座默认 Claude Sonnet 4.5;SWE-bench 72%+。订阅 $20–200/月;企业版有审计与 SSO。来源
- OpenAI Codex CLI — 2025 中重写为 Rust 核心 + Node CLI 包装(
codex-rs/、codex-cli/、mcp-server/),Tokio 异步 + Ratatui TUI;模型默认 GPT-5-Codex;MCP 同时做 client+server。来源 - Codex 三档审批/沙箱 —
Suggest/Auto-Edit/Full-Auto;权限策略ReadOnly/WorkspaceWrite/DangerFullAccess;可--dangerously-bypass-approvals-and-sandbox(仅推荐 VM/容器)。来源 - Codex OS 级沙箱 — macOS Seatbelt(
sandbox-exec)、Linux Landlock + seccomp(企业可叠 bubblewrap)、Windows 仅 WSL2 + Restricted Tokens。默认范围$PWD与~/.codex。来源 - Codex 2025–2026 关键更新 — Session Resumption、VS Code 插件、ChatGPT 账号同步(Pro/Enterprise 自动配 key)、自定义 prompt 库、命令白名单(git/npm 等)。Apache-2.0。来源
- 价格与模型耦合 — Codex 与 ChatGPT 订阅捆绑、Claude Code 与 Anthropic 订阅捆绑;两者都允许 API key,但实际工具调用与提示词都是按自家模型调过的——把 Claude Code 接到 GPT 上,Plan mode/Subagents 稳定性会下降。来源
九、十维对比矩阵
矩阵结构:行是对比维度,列是对比对象。本次新增 / 升级两列:OpenCode(升级为
sst/opencode权威数据) 与 Alma(新增桌面 GUI 对照)。Alma 在很多列上是”GUI / 不适用”——把它列出来是为了让”非 CLI 桌面客户端 vs CLI agent harness”的差异可视化,不是说它在 agent 能力上等价。
| 维度 | earendil-works/pi | OpenHands | Aider | block/goose(迁移前快照) | aaif-goose/goose(当前规范) | Cline | OpenCode(sst/opencode) |
Qwen Code | Alma(桌面 GUI) | Claude Code | Codex CLI |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 开源协议 | MIT | MIT | Apache-2.0 | Apache-2.0 | Apache-2.0(AAIF 治理) | Apache-2.0 | MIT | Apache-2.0 | 闭源(仅发布存档仓 yetone/alma-releases,无公开 LICENSE) |
闭源(CLI 二进制) | Apache-2.0 |
| 底座模型耦合 | 解耦(pi-ai 抽 20+ provider,含 ChatGPT Pro/Claude Pro/Copilot OAuth) | 解耦(Claude/GPT/Ollama) | 解耦(100+ provider) | 解耦(15+ LLM) | 解耦(15+ LLM;v1.37 新增 xAI SuperGrok / Qwen / NEAR / Scaleway / Atomic Chat;ACP 走订阅) | 偏向 Anthropic | 解耦(75+ 模型;OpenAI/Anthropic/Google/Ollama/Llama 3/Qwen + 本地) | 强耦合 Qwen | 解耦(OpenAI / Anthropic / Gemini / DeepSeek / 自定义 base URL) | 强耦合 Claude | 强耦合 GPT-5-Codex |
| 核心工具 | 4 个:read/write/edit/bash |
shell + browser + editor + planner | edit + git + lint | shell + MCP | shell + MCP + Hooks + 深链(goose://) |
IDE 内嵌 | shell + LSP + Plan/Build 双代理 + General Subagent | shell + 大上下文检索 | 聊天 + 内置终端 + 可视化 Git(worktree 抽象)+ 内置浏览器 + Memory + Web Search(GUI 工具,无 agentic tool calling) | 全套 + Skills/Hooks | shell + apply_patch |
| 插件机制 | TS extension + skill + package(无内置 MCP) | 内建工具集 + MCP | 内置工具集(Repo Map / linter / git) | MCP(3000+ 扩展) | MCP(3000+ 扩展)+ Hooks 系统 + Recipes(YAML) | VS Code 插件 + 工具 | VS Code SDK + console / web / mobile 客户端 + AGENTS.md 自动生成 | 内置 + agent.md | 未公开扩展 API(GUI App,Memory 与 provider 配置可定制) | Skills + Hooks + MCP(一等公民) | MCP client+server + 命令白名单 |
| Subagent | 无内置,有 subagent.ts 示例 |
多 agent 并行 + PLAN.md | 单 agent | 单 agent + Recipes | 单 agent + Recipes(YAML workflow,多步任务编排) | 单 agent | Plan / Build + General Subagent(处理复杂搜索与多步任务) | 单 agent | GUI / 不适用 | Subagents(角色 + 仲裁) | 单 agent + 审批模式 |
| Plan mode | 无内置,有 plan-mode/ 示例扩展 |
PLAN.md beta | 无 | Recipes(YAML) | Recipes + /goal 斜杠命令 |
无 | Plan mode 内置(Tab 键切 Plan/Build;Plan 是只读探索) | 无 | GUI / 不适用 | 一等公民 | 无 |
| Sandbox / 权限 | 无内置;推荐 OpenShell / Gondolin / Docker | 每 session Docker | 无 shell 自主执行(最安全的”无”) | 本地执行 + 权限层 | 本地执行 + 权限层;AAIF 红队后引入 MCP 安全 profile + sandboxing API 草案(演进中) | IDE 内 human-in-loop | Plan 模式跑 bash 前请求权限 + Client-Server 隔离(远程部署天然分进程) | 无 | 桌面 App 沙箱(macOS App sandbox / Windows AppContainer 等系统级隔离,未公开细节) | 内置权限提示 + plan mode | Seatbelt / Landlock+seccomp / WSL2 三档 |
| 上下文/记忆 | 树状 session(JSONL)+ /tree + HTML 导出 + HF 分享 | 多代理工作区 | Repo Map + git 历史 | Recipes(YAML workflow) | Recipes + 加密 Nostr session 共享 + 深链恢复 | IDE 上下文 | AGENTS.md + LSP 索引 + 远程 server context(client/server 分离持久化) | 256K → 1M 大上下文 | 持久 Memory 系统(跨会话保留偏好 / 历史) | Skills 持久化 + 文件级 memory | Session Resumption + prompt 库 |
| IDE 集成 | 终端为主 | Web IDE / GitHub 直连 | 终端 + 编辑器外挂 | CLI / 桌面 | CLI / 桌面 / API 三入口 + ACP | 原生 VS Code/JetBrains | 终端 TUI + Web UI + VS Code SDK + 移动端 client | 终端 | 桌面 GUI App(macOS / Windows / Linux) | VS Code 扩展 | VS Code 插件 |
| 企业部署 | 弱(需自建容器/审计) | 强(Docker/K8s) | 弱(个人开发者向) | 强(Block 内部 + 私有 MCP) | 强(Linux Foundation 中立治理 + 多家厂商背书:OpenAI/Anthropic/Block/Google/Microsoft/AWS) | 中(IDE 部署) | 强(Client-Server 架构 + privacy-focused,金融/医疗团队反馈在用 offline 部署) | 中(阿里云生态) | 中(vibesparking 评测提到 SSO + 访问控制,官方页未公开企业方案) | 强(SSO、审计、合同) | 强(ChatGPT Enterprise 同步) |
| 社区规模 (2026-06) | ≈59.8k stars / 7.2k forks / 4427+ commits | 中-大(中文社区热门) | ≈35–39k stars | 迁移前 ≈45k+ | ≈46.5k stars / 4.9k forks / 137 release | 中 | ≈170k stars / 20.3k forks / 5000+ open issues / v1.15.13(2026-05-30) — 2026 年增速最猛的开源 CLI agent | 中 | alma-releases 仓 732 个 release / v0.0.812(2026-06-03);社区主要在中文圈与 yetone 个人粉丝群 | ≈48k stars(公开仓) | ≈49.7k–54.5k stars |
stars 数据来自各仓库截至 2026-05–06 的搜索快照,可能略有偏差。
block/goose的链接已 GitHub transfer 重定向到aaif-goose/goose,所以两列其实指向同一份代码、同一段 git 历史,差别在治理 / 路线 / 安全 profile,对比矩阵把它们拆成两列只是为了凸显 AAIF 化前后的增量。OpenCode 列已升级到sst/opencode权威数据(上一版笔记记的 31.5k stars / Zig+SolidJS 是错误,实际是 TypeScript+Go / 170k stars)。Alma 列很多格用了 “GUI / 不适用”——它和 CLI agent 是不同形态产品,放在矩阵里只是为了让边界可见。
十、其他高讨论度 AI agent(2026 新增 8 个对比对象)
本节集中刻画 8 个 2026 年高讨论度但不属于纯 CLI agent赛道的项目——自治 SaaS、IDE-native 多 agent、Web-IDE 长程自治、multi-agent 框架,与 pi 的”primitives, not products”哲学形成正面对照。每个子节固定结构:定位 / 底座 / 形态 / 工具 / 典型用户 / vs pi / 引用。
10.1 Devin(Cognition + Windsurf)
- 定位:自治 SaaS agent,被设计成”AI 软件工程师”,可分配 ticket 后异步独立完成
- 底座:Cognition 自家模型 + 多家 LLM 编排
- 形态:SaaS(Web 控制台)+ 收购 Windsurf 后整合 IDE 端(2026 年 Cognition 收购 Windsurf)
- 工具:浏览器 / shell / 编辑器 / 自有 sandbox
- 典型用户:企业团队批量分配 PR / bug fix
- vs pi:Devin 是产品,pi 是工具箱;Devin 长程自治,pi 单步原子操作
- 引用:devin.ai、Cognition acquires Windsurf 报道
10.2 Cursor Composer 2
- 定位:IDE-native AI 编辑器,Composer 2 引入 worktree 多 agent 并行
- 底座:Anthropic Claude / OpenAI GPT / Cursor 自训模型
- 形态:VS Code fork IDE
- 工具:内置 codebase indexing、agent loop、MCP
- 典型用户:日常 IDE 编码者
- vs pi:Cursor 是 IDE 体验中心,pi 是 CLI;Cursor 多 agent 是产品默认,pi 靠 extension
- 引用:cursor.com
10.3 Manus(Butterfly Effect)
- 定位:通用自治 agent(”Multi-agent Universal Solver”),可执行长任务(写报告、订机票等)
- 底座:未公开(多 LLM)
- 形态:Web SaaS
- 典型用户:通用消费者 / 商务自动化
- 要点:2026 年 Meta 试图收购 Butterfly Effect 被中国监管否决(事实标注,后续产品方向待跟踪)
- vs pi:Manus 是黑盒长程自治,pi 是透明工具箱
- 引用:manus.im
10.4 Trae SOLO(字节)
- 定位:字节跳动出品的 AI-native IDE,2026-03 推出独立 SOLO 模式(多 agent 并行)
- 底座:豆包 / Claude / GPT 多家
- 形态:独立 IDE(VS Code fork)
- 工具:MCP 兼容
- 典型用户:中国开发者 / 跨国团队
- vs pi:Trae 是中国版 Cursor,pi 是 CLI primitives
- 引用:trae.ai
10.5 Qoder(阿里)
- 定位:阿里出品的企业级 AI IDE,2026-05-15 GA 1.0,主打 Quest 模式(任务驱动)
- 底座:通义千问 + 多家 LLM
- 形态:独立 IDE
- 工具:MCP、Quest 模式、企业 SSO
- 典型用户:阿里云 / 国央企
- vs pi:Qoder 是企业产品,pi 是个人工具箱
- 引用:qoder.com
10.6 Replit Agent 3
- 定位:Web-IDE + 长程自治(最长 200 分钟单任务),可在线部署
- 底座:Anthropic Claude + OpenAI
- 形态:Web IDE + cloud sandbox
- 典型用户:原型开发 / 教育
- vs pi:Replit 是云端一体化,pi 是本地 CLI
- 引用:replit.com
10.7 Jules(Google Labs)
- 定位:异步 GitHub-native agent,可在 GitHub PR/issue 上挂载,自动开 PR 修复
- 底座:Gemini 3.1 Pro
- 形态:GitHub App + Web 控制台
- 典型用户:GitHub 重度团队
- vs pi:Jules 是 GitHub 集成 SaaS,pi 是本地 CLI
- 引用:jules.google
10.8 CrewAI
- 定位:Python multi-agent 框架,让开发者编排多个 agent 协作(角色分工 + 任务流)
- 底座:与任意 LLM provider 配合(OpenAI / Anthropic / 本地模型)
- 形态:Python library
- 典型用户:研究者 / 自建 agent 系统的工程团队
- 当前版本:1.14.4(2026-06)
- vs pi:CrewAI 是框架(程序化编排),pi 是 CLI 产品;定位完全不同流派
- 引用:github.com/crewAIInc/crewAI
10.9 8 个新增对象的浓缩对比小矩阵
为避免与第九节的主矩阵列数过宽,本小节单独列出 8 个新增对象。列是 10 维(与主矩阵共享术语),行是 8 个项目。GUI/SaaS 不适用列标 “—“ 或 “SaaS/IDE”。
| 项目 | 开源协议 | 底座耦合 | 核心工具 | 插件机制 | Subagent | Plan mode | Sandbox/权限 | 上下文/记忆 | IDE 集成 | 企业部署 |
|---|---|---|---|---|---|---|---|---|---|---|
| Devin | 闭源 SaaS | Cognition 自家 + 多 LLM | 浏览器/shell/编辑器 + 自有 sandbox | SaaS API | 内置长程自治 | 任务分解 + 异步执行 | 自有云端 sandbox | 跨 ticket 持久 | Web 控制台 + Windsurf IDE | 强(企业 SaaS 合同) |
| Cursor Composer 2 | 闭源(VS Code fork) | 多家(Claude/GPT/自训) | codebase indexing + agent loop + MCP | MCP + IDE 扩展 | 多 agent worktree 并行 | 内置 plan | IDE 进程 + 用户审批 | 索引 + 长上下文 | 自身就是 IDE | 强(Cursor for Business) |
| Manus | 闭源 SaaS | 未公开(多 LLM 编排) | 通用浏览器 + 文件 + 工具调用 | SaaS(无插件 API) | 多 agent 黑盒 | 长程任务自动分解 | 云端 sandbox(黑盒) | 长程会话 | — | 中(C 端 + 商务 SaaS) |
| Trae SOLO | 闭源(VS Code fork) | 豆包 + Claude + GPT | IDE 工具集 + MCP + SOLO 多 agent | MCP 兼容 | SOLO 多 agent 并行 | 内置 | IDE 进程 | IDE 索引 | 自身就是 IDE | 中(字节生态) |
| Qoder | 闭源(独立 IDE) | 通义千问 + 多家 LLM | Quest 模式 + MCP + 企业 SSO | MCP | Quest 模式任务驱动 | Quest 模式 | IDE 进程 + 企业策略 | 项目级索引 | 自身就是 IDE | 强(阿里云 / 国央企) |
| Replit Agent 3 | 闭源(Web IDE) | Claude + OpenAI | Web IDE + cloud sandbox + 在线部署 | Replit 平台 | 长程自治(≤200 分钟) | 任务自动分解 | Cloud sandbox | 项目持久 | 自身就是 Web IDE | 中(教育 / 原型) |
| Jules | 闭源(Google Labs) | Gemini 3.1 Pro | GitHub PR/issue 挂载 + Web 控制台 | GitHub App | 异步独立开 PR | 异步任务规划 | Google 云端 sandbox | PR/issue 上下文 | GitHub 原生 | 中(GitHub 团队) |
| CrewAI | MIT | 任意 LLM provider | Python 框架(无内置 CLI) | Python library 程序化编排 | 多 agent 角色 + 任务流(核心卖点) | 由用户代码编排 | 由用户实现 | 由用户实现 | 无(库) | 中(自建 agent 系统) |
对比与判断
1. 真正的差异点:完成度 vs 可塑性
- Claude Code、Codex CLI:MCP、Sandbox、Subagent/Plan、企业权限做成默认开。代价是行为被官方调教过,深度自定义要走 Skills / Hooks / AGENTS.md,且模型替换会显著降级。
- earendil-works/pi:故意把这些全部下放到 extension / skill / package。短期上手更难;长期可以让一个团队真正拥有自己的 harness(公司专属 review skill / 项目模板 / 评审 SOP)。它给出的不是产品,而是写产品需要的零件。
- **OpenHands、
aaif-goose/goose**:两端折中——aaif-goose/goose借 MCP + Hooks + AAIF 中立治理做生态、OpenHands 借 Docker 做企业级隔离。 - **
sst/opencode**:是开源侧”完成度最高”的代表——把 Claude Code 的 plan/build 模式 + Cursor 的 client-server 架构 + AGENTS.md 全部内置成默认开,但代码完全开源、模型完全解耦。它和pi是开源 CLI agent 谱系两端:pi极简、sst/opencode极全。 - Alma:不在”agent harness”赛道里,是”统一桌面 AI 客户端”赛道;要把它和 Claude Code 比,更合适的对照是 Cursor / Claude Desktop 而不是 CLI agent。本笔记列出来主要是因为用户社区会拿它和 Claude Code 桌面体验直接对比。
2. 模型耦合度的”隐性”差异
表面上 Claude Code 和 Codex 都”支持自定义 API key”,但工具调用与提示词都是按自家模型调过的。pi / Aider / aaif-goose/goose / sst/opencode / Alma 在这点上都是真正模型无关的,是它们存在的核心理由之一。pi-ai 把 20+ provider 都抽象在同一接口下,并直接支持 ChatGPT Pro / Claude Pro / Copilot 三种订阅级 OAuth——这意味着 pi 的用户可以用同一个 harness 在三家订阅之间切换底座,这是 Claude Code 与 Codex 都做不到的。aaif-goose/goose 走的是另一条路线:通过 ACP(Agent Connection Protocol)让自己挂上各家订阅,覆盖面相似但实现不同。sst/opencode 直接挂 75+ 模型且强调本地/offline 能力。Alma 因为是闭源 GUI,多 provider 编排做得很顺(XiaomaiAPI / CodeKey 之类的中转 base URL 都有专门接入指南),但代价是 prompt / tool calling 框架不可审计、不可替换。
3. 沙箱:从”可选”变成”产品级护城河”
2026 年最显著的变化:Codex 把 Seatbelt / Landlock+seccomp 做成产品默认;Claude Code 强化 Plan/审批;OpenHands 以 Docker-per-session 出名;**aaif-goose/goose 在 AAIF 化后由基金会推动 MCP 安全 profile 与 sandboxing API 草案——治理中立化让它可以更容易被多家厂商共同 review,但具体落地仍在演进。sst/opencode 借 client-server 架构天然把执行体与终端 UI 分开,远程部署时是天然进程隔离;Plan 模式跑 bash 前会要权限。pi 在这条线上明显落后——文档明说自己”没有权限系统”,企业落地需要团队自建容器化 wrapper(Earendil 自家的 gondolin 是当前最完整的方案,但仍是”实验性”标签)。这既是它的设计选择,也是潜在风险。Alma 作为桌面 App**,依赖 OS 级 App sandbox(macOS App Sandbox / Windows AppContainer 等),但官方未公开沙箱细节,企业落地需要单独 audit。
4. 按流派归纳(2026-06 更新)
为了让上面 19 个对比对象不至于在矩阵里散成一团,可以按”产品形态/工作流”归到 5 个流派:
- CLI primitives 派(pi)— 最小内核 + 用户组装。极致可塑、上手陡峭、企业落地需自补沙箱。
- CLI 成品派(Claude Code / Codex / sst/opencode / aaif-goose / Cline / Aider)— 工具箱 + 默认 agent loop。开箱可用、生态成熟、深度定制要走 Skills/Hooks/AGENTS.md。
- IDE-native 派(Cursor / Trae / Qoder)— 编辑器为中心,多 agent 是 IDE 特性。worktree 并行是 2026 年这条线最显眼的工程模式。
- 自治 SaaS 派(Devin / Manus / Replit Agent 3 / Jules)— 黑盒长程自治。”丢任务进去、回头看 PR/报告”是产品形态共识;可审计性 / 数据隔离仍是企业落地最大不确定性。
- Multi-agent 框架派(CrewAI / OpenHands 部分)— 程序化编排。把 agent 协作做成 Python library 或 Web/Docker workspace,让开发者用代码定义角色分工与任务流。
pi 与 CrewAI 实际是两端:pi 把 “harness 层” 做成最小内核给用户填扩展,CrewAI 把 “编排层” 做成 Python 框架给用户写多 agent;中间的 CLI 成品派 / IDE-native 派 / 自治 SaaS 派则各自把 “体验完整度” 做到不同位置。
5. 选型建议
| 场景 | 推荐 |
|---|---|
| 想最快出活、团队预算够、用得起 Claude/GPT 订阅 | Claude Code(Skills/Subagents/Plan 最成熟)或 Codex CLI(沙箱最严格) |
| 已经付了 ChatGPT 订阅、严格沙箱、Rust/Tokio 偏好 | Codex CLI |
| 想完全控制 prompt/工具/会话树、做 agent 研究或定制 harness、要在多家订阅间切换 | earendil-works/pi |
| 要中立治理(不想被任何一家 AI 厂商绑定)、隐私优先、本地执行、要 MCP 生态接 Jira/AWS | **aaif-goose/goose**(Linux Foundation / AAIF 治理是这条路线的最大卖点) |
| 大型 monorepo、企业自主代理、可接受 Docker 隔离与高 token | OpenHands |
| 增量重构、Git 工作流、想要最稳的”半自动” pair programmer | Aider |
| 要”开源 Cursor”、终端 + Web/移动端 client、Plan/Build 双代理、本地或远程部署都行、最热的开源生态 | sst/opencode |
| 中文场景、本地大上下文(≥1M) | Qwen Code |
| 免费额度最大(个人开发者起步) | Gemini CLI |
| 不想离开桌面 GUI、要在 Claude/GPT/Gemini/DeepSeek 之间频繁切换且接受闭源 + 自定义 base URL 中转 | Alma(注意:不是 agentic harness,更接近”高级 AI 客户端 + 内置工具”) |
| 异步派 ticket 自治执行、想让 agent 直接接 PR/issue | Devin(企业 SaaS 长程自治)或 Jules(Google Labs,GitHub-native 异步) |
| IDE 多 agent 并行 worktree、希望 agent 是编辑器原生特性 | Cursor Composer 2(西方主流)或 Trae SOLO(字节,中国/跨国) |
| 企业 IDE + 中国云生态、需要通义千问 + 企业 SSO | Qoder(阿里 1.0 GA) |
| Web-IDE 教学/原型、要云端 sandbox + 在线部署一体化 | Replit Agent 3(最长 200 分钟单任务) |
| 自建 multi-agent 工作流、要 Python 程序化编排角色 + 任务流 | CrewAI |
6. 2026 H2 趋势
- Subagent / Plan / Skills 标准化 — Claude Code 把它们变成默认;Codex 跟进;开源侧 OpenHands /
aaif-goose/goose/sst/opencode各自实现。pi是”明确不做、交给社区”的特立独行派。 - Sandbox 进入产品默认值 — Codex 把 OS-level sandbox 做成不可绕过;OpenHands 把 Docker 当默认;AAIF 在推 MCP 安全 profile + sandboxing API;
sst/opencode借 client-server 自带进程隔离。pi+gondolin组合可能是开源侧最干净的”非容器即 microvm”方案,但还需要时间成熟。 - MCP 生态分化 —
aaif-goose/goose已 3000+ MCP;Codex 双向 MCP;Claude Code 一等公民;pi故意不内置但可用 extension 桥接;sst/opencode当前 MCP 接入主要走 SDK;Alma 至今官方未明确表态。社区里一旦出现”事实标准pi-mcp-bridge“,分化就会被弥合。AAIF 把 MCP(Anthropic)+ Goose(Block)+ AGENTS.md(OpenAI)放到同一治理下,2026 H2 之后可能会出现”AAIF 标准 agent runtime profile”,这会是开源 CLI agent 生态最值得跟踪的事件。 - 订阅级 OAuth 成为新底线 —
pi-ai同时挂 ChatGPT Pro / Claude Pro / Copilot 三种订阅,是 2026 年开源 CLI 难得做完整的实践,未来可能成为社区基线;aaif-goose/goose的 ACP 是另一种实现路线;sst/opencode的 75+ 模型 + 自定义 base URL 也走类似方向。 - 桌面 GUI 与 CLI 双轨并行 — Cursor / Alma / Claude Desktop 等桌面客户端在中文用户群里增长很快;CLI agent 仍是工程深度用户与 CI/CD 场景的默认。两条赛道短期内不会合流,但 client-server 架构(
sst/opencode、aaif-goose/goose)正在让”同一个 backend、CLI/Web/桌面三种前端”成为可能。 - 新增(2026-06):自治 agent 商业化加速 + IDE-native 多 agent worktree 范式 + 中国 IDE 厂商崛起 — 自治 agent 商业化加速(Devin / Manus 走向 SaaS、Jules 走 GitHub-native、Replit Agent 3 走 Web-IDE 一体化)+ IDE-native 多 agent worktree 范式(Cursor Composer 2 引领,VS Code fork 派全部跟进)+ 中国 IDE 厂商崛起(Trae(字节)/ Qoder(阿里) 各自占位)。这三条线 2026 H2 大概率会进一步分化——CLI 派强调可审计性与可移植,自治 SaaS 派强调”丢进去、回来取”,IDE-native 派强调编辑器内多 agent 并行,三派短期内难以合流。
不确定性
badlogic/pi-mono→earendil-works/pi的迁移时间点没有官方公告原文,我是从 GitHub 的 transfer-redirect 行为 + changchen.me 等中文博客交叉确认,时间窗大约在 2026-04 前后。如果用户能找到官方 announcement,应替换本笔记里”4 月”一节。- GitHub stars 数据:59.8k stars 来自搜索快照与仓库主页,但同一时段不同来源给到 46.8k–60k,相差较大。落地决策建议直接看 GitHub 实时数据。
- “Subagent / Plan mode 仅是示例扩展”是否准确:
packages/coding-agent/examples/与extensions.md都把plan-mode/与subagent.ts列为示例,但是否有”官方推荐 + 内嵌”版本未完全确认。建议从pi内/help+ 实际pi install看清楚。 - 三层 SDK 的中文叫法(agentLoop / Agent / AgentHarness)来自第三方综述(silenceper、CSDN),仓库 docs 自己没用这套术语,技术博客和官方文档之间可能存在用词漂移。
- 企业级落地路径:当前没有看到”earendil 官方提供的 SaaS 或托管沙箱”产品,企业用
pi仍需自己负责 audit / SSO / 容器化。 - **
aaif-goose/goose的”组织搬家而非 fork”:README 顶部明写 “moved fromblock/goose“,GitHub transfer 重定向也支持这一说法;但是否有”独立维护人 fork 出去”的旁支(例如某个早期 tag 被分叉)暂未在 release/contributors 列表里看到——结论是目前唯一规范仓库就是aaif-goose/goose**,但用户如遇到第三方 fork 应单独审计。 - AAIF 化的实质变化深度:搜索结果提到”红队反馈后 AAIF 引入 MCP 安全 profile 与 sandboxing API”,但官方仓库 main README 并未把这部分细节展开,可能仍是治理路线图而非已落地特性。生产落地前建议直接查 AAIF 官网与 SECURITY.md 的具体 commit。
aaif-goose/goose与 Block Goose 老文档站的同步状态:block.github.io/goose老站点是否完全废弃、是否会迁到 AAIF 域名暂不明确;本笔记引用的中文综述 (oao.tw 等) 仍以block/goose为基准。sst/opencode与opencode-ai/opencode的法律/治理关系:搜索结果一致认为是 SST 团队”接管/重写”,但没有找到官方说明是否经过原作者 Kujtim Hoxha 同意——npm 包opencode-ai现在指向 SST 代码这一点可能涉及命名权争议。落地前建议直接读两个仓库 README + LICENSE + 任何 NOTICE 文件。sst/opencode的 stars 数据:搜索结果给到 ~94k–170k 不等区间(94k 来自 2026-02 快照、170k 来自 2026-05 快照),增速极快但难以精确锁定。- Alma 的开源/闭源状态:
yetone/alma-releasesREADME 明写”仅是发布存档”,未找到任何源码仓库或 LICENSE,目前判断为闭源;但作者 yetone 同时维护多个开源项目(avante.nvim等),未来是否开源不可预测。如果用户给出 Alma 的实际源码仓库链接,本笔记应立即更新。 - Alma 的 MCP / agent 能力:官方页与归档仓 README 均未提到 MCP;中文综述提到 “Git worktree 抽象”与 “Memory” 等,但没有任何”agentic tool calling / subagent”语义证据。把它在矩阵里标 “GUI / 不适用” 是保守做法,可能低估了它实际具备的 agent 能力——建议用户实际跑一遍验证。
- Alma 的定价 / 企业方案:alma.now 官方页未公开任何定价,vibesparking 评测提到 “SSO + 访问控制”但没有报价;本笔记的”中”档企业部署评分基于二手信息,需要原厂确认。
- Cognition 收购 Windsurf 后的产品整合细节:Cascade IDE 是否会作为独立产品保留?Devin Web 控制台与 Windsurf IDE 的 agent 是同一份 backend 还是两套?官方未有明确说明。
- Manus 因 Meta 收购被中国监管否决后的产品方向:是否会调整服务区域 / 改组治理结构 / 接入特定云厂商,目前仅有外部报道、官方未表态。
- Qoder 1.0 GA 的国际可用性:是否仅在阿里云中国区可用?海外节点何时上线?官方页未给明确回答;国际客户落地前需要单独和阿里云商务确认。
- Trae SOLO 是否仍在 beta / 是否对国际用户开放:2026-03 推出后官方文档语义模糊(”SOLO 模式”在不同页面分别被描述为 beta / GA),且海外可访问性受字节产品出海策略影响,需要直接以官网当前状态为准。
后续行动
- 在本仓库实操:用
@earendil-works/pi-coding-agent与claude同时跑同一中等仓库的修改任务,记录 token 消耗、首次成功率、最终 PR 质量。 - 追加:把
sst/opencode与 Alma 也加进同一 benchmark,对照”开源 Cursor”与”桌面统一客户端”两种产品形态在真实开发流程中的取舍。 - 调研
pi与aaif-goose/goose之间是否已经有社区版pi-mcp-bridgeextension;同时跟踪 AAIF “agent runtime profile” 草案是否被pi/ OpenHands / Codex /sst/opencode共同实现。 - 把
earendil-works/gondolin真正在本机搭一次,验证 microvm 隔离的实用强度。 - 跟踪 Codex CLI 的 Linux Landlock + seccomp 配置实践,对照
pi + gondolin与aaif-goose/goose + AAIF sandboxing API做沙箱评测。 - 关注 2026 H2 是否会出现”agent harness 标准”,尤其 ACP(Agent Communication Protocol)能否中立化生态——AAIF 把 MCP + Goose + AGENTS.md 放到一起,是目前最可能产出标准的渠道。
- 单独跟踪:Alma 是否会公开源码、是否会接入 MCP——这两点决定它能不能从”AI 客户端”跨到”CLI agent”赛道。
- 新增(2026-06)跟踪项:Cognition + Windsurf 收购整合落地(Cascade 是否独立保留)、Manus 在中国监管否决 Meta 收购后产品方向、Qoder 1.0 GA 国际节点排期、Trae SOLO 国际开放状态、Cursor Composer 2 与 Trae SOLO 在 worktree 多 agent 上的实测对照、CrewAI 在企业自建 agent 系统中的真实采纳率。
来源
- earendil-works/pi — GitHub(项目主页)
- earendil-works 组织页 — GitHub
- earendil-works/pi — packages/coding-agent README
- pi docs: index
- pi docs: extensions
- pi docs: skills
- pi docs: packages
- pi docs: sessions
- pi docs: providers
- pi docs: containerization
- pi docs: sdk
- earendil-works/pi releases
- earendil-works/gondolin — Linux microvm sandbox
- Mario Zechner 加入 Earendil 的中文解读 — changchen.me
- Pi Coding Agent Harness — silenceper(中文综述)
- Agent 三层 API 设计:agentLoop / Agent / AgentHarness — CSDN
- pi 作者 Mario Zechner + Flask 之父 Armin Ronacher 播客 — LinkedIn
- Claude Code 替代品 10 强对比 — kevnu.com
- Terminal AI Agents 2025 Landscape — wal.sh
- Best AI Coding Assistants — Shakudo
- OpenAI Codex CLI 官方文档
- openai/codex — GitHub
- Anthropic Developer Docs(Claude Code)
- 2026 最强开源 AI 编程工具清单 — 博客园
- OpenHands 评测 — bestaitools.com
- Goose(Block)AI Coding Agent — 效率 AI
- aaif-goose/goose — GitHub(AAIF 化后的 Goose 规范仓库)
- aaif-goose/goose releases(含 v1.37.0 release notes)
- Newly Launched Agentic AI Foundation — Campus Technology(AAIF 启动报道)
- OpenAI, Anthropic and Block Join New Linux Foundation Effort — TechCrunch via NewsBreak
- AAIF Linux Foundation Governance Discussion — Windows Forum
- SWE-agent / Devin / 通义灵码对比 — PHP 中文网
- pi vs Claude Code/Codex/Trae/Qwen/Qoder — cnblogs/haochuang
- Best Terminal AI Coding Agents 2026 — Scopir
- sst/opencode — GitHub(OpenCode 当前规范仓库)
- opencode-ai/opencode — GitHub(OpenCode 历史原仓库,已基本停滞)
- OpenCode Terminal AI Coding Revolution — CSDN/xcbeyond
- 94K Star Open-Source AI Coding Helper — 2048ai.net
- Developer Navigator: sst/opencode — CSDN/wangxy_job
- Alma 官网(alma.now)
- yetone/alma-releases — GitHub(Alma 发布存档仓)
- yetone — GitHub Profile(Alma 作者,avante.nvim 作者)
- Alma — Elegant AI Provider Orchestration(Vibesparking 评测)
- Alma 接入 XiaomaiAPI 配置文档
- Alma 接入 CodeKey 配置文档
- Devin(Cognition)官方主页
- Cognition 收购 Windsurf — 官方博客
- Cursor 官方主页(Composer 2)
- Manus(Butterfly Effect)官方主页
- Trae(字节跳动 AI-native IDE)官方主页
- Qoder(阿里企业级 AI IDE)官方主页
- Replit 官方主页(Replit Agent 3)
- Jules(Google Labs)官方主页
- crewAIInc/crewAI — GitHub(multi-agent 框架)