AI Research

pi agent(earendil-works/pi)与 Claude Code、Codex CLI 对比:开源 CLI 编码代理全景(2026)

2026-06-05 #codex#claude-code#pi#cli-agent#ai-agent#comparison

pi agent(earendil-works/pi)与 Claude Code、Codex CLI 对比:开源 CLI 编码代理全景(2026)

‼️ 本笔记的”pi agent”特指 earendil-works/pi

这是 Mario Zechner(GitHub @badlogic)创建、2026 年 4 月随他加入 Armin Ronacher(Flask 之父)的 Public Benefit Corp Earendil 后转入 earendil-works 组织的”AI agent toolkit”monorepo。它的 npm 旗舰包是 @earendil-works/pi-coding-agent

**关于历史名 badlogic/pi-mono**:项目最早确实在 badlogic/pi-mono 仓库下开发,后整体迁移到 earendil-works/pi。同一份代码、同一作者、同一 license(MIT);旧链接通常被 GitHub 自动重定向到新地址(截至 2026-06-05 实测 badlogic/pi-mono/blob/main/README.md 直接落到 earendil-works/pi)。本笔记以新仓库为唯一权威来源;上一版笔记错把项目当作两个独立仓库或者只引用旧名,本次重做修正。

参考:earendil-works/pi GitHub 主页earendil-works 组织页changchen.me 关于 Mario 加入 Earendil 的解读

**‼️ 关于本笔记里的”Goose”:之前版本只引用 block/goose截至 2026-06-05,Block 出品的 Goose 已经把规范仓库迁到 aaif-goose/goose**——治理转入 Linux Foundation 旗下 Agentic AI Foundation (AAIF)。两者不是 fork、不是巧合同名,而是同一项目同一份代码的”组织搬家”:block/goose 已通过 GitHub transfer 重定向到 aaif-goose/goose,README 顶部明写 *”goose has moved! This project has moved from block/goose to the Agentic AI Foundation (AAIF) at the Linux Foundation.”*。本笔记用 aaif-goose/goose 指当前版本,用 block/goose 指迁移前历史快照(v1.x 早期)。两条对比线在矩阵里同时保留,方便看治理变更前后差异。

‼️ 关于 OpenCode 与 Alma(本次新增)

  • OpenCode 在前一版笔记里只是”同类清单”中的提及;本次升级为独立对比项,**唯一规范仓库是 sst/opencode**(SST/Serverless Stack 团队主导、TypeScript + Go、Bun runtime)。原 opencode-ai/opencode(Kujtim Hoxha 创建、Go-only)已基本停滞,npm 包名 opencode-ai 现指向 sst/opencode 代码——这是社区里最常被混淆的一对仓库,本笔记以 sst/opencode 为权威。上一版笔记把 OpenCode 写成”Zig + SolidJS”是错误,本次修正。
  • Almaalma.now 桌面应用,作者 yetone(同 avante.nvimfittencode.nvim 作者)。Alma 不是 CLI,而是桌面 GUI 客户端;源码未开源,yetone/alma-releases 仅是发布存档仓。本笔记把它纳入对比是因为它在中文 AI 用户群里能见度高、定位上和 Cursor / Claude Code 桌面版竞争,但本质属于”统一 AI provider 编排 GUI”而非纯 CLI agent,矩阵里相关行会用”GUI / 不适用”标注。

关于本次新增的 8 个对比对象(2026-06)
为体现 AI agent 生态的多元流派,本次新增 8 个高讨论度项目:Devin(Cognition)Cursor Composer 2Manus(Butterfly Effect)Trae SOLO(字节)Qoder(阿里)Replit Agent 3Jules(Google Labs)CrewAI。它们分别代表”自治 SaaS agent”、”IDE-native 多 agent”、”通用自治 agent”、”AI-native IDE”、”企业 IDE”、”Web-IDE 长程自治”、”异步 GitHub-native agent”、”multi-agent 框架”五大流派——与 pi 的 “primitives, not products” 哲学形成正面对照。

摘要

2026 年的开源 CLI 编码代理生态已基本成型。以 earendil-works/pi 为代表的”极简内核 + 可组合扩展”流派,与 OpenHands、Aider、Cline、Goose(现 aaif-goose/goose)、Plandex、SWE-agent、OpenCode(sst/opencode、Crush、Qwen Code、Gemini CLI、Kimi CLI 等不同设计取向并存;闭源侧由 Anthropic 的 Claude Code 与 OpenAI 的 Codex CLI 双寡头主导,桌面 GUI 阵营则有 yetone 的 Alma 这种”统一 provider 编排”产品。2026 年生态进一步外扩:自治 SaaS agent 流派以 Devin(Cognition + Windsurf)Manus(Butterfly Effect)Replit Agent 3Jules(Google Labs) 为代表;IDE-native 多 agent 流派以 Cursor Composer 2Trae SOLO(字节)Qoder(阿里) 为代表;multi-agent 框架派的代表则是 CrewAI。本笔记的核心结论:**earendil-works/pi 与 Claude Code/Codex 的根本差异是产品形态——pi 是一个故意保持骨架级最小的 harness(”primitives not products”),把 MCP、subagent、plan mode、权限弹窗等几乎所有”成品功能”全部下放给用户用 TypeScript extension/skill/package 自行组合**;Claude Code 与 Codex 则代表”开箱即用、企业可签约”的成熟产品;sst/opencode 走”client-server + plan/build 双代理”路线,企图在终端里复刻 Cursor 体验;Alma 则把同一组 provider 装进 GUI、瞄准非终端用户;Devin / Manus / Replit / Jules 走”黑盒长程自治 SaaS”路线;Cursor / Trae / Qoder 把 multi-agent 做成 IDE 默认特性;CrewAI 则把 agent 编排彻底框架化、交给开发者用 Python 程序化组合。选型上,pi 适合愿意自定义 harness 的高级开发者与研究者;OpenHands 与 aaif-goose/goose 适合企业级自主代理与 MCP 生态(后者还有 Linux Foundation 中立治理加成);sst/opencode 适合想要”开源 Cursor 替代”且偏终端的团队;Alma 适合不想离开桌面、要在多家订阅之间切换的个人/小团队;Claude Code / Codex 仍是”平均水平最高、上手最快”的默认选择;Devin / Jules 适合”丢 ticket 进去、回头看 PR”的异步派;Cursor / Trae / Qoder 适合”IDE 内多 agent 并行 worktree”的工程团队;Replit Agent 3 适合 Web-IDE 教学与原型;CrewAI 适合自建 multi-agent 工作流的研究/工程团队。

研究问题

  • earendil-works/pi 究竟是什么?它的归属、版本、活跃度、架构、提示词框架、工具系统、扩展性是什么样?
  • 它和 badlogic/pi-mono 是不是同一个项目?两者的差别是什么?
  • 同类开源 CLI agent(OpenHands、Aider、Cline、Goose(**aaif-goose/goose** vs 历史 block/goose)、SWE-agent、Plandex、OpenCode(sst/opencode vs opencode-ai/opencode、Crush、Qwen Code、Gemini CLI、Kimi CLI 等)各自的定位、底座、社区活跃度如何?
  • aaif-goose/goose 与历史 block/goose 是 fork 还是组织迁移?AAIF 化之后治理 / 路线 / 安全模型有什么变化?
  • sst/opencode 与原始 opencode-ai/opencode 是什么关系?为什么 npm 包 opencode-ai 现在指向 SST 仓库?
  • Alma(yetone / alma.now)的定位与 CLI agent 的差异?它是开源还是闭源?放进对比矩阵的合理位置在哪?
  • 闭源对照 Claude Code 与 OpenAI Codex CLI 的最新(2026)能力差异:模型可替换性、生态、权限/沙箱、上下文管理、企业可用性、价格模式?
  • 本次新增 8 个对比对象Devin(Cognition + Windsurf)Cursor Composer 2Manus(Butterfly Effect)Trae SOLO(字节)Qoder(阿里)Replit Agent 3Jules(Google Labs)CrewAI——它们各自是什么定位、底座、形态?与 pi 的”primitives, not products”哲学如何对照?
  • 横向比较哪些维度是真正的差异点?2026 年视角下风险与未来趋势是什么?

发现

一、earendil-works/pi 项目身份与活跃度

  1. 归属与许可证 — Owner:earendil-works 组织(Austria 注册的 PBC,”Bearer of Light” tagline,由 Armin Ronacher、Vegar Stikbakke、Colin Daymond 等任成员)。仓库 earendil-works/pi 是其旗舰开源项目,MIT License。来源

  2. 作者与历史 — 实际作者 Mario Zechner(@badlogic,libGDX 作者)2026 年 4 月加入 Earendil 时把原 badlogic/pi-mono 整个迁移过来。最新 commits 仍由 badlogic 主导,外加 xl0Perlencevegarsti 等社区贡献者;GitHub 已对旧 URL 做 transfer-redirect。来源

  3. 截至 2026-06-05 的状态 — 主语言 TypeScript(93.5%),≈59.8k stars / 7.2k forks,主分支 4427+ commits,226 个 release。最新版本 v0.78.1(2026-06-04),更新主要是提供商扩展(Ant Ling、NVIDIA NIM、MiniMax-M3)、HTML 导出 XSS 修复、扩展安装目录权限收紧等小步快跑式增量。来源

  4. monorepo 四大包(与上一版笔记修正:是 4 个不是 3 个):

    • @earendil-works/pi-coding-agent — 交互式 CLI(旗舰)
    • @earendil-works/pi-agent-core — agent 运行时(tool calling、状态管理)
    • @earendil-works/pi-ai — 统一多 provider LLM API(OpenAI / Anthropic / Google / Bedrock / Vertex / Azure / Cloudflare / DeepSeek / xAI / Groq / Together / Hugging Face / OpenRouter / Mistral / Kimi / MiniMax / Xiaomi MiMo / Ollama 等 20+)
    • @earendil-works/pi-tui — 差分渲染终端 UI 库

    组织内还有 pi-chat(Slack/Discord/Telegram 集成)、pi-review(代码评审扩展)、pi-tutorial(教程模式)、gondolin(Linux microvm 沙箱)、absurd(Python durability 实验)等姊妹仓库。来源

二、设计哲学:”Primitives, not products”

  1. 极简内核 — 系统提示约 < 1000 token,只暴露四个原子工具:readwriteeditbash(注意:是 bash 不是 shell,与上一版笔记修正)。文档原文:”Pi is aggressively extensible so it doesn’t have to dictate your workflow.” 复杂能力一律不进核心。来源
  2. 官方明确”不内置” — README/docs 直接列举:
    • No MCP by default:要 MCP 自己装 extension/package
    • No sub-agents baked in:要子代理自己 spawn pi.exec() 或写扩展(仓库内有 subagent.ts 示例)
    • No permission popups:不做权限弹窗,建议跑容器或自己实现确认流
    • No plan mode / built-in to-dos / background bash:交给 extension(仓库有 plan-mode/ 示例扩展)
      来源
  3. 三层 SDK API@earendil-works/pi-agent-core):
    • createAgentSession — 高层工厂,单个 AgentSession
    • Agent 类 — 直接管理 LLM 状态、history、thinking level、system prompt
    • createAgentSessionRuntime — 多会话/切换/fork/clone 的运行时
      事件驱动 + 可订阅流式接口;中文社区把它解读为 agentLoop / Agent / AgentHarness 三层(来自 silenceper、CSDN 综述),但仓库 docs 自己没有用这个标签。来源silenceper 综述

三、扩展系统的四个层次

  1. Skills(on-demand capability)— 自包含目录 + SKILL.md,支持”progressive disclosure”:启动时只把名字 + 描述塞进 system prompt,匹配到任务时才完整加载。可以放在全局、项目内、package 内或 CLI 指定路径,也可以用 /skill:name 显式触发。遵循 Agent Skills 标准。来源
  2. Prompt Templates(slash commands)— 可重用 prompt 模板,绑到 /cmd 命令上。
  3. Extensions(TypeScript 模块)— 自动从 ~/.pi/agent/extensions/.pi/extensions/ 发现,能力包括:
    • pi.registerTool() 注册新工具或覆盖内置工具
    • 订阅生命周期事件:session_start/shutdown/before_switch/before_forkbefore_agent_startagent_start/endturn_start/endtool_call(可阻断)、tool_result(可改写)、tool_execution_start/endmodel_selectthinking_level_selectinput(可改写或拦截)
    • 通过 ctx.ui 弹 select/confirm/input 与自定义 TUI 组件
    • 注册 /commands 与键盘快捷键
    • pi.appendEntry() 持久化扩展自己的状态
      来源
  4. Packages(组合 + 分发)— 用 package.json 里的 pi 字段或约定目录结构声明,能同时打包 extensions + skills + prompts + themes。安装来源三种:npm(~/.pi/agent/npm/)、git(.pi/git/)、local path。命令是 pi install / pi update安全提示明确:”Pi packages run with full system access. Extensions execute arbitrary code, and skills can instruct the model to perform any action including running executables.” 责任推给用户审计。来源

四、Session = 树而非链

  1. JSONL 树结构 — 每个 entry 有 idparentId,”current position” 是活动叶子。/tree 交互式浏览历史、折叠、贴标签、跳转;选 user 消息进 editor 编辑、选 assistant 直接续写。/fork 在更早节点拆出新 session 文件;/clone 复制当前活跃分支。/share 上传成 GitHub gist + HTML 链接,/export 生成独立 HTML。Hugging Face 数据集 badlogicgames/pi-mono 用来发布作者本人的真实工作 session,作为非 toy benchmark 的训练材料。来源

五、Provider 与认证

  1. 订阅级登录 — pi-ai 原生支持 ChatGPT Plus/Pro(Codex 通道)、Claude Pro/Max、GitHub Copilot 三种订阅 OAuth;token 存 ~/.pi/agent/auth.json 自动刷新。也兼容 API Key、自定义 provider、Azure / Bedrock / Vertex / Cloudflare AI Gateway 等云后端。来源

六、沙箱:三套官方推荐模式

  1. OpenShell — 适合需要”policy-controlled sandbox with filesystem, process, network, credential, and inference controls”。NVIDIA OpenShell 的策略式沙箱,credential 与推理也在管控边界内。

  2. Gondolinearendil-works/gondolin 自家实验性 Linux microvm(QEMU/krun 后端)。”want pi on the host but all built-in tools routed into the VM”——auth 留在宿主、工具进 VM。支持可编程 HTTP/TLS 出站策略、密钥占位注入、JS 控制 VFS、SSH allowlist、磁盘 checkpoint、ingress gateway。

  3. Plain Docker — 最简单的整进程容器化,但需要把 API key 带进容器。

    docs 直接说:”OpenShell 与 Gondolin 提供凭据隔离,Docker 不行”——很难得地坦诚。来源

七、其他主流开源 CLI agent(更新版)

  1. OpenHands(前 OpenDevin) — 多代理工作区(shell+browser+editor+planner),2026 引入 PLAN.md beta;每 session Docker 沙箱;SWE-bench Verified ~53%(Claude 3.5/4.5);模型可换(Claude/GPT/Ollama);强企业向,token 消耗较高。来源
  2. Aider — 终端 + Git 原生 pair programmer,≈35–39k stars。亮点:基于 ctags 的 Repo Map、自动 commit message、linter 自动修复;100+ provider;无 shell/browser 自主执行——更安全但自主性弱;Polyglot benchmark 84.9%。来源
  3. Cline(前 Claude Dev) — 主要是 VS Code/JetBrains 插件,不是纯 CLI;GUI human-in-the-loop;强 Anthropic 集成。来源
  4. Goose(历史名 block/goose,现规范地址 aaif-goose/goose — Block 出品的 Rust runtime,CLI / 桌面 / API 三入口;多 LLM;YAML Recipes workflow;3000+ MCP 扩展;隐私优先;架构三层(Interface / Agent Logic / Extensions)。**2025-12 起治理移交 Linux Foundation 旗下 Agentic AI Foundation (AAIF)**——README 顶部明写 “goose has moved from block/goose to the Agentic AI Foundation (AAIF) at the Linux Foundation.” block/goose 已 GitHub transfer 重定向到新仓库;不是 fork,是组织搬家。来源
  5. aaif-goose/goose(AAIF 化后的 Goose) — 当前规范仓库地址(2026-06);Apache-2.0;主语言 Rust(63.8%)+ TypeScript(29.4%);≈46.5k stars / 4.9k forks / 137 个 release。最新版本 v1.37.0(2026-06-03),新增 xAI SuperGrok / 阿里 Qwen / NEAR AI Cloud / Scaleway / Atomic Chat 等 provider,强化 ACP(Agent Connection Protocol)会话级 system prompt 与 OAuth proactive refresh,引入 Hooks 系统/model/goal 斜杠命令、goose://resume goose://new-session 深链、加密 Nostr session 共享、俄/土语本地化。AAIF 化最重要的实质变化在治理与安全:作为 AAIF 旗舰项目(与 MCP、AGENTS.md 并列),由 OpenAI / Anthropic / Block / Google / Microsoft / AWS 共同背书;红队反馈后 AAIF 引入 MCP 安全 profile 与 sandboxing API 草案(仍在演进,未在 main README 详细化),SECURITY.md 是漏洞披露入口。Block 内部公开数据:开源前每工程师每周净增 8–10 小时产出。来源Campus Technology AAIF 报道
  6. Plandex — 长程规划与大型 codebase 任务编排,多代理并行子任务、自我调试。来源
  7. SWE-agent(Princeton NLP) — 学术起家,简化 ACI(Agent-Computer Interface),SWE-bench ~12.29% / 平均 93s;偏 agent ↔ repo 交互形式化研究。来源
  8. OpenCode(sst/opencode,本次升级为独立项) — SST/Serverless Stack 团队主导的开源 AI 编码代理,MIT License,主语言 TypeScript(68.1%)+ Go(上一版笔记里写”Zig + SolidJS”是错误,本次修正)、Bun runtime + Turbo monorepo + SST 部署、Oxlint。截至 2026-06-05 ≈170k stars / 20.3k forks / 5000+ open issues,最新版本 v1.15.13(2026-05-30)——堪称 2026 年开源 CLI agent 新晋第一明星。核心特性:
    • Plan / Build 双代理(Tab 键切换):Plan 是只读探索模式,跑 bash 之前会要权限;Build 是全权限执行模式。等价于 Claude Code 的 plan mode + execute 一体化。
    • General Subagent:处理复杂搜索、跨文件多步任务,是 sst/opencode 与原始 opencode-ai/opencode 最大的差异。
    • Client-Server 架构:服务端可本地或远程部署,前端可以是 console、web UI、VS Code SDK、移动端(仓库内有 apps/mobile/ 等 package);这是它”开源 Cursor”定位的基础。
    • 75+ 模型:OpenAI / Anthropic / Google / Ollama / Llama 3 / Qwen / 本地模型;privacy-focused,明确强调 offline 能力。
    • AGENTS.md 自动生成 + GitHub/GitLab 深度集成:PR comment /opencode 触发;auto PR review、issue triage、branch 创建。
    • LSP 集成:在终端里得到接近 IDE 的补全 / 跳转能力。
    • 历史与命名混淆:原项目 opencode-ai/opencode(Kujtim Hoxha、Go-only)已基本停滞;SST 团队接管/重写后改用 TS+Go 并保留 npm 包名 opencode-ai,导致 npm 包名与 GitHub 组织名不一致。**社区一致推荐 sst/opencode**。来源2026 OpenCode 综述 - 2048ai.net
  9. Crush / Kimi CLI / Qwen Code / Gemini CLI — Crush 内置 LSP 上下文与 MCP(≈14.4k stars);Qwen Code 256K 原生上下文(可扩到 1M),中文场景优化;Gemini CLI 免费额度最大(1000 请求/日);Kimi CLI 走 Moonshot 自家模型 + 国内生态。来源

七·补、Alma:桌面 GUI 客户端(非 CLI 的对照项)

  1. Alma(yetone 出品的桌面 AI 客户端) — 与本笔记其他对比对象不同,Alma 是桌面 GUI 应用而非 CLI,但因为它在中文 AI 用户群里能见度极高、定位上直接对标 Cursor / Claude Code 桌面体验,本次纳入对比矩阵作为参照。要点:
    • 定位:作者自述 “A beautiful desktop application that unifies your AI experience”——把多家 AI provider 装进同一个 Mac/Win/Linux 桌面 App,重点是体验一致性与多模型编排,而非纯编码。
    • 作者yetone,国人开发者,同时也是 avante.nvim(Neovim 里最火的 AI 插件)和 fittencode.nvim 等工具的作者,在 AI / editor 工具圈有持续产品力。
    • 开闭源官方未开放源码。GitHub 上 yetone/alma-releases 仅是发布存档仓(README 明写 “This is just a repository for archiving”),截至 2026-06-05 已发布 732 个 release,最新 v0.0.812(2026-06-03)——更新极其频繁,每天近 1 个版本,但 LICENSE 与定价信息官方页面均未公开。
    • 核心特性(来自 alma.now 官方页 + Xiaomai/CodeKey 第三方配置文档 + vibesparking 评测):
      • 统一 provider:原生支持 OpenAI / Anthropic(Claude Sonnet/Opus)/ Google Gemini / DeepSeek / 自定义 base URL(XiaomaiAPI、CodeKey 等中转服务都有专门接入文档)。
      • 持久 Memory 系统:跨会话保留偏好与历史。
      • 集成开发工具:内置终端、可视化 Git 操作(中文综述提到使用 Git worktree 抽象做任务隔离,与 Claude Code 的 worktree 工作流思路一致)、内置浏览器查文档、代码生成与补全。
      • 企业能力:SSO 与访问控制(来自 vibesparking 评测,未在官方页直接列出)。
      • Web Search + Advanced Tool Use:标 “for complex tasks and data analysis”。
      • MCP 支持:官方页与归档仓 README 均未明确说明支持 MCP;本笔记保守标 “未确认”。
    • 平台:macOS(Apple Silicon 主力)、Windows、Linux 均有构建。
    • 典型用户:偏好桌面 GUI、不想留在终端、需要在 Claude/GPT/Gemini/DeepSeek 之间频繁切换且有自定义 base URL 中转需求的个人开发者与小团队;中文用户社区是其主要推广渠道。
    • 与 pi / Claude Code / Codex 的关键差异:Alma 把 LLM provider 编排做成桌面 App 体验,目标用户与 CLI agent 不重叠;它不是 agentic harness(没有公开的 tool calling 框架、没有 subagent / plan mode 这种”让模型自主多步执行”的产品定位),更像”高级聊天 + 内置工具”的 client。所以放进矩阵时 plan mode、subagent、sandbox 等几列基本是 “GUI / 不适用”。来源yetone/alma-releasesVibesparking 评测Xiaomai 接入文档CodeKey 接入文档

八、闭源对照:Claude Code 与 Codex CLI

  1. Claude Code(Anthropic 官方 CLI) — 2026 形态:Agent SDK(Python/TS)、Skills、Hooks(pre/post)、MCP(一等公民)、Subagents(角色委派 + 冲突仲裁)、Plan mode(目标分解 + 动态重规划 + 进度跟踪);底座默认 Claude Sonnet 4.5;SWE-bench 72%+。订阅 $20–200/月;企业版有审计与 SSO。来源
  2. OpenAI Codex CLI — 2025 中重写为 Rust 核心 + Node CLI 包装(codex-rs/codex-cli/mcp-server/),Tokio 异步 + Ratatui TUI;模型默认 GPT-5-Codex;MCP 同时做 client+server。来源
  3. Codex 三档审批/沙箱Suggest / Auto-Edit / Full-Auto;权限策略 ReadOnly / WorkspaceWrite / DangerFullAccess;可 --dangerously-bypass-approvals-and-sandbox(仅推荐 VM/容器)。来源
  4. Codex OS 级沙箱 — macOS Seatbelt(sandbox-exec)、Linux Landlock + seccomp(企业可叠 bubblewrap)、Windows 仅 WSL2 + Restricted Tokens。默认范围 $PWD~/.codex来源
  5. Codex 2025–2026 关键更新 — Session Resumption、VS Code 插件、ChatGPT 账号同步(Pro/Enterprise 自动配 key)、自定义 prompt 库、命令白名单(git/npm 等)。Apache-2.0。来源
  6. 价格与模型耦合 — Codex 与 ChatGPT 订阅捆绑、Claude Code 与 Anthropic 订阅捆绑;两者都允许 API key,但实际工具调用与提示词都是按自家模型调过的——把 Claude Code 接到 GPT 上,Plan mode/Subagents 稳定性会下降。来源

九、十维对比矩阵

矩阵结构:行是对比维度,列是对比对象。本次新增 / 升级两列:OpenCode(升级为 sst/opencode 权威数据)Alma(新增桌面 GUI 对照)。Alma 在很多列上是”GUI / 不适用”——把它列出来是为了让”非 CLI 桌面客户端 vs CLI agent harness”的差异可视化,不是说它在 agent 能力上等价。

维度 earendil-works/pi OpenHands Aider block/goose(迁移前快照) aaif-goose/goose(当前规范) Cline OpenCode(sst/opencode Qwen Code Alma(桌面 GUI) Claude Code Codex CLI
开源协议 MIT MIT Apache-2.0 Apache-2.0 Apache-2.0(AAIF 治理) Apache-2.0 MIT Apache-2.0 闭源(仅发布存档仓 yetone/alma-releases,无公开 LICENSE) 闭源(CLI 二进制) Apache-2.0
底座模型耦合 解耦(pi-ai 抽 20+ provider,含 ChatGPT Pro/Claude Pro/Copilot OAuth) 解耦(Claude/GPT/Ollama) 解耦(100+ provider) 解耦(15+ LLM) 解耦(15+ LLM;v1.37 新增 xAI SuperGrok / Qwen / NEAR / Scaleway / Atomic Chat;ACP 走订阅) 偏向 Anthropic 解耦(75+ 模型;OpenAI/Anthropic/Google/Ollama/Llama 3/Qwen + 本地) 强耦合 Qwen 解耦(OpenAI / Anthropic / Gemini / DeepSeek / 自定义 base URL) 强耦合 Claude 强耦合 GPT-5-Codex
核心工具 4 个:read/write/edit/bash shell + browser + editor + planner edit + git + lint shell + MCP shell + MCP + Hooks + 深链(goose:// IDE 内嵌 shell + LSP + Plan/Build 双代理 + General Subagent shell + 大上下文检索 聊天 + 内置终端 + 可视化 Git(worktree 抽象)+ 内置浏览器 + Memory + Web Search(GUI 工具,无 agentic tool calling) 全套 + Skills/Hooks shell + apply_patch
插件机制 TS extension + skill + package(无内置 MCP 内建工具集 + MCP 内置工具集(Repo Map / linter / git) MCP(3000+ 扩展) MCP(3000+ 扩展)+ Hooks 系统 + Recipes(YAML) VS Code 插件 + 工具 VS Code SDK + console / web / mobile 客户端 + AGENTS.md 自动生成 内置 + agent.md 未公开扩展 API(GUI App,Memory 与 provider 配置可定制) Skills + Hooks + MCP(一等公民) MCP client+server + 命令白名单
Subagent 无内置,有 subagent.ts 示例 多 agent 并行 + PLAN.md 单 agent 单 agent + Recipes 单 agent + Recipes(YAML workflow,多步任务编排) 单 agent Plan / Build + General Subagent(处理复杂搜索与多步任务) 单 agent GUI / 不适用 Subagents(角色 + 仲裁) 单 agent + 审批模式
Plan mode 无内置,有 plan-mode/ 示例扩展 PLAN.md beta Recipes(YAML) Recipes + /goal 斜杠命令 Plan mode 内置(Tab 键切 Plan/Build;Plan 是只读探索) GUI / 不适用 一等公民
Sandbox / 权限 无内置;推荐 OpenShell / Gondolin / Docker 每 session Docker 无 shell 自主执行(最安全的”无”) 本地执行 + 权限层 本地执行 + 权限层;AAIF 红队后引入 MCP 安全 profile + sandboxing API 草案(演进中) IDE 内 human-in-loop Plan 模式跑 bash 前请求权限 + Client-Server 隔离(远程部署天然分进程) 桌面 App 沙箱(macOS App sandbox / Windows AppContainer 等系统级隔离,未公开细节) 内置权限提示 + plan mode Seatbelt / Landlock+seccomp / WSL2 三档
上下文/记忆 树状 session(JSONL)+ /tree + HTML 导出 + HF 分享 多代理工作区 Repo Map + git 历史 Recipes(YAML workflow) Recipes + 加密 Nostr session 共享 + 深链恢复 IDE 上下文 AGENTS.md + LSP 索引 + 远程 server context(client/server 分离持久化) 256K → 1M 大上下文 持久 Memory 系统(跨会话保留偏好 / 历史) Skills 持久化 + 文件级 memory Session Resumption + prompt 库
IDE 集成 终端为主 Web IDE / GitHub 直连 终端 + 编辑器外挂 CLI / 桌面 CLI / 桌面 / API 三入口 + ACP 原生 VS Code/JetBrains 终端 TUI + Web UI + VS Code SDK + 移动端 client 终端 桌面 GUI App(macOS / Windows / Linux) VS Code 扩展 VS Code 插件
企业部署 弱(需自建容器/审计) 强(Docker/K8s) 弱(个人开发者向) 强(Block 内部 + 私有 MCP) 强(Linux Foundation 中立治理 + 多家厂商背书:OpenAI/Anthropic/Block/Google/Microsoft/AWS) 中(IDE 部署) 强(Client-Server 架构 + privacy-focused,金融/医疗团队反馈在用 offline 部署) 中(阿里云生态) 中(vibesparking 评测提到 SSO + 访问控制,官方页未公开企业方案 强(SSO、审计、合同) 强(ChatGPT Enterprise 同步)
社区规模 (2026-06) ≈59.8k stars / 7.2k forks / 4427+ commits 中-大(中文社区热门) ≈35–39k stars 迁移前 ≈45k+ ≈46.5k stars / 4.9k forks / 137 release ≈170k stars / 20.3k forks / 5000+ open issues / v1.15.13(2026-05-30) — 2026 年增速最猛的开源 CLI agent alma-releases 仓 732 个 release / v0.0.812(2026-06-03);社区主要在中文圈与 yetone 个人粉丝群 ≈48k stars(公开仓) ≈49.7k–54.5k stars

stars 数据来自各仓库截至 2026-05–06 的搜索快照,可能略有偏差。block/goose 的链接已 GitHub transfer 重定向到 aaif-goose/goose,所以两列其实指向同一份代码、同一段 git 历史,差别在治理 / 路线 / 安全 profile,对比矩阵把它们拆成两列只是为了凸显 AAIF 化前后的增量。OpenCode 列已升级到 sst/opencode 权威数据(上一版笔记记的 31.5k stars / Zig+SolidJS 是错误,实际是 TypeScript+Go / 170k stars)。Alma 列很多格用了 “GUI / 不适用”——它和 CLI agent 是不同形态产品,放在矩阵里只是为了让边界可见。

十、其他高讨论度 AI agent(2026 新增 8 个对比对象)

本节集中刻画 8 个 2026 年高讨论度但不属于纯 CLI agent赛道的项目——自治 SaaS、IDE-native 多 agent、Web-IDE 长程自治、multi-agent 框架,与 pi 的”primitives, not products”哲学形成正面对照。每个子节固定结构:定位 / 底座 / 形态 / 工具 / 典型用户 / vs pi / 引用。

10.1 Devin(Cognition + Windsurf)

  • 定位:自治 SaaS agent,被设计成”AI 软件工程师”,可分配 ticket 后异步独立完成
  • 底座:Cognition 自家模型 + 多家 LLM 编排
  • 形态:SaaS(Web 控制台)+ 收购 Windsurf 后整合 IDE 端(2026 年 Cognition 收购 Windsurf)
  • 工具:浏览器 / shell / 编辑器 / 自有 sandbox
  • 典型用户:企业团队批量分配 PR / bug fix
  • vs pi:Devin 是产品,pi 是工具箱;Devin 长程自治,pi 单步原子操作
  • 引用:devin.aiCognition acquires Windsurf 报道

10.2 Cursor Composer 2

  • 定位:IDE-native AI 编辑器,Composer 2 引入 worktree 多 agent 并行
  • 底座:Anthropic Claude / OpenAI GPT / Cursor 自训模型
  • 形态:VS Code fork IDE
  • 工具:内置 codebase indexing、agent loop、MCP
  • 典型用户:日常 IDE 编码者
  • vs pi:Cursor 是 IDE 体验中心,pi 是 CLI;Cursor 多 agent 是产品默认,pi 靠 extension
  • 引用:cursor.com

10.3 Manus(Butterfly Effect)

  • 定位:通用自治 agent(”Multi-agent Universal Solver”),可执行长任务(写报告、订机票等)
  • 底座:未公开(多 LLM)
  • 形态:Web SaaS
  • 典型用户:通用消费者 / 商务自动化
  • 要点:2026 年 Meta 试图收购 Butterfly Effect 被中国监管否决(事实标注,后续产品方向待跟踪)
  • vs pi:Manus 是黑盒长程自治,pi 是透明工具箱
  • 引用:manus.im

10.4 Trae SOLO(字节)

  • 定位:字节跳动出品的 AI-native IDE,2026-03 推出独立 SOLO 模式(多 agent 并行)
  • 底座:豆包 / Claude / GPT 多家
  • 形态:独立 IDE(VS Code fork)
  • 工具:MCP 兼容
  • 典型用户:中国开发者 / 跨国团队
  • vs pi:Trae 是中国版 Cursor,pi 是 CLI primitives
  • 引用:trae.ai

10.5 Qoder(阿里)

  • 定位:阿里出品的企业级 AI IDE,2026-05-15 GA 1.0,主打 Quest 模式(任务驱动)
  • 底座:通义千问 + 多家 LLM
  • 形态:独立 IDE
  • 工具:MCP、Quest 模式、企业 SSO
  • 典型用户:阿里云 / 国央企
  • vs pi:Qoder 是企业产品,pi 是个人工具箱
  • 引用:qoder.com

10.6 Replit Agent 3

  • 定位:Web-IDE + 长程自治(最长 200 分钟单任务),可在线部署
  • 底座:Anthropic Claude + OpenAI
  • 形态:Web IDE + cloud sandbox
  • 典型用户:原型开发 / 教育
  • vs pi:Replit 是云端一体化,pi 是本地 CLI
  • 引用:replit.com

10.7 Jules(Google Labs)

  • 定位:异步 GitHub-native agent,可在 GitHub PR/issue 上挂载,自动开 PR 修复
  • 底座:Gemini 3.1 Pro
  • 形态:GitHub App + Web 控制台
  • 典型用户:GitHub 重度团队
  • vs pi:Jules 是 GitHub 集成 SaaS,pi 是本地 CLI
  • 引用:jules.google

10.8 CrewAI

  • 定位:Python multi-agent 框架,让开发者编排多个 agent 协作(角色分工 + 任务流)
  • 底座:与任意 LLM provider 配合(OpenAI / Anthropic / 本地模型)
  • 形态:Python library
  • 典型用户:研究者 / 自建 agent 系统的工程团队
  • 当前版本:1.14.4(2026-06)
  • vs pi:CrewAI 是框架(程序化编排),pi 是 CLI 产品;定位完全不同流派
  • 引用:github.com/crewAIInc/crewAI

10.9 8 个新增对象的浓缩对比小矩阵

为避免与第九节的主矩阵列数过宽,本小节单独列出 8 个新增对象。是 10 维(与主矩阵共享术语),是 8 个项目。GUI/SaaS 不适用列标 “—“ 或 “SaaS/IDE”。

项目 开源协议 底座耦合 核心工具 插件机制 Subagent Plan mode Sandbox/权限 上下文/记忆 IDE 集成 企业部署
Devin 闭源 SaaS Cognition 自家 + 多 LLM 浏览器/shell/编辑器 + 自有 sandbox SaaS API 内置长程自治 任务分解 + 异步执行 自有云端 sandbox 跨 ticket 持久 Web 控制台 + Windsurf IDE 强(企业 SaaS 合同)
Cursor Composer 2 闭源(VS Code fork) 多家(Claude/GPT/自训) codebase indexing + agent loop + MCP MCP + IDE 扩展 多 agent worktree 并行 内置 plan IDE 进程 + 用户审批 索引 + 长上下文 自身就是 IDE 强(Cursor for Business)
Manus 闭源 SaaS 未公开(多 LLM 编排) 通用浏览器 + 文件 + 工具调用 SaaS(无插件 API) 多 agent 黑盒 长程任务自动分解 云端 sandbox(黑盒) 长程会话 中(C 端 + 商务 SaaS)
Trae SOLO 闭源(VS Code fork) 豆包 + Claude + GPT IDE 工具集 + MCP + SOLO 多 agent MCP 兼容 SOLO 多 agent 并行 内置 IDE 进程 IDE 索引 自身就是 IDE 中(字节生态)
Qoder 闭源(独立 IDE) 通义千问 + 多家 LLM Quest 模式 + MCP + 企业 SSO MCP Quest 模式任务驱动 Quest 模式 IDE 进程 + 企业策略 项目级索引 自身就是 IDE 强(阿里云 / 国央企)
Replit Agent 3 闭源(Web IDE) Claude + OpenAI Web IDE + cloud sandbox + 在线部署 Replit 平台 长程自治(≤200 分钟) 任务自动分解 Cloud sandbox 项目持久 自身就是 Web IDE 中(教育 / 原型)
Jules 闭源(Google Labs) Gemini 3.1 Pro GitHub PR/issue 挂载 + Web 控制台 GitHub App 异步独立开 PR 异步任务规划 Google 云端 sandbox PR/issue 上下文 GitHub 原生 中(GitHub 团队)
CrewAI MIT 任意 LLM provider Python 框架(无内置 CLI) Python library 程序化编排 多 agent 角色 + 任务流(核心卖点) 由用户代码编排 由用户实现 由用户实现 无(库) 中(自建 agent 系统)

对比与判断

1. 真正的差异点:完成度 vs 可塑性

  • Claude Code、Codex CLI:MCP、Sandbox、Subagent/Plan、企业权限做成默认开。代价是行为被官方调教过,深度自定义要走 Skills / Hooks / AGENTS.md,且模型替换会显著降级。
  • earendil-works/pi:故意把这些全部下放到 extension / skill / package。短期上手更难;长期可以让一个团队真正拥有自己的 harness(公司专属 review skill / 项目模板 / 评审 SOP)。它给出的不是产品,而是写产品需要的零件
  • **OpenHands、aaif-goose/goose**:两端折中——aaif-goose/goose 借 MCP + Hooks + AAIF 中立治理做生态、OpenHands 借 Docker 做企业级隔离。
  • **sst/opencode**:是开源侧”完成度最高”的代表——把 Claude Code 的 plan/build 模式 + Cursor 的 client-server 架构 + AGENTS.md 全部内置成默认开,但代码完全开源、模型完全解耦。它和 pi 是开源 CLI agent 谱系两端:pi 极简、sst/opencode 极全。
  • Alma:不在”agent harness”赛道里,是”统一桌面 AI 客户端”赛道;要把它和 Claude Code 比,更合适的对照是 Cursor / Claude Desktop 而不是 CLI agent。本笔记列出来主要是因为用户社区会拿它和 Claude Code 桌面体验直接对比。

2. 模型耦合度的”隐性”差异

表面上 Claude Code 和 Codex 都”支持自定义 API key”,但工具调用与提示词都是按自家模型调过的pi / Aider / aaif-goose/goose / sst/opencode / Alma 在这点上都是真正模型无关的,是它们存在的核心理由之一。pi-ai 把 20+ provider 都抽象在同一接口下,并直接支持 ChatGPT Pro / Claude Pro / Copilot 三种订阅级 OAuth——这意味着 pi 的用户可以用同一个 harness 在三家订阅之间切换底座,这是 Claude Code 与 Codex 都做不到的。aaif-goose/goose 走的是另一条路线:通过 ACP(Agent Connection Protocol)让自己挂上各家订阅,覆盖面相似但实现不同。sst/opencode 直接挂 75+ 模型且强调本地/offline 能力。Alma 因为是闭源 GUI,多 provider 编排做得很顺(XiaomaiAPI / CodeKey 之类的中转 base URL 都有专门接入指南),但代价是 prompt / tool calling 框架不可审计、不可替换。

3. 沙箱:从”可选”变成”产品级护城河”

2026 年最显著的变化:Codex 把 Seatbelt / Landlock+seccomp 做成产品默认;Claude Code 强化 Plan/审批;OpenHands 以 Docker-per-session 出名;**aaif-goose/goose 在 AAIF 化后由基金会推动 MCP 安全 profile 与 sandboxing API 草案——治理中立化让它可以更容易被多家厂商共同 review,但具体落地仍在演进。sst/opencode 借 client-server 架构天然把执行体与终端 UI 分开,远程部署时是天然进程隔离;Plan 模式跑 bash 前会要权限。pi 在这条线上明显落后——文档明说自己”没有权限系统”,企业落地需要团队自建容器化 wrapper(Earendil 自家的 gondolin 是当前最完整的方案,但仍是”实验性”标签)。这既是它的设计选择,也是潜在风险。Alma 作为桌面 App**,依赖 OS 级 App sandbox(macOS App Sandbox / Windows AppContainer 等),但官方未公开沙箱细节,企业落地需要单独 audit。

4. 按流派归纳(2026-06 更新)

为了让上面 19 个对比对象不至于在矩阵里散成一团,可以按”产品形态/工作流”归到 5 个流派:

  • CLI primitives 派(pi)— 最小内核 + 用户组装。极致可塑、上手陡峭、企业落地需自补沙箱。
  • CLI 成品派(Claude Code / Codex / sst/opencode / aaif-goose / Cline / Aider)— 工具箱 + 默认 agent loop。开箱可用、生态成熟、深度定制要走 Skills/Hooks/AGENTS.md。
  • IDE-native 派(Cursor / Trae / Qoder)— 编辑器为中心,多 agent 是 IDE 特性。worktree 并行是 2026 年这条线最显眼的工程模式。
  • 自治 SaaS 派(Devin / Manus / Replit Agent 3 / Jules)— 黑盒长程自治。”丢任务进去、回头看 PR/报告”是产品形态共识;可审计性 / 数据隔离仍是企业落地最大不确定性。
  • Multi-agent 框架派(CrewAI / OpenHands 部分)— 程序化编排。把 agent 协作做成 Python library 或 Web/Docker workspace,让开发者用代码定义角色分工与任务流。

pi 与 CrewAI 实际是两端:pi 把 “harness 层” 做成最小内核给用户填扩展,CrewAI 把 “编排层” 做成 Python 框架给用户写多 agent;中间的 CLI 成品派 / IDE-native 派 / 自治 SaaS 派则各自把 “体验完整度” 做到不同位置。

5. 选型建议

场景 推荐
想最快出活、团队预算够、用得起 Claude/GPT 订阅 Claude Code(Skills/Subagents/Plan 最成熟)或 Codex CLI(沙箱最严格)
已经付了 ChatGPT 订阅、严格沙箱、Rust/Tokio 偏好 Codex CLI
想完全控制 prompt/工具/会话树、做 agent 研究或定制 harness、要在多家订阅间切换 earendil-works/pi
要中立治理(不想被任何一家 AI 厂商绑定)、隐私优先、本地执行、要 MCP 生态接 Jira/AWS **aaif-goose/goose**(Linux Foundation / AAIF 治理是这条路线的最大卖点)
大型 monorepo、企业自主代理、可接受 Docker 隔离与高 token OpenHands
增量重构、Git 工作流、想要最稳的”半自动” pair programmer Aider
要”开源 Cursor”、终端 + Web/移动端 client、Plan/Build 双代理、本地或远程部署都行、最热的开源生态 sst/opencode
中文场景、本地大上下文(≥1M) Qwen Code
免费额度最大(个人开发者起步) Gemini CLI
不想离开桌面 GUI、要在 Claude/GPT/Gemini/DeepSeek 之间频繁切换且接受闭源 + 自定义 base URL 中转 Alma(注意:不是 agentic harness,更接近”高级 AI 客户端 + 内置工具”)
异步派 ticket 自治执行、想让 agent 直接接 PR/issue Devin(企业 SaaS 长程自治)或 Jules(Google Labs,GitHub-native 异步)
IDE 多 agent 并行 worktree、希望 agent 是编辑器原生特性 Cursor Composer 2(西方主流)或 Trae SOLO(字节,中国/跨国)
企业 IDE + 中国云生态、需要通义千问 + 企业 SSO Qoder(阿里 1.0 GA)
Web-IDE 教学/原型、要云端 sandbox + 在线部署一体化 Replit Agent 3(最长 200 分钟单任务)
自建 multi-agent 工作流、要 Python 程序化编排角色 + 任务流 CrewAI

6. 2026 H2 趋势

  • Subagent / Plan / Skills 标准化 — Claude Code 把它们变成默认;Codex 跟进;开源侧 OpenHands / aaif-goose/goose / sst/opencode 各自实现。pi 是”明确不做、交给社区”的特立独行派。
  • Sandbox 进入产品默认值 — Codex 把 OS-level sandbox 做成不可绕过;OpenHands 把 Docker 当默认;AAIF 在推 MCP 安全 profile + sandboxing API;sst/opencode 借 client-server 自带进程隔离。pi + gondolin 组合可能是开源侧最干净的”非容器即 microvm”方案,但还需要时间成熟。
  • MCP 生态分化aaif-goose/goose 已 3000+ MCP;Codex 双向 MCP;Claude Code 一等公民;pi 故意不内置但可用 extension 桥接;sst/opencode 当前 MCP 接入主要走 SDK;Alma 至今官方未明确表态。社区里一旦出现”事实标准 pi-mcp-bridge“,分化就会被弥合。AAIF 把 MCP(Anthropic)+ Goose(Block)+ AGENTS.md(OpenAI)放到同一治理下,2026 H2 之后可能会出现”AAIF 标准 agent runtime profile”,这会是开源 CLI agent 生态最值得跟踪的事件。
  • 订阅级 OAuth 成为新底线pi-ai 同时挂 ChatGPT Pro / Claude Pro / Copilot 三种订阅,是 2026 年开源 CLI 难得做完整的实践,未来可能成为社区基线;aaif-goose/goose 的 ACP 是另一种实现路线;sst/opencode 的 75+ 模型 + 自定义 base URL 也走类似方向。
  • 桌面 GUI 与 CLI 双轨并行 — Cursor / Alma / Claude Desktop 等桌面客户端在中文用户群里增长很快;CLI agent 仍是工程深度用户与 CI/CD 场景的默认。两条赛道短期内不会合流,但 client-server 架构(sst/opencodeaaif-goose/goose)正在让”同一个 backend、CLI/Web/桌面三种前端”成为可能。
  • 新增(2026-06):自治 agent 商业化加速 + IDE-native 多 agent worktree 范式 + 中国 IDE 厂商崛起 — 自治 agent 商业化加速(Devin / Manus 走向 SaaS、Jules 走 GitHub-native、Replit Agent 3 走 Web-IDE 一体化)+ IDE-native 多 agent worktree 范式(Cursor Composer 2 引领,VS Code fork 派全部跟进)+ 中国 IDE 厂商崛起(Trae(字节)/ Qoder(阿里) 各自占位)。这三条线 2026 H2 大概率会进一步分化——CLI 派强调可审计性与可移植,自治 SaaS 派强调”丢进去、回来取”,IDE-native 派强调编辑器内多 agent 并行,三派短期内难以合流。

不确定性

  • badlogic/pi-monoearendil-works/pi 的迁移时间点没有官方公告原文,我是从 GitHub 的 transfer-redirect 行为 + changchen.me 等中文博客交叉确认,时间窗大约在 2026-04 前后。如果用户能找到官方 announcement,应替换本笔记里”4 月”一节。
  • GitHub stars 数据:59.8k stars 来自搜索快照与仓库主页,但同一时段不同来源给到 46.8k–60k,相差较大。落地决策建议直接看 GitHub 实时数据。
  • “Subagent / Plan mode 仅是示例扩展”是否准确packages/coding-agent/examples/extensions.md 都把 plan-mode/subagent.ts 列为示例,但是否有”官方推荐 + 内嵌”版本未完全确认。建议从 pi/help + 实际 pi install 看清楚。
  • 三层 SDK 的中文叫法(agentLoop / Agent / AgentHarness)来自第三方综述(silenceper、CSDN),仓库 docs 自己没用这套术语,技术博客和官方文档之间可能存在用词漂移。
  • 企业级落地路径:当前没有看到”earendil 官方提供的 SaaS 或托管沙箱”产品,企业用 pi 仍需自己负责 audit / SSO / 容器化。
  • **aaif-goose/goose 的”组织搬家而非 fork”:README 顶部明写 “moved from block/goose“,GitHub transfer 重定向也支持这一说法;但是否有”独立维护人 fork 出去”的旁支(例如某个早期 tag 被分叉)暂未在 release/contributors 列表里看到——结论是目前唯一规范仓库就是 aaif-goose/goose**,但用户如遇到第三方 fork 应单独审计。
  • AAIF 化的实质变化深度:搜索结果提到”红队反馈后 AAIF 引入 MCP 安全 profile 与 sandboxing API”,但官方仓库 main README 并未把这部分细节展开,可能仍是治理路线图而非已落地特性。生产落地前建议直接查 AAIF 官网与 SECURITY.md 的具体 commit。
  • aaif-goose/gooseBlock Goose 老文档站的同步状态block.github.io/goose 老站点是否完全废弃、是否会迁到 AAIF 域名暂不明确;本笔记引用的中文综述 (oao.tw 等) 仍以 block/goose 为基准。
  • sst/opencodeopencode-ai/opencode 的法律/治理关系:搜索结果一致认为是 SST 团队”接管/重写”,但没有找到官方说明是否经过原作者 Kujtim Hoxha 同意——npm 包 opencode-ai 现在指向 SST 代码这一点可能涉及命名权争议。落地前建议直接读两个仓库 README + LICENSE + 任何 NOTICE 文件。
  • sst/opencode 的 stars 数据:搜索结果给到 ~94k–170k 不等区间(94k 来自 2026-02 快照、170k 来自 2026-05 快照),增速极快但难以精确锁定。
  • Alma 的开源/闭源状态yetone/alma-releases README 明写”仅是发布存档”,未找到任何源码仓库或 LICENSE,目前判断为闭源;但作者 yetone 同时维护多个开源项目(avante.nvim 等),未来是否开源不可预测。如果用户给出 Alma 的实际源码仓库链接,本笔记应立即更新
  • Alma 的 MCP / agent 能力:官方页与归档仓 README 均未提到 MCP;中文综述提到 “Git worktree 抽象”与 “Memory” 等,但没有任何”agentic tool calling / subagent”语义证据。把它在矩阵里标 “GUI / 不适用” 是保守做法,可能低估了它实际具备的 agent 能力——建议用户实际跑一遍验证。
  • Alma 的定价 / 企业方案alma.now 官方页未公开任何定价,vibesparking 评测提到 “SSO + 访问控制”但没有报价;本笔记的”中”档企业部署评分基于二手信息,需要原厂确认。
  • Cognition 收购 Windsurf 后的产品整合细节:Cascade IDE 是否会作为独立产品保留?Devin Web 控制台与 Windsurf IDE 的 agent 是同一份 backend 还是两套?官方未有明确说明。
  • Manus 因 Meta 收购被中国监管否决后的产品方向:是否会调整服务区域 / 改组治理结构 / 接入特定云厂商,目前仅有外部报道、官方未表态。
  • Qoder 1.0 GA 的国际可用性:是否仅在阿里云中国区可用?海外节点何时上线?官方页未给明确回答;国际客户落地前需要单独和阿里云商务确认。
  • Trae SOLO 是否仍在 beta / 是否对国际用户开放:2026-03 推出后官方文档语义模糊(”SOLO 模式”在不同页面分别被描述为 beta / GA),且海外可访问性受字节产品出海策略影响,需要直接以官网当前状态为准。

后续行动

  • 在本仓库实操:用 @earendil-works/pi-coding-agentclaude 同时跑同一中等仓库的修改任务,记录 token 消耗、首次成功率、最终 PR 质量。
  • 追加:把 sst/opencode 与 Alma 也加进同一 benchmark,对照”开源 Cursor”与”桌面统一客户端”两种产品形态在真实开发流程中的取舍。
  • 调研 piaaif-goose/goose 之间是否已经有社区版 pi-mcp-bridge extension;同时跟踪 AAIF “agent runtime profile” 草案是否被 pi / OpenHands / Codex / sst/opencode 共同实现。
  • earendil-works/gondolin 真正在本机搭一次,验证 microvm 隔离的实用强度。
  • 跟踪 Codex CLI 的 Linux Landlock + seccomp 配置实践,对照 pi + gondolinaaif-goose/goose + AAIF sandboxing API 做沙箱评测。
  • 关注 2026 H2 是否会出现”agent harness 标准”,尤其 ACP(Agent Communication Protocol)能否中立化生态——AAIF 把 MCP + Goose + AGENTS.md 放到一起,是目前最可能产出标准的渠道。
  • 单独跟踪:Alma 是否会公开源码、是否会接入 MCP——这两点决定它能不能从”AI 客户端”跨到”CLI agent”赛道。
  • 新增(2026-06)跟踪项:Cognition + Windsurf 收购整合落地(Cascade 是否独立保留)、Manus 在中国监管否决 Meta 收购后产品方向、Qoder 1.0 GA 国际节点排期、Trae SOLO 国际开放状态、Cursor Composer 2 与 Trae SOLO 在 worktree 多 agent 上的实测对照、CrewAI 在企业自建 agent 系统中的真实采纳率。

来源

评论
分享