我最近越来越觉得,AI 编程工具这件事,已经走到了一个很明显的分水岭。
最早那几年,我们谈的是补全。
后来我们谈的是聊天。
再后来,我们开始谈 Agent。
而现在,我们讨论的已经不是“它能不能帮我写代码”,而是:
我到底要不要继续亲自写这段代码。
这听起来像一句夸张的话,但如果你这两年一路用下来,大概率能感受到那种变化:
开发者和 AI 的关系,已经从“辅助”慢慢变成了“委派”。
而我自己的感受,也是沿着这条线一点点变的。
1. 最开始吸引我的,不是模型,是 Cursor 这种“几乎零门槛”的体验
如果把时间往前拨一点,很多人对 AI 编程的第一印象,其实都不是 Agent,也不是所谓的 Vibe Coding,而是 GitHub Copilot 那种“自动补全”的震撼:2021 年 GitHub 把 Copilot 作为技术预览推出,核心卖点就是根据当前上下文直接补全整行甚至整段代码。那时候它更像一个超强的自动补全器,而不是今天意义上的“开发搭档”。
真正让我感觉“这东西变了”的,是 2023 年之后那一波 AI 编辑器。
GitHub 在 2023 年 3 月把 Copilot X 推出来,开始把聊天、文档问答、PR 支持这些能力往开发全流程里铺;差不多同一时期,Cursor 也开始明确把自己往“不是插件,而是 AI-first editor”的方向推。Cursor 在 2023 年的官方文章里,讨论的就已经不是简单补全,而是代码编辑器里上下文、历史、符号关系、执行痕迹这些更复杂的问题了。
我最开始接触 Cursor 的时候,吸引我的其实不是“它用了哪个模型”,而是那种几乎零学习成本的顺滑感。
你打开编辑器,描述需求,按几下 Tab,代码就开始往外冒。侧边聊天、内联 Diff、一键应用修改,全都在一个窗口里完成。对刚接触这波 AI 编程的人来说,这种体验太容易让人上头了。
它不是那种会让你觉得“我在学习一个新工具”的产品。
它更像是在说:你原来怎么写代码,现在就怎么写,只不过旁边多了个很会接话、还能直接改文件的人。
这也是为什么,很多人最开始都会喜欢 IDE 形态的 AI 工具。
因为它给你的不是能力上的震撼,而是控制感上的安全感。
你能看见每一步改动。
你能看见 Diff。
你能看见文件树变化。
你知道 AI 改了什么,也知道自己随时可以打断它。
对于一个刚从传统开发环境迈进来的人来说,这种“所见即所得”的安心感,比模型榜单更重要。
2. 2024 年前后,我们还在“和 AI 一起写”;到了 2025 年,大家开始“把活交给 AI 写”
如果说 2023 年还是“AI 进入编辑器”的一年,那 2024 到 2025 年,真正发生变化的是:
AI 开始从一个聊天对象,变成一个可以独立执行任务的 Agent。
这个变化在 GitHub Copilot 身上其实很典型。
2025 年 2 月,GitHub 官方公开介绍了 Copilot 的 agent mode,强调它已经可以自主迭代代码、识别错误并尝试修复;到了 2025 年 5 月,GitHub 又把 coding agent 推到更明确的位置上,让它在 GitHub Actions 驱动的环境里完成任务、提交 PR,而且开始覆盖 GitHub CLI 和移动端入口。
Cursor 这一侧也在往同一个方向走。
它现在官方文档里把 Agent 定义得很直接:可以独立完成复杂任务、运行终端命令、修改代码;2025 年推出的 Plan Mode,以及 2026 年推出的 Automations 和 Cloud Agents,本质上都说明同一件事——编辑器本身正在从“人主导、AI辅助”变成“人定目标、Agent执行”。
我自己对这件事的体感,是在用 Cursor 用到后面时慢慢出现的。
最开始我很喜欢那种“边聊边改”的感觉。
但时间一长,我会发现一个问题:
当任务变重之后,IDE 的优势会开始变成负担。
比如说:
一个需求会改十几个文件
改完还得跑测试
跑完要修报错
修完还得补文档
最后还得自己再检查一遍有没有把别的逻辑顺手搞坏
这种时候,你其实不再需要一个“在旁边陪你写”的助手。
你需要的是一个能把整段流程接过去跑完的执行者。
而这,恰好就是 CLI 形态开始变得有吸引力的时候。
3. “Vibe Coding”火起来,不是因为大家突然变懒了,而是因为工具真的跨过了一个门槛
2025 年有个词突然变得很流行:vibe coding。
这个词是 Andrej Karpathy 在 2025 年 2 月公开提出来的;GitHub 在 2025 年的 Octoverse 里也专门提到,vibe coding 成了那一年一个非常显眼的开发趋势,指向的是一种“从想法直接跳到可运行原型”的工作方式。
我觉得很多人会误解这个词,以为它只是“随便写写”“不讲工程”。
但它真正流行起来,背后其实是一个很现实的前提:
模型和工具终于强到,足以让“先别管代码细节,先把东西跑起来”这件事变得可行。
也就是说,vibe coding 不是一种哲学先诞生,然后工具跟上;
而是工具先跨过门槛,大家才发现,原来开发可以先从“描述结果”开始,而不一定从“设计实现”开始。
这也是为什么我会觉得,Cursor 这类产品在 2024 到 2025 年那么容易让人上头。
因为它们第一次把“我有一个想法,先把它做出来看看”这件事,压缩到了很短的链路里。
你不用先开一堆文档。
不用先想完整架构。
不用先把每个目录规划好。
甚至很多时候,连 API 文档都可以边做边补。
你只需要开口描述,AI 就会把一个雏形先给你堆出来。
那种感觉特别像:
你不是在写代码,而是在不断把一个模糊想法往现实里拽。
所以我完全理解为什么那么多人会爱上这种开发方式。
因为它真的很接近一种创作体验。
4. 但也是在这个阶段,我开始第一次认真意识到:IDE 不是终点
我后来从 Cursor 往外看,很大一个原因,其实不是它不好,而是我慢慢发现了自己需求的变化。
一开始我最在意的是“快不快”。
后来我最在意的是“顺不顺”。
再后来,我最在意的变成了:
它到底能不能把重活接过去。
当免费额度用完、开始付费、开始认真比较模型质量的时候,这件事会变得尤其明显。
你会开始在意:
Auto 模式够不够稳?
高级模型到底值不值这个价?
上下文会不会乱?
改动会不会越来越“发散”?
它到底是在帮你省时间,还是在制造另一种形式的返工?
也是在这个阶段,我开始接触 CLI 形态的工具。
最开始那个落差感是很真实的。
因为你从 Cursor 这种高度可视化的环境,切到终端里的对话窗口,第一感觉一定是:这也太糙了。
IDE 里有 Diff 高亮,有文件树,有报错,有按钮,有侧栏。
CLI 一上来就是一堵文字墙。
它读了什么、改了什么、正在做什么,全靠你自己从输出里理解。
说白了,IDE 给你的感觉是“它在你眼前工作”;
CLI 给你的感觉则是“它在后台办事”。
刚开始当然会不习惯。
但也正是从这里开始,我意识到:
我可能并不总是需要“看着它工作”。
很多时候,我真正想要的是:
我把任务交代清楚
它自己去读库、找文件、改逻辑
它自己跑命令、修错误、补测试
最后把结果端回来给我审
这时,CLI 的意义就出来了。
5. 2025 年之后,CLI 不再只是“命令行聊天”,而是真的开始长成 Agent 形态了
CLI 真正让我改观,不是因为终端多酷,而是因为这条线上的产品,在 2025 年之后成长得非常快。
Anthropic 在 2025 年 2 月随着 Claude 3.7 Sonnet 一起公布了 Claude Code;到 2025 年 5 月,Claude Code 转为更广泛可用,开始支持 GitHub Actions 背景任务,以及 VS Code 和 JetBrains 的原生集成。它现在官方定义得很明确:这是一个 agentic coding tool,可以读代码库、编辑文件、运行命令,还能接 IDE、桌面端和浏览器。
OpenAI 的 Codex 也是类似路线。
现在官方文档把 Codex CLI 直接定义为本地运行的 coding agent:能在选定目录里读代码、改代码、跑命令,开源,而且用 Rust 写,强调的是“本地、快、能干活”。后续还加了 skills、SDK、非交互式模式,明显是在往自动化和工程化工作流延伸。
Google 这边的 Gemini CLI 也不是一个简单壳子。
官方 GitHub 直接把它写成“an open-source AI agent”,强调它是把 Gemini 直接带进终端的一条轻量路径。后续路线图和讨论里,也明显能看出它在往 skills 和 agent framework 的方向扩展。
到了这个阶段,CLI 的意义已经不是“没有界面的聊天框”了。
它其实是在形成一套非常明确的工作方式:
需求输入 → 代码库探索 → 计划拆分 → 文件修改 → 命令执行 → 测试验证 → 结果回传
一旦你习惯了这种节奏,就会发现它和 IDE 最大的差别,不是功能,而是角色分工。
在 IDE 里,你和 AI 更像是一起坐在工位前。
在 CLI 里,你更像是把任务交给了另一个工程师。
6. 这也是为什么,Claude Code 会让我觉得它特别适合“重活”
如果只说我对这波 CLI 工具的整体判断,我会觉得 Claude Code 是最接近“成熟搭档感”的一个。
原因并不只是模型强。
更重要的是,Anthropic 对它的定位很清楚。
Claude Code 的文档和工程博客里,反复强调的是 agentic coding、best practices、context engineering、long-running agents;它不只是想帮你改一段代码,而是想帮你完成“理解代码库—制定策略—执行修改—验证结果”这一整套事。
这类工具给我的最大感受是:
它不再只是帮你“生成代码”,而是在替你“消化复杂度”。
以前一个大型重构,最痛苦的不一定是写代码本身,而是:
先摸清上下文
找到真正相关的文件
判断哪些依赖不能动
改完之后确认影响面
再补测试和文档
这些事情很耗注意力,也很耗精力。
而一个好的 CLI agent,恰恰是把这部分工作吃下去了。
所以我现在会觉得,Claude Code 这类工具最适合的不是“小修小补”,而是那种真正有工程重量的活:重构、迁移、补测试、扫技术债、读陌生代码库。
7. 但这不意味着 IDE 没价值。恰恰相反,IDE 变成了另一个更重要的角色
我并不觉得未来会是 CLI 干掉 IDE。
我更相信的是,IDE 和 CLI 会越来越像“前台”和“后台”。
这点其实从很多产品最近的演化也能看出来。
Cursor 现在除了编辑器里的 Agent 之外,还有 Cloud Agents、Automations、多种插件和外部集成,已经明显在往“代理运行平台”扩。
GitHub Copilot 也是一样:IDE 里的 agent mode 和 GitHub 上的 coding agent,本来就是两个层次——一个在本地环境里自主编辑,一个在 Actions 驱动的环境里独立完成任务。
这说明一个很重要的趋势:
未来的开发界面,不再只是“编辑代码的地方”,而会变成“管理 agent 的地方”。
IDE 的价值并不会消失。
它只是从“唯一工作场所”,慢慢变成:
看结果的地方
调试的地方
审查的地方
处理局部精修的地方
做前端可视化反馈的地方
这一点对我个人使用习惯的影响很大。
我现在越来越少把 IDE 看成“主战场”,而更愿意把它看成“控制台”。
小需求、小改动、前端调样式,我还是会更喜欢待在 IDE 里。
因为这些事情天然需要强反馈、强可视化、强交互。
但一旦任务进入:
架构调整
大面积重构
复杂逻辑迁移
批量文件修改
自动化验证
我更愿意切去 CLI,让 agent 去跑完整流程,然后再回到 IDE 里做审查和收尾。
8. Kiro 和 Antigravity 的出现,也让我意识到:下一阶段不是“更会写代码”,而是“更会组织复杂开发”
如果说 Cursor、Claude Code、Codex、Gemini CLI 这些产品,解决的是“让 AI 更像开发者”,那 Kiro 和 Antigravity 让我看到的是另一件事:
下一阶段的问题,可能不是代码生成,而是复杂度管理。
Kiro 在 2025 年 7 月发布时,就把核心放在 spec-driven development 上:把高层需求结构化成 requirements、design、tasks,再交给 agents 去实现。它官方甚至直接说,Kiro 很适合 vibe coding,但更重要的是把原型带进生产。
Google 的 Antigravity 则更激进一些。
它在 2025 年 11 月正式亮相,被定义为 agent-first development platform。官方文档和博客里最核心的表达,不再是“聊天”“补全”,而是 workspaces、agents、skills、Mission Control 这类概念,本质上是在把开发环境重新组织成一个多代理编排平台。
这两类工具让我越来越相信一件事:
这波 AI 编程的终点,未必是“每个人都坐在 IDE 里跟 AI 一起敲”。
更有可能的终点是:
需求先被结构化
任务再被拆解
多个 agent 并行执行
人主要负责定义目标、设置约束、审查结果
换句话说,
“写代码”这件事本身,正在慢慢从中心位置退下去;
“组织开发”反而开始变成更核心的能力。
9. 回头看这几年,我觉得 AI 编程大概经历了三个阶段
如果一定要按时间顺序,把这几年串成一条线,我会这样理解。
第一阶段:补全时代
大约从 2021 年 Copilot 技术预览开始,AI 编程最主要的价值还是“加速输入”。它更像一个聪明的自动补全器,帮你少打字,偶尔给你灵感。
第二阶段:聊天和编辑时代
2023 年前后,Copilot X、Cursor 这类产品开始把 AI 放进编辑器主界面,代码生成不再只是补全,而是开始进入问答、改写、解释、跨文件编辑。这个阶段的关键词是:AI 开始理解局部上下文。
第三阶段:Agent 和 Vibe Coding 时代
到了 2025 年,vibe coding 成为流行词,Copilot agent mode、Claude Code、Kiro、Antigravity 这些产品陆续出现,说明行业重心已经从“帮你写”转向“替你做”。这个阶段的关键词是:AI 开始接管完整任务流。
而 2026 年给我的感觉则更进一步。
现在很多产品都在强化 plan、skills、subagents、automations、background tasks,这意味着行业已经不满足于“会写代码的聊天机器人”,而是在认真做“可以持续工作的软件代理”。
10. 所以今天的 CLI vs IDE,本质上已经不是界面之争,而是工作流之争
这也是我现在最明确的一个判断。
今天再讨论 CLI 和 IDE,已经不能只看“哪个界面更舒服”。
真正的区别其实是:
IDE 更适合什么?
IDE 更适合这些场景:
需要强反馈
需要实时调试
需要边看边改
要做 UI、样式和交互
你还不想完全把执行权交给 AI
它解决的是:
怎么更舒服、更安心地和 AI 一起工作。
CLI 更适合什么?
CLI 更适合这些场景:
任务描述可以一次讲清
需要跨文件大改
需要自动跑命令和测试
需要集中处理重构、迁移、批量修改
你更愿意让 AI 当执行者,而不是副驾驶
它解决的是:
怎么更高效地把一整段开发工作委派出去。
所以在我看来,CLI 和 IDE 并不是替代关系。
更像是你在不同阶段、不同任务里,选择不同的“交互密度”。
你越想盯过程,越会偏 IDE。
你越愿意看结果,越会偏 CLI。
11. 如果要给我这条路径做个总结,那大概是这样
最开始,我被 Cursor 吸引,是因为它让我第一次觉得 AI 编程这件事足够顺滑、足够轻松、足够“像真的”。
后来我开始折腾 CLI,不是因为我突然不喜欢 IDE 了,而是因为我发现自己想让 AI 接的活越来越重了。
我并不是从“喜欢 IDE”变成了“讨厌 IDE”。
而是从“我想和 AI 一起写”,慢慢变成了“我想让 AI 先去写完,我再来审”。
回头看,这其实也正好对应了这几年整个行业的演进:
一开始,AI 只是帮你写得快一点
后来,AI 开始帮你想
再后来,AI 开始帮你做
接下来,AI 很可能会开始帮你组织整套开发流程
所以如果今天再让我说一句最直白的话,我会这么总结:
Cursor 这类 IDE,让我第一次享受到 AI 编程。
Claude Code、Codex、Gemini CLI 这类 CLI,让我第一次认真思考:以后是不是很多代码,真的不用我亲自写了。
而 Kiro 和 Antigravity 这类更新一代的产品,又在继续提醒我:
也许真正要被重写的,不只是“怎么写代码”,而是“软件开发这件事本身”。
这几年 AI 编程工具的变化,看上去像是从 Copilot 到 Cursor,再到 Claude Code、Kiro、Antigravity 的产品更替;但更深层的变化,其实是开发者角色的变化。我们正在从“亲自实现的人”,慢慢变成“定义目标、设置约束、审查结果的人”。对我来说,Cursor 代表的是 AI 编程最舒服的入口,CLI 代表的是 AI 编程真正开始进入生产力阶段,而 Kiro 和 Antigravity 则像是在提醒我们:下一代开发环境,可能不再是编辑器,而是一个专门用来调度 agent 的工作台。
评论交流
欢迎留下你的想法