Agent-first Engineering OS

Yousa Driven Development (YDD)

面向 AI 协作编程的实践手记

把自己在腾讯的一线工程经验 + AI 协作实验都放进一册「YDD」。不卖课,只是把真实的工程笔记、踩坑、工具链迭代写清楚。

  • Infra Notes

    Golang、K8S、OpenResty、APISIX、Istio、Envoy 的落地记录

  • AI Pairing

    让模型当队友的 Prompt/Agent/工具链实验手记

  • Personal Stack

    写作、知识管理、Dev Workflow 的自定义脚本与仪式感

YDD Sprint

最近在写些什么

聚焦「AI 协作编程」&「云原生基础设施」的真实进展。

  • APISIX / Envoy 的插件实践 & 边车策略
  • 把 LLM 接入工作流:Prompt 合同、工具协议、回放机制
  • 如何把写作、产品、工程节奏融合成一个长期栈

不要让 AI 批改自己的试卷 —— 一次 16 处遗漏的协作复盘

不要让 AI 批改自己的试卷 —— 一次 16 处遗漏的协作复盘 Tokscale 是一个开源的 AI 编程助手用量统计工具。它扫描本地各 AI 编程助手(Claude Code、Codex CLI、Gemini CLI 等)的会话文件,解析每次对话的 token 消耗量并汇总成本。技术上,Rust Core 负责解析各家助手的本地会话格式并提取 token 数据,TypeScript CLI/TUI/Frontend 负责过滤、展示和提交统计结果。 TypeScript 编译零错误,clippy 零 warning,CLI 返回正确数据。AI 报告「代码完成」。 submit 功能完全失效。前端校验拒绝含新数据源的提交请求。文档多处描述与代码不一致。这些问题在首轮验收中全部隐形——不是检查者忽略,而是现有验证手段从结构上无法触及。 测试全绿只证明覆盖了多少,不证明质量。一个新增枚举值需要在 26 个触点注册,约 8 个缺失会触发编译错误,剩余 18 个全部遗漏也编译照过、测试照绿,功能链路静默断裂在中间层。遗漏是一种 absence——在缺乏穷尽匹配约束的代码层中,absence 不报错。 本文解剖一个真实任务:为 Tokscale 添加第 10 个数据源(Kimi),28 个文件修改、约 300 行新增 Rust 代码、横跨 6 个架构层。AI 首轮交付后,第一轮验收发现 0 个问题,第二轮发现 12 处遗漏,第三轮追出 3 处——每一层用不同的验证方法捕获前一层的盲区。 本文同时复盘了每一轮验收背后的 Prompt——人类如何提问,直接决定了 AI 能暴露多少盲区。同一个 AI,面对不同的提问方式,交出的答案质量天差地别。 读完本文你会了解:测试全绿为什么不等于功能完整;四层互补的验收手段如何系统性地捕获遗漏;哪些 Prompt 策略有效、哪些无效;以及如何在设计阶段就预防大部分问题。 ...

二月 18, 2026 · 7 分钟 · 12294 字 · Miss-you

从一个 WebSocket 到四个组件:多端操控 AI Coding CLI 的架构演化

从一个 WebSocket 到四个组件:多端操控 AI Coding CLI 的架构演化 手机远程操控电脑上的 AI Coding CLI,直觉上只需一个 WebSocket。CLI 在电脑上跑着,手机连上去,发消息,收输出,结束。 Kimi CLI 的 Web UI 做到了这一步。执行 kimi web,本地起一个 HTTP + WebSocket 服务,浏览器打开就能用。底层 Wire 协议(JSON-RPC 2.0)支持多个 WebSocket 客户端同时接入,消息通过 BroadcastQueue 广播给所有订阅者。手机套个 WebView 就行了? 但 Happy 项目把同样的需求拆成了四个独立组件:CLI、Daemon、Server、App。四个进程,三种 Socket 连接类型,一套 RPC 转发机制,外加端到端加密(E2EE)。 为什么? 这篇文章用两个真实项目的源码回答。从最简的直连方案开始,每遇到一个绕不过去的约束就加一个组件。四层方案逐层淘汰,最终会发现:四组件不是过度设计,而是五个硬约束逐层叠加的必然结果。 读完后能得到: 每个组件存在的「不可替代的理由」,以及没有它会怎样 Happy 和 Kimi CLI 在消息路由、进程管理、控制权协调上的关键设计细节 一棵决策树,根据自己的场景判断需要几个组件、哪些可以省 现有 Wire 协议哪些能复用、哪些必须新增的分层分析 阅读路线: 只想知道为什么不是一个 WebSocket → 第 1 节 + 小结 想理解 Happy 的核心机制 → 第 4 节(scope / RPC / 租约 / E2EE)+ 第 5 节(Daemon) 想设计自己的远程操控系统 → 第 6.3 节(五维度扫描)+ 小结决策树 想做协议复用 / 迁移评估 → 第 7 节 1. 五个硬约束 拆解方案之前,先定义检验标准。「手机远程操控电脑上的 AI Coding CLI」拆成五个约束: ...

二月 17, 2026 · 11 分钟 · 17731 字 · Miss-you

用 300 行 Swift 让 iPhone 变成 Kimi CLI 控制台

用 300 行 Swift 让 iPhone 变成 Kimi CLI 控制台 你在咖啡馆喝完拿铁,突然想起 Mac 上挂着的 Kimi CLI 正在跑一个代码分析任务。你掏出手机,打开一个原生 App,看到 Agent 的输出正在实时滚动,已经跑完三分之二。你追加一条新指令,然后继续刷朋友圈。 这不是科幻场景。只需要约 300 行 Swift 代码,零第三方依赖,就能把 iPhone 变成功能完备的 Kimi CLI 控制台。手机端并不是把 CLI 跑在手机上,而是给 Kimi 已有的 Web UI 套一层原生壳,借助 WebView 直接复用现有界面。这个项目的特点是代码量少,更多时间花在理解架构和拆解任务上。 TL;DR — 读完你会得到什么 理解 Kimi CLI 的「内核 + 多前端」架构,以及 Web UI 为什么能让移动端封装变得低成本 掌握 useSessionStream 中两个关键设计:wsRef 连接守卫 + Ref 流式累积 知道 WKWebView 封装的三个必踩坑:ATS 权限 / JS 弹窗 / 真机网络 获得一个可复用的工程模式:「本地 Web 服务 + WebView」 学到一套面对不确定目标的拆解方法:把大问题拆成可验证的小实验 阅读路线:如果你只想 30 分钟做一个 iOS 壳,直接跳到第 4 节 + 第 5 节 + Quick Start。如果你想理解 Web UI 的通信机制或基于 Wire 协议做自定义客户端,重点读第 2 节。 ...

二月 16, 2026 · 8 分钟 · 12781 字 · Miss-you

选工作,你在看朋友圈还是体检报告?

「选工作最重要的是跟对人。」 这句话你一定听过。不止听过,大概率还深信不疑。因为有切身体会。 你有没有经历过这样的时刻:换了一个领导之后,同样的工作突然变了味道。之前觉得干什么都拧巴,每天上班像在水里走路。换了一个人带你之后,信息开始透明,你知道自己在干什么、为什么干、干好了会怎样。你甚至觉得自己变聪明了,但其实不是你变了,是你上面那个人变了。 好领导的作用不止「让你舒服」。一个好的领导会改变你的判断力本身。他让你看到更大的系统,而不只是手头的任务。他做决策的时候,你在旁边看着,学到的不是他做了什么决定,而是他怎么想问题。这种东西,换一个人带你,接触不到。 在中国职场,「跟对人」更不是一句鸡汤。人治成分依然很重的环境里,好的领导能帮你绕过制度性的障碍,能把资源往你手里倾斜,能在关键时刻替你挡压力。这是中国组织生态里一个冷冰冰的现实。所以你告诉我「选工作最重要的是跟对人」,我不会反驳。我甚至觉得你可能还低估了这件事。 在大组织里,你的直属上级就是你的「微型生态系统」。他决定了你能看到什么信息,接触什么项目,得到什么反馈。你以为你在一家大公司工作,其实你在你领导构建的那个小世界里工作。创业场景里这一点放大到极致。五六个人的团队,创始人就是一切。「跟对人」几乎等于「选对一切」。 但也正因为「人」在这个等式里权重这么大,你对「人」的判断质量就变得生死攸关。 这就是为什么,当你遇到一个「看起来对的人」时,你会那么兴奋。 你遇到了一个人。简历亮眼,聊起来逻辑清晰、视野开阔,对行业的理解让你觉得「他确实想清楚了」。你们聊了一个多小时,他谈起自己想做的事情的时候眼睛里有光,不是浮夸的激动,而是经过思考的笃定。散场的时候直觉告诉你:就是他了。 你甚至觉得自己做了充分的判断。回去问了两三个朋友,评价都不错。看了融资新闻,投资方的名字你认识。又深聊了一次,信心又涨了一层。心里已经开始规划入职之后要做的第一件事了。 你签了 offer。你觉得这一次,终于跟对了人。 三种判断方式,三个结构性盲区 但这里有一个问题。一个你可能没注意到,但会决定这个选择最终走向的问题。 你判断「这个人对不对」,用的是什么方法? 仔细想想,大多数人判断一个人靠不靠谱其实只有三招。第一招是直觉:「我跟他聊下来感觉很靠谱。」第二招是光环:「他的履历很强,背后的投资人也很好。」第三招是口碑:「我认识的几个人都说他不错。」 这三招在日常场景里好使。但恰恰在「选团队」这个场景里最容易失灵。因为这三招识别的都是信号,而信号和系统之间的距离,比你以为的大得多。 我不是说你错了。这套方法在别的场景下有效,但在这个场景下有结构性的盲区。一个个来看。 先说直觉。你觉得「跟他聊完感觉很靠谱」,这个判断是怎么形成的? 心理学家 Chase 和 Simon 在 1973 年做过一个经典实验。他们让国际象棋大师看一眼真实的棋盘,凭记忆复原棋子位置。大师几乎能完美复原,远超新手。但接下来研究者把棋子随机摆放,不符合任何真实棋局的规律。这一次,大师的记忆力突然跌到和新手一样。 为什么?因为大师的「超能力」不是记忆力,而是模式识别。他记住的不是一个一个棋子,而是棋局的「叙事结构」。棋盘符合已知模式时,大脑自动补全。模式被打乱,能力就失效了。 这跟你选团队有什么关系?关系太大了。 「大厂高P出来创业,拿了一线基金,做的是热门赛道。」这些信号组成了一个你熟悉的「成功模式」。你的大脑自动启动补全机制:现金流?「一线基金投了,没问题。」决策质量?「大厂管过几百人的团队。」你以为自己在判断,其实在做模式匹配,把缺失的信息用「合理推断」填上了。 但创业不是随机摆的棋子,它有它的规律。问题在于,这个规律的变量比棋盘多太多了,结果的分布更极端,反馈周期也长得多。你从一个人的履历、融资这些有限信号里推断「这个团队能运转」,误差会被放大到你想象不到的程度。你的模式识别能力,在这里不是帮你判断,而是帮你跳过判断。 更麻烦的是,一旦大脑倾向于一个选择,认知能力不会帮你找反对理由,它会帮你找支持理由。你越聪明,找到的理由越像样。公司突然裁掉一个干得不错的人,没给任何说法。你心里不舒服,但转念一想:「他管过那么大的团队,判断维度肯定比我多。」你用自己的聪明帮他合理化了一个本该让你警觉的信号。能力没有成为纠错器,反而成了偏见的放大器。 聪明人踩的坑有一个特殊性:每一个错误决策都穿着「逻辑自洽」的外衣。不是盲目相信,是「理性地」说服了自己。这种错误特别难修正,你很难从一个自认为「理性」的错误中学到教训。 再看光环。 光环的问题不在于「没有信息量」,而在于它提供的信息量和它在你脑中占据的权重不成比例。 一个很多人没想过的问题:大厂教会一个人的能力,和创业需要的能力,是同一种东西吗? 在大组织里,成功的底层逻辑是「优化已知」。方向是上面定的,用户基数是平台给的,增长预算是公司批的。你的厉害之处在于把转化率从3%做到5%,把日活从一千万拉到五千万。但这有一个隐含前提:有人已经替你验证了方向是对的。 创业需要的是「验证未知」。方向本身不确定,没有用户基数,没有现成资源。你要做的不是把对的事做得更好,而是在一堆错的事里找到那件对的。这不是难度不同,是物种不同。 有一种创业团队特别常见:创始人从大厂出来,核心班底全是老同事,融资 PPT 第一页就是一排大厂 logo。但他们的默契建立在大厂的资源、流程和安全网上。离开那个系统,面对的不再是从80分到90分的优化题,而是从0到1的生存题。过去的默契不但帮不上忙,甚至变成路径依赖。他们会本能地用大厂的方法论去解一个根本不是大厂的问题。 打个比方,光环可能把创业成功率从3%提高到了5%。这不是精确统计,只是为了说明一个感知上的落差:光环带来的实际优势远没有你以为的那么大。但人们心里感知到的提升是从30%到70%。这个感知差距,就是聪明人反复踩坑的心理基础。 我不是说光环毫无价值。这些信息不是零。但看到光环之后不要停在那里,继续追问背后的东西。只看光环就做决定,那做的不是判断,是自动补全。 最后一招:口碑。 你入职前找了三个人打听。三个人一致说「老板人很好,很有格局」。你放心了。后来才知道,这三个人都是创始人从老东家带过来的嫡系。那些待了半年就走的人,你一个也没问到。你的「尽调」样本,被幸存者偏差扭曲了。 口碑的问题还不止于此。哪怕你问到的人是客观的,「他人很好」本身信息量也有限。因为信号的伪造成本和验证成本不对称。「我们的文化是扁平、透明、尊重人」,说出来十秒钟,验证它需要你在里面工作六个月。 这里要说一件事。这篇文章不是在说创始人是骗子。大多数创始人是真诚的。但真诚不等于正确,善意不等于能力。一个「真诚地相信明年能融到钱所以今年先不发年终奖」的创始人,和一个刻意画饼的创始人,对你的实际影响没有区别。你的年终奖都没了。所以你要判断的不是「他是不是好人」,而是「这个组织的系统能不能运转」。好人在烂系统里,也会做出让你付出代价的决策。不是因为他变坏了,是因为结构在奖励那种行为。 没人想戳破的信号泡沫 但为什么偏偏是这三招成了你最依赖的判断方式? 答案让人不太舒服:因为双方都从中获益。不是一方在骗,另一方在被骗。是双方都有动力让这个游戏继续。 创始人一方,包装光鲜信号收益大、成本低、风险小。讲一个好故事不花钱,大多数候选人在入职前根本不会追问到系统层面。 你这一方,也有动力去相信。相信意味着可以跳过繁琐的尽调,意味着做了一个「聪明」的选择,意味着即将加入一个有前途的团队。而质疑呢?质疑意味着要面对焦虑,要放弃让你激动的机会,要承认自己的判断可能有问题。当你已经在心理上倾向于接受一个 offer 的时候,大脑的首要任务不是「找出问题」,而是「确认它是对的」。 卖方有动力包装,买方有动力相信。一个稳定的「信号泡沫」就这么形成了。你的加入还会强化泡沫。「连他都去了,说明真的不错。」更多人被吸引进来,泡沫越滚越大,直到有一天现实击穿叙事。 朋友圈还是体检报告 那到底该看什么? 用一个类比来说。判断一个人的健康状况,你看他的朋友圈还是体检报告?朋友圈是「展示出来的健康」:跑步打卡、晒健康餐、精神饱满。体检报告是「运行中的健康」:血压、血糖、肝功能。朋友圈可以完美无缺,体检报告一塌糊涂。 判断团队也一样。创始人的演讲风格、融资新闻、办公室氛围,这些是朋友圈。工资是否按时发、加班制度有没有白纸黑字、「融资不顺怎么办」能不能用数字回答,这些才是体检报告。大多数人选团队的方式,就像看着一个人的朋友圈判断他还能活多久。我知道这个类比听起来刺耳,但信息不对称的本质就是这样。 选团队说白了是在「信息极度不对称下做高风险投资决策」。你投入的不是钱,而是比钱更不可逆的东西:一到三年的时间、职业声誉、身心健康。投资人可以做组合,投一百个项目有一个成了就够回本。你不能做组合,两到三年只能 all in 一个团队。从风险管理的角度说,你应该比投资人更审慎。但现实反过来:投资人有尽调流程,你靠感觉。 这就引出了一个根本性的区分。信号,是别人想让你看到的东西。系统,是你需要自己去验证的东西。你不可能通过堆积更多信号来替代对系统的验证。信号不是垃圾,它是你的起点。但起点不等于终点。你需要用系统层面的验证去更新你最初的判断,而不是停在起点上不动。 三个系统:信用、决策、经济 那「系统」具体是什么?拆成三个部分。 先说一句:这套框架不是放之四海皆准的。它对「组织越小、信息越不对称、创始人权力越集中」的场景越关键。在成熟的大组织里,很多系统级的保障已经内置了,HR、合规、流程都在替你做一部分把关。但哪怕在大公司,「直属上级就是你的微型生态」这个逻辑仍然成立。你的上级怎么用权力,这套框架一样适用。 第一个,信用系统。核心问题:这个组织是用契约在运转,还是用话术在运转? 举一个你可能经历过的场景。谈 offer 的时候你问年终奖怎么算,HR 说「看公司情况,一般两到四个月」。你追问能不能写进 offer,HR 笑着说「这个真写不了,但我们从来没少发过」。你签了。年底,拿到了零。找 HR 理论,对方翻出 offer 说「上面确实没写」。 ...

二月 14, 2026 · 1 分钟 · 7187 字 · Miss-you

为什么有些人越忙越穷,有些人越闲越富

为什么有些人越忙越穷,有些人越闲越富? 四个故事 下面这些故事,是我从身边和网上常见的模式里拼出来的,细节做了简化。 小雨每天学到凌晨一点。笔记记了十二本,错题本工工整整抄了三遍。她妈妈心疼,但也骄傲,至少孩子在努力。她的同桌小凡每天十一点就睡了,但小凡做了一件不同的事。把每次模考的错题按知识漏洞分类,每一类只做三道典型题,然后讲给同桌听。期末考试,小凡比小雨高了40分。 这个例子不涉及钱。但它说的那件事,出了学校同样成立。 张琳是一家中型公司的市场总监。周五晚上十一点,她还在改第二天要给老板汇报的PPT,措辞改了五遍,每个像素都调到完美。第二天老板花三分钟翻完,说了句「方向可以,推进吧」,然后去打高尔夫了。她改到凌晨,他三分钟定方向。到底谁的时间更值钱? 不只是打工人。自己单干也一样。 设计师小陈在闲鱼接logo设计,一单500块,改三次,前后花两天。一个月满打满算15单,7500块。春节想多挣点,把自己逼到每天只睡五小时,差点进医院。他的一个朋友做了一套Figma设计模板放在Gumroad上,定价99美元,每月被动收入两三千美元。那朋友现在每天下午三点去咖啡馆坐着。一个在用命换钱,一个睡着都在赚。 再看一个你每天路过的场景。 你家小区门口有个煎饼摊。大叔凌晨四点半出摊,站到上午十一点,一天卖150个煎饼,一个赚两块,日入300。他干了八年,每天都是这个数字,因为他的产能上限就是一双手、一口锅、七个小时。抖音上有个人拍了一条「教你在家摊煎饼」的视频,三分钟,播放量两百万。他靠这个号接了一个厨具品牌的年度代言,五十万。 同样的知识。一个被一双手和一口锅锁死,一个被算法放大了几百万倍。 你有没有注意到一件反常的事?在这四个故事里,最忙的那个人,收入最低。看起来最闲的那个人,收入最高。 这不是巧合。努力和产出之间,从来不是一比一的关系。 两种努力 要理解为什么忙碌不等于高产出,得先分清两种根本不同的努力。 第一种叫线性努力。你投入多少时间,产出多少成果,一比一绑定。多干一小时,多赚一小时的钱。第二种叫杠杆化努力。你做一次,被放大一万次。投入和产出脱钩了,不在同一个维度上。一个人每天工作十六小时,没有杠杆,上限就是十六小时的劳动成果。另一个人每天工作四小时,但他写的代码在替一百万人解决问题。 厨师一天最多炒三百盘菜。无论他多勤奋,上限就卡在那里。但如果他把最拿手的菜谱写成标准化流程、教会五十个学徒,这个系统每天能产出一万五千盘。手艺没变,变的是放大倍数。 麦当劳的创始人雷·克罗克不会做汉堡。但他设计了一个让任何人都能做出标准汉堡的系统,每天替他服务近7000万人。麦当劳不是餐饮公司,是系统复制公司。克罗克本人很闲,但他比任何一个忙碌的厨师都富。 其实杠杆不是一个开关,不是「有」和「没有」两种状态。它更像一道阶梯。 最底下一级是纯执行。一双手,一口锅,干一小时算一小时,杠杆倍数是零。往上走一级,你把干活的经验记下来了,变成笔记、变成模板。下次再干同样的事,快了一倍,这就有了一点点杠杆。再往上,模板变成流程,流程交给别人跑,你用人力把自己复制了出去。再往上,流程写成代码,或者做成产品,它不需要任何人盯着就能跑,一天跑二十四小时也不累。最顶上那一级是资本和媒体,钱在替你做决策,内容在替你触达陌生人,你睡着的时候它们还在干活。 代码、媒体、流程、人力、资本,这五种东西本质上都是杠杆,只是放大倍数不同。设计师从接单到做模板,就是从纯执行跳到了产品那一级。煎饼大叔如果把手艺写成流程、教会十个人,就是从零杠杆跳到了人力那一级。每往上走一级,你的时间和产出就脱钩一点。不用一步到顶。先把今天干的事记下来,就已经在爬了。 一个残酷的测试 有一个残酷的测试可以判断你在哪条轨道上。如果你明天倒下了,收入会不会也跟着倒下? 如果会,不管你名片上印的是「自由职业者」还是「CEO」,你卖的都是时间。很多人以为自己跳出了卖时间的陷阱,其实只是换了一个更贵的时薪在卖。从按月卖变成按小时卖,从卖给一个老板变成卖给十个客户。模式没变。 真正从「卖时间」跳到「卖系统」的人,做了一件不同的事。把自己解决问题的方式变成了一个产品。一段代码、一套流程、一个品牌。产品的特征是你造了一次,它可以卖一万次,不需要你在场。Eric Barone一个人、一台电脑、四年半,做出了全球销量超4000万份的星露谷物语。代码在替他7×24小时卖货。同样是忙四年,有人忙出了一份工资,有人忙出了一台永不停歇的印钞机。区别就在这里。你忙的那件事,做完之后还在不在替你工作? 你可能在想,星露谷物语、麦当劳,这不都是幸存者偏差吗?没错,这些是极端值。用了杠杆不保证你成功。但我想说的不是「用杠杆就能暴富」,而是「不用杠杆就一定有天花板」。这是两个完全不同的命题。前者是彩票逻辑,后者是物理约束。一天只有24小时,你的产出上限就卡在那里。杠杆不保证你赢,但没有杠杆,保证你赢不大。 不过事情没那么干净。杠杆放大的是能力,如果能力本身还没长出来,放大一万倍也是零。在练基本功的阶段,老老实实把手艺磨扎实,就是对的策略。杠杆不能替你跳过那一步。 另外,不是所有行业的杠杆都长得像代码和短视频。一个外科医生的杠杆可能是流程和团队,一个手工匠人的杠杆可能是品牌和学徒体系。形态不同,但逻辑一样,都是把个人能力从一双手里解放出去。 还有一件容易忽略的事。杠杆在放大收益的同时,也放大了波动。写代码做产品可能花半年一分钱没赚到,发内容可能两百条都没人看。不是每个人当前的处境都适合承受这种不确定性。承认这一点,不丢人。 这里有个问题。权力、人力、资本这些杠杆都需要许可。你得先当上领导、先有钱、先有信用,才能动用。 但代码、AI和社交媒体不需要。你今晚就可以开始写一个小程序、发一条内容、用AI搭一个自动化工作流。没有人需要给你一把钥匙,钥匙已经放在桌上了。这是人类历史上第一次,几种强大的杠杆工具,门槛低到接近免费。考公上岸的同学需要层层审批才能做一个决定。做短视频的同学一个人、一台手机,前一年半零收入,被父母天天骂不务正业,最近半年突然爆了,一条广告报价五万。他用的就是不需要任何人许可的媒体杠杆。 我猜你现在想说。道理我都懂,但我连睡觉的时间都不够,哪有空建系统? 这个反驳是对的。不是所有人都有「停下来」的条件。有些人的忙碌不是选择,是没有选择。但没有人要求你明天辞职去创业。杠杆可以从极小的地方开始。你每天重复做的那件事,能不能写成一个模板?你踩过的坑,能不能记下来变成别人也能用的经验?从「完成任务」到「积累资产」,有时只差一个意识的转变。 如果你还是觉得太抽象,试试这样。学生党,把这学期反复出错的那类题整理成一页速查表,发到班群里。你自己搞懂了,同学也省了翻课本的时间,这张表就是你的第一个杠杆。上班的,想想每周重复做的那份报告,能不能花一个下午写成自动化模板?搭一次,以后每周省两小时,一年省掉一百小时。自由职业的,你一定有一个问题被客户反复问。把回答写成一篇FAQ文档,下次直接甩链接,省下来的时间去接下一单。 方法很简单。每周列一下自己重复在做的事,挑最烦的那件,写成模板或文档,下周看看是不是真的省了力气。如果省了,恭喜,你有了一个可复用的资产。如果没省,换一件再试。一周一个小实验,成本几乎为零。 判断标准也很简单。杠杆不是做更大的事,而是让同一件事下次更省力,能被更多人复用。 但这还不是全部。如果杠杆的逻辑这么清楚,线性努力有天花板,杠杆化努力的天花板高得多,为什么大多数人还是困在第一种模式里? 三把锁 不是因为笨,也不是因为不想改变。真正卡住人的,是比「知不知道杠杆」更深一层的东西。 第一把锁,大脑。 人的大脑偏爱确定性和即时反馈。线性努力恰好满足这两点。你多干一小时,多赚一小时的钱,大脑的奖赏回路持续激活。而杠杆化努力的早期是反馈黑洞。你花六个月写一个产品,可能一分钱没赚到。你发了两百条内容,播放量还是个位数。大脑讨厌这种延迟回报。这不是意志力问题,是进化留下的神经机制。狩猎采集时代,「这棵树上有果子」比「半年后那块地会长出庄稼」重要一万倍。我们的大脑还在用旧世界的评分系统给新世界的选项打分。 所以线性增长让人上瘾。每年涨薪10%,每月多接几个客户,你觉得生活在变好。但如果你画出那条曲线,它是一条直线。直线的特征是有尽头。你一天能工作的时间是有限的,那就是你的产出天花板。无论你多勤奋,你都不可能把一天活成四十八小时。 线性增长不是增长,是一种伪装得很好的天花板。但因为它有即时反馈,人们宁愿在天花板下安心地忙碌,也不愿走进那条看不见终点的隧道。 第二把锁,文化。 「勤劳致富」是工业时代的逻辑。工厂需要工人按时到岗、按件计酬,所以「投入时间=创造价值」在那个时代是成立的。整个社会的道德体系、教育体系、评价体系都围绕这个等式搭起来。学校按出勤打分,公司按工时考核,社会按「看起来忙不忙」评价一个人。「我很忙」成了一种社交货币,暗示你被需要、有价值。知识经济早就改变了游戏规则,但我们的道德直觉没有跟上。 我们把忙碌当成勤奋的勋章。但仔细看,它更像一份诊断报告。一个人必须事事亲力亲为,不是因为他不可替代,而是因为他还没有建起任何一个替他工作的系统。CEO可以去度假三周,公司照常运转。不是因为他懒,是因为他花了多年搭了一个不依赖他在场的组织。 忙碌不是价值的信号。它是系统还没建好的信号。 第三把锁,参考系。 煎饼大叔每天出现在你面前,你看到他的辛苦。但那个拍煎饼视频赚五十万的博主,你看不到他前一年半零收入、被父母骂不务正业的阶段。杠杆的建造过程是不可见的,只有结果是可见的。所以大多数人的参考系里,根本没有「杠杆化努力」这个选项。你不知道它存在,不去寻找相关信息,社交圈也都是卖时间的人,就更加确信努力是唯一的路。这是一个自我加强的闭环。 三把锁同时锁住。大脑、文化、参考系,都在把你推向同一条路。更忙、更累、更多时间换更多产出。 怎么打开 要打开这些锁,第一步不是找工具,不是学技术,而是接受一个听起来很荒谬的说法。 真正的勤奋,不是永远在忙,而是让自己闲下来。 这里说的「闲」,不是什么都不做。而是把忙的内容从「执行」迁移到「建系统」,让系统替你执行。 有一种勤奋是每天忙到深夜,日程排得密不透风,倒头就睡,第二天再来一遍。还有一种勤奋是花大量时间思考一个问题。我怎么才能不再需要做这件事?前者的结局是越来越忙。后者的结局是越来越闲。但那个闲不是偷来的,是建出来的。 我知道你在想什么。这不是给懒惰找借口吗? 这个担心合理。但懒惰是逃避投入。我说的「闲」不一样。你先拼命建了一个系统,然后系统替你忙。一个是起点的闲,一个是终点的闲。区分方法很简单。懒的人闲完之后什么都没留下,建系统的人闲完之后多了一个替他工作的东西。 还记得那个改PPT到凌晨的张琳吗? 她的问题不是不够努力。她可能是整个公司最努力的人。但她所有的努力,都花在杠杆的长臂末端,做的是最容易被替代的执行工作。也许有一天,她不是在改PPT,而是在设计一个让团队自己就能做出好PPT的流程。那时候她也许会更闲。但那个闲,不是因为她放弃了,而是因为她终于建好了一个不需要她在场的系统。 我不确定每个人都能找到自己的杠杆。但我确定的是,如果你从来没想过这个维度,你连找的机会都没有。也许真正难的不是找到杠杆,而是放下「忙碌=有价值」这个让你安心了二十年的等式。

二月 14, 2026 · 1 分钟 · 4629 字 · Miss-you

当浏览器自动化遇上平台风控:一次小红书发布工具的反检测实战

当浏览器自动化遇上平台风控:一次小红书发布工具的反检测实战 事情的起因很简单。我需要一个工具,自动把内容发布到小红书。 打开创作者中心,上传几张图,填标题,写正文,加话题标签,点发布。一篇两篇没问题,但每天要发几十篇的话,纯体力劳动。 自然想到浏览器自动化。写个脚本,模拟人在浏览器里的操作。 但我低估了难度。Playwright 的 API 很好用,模拟点击、填写、上传都有现成的方法,编码不难。难的是小红书的风控系统会识别出你在用自动化工具,然后封你。 下面是从被风控到稳定运行的调试记录,踩了 7 个坑。 为什么得用浏览器自动化 国内的内容平台,小红书、抖音、公众号,都不提供公开的发布 API。 海外不一样。Twitter、YouTube、Medium 都有 API,HTTP 请求直接发内容。国内平台对内容管控更严格,API 只给少数合作伙伴,普通开发者拿不到。 所以你想自动化发内容,只剩一条路。用代码打开浏览器,模拟人的操作。 主流工具有 Selenium、Playwright、Puppeteer,干的事情一样。启动一个浏览器实例,通过协议控制它。 但平台也不傻。 传统方案怎么被检测的 用 Playwright 的 launch() 启动浏览器,这个浏览器从出生那一刻就带着「自动化」的印记。风控脚本查几个点就够了。 最直接的是 navigator.webdriver。正常浏览器里这个值是 undefined,但 Selenium 和 Playwright 启动的浏览器是 true。一行 JS 就能判断。 1 2 3 if (navigator.webdriver) { // 自动化工具,触发风控 } 然后是浏览器指纹。UA 字符串可能带 HeadlessChrome,WebGL 渲染结果不同,Canvas 指纹不同,屏幕分辨率是固定的默认值。单个差异不起眼,组合起来就是明确的信号。 还有操作节奏。机器操作太整齐了,每次点击间隔恰好 500ms,输入速度完全一致。真人会犹豫,会停顿,快慢不一。 最后是「生活痕迹」。自动化启动的浏览器是全新实例。没有浏览历史,没有书签,没有扩展,没有其他网站的 cookies。像一个刚出厂的手机。 风控不需要多精密。它只问一个问题:这个浏览器环境真实吗? 不真实就触发验证码、限制发布、标记异常。 小红书自动发笔记 先说我要做的事。 写一个 Python 脚本。打开小红书创作者中心,登录,上传图片,填标题正文,加话题标签,点发布。 用 Playwright 写这个流程不难。page.click()、page.fill()、page.set_input_files() 都能直接用。 第一次跑,成功了。 第二次,还是成功。 第三次,弹了个滑块验证码。手动过了,继续。 ...

二月 13, 2026 · 7 分钟 · 12828 字 · Miss-you

追赶者困境

谈到 LLM 产业,很多人会说「追赶者优势」。后发者少踩坑,跟进成本更低。真格基金合伙人戴雨森在张小珺的年终对话里讲得直接:美国头部实验室的高投入,「无法阻止中国模型低成本跟进」。 这种信心不是凭空来的。中国互联网最成功的公司之一,就是靠后来居上起家的。 QQ 不是第一个即时通讯工具,ICQ 才是。微信支付起步比支付宝晚了十年。《王者荣耀》也不是第一款 MOBA 手游。但腾讯每次都追上来了,而且经常超过去。 这些案例太深入人心了。以至于「追赶者优势」在中国互联网圈几乎成了默认叙事——别人趟过的坑我跳过去,别人教育过的市场我直接收割。 但追赶不是万能的。有一个领域,腾讯追了十年,追得很辛苦。这个后面再说。 2025 年国产模型在 coding 维度的跃迁很明显。智谱的 GLM-4.5 技术报告里,直接用 Claude Code 做智能体编程评测,把工程任务当作主战场。能力追上来了,速度比很多人想的快。 能力追上来了。但追上来之后呢? 2024 年 5 月那波大模型 API 降价把这事讲得直白。省下来的不是利润,是下一轮报价单里的让利空间。 5 月 21 日阿里云降价 97%。几小时后百度免费。第二天腾讯云免费。火山引擎更狠,0.0008 元/千 Token,比市面便宜 150 倍。 价格表里的零越来越多。所谓「追赶者优势」在商业上经常是句反话。后发者确实少踩坑,但省下来的钱,最后往往被迫用来把行业价格打穿。 投资人也信这套。不止一位投资人反馈,路演时听到「成本只有 OpenAI 的十分之一」,觉得是好消息。直到他们发现,每个来路演的团队都在讲同一个故事。当每个人都在讲同样的差异化故事,差异化就不存在了。 这个叙事太顺滑了。后发者省钱、少踩坑、站在巨人肩膀上。但有件事很少有人问:能力差距缩小了,利润差距缩小了吗? 能力追赶可以测量。benchmark 上的数字不会骗人。但价值捕获是另一回事。它藏在用户习惯里、藏在生态锁定里、藏在「虽然你也行,但我懒得换」的惯性里。追平功能只是入场券,利润池可能根本不在功能这个维度上。 追赶者优势的叙事默认一件事。你追的是一个「东西」。一个模型,一个产品,一个技术指标。追上了就算赢。 但 LLM 产业的领先者卖的不是模型。OpenAI 卖的是用户习惯,是 API 生态,是「出了问题有人兜底」的信任。你蒸馏出一个差不多强的模型,能蒸馏出这些吗? 这件事在云计算里发生过一遍。你以为追的是某个产品能力,实际上追的是一套会自我强化的商业系统。腾讯云追阿里云,就是一个把「追赶者困境」讲穿的案例。 腾讯云有人复盘过。2016 年觉得追阿里云只是时间问题,有钱有人。后来才明白,追的不是产品,是一个会自己滚雪球的系统。 2014-2016:红利期 2014 年手游市场爆发。腾讯是游戏霸主,自家游戏和被投公司自然都跑在腾讯云上,后来的《王者荣耀》把这个优势推到极致。2015 年直播行业爆发,斗鱼、虎牙等直播平台与腾讯云有公开合作案例,直播平台对 CDN 和音视频基础设施的需求,构成腾讯云早期增长的重要来源。追赶者优势的甜头,腾讯云吃到了。 2016-2018:困难显化 但 2016 年,阿里云在见市长。 2016 年云栖大会,王坚博士发布「城市大脑」,不跟政府官员讲 KV 存储、负载均衡,讲「用数据治理拥堵」「让城市会思考」。这把云计算销售层级直接拉到一把手工程。阿里云销售铁军拿着这个概念,全国各地见市长、见局长,疯狂跑马圈地。马云同年提出「五新」战略,全集团 All-in 数据化。客户的感觉是。买了阿里云,我就拥有了阿里巴巴的数字化能力。 「城市大脑」能把销售层级拉到「一把手工程」,不是概念喊得响,是从一开始就选了市长最在意、最容易量化的切口。治堵。 ...

一月 13, 2026 · 2 分钟 · 7812 字 · Miss-you
设计游戏的人,才不会被游戏玩

像玩游戏那样玩 AI

像玩游戏那样玩 AI 1/4 一个反直觉的问题 凌晨两点十七分,你对自己说「这是最后一条」。两点四十三分,你又说了一遍。 第二天早上,你下载了一个 AI 工具。用了五分钟,关掉了。图标沉到第三屏,再也没打开。 你对抖音没有学习意愿,但能刷三小时。你对 AI 充满学习意愿,但用不了十分钟。 我们通常会把它归结为:没时间、不够感兴趣、工具不顺手。 这些当然都可能成立。 但我后来发现,更常见的卡点是:短视频把「下一步」替你安排好了,而 AI 没有。你得自己把它放进流程里。 2/4 上瘾不是问题,问题是对什么上瘾 我们习惯把「上瘾」当贬义词。但仔细想想,上瘾的本质是什么? 做了一件事,得到奖励,想再做一次。 这套东西本身没好坏。它可以让你停不下来地刷视频,也可以让你停不下来地写代码、练琴、健身。 问题不在于你上瘾了,而在于谁在设计这个循环。 抖音的产品经理设计了一个算法,它比你更了解你。你以为在选择看什么,其实在被推着走。滑一下,奖励来了。再滑一下,又来了。继续不费力,停下才费力。 这就是被动上瘾。别人设计机制,你被卷入。 主动上瘾正好反过来。你自己设计机制,你选择卷入。 这里说的「上瘾」不是让你沉迷时间。而是让你不用靠意志力也能开始,但产出要能落到一个真实任务上。如果只是刷起来没有产出,那跟刷视频没区别。 你不是没有自制力。你只是一直在别人的游戏里玩。 2.5/4 一个容易混淆的地方 这里有个常见的误解:很多人觉得自己「用不起来 AI」是因为不够喜欢它。 但你对抖音也谈不上喜欢。你只是打开了手机,它就播了。 「喜欢」和「顺手」是两回事。 喜欢是情绪,会波动。今天喜欢,明天可能就腻了。 顺手是结构。它不依赖你当时的状态,只依赖「开始的摩擦有多低」和「反馈来得有多快」。 短视频强在这里:每一次滑动都是一个「可关闭的最小单元」。做完就结束,没有压力,随时可以再来一次。 而「学 AI」听起来像一个无限任务,给人压力。但「用 AI 改一句话」是一个可关闭的任务,做完就结束。 AI 用不起来,很多时候不是「不有趣」,而是「开始太像一件需要决心的事」。 3/4 两条规则,不是十条清单 有个叫福格的行为学家说过:行为 = 动机 + 能力 + 提示。 动机会波动,能力也确实会成为门槛,尤其是不知道怎么问、怎么用结果的时候。 但最容易被忽视、也最容易立刻改的,往往是「提示」:你有没有给 AI 安排一个默认出场的时刻。 没有这个时刻,AI 就永远停留在「我应该用」的层面。 所以我试下来,真正有用的就两条规则: 规则 1:默认出场时刻 找一个你每天都会做的事,把 AI 绑上去。 比如:打开文档 → 先让 AI 改第一段。不是因为你需要 AI 改,而是让「打开文档」自动触发「用 AI」。 ...

十二月 29, 2025 · 1 分钟 · 2135 字 · Miss-you

我,一个重度极客用户,为什么觉得这代 AI 眼镜不适合我

我,一个重度极客用户,为什么觉得这代 AI 眼镜不适合我 ——以夸克 AI 眼镜为例 过去一年,我陆续体验了几款 AI 眼镜:包括带显示的那种(比如 Rokid 这一类),也包括不带显示、偏音频和拍摄的形态。与此同时,我一直在关注阿里系的夸克 AI 眼镜,从技术规格、评测视频到功能介绍看得比较细,即便体验过朋友的夸克 AI 眼镜后,也没有真正下单。原因很简单: 对我这种重度极客用户来说,这一代 AI 眼镜——以夸克 AI 眼镜为代表——还没有真正跨过《跨越鸿沟》里那条“鸿沟”。 下面我会用 Geoffrey Moore《跨越鸿沟》的框架,系统性拆解一下:为什么我不认为夸克 AI 眼镜是「我需要的东西」。(Wikipedia) 一、先说框架:《跨越鸿沟》给我的几个关键问题 《跨越鸿沟》讨论的是:高科技产品如何从早期发烧友,跨越到主流用户。书里提出了一个技术采用生命周期:创新者、早期采用者、早期大众、晚期大众和落后者,并强调早期采用者和早期大众之间存在一条“鸿沟”。(Wikipedia) 对我来说,最实用的几点工具是: 目标细分市场 不要一上来就说「面向所有人」,而要选一个足够具体的小人群,作为“登陆海滩”。 非买不可的理由(Compelling Reason to Buy) 对那一小撮人来说,这个产品必须解决一个「不用会很痛、用了会明显轻松」的问题。 完整产品(Whole Product) 不只是硬件和几个功能,而是包括:配套软件、服务、生态集成、品牌和渠道在内的完整解决方案。 心智定位(Positioning) 在用户脑子里,它到底被当成什么品类?耳机?相机?翻译机?还是「下一代终端」? 价格 & 使用频率 价格要和「我一年真实会用它多少次」匹配,否则就会被归类为“昂贵玩具”。 带着这套问题,我再看夸克 AI 眼镜,就会发现:它离「跨过鸿沟」——至少对我这种人——还有一段距离。 二、我是谁:一个站在“鸿沟边缘”的重度极客 先讲清楚我的位置。 我是典型的数字重度用户:手机、电脑、iPad 多设备切换,对各种 AI 工具、语音输入、会议转写软件都很熟。 我乐意为新玩具买单,但前提是: 要么解决了我实实在在的痛点; 要么让我「爽到爆」,情绪价值很高。 我的日常工作以知识劳动为主,会大量阅读论文、写东西、开线上会议。 用《跨越鸿沟》的话说,我更像是早期大众的前沿,而不是纯粹的“极客玩具收藏家”:我有技术好奇心,但不会为「只有炫技没有刚需」的硬件掏 4000 块。 所以,如果这代 AI 眼镜连我都打不动,那它要跨越到真正的主流用户,其实还挺难。 三、夸克 AI 眼镜到底在卖什么故事? 先基于公开信息快速勾一下夸克 AI 眼镜 S1 的轮廓: ...

十二月 11, 2025 · 3 分钟 · 7287 字 · Miss-you

从「写代码」到「验代码」:AI 搭档写走 3 年,我踩出来的协作路线图

当 30% 代码都由 AI 写出来,我们该把时间花在哪? 从「写代码」到「验代码」的三年实战笔记 2022 年,我第一次在生产项目里用上 VS Code 的 Copilot,用它来写一个再普通不过的后端接口:登录、校验、打点日志。 我刚给函数写好名字、入参和返回值,函数体还一行没写,编辑器底部就灰出来一整段代码:参数校验、错误码、日志风格,甚至连变量命名都和我平时写得差不多。 那一刻我心里只有一个念头:「AI Coding 好牛!」 两小时后,测试环境里一个边界场景直接 panic,把服务干崩,罪魁祸首正是这段看起来「标准又优雅」的自动生成代码。那晚我第一次很具体地意识到:AI 写代码最危险的地方,不是它写不出来,而是它写得「看起来对,其实不对」。 三年过去,到 2025 年,各大厂公开的数据和访谈里不断提到类似的数字:工程师新写的代码里,大约 20%–30% 已经是 AI 生成的,一些激进团队甚至做到 50%。 但很多已经上手 AI Coding 的工程师,包括当时的我自己,却有很相似的感受:写的代码变多了,背的责任更重了,人反而更累。 我叫厉辉,网名 yousa。在大厂写了很多年后端,也在开源社区混过几轮(当过 Apache 项目贡献者和 CNCF Ambassador)。从 2022 年开始,我几乎每天都在和各种 AI Coding 工具打交道:从 VS Code 里的 Copilot,到 Cursor、Windsurf,再到 Codex、Trae SOLO 这一类更「重」的 Agent。 这篇文章写给已经在或准备在真实生产项目里用 AI Coding 的后端 / 全栈工程师和技术管理者。 它不会教你「按钮在哪里」「哪个 prompt 最神」,而是想在大约 15 分钟里,帮你搞清楚三件事: 哪些任务交给 AI 最「划算」 怎么让项目本身变得更「AI 友好」,提高一次命中率 当生成不再是瓶颈时,工程师应该如何设计验证流程,把时间花在真正值钱的地方。 文中的例子主要来自互联网业务后端,但你可以类比到自己的技术栈。 ...

十一月 24, 2025 · 4 分钟 · 12954 字 · Miss-you