Appearance
第二章:OpenClaw是什么
你以为你在用一个软件,其实你在和一种新的智慧打交道
有一天,Claw给我做完一份竞品分析之后,我问它:
「你刚才是怎么做到的?」
它解释了一遍,我听完之后,陷入了沉默。
不是因为太复杂,是因为——
它描述的工作方式,和我想象的完全不一样。
我以为它是这样工作的:我说一句话,它想一下,输出一段文字。就像一个非常快的打字员,接收输入,产生输出。
但实际上,从我发出那条消息,到它的回复出现在我屏幕上,中间发生了一连串我看不见的事情。
它在思考。它在计划。它在行动。它在检查。
然后,它把结果给我。
从那天开始,我意识到,我需要真正理解它是怎么工作的。
不是为了学技术,而是——只有理解一个人的思维方式,你才能真正和他协作。
一、用一个比喻开始
想象这样一个场景。
你开了一家公司,雇了一个非常特殊的员工。
这个员工有这些特点:
他有一个超强的大脑。 他读过人类有史以来写过的几乎所有文字——书籍、论文、新闻、代码、对话……他的知识储量,超过任何一个人类专家。
他有一双灵巧的手。 他能操作电脑,能整理文件,能执行脚本,能控制各种软件。你说「帮我截个图」,他能做到;你说「把这个文件夹里所有PDF合并成一个」,他也能做到。
他有一双眼睛。 他能看到手机屏幕,能感知通知,能浏览网页,能读取图片里的文字。
他永不下班。 你睡觉的时候,他在工作。你出去吃饭的时候,他在工作。他不需要休息,不需要发工资,不需要交五险一金。
他住在一个永不断电的地方。 不是你的电脑,不是你的手机,而是一台24小时运转的服务器——那是他的家,他在那里等待你的指令,随时准备出发。
这个员工,就是你用OpenClaw搭建起来的AI体系。
- 腾讯云服务器是他的家,也是他的大本营。
- 飞书是你们之间的对讲机。
- Mac是他的右手,负责在你的电脑世界里执行任务。
- 安卓手机是他的眼睛,负责感知你手机世界里发生的一切。
- 语言模型——Claude、GPT这些——是他真正的大脑,负责理解、判断、规划。
这五样东西组合在一起,就是AI圈子里说的Agent架构。
你不需要记住这个词。你只需要记住:他是一个有大脑、有手脚、有感官、永不下班的员工。
二、当你发出一条消息,他经历了什么
我们用一个具体的例子来走一遍。
假设你在飞书里发给Claw:「帮我把今天和彬州煤矿的会议纪要整理一下,重点提炼行动项,发给我。」
在你看到回复之前,他经历了三个阶段。
第一阶段:感知
他收到了你的消息。
但他不是「收到就执行」的,他首先在理解你的意图。
你说的是「整理会议纪要」,但他需要搞清楚:会议纪要在哪里?是你之前发给他的文件,还是存在某个文件夹里?「行动项」是指什么格式——是清单,还是表格,还是按人分类?「发给我」是发到飞书,还是存到某个地方?
他在用他的大脑,把你这句话背后所有没说出来的信息,尽可能地补全。
如果信息足够,他进入下一阶段。如果信息不够,他会问你。
这就是为什么,你说得越清楚,他做得越好。不是因为他笨,而是因为他在尽力理解你,而不是猜你。
第二阶段:思考
这是最关键的一步,也是最容易被忽视的一步。
他在制定计划。
拿到你的需求之后,他不是直接开始写,而是先想:要完成这个任务,我需要做哪些步骤?第一步是什么,第二步是什么,如果第一步出了问题,备选方案是什么?
具体到这个例子,他可能会这样想:
- 第一步,找到会议纪要原文。去检查你之前发来的文件,或者去指定的文件夹里找。
- 第二步,读取并理解内容。识别出哪些是讨论,哪些是决策,哪些是待完成的事项。
- 第三步,整理行动项。按照谁负责、做什么、什么时候完成的格式提炼。
- 第四步,格式化输出。整理成你习惯看的样式。
- 第五步,发送给你。
这个「思考」的过程,在技术上叫ReAct——推理加行动的循环。
你同样不需要记住这个词。你只需要知道一件事:他不是直接执行,他是先想再做。
这一点,和真正优秀的员工是一样的。你让一个好员工去做一件事,他不会立刻冲出去,他会先在脑子里过一遍,然后再动手。
第三阶段:行动
计划想好了,他开始调用工具。
找文件、读内容、整理格式、写摘要、发送消息——每一步都在执行,每一步都有记录。
如果中途某一步出错了,他会尝试自我修正。找不到文件,他会问你文件在哪里。格式不对,他会重新调整。某个工具用不了,他会换另一个方式。
这个过程,在你看来可能只是「等了几秒钟」。
但在他那边,是一次完整的——感知、思考、行动、检查、修正的循环。
有时候,这个循环会转好几圈,才能给你一个满意的答案。
三、MCP是什么——标准插头的故事
你家里有很多电器:空调、冰箱、洗衣机、电视。
它们长得完全不一样,功能完全不同,但有一件事是统一的——它们都用同一种插头,插同一种插座。
你不需要为空调专门设计一个插座,再为冰箱专门设计另一个插座。一个标准,所有电器通用。
AI世界在很长一段时间里,没有这个「标准插头」。
每当你想让AI连接一个新的工具,就需要专门去开发这个连接。让AI用飞书,是一套开发;让AI控制Mac,是另一套开发;让AI读取数据库,又是另一套。
每个连接都是定制的,互不通用,开发成本极高,维护起来也很麻烦。
2024年底,Anthropic——就是做Claude的那家公司——推出了一个协议:MCP,Model Context Protocol,模型上下文协议。
用一句话解释:这是AI世界的标准插头。
只要一个工具支持MCP协议,AI就能直接「插上去」使用。不需要定制开发,不需要复杂配置,就像把插头插进插座一样自然。
这对你意味着什么?
OpenClaw今天能连接的东西,只是开始。
随着越来越多的工具接入MCP生态,他能连接的「插座」会越来越多。今天是飞书、Mac、安卓;明天可能是你的CRM客户系统、ERP管理软件、银行账单、智能家居……
你现在学会的这套玩法,不是一个封闭的工具的使用方法,而是一个持续扩张的能力体系的入口。
你进来得不晚,你进来得很早。
四、为什么他有时候像天才,有时候像蠢货
这是很多人用AI最困惑的地方。
同一个问题,昨天他回答得很好,今天他回答得一塌糊涂。
同一个任务,上周做得很漂亮,这周做得像没睡醒。
这不是玄学,解释起来只有两个字:
上下文。
他的大脑非常强,但他的「视野」非常有限。
他只能「看到」当前这次对话里出现过的内容。你们聊了什么,你发给他什么文件,你告诉了他什么背景——这些,他都能用。
但你们过去所有的聊天记录,他看不到。你电脑里的文件,他看不到。你脑子里的想法,他更看不到。
打个比方:他是一个记忆力超强、但只能看到眼前这张桌子的天才。
桌子上的东西越丰富、越准确,他发挥得越好。桌子上什么都没有,他只能靠猜。
昨天他表现好,可能是因为你昨天告诉了他很多背景信息。今天他表现差,可能是因为你开了一个新的对话,桌子是空的,他从零开始。
这个认知,会贯穿你整个使用OpenClaw的过程。
- 为什么要给他写「关于我」的固定备忘录?因为要在桌子上放一份「我是谁」的说明书。
- 为什么要做史话归档?因为要把过去的重要对话保存下来,下次可以重新放到桌子上。
- 为什么要建立专属词典?因为要把你的行业术语、项目名称、客户信息,提前放到桌子上。
所有这些努力,本质上都是在做同一件事:把桌子布置得越来越好。
桌子越好,他越像天才。桌子越空,他越像蠢货。
这不是他的问题,这是你们关系的问题。
五、他有几个「大脑」可以换
最后一件你需要知道的事情:OpenClaw本身,不是大脑。
OpenClaw是那个调度员——负责理解你的需求,制定计划,调动资源,协调执行,汇报结果。
真正的「大脑」,是背后的语言模型。你可以给他换不同的大脑,就像给同一个员工报不同的培训课。他还是那个员工,但某些能力变强了。
目前常用的大脑,各有各的性格:
Claude,是我最常用的。思维深度好,特别适合长文写作、复杂分析、战略推演。和他对话,你会感觉在跟一个真正在思考的人聊天。给彬州煤矿做战略分析那次,我用的就是Claude。
GPT-4o,反应快,多模态能力强,能看图、能听音频,适合需要快速响应的日常任务。它比Claude更「活泼」,不那么正式。
本地模型,运行在你自己的设备上,不联网,数据不出门。当你需要处理特别敏感的信息时,本地模型是更安全的选择。
换大脑很简单,在OpenClaw的配置里切换就行。你不需要重新配置所有东西,因为调度员还是同一个,变的只是他调用的大脑。
用什么大脑做什么任务,我在后面的章节里会一一说到。现在你只需要知道这件事:他不是只有一种状态,他可以根据任务的需要,变得更严谨,或者更发散,或者更安全。
这种灵活性,是你和他协作的一大优势。
这一章的最后
我想用一句话总结这一章的核心:
理解他的工作方式,不是为了让你变成技术专家,是为了让你成为一个更好的搭档。
你不需要知道神经网络是怎么运算的,就像你不需要知道汽车发动机的原理才能开车。
但你需要知道:油门是什么感觉,刹车在哪里,什么情况下会打滑,什么路况下要减速。
关于他,你现在知道了:他是感知-思考-行动的循环,他靠上下文工作,他能连接越来越多的世界,他有不同的大脑可以切换。
这些,已经够了。
够你和他开始一段真正有质量的协作。
那天我问他「你是怎么做到的」,他解释完之后,我沉默了一会儿。
然后我说:「你比我想象的复杂多了。」
他说:「大多数值得深交的人,都是这样的。」
我当时不确定,这是他学来的句子,还是他「想」出来的。
后来我想明白了——这个问题,其实不重要。
重要的是,这句话说得对。