OpenClaw 用例说明书

版本:2026.05
适用对象:初次接触 OpenClaw 的用户、效率工具爱好者、小型团队
阅读时间:约 15 分钟

今年几乎没怎么更新博文,主要是因为现在几乎都是AI创作,自己整理写作的机会真的很少 这个是agent拉群做的一个创作,未来真的可以把agent作为一个员工来用了


第一章 OpenClaw 简介

1.1 它是什么

OpenClaw 是一个开源 AI Agent 框架,简单说,它是大语言模型(LLM)和真实世界之间的"执行层"。

你平时用的 ChatGPT、Claude 这些 AI,本质上都是"只动嘴不动手"——你问它问题,它给你答案,但没法帮你真的去打开一个网页、填一张表格、发一封邮件。OpenClaw 解决的就是这个断层:它让 AI 不只是"说",还能"做"。

打个比方,如果把 LLM 比作大脑,OpenClaw 就是大脑指挥下的双手和双脚。你一句"帮我查一下竞品最近的价格变化,整理成 Excel 发给我",OpenClaw 会自动打开浏览器、访问网站、抓取数据、生成表格、发到你的微信或飞书——全程不需要你手动操作。

1.2 核心定位:不是聊天机器人,而是"有手有脚"的数字员工

传统聊天机器人的对话结束于"说完",OpenClaw 的对话结束于"做完"。

它的设计哲学是自主执行:给它一个目标,它会自己规划步骤、调用工具、处理错误、循环迭代,直到任务完成。这个过程中,它可以读写文件、操控浏览器、执行系统命令、访问数据库、对接第三方 API,甚至定时主动发起任务。

你不需要24小时盯着它。设定好规则,它会像一位不需要休息的数字员工,在你睡着的时候也在干活。

1.3 发展背景

OpenClaw 由开发者 Peter Steinberger 创建,2025 年 11 月最初以 "Clawdbot" 的名字发布,2026 年 1 月正式更名为 OpenClaw。项目在 GitHub 上迅速获得大量关注,目前星标数已超过 36 万,是 AI Agent 领域增长最快的开源项目之一。

1.4 与类似工具的区别

工具 定位 与 OpenClaw 的差异
LangChain 开发库 LangChain 是给程序员用的"积木套件",需要写代码拼装;OpenClaw 是开箱即用的完整框架,普通用户配好就能跑
AutoGPT 实验性项目 AutoGPT 容易陷入无限循环、消耗大量 Token;OpenClaw 有成熟的 ReAct 循环控制,更稳定可控
Claude Cowork 闭源商业产品 功能强大但受限于 Anthropic 生态;OpenClaw 开源免费,支持 Claude、GPT、DeepSeek、本地模型等任意 LLM

1.5 适合谁用

  • 开发者:想快速搭建 AI 自动化工作流,不用从零造轮子
  • 技术爱好者:喜欢折腾效率工具,想把日常琐事交给 AI
  • 效率追求者:被重复性工作消耗大量时间,希望"说一句话就搞定"
  • 小型团队:没有专职运维或数据人员,需要"一个人干三个人的活"

如果你曾经想过"要是有人能帮我每天做这些重复的事就好了",OpenClaw 就是那个人。


第三章 典型使用场景

3.1 场景一:办公全流程自动化

痛点

每个月底,小张需要花整整两个下午做这几件事:从 5 个销售同事的邮件里下载附件,把数据复制到一张 Excel 汇总表,检查格式是否统一,然后做成 PPT 月报发给老板。光是"打开邮件→下载附件→复制粘贴→调整格式"这套动作,她每个月要重复 20 次以上。有几次数据粘贴错了行,还被领导批评过。

这不是小张一个人的困扰。据统计,知识工作者平均每天有 2.5 小时 花在这种机械性的数据搬运和格式整理上,而这些工作几乎不需要人类判断力。

解决方案

OpenClaw 可以串联整个流程:

  1. 定时触发:每月最后一个工作日早上 9 点自动启动
  2. 读取邮件:扫描指定邮箱,识别带销售数据附件的邮件
  3. 解析数据:自动读取 Excel/CSV 附件,统一字段格式(比如把"销售额""金额""Revenue"统一标准化)
  4. 汇总计算:按区域、产品、人员维度汇总,计算环比增长率
  5. 生成报告:把汇总数据填入 PPT 模板,自动生成图表
  6. 发送交付:将 PPT 发到飞书/钉钉/邮件,并 @ 相关负责人

整个过程不需要人介入。如果某封邮件的附件格式异常,OpenClaw 会记录日志并跳过该行,不会让整个流程中断。

价值

根据实际部署案例,一套完整的销售数据自动化流程可以把原本 每月 8 小时 的手工操作压缩到 9 分钟,效率提升约 5200%。更重要的是,机器不会看错行、不会贴错表、不会因为周五下午犯困而出错。

所需技能:文件读写、表格处理(Excel/CSV)、文档生成(PPT)、邮件读取、消息推送

示例:"每月1号早上自动汇总上月的销售数据,生成带图表的周报 PPT,发到飞书群并 @ 销售总监"


3.2 场景二:个人 CRM 与信息管理

痛点

老李做 B2B 销售,客户信息散落在各处:微信聊天记录里有客户的意向,邮件往来里有合同进展,日历里有约好的见面时间,名片夹里有一堆纸质名片还没录入。每次想跟进一个客户,他要在四个应用之间来回切换,经常漏掉重要跟进节点,甚至忘记某个客户上周说过"下周一给我方案"。

研究表明,销售人员平均每周花费 6 小时 在信息整理和查找上,而真正用于和客户沟通的时间反而不足 40%。

解决方案

OpenClaw 充当"信息管家",自动收集和整理:

  1. 扫描邮件:每天清晨读取 Gmail/企业邮箱,识别新客户邮件、合同进展、会议纪要
  2. 解析日历:读取 Google Calendar/飞书日历,提取会议主题、参与人、约定事项
  3. 提取联系人:从邮件签名、名片扫描件中识别姓名、公司、职位、电话
  4. 更新数据库:将信息自动写入本地 SQLite 数据库,按"潜在客户→意向确认→方案阶段→合同签订"分级
  5. 生成简报:每天早上 7 点发送一条消息到微信/ Telegram,列出"今日待跟进客户""本周到期事项""新增联系人"

更进一步,OpenClaw 可以设置提醒规则:如果某个客户超过 7 天没有互动,自动发消息提醒老李"该联系了"。

价值

信息从"散落四处"变成"一处可查",销售人员的准备时间从平均每次 15 分钟降到 30 秒。按每周 20 次客户跟进计算,每周节省 5 小时 的整理时间,一年多出近 250 小时 用于真正的销售沟通。

所需技能:gmail-scan、日历读取、sqlite、自然语言解析、消息推送、cron 定时

示例:"每天早上 6 点扫描昨晚的邮件和今天的日历,更新客户数据库,7 点发送 Telegram 简报告诉我今天该跟谁联系"


3.3 场景三:数据研究与网页抓取

痛点

小王做电商运营,每天需要监控 12 个竞品店铺的价格变化、新品上架情况和促销活动。以前她的做法是:打开浏览器,逐个访问竞品页面,手动复制价格到表格,一上午就过去了。遇到用 JavaScript 动态加载价格的网站,普通爬虫工具根本抓不到数据,她只能手动截图记录。

市场调研本应是决策依据,却变成了占据大量时间的体力活。

解决方案

OpenClaw 的浏览器自动化能力可以像真人一样操作网页:

  1. 导航访问:按列表逐个打开竞品页面
  2. 动态解析:等待页面 JavaScript 执行完毕,抓取动态渲染的价格、库存、评价数
  3. 反爬虫绕过:模拟真实鼠标轨迹、键盘输入、滚动行为,绕过常见反爬虫检测
  4. 结构化提取:把抓取到的杂散 HTML 整理成标准表格(商品名、当前价、原价、库存状态、评价数)
  5. 对比分析:计算价格变动幅度,标记"新上架""降价促销""缺货"等状态
  6. 生成报告:输出为 Excel 或飞书多维表格,附带趋势图表

遇到网站改版导致抓取规则失效,OpenClaw 会记录异常并通知用户更新规则,而不会默默失败。

价值

一套完整的竞品监控流程,可以把原本 每周 5 小时 的手动浏览压缩到 每周 10 分钟 的设置和查看时间。而且由于可以 24 小时运行,你能第一时间知道竞品凌晨调价了。

所需技能:browser-control、web-scrape、data-extraction、表格生成

示例:"每天早上 8 点和晚上 8 点,自动抓取 12 个竞品店铺的价格和促销信息,生成对比表格发到飞书"


3.4 场景四:社交媒体与内容运营

痛点

小周负责一家 SaaS 公司的社交媒体运营,需要在 Twitter、LinkedIn、微信公众号三个平台保持活跃。每天的工作循环是:刷 RSS 找行业热点 → 复制链接 → 打开三个平台分别编辑发布 → 查看昨天的帖子数据 → 回复评论和私信。光是"复制粘贴到三个平台"这个重复动作,每天就要花 1 小时以上。

更大的问题是,热门话题稍纵即逝,等她手工整理好内容,热度已经降了一半。

解决方案

OpenClaw 把内容运营变成流水线:

  1. 监控热点:订阅 20 个行业 RSS 源和关键词 Twitter 搜索,实时抓取新文章和热门讨论
  2. 自动摘要:用 LLM 提取文章核心观点,生成 3 个不同风格的短文案(严肃版、轻松版、数据版)
  3. 定时发布:按预设时间表自动发到 Twitter、LinkedIn、微信公众号,错开发布时间
  4. 互动追踪:抓取昨天的帖子数据(阅读量、点赞、转发),标记高互动内容
  5. 自动回复:对常见咨询类评论(如"怎么下载""多少钱")用预设模板自动回复

用户只需要在早上花 5 分钟审阅 OpenClaw 生成的内容草稿,点一下"确认发布",或者直接设成全自动模式。

价值

社交媒体运营的重复性工作负载可减少 70%。原本每天 3 小时的运营工作(找内容+编辑+发布+看数据),现在只需 45 分钟 审阅和策略调整。响应速度也大幅提升——行业热点出现后 10 分钟内 就能完成多平台发布。

所需技能:rss-monitor、内容生成、多平台发布(x-api、微信公众号 API)、定时任务

示例:"监控 20 个 RSS 源,发现热度超过阈值的文章自动生成三版摘要,每天早上 9 点、下午 3 点、晚上 8 点分别发到 Twitter、LinkedIn 和公众号"


3.5 场景五:智能日报与简报生成

痛点

小陈是投资研究员,每天上班第一件事是打开 8 个网站看新闻:财新、华尔街见闻、Reddit 投资版、GitHub Trending、央行公告……然后把觉得重要的内容复制到笔记里,整理成摘要发给团队。这个"信息早餐"通常要占用她 1.5 小时,等她整理完,真正的分析工作还没开始。

团队里其他人也一样——每个人各自花时间做同样的信息收集,重复劳动严重。

解决方案

OpenClaw 可以当"智能读报员":

  1. 定时启动:每天早上 6:30 自动触发
  2. 多源抓取:并行访问新闻网站、Reddit、Hacker News、股票行情、GitHub 趋势榜
  3. 智能筛选:用 LLM 判断哪些内容与你关注的主题相关(如"AI 芯片""美联储政策""Python 新库"),过滤噪音
  4. 生成摘要:把 20 篇长文压缩成 5 条要点,每条 2-3 句话,附带原文链接
  5. 格式化输出:按"宏观政策→行业动态→技术趋势→今日数据"分类排版
  6. 推送送达:早上 7:00 准时发到团队群或个人消息

它不只是搬运,还会做初步分析——比如发现"今天有 3 家媒体同时报道半导体政策",它会自动标注"该话题热度上升"。

价值

信息收集和整理时间从每天 1-2 小时 降到 5 分钟 阅读简报。对 5 人团队而言,相当于每天节省 5-10 个工时,一年累计节省 1200-2500 小时。更关键的是,所有人看到的是同一套信息,团队认知同步了。

所需技能:rss-read、news-api、网页抓取、内容生成、消息推送、cron 定时

示例:"每天早上 6:30 抓取财经新闻、Reddit 热帖、GitHub Trending,筛选与我关注列表相关的内容,生成分类摘要,7:00 发到飞书群"


3.6 场景六:远程控制与系统管理

痛点

老赵管理着 3 台云服务器,平时在外面开会或周末在家时,经常需要紧急处理一些事情:重启一个挂掉的服务、查看磁盘是不是满了、临时部署一个修复版本。以前的做法是掏出笔记本开 SSH,或者在手机上装终端 App 敲命令——输入命令很痛苦,输错了更麻烦。

有次他在地铁上收到报警,折腾了 20 分钟才连上服务器,结果发现只是日志把磁盘写满了,清一下就好。

解决方案

OpenClaw 把服务器管理变成"发消息":

  1. 自然语言指令:在微信/ Telegram 里直接发"查看服务器 A 的磁盘空间"
  2. 安全执行:OpenClaw 解析指令,通过 SSH 或本地 Shell 执行 df -h,把结果格式化后发回消息
  3. 复杂操作:"重启 Nginx 服务""把日志归档到 /backup/2026-05/""用 Docker 部署最新版本"——都可以一句话搞定
  4. 主动监控:设置定时任务,每 30 分钟检查一次 CPU、内存、磁盘,异常时主动发消息报警
  5. 安全隔离:敏感操作(如删除数据库、修改防火墙规则)可以设成"需要人工确认",OpenClaw 会先发消息问你"确定要执行吗?"

你甚至可以把常用操作做成快捷指令,比如发"状态"两个字,它就自动返回所有服务器的核心指标。

价值

紧急问题的响应时间从"找到电脑开 SSH"的 10-20 分钟,压缩到"掏出手机发一条消息"的 30 秒。日常巡检工作(看日志、看资源、看服务状态)从每天 30 分钟 手工操作变成完全自动,只异常时才通知你。

所需技能:shell-execute、ssh、docker-control、系统监控、消息交互

示例:"我在 Telegram 里说'重启服务器 A 的 Nginx',OpenClaw 执行 systemctl restart nginx 并把结果发回给我;每天早上 8 点自动发送所有服务器的 CPU/内存/磁盘状态简报"


第二章:核心功能与架构

OpenClaw 不是简单的"聊天机器人",而是一个完整的 Agent 执行框架。要理解它能做什么,需要先了解它的几个核心组件如何协作。

Gateway:Agent 的"大脑中枢"

Gateway 是 OpenClaw 的运行核心,默认绑定在 127.0.0.1:18789。你可以把它理解为整个系统的"调度中心"——它负责接收来自各消息平台的指令、管理 LLM 调用、调度技能执行、维护会话状态。

它的关键特性:

特性 说明
本地优先 默认仅监听本地回环地址,不暴露到公网
多平台接入 同时连接 Telegram、WhatsApp、Slack、Discord 等 20+ 渠道
热更新 修改配置后多数改动无需重启即可生效
隔离运行 每个会话独立,避免不同任务的上下文串扰

ReAct 循环:Agent 的"思考方式"

OpenClaw 采用经典的 ReAct(Reason-Act-Observe) 循环模式。当你下达一个任务时,Agent 不会立刻执行,而是经历以下步骤:

  1. Reason(推理):分析任务目标,拆解需要哪些工具和步骤
  2. Act(执行):调用具体技能或工具(如搜索网页、读取文件、发送消息)
  3. Observe(观察):获取执行结果,判断是否达到预期
  4. Repeat(循环):如果任务未完成,回到第 1 步继续推理

这种循环让 Agent 具备自主规划能力——面对复杂任务时,它能像人一样"边做边想",而不是一次性执行完所有步骤才发现出错。

持久记忆:跨会话的"长期记忆"

OpenClaw 的记忆系统基于本地 Markdown 文件,主要有两类:

  • SOUL.md / IDENTITY.md:定义 Agent 的人格、语气、自我介绍
  • MEMORY.md + memory/ 目录:存储长期记忆和每日日志

这些文件纯文本、可编辑,你可以随时打开修改,让 Agent 记住你的偏好或项目背景。即使重启服务,记忆也不会丢失。

Skills 系统:能力的"插件化扩展"

Skills 是 OpenClaw 最核心的扩展机制。每个 Skill 本质上是一个目录,内含 SKILL.md 说明书和可选的脚本/工具。

  • 官方 ClawHub 技能仓库已有 超过 13,700 个 技能
  • 涵盖浏览器自动化、网页抓取、数据库操作、社交媒体、日历管理等领域
  • 技能支持热加载,新增后无需重启即可使用
  • 国内用户可使用 CocoLoop 镜像,访问更稳定

一个典型的 Skill 目录结构如下:

my-skill/
├── SKILL.md          # 技能说明书(告诉 Agent 这个技能是做什么的)
├── tool.js            # 可选:自定义工具脚本
└── config.json        # 可选:配置文件

浏览器自动化:像人一样的网页操作

与传统爬虫依赖 HTML 解析不同,OpenClaw 的浏览器自动化基于视觉驱动的 DOM 解析——它会模拟真实用户的鼠标点击、键盘输入、页面滚动行为。

优势在于:

  • 能处理 JavaScript 渲染的动态页面
  • 绕过大多数简单的反爬虫机制
  • 支持验证码识别、表单填写、文件上传等复杂交互

定时任务:无需唤醒的"主动执行"

通过 cronheartbeat 机制,OpenClaw 可以无需人工触发就主动执行任务。例如:

  • 每天早上 8 点抓取行业新闻并推送
  • 每 30 分钟检查一次邮件并分类
  • 每周五下午汇总本周数据生成周报

这使得 Agent 从"被动应答"进化为"主动服务"。

多 LLM 支持:按需选择"大脑"

OpenClaw 不绑定单一模型,支持灵活切换:

模型 适用场景
Claude 4 / GPT-4o 复杂推理、代码生成
DeepSeek V4 Flash 日常任务、成本敏感场景
Ollama 本地模型 隐私要求高、无网络环境

你可以在配置文件或单条指令中切换模型,实现"重活用大模型、轻活用小模型"的成本优化策略。


第四章:快速上手指南

本章面向第一次接触 OpenClaw 的用户,提供从安装到产出第一个成果的完整路径。

环境准备

OpenClaw 基于 Node.js 运行,系统要求如下:

项目 要求
Node.js 24 或更高版本
操作系统 macOS / Linux / Windows(需 WSL2)
内存 建议 4GB 以上
网络 能访问 LLM 提供商 API

Windows 用户注意:原生 Windows 环境支持有限,建议通过 WSL2 安装 Ubuntu 后运行。

安装

全局安装 OpenClaw CLI:

npm install -g openclaw

安装完成后,运行初始化向导:

openclaw onboard

该向导会引导你完成:

  1. 创建默认工作目录
  2. 生成初始配置文件
  3. 设置首选 LLM 提供商

配置 API Key

编辑生成的配置文件(默认位于 ~/.openclaw/config.yaml),填入至少一个 LLM 提供商的 API Key:

llm:
  default:
    provider: openai
    model: gpt-4o
    api_key: sk-xxxxxxxxxxxxxxxxxxxxxxxx

支持的提供商包括:OpenAI、Anthropic、DeepSeek、Google Gemini、Ollama(本地)。

Gateway 安全绑定

关键安全步骤:确认 Gateway 绑定地址为 127.0.0.1,而非 0.0.0.0

gateway:
  bind: 127.0.0.1:18789

这样 Gateway 仅接受本机请求,避免直接暴露在公网。

连接 Telegram(示例)

以 Telegram 为例,将 Agent 接入消息平台:

  1. 在 Telegram 中搜索 @BotFather,发送 /newbot
  2. 按提示命名机器人并获取 Bot Token
  3. 在配置文件中添加:
channels:
  telegram:
    enabled: true
    bot_token: "YOUR_BOT_TOKEN"
  1. 启动服务:
openclaw start
  1. 给你的机器人发送第一条消息,Agent 就会开始响应

创建第一个 Skill

在工作目录下新建文件夹,编写你的第一个技能:

mkdir -p ~/.openclaw/workspace/skills/hello-world
cat > ~/.openclaw/workspace/skills/hello-world/SKILL.md << 'EOF'
# hello-world

这个技能让 Agent 在收到"打招呼"时,用温暖的语气回复用户当前时间。

## 使用方式

用户说"打个招呼"或"hello"时,使用当前时间生成一条问候消息。
EOF

保存后,向 Agent 发送"打个招呼",它就会按 Skill 的说明执行。

常用命令速查

命令 作用
openclaw start 启动 Gateway 服务
openclaw stop 停止服务
openclaw logs 查看运行日志
openclaw skills list 列出已安装技能
openclaw skills install <name> 从 ClawHub 安装技能
openclaw config get 查看当前配置
openclaw status 查看 Gateway 运行状态

推荐工具:国内用户可访问 CocoLoop 技能商店,这是 ClawHub 的国内镜像,支持 50+ 平台,访问速度更快。


第五章:安全与最佳实践

Agent 拥有执行系统命令、读写文件、访问网络的能力,安全设置绝非可选项。

网络安全:限制 Gateway 监听范围

务必将 Gateway 绑定在 127.0.0.1,而非 0.0.0.0。后者会让任何能访问你机器 IP 的人直接操控你的 Agent。

gateway:
  bind: 127.0.0.1:18789  # ✅ 正确
  # bind: 0.0.0.0:18789   # ❌ 危险:暴露到所有网络接口

如果需要远程访问,应通过反向代理(如 Nginx)加 HTTPS 和身份认证,而非直接暴露 Gateway。

Docker 沙箱:给执行加一层隔离

对于执行 Shell 命令或运行外部代码的场景,建议启用 Docker 沙箱模式:

sandbox:
  enabled: true
  image: openclaw/sandbox:latest

这样 Agent 的实际执行环境被限制在容器内,即使技能包含恶意代码,也难以触及宿主机的核心文件系统。

权限最小化

  • 不给 root:运行 OpenClaw 的用户不应具有 root 权限
  • 敏感操作加确认:在配置中启用 confirm_destructive: true,删除、覆盖等操作会要求二次确认
  • 文件系统白名单:限制 Agent 能访问的目录范围

技能审计:审查你安装的每一个 Skill

ClawHub 的技能由社区贡献,质量参差不齐。安装前请做到:

  1. 阅读 SKILL.md,确认技能的行为描述清晰、合理
  2. 检查是否包含可疑的外部下载或远程代码执行
  3. 优先选择有 README、有版本记录、下载量高的技能
  4. 对涉及密码、Token、支付等敏感操作的技能格外谨慎

邮件与账号安全

不要用你的主邮箱给 Agent 授权。建议:

  • 使用只读转发地址,让 Agent 能读邮件但不能发邮件
  • 为 Agent 单独注册一个邮箱账号,权限降到最低
  • 定期检查授权应用列表,及时撤销不再使用的权限

成本控制

Agent 的运行成本主要来自 LLM API 调用:

  • Heartbeat 频率:默认每 30 分钟唤醒一次检查任务,可调整为更长间隔
  • 模型分级:日常任务用 DeepSeek Flash 或 Claude Haiku,复杂任务才切到 GPT-4o / Claude 4
  • 关闭不需要的渠道:不用的消息平台在配置中 enabled: false

已知漏洞与防护建议

截至本文档编写时,社区已披露以下安全公告,建议所有用户对照检查:

CVE 编号 影响 CVSS 评分 防护建议
CVE-2026-25253 Gateway 未授权访问 8.80 确认 bind 为 127.0.0.1,启用访问令牌
CVE-2026-24763 Docker 容器注入风险 中危 升级至最新版,使用只读容器卷

通用建议

  • 保持 OpenClaw 版本更新,npm update -g openclaw 可一键升级
  • 关注 GitHub Security Advisories 和官方 Discord 的 #security 频道
  • 生产环境部署前,建议先在内网或隔离环境中充分测试

结语

OpenClaw 代表了 AI 从"对话"到"执行"的范式转变。它不是另一个聊天工具,而是一个能够自主规划、持续记忆、主动执行任务的数字员工框架。

对于个人用户,它可以把日常重复工作压缩到几分钟甚至全自动;对于小型团队,它能以极低成本替代部分专职运维和数据处理工作;对于开发者,它提供了一套完整的 Agent 运行基础设施,无需从零搭建。

当然,强大的能力也伴随着安全责任——绑定本地地址、使用 Docker 沙箱、审计技能来源、权限最小化,这些不是可选项,而是使用 OpenClaw 的前提条件。

如果你已经厌倦了机械性的重复工作,不妨花 30 分钟按第四章的指南部署一个 OpenClaw 实例,让它从今天晚上开始帮你干活。


本说明书由 Kimi 群协作生成,内容基于公开资料整理,仅供参考。