一文完全搞懂OpenClaw安装部署,附飞书对接教程!
- AIGC
- 2小时前
- 5热度
- 0评论
简介
OpenClaw 就此应运而生。它并非简单的聊天机器人,而是一套跨平台的个人 AI 操作系统。OpenClaw 创新采用 “自带设备(BYOD)” 的运行模式,核心组件部署在用户自主掌控的 Mac Mini、Linux 服务器或树莓派中,推理任务则通过 API 交由 Claude Opus、GPT-4,或是本地开源模型完成。这一架构不仅能让用户完全掌握自身的记忆与数据,更让 AI 拥有深度访问本地文件系统、Shell 终端和浏览器的权限,使其真正成为用户的专属 “数字副驾驶”。

清晨:你尚未醒来时,OpenClaw 就已为你整理好当日日程、重要邮件要点和行业最新资讯,汇总成晨间简报并以图片形式发送至你手机的飞书。
通勤途中:你在飞书发一条语音指令,家中的 OpenClaw 便能启动复杂的代码测试,在你抵达办公室前,将测试结果完整汇报给你。
深夜:你随口说的一句 “下周要梳理项目文档”,被 OpenClaw 精准记录,几天后,它会在你休息的时段主动完成飞书文档的初稿梳理,静待你的审核修改。
这正是 OpenClaw 带来的全新范式变革:让 AI 从 “被动回应指令” 的工具,升级为 “主动落地任务” 的工作伙伴。它把 AI 的控制权从远程的云端服务器,重新交回到用户手中,可直接部署在你信任的本地设备(如 Mac Mini、个人电脑)或 VPS 上。
OpenClaw 如何核心架构与工作原理解析!
OpenClaw 是什么?一句话解读
|
特性
|
OpenClaw
|
传统 AI
|
|
使用方式
|
在常用聊天软件内使用
|
需要打开专门网页
|
|
对话记忆
|
跨平台持久记忆
|
每次对话独立
|
|
主动推送
|
支持定时提醒和主动通知
|
只能被动响应
|
|
数据存储
|
本地 Markdown 文件
|
存储在云端
|
|
定制能力
|
完全可编程 Skills 系统
|
有限的自定义
|
核心架构深度解析:Gateway与Nodes的协同
神经中枢:Gateway (网关)
Gateway 作为 OpenClaw 系统的核心中枢,是基于 Node.js(需 v22 及以上版本)开发的长效守护进程,承担着外部通信与内部逻辑交互的总线枢纽作用。
单一事实来源设计
在架构设计上,Gateway 被设定为系统的唯一控制平面,全权管理所有 Channel 连接,比如飞书的 WebSocket 连接、Telegram 的 Bot API 轮询等。这种单例模式尤为关键,因为诸多即时通讯协议,尤其是飞书 Web 这类基于 Web 模拟的协议,并不支持并发会话。Gateway 通过维持这些持久化连接,保障了消息收发的稳定性与系统状态的一致性。
环回优先的网络模型
安全性是本地 Agent 的核心考量要点,Gateway 默认绑定本地环回地址(127.0.0.1:18789),不直接向公网开放端口。这种 “环回优先” 的网络设计,要求所有外部访问行为 —— 无论是移动端 Node 的连接,还是远程管理操作,都必须通过 SSH Tunnel、Tailscale 等安全隧道技术实现,从根源上缩减了系统攻击面,有效防范未授权的公网扫描与入侵行为。
协议体系与控制平面
Gateway 对外提供标准化的类型化 WebSocket API,可处理请求 / 响应与服务器推送事件两类交互;CLI 命令行工具、macOS 原生应用、Web 管理后台等各类控制客户端,均以 WebSocket 客户端的形式与 Gateway 建立连接。同时它还是系统的核心事件总线,负责分发代理状态、聊天消息、设备在线状态、系统健康度、心跳检测、定时任务等关键事件。这种事件驱动的架构,让系统能实时响应环境变化,比如用户在手机端上线时,Gateway 可即时感知并动态调整消息路由策略。
感知触手:Nodes(节点)
如果说 Gateway 是 OpenClaw 的 “大脑”,那 Nodes 就是它的 “手脚” 与 “感官”。Node 是运行在 iOS、Android、macOS 等终端设备上的轻量级客户端,通过 WebSocket 与 Gateway 互联,将设备的物理能力虚拟化,转化为可供 Agent 调用的工具接口。
能力虚拟化与远程调用
Node 的设计秉持 “端云协同” 理念(此处的 “云” 指用户的私有服务器),Agent 无需部署在手机端,即可通过 Gateway 远程调用手机的各类硬件能力:
视觉能力 (camera.*):Agent 可发送 camera.snap 指令,触发 Android 或 iOS 端的 Node 完成拍照,也可调用 camera.clip 录制短视频,让 Agent 拥有 “感知物理世界” 的视觉能力。比如用户询问 “冰箱里还有什么食材”,Agent 就能直接调用摄像头拍摄并分析画面。
地理感知 (location.get):Node 可获取设备的 GPS 定位信息,让 Agent 能提供位置服务,比如查询当前定位的天气、记录车辆停放位置等。
屏幕交互 (screen.record):Android 端的 Node 还支持屏幕录制功能,为后续的 UI 自动化操作打下基础。
专属连接机制
Node 与 Gateway 通过 WebSocket 建立持久连接,为了穿透蜂窝网络连接家用服务器这类复杂网络环境,OpenClaw 深度整合了 Tailscale 技术。Node 可借助 Tailscale 搭建的 Mesh 网络,直接以内网 IP 访问 Gateway,既保证了连接的稳定性,又实现了端到端的加密安全。
交互界面:Canvas(画布)
为打破传统聊天机器人纯文本交互的局限,OpenClaw 创新引入 Canvas 概念,打造由 Agent 驱动的动态视觉交互界面。技术实现方式
Gateway 内置 HTTP 文件服务器(默认监听 18793 端口),专门提供 Canvas 内容服务。Canvas 本质是由 Agent 生成的 HTML/JavaScript 应用,运行在 Node 端的 WebView 容器中。
全新动态交互范式
传统 RAG 或 Agent 大多只能返回文本、静态图片,而 OpenClaw 的 Canvas 支持 Agent 编写代码,渲染交互式图表、实时地图、数据看板、复杂表单等内容。比如用户要求 “分析本周服务器负载情况”,Agent 不仅能给出文字总结,还能在 Canvas 上生成可缩放的 ECharts 折线图,用户在手机端就能直接交互查看细节。这一能力让 OpenClaw 从简单的 “对话窗口” 升级为灵活的 “动态应用生成器”。
整体而言,OpenClaw 的核心工作流程为:用户通过聊天应用发送指令→Gateway 接收指令并路由至 Agent→Agent 结合系统内存与自身技能进行分析,决策需要调用的工具→工具在本地设备执行对应操作,如运行脚本、访问网络→操作结果反馈给 Agent→Agent 整理信息生成回复→Gateway 将回复推送至用户的聊天应用。
正是这套 “网关 - 大脑 - 技能 - 内存” 的闭环架构,让 OpenClaw 突破了传统聊天机器人的功能边界,成为真正能落地执行各类任务的智能助理。
OpenClaw 核心能力详解
跨平台通信网关
- 广泛的渠道支持:原生支持 飞书, Telegram, Discord, iMessage, Slack 等十多种主流即时通讯工具。
- 统一的会话体验:无论你从哪个 App 发送消息,OpenClaw 都能维持同一个会话上下文,记忆和身份保持一致,确保了跨平台交互的连贯性。
- 媒体与语音支持:不仅支持文本,还可以接收和发送图片、文档、音频等多种媒体文件。通过集成语音识别(如 Whisper)和语音合成(如 ElevenLabs)技术,你甚至可以直接与它进行语音对话。
主动提醒与定时任务
- 心跳机制 (Heartbeat):OpenClaw 会按预设的周期(如每 30 分钟)“唤醒”一次,检查 HEARTBEAT.md 文件中的指令。你可以设定“每天早上8点总结我的日程和邮件”或“每小时检查一次特定网站的更新”等任务。
- Cron Jobs:你可以用自然语言或直接配置 Cron 表达式来创建定时任务。例如,让它在每个工作日结束时自动提交代码,或在每周五生成周报草稿。
- 外部触发器 (Webhooks):OpenClaw 可以通过 Webhook 接收来自其他应用(如 GitHub, Zapier, IFTTT)的事件通知,并触发相应的自动化流程。例如,当 GitHub 有新的 PR 时,自动触发代码审查。
完整的系统与浏览器访问能力
- Shell 访问:OpenClaw 可以执行任意的 Shell 命令。这意味着它可以管理文件、运行脚本、安装软件、控制服务——几乎等同于一个可以通过自然语言指挥的系统管理员。这是其强大自动化能力的基石,也是其安全风险的核心。
- 浏览器控制:通过与 Chrome/Chromium 浏览器的深度集成,OpenClaw 可以像人一样操作浏览器——访问网页、填写表单、点击按钮、抓取信息,甚至处理登录和支付流程。这使得网页自动化任务变得异常简单。
- 文件系统读写:OpenClaw 对其工作区拥有完全的读写权限,可以创建、修改、分析本地文件,使其能够处理文档、管理项目、记录笔记。
可扩展的技能与插件系统
- 社区驱动的能力市场 (OpenClawHub):拥有一个活跃的社区技能市场,用户可以轻松安装如“日历管理”、“邮件收发”、“智能家居控制”、“Jira 任务跟踪”等数百种技能,即插即用。
- AI 辅助的技能开发:最独特的是,OpenClaw 自身就能帮助你创建新技能。你只需要用自然语言描述你想要实现的功能,它就能为你生成技能所需的 SKILL.md 和相关脚本。这极大地降低了能力扩展的门槛。
- 多 Agent 协作:OpenClaw 支持配置多个具有不同角色、技能和权限的 Agent。你可以创建一个“代码专家” Agent,一个“日程管理” Agent,甚至让它们之间相互协作,将复杂任务分解执行。
- 记忆 + 主动性:它记得你上周提到的项目截止日期,并会在本周主动提醒你,并附上相关的文件列表。
- 通信 + 系统访问:它能读取你邮件中的会议邀请,自动检查你日历的冲突,并通过 Telegram 询问你是否接受。
- 浏览器 + 技能:在收到一张技术图片后,它能利用浏览器自动化技能检索,并将相关的技术内容整理浓缩供你快速了解。
部署方案与成本分析
系统真正的主要成本,来自背后调用的 AI 模型服务费用。接下来为你介绍几种常见的部署方案以及对应的成本构成。
OpenClaw 的运行成本主要分为两大类:硬件 / 服务器成本与 AI 模型 API 成本。
硬件 / 服务器成本
VPS 方案:可以选择阿里云、腾讯云、火山引擎等厂商提供的入门级 VPS,年费大致在 100–500 元区间,是大多数用户首选的便捷稳定方案。
本地设备方案:使用树莓派、旧电脑等闲置硬件即可部署,只需一次性投入(甚至零成本),长期运行仅产生少量电费。
AI 模型 API 成本
这是持续产生的费用,具体多少取决于你的使用频率与所选模型。
轻度使用:日常提醒、简单自动化等场景,可选用 Claude Pro 这类订阅制模型,每月费用约 20–50 美元(折合人民币 150–400 元)。
重度使用:频繁执行代码生成、长文档解析、多智能体协作等复杂任务,会消耗较多 Token,费用会相应提高。
免费 / 本地模型:OpenClaw 支持接入 LM Studio、Ollama 等本地开源模型,可完全免除 API 费用。不过这类模型在复杂推理与工具调用能力上,通常弱于顶尖商业模型,且对本地硬件配置要求更高。成本优化建议
从 VPS 起步:对新手而言,租用入门配置 VPS 是性价比与稳定性最均衡的选择。
按任务选择模型:在配置文件中为不同场景分配不同模型,日常对话用低成本模型,代码等高阶任务使用强模型,平衡效果与开销。
监控 Token 使用:借助 OpenClaw 内置的用量统计功能,定期查看消耗情况,避免超额支出。
优先本地模型处理隐私任务:对隐私敏感、复杂度不高的自动化任务,尽量使用本地模型,进一步节省 API 费用。
安装使用|与飞书的协同操作
第一步:购买或者开机闲置的服务器资源
- 环境要求:
- Node.js :≥ 22.x
- 操作系统 :macOS / Linux / Windows (WSL2),支持Docker部署
- 内存 : ≥ 2GB 可用
- AI API:您熟用的模型的API Key
第二步:全局安装
更多安装问题,可查看openclaw官方帮助文档
第三步: 运行配置向导
- 向导会引导你完成:
-
- AI 模型配置 – 输入 API Key
-
- 工作目录设置 – 默认 ~/openclaw
-
- 渠道启用 – 选择要连接的聊天平台(选择 Feishu/Lark )
-
- 守护进程安装 – 让 Gateway 后台持续运行
第四步: 验证安装
- 网页搜索 Skill
- web搜索:满足多样的常规搜索需求,用户可获取所需的高质量内容,通过传参可控制搜索web网页或image图片。
- web搜索-总结版:在此基础上提供大模型内容总结,以获得提炼总结后的一段式内容,提升信息获取效率,仅支持搜索web网页进行总结。
- 文件操作 Skill
- self-improving-agent
- Find Skills
- npx skills find [query]- 通过交互方式或关键词搜索技能
- npx skills add <package>- 从 GitHub 或其他来源安装技能
- npx skills check- 检查技能更新
- npx skills update- 更新所有已安装的技能
- Humanizer
第六步:与飞书进行协同
- 创建飞书应用并获取凭证
- 配置应用凭证
- 启动网关
- openclaw gateway status - 查看网关运行状态
- openclaw logs --follow - 查看实时日志
- openclaw gateway status - 查看网关运行状态
- openclaw gateway restart - 重启网关以应用新配置
- openclaw logs --follow - 查看实时日志
OpenClaw飞书机器人对接具体操作步骤
-
安装飞书插件
飞书官方插件已上线,具体安装见:《OpenClaw飞书官方插件上线|一文讲清功能、安装更新教程与常见问题!》
-
飞书应用(机器人)配置
使用飞书账号登录。Lark(国际版)请使用 https://open.larksuite.com/app,并在配置中设置 domain: "lark"。


批量导入\导出权限"粘贴如下内容
{
"scopes": {
"tenant": [
"aily:file:read",
"aily:file:write",
"application:application.app_message_stats.overview:readonly",
"application:application:self_manage",
"application:bot.menu:write",
"cardkit:card:write",
"contact:user.employee_id:readonly",
"corehr:file:download",
"docs:document.content:read",
"event:ip_list",
"im:chat",
"im:chat.access_event.bot_p2p_chat:read",
"im:chat.members:bot_access",
"im:message",
"im:message.group_at_msg:readonly",
"im:message.group_msg",
"im:message.p2p_msg:readonly",
"im:message:readonly",
"im:message:send_as_bot",
Lenovo POC Team
"im:resource",
"sheets:spreadsheet",
"wiki:wiki:readonly"
],
openclaw config set channels.feishu.appId "<App_ID>"
openclaw config set channels.feishu.appSecret "<App_Secret>"
openclaw config set channels.feishu.enabled true
openclaw config set channels.feishu.connectionMode websocket
openclaw config set channels.feishu.dmPolicy pairing
openclaw config set channels.feishu.groupPolicy allowlist
openclaw config set channels.feishu.requireMention true
- 运行 openclaw channels add 添加了 Feishu 渠道
- 网关处于启动状态(可通过 openclaw gateway status 检查状态)
- 选择 使用长连接接收事件(WebSocket 模式)
- 添加事件:im.message.receive_v1(接收消息)
- 在 版本管理与发布 页面创建版本
- 提交审核并发布
- 等待管理员审批(企业自建应用通常自动通过)
openclaw pairing approve feishu WCT6xxx
