关嘉伟 · 趋境科技 01 / 16

2026 中国生成式 AI 大会（北京站）

端云结合，
让 OpenClaw
更有趣也更安全

硬件载体在变
端上跑得动多模态和隐私数据，云上有真正聪明的模型
两边走到一起，事情才刚开始有意思

第一幕 · 硬件载体被重新定义 02 / 16

问题

PC 的默认是开关机
Agent 的默认是一直醒着

家里的路由器一直开着，没人觉得奇怪
我帮人装完 OpenClaw 才发现，大家脑子里那个"AI 工具"还长着电脑的样子
其实不是它该一直在那儿

来自一个真实问题

"我不小心把电脑关了
怎么说话没反应"

24/7

第一幕 · 硬件载体被重新定义 03 / 16

小

观点一

端侧设备
别再去卷大模型

算力、带宽、内存供应链，三道墙一起卡在"本地跑大模型"这条路上
盒子的价值从来不在能跑多大的模型，在醒着、便宜、安静

Mac mini 形态

16G 统一内存就够
不必追 64G、96G

异构优先

GPU 跑 embedding
NPU 跑视觉
每颗芯片都别闲着

稳定至上

常开低功耗安静
放客厅像个路由器

第一幕 · 硬件载体被重新定义 04 / 16

观点二

多模态才是真正值得在端上跑的

大家都在想端上怎么跑通用大模型，这条路其实太贵
划算的是那些小的、数量多的、天天要用的辅助模型
共同特征就三条：不想外传、不着急、云上按秒扣费扣得吓人

Embedding

记忆向量化
私人资料不外传

ASR

语音转文字
端上速度足够

TTS

情感音色克隆
云端按分钟扣费

OCR

敏感合同识别
不想让它上云

VLM

图片和视频理解
摄像头场景最典型

第一幕 · 硬件载体被重新定义 05 / 16

案例

家里摄像头的视频
云上又贵又泄隐私
端上又慢但数据在家

现在家里装监控的越来越多
真要把视频传上云，大部分人心里不舒服
云上视觉大模型的单次价格，对一个普通家庭也过分

视频分析本来就不着急
晚上慢慢算，白天看结果就行

端侧 VLM 加上异步隐私留下账单也留下

夜

第二幕 · AIMA 把端云结合做成一条路 06 / 16

Act II

II

AIMA 把"端云结合"
做成一条能走通的路

从安装到连接到交互，一条链路一次走通
接下来用五张真实截图带你过一遍

第二幕 · AIMA 把端云结合做成一条路 07 / 16

Step 01 · 开箱

插电 → 浏览器
它已经认识自己

不用你去查 GPU 型号、算 VRAM、配 arm64 环境
AIMA 一打开就认出来了
GB10、119.6GB 显存、Cortex-X925、Docker 就绪
然后把这些信息喂给后面的路径

自省

GPU、CPU、RAM、架构
全部自己认

预检

Docker、K3S 状态
直接告诉你

第二幕 · AIMA 把端云结合做成一条路 08 / 16

Step 02 · 选路径

两条路
同一个设备

"查看推荐模型"是 AIMA 按你的硬件给你排好的清单
"使用本地模型"是你手里已经有的那 18 个
不管走哪条，装 agent 这件事，用 agent 的方式完成

▸ 没有门槛，有硬件就能开始

第二幕 · AIMA 把端云结合做成一条路 09 / 16

Step 03 · 模型

FIT% 告诉你
这台机器能跑到多好

不是"能装吗"，是"装完了能跑多快"
qwen3-asr-1.7b · 621%、tts-0.6b · 619%、qwen3-32b · 592%
辅助模型一抓一大把，稍微大点的也能在端上试跑

要点

端上跑的不是一个大模型
是围着 agent 转的一整套辅助模型
embedding、ASR、TTS、图像、视频，每样都有得选

第二幕 · AIMA 把端云结合做成一条路 10 / 16

Step 04 · Agent

看右下角那一行
OpenClaw 未接入

这是我整张幻灯片最想停一下的瞬间
AIMA 是盒子，OpenClaw 还差一口气
一旦接上，这台 GB10 才真正变成有工具调用、有模型推理、有持久记忆的 agent

▸ 硬件 + 模型 + OpenClaw 才算齐

第二幕 · AIMA 把端云结合做成一条路 11 / 16 ⭐

Step 05 · 端云接通

这就是
端云结合的样子

用户对云端说的一句话

"安装 openclaw 到这台机器
连 llm 连飞书"

云端大模型把意图拆成一串命令，下发
端侧 AIMA 接到以后跑任务，把进度汇报回来
一句自然语言，两边一起动起来

第三幕 · 更有趣也更安全 12 / 16

更有趣

端和云
不是谁替代谁
是谁把谁的短板兜住

端侧 · EDGE

隐私
摄像头、合同、家庭数据不出这台机器
异步算
半夜慢慢算电费比云便宜不少
多模态便宜跑
ASR、OCR、VLM 一直常驻
24h 醒着
路由器形态你关电脑它还在
法律干净
设备是你的责任就是你的

+

云端 · CLOUD

前沿智能
Claude Opus 4.7、GPT-5、Kimi K2、DeepSeek 这一档
长上下文
100K 甚至 1M token 一次看完
意图分解
一句话拆成一串工具调用
集群回退
端上算不动时云端自动接手
生态协议
MCP、飞书、企微、各种 API

端 + 云不是折中是互补

第三幕 · 更有趣也更安全 13 / 16

更安全 ①

OpenClaw 默认
只跑在 localhost

它不暴露在公网上
后台工具全在 127.0.0.1
只有一个 Gateway 通过 IM 长链接走出去
外面摸不到你的机器

▸ 安全是架构层面的事不是事后找审计员

┌──────────────── 你的盒子 ─────────────────┐ │ │ │ localhost (127.0.0.1) │ │ ┌─────────────────────────────┐ │ │ │ OpenClaw tools │ │ │ │ · Embedding · ASR · TTS │ │ │ │ · Skills · FS · Shell │ │ │ └──────────────┬──────────────┘ │ │ │ │ │ ┌───────▼────────┐ │ │ │ Gateway │ │ │ └───────┬────────┘ │ │ │ IM 长链接 │ └────────────────────┼───────────────────────┘ │ (飞书 / 企微 / Slack) │ ▼ ☁ 云端 LLM

第三幕 · 更有趣也更安全 14 / 16

端 · 卖烟的

"吸烟有害健康"提示到位
一手交钱一手交货，就结束了
资产归你，责任归你

云 · 开烟馆的

你在我场所，用我工具，我还按时收你钱
真出事了
我就是从犯

更安全 ②

端等于卖
云等于租
法律上是两件事

Agent 不再只是工具，它会自己做决策
一旦真出事，法律会追到最近的那个"持有人"
端侧设备是卖给你的，归属权最干净

来源《边端AI的第三个理由：法律》· guanjiawei.ai/blog

第三幕 · 更有趣也更安全 15 / 16

真实生产

从玩具到工具
端云结合才能真进生产

连飞书

一句"连飞书"
端侧起机器人云端解析意图
以前 95% 的人会卡在这一步
现在 30 分钟跑通

常开

盒子常开云端回调触发任务
你关电脑没关系
服务不在你的电脑上
在那个盒子上

AI 自装

远程 agent 自己装
自己连自己排错
装了几十台下来
它越来越上手

安装 → 连接 → 交互
以前每一步都在卡人的环节
现在都被 agent 吸收了

全文完 16 / 16

Fin

一起把 agent
从 demo 推到生产

洪水很大最后船上站不了多少人
你希望那条船上的人是谁

GUANJIAWEI.AI

博客 · 思考

AIMA × OPENCLAW

端云 · 贯通

端云结合， 让 OpenClaw 更有趣也更安全

PC 的默认是开关机 Agent 的默认是 一直醒着

端侧设备 别再去卷大模型

Mac mini 形态

异构优先

稳定至上

多模态才是真正值得在端上跑的

Embedding

ASR

TTS

OCR

VLM

家里摄像头的视频 云上又贵又泄隐私 端上又慢但数据在家

AIMA 把"端云结合"做成一条能走通的路

插电 → 浏览器 它已经认识自己

自省

预检

两条路 同一个设备

FIT% 告诉你 这台机器能跑到多好

看右下角那一行 OpenClaw 未接入

这就是 端云结合的样子

端和云 不是谁替代谁 是 谁把谁的短板兜住

端侧 · EDGE

云端 · CLOUD

OpenClaw 默认 只跑在 localhost

端等于卖 云等于租 法律上是两件事

从玩具到工具 端云结合才能真进生产

连飞书

常开

AI 自装

一起把 agent 从 demo 推到 生产

端云结合，
让 OpenClaw
更有趣也更安全

PC 的默认是开关机
Agent 的默认是一直醒着

端侧设备
别再去卷大模型

家里摄像头的视频
云上又贵又泄隐私
端上又慢但数据在家

AIMA 把"端云结合"
做成一条能走通的路

插电 → 浏览器
它已经认识自己

两条路
同一个设备

FIT% 告诉你
这台机器能跑到多好

看右下角那一行
OpenClaw 未接入

这就是
端云结合的样子

端和云
不是谁替代谁
是谁把谁的短板兜住

OpenClaw 默认
只跑在 localhost

端等于卖
云等于租
法律上是两件事

从玩具到工具
端云结合才能真进生产

一起把 agent
从 demo 推到生产