
Jay 发自 凹非寺德州pvc管道胶水
OpenClaw(原名Clawdbot)爆火,「贾维斯」狂潮席卷全球。
刚看了下京东,本地Agent甚至已经成了Mac mini的广告语……
近硅谷的个本地Agent项目也很有关注度,而且是软硬件包好,买回来就能直接用的那种。
长这样子,250美元(折人民币约1700元),买来插上电就能当OpenClaw用。
对,硬件版的OpenClaw……
硬件版OpenClaw
名字叫Distiller Alpha,款Linux硬件,核心计模块基于树莓派CM5,8GB内存,64GB存储。
在此基础上,还集成了墨水屏、麦克风、扬声器、摄像头……
特别小个,手掌半都不到,整体尺寸比手机还小,感觉能直接揣裤兜。
所有都提前在这块硬件里部署好了,扫下墨水屏上的二维码,就能直接进入交互界面,和个叫Pamir的Agent对话。
OpenClaw能干的都能干,整理文件、翻阅X、发邮件……理论上,只要能通过「点击」解决的事情,都没问题。
同样是个24小时待命的贾维斯,可以随地大小Code。
这些都不是。
上面这些事情,OpenClaw都能做,甚至能夸张。
Pamir不样的地,是它竟然还可以给硬件Vibe coding……
有人给扫地机器人装了根机械臂,现在不仅能扫灰尘了,遇到大点的垃圾也能顺手捡起。
链接:https://mp.weixin.qq.com/s/GqKxBt_FjuyKacsc_ckYiw
有个老哥在里搭了套赛车模拟器,把Pamir当「驾驶」用。
每次他跑完圈后,这个「驾驶」会自动帮他回顾和分析驾驶数据,然后把这些数据实时展示在他接上的堆小显示屏上。
链接:https://mp.weixin.qq.com/s/GqKxBt_FjuyKacsc_ckYiw
就连这个8×8的LED灯阵都能玩出花来,只需要句话就能搞出各种炫酷的特。
链接:https://mp.weixin.qq.com/s/GqKxBt_FjuyKacsc_ckYiw
如果你想,甚至能在这上面玩贪吃蛇……
链接:https://mp.weixin.qq.com/s/GqKxBt_FjuyKacsc_ckYiw
各种离谱的demo见得多了,能给硬件Vibe coding的Agent倒还是次见。
正好近本地Agent火,相信大心里多少都有不少困惑:
这条路到底和其他Agent有什么不同?
类似的创业者如何看OpenClaw?
用户又该如何好地造自己的「贾维斯」?
带着这些问号,量子位找到了这硬件版OpenClaw,Pamir的两位创始人之——叶天奇,聊了聊他们在本地Agent这条赛道上的想法。
采访原文1.2万字,信息密度很,其中有不少有趣的观点。
为了完整呈现叶天奇的思考,我们决定不做过多处理,直接把全文端上来。
在这场对话里,你会看到:
软硬体的Agent,会有什么不样?
OpenClaw到底做对了什么,火了之后为什么又迅速暴露出堆安全问题?
为什么Mac mini并不是适部署Agent的硬件?
那些提前半年就体验过OpenClaw这种能力的人,现在都怎么用本地Agent?
为什么对初创公司来说,硬件是条适的路径?
AI时代下,电脑的终形态可能会长什么样?
以下附上访谈全文,为提升可读,量子位在不改变原意的前提下,对内容进行了适当调整和删减。
请享用。
OpenClaw、本地Agent,以及电脑的下步
Pamir是什么?
Q:Pamir现在做的Distiller Alpha是什么?它能干些什么?
叶天奇:Distiller Alpha本质上是台Linux的mini PC,台非常小的Linux小电脑。
我们把传统电脑里些基础的元件单拎出来,配上小屏幕、LED灯、麦克风、扬声器,以及各种各样的IO接口,把它做成了个非常紧凑的形态,整体尺寸比手机还小。
在系统层面,我们给这台设备预装了Agent,目前主要用于跑Claude Code。基本上,只要是Linux+Docker能做的事情,它都能做。
典型的场景是Vibe coding。现在有批开发者非常痴迷Vibe coding,希望随时随地都能写代码,他们会通过手机远程操作我们的设备。
除此之外,还有批用户会把我们的设备接到各种各样的硬件上,通过Vibe coding的式来开发和控制这些硬件。
Q:「Vibe coding+硬件」的组听起来挺新鲜的,可以展开讲讲吗?
叶天奇:这个向其实并不是我们开始有意设计的。从用户角度来看,会购买我们设备的人,往往本身就很喜欢玩硬件。
很多设计师,他们很懂电子产品设计,但并不擅长编程。过去他们使用的往往是比较简单的开发板,如果要做原型,就需要雇电子工程师帮忙。
现在他们会直接把Distiller Alpha接到硬件上,把自己的想法描述出来,系统就可以自动帮他把对应的逻辑和代码生成出来。
还有些用户,会用它去「接管」已经存在的设备,比如蓝牙设备。
很多蓝牙设备其实并不需要额外的密码,只要发送串正确的二进制指令,就能完成控制。
他可以直接对系统说:「帮我扫描下附近有哪些蓝牙设备」「帮我把这盏灯关掉」。
很多智能居都是自己立的套App,非常散。用Distiller Alpha就能个页面里,控制里所有的智能设备。
再比如印机,你不需要安装官App,只要知道它内部使用的是什么芯片,就可以让Agent写代码、做简单的逆向工程,让这台印机工作起来。
Q:如果不靠Distiller Alpha,客通常是怎么完成这些操作的?
叶天奇:这个问题其实挺有意思的。
我之前也问过些用户,发现主要取决于技术水平。
技术能力强的人直都是手写。他们会先去读硬件的说明书,搞清楚芯片型号、通信式和编程法,然后直接写代码、录。
但对技术能力没有那么强的人来说,过去的主流式,其实是用ChatGPT。他们会把需求丢给ChatGPT,让它生成段代码,然后复制粘贴到硬件的编辑器或录工具里,点下录,再测试。
如果发现不work,就把报错信息再反馈给ChatGPT,让它改版代码,再复制粘贴、再录。
有了我们的硬件之后,整个链路被闭环了。Agent可以自己写代码、自己录到硬件上、自己读取报错信息、再根据结果修改代码并重新录。不再需要在中间反复做人肉中转。
Q:为什么Distiller Alpha会出现这么多偏硬件的玩法?
叶天奇:核心的原因在于出发点不样。
OpenClaw是从软件向起步。即使你买了台Mac mini,也很少想到把它当成嵌入式设备,塞进另个硬件里。
面体积摆在那里,另面它的IO接口数量有限,也不太容易激发用户在硬件层面进行二次开发的欲望。
而且OpenClaw本身偏向于为知识工作者设计交互。对开发者来说,如果要写软件,不太可能通过WhatsApp、Telegram这种聊天气泡式的式,那会非常痛苦。
本质上还是面向的人群不同。我们早期的定位就是remote——个让你随时随地都能接触到自己Claude Code的设备。早购买我们的,基本都是Early adopter型的开发者。
后来随着Vibe coding这个概念被多人接受,有开始有越来越多非开发者、甚至传统意义上的知识工作者购买我们的设备。
有的用户在自己买了之后,还会再给父母买台。而这些非开发者用户,往往会把我们的产品当成种「智能硬盘」来用。
Q:Distiller Alpha本身的硬件由哪些组件构成?
叶天奇:我们在设计这款产品时的个原则是:在体积允许的情况下,把能装的能力尽量都装上。
比如灯带,它的核心作用是显示Agent的工作状态。比如Agent在思考时,会显示黄灯光;当Agent需要用户介入时,会闪烁绿灯光。我们希望通过这种比较克制的式,把Agent的状态融入到设备本身。
现在很多程序会用消息通知或者声音提醒,但我们觉得,用种偏「环境感」的式,通过视觉氛围来反映Agent状态,会自然些。
而且,通过环境光来传递状态的信息式,本身就很客。这点可以类比喜欢装机、玩电脑的人,会很热衷RGB灯。
屏幕的设计思路同样比较客。我们用的是块墨水屏。面,墨水屏显示果很好,很多开发者本身就对这种屏幕有偏好;另面,它的功耗非常低。
有些用户会把这块屏幕改造成自己的Personal dashboard,比如显示股票信息、未读邮件数量,或者当天还有多少任务需要处理。这类信息不需要频繁刷新,墨水屏非常适。
还内置了麦克风和扬声器。有的用户会设定:每天早上醒来时,让设备从自己的音乐列表里挑喜欢的歌来叫醒自己。
另外,我们还内置了个摄像头,主要是给开发者使用。有人会用它来远程看看里的猫狗,或者用来监控另台电脑的屏幕状态。这些都属于比较自由的开发用途。
Q:力配置是什么水平?
叶天奇:目前是8GB内存、64GB存储的CPU平台。
这个配置其实不是开始就想清楚的,你需要积累很多真实使用的know-how,才能知道跑个Agent到底需要多大的内存、多少存储。
我们会从几个维度去看,比如:个普通用户通常会同时跑多少个Agent;这些Agent的知识资产大概会增长到什么规模;个用户大概用多久,设备里的存储就会被填满;Agent的运行上限在哪里,瓶颈会出现在内存、存储还是IO上。
个很有意思的发现是,我们开始低估了知识资产的增长速度。
之前没想到会有这么多知识工作者,有些用户会长期给设备外接块SSD,把每次对话、每次任务执行的记录全部存下来,在他们看来,这些是非常重要的个人资产。
这类需求很难在产品设计阶段预判。但旦接触到用户,就会意识到存储本身,是Agent产品里个非常关键的维度。
Q:Pamir的技术原理是怎样的?
叶天奇:我们在产品路径上,和很多AI公司不太样。我们是先做硬件和系统,再在探索过程中不断摸索软件形态。
开始,我们在设备里直接内置了VSCode。我们的判断是,VSCode基本可以覆盖大多数软件开发和交互需求。后来随着产品迭代,我们不断做减法,把界面逐渐收敛,终拆掉了传统意义上的「GPT对话界面」。
软件交互主要基于内网直连。只要这台设备是开机状态,论你在什么地,用电脑也好、手机也好,都可以直接访问到它。有点像个ChatGPT式的入口,不同终端之间是同步的。
硬件交互面,设备上有个小的显示模块,会实时显示当前设备的连接状态。比如我们会展示个二维码,任何人用手机扫,就可以直接进入这台设备,向Agent发送指令。
Pamir的差异点在哪?
Q:Distiller Alpha和OpenClaw有什么区别?德州pvc管道胶水
叶天奇:在我看来,OpenClaw像是个「软件傻瓜包」。
它本质上像层胶水,把很多已有的能力粘在起,解决的是可用和易用。这有点像当年大对原生安卓系统不满意,于是会去刷各种三ROM,比如MIUI。
OpenClaw刻意简化了很多复杂的项目管理流程,把所有交互都集中在个Chat session,同时在记忆持久化上做了大量工作,让普通用户容易使用Agent。
其实类似OpenClaw的项目以前也不少,没有十个也有五个,只是今年OpenClaw跑出来了。我认为个重要原因在于,它「胶水粘得足够多、足够好」。
我们关注另层问题:如何让用户快速、安全地访问Agent?当Agent出错时,如何在系统层面进行回滚?
围绕这些问题,我们把自己正在做的事情统称为Agent runtime。
奥力斯 万能胶生产厂家 联系人:王经理 手机:13903175735(微信同号) 地址:河北省任丘市北辛庄乡南代河工业区
除此之外,我们还把麦克风、扬声器、灯带等硬件能力全部包成SDK,再进步抽象成Skills,原生地放进Agent体系里。
这样来,Agent在运行时,就不只是「生成文本」,而是可以通过硬件去表达状态、反馈和意图。
Q:把硬件能力包成Skills,解决了什么痛点?
叶天奇:个很直接的痛点是,非技术用户如何快速上手硬件。
我们在产品时,会附赠个硬件小玩具。哪怕你不懂技术、不懂编程,拿到产品之后也可以立刻开始玩。只需要开机,把这个硬件插上,就可以直接用,不需要理解它的工作原理。
这个过程其实不需要我们在Agent层或者模型层投入特别大的精力。
因为硬件是通过USB和设备通信的,只要插上,Agent就能立刻识别你连接了什么设备。比如你插的是块基于ESP32的LED模块,这个信息会直接在系统里被识别出来。
当你再去和Agent交互时,Agent会先检查当前的USB端口上连接了什么设备。它会发现这是个基于ESP32的、具体型号是什么的硬件,然后再去查看:当前项目目录里,是否已经存在这个硬件对应的说明书。
然后Agent就会知道,如果要给这个硬件写程序,需要用什么工具、通过什么式刷进去;如果过程中遇到问题,它也知道该如何提示用户,比如提醒你去按下设备上的reset按钮进行排错。
Q:Pamir能做OpenClaw能做的事情吗?
叶天奇:可以的。因为Distiller Alpha本身也是台完整的电脑,和买台Mac mini来跑是同种质。
只要是那种长期、可重复利用知识资产的工作,都可以直接放在我们的设备上去运行。
有位用户是网络安全,他积累了非常多年的安全经验,自己整理了大批网络安全相关的资料和法论,全都记录在文档里。他把这些文档交给Agent,相当于把自己的经验沉淀成套可以执行的SOP。
在网络安全域,有种常见的工作式叫做漏洞赏金,安全研究者会到各个网站上寻找漏洞,找到之后网站会支付报酬表示感谢。
这个用户就是把自己的经验交给Agent,让Agent 24小时不间断地在各类网站上寻找漏洞。
Q:Pamir的自研硬件,和Mac mini这种通用电脑有什么区别?
叶天奇:Mac mini有点太了,如果你的需求只是检查下Gmail、看看Slack消息,那其实没要花这么多钱买台Mac mini。
重要的是,Mac mini并不是个原生为Agent设计的系统。
今天不管是电脑厂商还是手机厂商,本质上做的还是「给人用的设备」。他们并没有在系统层面,门为Agent预留套执行、行动、回滚的机制。
所以Mac mini开箱之后,你需要自己做大量setup,这也是为什么像OpenClaw这类案,在真实生产环境中会遇到很多问题。
当然,从纯能角度来说,Mac mini的硬件上限很。但我认为,决定个系统是否能真正投入生产的,不是能上限,而是系统层面的下限和鲁棒。
Mac mini加OpenClaw的案是没法真正投入生产的,原因就在于它的不可控太强,它不是原生的Agent系统。
Q:那Pamir为了做个「原生Agent硬件」,相比Mac mini掉了哪些?
叶天奇:先,我们没有桌面,也没有传统意义上的屏幕系统。
如果你从原理去思考,Agent的工作时长会越来越长,能力也会越来越强,终它像是你的个同事。而你不会和同事共用台电脑。
这也是为什么我们没有给Distiller Alpha做桌面系统和屏幕。Agent当然可以在内部使用虚拟桌面、虚拟浏览器,但这些并不需要被人看到。
Q:围绕这种思考,你们增加了什么原生能力?
叶天奇:我们非常重视安全。
个很重要的能力是自修复。如果你把个OpenClaw交给非技术用户,玩天之后,很有可能就把系统搞坏了,因为Agent本身是可以修改自己代码的。
进Windows时,你可以按F12进入恢复模式,我们认为原生的Agent电脑也应该有这样的机制,不过是由Agent自己来完成。
我们的设备里有个watchdog系统。当系统出现问题时,它会行自检,然后告诉你:比如某个关键文件被误删,致系统异常。你只需要确认次,系统就会在几分钟内完成自修复,重启后回到正常状态。
在这种情况下,我们甚至不需要提供什么售后支持。如果你的电脑坏了,让它自己修自己就好。
另外,硬件本身也是个物理层面的沙盒。
有些安全问题,在软件层面很难解决,但通过硬件就轻松很多。比如你在使用Mac时,会用到指纹解锁。
还有个很重要的点,我们的每台设备都有个二的ID。在硬件层面,我们可以加入门的加密芯片,用来存储这个Agent的ID。这个ID只能通过物理层面的式进行破解才能拿到。
Agent所绑定的敏感个人信息,是可以直接和硬件捆绑在起的,这对于范围绕Agent的攻击非常重要。
Q:OpenClaw社区近反馈了很多安全问题,比如擅自重构文件夹,甚至有用户的钱全被转走了,这是怎么回事?
叶天奇:这和OpenClaw的设计取向有关。
它为了追求便捷和自动化,希望创造多「hands off」的惊喜时刻,因此在系统里加入了非常多的自动执行逻辑。比如它内部有类似「心跳机制」的设计,每隔段时间就会主动去寻找可以做的事情。
但它的下限和系统鲁棒不足,这种过强的主动和自动,会直接带来不稳定。
在我看来,OpenClaw像是种新的软件范式。如果你去看它生成的代码,会发现整体结构非常混乱,有不少bug。
这种产品会越来越多,而且也会继续有人使用。但它和我们这种有业团队、步步从系统层和硬件层进行设计、开发的产品,在本质上还是不同的。
我们不会像OpenClaw那样,为了让Agent能直跑,就不断给它叠加各种Skills。在权限和安全设计上,我们强调引入人的监管。
Q:所以还是OpenClaw的上限?
叶天奇:我纠正个容易被误解的点,并不是说OpenClaw本身的软件或架构决定了它的上限。
多是因为外部条件:它跑在Mac mini这种能很强的硬件上,同时又调用了当前好的模型。
Q:有人把OpenClaw能做的事情从简单、中等到难度分了几个别,你能给Pamir做个类似的分吗?
叶天奇:很多知识工作者买我们的设备,做的事情其实非常简单。他们把它当成个「聪明的硬盘」。
比如有位律师用户,有个项目涉及两百多份文件。我开始也很疑惑他为什么要买我们的设备,后来发现他之前直用ChatGPT,但没办法次把这么多文件交给它。
我们的设备刚好解决了这个问题。对他来说,它就是块可以被Agent理解、可以直接操作的移动硬盘。
再比如,有些用户会把U盘插到设备上,然后直接对Agent说:「这个U盘里有个文件,你帮我改下。」Agent可以自己进入U盘目录,找到文件、修改、再告诉用户已经完成。
这层的本质就是文件系统能力。
再往上层,就涉及真实的「电脑行为」。
比如让设备去查看Twitter、订餐厅、处理网页上的事务。这类事情如果放在纯云端环境,其实并不好做。但我们的设备本身就是台真实的电脑,有自己的浏览器、桌面和网络环境。
举个例子,我之前想订餐厅,直订不到位置。我就让设备去盯着网页。银行卡信息是存在设备里的,旦有空位出现,pvc管道管件胶它就可以立刻帮我完成预订。
过去类似的事情,大通常是写脚本来做,但很容易被网站的「机器人检测」拦下来。现在你可以让Agent像人样开网页、浏览、点击,这种行为很难被识别为自动化。
再往上层,往往和你个人的技术能力或知识资产度相关。
比如有程序员用户,白天在公司上班,里放着我们的设备,把自己的「二份工作」相关内容全部交给Agent。他会在中午休息或者空闲时间,通过设备检查二份工作的进度、下达接下来的任务,相当于同时做两份工。
类似的情况也出现在电气工程师、维修技工身上。他们过去要带着电脑去现场检修设备,现在只需要带这台设备,把可复用的维修流程和知识资产都交给Agent,再连接服务器就行,能显著加快检修率。
再往上走,就是偏客的玩法了。
比如之前说的逆向印机、强行控制硬件。如果你的技术背景足够扎实,只需要把这些知识交给Agent,它就可以很快帮你写出份Linux驱动,直接控制设备。
为什么要自研硬件?
Q:Pamir是在用台硬件去替代原本的电脑。另种是Manus路线,让Agent操纵云端的虚拟计机。如果看便携,这种式岂不是连额外硬件都不用带,只需要部手机就可以了?
叶天奇:对,从技术上来说,这是另种解法。
我认为这两种形态在未来都会长期存在,只是它们适的任务类型不样。
云端虚拟计机适做次的任务,比如调研、科研相关工作。这类任务往往是one-shot的,不太强调长期运行和状态持久化。
但如果你需要的是长期持久化的Agent,问题就来了。这些信息要不要直放在云端?那是不是意味着你要持续付费?而且很多度个人化的信息,大也不太愿意长期放在云上。
这其实和人们买电脑是样的逻辑。理论上,很多文件都可以放在云端,但真正和你每天工作强相关、需要随时访问的东西,你还是会希望它在自己身边、随手可用。
另外个差别点是,硬件容易通过USB和硬件交道。尤其是知识工作者,会大量使用U盘、SD卡,实体设备在这种场景下顺手。
Q:除了刚刚提到的这些价值之外,从你的个人体验来看,这种实体硬件在情绪价值上,能带来什么?
叶天奇:情绪价值其实非常多。
在早期阶段,如果你想用纯软件去「惊艳」开发者,其实是很难的件事。通过硬件形态,反而容易让他们产生情感连接。
比如Distiller Alpha,外壳表面覆了层特殊的手感漆,整体是偏柔软的触感。很多用户次拿到设备时,都会觉得这是个远远出预期的体验,因为他们从没见过台「软的」的电脑。
这会让他们意识到:这不是个Mac mini的替代品,而是个全新的品类。
产品形态如果不够创新,用户句话定会问:「这和手机有什么区别?」「这和电脑有什么区别?」
我觉得在做面向未来的产品时,很重要的是,要主动破用户已有的认知框架,消解他们的疑虑,让他们来不及问出这些问题。
此外,当你通过硬件设计、材质、触感,让用户意识到这是个从未见过的形态时,产品的情绪价值就会被显著放大,这对To C产品来说非常重要。
Q:这也是为什么你们开始会选择线下销售的原因吗?
叶天奇:对。我们会去参加各种黑客松、线下活动。
你问的很多问题在线下也经常被问到,比如:为什么不直接跑在云上?为什么不直接用ChatGPT?
但现在问这些问题的人越来越少了。我觉得这和OpenClaw的走红也有关系,如果OpenClaw是四个月前发布,很多人可能根本不知道它是什么。但现在,市场对Agent、以及「Agent需要自己台电脑」这个概念的接受度提得很快。
Q:你们在黑客松遇到消费者,会怎么说服他购买?
叶天奇:我般会先问个很简单的问题:「你平时用不用Claude Code?」
如果对说用,那其实已经基本落在我们的目标用户范围里了。
接下来我会继续问他:「你现在有没有在写代码?」
通常他说没有。我就会接着说:
「你其实应该在写代码,现在写不了,是因为你把你的电脑上了。」
这时候他往往会愣下,然后觉得你说得有点道理。
然后我会直接掏出手机,给他看我正在用手机远程Vibe coding。
这刻通常就已经完成了认知转变。
还有些不是当场发生的。有个客,平时用机械键盘,晚上敲代码声音很大,女朋友嫌他太吵,不让他继续敲。
但那天晚上他的灵感还没断。他回到床上,突然想起了我们的设备,于是直接给设备发消息,继续进他的项目。
那刻他觉得特别爽。后来他在社交平台上发了很多帖子,主动荐大买我们的产品。
我觉得本质上,我们动的,是那些不希望被断心流的人。
Q:那假设我已经被说服了,也花了250美元买了这个设备,我拿到设备后要做些什么?
叶天奇:先你需要有个Claude账号。大部分购买我们设备的人其实已经有了。
拿到设备之后,你只需要插上电,它会先显示个二维码。扫这个二维码之后,会进入Wi-Fi连接页面,设备连上网之后,会再生成个新二维码。
你再扫次这个二维码,就可以进入设备页面,登录你的Claude账号,然后就可以开始对话了。
在开始的阶段,我们会给用户准备些「玩具」示例。
比如我们会引你创建个个人主页,这个主页直接跑在这台小电脑上。它可以每天帮你抓取你感兴趣的论文、新闻或信息新。
硬件这块,我们会附赠个硬币大小的8×8的LED灯阵。拿到这个小玩具后,有些顾客会描述自己喜欢的游戏角,说:「你帮我把这个角展示出来。」
然后设备会自己去网上查这个角的形象,下载需要的依赖,生成对应的程序。
两分钟左右,这个LED灯阵上就会开始播放他喜欢的角动画。整个过程用户什么都不用做。
Q:在部署成本这件事上,Pamir的优势主要体现在哪里?
叶天奇:我们其实准备了两套使用式。
对技术人员来说,你可以直接在电脑上开,用的就是VSCode这套熟悉的IDE体系。这类用户几乎是门槛,他们本来就在用这些工具。
对非技术人员来说,他们不需要碰电脑,可以直接用手机。手机端是个和ChatGPT很像的网页界面,通过对话的式来使用。
当然,非技术用户也不是不需要学习,只是学习成本会低很多。我也承认,OpenClaw在这点上做得很好,它通过集成到用户已经熟悉的聊天工具里,对非技术用户来说,几乎是「可用」的。
所以两者大的差别,其实是在交互路径上。
Q:刚才聊了很多新用户的体验,但你应该老的用户,用了这么久本地Agent,它对你个人的生活和工作习惯,带来了哪些变化?
叶天奇:变化其实非常大。
我们是度用户,现在大对OpenClaw的体验,我们在半年前就已经经历过了。
到现在,我们公司内部已经开始出现种现象——
传统电脑的存在感越来越低,很多工作,用设备+手机+iPad,甚至再加个AR眼镜,就已经足够了。
现在我们在开电脑之前,都会先问自己个问题:我现在要做的这件事,能不能交给设备?
如果答案是肯定的,那这件事可能已经不需要人去做了。
所有人的角,几乎都被迫「往上提了」。以前你可能还是个主要负责写代码的角;现在你像是个架构师,需要决定向、拆解问题、设计系统。
Q:当Pamir帮把很多工作自动化后,你把时间花在了什么地?
叶天奇:学习,读书。当然,作为CEO,我多的时间会放在判断接下来几个月可能发生什么,以及应该围绕这些变化去设计怎样的软件架构。
真正花时间的地,已经从「执行」,转移到了Review和思考上。
过去,行动比想法有价值。公司之间的差距,主要来自工程能力和工程时间的堆积。
但现在,行动本身的价值在下降,因为Agent可能十分钟就把事情做完了。反而是你的思考、你的判断、你的愿景,变得越来越重要。所以我们现在会花大量时间去复盘、讨论、对齐向。
Q:这种转变,会对公司的组织形式和工作范式带来什么影响?
叶天奇:我觉得这种变化带来的冲击会非常大,很多公司可能还没真正意识到这点。
如果把今天的大厂,尤其是些Frontier Lab,和普通创业公司放在起看,会发现差距非常明显。
原因在于,模型厂商掌握着模型本身的控制权。
用户在使用过程中遇到的所有问题,都可以被他们捕捉到。这些问题会直接进入下轮后训练,模型的下限会不断被抬,鲁棒会越来越强。
这意味着他们是可以形成闭环的,模型和Agent可以起成长,产品会越用越好,内部率也会越来越。这也是为什么Claude产品会越用越好。
相比之下,如果你只做Agent layer,就你把Agent写得再好,它也没法把反馈「喂」回模型。你只能不断用人力去维护规则、修补边界。
我觉得今天的创业要想清楚件事:自己的真正优势和差异化到底在哪里?
定要做那些别人暂时做不了的事情,主动避开不公平竞争。
Q:如果Claude下场做类似的事情,你们的护城河在哪?
叶天奇:对我们来说,就是系统层和硬件层。
硬件意味着供应链、生产、真实用户交互、物理世界里的反馈,这些并不在模型到Agent的闭环之中;系统层的沙盒、安全、回滚机制,同样是在模型和Agent之上的层。
说实话,今天软件层面的护城河已经非常薄了,而且只会越来越薄。就你做出来个新,别人可能花两天就能把复现出来。
真正的护城河,多集中在硬件本身,以及软硬件的度集成上。
能耗、芯片选型、内存和存储的配比、Agent能跑到什么边界、供应链周期,这些都需要大量经验和时间去点点堆出来。
核心还是两点。
,是你对Agent的认知度。
这个域变化太快了,几乎每天醒来都会出现新的东西。如果你对Agent的理解没有至少几个月的前瞻优势,很容易就会陷入被动追赶。
二,是你能不能做出10倍、20倍别的用户体验差异。
如果只是1.2倍、1.5倍的改进,在今天的软件竞争环境里,很快就会被淹没。
你看现在Claude产品确实已经很好用了,但真正的非技术用户有多少人在用Claude Code?
在我看来,这个体验距离「我爸妈也能用」之间,依然存在明显的gap。而这个gap,恰恰是本地Agent和软硬件结还有机会去填补的地。
Q:有没有些关于使用Agent的小tips,能让普通用户用得些?
叶天奇:我觉得可以先假设个前提。如果大用的都是顶模型、顶Agent layer,那么终果的差异,很大程度上并不来自「模型聪不聪明」,而是你如何和它沟通。
个很常见的问题是,很多人上来就把个很大的任务次交给Agent。这种情况下,Agent做不好是非常常见的。
我自己的习惯是先和Agent起做计划。但我也不会让它次把所有事情规划完,然后直接Kick off全流程。那样在执行过程中,几乎定会出错。
我倾向于把任务切割成足够小、足够清晰的步骤,再告诉Agent把这套计划存下来。
这样来,它在后续执行时,可以不断回访「自己该做什么」,整个过程会有条理,执行的鲁棒也会。
还有个很多人容易忽略的点:如何把次对话,转化成可复用的知识资产。
很多人Vibe coding完了就结束了,这个过程中产生的大量经验,并没有被保存下来。
比如你在调个蓝牙模块,怎么都连不上,后发现是因为某种芯片只接受特定格式的消息。这本身就是个非常有价值的知识点,在之后的项目里,很可能会反复用到。
所以我会建议用户,在使用过程中有意识地引Agent把这些错误、踩坑、解决路径,总结成可复用的Skills或规则。
不要用完就结束,记得持续积累属于你自己的知识资产。
本地Agent的创业感悟
Q:能跟我们讲讲你的创业故事吗?开始做这个项目的时候,起心动念是怎样的?
叶天奇:说实话,这个项目里,运气的成分挺大的。
我们年半以前就开始做Pamir。那个时候,很多人连Agent是什么都不知道。当时Pamir也不是现在这个形态,我们开始做的是端侧AI,To B业务。
我和联创张城铭毕业后,大概在大厂工作了两年。那段时间,我们白天上班,晚上和周末就尝试各种各样的项目,但直没有真正做出什么特别大的东西。Pamir对我们来说,是次孤注掷。
在这之前,我们直都是边上班、边做项目。但做Pamir的时候,我直接搬到联创里,睡在他的沙发上。那段时间其实挺糟的,全职工作也做不好,项目也做不出来。想着「要么成、要么就了」。
当时做Pamir的判断是:如果你要做嵌入式系统,就定需要个端侧的硬件板子。所以开始我们是在开发板,面向的是硅谷小撮在做对话式AI和硬件结的客。
不过,联创和我都是技术出身,对融资所知,也不知道应该怎么讲故事,基本就是硬着头皮做。
花了几周时间把原型做出来之后,就直接拿到硅谷去。
Q:开始给硅谷,顺利吗?
叶天奇:比我想象中要顺利。
当时正好有两个非常有名的AI硬件项目,个是Rabbit,另个是Humane,带起了波AI硬件创业的热潮。那个时间点,市场是被充分教育过的,我们本身的产品也很有优势。
当时很多做语音交互的AI公司都非常「笨重」:用树莓派,加USB麦克风,再加USB扬声器,拼成个很大的盒子。
我们给他们展示的,是个非常小的板子,却能完成他们现有案里大部分的。这对他们来说吸引力非常大。
Q:当时和你们在同批起跑的竞争对手,现在都是什么状态?
叶天奇:很多都选择All-in端侧模型,甚至是Double down在端侧这条路上,但基本都转去做To B业务了。
从市场上看,To B这几年是有增长的。端侧模型越做越小、越做越轻,在些明确的落地场景里是成立的,比如车机系统、企业内部的私有化部署,都会有需求。只不过,这条线的增长速度,明显赶不上Agent相关的公司。
我们也不太适做To B生意,坦白说,我们不太喜欢和B端客户交道。
是交期要求非常严格,二是很难发挥想象力。
好不容易从大公司出来创业,结果折腾趟后,发现自己又在给别人工。
有次我在给产品写代码,让Agent跑任务。我盯着屏幕看了大概两分钟,什么都没做,只是在发呆。
突然个念头闪过——为什么我的Agent在工作,而我却要盯着它看?
从这个体验出发,我们出个结论:未来定需要种Agent自己的、立的计设备。
想清楚这点之后,我们几乎是立刻决定把所有端侧相关的案全部删掉,接入当时新的大模型,转向To C。
之后的事情就比较顺了。
我们开始正式产品,开始大量做线下展示。后来Vibe coding开始流行,然后Claude Code火起来,我们又继续往这个向演进。
Q:你觉得现在幸福,还是之前在公司上班的时候幸福?
叶天奇:这是个好问题。
其实我之前也被朋友问过类似的问题,问我理想的生活状态是什么样的。我想了很久,发现现在的生活基本就是我理想中的状态。每天都有新的挑战,还能和志同道的人起解决问题。
你可能听说过「传教士」和「雇佣兵」的说法。我们像传教士,是在为件于自我的事情工作,即使短期没有物质回报也愿意坚持。
开始做Agent电脑,很多人根本理解不了,觉得不可理喻。但我们自己是信的,甚至觉得这件事情的意义,于我们个人本身。
我们现在创业在做的,就是把它带到这个世界上。我很享受这个过程。
Q:你有没有宏大的愿景?AI电脑这件事,终会走向哪里?
叶天奇:我们希望替代现在意义上的电脑,准确地说,是替代笔记本电脑。
今天人的大量时间,还浪费在低价值的操作上,比如在不同系统、不同表格之间手动搬运数据。我们希望把这些工作自动化,让人把精力用在真正需要思考、判断和创造的事情上。
也有点很个人的动机。我其实非常想挑战苹果。
我现在对苹果的态度是复杂的。面我很依赖它的生态;另面,我对它当前定义「个人计」的式感到不满意。公司里很多人也有类似的感受。
手机厂商当然知道自动化、智能体是趋势,他们也会往这个向走。但路径有根本差异。
他们做的是前台,所有能力终都要回到屏幕、交互界面和注意力占用上;我们做的是后台,很多任务不需要屏幕,也不需要人持续盯着。
我们认为这是次非常难得的机会,终于可以不再需要围绕「屏幕」去设计产品。
Q:近OpenClaw把Mac mini又带火了波,你什么感受?
叶天奇:这确实是我们很难在短期内追平的点。
苹果在处理器、硬件整上的能力,几乎没有对手。这也是我们后面考虑逐步引入通芯片、点点缩短硬件差距的原因。
但从另个角度看,在Agent成为主范式之后,硬件参数的重要在相对下降。苹果依然可以继续做其强大的通用计设备,这件事不会消失。但它是否定是Agent的入口,这件事并不确定。
历史上类似的情况其实反复出现过。早期个人计时代,也有像IBM这样的巨头存在,但形态、入口和主权依然发生过转移。
我觉得今天是又次轮回,只是这次的核心变量变成了Agent。
— 完 —
量子位 QbitAI · 头条号签约
关注我们德州pvc管道胶水,时间获知前沿科技动态
相关词条:离心玻璃棉 塑料挤出机 钢绞线厂家 铝皮保温 pvc管道管件胶