伴随着 Clawdbot 改名成 @moltbot,大家火爆的情绪也开始逐渐退潮。不知道有多少人已经随着潮落回到了日常生活的汪洋中,又有多少人作为潮水退去后留下的「新物种」,开始探索这片全新的大陆了?
我相信很多朋友会觉得:这好像也没什么出彩的地方啊,不明白它为什么这么火?
有这种感觉很正常。这个产品一开始是作者做来自己用的,按照他的需求「长」成现在这只🦞。他在 Demo Day 介绍项目时说过,这个产品最早新建文件夹时的名字叫「WhatsApp Relay」——起初只是拿它来远程控制自己的 coding agent。后来他发现这个 agent 会自己解决一些没有预设流程的问题:比如在没有转写服务的时候给它发了一条语音,结果 agent 骂骂咧咧地自己用 OpenAI API 写了个代码去转写。从那之后他才不断扩展功能,往生活助理的方向打造。
所以,如果你没有他日常遇到的问题,自然会觉得没用;跟他的点重合得越多,就越会觉得好用、爱用、头皮发麻。大家的失望主要来源于没找到合适的场景——要么需求太简单用 chat bot 就够了,要么需求太复杂哪怕给真人都搞不定。
我的 Clawdbot 初体验:从吓跑到入坑#
最早朋友向我推荐这个产品时,我在本机上装了一下。起初因为配置问题跑不起来,间歇性地跑起来几次后,看到它对权限要求如此之高,又能啪的一下就把我浏览器打开,开始自己输入网址查东西——我立马把它关了并卸载。
初次见面是一次非常不愉快的经历。
但是,虽然见面时间很短,它做的事也很吓人,它的交互体验确实让我眼前一亮。说时迟那时快,我立马下单了 Mac mini(没错购物车里躺了一年了,终于有理由了),到货后第一时间把 Clawdbot 装进去,还给这台机器起了极其中二的名字「Bunker」(地堡)——如果你玩过《尼尔:机械纪元》,就是月球上的那个 Bunker。
有了这套 setup 之后,我就开始慢慢探索它的功能,结果越探索越上头。直到现在,我觉得还是没有完全发挥出它的实力。
所以,我打算接下来按照一篇文章一个案例的节奏,分享我的使用心得。我不会只甩一个教程说「照着做就行」,我会从为什么有这个需求开始,讲我怎么想到用 agent 解决问题,以及尝试的过程。当然,有必要的话,也会附上尽可能好上手的复刻方法——但这是我打的「鱼」,你未必爱吃;前面的「渔」可以让你去打自己爱吃的。
今天的案例:写博客的完整工作流#
今天要分享的场景是写博客——不仅仅是写本身,而是为什么要写,以及怎么通过 Clawdbot 搭建一整套符合自己习惯的工作流。比如我喜欢用说话的方式输出,所以是录音转写;你可能喜欢手写,那就写在纸上拍给它。
为什么要有自己的博客?#
在 AI 时代,人的角色会发生极大变化。越来越多的事情不再需要人的「工具属性」,而更多需要人的创意、审美、思路。思维产出不能只停留在脑海里想或跟朋友吹水,需要凝结下来——写文章、发推文、做视频都可以。
而现在有了 Clawdbot,搭建博客的门槛大大降低了。作为一个跑在本地、权限很高的 agent,它可以自己完成整个博客的搭建,只需要你一声令下。中间出了任何问题,都可以让它继续解决。
如果你之前觉得麻烦或搞不定,现在可以作为 Clawdbot 的第一个用例去探索看看。比如现在马上掏出手机,跟你的 Clawdbot 说一声「提醒我尝试搭建自己的博客网站」,后面它就会不断拿这事烦你,甚至给你准备好调研方案。
第一步:怎么开始写?#
这是最难的。我虽然在 AI 流行之前也写过一些偏技术和科普类的文章,但自认是个写作困难户。很多文章写了又改、改了又写,或者中途搁置两个月之后再拿出来继续。经常有朋友跟我聊天后说:你这些想法都很有意思,怎么不见你写出来?就是因为我很难动笔开始。
在我看来,自律当然是好品质。但有时候为了让事情启动,不能非要找那种逼自己到一定程度来彰显决心的方式,这样很容易半途而废。应该找适合自己习惯、让自己觉得舒适的方式做事情,哪怕做得磕磕绊绊,也比被堵在前面不往前走强。一旦走起来,正反馈越强,就能克服更大的阻力。
很庆幸在 AI 时代,用自己舒适的方式完成某件事的门槛大大降低了——即便现成的工具流程不适合你,你也可以自己很简单地创造出一套适合自己的工具流程。
我的工作流:语音转写 → 润色 → 发布#
1. 语音输入:边走边说#
比如现在这篇文章,我正在路上散步,一边走一边通过 AirPods 给一个 Discord channel 发语音消息,口述我的想法。
收到语音消息后,Discord bot 就会启动工作流:自动把语音拿去给本地搭的 Whisper 转写,然后通过另一个小模型进行纠错润色。

插一句,我的工作流基本都沉淀在 Discord,感兴趣的话可以看这一篇文章。
2. Whisper + Apple Foundation Model:本地转写清理#
这套流程的核心是 Whisper 负责「听」,AFM 负责「编辑」。
用过语音转文字的人都知道,转出来的文字往往不能直接用。口语里的「嗯」「那个」「就是说」会原封不动地出现,标点要么几乎没有,要么夹杂着加错位置的英文标点,断句全靠猜。
拿一段日常语音举例,Whisper 转出来大概是这样:
今天打算做的事情还有哪些呢一会儿我觉得可以让AI助理帮我每天看一下我的Google Analytics里面我的Blog Site的访问情况毕竟我平时想不起来去看让他帮我追一下还有一件能做的事情就是就是什么来着怎么突然想不起来了那个算了先这样吧
没有标点,没有分段,重复的「就是就是」也保留着,这种文字发出去或存档都不太体面。
我让 Apple Foundation Model(3B 参数的本地小模型)扮演一个「编辑」角色,把口语整理成书面语:
System Prompt: 将语音转写的口语文字整理为书面语。去除口语词(嗯、啊、就是、那个等)、删除重复内容、修复断句、添加标点。保持原意,只输出整理后的文字。
同样那段语音,经过 AFM 处理后变成:
今天打算做的事情还有哪些呢?一会儿我想让AI助理每天查看我的Google Analytics,看看博客的访问情况。毕竟平时我常常忘记去看,让它帮我跟踪一下。还有一件事情,我突然想不起来了,算了先这样吧。
标点有了,断句清晰了,重复和口语词都删掉了,但意思完全没变。
性能方面,AFM 的处理大概增加 0.8 秒(纯 Whisper 1.05s → 加上 AFM 1.85s)。对语音消息来说,这点延迟完全可以接受,换来的是可以直接用的文字。

自从加了这套优化,转出来的标点基本一遍过,不需要再改了,之前手改标点改得痛不欲生的日子一去不复返 ✌️。
3. 整理和润色#
有了草稿,第二步是整理和优化。这一步一定要自己完成,因为我希望保持自己的思路和叙事方式,是真正的「灵魂的回响」(中二病又犯了),也是思维输出的必要步骤。
完成后交给 Clawdbot,它有一个我们商量出来的 skill 叫「zhixian writer skill」。它学习了我过去很多文章和推特,熟悉了我的行文风格。给它草稿后,它就会按照这个特点帮我润色——主要是查缺补漏:逻辑不全、用词错误、文章结构问题。它还能帮我做标题建议、内容排版和分段标题,这些都是我特别讨厌的必要工序,也是之前写作的一大阻力来源。
4. 发布:Hugo + GitHub#
关于博客网站,我现在用的是 Hugo,一个非常轻量级的本地静态博客生成器。只要把 Markdown 文件给它,跑一个命令就能生成漂亮的博客网站,推到 GitHub 上就可以直接发出去。
这种操作接口对普通人来说可能太硬核,但对 agent 来说是天然最适合的。而且 agent 还可以按照既定的元数据格式,自己配好标题、标签——这也是之前手写博客时最烦人的活,现在都交给 Clawdbot 做。
另外,因为我的博客是中英双语,它还会自动帮我翻译一遍英文。大家都知道大模型大多靠英文内容训练,中翻英的效果远比英翻中好。中文润色结束、生成预览后,如果我觉得没问题,说「发吧」,它就会自动完成翻译,起一个英文简称作为目录名,把文件按照博客要求的格式(index.en.md 和 index.zh.md)命名好。

5. 配图:让 Clawdbot 自己生成#
还没完,因为它非常了解这篇文章,配图也由它来做。它会生成提示词,如果你配了 Gemini 或 OpenAI 的 API,可以直接调用生图。但我属于比较追求「性价比」的那一挂,不想额外买 API,就让它直接去登录了 Gemini 的浏览器里,访问网站生成图片,下载后整理好再上传到博客。

当时看到它自己完成这个流程的时候我也很震惊——希望大家多尝试给它一些复杂任务,不要预设做不成,试一下再说。
6. 同步 X Article#
博客发出来后,如果我打算也发到 X 的 Article,很可能会在文章中手动配一些图,或进行文字的小修小补。发布后,我会把 Article 的链接扔给 Clawdbot,告诉它这是最终版本,它就会按照文章里的排版,把图片下载下来,并根据图片位置更新那两篇博客,包括文笔的修改和插入链接,都会完整同步过去。

效果对比#
整个流程给我的感觉是:
如果原来写一篇文章需要耗的精力是 100,里面可能只有 50 甚至更少是用在内容主旨上,剩下一大半都在处理语句表达、排版、发布、找图这些杂事。
现在完全反过来了——大部分精力都放在内容上,输出效率和质量都可以得到提升。
小结#
这篇文章先讲这一个用例。如果你觉得这个流程也很适合你,可以把文章链接扔给你的 Clawdbot,看看它能不能开始跟你讨论这个工作流的搭建。如果它做不到,欢迎回来留言告诉我,我之后再出一个 md 文件让它能更好地执行。
当然我认为更重要的是展示**「搭建符合自己舒适区的工作流」**这件事情本身——希望大家都能找到自己的舒适区,舒适区赛高!😆
关于我#
有朋友问我为什么叫「直线」,是表明自己是钢铁直男吗?😂
这里简单介绍一下:大家可以叫我「知县」,在移动互联网和 Crypto 行业一共混迹十几年了,目前的兴趣方向是「Agent 训练师」,希望利用 Agent 把我开的脑洞验证一遍,甚至让它们独立推动一些事情的进展。哪怕一时做不到,也要相信大模型的力量持续尝试。
如果大家对这个方向感兴趣,欢迎关注我,多多讨论交流,也可以加入我正在做的社区项目,一起撸起袖子探索。
下期预告#
下一篇我可能会聊聊日常与 Clawdbot 交互的一些小技巧和设定,比如 Telegram 的 DM Thread 模式,以及在 Discord 上给 Clawdbot 搭建更「宽敞」的工作场地。希望我的经验和探索出的使用方法能对大家有所帮助。

