Koclaw正式上线 — 从构想到运行的代码
Koclaw正式上线 — 从构想到运行的代码
在上一篇关于Koclaw的文章中,我分享了早期的构想:以AIKokoron的理念为基础,将其发展成一个跨平台的AI Agent框架。那时候项目甚至还没上传到GitHub。如今,情况已经大不一样了。
Koclaw现已部署完成、开源发布,并在生产环境中运行。
Koclaw是什么
Koclaw(Kokoron + claw)是一个安全的、可自托管的个人AI Agent框架。核心理念是:一个AI人格、多个平台、统一记忆、端到端加密。不再需要为每个平台维护独立的AI机器人,Koclaw让同一个助手 — Kokoron — 在Telegram、QQ、Discord、桌面应用和网页上运行,共享所有上下文,保持一致的性格。
项目由两个核心组件构成:
- Rust Gateway — 安全核心。负责消息路由、认证、加密、通道管理和基于cron的调度器。使用Rust编写,确保内存安全和高性能。
- Python Agent — AI大脑。负责LLM路由(Claude、GPT-4o、DeepSeek、Ollama)、对话记忆、MCP工具执行、语音合成和Live2D头像的表情提取。
两者通过内部WebSocket桥接通信,Gateway作为守门人负责执行权限控制并将消息路由到正确的通道。
目前已实现的功能
五个计划开发阶段全部完成,124个测试通过(Rust 66个 + Python 58个):
多平台通道
- Telegram(轮询模式,支持文本/语音/图片)
- QQ(OAuth2认证,频道 + 私信)
- Discord(WebSocket Gateway,频道 + 私信)
- 面向桌面和Web客户端的WebSocket通道
安全性
- X25519密钥交换 + HKDF-SHA256密钥派生
- ChaCha20-Poly1305静态加密
- 加密SQLite记忆存储
- 文件系统路径验证和命令白名单的工具沙箱
- 三级权限模型:Public / Authenticated / Admin
AI能力
- 多供应商LLM路由(在Claude、GPT-4o、DeepSeek、本地Ollama之间切换)
- 27个MCP工具(文件系统、网页抓取、记忆、顺序思考等)
- 基于会话的对话记忆
- GPT-SoVITS语音合成和Faster-Whisper语音识别
- Live2D头像同步的表情提取
自动化
- 用于提醒和主动消息的cron调度器
- 可配置活跃时段的心跳监控
- LLM驱动的任务创建(AI可以自行安排提醒)
人格系统
- 统一的
persona.yaml作为唯一的事实来源 - 按通道定制行为(例如仅在桌面模式添加表情标签)
- 自动语言检测(日语、中文、英语)
未来计划
接下来期待实现的功能:
@koclaw/web-widgetSDK — 一个TypeScript/React包,可在任意网站上一行代码嵌入。API规范已设计完成,下一步是实现。- RAG知识库 — 将检索增强生成直接集成到Agent中,让Kokoron能够利用训练数据之外的结构化知识。
- 真正的零知识端到端加密 — 目前Gateway需要解密消息再转发给Agent,目标是让Agent持有自己的密钥,使Gateway成为纯粹的中继。
- shinBlog集成 — 将博客的Kokoron聊天功能连接到运行中的Koclaw Gateway,替换当前的占位组件。
关于AIKokoron — 桌面伙伴
还记得之前写的AIKokoron吗?那个桌面端的Live2D伙伴应用。AIKokoron和Koclaw关系密切,但各司其职:
- Koclaw 是后端框架 — 负责所有平台间的通信、安全和AI编排的"神经系统"。
- AIKokoron 是桌面前端 — 一个搭载Live2D角色的Electron应用,提供语音对话和视觉交互。
可以这样理解:它们共享同一个大脑,但住在不同的身体里。Koclaw的Python Agent已经包含了最初为AIKokoron构建的语音管线和表情系统。当AIKokoron通过WebSocket连接到Koclaw时,就能获取Koclaw提供的所有跨平台上下文和工具能力。
AIKokoron仍在打磨中,计划作为独立项目发布。但即使是独立项目,它也会连接回Koclaw — 一个人格、一份记忆、一个大脑,无论从桌面还是任何消息平台都能访问。
尝试一下
Koclaw以MIT许可证开源:
- GitHub: github.com/ksromt/koclaw
如果你对自托管AI助手、跨平台Agent框架或Rust + Python架构感兴趣,欢迎了解。贡献和反馈随时欢迎。