3. 核心概念

后续每一章用到的术语,基本就是下面这七个词。读完这一章,本手册其余部分读起来都会自然许多。


3.1 智能体(Agent)

智能体就是那个持续存在、会回复你的”它”。从你的角度看,它是一个名字(mainworkhome)外加:

  • 一个配置好的模型(它用哪个 LLM 思考),
  • 一组技能MCP 服务(它能做什么),
  • 一个工作区(它能操作哪些文件),
  • 记忆指令(它记住什么、遵守什么规则),
  • 一个成员列表(谁可以和它对话、各自能做什么)。

一个 OpenHermit 实例可以托管多个智能体。它们彼此隔离:不同的记忆、不同的配置、不同的访问列表。


3.2 会话(Session)

会话是一次对话。它有消息历史、一个 ID、参与者列表,以及一个状态(active 或 closed)。

你可以同时与同一个智能体开多个会话 —— 一个话题一个,一个通道一个,一个项目一个,只要你觉得好整理就行。关闭一个会话不会删除它,你之后可以恢复。智能体的长期记忆跨会话持久;会话自己的消息历史只属于那个会话。

在 Telegram 或 Slack 这类通道里,一个会话通常对应一个聊天或一个 thread。


3.3 通道(Channel)

通道是消息到达智能体的途径。OpenHermit 开箱即用五种:

通道是什么
CLIhermit chat 终端。
Web管理界面里的浏览器聊天。
Telegram通过 bot token 接入的 Telegram bot。
DiscordDiscord bot(gateway 连接)。
SlackSlack 应用(socket mode)。

同一个智能体可以同时在多个通道上可达。每次对话的会话彼此独立;记忆与配置则是共享的。


3.4 技能(Skill)

技能是你可以为某个智能体启用的、打包好的能力 —— 一份 SKILL.md 加上配套文件(脚本、提示词、参考资料)。例如:standup-digestweb-researchpostgres-explorer

技能分两种:内置(随 OpenHermit 发布)和工作区(你自己从本地目录注册)。无论哪种,启用一个技能就把它的指令和工具暴露给智能体;停用则再次隐藏。

你可以用 hermit skills 这组命令或 Web 管理界面的 Skills 选项卡来管理技能。


3.5 MCP 服务(MCP Server)

MCP 服务是一个外部工具提供方 —— 从 GitHub、Slack 到你自己的内部 API,都可以 —— 它说 Model Context Protocol。接入一个 MCP 服务,你的智能体就能在正常对话中调用它的工具。

MCP 服务在 OpenHermit 中全局注册,按智能体(或按整个舰队)启用。日常操作:hermit mcp 或管理界面的 MCP 选项卡。


3.6 记忆(Memory)

记忆是智能体跨会话保留的内容。分三层:

  • 会话历史 —— 一个会话里的每条消息。本质上属于那个会话。
  • 工作记忆 —— 单个会话内的短期备忘(例如”用户希望这份报告用 markdown 格式”)。
  • 长期记忆 —— 持久化在数据库中、可跨会话检索的条目。偏好、事实、学到的模式都住在这里。

长期记忆主要通过对话来教:“记住我吃素”、“记住我们的预发环境 URL 是……”。你也可以在管理界面查看与整理。详见 第 6 章 · 记忆


3.7 工作区(Workspace)

工作区是智能体的”电脑” —— 一个沙箱内的文件系统,智能体可以在里面读写。每个智能体都有自己独立的工作区,互不相干。

上传的文件会落到这里,智能体生成的产物会保存在这里;如果你让它克隆一个仓库,仓库也会出现在这里。工作区对同一个智能体的所有会话共享:你在某次对话中上传的文件,下一次对话时智能体依然能看到。

底层沙箱可以是本地 Docker 容器、E2B 云沙箱,或 Daytona 工作区 —— 取决于实例当初是怎么搭的。这是运维侧的选择;从你的座位上看,工作区就像智能体的硬盘。详见 第 10 章 · 文件与工作区


3.8 它们如何拼在一起

大致是这样:

  ┌────────────────────── 智能体: "main" ──────────────────────┐
  │                                                            │
  │   ┌──────┐    ┌──────┐    ┌──────┐                         │
  │   │ 会话 │    │ 记忆 │    │ 指令 │                         │
  │   └──────┘    └──────┘    └──────┘                         │
  │                                                            │
  │   ┌──────┐    ┌──────┐    ┌────────┐                       │
  │   │ 技能 │    │ MCP  │    │ 工作区 │                       │
  │   └──────┘    └──────┘    └────────┘                       │
  │                                                            │
  └─────────────────────┬──────────────────────────────────────┘

       ┌────────┬───────┼────────┬─────────┐
     CLI    Web UI  Telegram   Discord   Slack

你通过任意一个通道触达智能体。每个通道里的每段对话是一个会话。智能体借助记忆指令技能MCP 服务工作区来完成工作。成员(你和你邀请的任何人)各自拥有一个角色,角色决定他们可以让智能体做什么。

整张图就是这样。后续每一章都是对其中某一个方框的近距离观察。