阅读时间:1 分钟
0 字
模型与能力协作
工作流里最容易让人混淆的一点,就是:
对话模型、图片模型、视频模型、向量模型,到底分别干什么?
你可以直接这样理解:
1. 对话模型负责理解和组织
对话模型的主要作用是:
- 理解输入
- 判断下一步该做什么
- 组织回复内容
- 把多个能力结果整合成最终输出
如果你的工作流里需要“理解需求”或“整理结果”,通常都离不开对话模型。
2. 图片模型负责图片生成
图片模型主要负责:
- 文生图
- 图生图
- 输出图片结果
它本身不负责流程编排,只负责生成图片。
3. 视频模型负责视频生成
视频模型主要负责:
- 提交视频生成任务
- 生成视频结果
但因为视频通常是异步任务,所以更适合由工作流来控制整个执行过程。
4. 向量模型负责知识库向量化
向量模型主要负责:
- 把文档内容转换成向量
- 给知识库检索准备底层数据
它不是拿来直接和用户对话的,而是给知识库链路使用的。
5. 能力节点负责执行具体动作
工作流里的能力节点,本质上是把这些模型能力或业务动作真正执行出来。
例如:
- 知识库检索
- HTTP 请求
- MCP 调用
- 图片生成
- 视频生成
- 通知发送
6. 工作流负责把它们串起来
工作流本身最重要的作用不是“做某一件事”,而是:
- 控制输入
- 控制执行顺序
- 控制异步恢复
- 控制输出结构
- 留下执行日志
所以你可以把它理解成:
- 模型负责“做某类事”
- 能力负责“执行动作”
- 工作流负责“把这些动作有顺序地组织起来”
推荐理解方式
如果你是第一次用工作流,建议直接按下面这句来记:
对话模型负责理解,专用模型负责生成,能力节点负责执行,工作流负责编排。