Appearance
1.7 模型路由与成本
Agent 运行时 · 步骤 ⑨ → Agent 运行时
Coze ⑥ 模型管理 + ⑧ 运营监控(产品向摘要)。
① PM 必懂
- 多 Provider · API Key 管理
- 智能路由:分类/简单 → Flash;复杂 → Plus
- 省钱三板斧:Scene L1 · 语义缓存 · 路由便宜模型
- 面试必讲:成本 ROI
② 晨悦实现
| 机制 | 效果 |
|---|---|
| Scene Layer1 | 0 token |
| SemanticCache | 命中 0 token |
| Agent.model | 默认模型 |
| sync_reply 降级 | 失败换备用模型(Layer3) |
Workflow 内 LLM 节点可单独设 temperature(意图 0.3 / 聊天 0.7)。
③ 实践举例
- AgentPM 长 PRD:Flash 草稿 + 人审
- 母婴:意图分类 Flash · 导语 ≤80 字控 token
④ 实战一步
对比同 Agent 开/关 Scene 时,一条高频句的响应时间与 token(日志)
工程真源:docs/15 · docs/44 · docs/53 Q7