Skip to content

1.7 模型路由与成本

Agent 运行时 · 步骤 ⑨Agent 运行时
Coze ⑥ 模型管理 + ⑧ 运营监控(产品向摘要)。

① PM 必懂

  • 多 Provider · API Key 管理
  • 智能路由:分类/简单 → Flash;复杂 → Plus
  • 省钱三板斧:Scene L1 · 语义缓存 · 路由便宜模型
  • 面试必讲:成本 ROI

② 晨悦实现

机制效果
Scene Layer10 token
SemanticCache命中 0 token
Agent.model默认模型
sync_reply 降级失败换备用模型(Layer3)

Workflow 内 LLM 节点可单独设 temperature(意图 0.3 / 聊天 0.7)。

③ 实践举例

  • AgentPM 长 PRD:Flash 草稿 + 人审
  • 母婴:意图分类 Flash · 导语 ≤80 字控 token

④ 实战一步

对比同 Agent 开/关 Scene 时,一条高频句的响应时间与 token(日志)

工程真源docs/15 · docs/44 · docs/53 Q7


相关

晨悦 AI 实践手册