Usecase Overview
- 业务目标:将业务用户的自然语言指令快速转化为结构化任务计划,自动匹配合适的插件/工具组合,并为后续并行执行与风控提供可追踪的上下文。
- 成功度量:平均 2 秒内返回可执行计划;插件匹配准确率 ≥ 90%;低置信度提示准确引导补充信息;所有计划均写入审计。
- 场景关联:对应主场景 Stage 1「Intent Parsing & Capability Planning」,是任务链路的入口,直接决定后续执行效率与安全边界。
Planner 需要兼顾 NLU 准确率与能力覆盖率,在保持体验秒级响应的同时输出可审计、可控的任务 DAG。
Context & Assumptions
- 前置条件
agent-orchestrator-v2与capability-graph-serviceFeature Flag 已启用。- 能力图谱中已录入插件元数据(版本、输入输出、租户可用性、敏感等级)。
- 对话/指令中心能够提供租户、用户、语言等上下文字段。
- 审计与指标管道可用,以便记录 Planner 输出与风险提示。
- 输入/输出
- 输入:自然语言指令、上下文实体(客户、账期、渠道)、历史对话片段、租户策略、Feature Flag。
- 输出:任务 DAG(节点、依赖、参数映射)、候选插件列表、插件评分/置信度、风险与审批建议、审计记录 ID。
- 边界
- 不负责插件自身的能力实现或测试。
- 不覆盖 ReAct Prompt 设计(由 ReAct 场景负责)。
- 不在此用例中处理执行重试或人工协同。
Solution Blueprint
体系分解
| 组件 | 责任 | 说明 |
|---|---|---|
| Intent Parser | NLU、实体抽取、置信度评估 | 基于多语言模型 + 规则,对输入语句进行结构化处理。 |
| Constraint Extractor | 约束识别、上下文合并 | 提取 SLA、预算、敏感级别等限制,并与租户策略融合。 |
| Capability Graph Service | 插件能力检索与打分 | 依据任务类型、数据需求、插件健康度进行多维评分。 |
| Plan Builder | 构建任务 DAG 与步骤描述 | 输出节点依赖、输入输出映射、风险标注、审批策略。 |
| Audit & Telemetry Writer | 记录计划与风险指标 | 写入 agent_plan 表、发布 agent.plan.created 事件。 |
流程与时序
- Step 1 – 输入解析:Intent Parser 对自然语言进行语义分析、实体抽取、置信度计算。
- Step 2 – 约束合并:Constraint Extractor 将输入约束与租户策略合并,补充缺失字段。
- Step 3 – 能力检索:Capability Graph 根据任务类型和上下文加载插件候选,结合健康信号和历史成功率打分。
- Step 4 – 计划生成:Plan Builder 生成任务 DAG,确定节点顺序、调用参数、回调、审批策略与风险标签。
- Step 5 – 输出与审计:Planner 返回计划给 Orchestrator,并写入审计、指标与风险提示,若置信度低则请求用户补充信息。
Contracts & Interfaces
- Inbound:
POST /internal/agent/intents:parse— 对话/命令中心调用,包含tenant,user,utterance,context。EVENT agent.intent.created— 提示异步 Planner 处理,适用于批量请求。
- Outbound:
POST /internal/capabilities/search— 根据任务标签、数据域、租户可用性检索插件能力。POST /audit/agent-plan— 写入计划、风险、插件列表。POST /notifications/agent/need-context— 当置信度过低时请求补充信息。
- 配置/脚本:
config/agent/intent_rules.yaml— 意图模板与后备规则。config/agent/capability_weights.yaml— 插件评分因子。scripts/qa/intent-regression.mjs— Parser 回归测试脚本。
Implementation Checklist
| 项目 | 描述 | 状态 | Owner |
|---|---|---|---|
| Parser 多语言支持 | 引入多语言模型与降级规则 | [ ] | Agent Platform Guild |
| 能力图谱评分 | 接入健康信号、租户白名单 | [ ] | Plugin Guild |
| 风险标注 | 支持敏感任务审批提示 | [ ] | Ops Reliability Center |
| 审计输出 | 计划、插件、约束写入统一审计通道 | [ ] | Agent Platform Guild |
| 低置信度补充 | 自动构造澄清问题并通知用户 | [ ] | Agent Platform Guild |
Testing Strategy
- 单元:意图解析、实体抽取、评分函数、DAG 依赖拓扑校验。
- 集成:Parser + Capability Graph + Plan Builder 端到端,分别验证常规任务、敏感任务、无可用插件三类路径。
- 端到端:在沙箱对话入口发起真实任务,检查 Planner 输出、审计日志、告警提示。
- 非功能:并发 200 QPS 压测;注入 Graph 慢查询验证超时保护;Chaos 模拟部分插件健康信号缺失。
Observability & Ops
- 指标:
agent.plan.latency_p95、agent.plan.success_rate、agent.plan.low_confidence_total、agent.plan.audit_write_total。 - 日志:记录
plan_id,intent,confidence,selected_plugins,risk_flags; 对 PII 做脱敏。 - 告警:计划耗时 >5s(5 分钟窗口)、匹配失败率 >5%、审计写入失败 >1%;通过 Grafana + PagerDuty 推送。
- Dashboard:Grafana「Agent Planner」、Datadog Trace「planner.*」、内部审计回放面板。
Rollback & Failure Handling
- Planner 升级失败时,可回滚至上一个容器镜像并恢复旧版权重配置。
- 若能力图谱不可用,降级为规则表匹配或提示人工流程。
- 发生大面积低置信度告警时,启用
planner-safe-mode仅允许白名单任务通过。
Follow-ups & Risks
| 风险 | 影响 | 缓解 | ETA |
|---|---|---|---|
| 插件健康信号尚未完全接入,影响评分稳定性 | 计划选择错误 | 与 Plugin Guild 对齐指标字段,发布健康信号 SDK | 2025-03-10 |
| 多语言支持覆盖不足 | 某些租户解析失败 | 扩充示例语料,按地区灰度上线 | 2025-03-05 |
References & Links
- 场景文档:
docs/scenarios/agent-orchestration/SCN-AGENT-TASK-EXEC-001.md - 设计稿:
docs/meta/scenarios/powerx/agent-and-automation/agent-orchestration/agent-task-execution/primary.md - 相关标准:
docs/standards/powerx/backend/integration/09_agent/Agent_Adaptor_and_Transport_Spec.md
scn_id: "SCN-AGENT-TASK-EXEC-001" scenario_name: "智能体任务执行" slug: "powerx-agent-task-execution" primary_scope: "powerx" primary_layer: "service" primary_domain: "agent-orchestration" primary_repo: "powerx" doc_owner: "Agent Platform Guild(Scenario Steward / agent-platform@artisan-cloud.com) & Ops Reliability Center(Automation Co-owner / ops-center@artisan-cloud.com)" last_generated_at: "2025-11-09"
智能体任务执行 Usecase Seed 生成指南
场景摘要:PowerX 主 Agent 在 2 秒内将自然语言目标拆解为可执行任务 DAG,联动插件能力图谱与 Copilot 协同,确保 95%+ 自动化成功率与 5 分钟内的异常闭环。
本文档面向场景负责人与仓库 Stewards,说明如何把跨仓场景拆解成可交付的子用例 Seed,为分发脚本与研发落地提供基础数据。请根据实际情况补充或修订所有 字段。
Seed 的定位
- 代表仓库在
智能体任务执行场景下需要实现的职责、接口、测试与运维要求。 - 与
docs/_data/docmap.yaml中scn_id: SCN-AGENT-TASK-EXEC-001的children节点一一对应,字段必须保持一致。 - 是
npm run publish:usecases分发到下游仓库、npm run publish:collected生成领导力视图的唯一信息来源。
前提条件
- 场景文档(如
docs/scenarios/agent-orchestration/SCN-AGENT-TASK-EXEC-001.md)已经勾勒四个阶段(规划、协调、恢复、闭环)及交付矩阵。 docs/_data/docmap.yaml已存在该场景节点,并在children中登记scope/layer/domain/repo/path字段。- 对应仓库在
docs/_data/repos.yaml中维护了usecase_seed_root、默认分支(dev/docs)与维护者,便于脚本分发。 - Planner 依赖的 Feature Flag(
agent-orchestrator-v2、capability-graph-service、workflow-trigger-kit、copilot-handoff、telemetry-unified-sink)已在目标环境启用,Kafka/SQS 状态总线、能力图谱索引、向量检索与审计流均可用。 - 观测与报告工具(
scripts/qa/workflow-metrics.mjs、Grafana「Agent Orchestration」面板、Copilot 工单模板)已同步到最新版本,可用于验证 Seed 内容。
TODO:如还需依赖新的插件健康信号、租户策略或凭据,请在此列出。
生成流程
登记/更新 docmap 子节点
yaml# docs/_data/docmap.yaml - scn_id: SCN-AGENT-TASK-EXEC-001 title: 智能体任务执行 children: - doc_id: UC-AGENT-EXEC-PLAN-001 scope: powerx layer: service domain: agent-orchestration optional: false repo: powerx path: docs/use_cases/_from_hub/SCN-AGENT-TASK-EXEC-001/UC-AGENT-EXEC-PLAN-001.md - doc_id: UC-AGENT-EXEC-COORD-001 scope: powerx layer: integration domain: agent-orchestration optional: false repo: powerx path: docs/use_cases/_from_hub/SCN-AGENT-TASK-EXEC-001/UC-AGENT-EXEC-COORD-001.md - doc_id: UC-AGENT-EXEC-RECOVERY-001 scope: powerx layer: ops domain: agent-orchestration optional: false repo: powerx path: docs/use_cases/_from_hub/SCN-AGENT-TASK-EXEC-001/UC-AGENT-EXEC-RECOVERY-001.md - doc_id: UC-AGENT-EXEC-CLOSURE-001 scope: powerx layer: ops domain: agent-orchestration optional: false repo: powerx path: docs/use_cases/_from_hub/SCN-AGENT-TASK-EXEC-001/UC-AGENT-EXEC-CLOSURE-001.mddoc_id与path要匹配未来的 Seed 文件名与下游仓库目录。optional: true/false用于领导力视图与发布脚本过滤,默认必选。
复制模板并放置到对应目录
bashmkdir -p docs/usecases-seeds/SCN-AGENT-TASK-EXEC-001 cp docs/usecases-seeds/_template.md \ docs/usecases-seeds/SCN-AGENT-TASK-EXEC-001/UC-AGENT-EXEC-PLAN-001.mdscope/layer/domain需与 docmap 中保持一致,确保脚本解析无偏差。- 如果需要为
powerx-plugin等仓库建立配套 Seed,请复制后在 Frontmatter 中切换repo_key与路径。
填充 Frontmatter 区域
repo_key与primary_repo一致(powerx),scenario_title建议使用「智能体任务执行」。- 默认 Owners:Agent Platform Guild(Scenario Steward / agent-platform@artisan-cloud.com)、Ops Reliability Center(Automation Co-owner / ops-center@artisan-cloud.com);若引入插件团队共建,可在
contributors中追加。 feature_flags至少包含agent-orchestrator-v2、capability-graph-service、workflow-trigger-kit、copilot-handoff、telemetry-unified-sink,并根据实现列出额外 Flag。linked_requirements建议对齐场景条目(如SCN-AGENT-TASK-EXEC-001-A/B),code_refs需明确services/agent/planner/*、services/audit/agent_plan_logger.ts等模块。
完善正文章节
Usecase Overview:强调 2 秒内完成规划、插件匹配 ≥90% 的 SLA,并说明 Stage 1 在全链路中的作用。Context & Assumptions:列出输入上下文、租户策略、审计依赖与非目标(如不覆盖 ReAct Prompt、失败恢复)。Solution Blueprint~Contracts:细化 Intent Parser、Constraint Extractor、Capability Graph、Plan Builder、审计写入以及POST /internal/agent/intents:parse、POST /internal/capabilities/search等接口。Testing/Observability/Rollback:纳入scripts/qa/intent-regression.mjs、agent.plan.*指标、planner-safe-mode降级与 Copilot 工单联动。
与场景文档互相链接
- 在
docs/scenarios/agent-orchestration/SCN-AGENT-TASK-EXEC-001.md的交付矩阵或 Stage 1 章节添加 Seed 链接,便于往返。 - 如引用新的标准(如 Agent 适配、插件契约、审计规范),同步更新
docs/standards/powerx/backend/integration/09_agent/**,保持契约唯一来源。
- 在
自检清单
docs/_data/docmap.yaml与 Seed Frontmatter 在doc_id/scope/layer/domain/repo/path上完全一致。- Seed 正文覆盖意图解析、约束合并、能力图谱检索、风险标注、审计写入、低置信度补充等链路。
- 已验证
scripts/qa/intent-regression.mjs与scripts/qa/workflow-metrics.mjs可在最新实现下运行,并输出预期指标。 - 所有 Feature Flag 与外部依赖(Kafka/SQS、能力图谱索引、Copilot 工单桥)均在前置条件中列出,并给出可观测项。
- 运行
npm run lint、npm run docs:build,确保 Markdown 语法与站点构建通过。 - 使用
npm run publish:scenarios -- --scn-id SCN-AGENT-TASK-EXEC-001 --validate-only验证 docmap、Seed、repo 配置无误后再发布。
常见问题
| 问题 | 处理方式 |
|---|---|
| Planner 难以稳定满足 2 秒 SLA 怎么办? | 在 Seed 中列出降级策略(轻量模型/缓存)、异步提示与告警阈值,并引用 scripts/qa/intent-regression.mjs 的压测指南。 |
| 能力图谱数据陈旧导致匹配准确率下降? | 将更新流程写入 Context 与 Follow-ups,说明如何通过健康信号、定期重建索引或临时白名单保障准确性,并补充运行脚本/指标。 |
完成上述步骤后,即可进入分发与发布流程,参考《发布 Usecase Seeds 指南》获取后续操作。
