Skip to content

Usecase Overview

  • 业务目标:将业务用户的自然语言指令快速转化为结构化任务计划,自动匹配合适的插件/工具组合,并为后续并行执行与风控提供可追踪的上下文。
  • 成功度量:平均 2 秒内返回可执行计划;插件匹配准确率 ≥ 90%;低置信度提示准确引导补充信息;所有计划均写入审计。
  • 场景关联:对应主场景 Stage 1「Intent Parsing & Capability Planning」,是任务链路的入口,直接决定后续执行效率与安全边界。

Planner 需要兼顾 NLU 准确率与能力覆盖率,在保持体验秒级响应的同时输出可审计、可控的任务 DAG。

Context & Assumptions

  • 前置条件
    • agent-orchestrator-v2capability-graph-service Feature Flag 已启用。
    • 能力图谱中已录入插件元数据(版本、输入输出、租户可用性、敏感等级)。
    • 对话/指令中心能够提供租户、用户、语言等上下文字段。
    • 审计与指标管道可用,以便记录 Planner 输出与风险提示。
  • 输入/输出
    • 输入:自然语言指令、上下文实体(客户、账期、渠道)、历史对话片段、租户策略、Feature Flag。
    • 输出:任务 DAG(节点、依赖、参数映射)、候选插件列表、插件评分/置信度、风险与审批建议、审计记录 ID。
  • 边界
    • 不负责插件自身的能力实现或测试。
    • 不覆盖 ReAct Prompt 设计(由 ReAct 场景负责)。
    • 不在此用例中处理执行重试或人工协同。

Solution Blueprint

体系分解

组件责任说明
Intent ParserNLU、实体抽取、置信度评估基于多语言模型 + 规则,对输入语句进行结构化处理。
Constraint Extractor约束识别、上下文合并提取 SLA、预算、敏感级别等限制,并与租户策略融合。
Capability Graph Service插件能力检索与打分依据任务类型、数据需求、插件健康度进行多维评分。
Plan Builder构建任务 DAG 与步骤描述输出节点依赖、输入输出映射、风险标注、审批策略。
Audit & Telemetry Writer记录计划与风险指标写入 agent_plan 表、发布 agent.plan.created 事件。

流程与时序

  1. Step 1 – 输入解析:Intent Parser 对自然语言进行语义分析、实体抽取、置信度计算。
  2. Step 2 – 约束合并:Constraint Extractor 将输入约束与租户策略合并,补充缺失字段。
  3. Step 3 – 能力检索:Capability Graph 根据任务类型和上下文加载插件候选,结合健康信号和历史成功率打分。
  4. Step 4 – 计划生成:Plan Builder 生成任务 DAG,确定节点顺序、调用参数、回调、审批策略与风险标签。
  5. Step 5 – 输出与审计:Planner 返回计划给 Orchestrator,并写入审计、指标与风险提示,若置信度低则请求用户补充信息。

Contracts & Interfaces

  • Inbound
    • POST /internal/agent/intents:parse — 对话/命令中心调用,包含 tenant, user, utterance, context
    • EVENT agent.intent.created — 提示异步 Planner 处理,适用于批量请求。
  • Outbound
    • POST /internal/capabilities/search — 根据任务标签、数据域、租户可用性检索插件能力。
    • POST /audit/agent-plan — 写入计划、风险、插件列表。
    • POST /notifications/agent/need-context — 当置信度过低时请求补充信息。
  • 配置/脚本
    • config/agent/intent_rules.yaml — 意图模板与后备规则。
    • config/agent/capability_weights.yaml — 插件评分因子。
    • scripts/qa/intent-regression.mjs — Parser 回归测试脚本。

Implementation Checklist

项目描述状态Owner
Parser 多语言支持引入多语言模型与降级规则[ ]Agent Platform Guild
能力图谱评分接入健康信号、租户白名单[ ]Plugin Guild
风险标注支持敏感任务审批提示[ ]Ops Reliability Center
审计输出计划、插件、约束写入统一审计通道[ ]Agent Platform Guild
低置信度补充自动构造澄清问题并通知用户[ ]Agent Platform Guild

Testing Strategy

  • 单元:意图解析、实体抽取、评分函数、DAG 依赖拓扑校验。
  • 集成:Parser + Capability Graph + Plan Builder 端到端,分别验证常规任务、敏感任务、无可用插件三类路径。
  • 端到端:在沙箱对话入口发起真实任务,检查 Planner 输出、审计日志、告警提示。
  • 非功能:并发 200 QPS 压测;注入 Graph 慢查询验证超时保护;Chaos 模拟部分插件健康信号缺失。

Observability & Ops

  • 指标agent.plan.latency_p95agent.plan.success_rateagent.plan.low_confidence_totalagent.plan.audit_write_total
  • 日志:记录 plan_id, intent, confidence, selected_plugins, risk_flags; 对 PII 做脱敏。
  • 告警:计划耗时 >5s(5 分钟窗口)、匹配失败率 >5%、审计写入失败 >1%;通过 Grafana + PagerDuty 推送。
  • Dashboard:Grafana「Agent Planner」、Datadog Trace「planner.*」、内部审计回放面板。

Rollback & Failure Handling

  • Planner 升级失败时,可回滚至上一个容器镜像并恢复旧版权重配置。
  • 若能力图谱不可用,降级为规则表匹配或提示人工流程。
  • 发生大面积低置信度告警时,启用 planner-safe-mode 仅允许白名单任务通过。

Follow-ups & Risks

风险影响缓解ETA
插件健康信号尚未完全接入,影响评分稳定性计划选择错误与 Plugin Guild 对齐指标字段,发布健康信号 SDK2025-03-10
多语言支持覆盖不足某些租户解析失败扩充示例语料,按地区灰度上线2025-03-05

References & Links

  • 场景文档:docs/scenarios/agent-orchestration/SCN-AGENT-TASK-EXEC-001.md
  • 设计稿:docs/meta/scenarios/powerx/agent-and-automation/agent-orchestration/agent-task-execution/primary.md
  • 相关标准:docs/standards/powerx/backend/integration/09_agent/Agent_Adaptor_and_Transport_Spec.md

scn_id: "SCN-AGENT-TASK-EXEC-001" scenario_name: "智能体任务执行" slug: "powerx-agent-task-execution" primary_scope: "powerx" primary_layer: "service" primary_domain: "agent-orchestration" primary_repo: "powerx" doc_owner: "Agent Platform Guild(Scenario Steward / agent-platform@artisan-cloud.com) & Ops Reliability Center(Automation Co-owner / ops-center@artisan-cloud.com)" last_generated_at: "2025-11-09"

智能体任务执行 Usecase Seed 生成指南

场景摘要:PowerX 主 Agent 在 2 秒内将自然语言目标拆解为可执行任务 DAG,联动插件能力图谱与 Copilot 协同,确保 95%+ 自动化成功率与 5 分钟内的异常闭环。

本文档面向场景负责人与仓库 Stewards,说明如何把跨仓场景拆解成可交付的子用例 Seed,为分发脚本与研发落地提供基础数据。请根据实际情况补充或修订所有 字段。

Seed 的定位

  • 代表仓库在 智能体任务执行 场景下需要实现的职责、接口、测试与运维要求。
  • docs/_data/docmap.yamlscn_id: SCN-AGENT-TASK-EXEC-001children 节点一一对应,字段必须保持一致。
  • npm run publish:usecases 分发到下游仓库、npm run publish:collected 生成领导力视图的唯一信息来源。

前提条件

  • 场景文档(如 docs/scenarios/agent-orchestration/SCN-AGENT-TASK-EXEC-001.md)已经勾勒四个阶段(规划、协调、恢复、闭环)及交付矩阵。
  • docs/_data/docmap.yaml 已存在该场景节点,并在 children 中登记 scope/layer/domain/repo/path 字段。
  • 对应仓库在 docs/_data/repos.yaml 中维护了 usecase_seed_root、默认分支(dev/docs)与维护者,便于脚本分发。
  • Planner 依赖的 Feature Flag(agent-orchestrator-v2capability-graph-serviceworkflow-trigger-kitcopilot-handofftelemetry-unified-sink)已在目标环境启用,Kafka/SQS 状态总线、能力图谱索引、向量检索与审计流均可用。
  • 观测与报告工具(scripts/qa/workflow-metrics.mjs、Grafana「Agent Orchestration」面板、Copilot 工单模板)已同步到最新版本,可用于验证 Seed 内容。

TODO:如还需依赖新的插件健康信号、租户策略或凭据,请在此列出。

生成流程

  1. 登记/更新 docmap 子节点

    yaml
    # docs/_data/docmap.yaml
    - scn_id: SCN-AGENT-TASK-EXEC-001
      title: 智能体任务执行
      children:
        - doc_id: UC-AGENT-EXEC-PLAN-001
          scope: powerx
          layer: service
          domain: agent-orchestration
          optional: false
          repo: powerx
          path: docs/use_cases/_from_hub/SCN-AGENT-TASK-EXEC-001/UC-AGENT-EXEC-PLAN-001.md
        - doc_id: UC-AGENT-EXEC-COORD-001
          scope: powerx
          layer: integration
          domain: agent-orchestration
          optional: false
          repo: powerx
          path: docs/use_cases/_from_hub/SCN-AGENT-TASK-EXEC-001/UC-AGENT-EXEC-COORD-001.md
        - doc_id: UC-AGENT-EXEC-RECOVERY-001
          scope: powerx
          layer: ops
          domain: agent-orchestration
          optional: false
          repo: powerx
          path: docs/use_cases/_from_hub/SCN-AGENT-TASK-EXEC-001/UC-AGENT-EXEC-RECOVERY-001.md
        - doc_id: UC-AGENT-EXEC-CLOSURE-001
          scope: powerx
          layer: ops
          domain: agent-orchestration
          optional: false
          repo: powerx
          path: docs/use_cases/_from_hub/SCN-AGENT-TASK-EXEC-001/UC-AGENT-EXEC-CLOSURE-001.md
    • doc_idpath 要匹配未来的 Seed 文件名与下游仓库目录。
    • optional: true/false 用于领导力视图与发布脚本过滤,默认必选。
  2. 复制模板并放置到对应目录

    bash
    mkdir -p docs/usecases-seeds/SCN-AGENT-TASK-EXEC-001
    cp docs/usecases-seeds/_template.md \
      docs/usecases-seeds/SCN-AGENT-TASK-EXEC-001/UC-AGENT-EXEC-PLAN-001.md
    • scope/layer/domain 需与 docmap 中保持一致,确保脚本解析无偏差。
    • 如果需要为 powerx-plugin 等仓库建立配套 Seed,请复制后在 Frontmatter 中切换 repo_key 与路径。
  3. 填充 Frontmatter 区域

    • repo_keyprimary_repo 一致(powerx),scenario_title 建议使用「智能体任务执行」。
    • 默认 Owners:Agent Platform Guild(Scenario Steward / agent-platform@artisan-cloud.com)、Ops Reliability Center(Automation Co-owner / ops-center@artisan-cloud.com);若引入插件团队共建,可在 contributors 中追加。
    • feature_flags 至少包含 agent-orchestrator-v2capability-graph-serviceworkflow-trigger-kitcopilot-handofftelemetry-unified-sink,并根据实现列出额外 Flag。
    • linked_requirements 建议对齐场景条目(如 SCN-AGENT-TASK-EXEC-001-A/B),code_refs 需明确 services/agent/planner/*services/audit/agent_plan_logger.ts 等模块。
  4. 完善正文章节

    • Usecase Overview:强调 2 秒内完成规划、插件匹配 ≥90% 的 SLA,并说明 Stage 1 在全链路中的作用。
    • Context & Assumptions:列出输入上下文、租户策略、审计依赖与非目标(如不覆盖 ReAct Prompt、失败恢复)。
    • Solution BlueprintContracts:细化 Intent Parser、Constraint Extractor、Capability Graph、Plan Builder、审计写入以及 POST /internal/agent/intents:parsePOST /internal/capabilities/search 等接口。
    • Testing/Observability/Rollback:纳入 scripts/qa/intent-regression.mjsagent.plan.* 指标、planner-safe-mode 降级与 Copilot 工单联动。
  5. 与场景文档互相链接

    • docs/scenarios/agent-orchestration/SCN-AGENT-TASK-EXEC-001.md 的交付矩阵或 Stage 1 章节添加 Seed 链接,便于往返。
    • 如引用新的标准(如 Agent 适配、插件契约、审计规范),同步更新 docs/standards/powerx/backend/integration/09_agent/**,保持契约唯一来源。

自检清单

  • docs/_data/docmap.yaml 与 Seed Frontmatter 在 doc_id/scope/layer/domain/repo/path 上完全一致。
  • Seed 正文覆盖意图解析、约束合并、能力图谱检索、风险标注、审计写入、低置信度补充等链路。
  • 已验证 scripts/qa/intent-regression.mjsscripts/qa/workflow-metrics.mjs 可在最新实现下运行,并输出预期指标。
  • 所有 Feature Flag 与外部依赖(Kafka/SQS、能力图谱索引、Copilot 工单桥)均在前置条件中列出,并给出可观测项。
  • 运行 npm run lintnpm run docs:build,确保 Markdown 语法与站点构建通过。
  • 使用 npm run publish:scenarios -- --scn-id SCN-AGENT-TASK-EXEC-001 --validate-only 验证 docmap、Seed、repo 配置无误后再发布。

常见问题

问题处理方式
Planner 难以稳定满足 2 秒 SLA 怎么办?在 Seed 中列出降级策略(轻量模型/缓存)、异步提示与告警阈值,并引用 scripts/qa/intent-regression.mjs 的压测指南。
能力图谱数据陈旧导致匹配准确率下降?将更新流程写入 ContextFollow-ups,说明如何通过健康信号、定期重建索引或临时白名单保障准确性,并补充运行脚本/指标。

完成上述步骤后,即可进入分发与发布流程,参考《发布 Usecase Seeds 指南》获取后续操作。

基于 Apache 2.0 许可发布