Skip to content

Executive Summary

该子场景集中治理模型与外部平台的用量、成本、配额与健康信号,确保调用成本透明可控,异常 5 分钟内告警,并能自动触发限流、降级或停用。

Scope & Guardrails

  • In Scope:用量计量、成本聚合、配额策略、异常检测、告警、报表、Runbook。
  • Out of Scope:财务结算流程、合同管理、业务定价策略。
  • Environment & Flagsprovider-cost-guardquota-enforcer;依赖 Cost Warehouse、Quota Service、Telemetry。

Participants & Responsibilities

ScopeRepositoryLayer责任与交付物Owners
cost-meteringpowerxopsToken/调用计量、成本计算、数据落地Ops Reliability Center
quota-servicepowerxops配额配置、限流、停用策略Agent Platform Guild
observabilitypowerxops指标、报表、RunbookOps Reliability Center

End-to-End Flow

  1. 采集调用计量并计算成本 → 2. 与租户/项目配额比对,超阈值触发告警或限流 → 3. 将指标推送至仪表板、生成报表 → 4. 如有异常,执行降级/停用并记录审计。

Key Interactions & Contracts

  • POST /internal/provider-usage/reportGET /internal/provider-quotasPOST /internal/provider-quotas/enforceEVENT agent.provider.cost.anomaly
  • 配置:config/cost/provider_rates.yamlconfig/quotas/model_usage.yaml

Acceptance Criteria

  • 成本数据延迟 <1 分钟;超配额告警 5 分钟内送达;限流/停用操作 100% 记录审计;降级策略可在 2 分钟内生效。

Telemetry & Ops

  • 指标:agent.provider.cost_total, agent.provider.quota_usage, agent.provider.alert_total, agent.provider.degrade_total
  • 告警:成本突增、配额超限、降级失败。

References

  • docs/meta/scenarios/powerx/agent-and-automation/agent-model-platform/primary.md
  • scripts/qa/provider-drill.mjs

基于 Apache 2.0 许可发布