Skip to content

性能与部署建议

面向运维 / 管理员,帮助你评估资源、排查性能瓶颈与保障服务稳定。

1. 服务拓扑

  • 前端:Vite + Element Plus,建议部署在静态资源服务(Nginx、Cloudflare Pages)。
  • 接口:Python FastAPI(参考项目后端),需开启 HTTPS 与鉴权。
  • 队列:生成请求建议进入任务队列(如 Redis + Celery)以应对高并发。

2. GPU 与推理策略

  • 推荐显卡:RTX 4090 / A5000 及以上。
  • 单卡并发:2~4 路,需根据显存与模型体积反复调优。
  • 若需高可靠,可采用多节点并行调度,并配置熔断与重试。

3. 性能指标

指标说明推荐监控
平均响应时长生成耗时Prometheus + Grafana
队列长度同时排队请求数Redis 监控
GPU 利用率GPU 占用、显存、温度NVML / DCGM Exporter
失败率出错比例与原因应用日志、Sentry

4. 缓存与 CDN

  • 图片生成结果可保存至对象存储(S3、OSS)并启用 CDN。
  • 通过文件哈希命名,避免重复生成。
  • 对手册、模板等静态资源开启长时间缓存,更新时附带版本号。

5. 风险控制

  • 启用管理员审核:充值订单、异常生成记录需定期检查。
  • 接口限流:对 /api/generate 等核心接口设置 IP/QPS 限制。
  • 日志审计:保存 30 天以上,请求参数敏感字段脱敏。

6. 备份策略

  • 核心数据:用户额度、订单、生成记录,每日备份并异地存储。
  • 模板配置:建议保存至 Git 仓库,支持回滚。
  • 手册文档:VitePress 构建结果可同步至对象存储进行容灾。

更多对外支持方式,请查看 版本与支持。***

以打造稳定可靠的 AI 图片编辑体验为目标。