性能与部署建议
面向运维 / 管理员,帮助你评估资源、排查性能瓶颈与保障服务稳定。
1. 服务拓扑
- 前端:Vite + Element Plus,建议部署在静态资源服务(Nginx、Cloudflare Pages)。
- 接口:Python FastAPI(参考项目后端),需开启 HTTPS 与鉴权。
- 队列:生成请求建议进入任务队列(如 Redis + Celery)以应对高并发。
2. GPU 与推理策略
- 推荐显卡:RTX 4090 / A5000 及以上。
- 单卡并发:2~4 路,需根据显存与模型体积反复调优。
- 若需高可靠,可采用多节点并行调度,并配置熔断与重试。
3. 性能指标
| 指标 | 说明 | 推荐监控 |
|---|---|---|
| 平均响应时长 | 生成耗时 | Prometheus + Grafana |
| 队列长度 | 同时排队请求数 | Redis 监控 |
| GPU 利用率 | GPU 占用、显存、温度 | NVML / DCGM Exporter |
| 失败率 | 出错比例与原因 | 应用日志、Sentry |
4. 缓存与 CDN
- 图片生成结果可保存至对象存储(S3、OSS)并启用 CDN。
- 通过文件哈希命名,避免重复生成。
- 对手册、模板等静态资源开启长时间缓存,更新时附带版本号。
5. 风险控制
- 启用管理员审核:充值订单、异常生成记录需定期检查。
- 接口限流:对
/api/generate等核心接口设置 IP/QPS 限制。 - 日志审计:保存 30 天以上,请求参数敏感字段脱敏。
6. 备份策略
- 核心数据:用户额度、订单、生成记录,每日备份并异地存储。
- 模板配置:建议保存至 Git 仓库,支持回滚。
- 手册文档:VitePress 构建结果可同步至对象存储进行容灾。
更多对外支持方式,请查看 版本与支持。***