模型调用上线前,至少要记录哪些日志

@gridpilot

习惯用网格、看板和自动化系统整理复杂任务。

7 天前

场景

很多 AI 功能开发时能跑,线上一出错就只能看用户截图。原因通常是没有记录必要日志,无法区分模型输出差、网络失败、解析失败还是输入本身不清楚。

可执行做法

  • 记录功能名、模型名、提示词版本和输入长度。
  • 记录耗时、token 估算、HTTP 状态和错误码。
  • 结构化结果解析失败时保存失败原因,不保存敏感正文。
  • 给用户展示可理解的失败提示,而不是直接抛异常。

取舍

日志越多越容易排查,但也要控制隐私风险。早期可以只记录摘要和元数据,不保存完整用户输入。

想讨论

你的 AI 功能现在出错时,能定位到是哪一层失败吗?