写在前面
第一轮排查不需要把所有调试信息都打开。
你只需要先拿到三类信息:
- 当前状态;
- 最近日志;
- 基础环境。
只要这三类信息已经足够归类,就不要继续加深调试。
第一步:先看状态
状态回答的是:它现在到底有没有在运行。
先执行:
openclaw status
openclaw gateway status如果这两步都说不清当前实例是不是正常运行,就不要急着开更深日志。
你现在先要弄清楚的是:
- 程序有没有起来;
- 网关状态是否可读;
- 当前问题是局部异常,还是整体运行都不稳定。
第二步:再看日志
日志回答的是:刚才发生了什么,卡在什么位置。
执行:
openclaw logs --follow这一层不是为了收集越多越好,而是为了尽快拿到:
- 最后一次明确的报错位置;
- 最近一次重复出现的阻塞信号;
- 这次异常和你最近改动之间的对应关系。
如果你已经拿到了清晰结论,就不要继续无限追加输出。
第三步:最后再看环境
环境回答的是:这台机器本身有没有条件支撑当前运行结果。
当你怀疑问题还在环境层时,再补这一类检查,例如:
- 运行时版本;
- 当前 shell 与路径;
- 目录权限;
- 服务运行上下文。
如果环境层本身不成立,日志里很多后续异常都只是结果,而不是根因。
第一轮检查时最值得保留什么
比起大段原始输出,更有价值的是这三样:
- 最后一次明确的报错位置;
- 最近一次改动内容;
- 当前平台或配置场景。
有了这三样,通常就足够判断问题属于安装、启动、配置还是通道。
什么时候不该继续加深日志
如果你还没做基础归类,就不要一上来开启更深层调试。
更稳妥的顺序是:
- 先看状态;
- 再看最近日志;
- 还不够,再看环境;
- 只有前三类都拿到了仍无法归类,才继续加深调试。
否则很容易变成“信息越来越多,但结论还是没有”。
常见错误或风险
- 还没做基础归类就打开更深层调试;
- 长期开启过度详细日志;
- 收集了很多输出,却没有记录最近一次改动;
- 把日志数量误当成排查进展。
下一步
如果你已经拿到清楚分类,回对应任务页继续修复。
如果仍然卡在安装、启动、配置或平台之间无法判断,回 故障排查总页。