系统化调试

来自 Superpowers 项目的系统化调试 Skill，强制执行严格的调试方法论：在尝试修复前必须找到根本原因。该 Skill 防止随机修复和快速补丁，确保真正解决问题而非掩盖症状。

铁律

没有根本原因调查就不能修复

这是不可妥协的原则。任何修复尝试都必须基于对根本原因的清晰理解。未经根本原因分析的修复是被禁止的。

随机修复的危害：随机尝试各种修复方法不仅浪费时间，还可能引入新的 bug。没有理解问题本质的修复往往治标不治本，问题会以其他形式再次出现。

快速补丁的陷阱：快速补丁虽然能暂时解决表面问题，但会掩盖潜在的深层问题。这些被掩盖的问题会在未来造成更大的麻烦，增加系统的技术债务。

症状修复即失败：只修复症状而不解决根本原因，就是失败的调试。真正的调试必须深入到问题的根源，理解为什么会发生这个问题，然后从根本上解决它。

问题重现：首先确保能够稳定重现问题。如果问题无法重现，就无法验证修复是否有效。记录重现步骤和环境条件。

收集信息：收集所有相关信息，包括错误日志、堆栈跟踪、系统状态、输入数据等。信息越完整，越容易定位根本原因。

形成假设：基于收集的信息，形成关于根本原因的假设。好的假设应该能够解释所有观察到的症状。

验证假设：通过实验、日志分析、调试工具等方法验证假设。如果假设被证伪，形成新的假设并继续验证。

定位根本原因：通过系统化的分析和验证，最终定位到问题的根本原因。确保理解为什么会发生这个问题。

实施修复：基于对根本原因的理解，实施针对性的修复。修复应该解决根本问题，而不仅仅是症状。

验证修复：验证修复确实解决了问题，并且没有引入新的问题。运行相关测试，确认问题不再出现。

测试失败：当测试失败时，不要盲目修改代码直到测试通过。首先理解为什么测试失败，是代码逻辑错误、边界条件处理不当，还是测试本身有问题。

生产环境 Bug：生产环境的 bug 往往影响用户体验，但不能因为紧急就跳过根本原因分析。快速补丁可能暂时缓解问题，但必须随后进行彻底的根本原因分析和永久修复。

意外行为：当系统出现意外行为时，系统化调试帮助理解行为背后的原因。可能是配置错误、环境差异、依赖问题或代码逻辑缺陷。

性能问题：性能问题的根本原因可能是算法效率、资源泄漏、数据库查询优化不当等。通过性能分析工具和系统化方法定位瓶颈。

该 Skill 防止草率修复，确保在实施任何解决方案之前进行适当的根本原因分析。通过强制执行系统化调试流程，避免了"打��鼠"式的调试，即修复一个问题又冒出另一个问题。

系统化调试不仅能更有效地解决当前问题，还能帮助团队积累调试经验，提升整体的问题解决能力。对于复杂系统和关键业务，系统化调试是确保系统稳定性和可靠性的重要实践。