Skip to content

feat: add lightweight kernel debug logs and remove legacy timing#158

Open
XFDG wants to merge 10 commits intoMooreThreads:mainfrom
XFDG:timing
Open

feat: add lightweight kernel debug logs and remove legacy timing#158
XFDG wants to merge 10 commits intoMooreThreads:mainfrom
XFDG:timing

Conversation

@XFDG
Copy link
Copy Markdown
Contributor

@XFDG XFDG commented Apr 7, 2026

背景

为了更方便地定位 MUSA kernel 的输入信息,这个 PR 将原来的 timing 宏方案替换为更轻量的 debug 日志方案。同时保留测试时的进度条体验,避免调试日志引入后影响现有单测使用方式。

主要改动

  • 新增统一调试宏 MUSA_DEBUG_LOG_KERNEL(ctx)
  • 在公共 helper 中输出 op_typeinput_typesinput_shapes
  • 去掉原先冗长的 register_type=... 输出
  • input_typesinput_shapes 增加终端颜色高亮能力
  • 删除旧的 timing 宏及其相关调用逻辑
  • 当前保留示例埋点的算子包括:
    • Add
    • AddN
    • Conv2D
    • GELU
  • 恢复并兼容测试进度条输出
  • 让直接执行 python test/ops/xxx_op_test.py 也能复用自定义 test runner
  • 更新中英文 README,补充新的调试方式,并明确说明:
    • 可以在仓库根目录运行并设置 PYTHONPATH
    • 也可以直接进入 test/ 目录运行,无需设置 PYTHONPATH

删除内容

以下旧 timing 宏已移除,不再作为调试入口使用:

  • MUSA_KERNEL_TIMING_GUARD
  • MUSA_KERNEL_TRACE_START
  • MUSA_KERNEL_TRACE_END
  • MUSA_KERNEL_TRACE
  • MUSA_PROFILE_OP

验证

已完成以下验证:

  • ./build.sh debug 编译通过
  • 直接运行 python3 test/ops/add_op_test.py 时,进度条与 MUSA_KERNEL_DEBUG 日志可同时输出
  • add_op_test 日志中能够正确看到新的 debug 输出格式

影响说明

本次改动主要影响 debug 观测方式,不改变算子计算逻辑。旧 timing 宏路径已废弃,后续调试请统一使用新的 kernel debug 日志方案。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant