Iter N

Pre-Edit

  • Kernel
  • Current bottleneck
  • Evidence
  • Hypothesis
  • Why it should help on Ascend
  • Expected improved metric
  • Main risk

Changes

  • 修改类型:代码修改 / 调参 / 环境配置
  • 修改的文件
  • 具体变更
  • (代码修改类:描述修改了哪个函数/模块、做了什么改动)
  • (调参类:每个参数的旧值→新值,如 BASE_N1: 64 → 128)
  • 基于哪一轮:iter-XXX
  • 本轮完整参数快照
  • BASE_M1=16, BASE_N1=64, BASE_K1=64, BLOCK_DIM1=8
  • BASE_M2=16, BASE_N2=64, BASE_K2=64, BLOCK_DIM2=8
  • RELU_BLOCK_DIM=8

Post-Run

  • Correctness:pass / fail
  • Performance:baseline → pto(写明具体数值和单位)
  • Stability:stable / noisy
  • Result:kept / neutral / failure

Analysis

(详细分析为什么有效或为什么失败,包括与上一轮/最佳轮的对比、硬件层面成因)

Next

(下一轮准备尝试什么,给出具体方向和理由)