手工调优 kernels(Manual kernels)

本目录包含手工调优(手写、面向性能)的 kernel 示例:需要显式管理 buffer、同步与流水线控制,以在支持的 NPU 上获得最佳性能。

如果你刚接触 PTO 编程,建议先从 ISA 与教程入手:

平台

  • a2a3/:Ascend A2/A3 平台的手工调优 kernels。
  • a5/:Ascend A5 平台的手工调优 kernels。
  • common/:跨平台手工调优 kernels(共享示例)。

如何运行

每个子目录都是一个独立示例,包含各自的构建/运行说明。请从这里开始: