triton.experimental.gluon.language.nvidia.blackwell.tma.async_scatter

triton.experimental.gluon.language.nvidia.blackwell.tma.async_scatter(tensor_desc, x_offsets, y_offset, src, _semantic=None)

Asynchronously scatter elements from shared memory to global memory using TMA.

Parameters: