Skip to content

CUDA:Architecture

Thread

Block

Warp

쓰레드 블럭이 실행될 때는 Warp 단위로 실행된다. 각각의 쓰레드 블럭들은 하나 또는 그 이상의 warp로 매핑되며 보통 32개의 쓰레드로 구성된다. 예를 들어, 128개의 쓰레드로 이루어진 쓰레드 블럭이 있다면 32 개의 쓰레드로 이루어진 4개의 Warp로 매핑된다. 하지만 만약, 쓰레드 블럭의 크기가 32개의 배수가 아닌 경우에는 마지막 warp에서 사용되지 않는 쓰레드들은 자동으로 disabled 된다.

Cuda_warp_example_image.png

See also

Favorite site