2014-10-19から1日間の記事一覧
ある CUDA 本に warp suffle を使った sum reduction プログラムが乗っていたのだが、GTX 780 で実行した結果が Tesla K40 とまったく違うのでメモ。 #include <stdio.h> #include <stdlib.h> #define WORK_SIZE 16384 // THREAD_SIZE <= 1024 でなければならない #define THREA</stdlib.h></stdio.h>…