徒然なる日々を送るソフトウェアデベロッパーの記録(2)

技術上思ったことや感じたことを気ままに記録していくブログです。さくらから移設しました。

2014-10-19から1日間の記事一覧

あれ、warp suffle を使った方が遅い???

ある CUDA 本に warp suffle を使った sum reduction プログラムが乗っていたのだが、GTX 780 で実行した結果が Tesla K40 とまったく違うのでメモ。 #include <stdio.h> #include <stdlib.h> #define WORK_SIZE 16384 // THREAD_SIZE <= 1024 でなければならない #define THREA</stdlib.h></stdio.h>…