2009-11-22から1日間の記事一覧

Twitterデビューなう

つぶやいたら負けと思ったけど、Twitterでつぶやく知人が増えてきて、一生懸命グーグルリーダーで拾って読んでたけど、数が増えてきたのでTwitterデビューしてしまった。ためになるブログを書いていた人がTwitter始めてからブログをまったく更新しなくなった…

CUDA本読み終わった

11章の粒子計算や12章の偏微分を最適化しながら実効性能を乗せてくれていたのは良かった。 (自分には計算式に、ついていけない部分もあったけど)付録Aに載っていたマニュアルへのパスの通し方は早速.bashrcに追加しておいた。 export MANPATH=$MANPATH:/us…

SMあたりのBlock数

CUDA本はまだ読み途中。性能を引き出す上で6章に書いてあった、Occupancyを高めるよりもマルチプロセッサあたりのアクティブなブロック数の方が大事というのはいいヒントになりそうだ。ついついBlockあたりのThread数を上げようとしてしまうが、同時におよそ…

cudaMalloc()を利用しないでDeviceメモリを確保する方法

__device__をつけてバッファを用意する。 HOST側のプログラムからは次の関数を利用してアドレスを取得する。 cudaError_t cudaGetSymbolAddress (void **devPtr, const char * symbol); こんな感じになるかな __device__ int d_buff[256]; int main(void) { …