GPGPU

GPU Computing Master Class

SIGGRAPH ASIA 2009の横で行われているNVIDIA主催のGPU Computing Master Classに参加した。 領収書を貰ったからたぶん会社からお金が出るだろう。 受付でCUDA本を貰った。(既に持ってるから誰かに上げる予定)http://www.siggraph.org/asia2009/jp/gpu/公…

GTX 295

ついにGTX 295 + CUDA 2.3環境ができた。まあ、自分は横で見てただけだけど。 Linuxでの環境構築は大変だ。これじゃあWindowsよりもユーザー数が増えることはないな。DeviceQueryを行うとGPUが2個ついているように見える。 GTX 295での最適化はどんな落とし…

GPU今ビューティングの現状とスーパーコンピューティングの未来

2009/12/10 GPUコンピューティングの現状とスーパーコンピューティングの未来2chで見つけた。京都大学の天体系の人が書いたスライド。 わかりやすくて面白かったのでボリュームがあるが一気に読んでしまった。 いろいろ考えさせられる。

Teslaの信頼性は?

パフォーマンスの点では値段の高いTeslaよりも安いGTX285やGTX290の方が高い。 おまけにGTXは画像の出力機能まである。 Teslaの値段が高いのは信頼性が高いからと言われるがどのくらい違うのか。そのヒントになりそうなのが次の論文(右側のdownloadの所から…

【後藤弘茂のWeekly海外ニュース】LarrabeeはSIMDとMIMDのバランス--Intel CTOが語る - PC Watch今回の後藤さんはLarrabeeの話し。 MIMDとSIMDの戦いの歴史の話なども面白かった。 Larrabeeも早く触ってみたいものだ。(SSEは命令がすっきりしてないのであま…

Fermiの設計思想

今回も後藤さんが詳しく纏めてくれている。【後藤弘茂のWeekly海外ニュース】NVIDIA Fermiのマルチスレッディングアーキテクチャ - PC WatchFermiはより汎用コンピューティング向けに進化している。そのためにNVIDIAが選んだのはメモリ階層を深くしてメモリ…

Occupancyの読み方

CUDA Profileを使うと次のようなログが取れるが、その中にoccupancyというのがある。 # CUDA_PROFILE_LOG_VERSION 1.4 # CUDA_DEVICE_NAME 0 GeForce GTX 280 timestamp,method,gputime,cputime,occupancy timestamp=[ 2155.302 ] method=[ _Z10fhaar1dwtdiP…

CUDA profileの読み方

さっそくCUDA profileを利用してみた。logファイルの中に以下のような関数ごとの時間が大量にでる。 timestamp=[ 2155.302 ] method=[ _func_name ] gputime=[ 7.808 ] cputime=[ 74.730 ] occupancy=[ 1.000 ] gputimeとcputimeの意味がいまひとつ分からず…

CUDAの復習とか

特に用事が無かったので一日引きこもってしまった。今日はNVIDIAのサイトにアップされた資料を使って、CUDAについての復習を行った。 座学のみだけど・・。CUDA Education & Training | NVIDIA Developer次の2つのpdfを直ぐには関係なさそうな箇所を飛ばし…

Fermiの構造とか

【後藤弘茂のWeekly海外ニュース】フラットで自由度が高いNVIDIA Fermiのアーキテクチャ - PC Watch後藤さんがFermiの解説をしてくれている。 G80やGT200ではLoad/Store UnitがSMの外に合ったとは知らなかった。 そしてFermiで各SMの中に入ることも。 各SMが…