2009-12-01から1ヶ月間の記事一覧

CUDA最適化実習(3)

今日は最後の課題に取りかかった。 内容は128K(131072)個のfloat値の合計CUDAを利用するためのオーバーヘッドだけでCPU(i7)で行った場合の時間を超えていたので、残念な感じだった。 データ量を増やしてみたらCPUよりも速くなったけど・・。レポートも書いて…

Larrabeeのgraphics chipがキャンセル

http://news.cnet.com/8301-13924_3-10409715-64.html記事を読むと最初に登場するLarrabeeは、graphics機能を持たないでHPC等のソフトウェア開発者向けに出るようだ。 安く手に入れる方法がなくなりそうで残念だ。Larrabeeの発売時期については来年としか書…

Intelの48コアチップ

昨日PC watchの記事を元にIntelの48コアチップがLarrabeeの次と書いたが、正確にはこっちのチップの発展系らしい。Intel | Data Center Solutions, IoT, and PC InnovationたしかにLarrabeeの次を語るには早すぎるよな。

2.3にした方がいいと思う

自分の組んだCUDAのKernelがたまに正しく動かず、かなり時間をかけて調査をしていたが原因が分からなかった。 同じデータに対して、同じ処理を行っているのに時々結果がランダムにおかしくなる。 (ランダムな結果を出力するKernelを作る方が、同じ結果を出…

IntelのLarrabeeの次

Intel、48コアのIAプロセッサを開発 - PC Watchいろんな事やってるな。 自分が触れるのは何年後になるのかな?とりあえずLarrabeeを早く触らせてくれ。

googleの日本語入力

Google 日本語入力 – Google いろんなところで語られているが、googleが無料の日本語入力を発表した。最近ATOK買ったばかりなのに・・。 とりあえず家のPCに入れてみた。芸能人の名前とかはATOKと比べ物にならないぐらい強いらしい。 「こちらか」と入力する…

バグ中

10回に1回ぐらい発生するバグが取れない・・。 たちが悪いよな・・この手のバグは。 環境を疑うのはまだ早いかな。

Larrabee関連(SVM)

今日も後藤さんがLarrabeeの話を書いてる。【後藤弘茂のWeekly海外ニュース】Larrabeeの切り札「シェアードバーチャルメモリ」 - PC WatchSVM(shared virtual memory)か。 巨大で複雑なデータ構造も、変更することなく渡すことができる。 これが実現するとLa…

久しぶりにLarrabeeの記事

後藤さんが書いている。 【後藤弘茂のWeekly海外ニュース】IntelのスカラCPU+LarrabeeのヘテロジニアスCPUビジョン - PC Watch今回はIntelの将来的なビジョンの話が多かったかな。 うーん。一体いつLarrabeeの実物は触れるんだろうか。

CUDAプログラムの落とし穴

今日はcudaMemcpyToSymbol()とcudaMemcpyFromSymbol()の2つの関数でひどい罠にはまった。 cudaError_t cudaMemcpyToSymbol (const char* symbol, const void * src, size_t count, size_t offset, enum cudaMemcpyKind kind) cudaError_t cudaMemcpyFromSym…