Re: NVIDIA 8800 integer performance
新城@筑波大学情報です。こんにちは。
In article <86lkhemh64.fsf@bsd2.4bn.ne.jp>
Yoshitaka Ikeda <ikeda@4bn.ne.jp> writes:
> いまどき、ビデオチップは3D演算用にGPUをつむのがあたりまえになっていますが、
> そのGPUを暗号化に使うと効率がよくなるのではないかという話です。
おもしろそうな話ですね。普通の数値計算だったら、SACSIS とい
う学会で見た気がします。他のもあるのかもしれません。
http://www.hpcc.jp/sacsis/2006/program.html.ja
CPUとGPUを用いた並列GEMM演算の提案と実装
大島 聡史, 吉瀬 謙二, 片桐 孝洋, 弓場 敏嗣(電通大)
プログラムを見ただけで、論文読んだり、発表聞いたりしたわけで
はないのですけど。
> 120MHzのPentiumは10サイクルで32ビット乗算を行え、1024bit RSAで
> 10Blocks/secで処理できます。
>
> GeForce 8800 GTXでは 700倍の速さで実行できそうです。
> (ALUの数が128でクロックが675MHzなので、128*675/120=720ってことですね。)
> ALUの単位計算速度が考えてられなかったり演算幅32bitを使う必要性なんかも
> ちょっと疑問ですが。
そうですね。結局の所、Pentium 120MHz の 700 倍で、7000
Bock/sec という予想ですか。
> ちなみに、2.4GHz Core2 Quad プロセッサは6000Blocks/secだそうです。
あんまり変らない。ああでも、Core 2 Quad よりも、GPU の方がだ
いぶ安いか。
> 個人的には、最近の暗号ソフトウェア実装でホットなのは、並列実装による
> 共通鍵ブロック暗号の高速化です。長いレジスタをもつアーキテクチャのほうが
> おいしいのですが、GPUでももしかしたら早くなるのかなぁ。
128 ビットのブロックだと 128 ビットのレジスタがいいという意
味ですか。64ビットは、今はわりと普通に使えるのですが、64ビッ
トだと倍出るという話になっていますか。
レジスタの幅の短さをレジスタ数でカバーできますか? メモリ・
アクセスなしに計算できると効きそうだけど、メモリ・アクセス入
ると途端に遅くなりそうな気もする。x86 のレジスタ数の少なさは
辛いかも。
\\ 新城 靖 (しんじょう やすし) \\
\\ 筑波大学 電子・情報 \\
Fnews-brouse 1.9(20180406) -- by Mizuno, MWE <mwe@ccsf.jp>
GnuPG Key ID = ECC8A735
GnuPG Key fingerprint = 9BE6 B9E9 55A5 A499 CD51 946E 9BDC 7870 ECC8 A735