Path: ccsf.homeunix.org!CALA-MUZIK!ie.u-ryukyu.ac.jp!gama.is.tsukuba.ac.jp!yas From: yas@is.tsukuba.ac.jp (Yasushi Shinjo) Newsgroups: fj.sci.crypt,fj.comp.arch,fj.comp.parallel Subject: Re: NVIDIA 8800 integer performance Date: 02 Apr 2007 08:48:51 GMT Organization: Institute of Information Sciences and Electronics, University of Tsukuba Lines: 48 Message-ID: References: <86lkhemh64.fsf@bsd2.4bn.ne.jp> NNTP-Posting-Host: kirk.hlla.is.tsukuba.ac.jp X-Trace: gama.is.tsukuba.ac.jp 1175503731 9719 130.158.83.129 (2 Apr 2007 08:48:51 GMT) X-Complaints-To: news@gama.is.tsukuba.ac.jp NNTP-Posting-Date: Mon, 2 Apr 2007 08:48:51 +0000 (UTC) In-reply-to: Yoshitaka Ikeda's message of 31 Mar 2007 08:43:15 +0900 Xref: ccsf.homeunix.org fj.sci.crypt:19 fj.comp.arch:447 fj.comp.parallel:133 新城@筑波大学情報です。こんにちは。 In article <86lkhemh64.fsf@bsd2.4bn.ne.jp> Yoshitaka Ikeda writes: > いまどき、ビデオチップは3D演算用にGPUをつむのがあたりまえになっていますが、 > そのGPUを暗号化に使うと効率がよくなるのではないかという話です。 おもしろそうな話ですね。普通の数値計算だったら、SACSIS とい う学会で見た気がします。他のもあるのかもしれません。 http://www.hpcc.jp/sacsis/2006/program.html.ja CPUとGPUを用いた並列GEMM演算の提案と実装 大島 聡史, 吉瀬 謙二, 片桐 孝洋, 弓場 敏嗣(電通大) プログラムを見ただけで、論文読んだり、発表聞いたりしたわけで はないのですけど。 > 120MHzのPentiumは10サイクルで32ビット乗算を行え、1024bit RSAで > 10Blocks/secで処理できます。 > > GeForce 8800 GTXでは 700倍の速さで実行できそうです。 > (ALUの数が128でクロックが675MHzなので、128*675/120=720ってことですね。) > ALUの単位計算速度が考えてられなかったり演算幅32bitを使う必要性なんかも > ちょっと疑問ですが。 そうですね。結局の所、Pentium 120MHz の 700 倍で、7000 Bock/sec という予想ですか。 > ちなみに、2.4GHz Core2 Quad プロセッサは6000Blocks/secだそうです。 あんまり変らない。ああでも、Core 2 Quad よりも、GPU の方がだ いぶ安いか。 > 個人的には、最近の暗号ソフトウェア実装でホットなのは、並列実装による > 共通鍵ブロック暗号の高速化です。長いレジスタをもつアーキテクチャのほうが > おいしいのですが、GPUでももしかしたら早くなるのかなぁ。 128 ビットのブロックだと 128 ビットのレジスタがいいという意 味ですか。64ビットは、今はわりと普通に使えるのですが、64ビッ トだと倍出るという話になっていますか。 レジスタの幅の短さをレジスタ数でカバーできますか? メモリ・ アクセスなしに計算できると効きそうだけど、メモリ・アクセス入 ると途端に遅くなりそうな気もする。x86 のレジスタ数の少なさは 辛いかも。 \\ 新城 靖 (しんじょう やすし) \\ \\ 筑波大学 電子・情報       \\