In article news:e0r06u$qu6$1@caraway.media.kyoto-u.ac.jp
 Masanori HATA wrote:

> あと、これはまだ目にしていないのですが、反対にレジスタを全部 1 で埋める

Carry flag が真だった場合。
        sbb cx,cx
Carry flag の状態が不定だったり、偽だった場合は、
        stc
        sbb cx,cx
とかやってました。

 試に、前者と後者をそれぞれループさせて測ったら、ほとんど同じで
        xor cx,cx
        dec cx
よりも、ほぼ二倍速かったです。

 x86系でも CPU によって結果が変化すると思いますが。
演算リソースの利用が、xor+dec : stc+sbb は、二倍って事か、
並列性がニ分の一みたいですね。

CPU: AMD Athlon(tm) XP 2800+ (2079.56-MHz 686-class CPU)
  Origin = "AuthenticAMD"  Id = 0x6a0  Stepping = 0

-- 
山口@福岡 <hyama@mx7.tiki.ne.jp>