[阅读: 361] 2006-03-28 05:40:41
每次迭代是两级级数,增加8bit精度
2.5066282746310
0 14703ms 2.5916209220886 1 6
1 19031ms 2.5022566318512 3 12
2 30922ms 2.5066168308258 5 18
3 37734ms 2.5066282749176 7 24 //单精度数,后面的数字相同是凑巧
4 49875ms 2.5066282749176
3次迭代已经到达Float32中24bit的有效位数了,第4次迭代没有意义。
第二次迭代已经比IntelCPU上的FSQRT慢了,精度还是稍差。
FSQRT是可以和整数指令并行执行的,对于有协处理器的CPU这个函数没有意义,对于没有协处理器的CPU,这个函数很不错。
很奇怪的一点,奇数次迭代速度快过偶数次迭代好多。