中国开发网: 论坛: 程序员情感CBD: 贴子 302255
GoodHope
果然!
每次迭代是两级级数,增加8bit精度

2.5066282746310
0 14703ms 2.5916209220886 1 6
1 19031ms 2.5022566318512 3 12
2 30922ms 2.5066168308258 5 18
3 37734ms 2.5066282749176 7 24 //单精度数,后面的数字相同是凑巧
4 49875ms 2.5066282749176

3次迭代已经到达Float32中24bit的有效位数了,第4次迭代没有意义。
第二次迭代已经比IntelCPU上的FSQRT慢了,精度还是稍差。
FSQRT是可以和整数指令并行执行的,对于有协处理器的CPU这个函数没有意义,对于没有协处理器的CPU,这个函数很不错。

很奇怪的一点,奇数次迭代速度快过偶数次迭代好多。

相关信息:


欢迎光临本社区,您还没有登录,不能发贴子。请在 这里登录