首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 开发语言 > 编程 >

关于浮点数的精度有关问题

2013-08-06 
关于浮点数的精度问题浮点类型的数据采用单精度类型(float)和双精度类型(double)来存储,单精度浮点数用4字

关于浮点数的精度问题
  浮点类型的数据采用单精度类型(float)和双精度类型(double)来存储,单精度浮点数用4字节(32bit)表示浮点数, 而双精度浮点数用8字节(64bit)表示。

在存储中都分为三个部分:
符号位(Sign) : 0代表正,1代表为负
指数位(Exponent):用于存储科学计数法中的指数数据,并且采用移位存储
尾数部分(Mantissa):尾数部分

用 M(尾数) * B(底数)的E(指数)次方加上符号位来表示数值。

float:
1bit(符号位) 8bits(指数位) 23bits(尾数位)
double:
1bit(符号位) 11bits(指数位) 52bits(尾数位)

  于是,float的指数范围为-127~+128,而double的指数范围为-1023~+1024,并且指数位是按补码的形式来划分的。
  其中负指数决定了浮点数所能表达的绝对值最小的非零数;而正指数决定了浮点数所能表达的绝对值最大的数,也即决定了浮点数的取值范围。
  float的范围为-2^128 ~ +2^128,也即-3.40E+38 ~ +3.40E+38;double的范围为-2^1024 ~ +2^1024,也即-1.79E+308 ~ +1.79E+308。

  float和double的精度是由尾数的位数来决定的。浮点数在内存中是按科学计数法来存储的,其整数部分始终是一个隐含着的“1”,由于它是不变的,故不能对精度造成影响。
  float:2^23 = 8388608,一共七位,这意味着最多能有7位有效数字,但绝对能保证的为6位,也即float的精度为6~7位有效数字;
  double:2^52 = 4503599627370496,一共16位,同理,double的精度为15~16位。

编译运行下面这个程序:

public class Test{    public static void main(String args[]){        System.out.println(0.05+0.01);        System.out.println(1.0-0.42);        System.out.println(4.015*100);        System.out.println(123.3/100);    }};

会看到结果为:
0.060000000000000005
0.5800000000000001
401.49999999999994
1.2329999999999999

在《Effective Java》这本书中提到,float和double只能用来做科学计算或者是工程计算,在商业计算中我们要用java.math.BigDecimal。

下面提供一个工具类Arith来实现浮点数的精确计算:
import java.math.BigDecimal;/*** 由于Java的简单类型不能够精确的对浮点数进行运算,这个工具类提供精* 确的浮点数运算,包括加减乘除和四舍五入。*/public class Arith{//默认除法运算精度private static final int DEF_DIV_SCALE = 10;//这个类不能实例化private Arith(){}/*** 提供精确的加法运算。* @param v1 被加数* @param v2 加数* @return 两个参数的和*/public static double add(double v1,double v2){    BigDecimal b1 = new BigDecimal(Double.toString(v1));    BigDecimal b2 = new BigDecimal(Double.toString(v2));    return b1.add(b2).doubleValue();}/*** 提供精确的减法运算。* @param v1 被减数* @param v2 减数* @return 两个参数的差*/public static double sub(double v1,double v2){    BigDecimal b1 = new BigDecimal(Double.toString(v1));    BigDecimal b2 = new BigDecimal(Double.toString(v2));    return b1.subtract(b2).doubleValue();}/*** 提供精确的乘法运算。* @param v1 被乘数* @param v2 乘数* @return 两个参数的积*/public static double mul(double v1,double v2){    BigDecimal b1 = new BigDecimal(Double.toString(v1));    BigDecimal b2 = new BigDecimal(Double.toString(v2));    return b1.multiply(b2).doubleValue();}/*** 提供(相对)精确的除法运算,当发生除不尽的情况时,精确到* 小数点以后10位,以后的数字四舍五入。* @param v1 被除数* @param v2 除数* @return 两个参数的商*/public static double div(double v1,double v2){    return div(v1,v2,DEF_DIV_SCALE);}/*** 提供(相对)精确的除法运算。当发生除不尽的情况时,由scale参数指* 定精度,以后的数字四舍五入。* @param v1 被除数* @param v2 除数* @param scale 表示表示需要精确到小数点以后几位。* @return 两个参数的商*/public static double div(double v1,double v2,int scale){    if(scale<0){        throw new IllegalArgumentException(        "The scale must be a positive integer or zero");    }    BigDecimal b1 = new BigDecimal(Double.toString(v1));    BigDecimal b2 = new BigDecimal(Double.toString(v2));    return b1.divide(b2,scale,BigDecimal.ROUND_HALF_UP).doubleValue();}/*** 提供精确的小数位四舍五入处理。* @param v 需要四舍五入的数字* @param scale 小数点后保留几位* @return 四舍五入后的结果*/public static double round(double v,int scale){    if(scale<0){        throw new IllegalArgumentException(        "The scale must be a positive integer or zero");    }    BigDecimal b = new BigDecimal(Double.toString(v));    BigDecimal one = new BigDecimal("1");    return b.divide(one,scale,BigDecimal.ROUND_HALF_UP).doubleValue();}};


热点排行