关于浮点数的精度有关问题

2013-08-06

关于浮点数的精度问题浮点类型的数据采用单精度类型（float）和双精度类型(double)来存储，单精度浮点数用4字

关于浮点数的精度问题
浮点类型的数据采用单精度类型（float）和双精度类型(double)来存储，单精度浮点数用4字节（32bit）表示浮点数, 而双精度浮点数用8字节（64bit）表示。

在存储中都分为三个部分：
符号位(Sign) : 0代表正，1代表为负
指数位（Exponent）:用于存储科学计数法中的指数数据，并且采用移位存储
尾数部分（Mantissa）：尾数部分

用 M(尾数) * B(底数)的E(指数）次方加上符号位来表示数值。

float：
1bit（符号位） 8bits（指数位） 23bits（尾数位）
double：
1bit（符号位） 11bits（指数位） 52bits（尾数位）

于是，float的指数范围为-127~+128，而double的指数范围为-1023~+1024，并且指数位是按补码的形式来划分的。
其中负指数决定了浮点数所能表达的绝对值最小的非零数；而正指数决定了浮点数所能表达的绝对值最大的数，也即决定了浮点数的取值范围。
float的范围为-2^128 ~ +2^128，也即-3.40E+38 ~ +3.40E+38；double的范围为-2^1024 ~ +2^1024，也即-1.79E+308 ~ +1.79E+308。

float和double的精度是由尾数的位数来决定的。浮点数在内存中是按科学计数法来存储的，其整数部分始终是一个隐含着的“1”，由于它是不变的，故不能对精度造成影响。
float：2^23 = 8388608，一共七位，这意味着最多能有7位有效数字，但绝对能保证的为6位，也即float的精度为6~7位有效数字；
double：2^52 = 4503599627370496，一共16位，同理，double的精度为15~16位。

编译运行下面这个程序：

public class Test{    public static void main(String args[]){        System.out.println(0.05+0.01);        System.out.println(1.0-0.42);        System.out.println(4.015*100);        System.out.println(123.3/100);    }};

会看到结果为：
0.060000000000000005
0.5800000000000001
401.49999999999994
1.2329999999999999

在《Effective Java》这本书中提到，float和double只能用来做科学计算或者是工程计算，在商业计算中我们要用java.math.BigDecimal。

下面提供一个工具类Arith来实现浮点数的精确计算：

import java.math.BigDecimal;/*** 由于Java的简单类型不能够精确的对浮点数进行运算，这个工具类提供精* 确的浮点数运算，包括加减乘除和四舍五入。*/public class Arith{//默认除法运算精度private static final int DEF_DIV_SCALE = 10;//这个类不能实例化private Arith(){}/*** 提供精确的加法运算。* @param v1 被加数* @param v2 加数* @return 两个参数的和*/public static double add(double v1,double v2){    BigDecimal b1 = new BigDecimal(Double.toString(v1));    BigDecimal b2 = new BigDecimal(Double.toString(v2));    return b1.add(b2).doubleValue();}/*** 提供精确的减法运算。* @param v1 被减数* @param v2 减数* @return 两个参数的差*/public static double sub(double v1,double v2){    BigDecimal b1 = new BigDecimal(Double.toString(v1));    BigDecimal b2 = new BigDecimal(Double.toString(v2));    return b1.subtract(b2).doubleValue();}/*** 提供精确的乘法运算。* @param v1 被乘数* @param v2 乘数* @return 两个参数的积*/public static double mul(double v1,double v2){    BigDecimal b1 = new BigDecimal(Double.toString(v1));    BigDecimal b2 = new BigDecimal(Double.toString(v2));    return b1.multiply(b2).doubleValue();}/*** 提供（相对）精确的除法运算，当发生除不尽的情况时，精确到* 小数点以后10位，以后的数字四舍五入。* @param v1 被除数* @param v2 除数* @return 两个参数的商*/public static double div(double v1,double v2){    return div(v1,v2,DEF_DIV_SCALE);}/*** 提供（相对）精确的除法运算。当发生除不尽的情况时，由scale参数指* 定精度，以后的数字四舍五入。* @param v1 被除数* @param v2 除数* @param scale 表示表示需要精确到小数点以后几位。* @return 两个参数的商*/public static double div(double v1,double v2,int scale){    if(scale<0){        throw new IllegalArgumentException(        "The scale must be a positive integer or zero");    }    BigDecimal b1 = new BigDecimal(Double.toString(v1));    BigDecimal b2 = new BigDecimal(Double.toString(v2));    return b1.divide(b2,scale,BigDecimal.ROUND_HALF_UP).doubleValue();}/*** 提供精确的小数位四舍五入处理。* @param v 需要四舍五入的数字* @param scale 小数点后保留几位* @return 四舍五入后的结果*/public static double round(double v,int scale){    if(scale<0){        throw new IllegalArgumentException(        "The scale must be a positive integer or zero");    }    BigDecimal b = new BigDecimal(Double.toString(v));    BigDecimal one = new BigDecimal("1");    return b.divide(one,scale,BigDecimal.ROUND_HALF_UP).doubleValue();}};

热点排行

编程

关于浮点数的精度有关问题