bjmike 发表于 2013-2-1 12:51:04

java.util.Arrays的二分查找

今天程序中需要用到最快的查询算法,本来想自己写,可是突然感觉java提供强大的collection操作类库应该包含这些。于是搜了一番,发现,确实如我所想。自己写了个exaple:
int[] arr=new int[]{5,2,7,9,4,9,3,2};Arrays.sort(arr);for(int a:arr){System.out.print(a+" ");}System.out.println();System.out.print(Arrays.binarySearch(arr, 12));

但是java自带的jdk存在bug。如下是它的源码,
1:   public static int binarySearch(int[] a, int key) {2:         int low = 0;3:         int high = a.length - 1;4: 5:         while (low <= high) {6:             int mid = (low + high) / 2;7:             int midVal = a;8:9:             if (midVal < key)10:               low = mid + 1;11:             else if (midVal > key)12:               high = mid - 1;13:             else14:               return mid; // key found15:         }16:         return -(low + 1);// key not found.17:   }

bug出现在第6行:

6:             int mid =(low + high) / 2;

在一般情况下, 这个语句是不会出错的, 但是, 当low+high的值超过了最大的正int值 (231 - 1) 的时候, mid会变成负值,这个时候, 会抛出ArrayIndexOutOfBoundsException 异常..

所以当一个数组包含超过2的30次方 个元素的时候, 就很可能会带来问题... 当然, 在一般的应用里面, 很少数组会包含那么多元素, 但是现在这样的情况已经越来越多了, 比如Google的海量运算..

那如何解决这个问题?

很简单, 修改这行语句为:

6:             int mid = low + ((high - low) / 2);
或者
6:             int mid = (low + high) >>> 1;


在c或者c++中, 则可以如下实现:
6:             mid = ((unsigned) (low + high)) >> 1;
页: [1]
查看完整版本: java.util.Arrays的二分查找