二分查找(Binary Search)算法

1、實現原理

二分查找針對的是一個有序的數據集合,每次都通過跟區間的中間元素對比,將待查找的區間縮小爲之前的一半,直到找到要查找的元素,或者區間被縮小爲 0。

如下是二分查找算法的查找過程,針對有序數組 int[] a={9,10,11,12,13,14,15};lowhigh表示數組查找的區間,mid 表示查找區間的中間元素。

在這裏插入圖片描述

2、代碼實現

明白二分查找的原理,代碼很容易明白了。如下代碼java實現

 /**
     * 簡單二分查找
     * @param arr
     * @param value
     * @return
     */
    public static int bSeaarch(int[] arr,int value){
        int low=0;
        int high=arr.length-1;
        while (low<=high){
            int mid=low+((high-low)>>1);
            if (value==arr[mid]){
                return mid;
            }else if (value>arr[mid]){
                low=mid+1;
            }else {
                high=mid-1;
            }
        }
        return -1;
    }

3、二分查找常見的變體

對於上面“值等於給定值”的二分查找在實際中用到的情況不多,二分查找更適合用在“近似”查找問題,在這類問題上,二分查找的優勢更加明顯,比如以下幾種變體。

3.1、查找第一個值等於給定值的元素

數組 int[] a={9,10,12,12,12,13,15}; 中有重複的值,我們希望查找第一個等於 12的數據,也就是下標是 2 的元素。

 /**
     * 查找第一個值等於給定值的元素
     * @param arr
     * @param value
     * @return
     */
    public static int bSeaarch2(int[] arr,int value){
        int low=0;
        int high=arr.length-1;
        while (low<=high){
            int mid=low+((high-low)>>1);
            //如果給定的值大於區間中間元素
            if (value>arr[mid]){
                low=mid+1;
            }else if (value<arr[mid]){  //如果給定的值大於區間中間元素
                high=mid-1;
            }else{  //如果給定的值等於區間中間元素
                //當前中間元素爲第一個或者中間元素的前一個不等於給定值,則當前元素就是要查找第一個值
                if (mid==0||arr[mid-1]!=value){
                    return mid;
                }else {
                    high=mid-1;
                }
            }
        }
        return -1;
    }

3.2、查找最後一個值等於給定元素

數組 int[] a={9,10,12,12,12,13,15}; 中有重複的值,我們希望查找最後一個等於 12的數據,也就是下標是 4 的元素。

/**
     * 查找最後一個值等於給定元素
     * @param arr
     * @param value
     * @return
     */
    public static int bseaarch3(int[] arr,int value){
        int low=0;
        int high=arr.length-1;
        while (low<=high){
            int mid=low+((high-low)>>1);
            //如果跟定的值大於區間數組中間值,則 low=mid+1
            if (value>arr[mid]){
                low=mid+1;
            }else if (value<arr[mid]){  //如果跟定的值小於區間數組中間值,則 high=mid-1
                high=mid-1;
            }else {
                //如果區間數組中間值是數組最後一個元素或者中間值的下一個元素不等於給定值,返回當前mid索引
                if ((mid==arr.length-1)||(arr[mid+1]!=value)) {
                    return mid;
                }else { //繼續在下一區間查找
                    low=mid+1;
                }
            }
        }
        return -1;
    }

3.3、查找最後一個大於等於給定值的元素

數組 int[] a={9,10,12,13,14,15,16}; 中重複的值,我們希望查找最後一個大於等於12元素的索引,也就是下標是6 。

   /**
     * 查找第一個大於等於給定值的元素
      * @param arr
     * @param value
     * @return
     */
    public static int bsearch4(int[] arr,int value){
        int low=0;
        int high=arr.length-1;
        while (low<=high){
            int mid=low+((high-low)>>1);
            //如區間元素中間值大於等於給定元素
            if (arr[mid]>=value){
                // 如區間元素是數組第一個元素或者下一個元素小於給定值,則當前索引滿足條件
                if (mid==0||arr[mid-1]<value){
                    return mid;
                }else { //不滿足上面條件,繼續循環
                    high=mid-1;
                }
            }else {
                low=mid+1;
            }
        }
         return -1;
    }

3.4、查找最後一個小於於等於給定值的元素

數組 int[] a={9,10,12,13,14,15,16}; 中重複的值,我們希望查找最後一個小於等於10元素的索引,也就是下標是0 。

/**
     * 查找最後一個小於於等於給定值的元素  `int[] a={9,10,12,13,14,15,16}
     * @param arr
     * @param value
     * @return
     */
    public static int bsearch6(int[] arr,int value){
        int low=0;
        int high=arr.length-1;
        while (low<=high){
            int mid=low+((high-low)>>1);
            if (arr[mid]>value){
               high=mid-1;
            }else {
                if ((mid==arr.length-1)||(arr[mid+1]>value)) {
                    return mid;
                }else {
                    low=mid+1;
                }
            }
        }
        return -1;
    }

4、二分查找算法的侷限性

  • 二分查找算法需要按照下標隨機訪問元素,所以二分查找算法依賴順序表結構,比如:數組。如果查找的數據是通過其他數據結構存儲的(如:鏈表),則無法應用二分查找。

  • 二分查找算法針對數據必須是有序的。如果數據沒有序,我們需要先排序。

  • 如果要處理的數據量很小,完全沒有必要用二分查找,順序遍歷就足夠了。

  • 如果處理的數據量特別大,也不適合用二分查找,二分查找的底層需要依賴數組這種數據結構,而數組爲了支持隨機訪問的特性,要求內存空間連續,對內存的要求比較苛刻。比如,我們有 1GB 大小的數據,如果希望用數組來存儲,那就需要 1GB 的連續內存空間。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章