leetcode之 median of two sorted arrays

原創

2018-09-13 03:36

另一種方法即是利用類似merge的操作找到中位數，利用兩個分別指向A和B數組頭的指針去遍歷數組，然後統計元素個數，直到找到中位數，此時算法複雜度爲O(n)。之後還嘗試了根據算法導論中的習題（9.3-8）擴展的方法，但是該方法會存在無窮多的邊界細節問題，而且擴展也不見得正確，這個可從各網頁的評論看出，非常不建議大家走這條路。

最後從medianof two sorted arrays中看到了一種非常好的方法。原文用英文進行解釋，在此我們將其翻譯成漢語。該方法的核心是將原問題轉變成一個尋找第k小數的問題（假設兩個原序列升序排列），這樣中位數實際上是第(m+n)/2小的數。所以只要解決了第k小數的問題，原問題也得以解決。

首先假設數組A和B的元素個數都大於k/2，我們比較A[k/2-1]和B[k/2-1]兩個元素，這兩個元素分別表示A的第k/2小的元素和B的第k/2小的元素。這兩個元素比較共有三種情況：>、<和=。如果A[k/2-1]<B[k/2-1]，這表示A[0]到A[k/2-1]的元素都在A和B合併之後的前k小的元素中。換句話說，A[k/2-1]不可能大於兩數組合並之後的第k小值，所以我們可以將其拋棄。

證明也很簡單，可以採用反證法。假設 A[k/2-1]大於合併之後的第k小值，我們不妨假定其爲第（k+1）小值。由於A[k/2-1]小於B[k/2-1]，所以B[k/2-1]至少是第（k+2）小值。但實際上，在A中至多存在k/2-1個元素小於A[k/2-1]，B中也至多存在k/2-1個元素小於A[k/2-1]，所以小於A[k/2-1]的元素個數至多有k/2+ k/2-2，小於k，這與A[k/2-1]是第（k+1）的數矛盾。

當A[k/2-1]>B[k/2-1]時存在類似的結論。

當A[k/2-1]=B[k/2-1]時，我們已經找到了第k小的數，也即這個相等的元素，我們將其記爲m。由於在A和B中分別有k/2-1個元素小於m，所以m即是第k小的數。(這裏可能有人會有疑問，如果k爲奇數，則m不是中位數。這裏是進行了理想化考慮，在實際代碼中略有不同，是先求k/2，然後利用k-k/2獲得另一個數。)

通過上面的分析，我們即可以採用遞歸的方式實現尋找第k小的數。此外我們還需要考慮幾個邊界條件：

如果A或者B爲空，則直接返回B[k-1]或者A[k-1]；
如果k爲1，我們只需要返回A[0]和B[0]中的較小值；
如果A[k/2-1]=B[k/2-1]，返回其中一個；

最終實現的代碼爲：

[cpp]view plaincopyprint? 
double findKth(int a[], int m, int b[], int n, int k)  
{  
    //always assume that m is equal or smaller than n  
    if (m > n)  
        return findKth(b, n, a, m, k);  
    if (m == 0)  
        return b[k - 1];  
    if (k == 1)  
        return min(a[0], b[0]);  
    //divide k into two parts  
    int pa = min(k / 2, m), pb = k - pa;  
    if (a[pa - 1] < b[pb - 1])  
        return findKth(a + pa, m - pa, b, n, k - pa);  
    else if (a[pa - 1] > b[pb - 1])  
        return findKth(a, m, b + pb, n - pb, k - pb);  
    else  
        return a[pa - 1];  
}  
  
class Solution  
{  
public:  
    double findMedianSortedArrays(int A[], int m, int B[], int n)  
    {  
        int total = m + n;  
        if (total & 0x1)  
            return findKth(A, m, B, n, total / 2 + 1);  
        else  
            return (findKth(A, m, B, n, total / 2)  
                    + findKth(A, m, B, n, total / 2 + 1)) / 2;  
    }  
};  

我們可以看出，代碼非常簡潔，而且效率也很高。在最好情況下，每次都有k一半的元素被刪除，所以算法複雜度爲logk，由於求中位數時k爲（m+n）/2，所以算法複雜度爲log(m+n)。

轉自：http://blog.csdn.net/yutianzuijin/article/details/11499917/

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

leetcode之 median of two sorted arrays

mp4文件格式

JVM Internals

更新github的repository

實現一個Android輸入法

HTTP Live Streaming直播(iOS直播)技術分析與實現

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結