題目描述
在數組中的兩個數字,如果前面一個數字大於後面的數字,則這兩個數字組成一個逆序對。輸入一個數組,求出這個數組中的逆序對的總數P。並將P對1000000007取模的結果輸出。 即輸出P%1000000007
輸入描述
題目保證輸入的數組中沒有的相同的數字
數據範圍:
對於%50的數據,size<=10^4
對於%75的數據,size<=10^5
對於%100的數據,size<=2*10^5
示例1
輸入
1,2,3,4,5,6,7,0
輸出
7
方法一、遍歷
從頭到位遍歷每一個數,將其與其他所有的數作比較,如果前一個數比後面的數小,則滿足逆序對的要求。這樣比較的時間效率是O(n^2),再數字較多時,明顯效率較低。
方法二、分別比較再合併結果
我們以數組{7,5,6,4}爲例來分析統計逆序對的過程。每次掃描到一個數字的時候,我們不拿ta和後面的每一個數字作比較,否則時間複雜度就是O(n^2),因此我們可以考慮先比較兩個相鄰的數字。
(a) 把長度爲4的數組分解成兩個長度爲2的子數組;
(b) 把長度爲2的數組分解成兩個成都爲1的子數組;
(c) 把長度爲1的子數組 合併、排序並統計逆序對 ;
(d) 把長度爲2的子數組合並、排序,並統計逆序對;
在上圖(a)和(b)中,我們先把數組分解成兩個長度爲2的子數組,再把這兩個子數組分別拆成兩個長度爲1的子數組。接下來一邊合併相鄰的子數組,一邊統計逆序對的數目。在第一對長度爲1的子數組{7}、{5}中7大於5,因此(7,5)組成一個逆序對。同樣在第二對長度爲1的子數組{6}、{4}中也有逆序對(6,4)。由於我們已經統計了這兩對子數組內部的逆序對,因此需要把這兩對子數組 排序 如上圖(c)所示, 以免在以後的統計過程中再重複統計。
接下來我們統計兩個長度爲2的子數組子數組之間的逆序對。合併子數組並統計逆序對的過程如下圖如下圖所示。
我們先用兩個指針分別指向兩個子數組的末尾,並每次比較兩個指針指向的數字。如果第一個子數組中的數字大於第二個數組中的數字,則構成逆序對,並且逆序對的數目等於第二個子數組中剩餘數字的個數,如下圖(a)和(c)所示。如果第一個數組的數字小於或等於第二個數組中的數字,則不構成逆序對,如圖b所示。每一次比較的時候,我們都把較大的數字從後面往前複製到一個輔助數組中,確保 輔助數組(記爲copy) 中的數字是遞增排序的。在把較大的數字複製到輔助數組之後,把對應的指針向前移動一位,接下來進行下一輪比較。
過程:先把數組分割成子數組,先統計出子數組內部的逆序對的數目,然後再統計出兩個相鄰子數組之間的逆序對的數目。在統計逆序對的過程中,還需要對數組進行排序。如果對排序算法很熟悉,我們不難發現這個過程實際上就是歸併排序。參考代碼如下:
class Solution {
public:
int InversePairs(vector<int> data) {
int size = data.size();
if(size <=1) return 0;
vector<int> copy(data);
long long ret = InversePairs2(data, copy, 0, size-1);
return ret%1000000007;
}
long long InversePairs2(vector<int> &data, vector<int> ©, int start, int end){
if(start==end) //這一步是必須的,處理長度爲1的時刻
{
copy[start]=data[start];
return 0;
}
int length = (end - start)/2;
long long left = InversePairs2(copy, data, start, start+length); //這裏注意參數copy和data的位置
long long right = InversePairs2(copy, data, start+length+1, end);
int i = start+length;
int j = end;
int indexOfcopy = end;
long long count = 0;
while(i>=start && j>=start+length+1){
if(data[i] > data[j]){
copy[indexOfcopy--] = data[i--];
count += (j-start -length);
}else{
copy[indexOfcopy--] = data[j--];
}
}
for(;i>=start;i--)
copy[indexOfcopy--]=data[i];
for(;j>=start+length+1;j--)
copy[indexOfcopy--]=data[j];
return left+right+count;
}
};
算法新增了一個vector,和輸入的數據同樣的大小。利用O(n)的空間消耗,將時間性能減少至O(nlogn),就是歸併排序的時間效率。
需要注意的地方:
1、大數問題。當輸入數據很大時,逆序對的數量也會很大,用int無法滿足數據範圍,考慮使用long long型。
2、邊界處理。處理只有一個數字時的情況。
if(start==end)
{
copy[start]=data[start];
return 0;
}
3、遞歸調用。可以看到遞歸調用InversePairs2()時,data和copy的位置發生了調換。這是因爲InversePairs2()的參數中,第一個參數表示待處理的數據,第二個參數是存放處理後的結果。在前一步處理後,copy中存放的是已經計算過並排序後的數據。這裏都是傳值的調用,數組都是直接修改。
long long left = InversePairs2(copy, data, start, start+length);