最近幾天一直被poj上的一個題目困擾着,倒不是問題有多難,而是老是超時,而且超時不打緊,要命的是程序的主要耗時程序爲排序部分,自己寫的如下快速排序代碼:
void swap(int *num1, int *num2)
{
int temp = *num1;
*num1 = *num2;
*num2 = temp;
}
int partition(int num[], int begin,int end)
{
while(begin<end)
{
while(begin<end && num[begin]<=num[end])
--end;
if(begin<end)
swap(&num[begin],&num[end]);
while(begin<end && num[begin]<=num[end])
++begin;
if(begin<end)
swap(&num[begin],&num[end]);
}
return begin;
}
void sort(int num[],int begin,int end)
{
if(begin<end)
{
int mid = partition(num,begin,end);
sort(num,begin,mid-1);
sort(num,mid+1,end);
}
}
用了上面屬於教科書上的代碼,提交,顯示超時,只能對快排繼續改進,由於在快速排序使用較多的函數是swap和partition,而partition使用了值傳遞,於是將程序改成了下面的代碼:
void sort(int num[],int begin,int end)
{
int i = begin;
int j = end;
if(begin<end)
{
while(begin<end)
{
while(begin<end && num[begin]<=num[end])
--end;
if(begin<end)
{
int tmp = num[begin];
num[begin] = num[end];
num[end] =tmp;
}
while(begin<end && num[begin]<=num[end])
++begin;
if(begin<end)
{
int tmp = num[begin];
num[begin] = num[end];
num[end] =tmp;
}
}
sort(num,i,begin-1);
sort(num,begin+1,j);
}
}
再次提交,結果顯示AC。顯示時間爲485ms。但是重複提交有時會顯示超時。於是我再次使用algorithm命名空間下的sort方法,其聲明如下
template <class RandomAccessIterator>
void
sort(RandomAccessIterator first, RandomAccessIterator last);
再次提交,結果顯示AC,時間顯示爲463ms,可以看到庫下面的排序要比我自己寫的還是要快不少,而且是一直AC。爲什麼後者要比前者快呢?
網上分析的原因有:
std::sort使用的算法在大多數情況下都比quick sort算法要快,並且,在quick sort越慢的情況下越明顯。Quick sort 平均情況下爲O( NlogN ) ,在最壞情況下爲 O (N^2)。 而std::sort是針對Quick sort最壞情況做的改進,從而保持了 O(NlogN) 的複雜度。但是,對適合quick sort的情況下,std::sort的改進沒有起作用,反而多做了一些操作,就比quick sort慢了。
所以測試數據對於這兩種算法的比較有很大影響。
std::sort使用的算法有些忘記了,好象是這樣的:先遞歸使用quick sort的某個版本(主要是參照值的選擇方案,用了三點選中);當長度較小時(如<20),改用另一種算法(名字忘了,它在長度較短且比較接近排序完成時比quick sort更快,這個條件正好符合此時的情形);而當性能向 O(N^2) 趨近時,改用heap sort。
看來自己寫的快速排序確實是受測試數據的影響,在測試數據爲倒序時,其時間複雜度爲O(n^2)了,而std:sort的算法更加靈活,不受測試數據的影響,所以最終會比自己寫的要快。