數組中第K大元素

在面試的時候遇到過這個問題，後來在leetcode上也遇到了這個問題，於是記錄下來以便以後快速回憶。

題目有多種思路，全排序是比較直觀的想法，然而最低的時間複雜度爲O(nlgn),並且不符合該題目的初衷。

題目更多想問的是如何在不進行全排序的條件下找到數組中第K大的元素，個人認爲比較被面試官中意的解答有兩個(理應也有其他的..)，如下：

構建最大堆

簡單分析時間複雜度: 構建堆的時間O(n)，k次取最大元素要k(lgn),最終的時間複雜度爲O(n+klgn).

顯然是比全排序要好一些，但是當時面試的時候我回答這個思路，面試官認爲並不是一個好的思路，因爲面試官認爲構建最大堆更適合題目：求數組中前K大的元素(維護一個大小爲K的最大堆).
然而我還是認爲這是一個可以的思路…..恩，代碼還是貼一下，以後就省事了..

   int heap_size;
   int parent(int idx) {
        return (idx - 1) >> 1; //求父節點
    }
   int left(int idx) {
        return (idx << 1) + 1;//左子樹
    }
   int right(int idx) {
        return (idx << 1) + 2;//右子樹
    }

   void max_heapify(vector<int>& nums, int idx) {
        int largest = idx;
        int l = left(idx), r = right(idx);
        if (l < heap_size && nums[l] > nums[largest]) largest = l;
        if (r < heap_size && nums[r] > nums[largest]) largest = r;
        if (largest != idx) {
            swap(nums[idx], nums[largest]);
            max_heapify(nums, largest);
        }
     }
    //構建最大堆，從非葉子節點開始操作,可證明時間複雜度是O(n)
    void build_max_heap(vector<int>& nums) {
        heap_size = nums.size();
        for (int i = (heap_size >> 1) - 1; i >= 0; i--)
            max_heapify(nums, i);
    }

    int findKthLargest(vector<int>& nums, int k) {
        build_max_heap(nums);
        for (int i = 0; i < k; i++) {
            swap(nums[0], nums[heap_size - 1]);
            heap_size--;
            max_heapify(nums, 0);
        }//不斷交換末尾元素和最大元素，之後重新max_heapify
        return nums[heap_size];
    }

快速排序思路

該思想類似快速排序：

以某一個元素爲pivot元素，將元素分爲兩個集合，一個集合元素比pivot小，另一個比pivot大。
若比pivot大的元素數目正好爲k-1，那麼pivot就是我們要找到元素；若比pivot大的元素爲m(小於k), 那麼就在比pivot小的集合裏面找第(k-m)大的元素; 若是比pivot大的元素爲m(大於k)，那就繼續在該集合裏面找第k大的元素。
重複上面步驟，直到找到第k大的元素

代碼如下：

int partition(vector<int>& nums, int i, int j)
    {//類似快速排序的分組
        if (i == j) return i;

        int pivot = nums[i];
        std::swap(nums[i], nums[j]);

        int i0 = i;
        for(int k = i; k < j; k ++)
        {
            if(nums[k] <= pivot)
            {
                std::swap(nums[k], nums[i0 ++]);
            }
        }
        std::swap(nums[i0], nums[j]);
        return i0;
    }

    int findKthEle(vector<int>& nums, int i, int j,int k)
    {
        int index = partition(nums,i,j);
        int length = j-index+1;
        if(length == k)
            return nums[index];
        else if(length > k)
            return findKthEle(nums,index+1,j,k);
        else if(length <k)
            return findKthEle(nums,i,index-1,k-length);
    }

    int findKthLargest(vector<int>& nums, int k) 
    {
        size_t len = nums.size();

        return findKthEle(nums,0,len-1,k);
    }

時間複雜度：
該算法的平均時間複雜度爲O(N)（詳細的推導過程看算法導論9.2節）,最壞情況爲N^2，即每次劃分把數組變爲爲（n-1）和1的兩斷。

同時算法導論上有關於O(n)的算法(9.3節)，其思路是選擇pivot元素時是通過選擇多組元素中的中位數，根據這個元素來劃分，能夠得到最壞情況爲線性時間的選擇算法（具體推導我還真是吃不消）。

看了算法導論以及網上相關的博客，發現這是個經典的老題目了…然而我並沒有研究的非常透徹…

zhaoyunfullmetal

發佈了42 篇原創文章 · 獲贊 32 · 訪問量 8萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

數組中第K大元素

數組中第K大元素

構建最大堆

快速排序思路

詐騙（殺豬盤）網站進行滲透測試

Python 潮流週刊#50：我最喜歡的 Python 3.13 新特性！

【Python】保存gym截圖

【譯】使用 GitHub Copilot 作爲你的編碼 GPS

Linux 服務器配置-安裝portainer-ce社區版

外行也能讀懂的網絡硬件設備功能原理速成

安裝Auto-GPT

Leetcode : Regular Expression Matching

編程珠璣——快速排序總結

BigInteger類實例的構造過程——JDK源碼解析

二叉樹的遍歷

窗口有關算法題目

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結