題目鏈接 http://hihocoder.com/problemset/problem/1483
題意
給定n個數A1…An,小Ho想了解AL..AR中有多少對元素值相同。小Ho把這個數目定義爲區間[L,R]的價值,用v[L,R]表示。
例如1 1 1 2 2這五個數所組成的區間的價值爲4。
現在小Ho想知道在所有的的v[L,R](1 <= L <= R <= n)中,第k小的值是多少。
輸入
第一行一個數T(T<=10),表示數據組數。
對於每一組數據:
第一行兩個數n,k(1<=n<=200,000,1<=k<=n*(n+1)/2)
第二行n個數A1…An(1<=Ai<=1,000,000,000)
輸出
一個數表示答案。
大體思路
對於直接求出第k個大小的數顯然時間複雜度會非常高,那麼就將問題轉化一下;
首先,在最理想的情況下,n個數都相同,也就是說,在這種情況下,取區間【1,n】的時候,可以得到最大的價值n*(n-1)/2;
而最小的價值就可以取單點區間(題目說L<=R,也就是可以只取一個點);
那麼就可以得知,n個數,它的所有區間的價值都在【0,n*(n-1)/2】這個區間裏;
而對於一個區間【L,R】來說,假如這個區間的價值大於S,那麼,區間【L,R+1】直到【L,N】這些區間的價值都必定是大於S的;
也就是說,我們可以通過尺取法(時間複雜度O(n))來求出區間的價值大於S的區間的數量;
然後,總區間的個數是n(n+1)/2;
這樣我們就可以得出區間價值小於等於S的區間的數量的
然後我們設NUM【S】表示區間價值小於等於S的區間的數量,
那麼若是存在一個S,使得NUM【S】
#include <bits/stdc++.h>
using namespace std;
typedef long long LL;
int road[200005];
int hsh[200005];
LL query(LL n,LL cnt)
{
memset(hsh,0,sizeof(hsh));
int l=0;
int r=0;
LL res=0;
LL gg=0;
while(r<n)
{
gg+=hsh[road[r]];
hsh[road[r]]++;
if(gg>cnt)
{
res+=n-r;
while(l<r)
{
hsh[road[l]]--;
gg-=hsh[road[l]];
l++;
if(gg>cnt)
{
res+=n-r;
}
else
{
break;
}
}
}
r++;
}
return res;
}
int main()
{
int T;
cin>>T;
while(T--)
{
LL n,k;
cin>>n>>k;
for(int i=0 ; i<n ; i++)
{
cin>>road[i];
}
map<int,int> mp;
int cnt=1;
for(int i=0 ; i<n ; i++)
{
if(mp[road[i]]==0)
{
mp[road[i]]=cnt++;
}
road[i]=mp[road[i]];
}
LL l=0;
LL r=n*(n-1)/2;
LL total=n*(n+1)/2;
while(l<=r)
{
LL m=(l+r)>>1;
LL val=query(n,m);
if(k<=total-val)
{
r=m-1;
}
else
{
l=m+1;
}
}
cout<<l<<endl;
}
return 0;
}