錯題集錦(一)
標籤(空格分隔): 找工作
靜態動態鏈接庫
靜態鏈接庫的優點
- 代碼裝載速度快,執行速度比動態鏈接庫略快;
- 只需保證在開發者的計算機中有正確的.lib文件,在意位二進制形式發佈程序時不需要考慮在用戶的計算機上是否存在.lib文件及版本問題;
動態鏈接庫的優點
- 節省內存並減少頁面交換;
- DLL文件與EXE文件獨立,只要輸出接口不變,更換DLL文件不會對EXE文件造成任何影響,極大的提高了可擴展性和可維護性;
- 不同編程語言編寫的程序只要按照函數調用約定就可以調用同一個DLL函數;
- 適用於大規模的軟件開發,是開發過程獨立,耦合度小,便於不同開發者和開發組織之間進行開發和測試。
不足
- 靜態鏈接生成的可執行文件體積較大,包含相同的公共代碼,浪費;
- 使用動態鏈接庫的應用程序,它所依賴的DLL模塊也要存在。速度比靜態鏈接慢。存在版本問題。
n個數選出最大m個數(3 < m < n)的最小算法複雜度
相當於topk問題,其最小的算法複雜度爲:O(nlogm)
策略一: 將n個數排序,排序後的前k個數就是最大的k個數,這樣算法複雜度最好爲O(nlogn);
策略二: 使用快排的patition思想,基於數組的第k大的數來調整,將比第k個數小的都放在左邊,比第k個大的數都放在右邊,這樣調整後,位於數組右邊的k個數就是最大的k個數,這樣的算法複雜度爲O(n);
策略三: 先創建一個大小爲m的最小堆,接下來每次從剩下的n-m個數中讀入一個數,如果這個數比最小堆的堆頂元素大,則替換堆頂圓度並調整堆,這樣的算法複雜度爲O(nlogm).
讀取磁盤上多個順序數據塊的效率最高?
- 中斷控制方式以字節爲單位;
- DMA控制方式以一個連續的數據塊爲單位;
- 通道控制方式是DMA控制方式的擴展,以一組數據塊爲單位,即可以連續讀取多個數據塊。
big-endian & little-endian
IBM的PowerPC是big-endian字節序列,是指大端模式 – 高地址存儲數據的低字節;
Intel的X86是little-endian字節序列,是指小段模式 – 低地址存儲數據的低字節。
TCP/IP建立過程的三次握手
- 第一次握手:客戶端向服務器端發送SYN包(syn = 1, seq = x),進入SYN_SEND狀態,等待服務器確認;
- 第二次握手:服務器收到SYN包,確認SYN,此時(syn = 1, ACK = 1, seq = y, ack = x + 1),服務器進入SYN_RCVD狀態;
- 第三次握手:客戶端收到SYN包,發送(ACK = 1, seq = x+1, ack = y+1),雙方進入ESTABLISHED狀態。
C指針相關
1.如題:
int * pint = 0; //將pint指針指向0地址處,指針類型爲int型
pint += 6; //int型每次加1相當於移動四個字節
cout << pint << endl;
以上程序輸入結果爲:4*6 = 24
抽樣總體與樣本
總體是指考察的全體對象;
個體是指總體中的每一個考察對象;
樣本是指總體中所抽取的一部分個體;
– 所以,如下描述:想了解上海市小學生的身高,需要抽取500個樣本,這項調查的樣本是:從中抽取的500名小學生的身高;總體是上海市全部小學生的身高;個體是上海市每個小學生的身高。
數據的左偏、右偏
“偏”可以理解爲哪邊的數據出現的比較少,左偏就是左邊的數據比較少,衆數等出現在均值的右邊。
基尼係數和熵的定義
熵:
基尼係數:
一元線性迴歸相關
相關假設:
1. 隨機誤差項是一個期望值或平均值爲0的隨機變量;
2. 對於解釋變量的所有觀測值,隨機誤差項具有相同的方差;
3. 隨機誤差項彼此不相關;
4. 解釋變量之間不存在精確的線性關係,即解釋變量的樣本觀測值矩陣是滿秩矩陣;
5. 隨機誤差項服從正態分佈。
6. 違背以上基本假設的計量經濟學模型還是可以估計的,只是不能使用普通最小二乘法進行估計。(導致參數估計值雖然是無偏的,但不是最小方差線性無偏估計);
7. 杜賓-瓦特森(DW)健談,是統計分析中常用的一種檢驗序列一階自相關方法。(序列相關性)
多重共線性:
多重共線性(Multicollinearity)是指線性迴歸模型中的解釋變量之間存在精確相關關係或高度相關關係而使模型失真或難以準確估計。
導致:
1. 完全共線性下參數估計量不存在;
2. 近似共線性下OLS估計量失效;
3. 多重共線性使參數估計的方差增大;
相關係數
Pearson相關係數:用於度量兩個變量X和Y之間的線性相關性。
ρX,Y=cov(X,Y)σXσY Spearman相關係數:衡量兩個變量的依賴性的非參數指標。
ρ=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2∑i(yi−y¯)2√
當數據滿足連續數據、正態分佈,線性關係時用Pearson相關係數最合適;
但當其中任何一個條件不滿足時,應該使用Spearman相關係數;
兩個定序數據之間也應該使用Spearman相關性係數。