筆試題及解釋

騰訊筆試題：const的含義及實現機制

const的含義及實現機制，比如：const int i,是怎麼做到i只可讀的？

const用來說明所定義的變量是隻讀的。

這些在編譯期間完成，編譯器可能使用常數直接替換掉對此變量的引用。

更多閱讀：

http://www.2cto.com/kf/200912/43500.html

初探編譯器static、const之實現原理

騰訊筆試題：買200返100優惠券，實際上折扣是多少？

到商店裏買200的商品返還100優惠券（可以在本商店代替現金）。請問實際上折扣是多少？

由於優惠券可以代替現金，所以可以使用200元優惠券買東西，然後還可以獲得100元的優惠券。

假設開始時花了x元，那麼可以買到 x + x/2 + x/4 + ...的東西。所以實際上折扣是50%.（當然，大部分時候很難一直兌換下去，所以50%是折扣的上限）

如果使用優惠券買東西不能獲得新的優惠券，那麼

總過花去了200元，可以買到200+100元的商品，所以實際折扣爲 200/300 = 67%.

騰訊筆試題：tcp三次握手的過程，accept發生在三次握手哪個階段？

accept發生在三次握手之後。

第一次握手：客戶端發送syn包(syn=j)到服務器。

第二次握手：服務器收到syn包，必須確認客戶的SYN（ack=j+1），同時自己也發送一個ASK包（ask=k）。

第三次握手：客戶端收到服務器的SYN＋ACK包，向服務器發送確認包ACK(ack=k+1)。

三次握手完成後，客戶端和服務器就建立了tcp連接。這時可以調用accept函數獲得此連接。

騰訊筆試題：用UDP協議通訊時怎樣得知目標機是否獲得了數據包

用UDP協議通訊時怎樣得知目標機是否獲得了數據包？

可以在每個數據包中插入一個唯一的ID，比如timestamp或者遞增的int。

發送方在發送數據時將此ID和發送時間記錄在本地。

接收方在收到數據後將ID再發給發送方作爲迴應。

發送方如果收到迴應，則知道接收方已經收到相應的數據包；如果在指定時間內沒有收到迴應，則數據包可能丟失，需要重複上面的過程重新發送一次，直到確定對方收到。

騰訊筆試題：統計論壇在線人數分佈

求一個論壇的在線人數，假設有一個論壇，其註冊ID有兩億個，每個ID從登陸到退出會向一個日誌文件中記下登陸時間和退出時間，要求寫一個算法統計一天中論壇的用戶在線分佈，取樣粒度爲秒。

一天總共有 3600*24 = 86400秒。

定義一個長度爲86400的整數數組int delta[86400]，每個整數對應這一秒的人數變化值，可能爲正也可能爲負。開始時將數組元素都初始化爲0。

然後依次讀入每個用戶的登錄時間和退出時間，將與登錄時間對應的整數值加1，將與退出時間對應的整數值減1。

這樣處理一遍後數組中存儲了每秒中的人數變化情況。

定義另外一個長度爲86400的整數數組int online_num[86400]，每個整數對應這一秒的論壇在線人數。

假設一天開始時論壇在線人數爲0，則第1秒的人數online_num[0] = delta[0]。第n+1秒的人數online_num[n] = online_num[n-1] + delta[n]。

這樣我們就獲得了一天中任意時間的在線人數。

騰訊筆試題：從10G個數中找到中數

在一個文件中有 10G 個整數，亂序排列，要求找出中位數。內存限制爲 2G。

不妨假設10G個整數是64bit的。

2G內存可以存放256M個64bit整數。

我們可以將64bit的整數空間平均分成256M個取值範圍，用2G的內存對每個取值範圍內出現整數個數進行統計。這樣遍歷一邊10G整數後，我們便知道中數在那個範圍內出現，以及這個範圍內總共出現了多少個整數。

如果中數所在範圍出現的整數比較少，我們就可以對這個範圍內的整數進行排序，找到中數。如果這個範圍內出現的整數比較多，我們還可以採用同樣的方法將此範圍再次分成多個更小的範圍（256M=2^28，所以最多需要3次就可以將此範圍縮小到1，也就找到了中數）。

騰訊筆試題：兩個整數集合A和B，求其交集

兩個整數集合A和B，求其交集。

1. 讀取整數集合A中的整數，將讀到的整數插入到map中，並將對應的值設爲1。

2. 讀取整數集合B中的整數，如果該整數在map中並且值爲1，則將此數加入到交集當中，並將在map中的對應值改爲2。

通過更改map中的值，避免了將同樣的值輸出兩次。

騰訊筆試題：找出1到10w中沒有出現的兩個數字

有1到10w這10w個數，去除2個並打亂次序，如何找出那兩個數？

申請10w個bit的空間，每個bit代表一個數字是否出現過。

開始時將這10w個bit都初始化爲0，表示所有數字都沒有出現過。

然後依次讀入已經打亂循序的數字，並將對應的bit設爲1。

當處理完所有數字後，根據爲0的bit得出沒有出現的數字。

首先計算1到10w的和，平方和。

然後計算給定數字的和，平方和。

兩次的到的數字相減，可以得到這兩個數字的和，平方和。

所以我們有

x + y = n

x^2 + y^2 = m

解方程可以得到x和y的值。

騰訊筆試題：需要多少隻小白鼠才能在24小時內找到毒藥

有1000瓶水，其中有一瓶有毒，小白鼠只要嘗一點帶毒的水24小時後就會死亡，至少要多少隻小白鼠才能在24小時時鑑別出那瓶水有毒？

最容易想到的就是用1000只小白鼠，每隻喝一瓶。但顯然這不是最好答案。

既然每隻小白鼠喝一瓶不是最好答案，那就應該每隻小白鼠喝多瓶。那每隻應該喝多少瓶呢？

首先讓我們換種問法，如果有x只小白鼠，那麼24小時內可以從多少瓶水中找出那瓶有毒的？

由於每隻小白鼠都只有死或者活這兩種結果，所以x只小白鼠最大可以表示2^x種結果。如果讓每種結果都對應到某瓶水有毒，那麼也就可以從2^x瓶水中找到有毒的那瓶水。那如何來實現這種對應關係呢？

第一隻小白鼠喝第1到2^(x-1)瓶，第二隻小白鼠喝第1到第2^(x-2)和第2^(x-1)+1到第2^(x-1) + 2^(x-2)瓶....以此類推。

回到此題，總過1000瓶水，所以需要最少10只小白鼠。

騰訊筆試題：根據上排的數填寫下排的數，並滿足要求。

根據上排給出十個數，在其下排填出對應的十個數, 要求下排每個數都是上排對應位置的數在下排出現的次數。上排的數：0，1，2，3，4，5，6，7，8，9。

解答: http://blog.csdn.net/heaven13483/article/details/7925621

騰訊筆試題：判斷數字是否出現在40億個數中？

給40億個不重複的unsigned int的整數，沒排過序的，然後再給幾個數，如何快速判斷這幾個數是否在那40億個數當中?

答案：

unsigned int 的取值範圍是0到2^32-1。我們可以申請連續的2^32/8=512M的內存，用每一個bit對應一個unsigned int數字。首先將512M內存都初始化爲0，然後每處理一個數字就將其對應的bit設置爲1。當需要查詢時，直接找到對應bit，看其值是0還是1即可。

原文鏈接1,感謝原作者

1.C++模板的作用。

將算法與具體對象分離，與類型無關，通用，節省精力

2.socket編程，如果client斷電了，服務器如何快速知道？？？

有以下幾個技術：

使用定時器（適合有數據流動的情況）；使用socket選項SO_KEEPALIVE（適合沒有數據流動的情況）;

3.fork()一子進程程後父進程癿全局變量能不能使用？？？

fork後子進程將會擁有父進程的幾乎一切資源，父子進程的都各自有自己的全局變量。不能通用，不同於線程。對於線程，各個線程共享全局變量。

4.4G的long型整數中找到一個最大的，如何做？？？？

我的想法是要找到最大的肯定要遍歷所有的數的，而且不能將數據全部讀入內存，可能不足。算法的時間複雜度肯定是O（n）

感覺就是遍歷，比較。。。。還能怎麼改進呢？？？？

可以改進的地方，就是讀入內存的時候，一次多讀些。。。。

需要注意的就是每次從磁盤上儘量多讀一些數到內存區，然後處理完之後再讀入一批。減少IO次數，自然能夠提高效率。而對於類快速排序方法，稍微要麻煩一些：分批讀入，假設是M個數，然後從這M個數中選出n個最大的數緩存起來，直到所有的N個數都分批處理完之後，再將各批次緩存的n個數合併起來再進行一次類快速排序得到最終的n個最大的數就可以了。在運行過程中，如果緩存數太多，可以不斷地將多個緩存合併，保留這些緩存中最大的n個數即可。由於類快速排序的時間複雜度是O（N），這樣分批處理再合併的辦法，依然有極大的可能會比堆和敗者樹更優。當然，在空間上會佔用較多的內存。

此題還有個變種，就是尋找K個最大或者最小的數。有以下幾種算法：

容量爲K的最大堆/最小堆，假設K可以裝入內存；

如果N個數可以裝入內存，且都小於MAX，那麼可以開闢一個MAX大的數組，類似計數排序。。。從數組尾部掃描K個最大的數，頭部掃描K個最小的數。

5.有千萬個string在內存怎麼高速查找，插入和刪除？？？

對千萬個string做hash，可以實現高速查找，找到了，插入和刪除就很方便了。

關鍵是如何做hash，對string做hash，要減少碰撞頻率。

在實際中，BKDRhash函數比較好

// BKDR Hash
unsigned int BKDRHash(char *str) 
{   unsigned int seed = 131; // 31 131 1313 13131 131313 etc..
    unsigned inthash = 0;   
    while (*str)
    {
       hash = hash * seed + (*str++); 
    }   
    return (hash & 0x7FFFFFFF);
 }

6.tcp三次握手的過程，accept發生在三次握手哪個階段？

三次握手：C----->SYN K

              S------>ACK K+1 SYN J

              C------->ACK J+1

              DONE!

client 的 connect  引起3次握手

server 在socket， bind， listen後，阻塞在accept，三次握手完成後，accept返回一個fd，

因此accept發生在三次握手之後。。。。。。

7.Tcp流， udp的數據報，之間有什麼區別，爲什麼TCP要叫做數據流？

TCP本身是面向連接的協議，S和C之間要使用TCP，必須先建立連接，數據就在該連接上流動，可以是雙向的，沒有邊界。所以叫數據流 ，佔系統資源多

UDP不是面向連接的，不存在建立連接，釋放連接，每個數據包都是獨立的包，有邊界，一般不會合並。

TCP保證數據正確性，UDP可能丟包，TCP保證數據順序，UDP不保證

8.

const的含義及實現機制，比如：const int i,是怎麼做到i只可讀的？

const指示對象爲常量，只讀。

實現機制：這些在編譯期間完成，對於內置類型，如int， 編譯器可能使用常數直接替換掉對此變量的引用。而對於結構體不一定。

看下面的例子：

const int j=100; int *p=const_cast<int*>(&j); *p=200; cout<<j<<endl; 輸出爲什麼是100呢？

cout<<*p<<endl; //輸出是改過的200

編譯器在優化代碼時把cout<<j直接優化成cout<<100了，所以雖然p和&j的值一樣，但cout<<j不再通過訪問j的地址輸出。（反彙編時也有看到直接把數字壓棧push 100 ）

這是因爲，const型在壓棧時，是使用的直接的數，就有點像C的#define a 100

對於非系統缺省類型，系統不知道怎麼去直接替換，因此必須佔據內存。

#include <iostream> using namespace std; struct A { int i; char ch; A() { i = 100; ch = 'S'; } }; int main() { const A a; const int i = 200; int *p1 = (int*)&a.i; int *p2 = (int*)&i; *p1 = 1; *p2 = 2; // a.i = 200; //報錯，左值不能爲const cout << a.i << " " << a.ch << endl; cout << i << endl; return 0; }

運行結果：

1 S 200

9.volatile的含義。

變量可能在編譯器的控制或監控之外改變，告訴編譯器不要優化該變量，如被系統時鐘更新的變量。

10.OFFSETOF(s, m)的宏定義，s是結構類型，m是s的成員，求m在s中的偏移量。

#define OFFSETOF（s, m） size_t（&((s*)0)->m）

11.100億個數，求最大的1萬個數，並說出算法的時間複雜度。

用小根堆來實現。注意是小根堆，

讀入1萬個數，然後做

時間複雜度是O（NlogK）

12.設計一個洗牌的算法，並說出算法的時間複雜度。

第一種： for i:=1 to n do swap(a[i], a[random(1,n)]);  // 湊合，但不是真正隨機

第二種： for i:=1 to n do swap(a[i], a[random(i,n)]);   // 真正的隨機算法
其中，random(a,b)函數用於返回一個從a到b（包括a和b）的隨機整數。

至於怎麼證明上兩個算法，沒想好。

算法複雜度是O（n。。。），要研究下random的實現。

13.socket在什麼情況下可讀?

1. 接收緩衝區有數據，一定可讀
2. 對方正常關閉socket，也是可讀
3. 對於偵聽socket，有新連接到達也可讀

4.socket有錯誤發生，且pending～～～

引用unp的一段話 第六章 6.3節   
A socket is ready for reading if any of the following four conditions is true:
a. The number of bytes of data in the socket receive buffer is greater than or 
     equal to the current size of the low-water mark for the socket receive buffer.
     A read operation on the socket will not block and will return a value greater than 0
b.  The read half of the connections is closed (i.e., A TCP connection that has received a FIN).
     A read operation on the socket will not block and will return 0 (i.e., EOF)
c. The socket is a listening socket and the number of completed connection is nonzero. 
    An accept on the listening socket will normally not block, although we will describe a   
d. A socket error is pending. A read operation on the socket will not block and will return
    an error (-1) with errno set to the specific error condition

14.流量控制與擁塞控制的區別，節點計算機怎樣感知網絡擁塞了？？？

擁塞控制是把整體看成一個處理對象的，流量控制是對單個的節點。

感知的手段應該不少，比如在TCP協議裏，TCP報文的重傳本身就可以作爲擁塞的依據。依據這樣的原理， 應該可以設計出很多手段。

15.C++虛函數是如何實現的？？？

使用虛函數表。 C++對象使用虛表， 如果是基類的實例，對應位置存放的是基類的函數指針；如果是繼承類，對應位置存放的是繼承類的函數指針（如果在繼承類有實現）。所以 ，當使用基類指針調用對象方法時，也會根據具體的實例，調用到繼承類的方法。

16.C++的虛函數有什麼作用？ ？？

虛函數作用是實現多態，

更重要的，虛函數其實是實現封裝，使得使用者不需要關心實現的細節。

在很多設計模式中都是這樣用法，例如Factory、Bridge、Strategy模式。

17. 非阻塞connect（）如何實現？ ？？

將socket設置成non-blocking，操作方法同非阻塞read()、write();

18. 以下代碼輸出結果：

#include <stdio.h>
#include <unistd.h>
int main(void)
{
printf("call execl"); 
sleep(1); 
execl("/bin/sh", "", NULL); 
printf("error!\n");
}

本題考標準IO緩衝，標準出錯是不帶緩緩衝的。

如若是涉及終端設備的其他流，則他們是行緩衝的；否則是全緩衝的。

printf是標準IO的一個，格式化打印到標準輸出，在這裏是行緩衝，那麼沒有遇到換行符也就是‘\n’或者沒有強制flush, 則不會輸出。

execl是創建新的可執行程序映像，一旦成功就不會返回了，只有在出錯的情況會返回1.

所以以上的程序沒有打印printf的內容，直接執行/bin/sh，輸出爲

若是代碼改爲以下：

#include <stdio.h>

#include <unistd.h>

int main(int argc, char *argv[])

{

printf("call execl\n");

/*fprintf(stderr, "%s", "call execl");*/

sleep(1);

execl("/bin/sh", "", NULL);

printf("error!\n");

return 0;

}

則輸出爲：

call execl

若改爲：

#include <stdio.h>

#include <unistd.h>

int main(int argc, char *argv[])

{

/*printf("call execl\n");*/

fprintf(stderr, "%s", "call execl"); // 標準錯誤，不緩衝

sleep(1);

execl("/bin/sh", "", NULL);

printf("error!\n");

return 0;

}

則輸出爲：

call execl$

若改爲：

#include <stdio.h>

#include <unistd.h>

int main(int argc, char *argv[])

{

/*printf("call execl\n");*/

fprintf(stdout, "%s", "call execl"); // stdout行緩衝

sleep(1);

execl("/bin/sh", "", NULL);

printf("error!\n");

return 0;

}

則輸出爲

19. TCP通訊中，select到讀事件，但是讀到的數據量是0，爲什麼，如何解決????

select 返回0代表超時。select出錯返回-1。

select到讀事件，但是讀到的數據量爲0，說明對方已經關閉了socket的讀端。本端關閉讀即可。

當select出錯時，會將接口置爲可讀又可寫。這時就要通過判斷select的返回值爲-1來區分。

20. 給出float與“零值”比較的 if 語句（假設變量名爲var）？？？

const float EPSINON = 0.00001;
if ((x >= - EPSINON) && (x <= EPSINON)

浮點數在內存中的存貯機制和整型數不同，有舍入誤差，在計算機中用以近似表示任意某個實數。具體的說，這個實數由一個整數或定點數（即尾數）乘以某個基數（計算機中通常是2）的整數次冪得到，這種表示方法類似於基數爲10的科學記數法。
所以浮點數在運算過成功運算通常伴隨着因爲無法精確表示而進行的近似或舍入。但是這種設計的好處是可以在固定的長度上存儲更大範圍的數。
例如，一個指數範圍爲±4的4位十進制浮點數可以用來表示43210，4.321或0.0004321，但是沒有足夠的精度來表示432.123和43212.3（必須近似爲432.1和43210）。當然，實際使用的位數通常遠大於4。
  所以浮點數不能夠判斷相等，像 if(x==0)的這樣的編碼是不總是正確的，我們在判斷浮點數相等時，推薦用範圍來確定，若x在某一範圍內，我們就認爲相等，至於範圍怎麼定義，要看實際情況而已了，float,和double 各有不同
所以const float EPSINON = 0.00001;
if ((x >= - EPSINON) && (x <= EPSINON) 這樣判斷是可取的
至於爲什麼取0.00001，可以自己按實際情況定義

原文鏈接2,感謝原作者

筆試題及解釋

Wireshark 安裝+使用（一）

linux_shell讀文件，然後排序

讓你對sizeof()另眼想看

c++按行讀取寫入文件

c++容器

linux bash shell中，單引號、雙引號，反引號（``）的區別及各種括號的區別

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結