清晰地介紹自己的項目:數據量、集羣大小、輸入、輸出、功能;
kafka的介紹;
short i=1; i = i+1;有什麼問題;short i=1; i += 1;有什麼問題;類型轉換,具體編譯實現;
java finalize方法,什麼作用;
是否使用過框架,入Spring、Structs等;
大數據平臺的生態圈,瞭解;
設計一個網站全流量鏡像的安全分析平臺,從架構、算法、平臺等方面考慮:
- 注意擴展性、應對流量峯值、系統本身安全;
- 可靠性、穩定性,是否容忍丟消息;
- 架構:實時處理、離線處理、使用開源的框架,
- 算法:機器學習、DPI;
- 接入流量的格式,進行預處理
設計一個日誌分析系統:
- 日誌採集多源、格式等,所以使用類似於flume的;
- 使用消息隊列進行緩衝、解耦;離線分析:
- 存分佈式文件系統,數據庫容錯性、存儲能力、檢索速度等不足,之後Hive查詢;
- 在線分析:Storm、Spark、MapReduce、展示;
- 系統的維護:Zookeeper、Cloudra;
執行一個任務,java線程是不是創建的越多越好?不是,有創建和銷燬的開銷,夠用即可,線程池的原理;
DNS欺騙包的識別:找特徵;
DNS的字段及含義;