所有面試的前奏:
先簡要的介紹一下自己!
這句話基本上是所有面試官問的第一個問題,這個問題我的應對策略是:
1. 簡要介紹何時畢業於哪所學校(姓名,籍貫可選擇)
2. 從近往遠介紹開始介紹工作經驗
3. 大廠大項目靠前介紹,其他情況靠後
4. 小項目簡要介紹一兩句話概括
5. 重要介紹和自己面試崗位匹配的項目,並且需要調理分明
後續就是按照你上面介紹的項目具體詢問各種細節問題,下面羅列一下自己遇到的相關面試問題:
一、某團面試問題
- 數據分層情況和原因,解決的什麼問題
- 數據抽取和同步的方法
- join的表中篩選和where中篩選有什麼區別 (謂詞下推)
- 範式建模和維度建模的區別,應用場景的區別,優缺點
- sql 分組三類函數的區別
- 拉鍊表的實現
- 手寫計算器java實現
- 手寫排序算法(快速排序)
- 手寫sql,基本上是實現排序分組去top5的類型,隨意修改要求說出統計思路
- linux過濾命令 grep -A / -B 去固定行的上下幾行
- hive整個調優過程做了哪些
- hive數倉整體架構,實現過程,有哪些問題,是怎樣解決的
- 元數據是怎樣管理的? 元數據中都包括了那些數據
- mapreduce 執行原理
- hive的窗口函數
二、某汽車行業大廠
- Hive 和MySQL的區別
- 元數據是怎麼應用的
- Sql優化都做了哪些?
- 分區和分桶具體怎麼實現的?
- 解決問題的處理思路和具體問題舉例說明解決過程
- 調度框架的運行機制和原理
- 數據倉庫整體架構
- Hive 支持的底層數據文件類型有哪些
- 元數據,技術元數據和業務元數據都包含了哪些?
- 元數據怎樣管理
- 怎樣保證數據質量
- 監控都做了哪些
- 怎樣實現歷史拉鍊
- IBM範式建模的七大主題是什麼?其中怎樣理解當事人主題
- 數據倉庫的容量,日增數據量
- 關係型數據庫到hive 效率提升的拐點是什麼?就是多大數據量後關係型數據庫計算效率不如hive
三、其他(上面重複的不在贅述)
- 數據表的分組和分塊? 怎樣完成數據的分組,並且在分組後按照一定的維度分塊
- 爲什麼要用Hbase 而不用關係型數據庫?
- 簡要介紹一下mapreduce執行時的數據流轉
四、必問項(表現不錯的話)
- 從上家公司離職的原因
- 你的職業規劃
- 你對面試官還有什麼想問的嗎?
雖然都說大環境不好,但是工作機會還是有,需要多做準備,還是可以找到心儀的工作的!