數據倉庫工程師面試經驗(2019)

所有面試的前奏:

先簡要的介紹一下自己!

這句話基本上是所有面試官問的第一個問題,這個問題我的應對策略是:

1. 簡要介紹何時畢業於哪所學校(姓名,籍貫可選擇)
2. 從近往遠介紹開始介紹工作經驗
3. 大廠大項目靠前介紹,其他情況靠後
4. 小項目簡要介紹一兩句話概括
5. 重要介紹和自己面試崗位匹配的項目,並且需要調理分明

後續就是按照你上面介紹的項目具體詢問各種細節問題,下面羅列一下自己遇到的相關面試問題:

一、某團面試問題

  1. 數據分層情況和原因,解決的什麼問題
  2. 數據抽取和同步的方法
  3. join的表中篩選和where中篩選有什麼區別 (謂詞下推)
  4. 範式建模和維度建模的區別,應用場景的區別,優缺點
  5. sql 分組三類函數的區別
  6. 拉鍊表的實現
  7. 手寫計算器java實現
  8. 手寫排序算法(快速排序)
  9. 手寫sql,基本上是實現排序分組去top5的類型,隨意修改要求說出統計思路
  10. linux過濾命令 grep -A / -B 去固定行的上下幾行
  11. hive整個調優過程做了哪些
  12. hive數倉整體架構,實現過程,有哪些問題,是怎樣解決的
  13. 元數據是怎樣管理的? 元數據中都包括了那些數據
  14. mapreduce 執行原理
  15. hive的窗口函數

二、某汽車行業大廠

  1. Hive 和MySQL的區別
  2. 元數據是怎麼應用的
  3. Sql優化都做了哪些?
  4. 分區和分桶具體怎麼實現的?
  5. 解決問題的處理思路和具體問題舉例說明解決過程
  6. 調度框架的運行機制和原理
  7. 數據倉庫整體架構
  8. Hive 支持的底層數據文件類型有哪些
  9. 元數據,技術元數據和業務元數據都包含了哪些?
  10. 元數據怎樣管理
  11. 怎樣保證數據質量
  12. 監控都做了哪些
  13. 怎樣實現歷史拉鍊
  14. IBM範式建模的七大主題是什麼?其中怎樣理解當事人主題
  15. 數據倉庫的容量,日增數據量
  16. 關係型數據庫到hive 效率提升的拐點是什麼?就是多大數據量後關係型數據庫計算效率不如hive

三、其他(上面重複的不在贅述)

  1. 數據表的分組和分塊? 怎樣完成數據的分組,並且在分組後按照一定的維度分塊
  2. 爲什麼要用Hbase 而不用關係型數據庫?
  3. 簡要介紹一下mapreduce執行時的數據流轉

四、必問項(表現不錯的話)

  1. 從上家公司離職的原因
  2. 你的職業規劃
  3. 你對面試官還有什麼想問的嗎?

雖然都說大環境不好,但是工作機會還是有,需要多做準備,還是可以找到心儀的工作的!

發佈了10 篇原創文章 · 獲贊 12 · 訪問量 1897
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章