數據分析/大數據研發面經筆經(阿里/騰訊/網易/招行信用卡中心/小紅書/vivo等)

**個人簡介:**本碩985,本科專業應用數學,碩士專業cs。有一段滴滴數據運營實習,碩士期間做過兩個工業類的項目(異常檢測/關聯分析),發了兩篇水論文(二作)。
**爲什麼投數據分析:**本來第一意向是算法。無奈今年算法崗實在太熱門,美團筆試受挫後覺得選數據分析或許會有更多的機會。


阿里

#####阿里巴巴數據研發工程師(內推,被轉崗數據分析)
**一面:**收到的第一個面試是阿里的內推,8.12網申,做完在線測評差不多一天就接到電話問什麼時間方便麪試。因爲投的是研發,我本人的方向又是機器學習相關的,於是用一天時間複習了ML算法、mapreduce、還看了一些面經。然而沒想到面試官問的問題的是這種畫風:
(1)自我介紹
(2)未來的職業規劃(在這裏我說首選的方向是算法,其次是數據類的,大概率踩雷了orz)
(3)介紹一下以前的工作經歷
(4)介紹一下學校的項目,你覺得你的這些方法在商業領域可以有什麼具體的應用?
(5)你認爲一個公司的經濟指標有哪些?(???)
(6)你認爲一個判斷一個公司有潛力的核心指標有哪些?(聽到這題簡直感覺自己在面商業分析= =)
(7)想在哪個城市工作,爲什麼?
(8)想在什麼行業工作,爲什麼?
(9)期望什麼樣的工作環境?
(10)你有什麼問題問我嗎?
由於全過程都覺得很迷在這裏沒忍住問了面試官這個崗是數據開發嗎…爲什麼都沒有問開發相關的東西…然後他才告知我我被內部轉崗到了數據分析(…),他是天貓BI做數據分析的。後來我又問了數據分析是不是要求熟悉SQL(當時還不會),以及他們的工作裏會不會用到ML相關技術,他的回答都比較官方,說不會的可以學,ML也還是會用到。╮( ̄▽ ̄")╭
面完就感覺涼涼,果然第二天收到了rejected。

**總結:**第一次面試太沒有經驗了…建議大家一開始就要問清自己面的是什麼崗什麼部門(存在轉崗、轉部門可能),回答的時候也一定要圍繞這個職位去說(比如我當時說prefer算法什麼的就很emmm…)


騰訊

#####軟件開發-數據分析
內推的時候選了因爲事業羣選了微信所以一直被泡在池子裏…直到轉正式秋招才收到模擬筆試通知(p.s.騰訊的模擬筆試和筆試是投了簡歷都會收到的,而且秋招的時候之前投的事業羣會沒有參考價值)
**模擬筆試:**題目基本上是春招的原題。具體可參考:
https://blog.csdn.net/Ego_Bai/article/details/79866112
考點包括概率統計、數據結構、排序、ML等等。
**筆試:**待9.16補


網易

#####數據分析師(考拉)
筆試:23道單選+2道簡答,單選各3分,簡答各10分。
部分單選
(1)從(0,1)不經對角線走到(m,n)(m小於n)的方法數?
(2)關係數據模型的三要素?
(3)E-R模型的說法正確的是?
(4)兩個袋子,4種顏色的球,一邊40個一邊36個(各色個數相等),拿出後不放回,什麼時候拿出的球裏至少有12個同色?
(5)神經網絡中什麼方式無法避免過擬合?
(6)SVM、logistic迴歸、決策樹、隨機森林裏對中小型數據集分類精度最高的是?
(7)sql查詢語句的正確性?
(8)sql查詢什麼情況下可以正確使用組合索引?
(9)本福特定律的別名?
(10)10人投票,其中7人贊成,3人反對,全程贊成數一直比反對數多的概率是?
(11)ABCD4個人,甲乙丙丁4件工作,A不做甲乙,B不做乙丙,C不做丙丁,問安排的方法數?
(12)X和Y均服從[0,1]上的均勻分佈,X2+Y2<=1的概率?
(13)一個去開會。遇到另外6人每人各12次,其中每2各6次,每3人各4次,每4人各3次,每5人各2次,每6人各1次,1人也沒遇見的有5次,問他共參加幾次會議?
(14)RGB三種顏色鋪地磚(每個可鋪1x1)。R只能在R的總數目是偶數的情況使用,問1x6地磚的鋪法?
(15)真人臉圖片檢測到人臉的概率是0.9,非人臉圖片檢測到的概率是0.01,已知真人臉與非真人臉圖片比例爲2:8,則一張真人臉圖片檢測到人臉的概率是?
(16)pearson相關係數的判斷?
(17)e100在使用泰勒展開計算的時候可以採用哪種拆分?99+1?Kln2+100?1010?0.1+99.9?
(18)一個班48人,上學坐公交的40人,放學坐公交的34人,上學放學都坐的人有30人,則上學放學都不坐的人數是?
簡答
(1)什麼是關聯分析?代表算法有哪些?請寫出其中一種的中心思想與具體步驟
(2)你會從哪些方面對已結束的黑五活動進行復盤?
**總結:**個人覺得網易的筆試題出得挺好的,涵蓋了概率、統計、sql、ML、業務等等,比起騰訊算法技術層面的難度低一些。


招行信用卡中心

#####數據分析類(APP運營方向,內推)
招行的筆試基本全是行測題…還有7 800字選一個結論的推斷,真的無聊死了(捂臉)


迅雷

#####大數據分析工程師
筆試:26道單選+16道多選,單選各2分,多選各3分。
部分單選
(1)hive裏sql執行計劃怎麼看?show?explain?list?describe?
(2)sql裏limit語句有map嗎?有reduce嗎?
(3)三張表,問其中一個的關鍵碼?
(4)linux怎麼切換到用戶主目錄?
(5)linux刪除命令?
(6)man 5 passwd 的含義?
(7)gzip bizp2 compress的壓縮效率排序?
(8)secondnamenode的作用?
(9)n=5的漢諾塔的移動次數?
(10)升級和不升級的概率的概率都是1/2,5級以上時若不升級則會降級,則一個人從1級升到8級的次數的期望是?
(11)sql中alter通常不能修改?
(12)sql給定表中各列的類型,選擇可以插入的內容爲?
(13)HDFS中block size默認的大小是?
(14)上述的默認大小可以修改嗎?
(15)-rwxrw-r-,則其他用戶對文件的權限是?
(16)INSTR(‘TUTORIALS POINT’,‘P’)的結果是?
(17)一個樣本需要在多個變量上進行描述,用什麼圖表示最好?
(18)描述數據波動的統計量是?
(19)分區、並行查詢、視圖、索引哪個不能提高查詢效率?
(20)兩條命令同時執行,1條需要1min執行,另一條需要3min,則從開始到第二條執行完過去了多久?
(21)一個二叉樹,給定前序中序,後序爲?
部分多選
(1)缺失值的處理辦法?
(2)RDBMS的判定?
(3)A1A2A3A4A5不可能的出棧順序?
(4)sql運算傾斜的解決方法?
(5)對數據庫的描述不正確的是?
(6)對hive分區描述不正確的是?
(7)算法的結構包括哪些:遞歸、條件、順序?循環?
(8)刪除表中所有數據的錯誤語句(truncate、drop、delete)?
(9)hadoop的模式?
(10)對某一商品取名的業務參考指標?
(11)視圖的說法正確的是?
(12)shell中$2的含義?
(13)shell中a+b的方法?
(14)假設檢驗的步驟?
(15)parse_url可以獲取的參數?
(16)hadoop中client上傳過程的描述?
**總結:**迅雷主要涉及三部分:linux、數據庫、mapreduce,還有少量的統計、算法。(linux和mapreduce我全靠蒙呵呵噠)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章