華爲數據分析師技術面試

華爲數據分析師技術面試感受

前言

年末華爲的各個部門好像都在招人。筆者收到了個面試邀請,是數據分析師的。好像只有三個步驟,投遞簡歷,技術面試,業務面試。就其中可能是大家最想知道的技術面試和大家分享一下。

正文

首先面試的形式是電話面試,時間大概是35分鐘鬼知道我這麼能聊)。

首先是先寒暄了幾句。問了我現在在哪個城市,然後強調了一下是籤德科,這是招聘的基礎。目前社招的17級及以下的都是走德科哈。至於德科和華爲的關係,建議大家自行百度。(當然之後我如果簽了,我肯定也會分享出來這方面的感受)

然後說進行技術面試,先自我介紹
我:“XXXX”(大概三分鐘)

接着是詢問你簡歷裏的和數據分析的項目
因爲我的工作是做圖像識別,而且公司做圖像的只有我一個。所以這方面的所有步驟我都很清楚,而這個又是和數據分析能扯到關係的。所以回答的算是很不錯。

再然後就是問數據分析的問題,猜測應該是考察對數據分析的瞭解的。建議瞭解下數據預處理和相關算法。
問題有
1.如何去衡量一個模型是一個好模型。
我:“如何衡量一個模型的好壞應該有五點,準確率,速度,強壯型,可規模性,可解釋性。然後就這五點我都舉了各自的例子”

2.如何去優化一個模型。
我:“模型的優化,還是要看你對模型的哪一點不滿意。你要是對準確性不滿意,那麼可以嘗試把多個弱分類器組成一個強分類器;對速度不滿意,可以import numba,然後在函數前面加@jit;對別的不滿意就針對性的去改就好。。。XXX說了一堆”

3.如何提高模型的準確性。
我就舉了些別人的經驗,之前網上看的kaggle一些大神的經驗分享,這時候就派上了用場。沒喫過豬肉,但我見過豬跑啊。別人的名人名言,從我嘴裏出來,那就是我的了。

4.過大的數據的準確度要怎麼提高。
說實話,這個我就不知道了,完全不知道。我回答是“您提到了以億級別的數據量,我第一個考慮到的就是時間問題。”我先打了一下擦邊球,然後說了不太清楚。

5.你處理的最大的數據量是什麼級別的,百萬的?千萬的?億?十億?
。。。。。。不好意思,最高就十萬(TAT)

6.你做圖像處理的時候,如何防止處理過程中的丟失數據對結果的影響?
說到了圖像,瞬間我就可以舉一反三。從圖像金字塔扯到深度學習裏的池化層。歸根到底,應該就是具有特徵的數據不丟就行。

7.你覺得你已經有了很大的訓練數據,這時候又有了些新的數據,你覺得這些新的數據對你是否有用。
我先回答的是要看這些數據是否具有我需要的特徵,然後我再做決定。然後我又改了下我的回答,改成了有用。我會把這些數據給放到我的測試集裏去。也不知道我回答的對不對。

8.你有沒有用過python做過一些爬蟲類的項目?
答“沒有,但我用python做過按鍵精靈。Python 實現按鍵精靈的功能,超簡單詳細

大概就這8個,沒有什麼其他問題了,問完之後就和我說,我技術面試過了,還差個業務面,這個面試不會問技術的問題了。接着評價我的廣度夠了,深度不夠。(這個肯定啊,我深度在圖像上啊)

下一步就是我問他了,這一部分我寫下我獲取到的信息。
部門是企業交付與服務部,負責華爲全國的AI項目。這個工作base在成都,但需要經常出差,短則一兩星期,長則半年。出差地大多是北京和廣州。順帶提一下,面試電話的來源也是在廣州。
工作時間跟着項目走(這個大家都懂)
至於薪資,想來各位會比較感興趣。說實話,我沒問,之後還有個業務面,那個時候的面試官肯定會主動的去問你的,到時候先漫天要價好了。

面試前的準備

既然通過了技術面,那麼分享下我的準備,給大家做一做參考。
1.瞭解技術分析師是做什麼的,這個去搜下他們的招聘需求就知道了,裏面也有些相關的知識。
2.瞭解“數據挖掘的十大算法”分別是C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART。瞭解他們的優點,缺點,適用的數據類型和場景。對其中的一部分算法用代碼跑了一下,感受了一下。
3.數據庫的相關知識,惡補了我的mySQL。(雖然面試官基本沒問)
4.平時的積累,我也覺得挺有用的。說出一些大牛的觀點和對問題解決的思路,感覺也有點用。

這篇文章發之前和我的面試官溝通了一下,比較擔心隱私的問題,不過還是獲得了允許的。希望對各位看官有用,以及麻煩能點個贊和要個關注。承諾周更。有不清楚的可以留言給我,會及時回覆的。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章