大數據崗位要求之數據測試

    繼續介紹大數據系列崗位的要求,今天是“最冷門”的崗位數據測試,如果大數據要發揮真正的價值,前提條件是非常多的,比如數據量要大、要有相應的人才等,這其中還包括數據質量,數據質量給很多人帶來的痛,要遠比表達出來的少的多的多。還是先從幾個大廠的崗位要求說起。

個推

1、本科及以上,計算機等相關專業,有一定的算法基礎優先;
2、熟悉數據倉庫系統架構,熟練測試理論及方法,能夠針對不同場景完成不同測試方案的設計、實施;
3、較強的學習能力、分析能力和解決問題的能力,能主動進行技術鑽研;
4、熟悉Hadoop生態圈技術,瞭解生態圈相關組件,主要包括Common、MapReduce、HDFS、Zookeeper、HBase、Hive等組件者優先;
5、掌握Java、HIVE、SQL語言,熟悉至少一種腳本語言(Python/Shell等),具備自動化測試經驗者優先;
6、有針對用戶畫像測試的經驗者優先

浙江執御

1、對軟件測試有興趣,有大數據平臺測試經驗;
2、熟悉linux操作系統,熟悉一款主流數據庫的基本操作和原理,熟悉SQL語言;
3、熟悉java、Scala等至少一種編程語言,有Shell或Python/PHP/Ruby等使用經驗者優先;
4、2年以上軟件開發/測試工作經驗;
5、熟悉分佈式軟件系統的測試方法,有BI、大數據平臺和Hadoop相關組件的測試經驗者優先;

華爲

1、熟練掌握測試需求分析和設計方法、黑盒和白盒測試方法、自動化測試等;
2、精通軟件開發和測試流程,有很強的測試技術規劃和測試架構設計能力;
3、熟悉常見編程語言或者腳本語言,如C++/Java/golang/Shell/Python/Ruby/Perl的一種或多種。
4、有大數據產品解決方案測試、POC測試、開源組件集成驗證經驗者優先;
5、對大數據產品技術架構原理有深入瞭解者優先。

螞蟻金服

1、計算機相關專業,本科以上學歷; 3年以上開發/測試經驗(語言不限,但要有專精)
2、熟悉Linux操作系統,熟練使用腳本語言編程(語言不限,但要熟練)
3、具有搜索引擎、算法優化及大數據等項目的測試經驗者優先。
4、(可選)熟悉Hadoop、Hive、HBase等分佈式開源項目及工作原理,有豐富的集羣部署、開發和維護管理經驗
5、(可選)熟悉數據倉庫的設計和開發以及建模、數據質量監控,有實施過程中解決問題經驗;
6、(可選)熟悉web前端架構並有實際工程構建的經驗
7、(可選)有大數據/算法開發相關工作經驗

曹操專車

1、計算機相關專業本科及以上學歷;
2、兩年以上大中型互聯網測試開發工作經驗,有小團隊測試管理經驗者優先;
3、有很強的分析能力和定位問題的能力,快速學習能力強;具有良好的溝通能力、細心負責、有團隊精神;
4、熟悉Linux操作系統,瞭解基本的Shell命令,能夠部署和維護測試環境;
5、熟悉MySQL、PostgreSQL、Redis等常用數據庫及緩存者優先;
6、熟悉Python,java,Scala等至少一種編程語言者優先;
7、熟悉Hadoop、Spark、HBase、kafka等分佈式開源項目及工作原理者優先;
8、熟悉分佈式軟件系統的測試方法,有電商平臺數據功能、BI、大數據平臺和Hadoop相關組件的測試經驗者優先。

能力三核模型分析

綜合結果如下

知識

1、本科及以上(3)
2、計算機等相關專業(3)
3、熟悉linux操作系統(3)
4、熟悉hadoop生態圈技術(3)
5、熟悉數據倉庫系統架構(1)

硬技能

1、2年及以上測試經驗(3)
2、熟悉測試理論和設計方法(3)
3、掌握java、sql、python等至少一種編程語言(4)
4、熟練掌握自動化測試(2)
5、熟悉數據倉庫開發及建模(1)
6、熟悉Mysql PostgreSql、Redis等常用數據庫及緩存

才幹or軟技能

1、較強的學習能力(2)
2、分析問題及解決問題能力(2)
3、良好的溝通能力(1)
4、有團隊精神(1)

分析

    通過上面能力三核要求來看,如果滿足了這三方面的要求,表面上看上去並不能保證數據的質量問題。既然這樣的話,還是先看一下上面幾家公司jd上的工作職責,他們到底希望數據測試解決什麼問題?

崗位職責(整理後)

1、負責大數據平臺測試規劃及架構(5)
2、負責大數據平臺自動化測試工具(3)
3、負責大數據平臺性能測試(4)
4、分析、定位問題並推動解決(3)
5、負責數倉計算邏輯正確性測試(1)
    通過上述列表基本明白了,大家希望的數據測試並不是關於保證數據正確性的(只有一家公司有這方面的訴求),而是更多的希望保證數據平臺功能性方面的穩定性和可用性。這樣就跟上面的能力三核的要求對應上了。

個人經驗

    文章開頭所說的“最冷門”崗位,經過上述的分析總結其實並不誇張,大家更多的是集中在數據平臺功能性方面的測試(也許他們在這方面已經做的足夠好了,不需要測試),這和非數據測試人員的要求並無本質區別。而我所理解的數據測試更多的是保證數據準確性方面。
    不管是數據倉庫開發還是數據分析師,他們的產出也都是正常人的產出,既然是正常人的產出,就有可能犯錯,既然有可能犯錯就需要有人測試來保證準確性,尤其是對外的數據應用。
    目前業內最常見的做法是數據開發的同學AB角來保證數據的準確性,即2個數據開發的同學,一個負責開發,一個負責測試或者review代碼,其實B角的同學在某個項目中已經是測試角色,只是這個測試角色週期比較短而已,他的主要職責還是開發。這樣的做法在一定程度上是可以保證數據質量的,但是弊端也很明顯,測試經驗無法有效沉澱,同時也不會考慮更深的自動化測試。
    按照我個人的經驗來看,如果要高效的保證數據質量,專門的數據測試同學是必須的,這裏的數據測試同學除了有上述能力三核中關於功能測試的要求之外,還要數據開發方面的經驗與理念,簡單總結如下幾點:
      1、熟悉測試理論和設計方法
      2、掌握java、sql、python等至少一種編程語言
      3、熟練掌握自動化測試
      4、熟悉數據倉庫開發及建模
    上面所說的都是關於在數據開發或者數據加工階段的準確性保證。但是請記住大數據同學是不產生數據的,他們只是數據的“搬運工”,如果數據的源頭出現了問題,大數據的同學就必須要費九牛二虎之力纔有可能保證數據的準確性,甚至根本無法保證數據的準確性。在這裏拋出另外一個問題:如何保證數據源頭的準確性,也是大數據的同學必須要關注的,這個將在另外一篇文章中單獨介紹。

系列文章

大數據崗位要求之數據挖掘
大數據崗位要求之數據倉庫
大數據崗位要求之數據產品經理
大數據崗位要求之數據分析師
大數據崗位介紹-引子(能力三核模型)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章