一個數據挖掘者的自我修養:數據科學家頭銜很光鮮,但全棧工程師纔是本質

真正的革命並不在於分析數據的機器,而在於數據本身和我們如何運用數據。

——《大數據時代》維克托·邁爾-舍恩伯格

二十年,是一個什麼概念?

對於大數據領域來說,過去二十年經歷了從新興到炒作巔峯再到實質生產高峯期的過程,並開啓了一次重大的時代轉型。被業界廣泛認可的“大數據”定義由著名諮詢公司Gartner的高級分析師道格拉斯·蘭尼 (Douglas Laney)在2001年提出;大數據經典框架Hadoop則誕生於2006年;如今,大數據技術已經從Hadoop推動的第一代向更智能、更實時、面向交互的技術方向轉變。

而數據挖掘的歷史比大數據要長得多,在數據量還遠遠沒有今天如此龐大的時候,人們就已經想方設法從中挖掘價值。對索信達首席科學家張磊博士來說,過去二十年是見證數據挖掘和分析技術與應用高速發展的二十年。

張磊從讀研開始進入數據挖掘和分析領域,博士畢業後一直在提供企業級大數據解決方案的知名廠商工作,從Teradata到IBM、SAS,他參與了橫跨運營商到金融行業的數十個項目,有着豐富的從業經歷。今年年初,張磊選擇加入專注金融數字化服務的索信達,擔任首席科學家,希望推動國內金融大數據行業朝着“擁抱開源、自主可控、信息融合、智能化”的方向前行。經過大量項目實踐的磨練,他對於To B大數據業務和技術方案有哪些經驗和獨到的思考?他怎樣看待金融大數據的過去和未來?做企業級大數據面臨哪些難點和挑戰?大數據人才團隊該如何搭建?帶着這些問題,InfoQ對張磊博士進行了獨家專訪,一探這位20年資深數據人對To B大數據的思考。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章