海量數據處理面試題

  1. 數據量太大導致的問題:無法在較短時間內迅速解決,無法一次性裝入內存。
  2. 針對時間,我們可以採用巧妙的算法搭配合適的數據結構,如 Bloom filter/Hash/bit-map/堆/數據庫或倒排索引/trie樹 。針對空間,無非就一個辦法:大而化小, 分而治之(hash映射) ,你不是說規模太大嘛,那簡單啊,就把規模大化爲規模小的,各個擊破不就完了嘛。
  3. 單機及集羣問題,通俗點來講,單機就是處理裝載數據的機器有限(只要考慮cpu,內存,硬盤的數據交互),而集羣,機器有多輛,適合分佈式處理,並行計算(更多考慮節點和節點間的數據交互)。

latex報錯:inputenc Error: Unicode char \u8,: not set up for use with LaTeX https://blog.csdn.net/weixin_37600848/article/details/87898653

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章