原创 上海諾西Java面試題

1.外連接和子查詢區別        外連接和子查詢最大的區別就在於外連接使用的join不需要在內存中創建臨時表,效率比子查詢高。2.String的equals方法      https://blog.csdn.net/qq_258278

原创 hadoop的工作原理?hadoop是什麼?hadoop的內部三大模塊是怎麼運行的?

hadoop是什麼? hadoop是一個開源框架,主要包括三大塊內容:hdfs(分佈式文件存儲系統),yarn(資源管理和任務調度系統),mapreduce(分佈式計算框架); hadoop的工作原理是什麼?或者說hadoop的內部工作機

原创 深入理解HBase的系統架構

HBase的構成 Regions HBase的HMaster ZooKeeper HBase各組成部分之間的合作 HBase的第一次讀寫 HBase的META table Region Server的組成 HBase的寫操作步驟 步驟一

原创 hbase和hive的區別是什麼?怎麼區分兩者之間的關係?

HIVE:  hive,是一款開源的數據倉庫  1、hive不是數據庫,而是數據倉庫,主要依賴於hadoop來實現 2、底層文件系統是hadoop的hdfs,實現對hdfs上結構化數據的SQL操作HQL,速度較慢 3、計算引擎是hado

原创 Zookeeper常見面試題總結

1.zookeeper是什麼? zookeeper是一個開源的分佈式數據一致性的解決方案,分佈式應用程序可以基於zookeeper實現數據發佈訂閱,負載均衡,命名服務,分佈式協調,集羣管理,分佈式鎖和分佈式隊列等一系列功能,可以保證如下分

原创 啓明信息科技技術股份有限公司面試題

筆試題: 1.spark中應該多用哪些算子操作?爲什麼? 2.hashMap,hashTable,currentHashMap三者之間的區別? 3.hive的優化方案? 4.hadoop環境中節點的增加和刪除怎麼實現? 5.h'ba'se

原创 大數據面試題總結

1.scala 語言有什麼特點,什麼是函數式編程?有什麼優點 2.scala 伴生對象有什麼作用 3.scala 併發編程是怎麼弄得,你對 actor 模型怎麼理解有何優點 4.Spark如何處理結構化數據,Spark如何處理非結構話數據

原创 HDFS的實現原理

1.HDFS是Hadoop的核心組件之一,作爲最底層分佈式存儲系統存在,主要是爲了解決大數據存儲; 2.特性:            採用master/slave架構,一個主節點,多個從節點,共同協調完成分佈式文件存儲服務;      

原创 Java中自旋鎖

自旋鎖 1.什麼是自旋鎖? 當一個線程需要在獲取鎖的時候,此時正好有其他線程佔用着鎖,那麼此時該線程將會進入循環等待模式,直到成功獲取到鎖纔會退出循環,因此稱爲自旋鎖。 2.什麼時候用到自旋鎖?自旋鎖的適用場景?           1)

原创 什麼是線程阻塞?爲什麼會出現線程阻塞?

什麼是線程阻塞? 在某一時刻某一個線程在運行一段代碼的時候,這時候另一個線程也需要運行,但是在運行過程中的那個線程執行完成之前,另一個線程是無法獲取到CPU執行權的(調用sleep方法是進入到睡眠暫停狀態,但是CPU執行權並沒有交出去,而

原创 Redis常見面試題

1、什麼是Redis?   Redis本質上是一個Key-Value類型的內存數據庫,很像memcached,整個數據庫統統加載在內存當中進行操作,定期通過異步操作把數據庫數據flush到硬盤上進行保存。因爲是純內存操作,Redis的性

原创 HashMap,HashTable,CurrentHashMap區別

繼承的父類不同,HashMap繼承的是AbstractMap類,而HashTable繼承的是Dictionary 類; 初始容量和擴容量不同,HashMap初始容量爲16個字節,擴容爲原來的2倍,而 HashTable初始容量爲11個字節

原创 搜狗面試題(大數據崗位)

1.Flume的組件filechannel設置層面是什麼?at least?at most?還是標準? 2.Mapreduce的工作原理?寫過源碼嗎? 3、畫一個二叉樹單鏈結構圖? 4、SQL的左右連接語句及區別?

原创 騰訊公司面試題(大數據崗位)

1、手寫一個冒泡排序代碼或者選擇排序代碼? 2、給一個網頁的url,抓取指定的title標籤裏的文本內容,請寫出實現代碼? 3、Hadoop怎麼從本地上傳到hdfs文件?請寫出命令行 4、怎麼獲取指定範圍內的POI?怎麼設計表? 5、一個

原创 方正國際軟件面試題(大數據崗位)

1、HashMap和HashTable區別? 2、Mapreduce寫過嗎?瞭解原理嗎?combine和分區什麼區別? 3、spark用過嗎?寫過哪些代碼? 4、Hive的UDF函數寫過嗎? 5、Hbase存的是清洗後的數據嗎? 6、Ja