原创 初識hadoop及僞集羣部署

hadoop:包含分佈式文件系統和分佈式計算的一個框架。 HDFS,mapreduce HDFS的架構:三種節點:NN,SNN,DN。 不可替代 存放海量的數據。 數據 --》----》文件—》存放HDFS—》數據文件(元

原创 Python基礎知識+計算器練習

1.列出python中的標識符命名規則 標示符由字母、下劃線和數字組成,且數字不能開頭。不能是關鍵字,不能有特殊符號:,/,;,#等 #關鍵字 >>> import keyword >>> keyword.kwlist ['Fal

原创 Python基礎知識問答

1.列表和元組之間的區別是? 列表和元組都是python內置的集合類型,列表用list表示,元組用tuple表示 list是有序的動態數組,引用不可變但是可以改變元素的個數,列表元素下標從0開始,列表用[ ] 表示,列表相關操作的

原创 博客園地址

                                   博客園地址

原创 Scala-基礎知識

1.var,val和def三個關鍵字之間的區別? Scala聲明變量有兩種方式,一個用val,一個用var。 val / var 變量名 : 變量類型 = 變量值。 val定義的值是不可變的,它不是一個常量,是不可變量,或稱之

原创 Sqoop架構原理及常用命令參數

1. 簡介 Sqoop:SQL–to–Hadoop Apache Sqoop是用來實現結構型數據(如關係數據庫)和Hadoop之間進行數據遷移的工具。它充分利用了MapReduce的並行特點以批處理的方式加快數據的傳輸,同時也藉助