原创 spark的一些難以理解的概念和一些知識點的解讀(高頻考點!!)(Unit1)

這篇文章是對於還沒有入門和剛剛入門的spark小白提的,大佬可以給出意見,本人接受!!! 關於RDD部分,首先你要知道什麼什麼RDD RDD字面意思就是彈性分佈式數據集。。。。。。。(百度一下都是這種字眼很讓人反感) 個人感覺應該要分開理

原创 關於centos完美安裝MYSql數據庫!!!(不看肯定後悔的一定後悔!!!!

剛剛入門linux的是的小白們好多都不明白是怎麼一回事,但是你用的時間長了,就會發現linux真的很好用,廢話不說了,直接開始正題!!! 1.centos7一般會自帶數據庫  所以大家在安裝的一定要先卸載這個自帶的數據庫! 輸入下面命令:

原创 Spark的轉換操作基礎知識和一些使用技巧!!!

在閱讀完最早之前的帖子(點擊打開鏈接)說了如何理解RDD和什麼是RDD和對一些基礎的術語的解讀示例,然後我又發了一份如何創建RDD(點擊打開鏈接)我們這節課來學學習火花的一些對RDD的轉換操作,轉換操作就是不會真的進行分佈式計算,而是將R

原创 字符串和字符編碼

由於計算機是美國人發明的,因此,最早只有127個字符被編碼到計算機裏,也就是大小寫英文字母、數字和一些符號,這個編碼表被稱爲ASCII編碼,比如大寫字母A的編碼是65,小寫字母z的編碼是122。 但是要處理中文顯然一個字節是不夠的,至少需