原创 【大數據學習】hadoop環境搭建

首先,安裝JDK,這裏就不細說了。 這裏使用的是hdfs用戶進行安裝的,先在五臺機器上創建hdfs用戶: useradd hdfs 設置密碼,我設置了000000 passwd hdfs 一、修改/etc/hosts文件 先配

原创 線性方程組-學習筆記

一、齊次方程組 一句話:初等行變換沒有改變方程組的解。 二、基礎解系的求法 三、非齊次方程組 四、含參方程組 五、方程組習題課 六、與方程組有關的證明題

原创 矩陣-學習筆記

參考資料:中國大學MOOC 山東大學 秦靜教授講解 目錄一、幾種特殊的矩陣二、矩陣的運算三、方陣的行列式四、伴隨矩陣五、初等變換六、矩陣的秩七、初等矩陣八、逆矩陣九、逆矩陣的性質與求解十、分塊矩陣十一、矩陣方程十二、習題課 一、幾

原创 行列式-學習筆記

行列式概念的引進 N階行列式 特殊行列式的計算 行列式的性質 克蘭姆法則 範德蒙行列式 逆序數與行列式 行列式展開定理

原创 N維向量-學習筆記

參考資料:中國大學MOOC 山東大學 秦靜教授講解 目錄一、向量及其線性運算二、向量組的線性相關三、線性相關的判定定理四、線性相關判定定理4和5的證明五、向量組的極大無關組與秩的定義六、向量組的極大無關組與秩的求法七、向量空間八、

原创 在漫無目的的學習中迷失了方向

發現自己啥都想學,但是回過頭來,發現自己啥也沒有掌握,學過的知識,一時在工作中沒有用上,過不了多久就忘了,甚至是明天就忘記了,我想,應該停下腳步,多複習自己學過的東西。

原创 python學習筆記(常用庫)

一、numpy 二、pandas 2.3 series結構 基本操作 import pandas as pd fandango = pd.read_csv('E:\\唐宇迪機器學習\Python庫代碼(4個)\\2-數據分析處理

原创 spark的DataFrame和DataSet

創建DataSet的幾種方式: 1、讀取文件的方式創建 只有一列,每一列對應文本的一行數據: DataSet既可以進行RDD的一些操作,又可以進行DataFrame的一些操作: 如果是DataFrame就不能簡單的進行上述操

原创 常用學習網站收藏

http://www.hollischuang.com/

原创 一個很漂亮的登錄頁面

<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Title</title> </head> <body> <div

原创 尚硅谷電商管理平臺-需求六-各區域Top3商品統計

各區域Top3商品統計 統計各個區域中Top3的熱門商品,熱門商品的評判指標是商品被點擊的次數,對於user_visit_action表,click_product_id表示被點擊的商品。 區域與等級: 數據流程: 代碼: 1

原创 尚硅谷電商管理平臺-需求七到十-廣告實時模塊

1.1創建表 SET FOREIGN_KEY_CHECKS = 0; -- ---------------------------- -- Table structure for `ad_blacklist` -- -----

原创 尚硅谷電商管理平臺筆記2

一、Session隨機抽取 1.1 數據轉換 接着筆記1中的代碼繼續寫: def sessionRandomExtract(sparkSession: SparkSession,

原创 尚硅谷電商分析平臺筆記1

一、需求概述 1.1需求 三個離線需求,一個實時需求。 1.2hive表 涉及三張hive表,動作表、用戶表、物品表 動作表詳細說明: 1.3數據樣例 1.4實時數據解析 1.5 需求總概述 二、用戶訪問Session

原创 尚硅谷電商管理平臺-需求五-頁面單跳轉化率統計

頁面單跳轉化率統計 思路: 先過濾符合條件的數據 轉換數據(sessionid,action) 獲取切片數組 對數據進行分組 對分組後的數據按照時間排序 取出排序後的pageid信息 過濾出不在切片數組中的數據 獲取起始頁面的