pyspark數據分析常用算子

不斷更新

1.filter
(1)單條件過濾

data = df.filter(df['age'] == 20))
或者
data = df.filter('age = 20')

(2)多條件過濾

data = df.filter((df['age'] == 20) | (df['gender'] == 'male'))
發佈了26 篇原創文章 · 獲贊 8 · 訪問量 3萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章