#pandas:
import numpy as np
import pandas as pd
df = pd.DataFrame(np.array([['banana',1],['apple',2],['pear',3]]).reshape(3,2))
df.columns = ['a','b']
df2 = df[df['a'].str.contains('l')]
print(df2)
a b
1 apple 2
#pyspark:
ddf = spark.createDataFrame(df)
ddf2 = ddf[ddf['a'].like('%l%')]
ddf2.show()
pyspark&pandas之字符串篩選dataframe
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章
CentOS 安裝 SVN1.7.7
dreamZhf
2020-07-08 12:36:10
亂序拼圖驗證的識別並還原 puzzle-captcha(開源)
S.F.
2021-12-01 00:53:28
【轉載】Python處理csv文件
zqh
2020-07-18 14:25:30
Error:field larger than field limit(131072)解決方法
hammring
2020-07-08 12:39:29
啓動Jupyter時, 遇到 sudo: jupyterhub: command not found 問題的解決方案
钢琴线与小刀
2020-07-08 12:39:19
Python小記 —— 文件讀寫操作裏read()方法的深究
柘月十七
2020-07-08 12:33:27
No more authentication methods to try,Permission denied (publickey)
the5fire
2023-11-21 09:53:05
linux有磁盤空間卻顯示不足 linux中inode使用率過高處理辦法 linux中inode使用率過高處理辦法
故宮博物院
2022-12-25 14:18:39
Unixbench:簡介及使用【轉】
張昺華-sky
2022-06-30 14:35:50
linux下kill殺死進程的命令
K~hat
2020-11-10 13:34:45
基於tiny4412的Linux內核移植 -- 設備樹的展開【轉】
張昺華-sky
2020-10-22 13:20:25
增加FastDfs多文件存儲路徑
pengdayong77
2020-07-08 12:37:23
supervisor管理redis,mysql進程
pengdayong77
2020-07-08 12:37:23
linux下禁止用戶使用密碼方式登陸,而使用密鑰方式登陸
dreamZhf
2020-07-08 12:36:09