pyspark&pandas之字符串篩選dataframe

#pandas:
import numpy as np
import pandas as pd

df = pd.DataFrame(np.array([['banana',1],['apple',2],['pear',3]]).reshape(3,2))
df.columns = ['a','b']
df2 = df[df['a'].str.contains('l')]
print(df2)

       a  b
1  apple  2

#pyspark:
ddf = spark.createDataFrame(df)
ddf2 = ddf[ddf['a'].like('%l%')]
ddf2.show()
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章