原创 Spark Python API函數:pyspark API(2)

文章目錄 •    1 sortBy •    2 glom •    3 cartesian •    4 groupBy •    5 pipe •    6 foreach •    7 foreachPartition •    

原创 3.字符串和編碼

1.計算機只認識數字,因此字符串被轉換爲數字進行表示。因此出現了編碼,最早的編碼是ASCII碼 2.隨着不同的語言接入計算機系統,出現了不同的編碼。例如要將漢子輸入計算機,出現了GB2312編碼,要將俄語輸入計算機出現了windows-1

原创 2.數據類型和變量

1.整數 1 100 -100 299 使用type(100)打印出數據的類型 print(type(100))  <class 'int'> 2.浮點數 3.1415 -0.999 26.0 使用type(3.1415)打印出數據類型

原创 4.python中的list集合

1.list:python內置的有序的集合 2.有兩種聲明list的方式:list()和[] list1=['liko','alan'] list2=list(['liko','alan']) print(type(list1),type

原创 5.“死板”的tuple

1.tuple是python中的另外一種有序的列表,一旦初始化就不能被修改 2.因爲tuple一旦初始化就不能變化,因此沒有append(),insert()這些方法。獲取元素的方法同list類似 3.因爲tuple不可變,所以代碼更安全

原创 6.從不撒謊的條件判斷

1.計算機之所以強大的原因是因爲內部能根據不同的條件作出判斷,自動化的完成任務 2.在python語言裏面使用if ... else 語句來進行條件判斷 3.若條件爲True,執行if:對應的代碼塊,否則執行else對應的代碼塊 4.只要

原创 9.‘獨一無二的’set

1.set中沒有重複出現的元素,用於存儲不重複的數據。重複的數據會被自動過濾掉 2.構建set需要傳入一個list set1 = set([1,2,3,5,'aa']) print(type(set1)) print(set1) <cl

原创 11.自己說了算,定義自己的函數

1.python中使用def定義函數,函數定義格式爲: def 函數名(參數列表): 代碼塊 return 返回值 2.如果沒有return語句,函數也會有返回值,返回None 3.若要從其他py文件中引用對應的方法,需要使用from語句

原创 10.“撿現成”之函數調用

1.函數是一種基本規律的抽象,可重用。例如說圓面積、正方形邊長,橢圓面積等。這些被發現的公式或定理或規律被固化下來,我們在遇到的時候可以直接套用這些定義好的函數。 2.python內置了很多的函數,這些函數爲我們省去了大量的工作 3.我們

原创 14.外科手術刀之集合切片

1.對集合list或tuple部分元素的操作是非常常見的操作,我們固然可以通過例如索引、循環等方式獲得集合中的元素,但是顯得非常繁瑣。python爲我們提供了更加簡潔的方式——切片 2.切片的使用方式是:startIndex:endIn

原创 12.多變的函數參數

1.定義函數的時候,吧函數的參數和參數的位置確定下來,加上函數體及return返回值,函數定義就完成了。函數內部複雜的邏輯被封裝起來,調用者只需要知道需要傳哪些參數,產生什麼返回值就可以了。 2.python定義函數參數的靈活性非常大,有

原创 7.集合遍歷能手for&while

1.for遍歷list和tuple list1=[1,2,3,4,'a'] for data in list1:     print(data) tuple1=('a','b',3.14) for data in tuple1:

原创 13.簡單明瞭的遞歸函數

1.遞歸函數:如果在一個函數的內部調用本身,就形成一個遞歸函數。 2.使用遞歸函數需要注意 堆棧溢出,在計算機內部,遞歸是通過Stack這種數據結構實現的。每調用一次函數,增加一層棧幀,每return一次減少一次棧幀。 3.理論上遞歸調用

原创 8.高效的dict

1.dict是Python內置的字典結構,類似於其它語言的map 2.dict的查詢效率很高,類似於查找字典。根據key找到value存放的位置,然後直接訪問value 3.python中的dict字典的創建以{}或dict()方法聲明

原创 15.可迭代數據的剋星

1.我們可以使用python內置的for...in語句迭代所有可迭代的集合人,例如迭代list、tuple、dict、set等 2. 如何查看一個對象是否可以迭代。我們可以使用collection模塊的Iterable類型來判斷。 fr