原创 pandas中的axis=0,axis=1,傻傻分不清楚

原文鏈接:https://www.cnblogs.com/nxf-rabbit75/p/10044801.html https://www.cnblogs.com/nxf-rabbit75/p/

原创 python中group方法以及與groups的區別

python中的group方法 group()在正則表達式中用於獲取分段截獲的字符串,解釋如下代碼(代碼來自網絡): import re a = "123abc456" print re.search("([0-9]*)([a-z]*)(

原创 linux 刪除文件第一行的方法

刪除第一行 sed -i '1d' filename 範圍刪除,刪除1-3行 sed -i '1,3d' filename 刪除第n行 sed -i 'nd' filename 刪除最後一行 sed -i '$d' filename

原创 Flink 實例

import org.apache.flink.streaming.api.scala.{StreamExecutionEnvironment, _} import org.apache.flink.streaming.api.wind

原创 python教程

https://www.liaoxuefeng.com/wiki/1016959663602400/1017806472608512     http://c.biancheng.net/python/class_object/

原创 SparkStreaming foreachPartition實現輸出數據到MYSQL

import java.sql.DriverManager import org.apache.spark.SparkConf import org.apache.spark.streaming.{Seconds, Streaming

原创 python 判斷文件是否是特定後綴文件

def endWith(s, *endstring): arr = map(s.endswith, endstring) if True in arr; return Ture else : return False  

原创 python MD5文件校驗

 根據文件塊長度,依次獲取文件內容讀入內存,通過update()逐次更新校驗值 import hashlib def md5sum(fname):      """ 計算文件的MD5值      """      def read_c

原创 python 將特定路徑下大於1G的文件拷貝

  from shutil import copyfile def list_files(files,file_dir,linux_dir): for ls_file in files: yn=os.path.exists(li

原创 DataFrame輸出操作

查看DataFrame API發現DataFrame中提供了很多種輸出操作方法。 其中save方法可以將DataFrame保存爲文件,save操作有一個可選參數SaveMode, 用這個參數可以指定如何處理數據已經存在的情況。 另外,在使

原创 python跳過GPG彈出窗口進行GPG解密

import gnupg gpg = gnupg.GPG(homedir='/root/.gnupg') filename='' outputPath='' stream=open(filename,'rb') data=gp

原创 EasyScheduler學習(一):部署與安裝

http://note.youdao.com/noteshare?id=67d3d798cb80defaf494c5d8fcdf6806

原创 jieba完美介紹

jieba ======== “結巴”中文分詞:做最好的 Python 中文分詞組件 "Jieba" (Chinese for "to stutter") Chinese text segmentation: built to be