原创 python獲取代碼運行時間

有的時候,操作大文件,或者取數,要很久,我們給腳本首尾添加一段代碼就知道,這段代碼整體的大致運行時間了。 import time start =time.clock() #中間寫上代碼塊 end = time.clock()

原创 機器學習之Logistic迴歸(五)

主要內容 ● Sigmoid函數和Logistoc迴歸分類器 ● 最優化理論初步 ● 梯度下降最優化算法 ● 數據中的缺失項處理 我們將介紹最優化算法,並利用他們訓練出一個非線性函數用於分類。 利用Logi

原创 python如何篩選數據集中列中value長度大於20的數據集

如果我有一個數據集,他的某個列名下面的value很長,我們需要篩選出,所有列名中value值字符串大於20的數據集。 其實比較簡單啦,一句代碼就可以搞定 #對該列進行強制的字符類型轉換 df["token"] = df["toke

原创 window10下安裝python basemap模塊

我們直接conda install basemap 發現報錯。 C:\Users\yi>conda install basemap Fetching package metadata ... CondaHTTPError: HT

原创 機器學習之決策樹(三)

正方形代表判斷模塊(decision block) ,橢圓代表終止模塊(terminating block),表示已經得到結論,可以終止運動。 決策樹的優勢在於數據形式容易理解。決策樹的很多任務都是爲了數據中所蘊含的知識信息。

原创 Linux部署neo4j

本教程在Linux上部署neo4j 安裝neo4j之前要先配置java環境。 [root@SCF-XJ00600]# java 一version #查看是否配置了java環境 openjdk version”1.8.0_161”

原创 mac os 上安裝lightgbm 採坑

直接 ```bash pip install lightgbm ```bash mbpdeMacBook-Pro:~ mbp$ pip install lightgbm Collecting lightgbm Downl

原创 python實現跨excel的工作表sheet之間的複製

python,將test1的Sheet1通過“跨文件”複製到test2的Sheet2裏面。 包括谷歌沒有能搜出這種問題答案。 我們貼出代碼。 我們加載openpyxl這個包來解決: from openpyxl import lo

原创 SAS如何查看列名

SAS如何查看列名呢? PROC CONTENT語句可以滿足。 apply_status是我們的數據集。 /*查看數據的列名*/ ods trace on; proc contents data=apply_status;

原创 SAS不能讀取複雜的csv文件怎麼辦?

有時候,我們需要讀取一些複雜的csv文件,這個時候如果讀取出錯怎麼辦? 我們從可以python來處理一下這個複雜的csv文件。 import csv import pandas as pd from pandas.io.excel

原创 python操作postgresql批量刪表

最近需要在pg庫需要刪除大量的表,之前採取的方式是進入postgresql,在Linux命令行使用pgsql,然後在交互命令中使用“drop table test_table”語句批量刪表; 這樣感覺效率好低,爲此採用了pytho

原创 python操作mysql的兩個方法

我想去數據庫裏面取出數據。 如果我有數據庫下面含很多個表。 在此之前,我們給出一個讀取數據庫密碼和用戶名等基本配置的一個包: # import the dbconfig import sys import json import

原创 python如何對dataframe下面的值進行大規模賦值

假設我們有一個數據集,列名叫status下面有100萬的數據,其中包裝 “HUMAN_REFUSE”,”SYS_REFUSE”,”HUMAN_AGREE”,”SYS_APPROVING”,”REVIEWING”, “HUMAN_C

原创 SAS如何計算經緯度之間的距離

給出一個思路十分清晰的代碼: 先轉爲弧度,然後利用三角函數運算即可 data job_haha; set distance; lon1 = job_company_longitude*constant('pi')/180; la

原创 python獲取一個月的最後一天和第一天

需要一個datetime模塊支持 import datetime start_dt = datetime.datetime(2017,4,1).replace(hour=0, minute=0, second=0, micros