原创 pandas創建dataframe的方法

創建pandas的DataFrame對象的5種方法 Pandas的DataFrame對象可以通過許多方式創建,舉幾個常用的例子。 通過Series對象創建 #1、通過單個Series對象創建。DataFrame是一組Se

原创 pandas.read_csv()參數詳解

  官方手冊:點擊打開鏈接! pandas.read_csv 老規矩,官方參數走一波: read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer',

原创 pandas創建Series

如何創建Series對象 常見的創建Pandas對象的方式,都像這樣的形式: pd.Series(data, index=index)1 其中,index是一個可選參數,data參數支持多種數據類型 例如,data可

原创 pd.read_excel()/pd.to_excel()參數詳解

1. read_excel read_excel方法定義: pandas.read_excel(io, sheet_name=0, header=0, skiprows=None, skip_footer=0, index_co

原创 pd.read_sql()參數詳解

pandas.read_sql(sql, con, index_col=None, coerce_float=True, params=None, parse_dates=None, columns=None, ch

原创 邏輯迴歸算法

LogisticRegression 1.建立模型 假設樣本是(x, y), y 是0或1,表示負類或者正類。x 是m維樣本的特徵向量,那麼這個樣本屬於正類,也就是y = 1的概率可以通過下面邏輯函數來表示: p(y=1∣x;θ)=σ

原创 電商推薦系統項目工作總結

電商推薦系統總結: 一. 數據清洗 < 1 >. 數據集中是否存在缺失值,處理缺失值。 處理數據集中缺失值的策略大概分爲刪除,補齊和忽略三類。組刪除:將含有缺失值的屬性特徵刪除(電商推薦中一般不採取此方法,具體看業務場景);忽略:補

原创 MySql基礎

*一個數據庫就是一個完整的業務單元,可以包含多張表,數據被存儲在表中 *爲了保證數據的有效性,準確性可以在創建表時爲表添加一些強制性的驗證,包括數據字段的類型和約束等 數據類型: 使用原則:爲節省存儲空間,儘量使用取值範圍小的數據類型

原创 常用linux命令行

1、ls命令 ls -a 列出目錄所有文件,包含以.開始的隱藏文件 ls -A 列出除.及..的其它文件 ls -r 反序排列 ls -t 以文件修改時間排序 ls -S 以文件大小排序

原创 python3 實現經典的排序與搜索算法

插入算法,最優時間複雜度:O(n), 最壞時間複雜度:O(n^2).    算法原理:從無序數列中選一個元素插入到有序的子序列中去,得到一個有序的、元素加一的子序列,直到整個無序數列的元素爲0,則整個序列全部有序。    算法實現:

原创 二叉樹

二叉樹:每個節點最多含有兩個子樹。       完全二叉樹:對於一顆二叉樹,深度爲d(d>1),除了第d層,其他各層節點數目均已達最大值,且第d層所有節點從左向右連續緊密排列。       滿二叉樹:所有葉子節點都在最底層的完全二叉樹

原创 數據結構

數據結構    數據結構是計算機存儲、組織數據的方式。數據結構是指相互之間存在一種或者多種特定關係的數據元素集合。通常情況下,精心選擇的數據結構可以帶來更高效的運行或者存儲效率。數據結構往往同高效的檢索算法和索引技術有關。    數據

原创 算法時間複雜度

時間複雜度    算法複雜度分爲時間複雜度和空間複雜度。其作用: 時間複雜度是指執行算法所需要的計算工作量;而空間複雜度是指執行這個算法所需要的內存空間。(算法的複雜性體現在運行該算法時的計算機所需資源的多少上,計算機資源最重要的是時