原创 排序和搜索(三)——hash查找之hash函數(1)

在之前的(一)順序查找和(二)二分查找中我們都是基於數據在列表中存儲的索引位置查找的,本文所要說的是基於hash表的查找【hash表】又名散列表,是一種根據關鍵碼尋找值的數據映射結構。哈希表的每個位置,通常稱爲槽,對應存儲一個項,由0開始

原创 機器學習(一)——k-近鄰、kd樹及其python實現

1.k近鄰的基本原理 1.1基本流程 1.2k-近鄰的三個基本要素 1.3k近鄰的python實現 2.kd樹 2.1構造平衡kd樹 2.2 搜索kd樹 2.3搜索kd樹分析 2.4kd樹的python實現 1.k近鄰的

原创 排序和搜索(九)——快速排序的python實現

【理解】快速排序是分治法的典型,我們首選一個樞軸值,樞軸值的作用是作爲比較對象將列表劃分爲大於它的一部分和小於他的一部分【分析】(1)分區總是出現在列表中間,則分區就可類比二分查找是O(logn);爲了找到分割點,需要針對樞軸值檢查 n

原创 基本數據結構的python實現

【1.棧結構的python實現】棧,線性數據結構,LIFO後進先出,添加和刪除總是發生在同一側。例如:盤子的堆放和拿取代碼:【2.隊列】隊列,FIFO,先進先出,新添加的在隊尾,移除的一端稱隊首,例如:排隊分析:python實現中,隊列尾

原创 movielens數據集讀取、轉換

【1】從https://grouplens.org/datasets/movielens/上下載數據集,包含6000用戶,4000多電影的100萬條數據【讀數據】import pandas as pd import numpy as np

原创 《誰說菜鳥不會數據分析(入門篇)》總結

一、數據分析方法論營銷方面:4P、用戶使用行爲、STP理論、SWOT管理方面的理論模型:PEST、5W2H、時間管理、生命週期、邏輯樹、金字塔、SMART原則等PEST(宏觀環境分析)P(political)政治環境(社會性質、執政黨性質

原创 數據分析實戰——統計、繪圖分析數據

根據獲取的數據,進行描述統計分析,並繪製直方圖 獲取數據及其描述統計分析 #獲取數據 get_housing_data() housing_data=load_housing_data(housing_path) # 查看數據類型,後

原创 python劃分訓練集和測試集

【第一種】方法def splitData(data,seed,m,k): #將數據分成訓練集和測試集,每次指定seed,更換K,重複M次,防止過擬合. test=[] train=[] #random.seed(s

原创 排序和搜索(三)——hash查找之衝突解決(2)

在http://blog.csdn.net/brave_jcc/article/details/79499336中提到了幾種hash函數,但是也只是最大可能減少衝突,並未真正解決衝突問題,本文主要介紹幾種常見的衝突解決方法(1)開放尋址+

原创 python文件讀取

一、 使用內置文件讀取函數1.open(file,r(rb、w、wb))——相關參數 File指文件名,r指讀,rb指以二進制形式讀取,w指寫(直接覆蓋原有內容),wb以二進制形式寫入2.read()一次讀取全部內容——使用with語句

原创 sql知識點簡單梳理

 創建模式create    schema test0402; use    test0402; 創建表createtable Course(Cno    char(4) primary key,Cname    char(40) ,Cp

原创 python operator之getitem和itemgetter

itemgetter(k)用於獲取對象那些維的數據,是定義可一個函數,待獲取的數據需要作爲參數傳入該函數,K只有一個值得時候,返回得是列表,多個值返回的就是元組getitem(boj,k)獲取boj的k維的數據,可直接獲得數據import

原创 python文件寫入excel

需求描述:將爬取的新聞數據按照、url地址、url Id、新聞標題、新聞內容字段寫入excel表1.安裝並導入xlwt模塊2.主要函數介紹enumerate 函數用於遍歷序列中的元素以及它們的下標w=xlwt.workbook()創建工作

原创 字典的遍歷方法+反序列化

[承接]http://blog.csdn.net/brave_jcc/article/details/79529012#python字典遍歷的幾種方法 #遍歷key # 1 for key in model: print('鍵4'