原创 【算法】各類排序算法Python簡單實現

 煩躁,看看算法書靜靜心 import numpy as np import random import time # 歸併排序 def sort_two(a,b): n = len(a) + len(b) a.app

原创 假設檢驗——小解轉化率A\B試驗

目前學習瞭解假設檢驗中,學的不是很透徹,所以僅根據 A/B-test顯著性檢驗 講一講轉化率類型的假設檢驗。   一、伯努利分佈 一次實驗,兩種結果,就是伯努利試驗。 伯努利分佈_百度百科 拋一次硬幣,結果爲正面爲事件A,則P(A)的期望

原创 Python 可迭代對象、迭代器、生成器概念理解

建議先看我上次發的作用域、閉包的概念 再看完廖老師的關於面向對象的高級編程,或者先看    定製類 再看 完全理解Python迭代對象、迭代器、生成器 再看 python迭代器與生成器詳解 最好有自己的思考,有時候雖然描述不同,但內核是一

原创 Python BeautifulSoup爬取鏈家租房信息

# -*- coding: utf-8 -*- """ Created on Thu May 3 14:15:00 2018 @author: """ import urllib import pandas as pd from

原创 小解假設檢驗

目前學習瞭解假設檢驗中,學的不是很透徹,所以僅根據 A/B-test顯著性檢驗 講一講轉化率類型的假設檢驗。   一、伯努利分佈 一次實驗,兩種結果,就是伯努利試驗。 伯努利分佈_百度百科 拋一次硬幣,結果爲正面爲事件A,則P(A)的期望

原创 機器學習實戰之knn算法pandas

這篇文章主要爲大家詳細介紹了機器學習實戰之knn算法pandas,具有一定的參考價值,感興趣的小夥伴們可以參考一下 機器學習實戰之knn算法pandas,供大家參考,具體內容如下 開始學習機器學習實戰這本書,打算看

原创 Hive-Sql內實現日期變量

目前的工作需要在公司平臺上通過hive導出數據,定時任務的權限沒有開放給我,所以只能每天手動導,手動導數時又要天天手工改日期,很麻煩,所以想要where子句能夠每天自動有對應的日期。以上是前提,有太多槽點,請忽略。     首先,要思考的

原创 機器學習實戰之KMeans算法pandas實現

這次寫的噁心死我了,第一次隨機選中心點的代碼有問題還是怎麼的,導致第一輪過完,可能會出現某個中心點根本就完全不合適,沒有任何一個點會標記爲這個中心點,然後報錯。導致我的這個代碼時靈時不靈,開始完全想不到bug的原因。 而且雖然用pand

原创 python 噹噹京東比價

今天發現噹噹的搶購價是覆蓋在噹噹價上的,大概是頁面加載js渲染展示新的搶購價。所以如果簡單的去爬就會發現爬到的價格和網頁顯示的不一樣。不得不吐槽,噹噹的網頁加載真的慢,我眼睜睜看着噹噹價被替換成搶購價。不過無所謂了,我已經會用seleni

原创 機器學習 決策樹初探Titanic

嘗試用了sklearn的決策樹,發現一些問題。決策樹算法的一個很大的優勢就是可以很輕鬆的處理離散的分類變量,但CART僅支持數值變量。我看周老師的決策樹這章講的是通過爲實例增加權重的方式處理缺失值,sklearn的分類樹數據中不能存在缺失

原创 Python Excel畫圖

from PIL import Image from pandas import DataFrame path = r'C:\Users\liuyiheng\Pictures\LCLM_1.jpg' img = Image.open(p

原创 python 全局變量和局部變量學習記錄

這是比較專業的解析:一步一步教你認識Python閉包 淺入深談:一道Python面試題,讓我明白了殊途同歸,卻開始懷疑自己函數閉包的概念在初學時容易迷糊,尤其涉及到閉包的作用域和參數問題以下是標準得半懂不懂瞎琢磨,根據表象猜想原理。不刪留

原创 Python __slots__ ,@property,私有變量學習記錄

使用裝飾器的實質是將方法僞裝成屬性調用,但並不是真的存在該屬性。 _Student__score根據不同解釋器並不總是能正確調用__score屬性,所以最後不要用。 另外,單下劃線命名的變量(包括類,函數,普通變量)僅不能通過from m

原创 Python pandas.DataFrame.apply用法

今天被pandas.DataFrame.apply和pandas.core.groupby.GroupBy.apply搞糊塗了,在搜索的過程中發現很多人跟我一樣弄糊塗了。 這是 DataFrame.apply   Applies fu

原创 Python BeautifulSoup爬取噹噹網圖書信息

# -*- coding: utf-8 -*- import urllib.request from bs4 import BeautifulSoup import pandas as pd path1 = r'C:\Users\