原创 機器學習實戰之利用AdaBoost元算法提高分類性能

利用AdaBoost元算法提高分類性能 元算法是對其他算法進行組合的一種方式。其背後的思路就像當做重要決定時,大家可能都會考慮吸取多個專家而不只是一個人的意見。利用元算法處理機器學習問題時就是採用 這種思路。 基於數據集多重抽樣的分類

原创 使用python實現地理位置查詢經緯度

地理編碼工具geocoder 地理編碼工具geocoder,不同廠商的服務整合統一起來 地理編碼 import geocoder g = geocoder.google("1403 Washington Ave, New Orlean

原创 機器學習實戰之支持向量機

參考文章 https://blog.csdn.net/v_JULY_v/article/details/7624837 https://www.jiqizhixin.com/articles/2018-10-17-20 支持向量機

原创 機器學習實戰之Logistic迴歸

Logistic迴歸 Logistic迴歸的一般過程 收集數據:採用任意方法收集數據。 準備數據:由於需要進行距離計算,因此要求數據類型爲數值型。另外,結構化數據格式則最佳。 分析數據:採用任意方法對數據進行分析。 訓練算法:大部分

原创 pandas用read_scv讀取含英文雙引號的文件,讀取後出現行數減少的解決方法

當文本文件中帶有英文雙引號時,直接用pd.read_csv進行讀取會導致行數減少,此時應該對read_csv設置參數quoting=3或者quoting=csv.QUOTE_NONE #quoting=3 df = pd.read_c

原创 Pandas實現Hive中的row_number窗口函數

#創建數據集 df = pd.DataFrame({'A':[12,20,12,5,18,11,18], 'C':['A','B','A','B','B','A','A'],

原创 pandas將DataFrame中的tuple分割成數據框的多列

通過apply(pd.Series)實現將tuple進行分列 df = pd.DataFrame({'a':[1,2], 'b':[(1,2), (3,4)]}) df['b'].apply(pd.Series) df[['b1',

原创 Python中遍歷pandas數據的幾種方法介紹和效率對比說明

前言 Pandas是python的一個數據分析包,提供了大量的快速便捷處理數據的函數和方法。其中Pandas定義了Series 和 DataFrame兩種數據類型,這使數據操作變得更簡單。Series 是一種一維的數據結構,類似於將列

原创 將DataFrame中的空列表替換爲nan值

DataFrame中空列表顯示爲[],將其替換爲NaN值的方法 DataFrame.mask(cond, other=nan, inplace=False, axis=None, level=None, errors='raise',

原创 pandas利用replace進行全部替換或者通過選擇篩選後進行替換

# -*- coding: utf-8 -*- import pandas as pd #創建數據集 df = pd.DataFrame( { '名稱':['產品1','產品2','產品3'

原创 使用Markdown編輯器寫博客

歡迎使用Markdown編輯器寫博客 本Markdown編輯器使用StackEdit修改而來,用它寫博客,將會帶來全新的體驗哦: Markdown和擴展Markdown簡潔的語法 代碼塊高亮 圖片鏈接和圖片上傳 LaTex數學公式

原创 股票趨勢線的繪製-維克托

上升趨勢的形態 在上升趨勢中,價格持續上漲而中間夾雜着暫時性的下跌走勢,但下跌走勢的低點不會低於前一波跌勢的低點。就上升趨勢而言,價 格將持續創新高,期間所夾雜的回檔走勢的底部也不斷墊高。 下降趨勢的形態 在下降趨勢

原创 pandas自定義排序

import pandas as pd #數據集 df = pd.DataFrame({'word':['a','b','c'], 'num':[2,1,3]}) #自定義排序順序,此順序對應爲升序ascending=True lis

原创 pandas處理日期函數

import pandas as pd import dateutil #獲取當天的時間 curr_time = pd.datetime.today() #對時間進行格式轉換爲yyyyMMdd curr_date = pd.dat

原创 python實現感知機學習算法的原始形式

感知機 感知機(perceptron)是二類分類的線性分類模型,其輸入爲實例的特徵向量,輸出爲實例的類別,取+1和-1二值。感知機對應於輸入空間(特徵空間)中將實例劃分爲正負兩類的分離超平面,屬於判別模型。感知機學習旨在求出將訓練數據