原创 機器學習之模型融合

模型融合簡單來說就是通過對一組的基分類器以某種方式進行組合,以提升模型整體性能的方法。當然,模型融合不能起到決定性作用,在影響模型結果的因素中,一般來說是數據>特徵>模型>模型融合。在業界流傳着這麼一句話,數據和特徵決定了機器學習的上限,

原创 python 實用功能

def word_count(object_list): # 詞頻統計 word_counts = collections.Counter(object_list) # 對分詞做詞頻統計 word_counts

原创 vip 文章

    沒有寫vip文章的能力,只能寫一寫常用的小demo,供大家使用。 對csdn的做法,有兩點不太認同的地方: 1、登錄看全文,最初會增加一點的註冊量,但長久來看會影響用戶體驗 2、vip文章,賺取一定的佣金。 廝混在csdn上的,多

原创 pdf轉txt的兩種方法:

import os import urllib import importlib ,sys importlib.reload(sys) from pdfminer.pdfparser import PDFParser, PDFDocum

原创 機器學習之混淆矩陣的兩種畫法(實戰)

混淆矩陣主要用於表示分類精度,利用橫軸爲預測結果,縱軸爲標準結果的表格圖,可視化地展示算法的分類性能。 import seaborn as sns sns.set() C2 = confusion_matrix(y_test, y_p

原创 多分類機器學習評價指標之準確率、精確率、召回率、F1值、ROC、AUC

準確率、精確率、召回率、F1值 定義: 準確率(Accuracy):正確分類的樣本個數佔總樣本個數,  A = (TP + TN) / N 精確率(Precision):預測正確的正例數據佔預測爲正例數據的比例,  P = TP / (T

原创 記20191207美團49期ai沙龍

一共四位老師對四個模塊進行分享:1、推薦;2、營銷;3、圖像;4、NLP 本人現在從事的工作與NLP相關,特重點留意NLP相關的知識: 美團在上線的技術中,模型主要還是使用雙向LSTM + attention機制; Transformer

原创 機器學習 + flask 簡單的模型上線

from sklearn.externals import joblib from flask import Flask,request app = Flask(__name__) @app.route('/') def hello_

原创 python 統計列表的相同元素的次數, 詞頻統計

有好幾種方式,個人覺得,下面這個還是挺好用 def list_count(num_list): return {x: num_list.count(x) for x in set(num_list)} 點贊

原创 matpltlib python

1、指定字體,解決中文無法顯示 plt.rcParams['font.sans-serif'] = ['SimHei'] # 子圖和x軸旋轉 fig = plt.figure() ax1 = fig.add_subplot(2,

原创 python 金融數據的幾種獲取api

1、挖地兔,開源的時間比較早,現在也在維護,網站:https://tushare.pro/,現在實行積分制,如獲取大盤指數每日指標,用戶需要至少400積分纔可以調取(快速獲取積分,會費50元,可以調用大部分的api),也衍生出部分商業價值

原创 深度學習 多分類roc曲線的繪製

對於多分類問題,ROC曲線的獲取主要有兩種方法:  假設測試樣本個數爲m,類別個數爲n。在訓練完成後,計算出每個測試樣本的在各類別下的概率或置信度,得到一個[m, n]形狀的矩陣P,每一行表示一個測試樣本在各類別下概率值(按類別標籤排序)

原创 mysql之局域網共享

1. 打開CMD,導航到當前MySQL的bin路徑,如下圖: 2. 訪問MySQL:輸入MySQL -u root -p,點擊Enter鍵,即可看到密碼輸入框: 輸入密碼,點需Enter鍵確定,即可看到如下圖:表示訪問MySQL成功。

原创 python windows 定時任務

之前都是在liunx上部署任務,現在換到windows部署python計劃任務,期間遇到一些小問題,現在總結一下: 1、運行結果(0x1)     程序或腳本:python.exe     添加參數:  可執行文件的絕對路徑     起始

原创 python 時間轉換 指定字符串時間轉時間戳

  指定年月日時分秒的表達方式 time.strftime("%Y-%m-%d %H:%M:%S", timeArray) 字符串轉時間戳: tss1 = "2019-08-27" timeArray = time.strptime(