原创 SVM的核函數之線性和高斯的選擇

Table of Contents 關於SVM中線性核函數和高斯核函數的選擇1.基本數據準備2.各情況對比1. SVM(kernel='linear'):直接採用數據集[966,1850]2. SVM(kernel='rbf'):直接

原创 python函數中將變量名轉換成字符串

考慮到在日常中,常常需要對模型指標輸出,但涉及多個模型的時候,需要對其有標示輸出,故需要將模型變量名轉換成字符串。看到的基本方法有兩種: 一、方法層面: 方法1(函數內推薦): def namestr(obj, namespace):

原创 Tensorflow的變量和模型保存以及模型應用

Table of Contents 一、模型部分(成功)1.保存的模型2.載入模型並用於預測1.載入圖結構和參數2.獲取圖3.獲取tensor4.新的input準備5.應用與預測6.其他內容6.1 查看tensor、node等6.2關

原创 關於np.max及tf.reduce_mean的計算軸axis的理解

np.max(axis=), tf.reduce_mean(axis=)的理解。下面以np.max作理解 import numpy as np a = [[[1,2,3],[11,22,33]],[[10,20,30],[110,

原创 Feature Engineering-(1)PCA的理解實現

Table of Contents PCA對比理解與實現一、numpy方式1.數據基本導入2. 繪圖函數定義4.計算pca協方差矩陣協方差矩陣的特徵值求解查看幾個特徵值的重要性5.應用求得到的特徵值對原數據集進行轉換二、採用sklea

原创 list多層列表展開方法對比

目的:希望展開list爲一層 abc=[[2,[1,1,1],2],[3,3,3]] 方法一:https://blog.csdn.net/ytfy12/article/details/51162079 def printm(listi

原创 根據身份證年齡計算

年齡計算 def calculate_age(input_born): ''' : input_born: string, len=8 ''' import datetime y_born =

原创 身份證真實性驗證

def is_valid_idcard(idcard): """Validate id card is valid.""" IDCARD_REGEX = '[1-9][0-9]{14}([0-9]{2}[0-9X])?

原创 反欺詐子研究-特徵衍生過程

內容目錄 1  衍生特徵分析過程1.1  數據讀取1.2  定義處理單列的數據1.2.1  單列數據的觀察1.2.1.1  家庭結構有關1.2.1.2  社交賬號有關1.2.1.3  購物數據(京東賬號jd_account、淘寶賬號a

原创 關於鏈家全網房價數據分析挖掘項目

**關於鏈家全網房價數據分析挖掘項目** 數據說明 數據信息: 數據量:40多萬條觀測,20多個列變量 時間:2018年5月前 數據來源 作者:田昕嶢 獲取方式:https://github.com/XinyaoTian

原创 np.column_stack()數組與列表list的區別

關於np.column_stack()裏面1維數組使用[1維數據]之後的區別 import numpy as np # np.array((1,2,3),(11,22,33)) a=[1,2,3];b=[11,22,33];np.co

原创 python_爬蟲(初入門)

基本實現的功能:抓取、分析、存儲。 一、URL是什麼?由哪些部分構成?     1、簡單來說,URL即,瀏覽器端輸入的 http://www.google.cn  字符串    \2、URI是什麼? Web上每種可用的資源,如 HTML文

原创 pyspark學習與工作歷程

pyspark學習與工作歷程 pyspark中的dataframe操作 spark sql理解:屬於架設在spark core之上的高級層。即在使用中,需要在SparkContext基礎上架一層SQLContext。Spark SQL的