原创 深度學習常用激活函數及其實現

1.階躍函數的實現 def step_function(x): if x>0: return 1 else: return 0 #支持numpy數組的實現: def step_fu

原创 機器學習數據集劃分/數據處理常用代碼總結

數據集劃分: 純隨機抽樣方法 from sklearn.model_selection import train_test_split train_set, test_set = train_test_split(data, te

原创 數據分析與挖掘2

一.數據探索:對樣本數據的結構和規律進行分析的過程(數據質量分析 / 數據特徵分析)。 1.數據質量分析的主要任務是檢查原始數據中是否存在髒數據【缺失值,異常值,不一致的值,重複數據及含有特殊符號的數據等】。 缺失值分析: 記錄的

原创 電腦問題整理

問題1.描述:聯不上網,打開應用顯示爲 initialization failure:0X0000000c : 解決方法:①以管理員身份打開控制檯。 ②輸入“NETSH WINSOCK RESET CATALOG”。 ③回車,提示

原创 百面機器學習總結

一 特徵工程 1 特徵歸一化 爲什麼對數值類型特徵做歸一化: 使不同指標之間具有可比性,將所有特徵統一到一個大致相同的數值區間內。 常用方法: ①線性函數歸一化:使結果映射到【0,1】的範圍,對原始數據等比縮放 X_norm

原创 LintCode題目(編號爲順序)

1.A+B問題 解法一:直接return a+b 解法二:通過位運算計算A+B def add(a, b): if a==0: return b if b==0: return a

原创 神經/卷積神經網絡模型架構

#構造神經網絡框架: import numpy as np import tensorflow as tf import matplotlib.pyplot as plt import input_data mnist = in

原创 機器學習函數調用及繪圖常用代碼總結

機器學習函數調用: 決策樹:from sklearn.tree import DecisionTreeRegressor 隨機森林:from sklearn.ensemble import RandomForestClassifi

原创 爬蟲實戰筆記

一章 爬蟲基礎 1HTTP基本原理 URL:統一資源定位符 URI:統一資源標誌符 HTTP:Hyper Text Transfer Protocol 超文本傳輸協議 HTTPS: Hyper Text Transfer Pr

原创 機器學習6SVM-支持向量機

將SVM分類器視爲在類別之間擬合可能的最寬的街道 二分類問題 其他分類算法: 軟間隔分類 Scikit_learn代碼 : 加載數據集,縮放特徵,訓練一個線性SVM模型 import numpy as np from s

原创 機器學習5貝葉斯分類方法

一種統計分類方法: 通過概率進行預測,即預測一個給定元組 屬於一個特定類的概率

原创 機器學習實戰筆記

一.端到端的機器學習項目 數據預處理常做的操作: –數據映射—>data[col_name == 原值 ,col_name]=映射值 –獲取列名列表—>col_names = data.columns.tolist() –預覽數據

原创 機器學習-推薦系統

基於用戶協同的過濾統計算法

原创 機器學習8聚類算法

聚類概念 無監督問題(無標籤) k-means算法 聚類:相似的東西分到一組 難點:評估,調參 指定一個K值,要得到簇的個數 質心:均值,向量各維取平均值 距離的度量:常用歐幾里得距離和餘弦相似度 工作流程:

原创 用戶流失預警案例

1.數據預處理 from future import division import pandas as pd import numpy as np churn_df = pd.read_csv(‘churn.csv’) col_