原创 機器學習7模型的評估與選擇

評估分類法: 提高分類法的準確性: 分類器評估度量:

原创 機器學習基本概念

監督學習(用於分類) 模型的學習在被告知每個訓練樣本屬於哪個類的“指導”下進行 新數據使用訓練數據集中得到的規則進行分類 無監督學習(用於聚類) 每個訓練樣本的類編號是未知的,要學習的類集合和數量也可能是事先未知的 通過一系列的觀

原创 機器學習4集成算法與隨機森林

理論上越多的樹效果會越好,但實際上基本超過一定數量就差不多上下浮動了 Bagging:訓練多個分類器取平均 代表:隨機森林 隨機:數據採樣隨機,特徵選擇隨機 森林:很多個決策樹並行放在一起 特徵重要性衡量: 破壞某列特徵,與原來情況進

原创 機器學習2梯度下降求解邏輯迴歸

import numpy as np import pandas as pd import matplotlib.pyplot as plt #準備工作,導入包 import os path = ‘data’ +os.sep+‘

原创 機器學習1線性迴歸算法

概述: 對於X1,X2特徵值作關於Y的擬合曲線 Y=參數0 + X1 * 參數1 + X2 * 參數2 紅色點爲真實數據值 誤差: 真實值和預測值之間肯定是要存在差異的 對於每個樣本:y (i)= 參數 * x(i) + p(i)

原创 算法

1章 1.1二分查找(二分查找的時間爲對數時間,low,high,mid) 1.2大O表示法(最糟糕情況下運行時間,n爲操作數,旅行商問題) 2章 2.1數組和鏈表(數組適合查找,鏈表適合增刪) 2.2選擇排序(一次找一個最值) 3章

原创 數據分析7數據聚合與分組操作

1.GroupBy機制 分離操作是在數據對象的特定軸上進行的。DataFrame可以在它的行方向(axis=0)或列方向(axis=1)進行分組。 創建一個小型表格數據集作爲例子: df = pd.DataFrame({'key1':

原创 數據分析5數據清洗與準備

pandas使用浮點值NaN(not a number)來表示缺失值。稱NaN爲容易檢測到的標識值: ①過濾缺失值 可以使用pandas.isnull和布爾值索引手動地過濾缺失值,但dropna在過濾缺失值時是非常有用的。 ①在ser

原创 編譯常見錯誤歸納

AttributeError: module ‘pandas’ has no attribute ‘Series’(及其類似情況) 可能是如下原因: (1)包 沒有安裝成功或更新到最新版本; (2)自己的文件名命名有問題,比如在上述

原创 prezi2展示思維的總結

1.介紹某地方的風景建築 ①以地圖爲故事線 分別進入敘述 例:比如要介紹倫敦的風景建築: ②使用invisible frame元素,添加在原來的地圖上,放置在具體場景敘述的版塊後面,造成在每次敘述完一個地點之後又回到原來地圖的效果。

原创 prezi1破解安裝與使用

1.破解安裝 ①下載破解安裝包 ②安裝exe文件(安裝步驟跳過),安裝好之後,在prezi安裝目錄下替換以下兩個同名文件 ③打開快捷方式,完成,進入編輯頁面 2.基本操作(功能) ①添加元素:左側的添加圖標,4種供選擇的頁面元素

原创 python擴展1遊戲項目的開發(1)

開始前,先安裝pygame包 1.創建Pygame窗口以及響應用戶輸入 import sys import pygame def run_game(): # 初始化遊戲並創建一個屏幕對象 pygame.init()

原创 python入門21測試代碼

python標準庫中的模塊unittest提供了代碼測試工具。 unittest Module中的斷言方法 assertEqual(a,b) 覈實a==b assertNotEqual(a,b) 覈實a

原创 數據分析4csv文件的處理

1.讀寫csv文件 f1 = open(r'D:\hhh.csv', 'r') f2 = open(r'D:\111.csv','w') ttt = f1.readline() //讀入第一行標題行 將其作爲字符串並賦給名爲hea

原创 H5C3-2拖放API

拖放事件: dragstart:網頁元素開始拖動時觸發 dragover:被拖動元素停留在目標元素持續觸發 drop:被拖動元素,落下時觸發 拖放的步驟: 1.將想要拖放的元素設置爲true 2.拖動什麼 ondragstart和se