原创 python——數據分析函數

1、pandas.notnull():去掉空值行 pandas.isnull():只要空值行 2、數據集.列.unique():只顯示不重複的指標值 3、數據集.列.value_count():統計某列各個指標的個數 並按降序排列 4、數

原创 MATLAB——KNN分類器實例

建立一個分類器,預測一個新客戶是否願意購買該產品 %%準備環境 clc,clear all,close all %%導入數據 load bank.mat; %將分類變量轉換成分類數組 names = bank.Properties.Va

原创 初識數據挖掘(data mining)

1、介紹 數據挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的,但又潛在的有用的信息和知識的過程。 2、特點 處理的數據規模較大 要能快速做出反應以隨時提高決策支持 數據挖掘的規則基於

原创 數據挖掘——數據的準備

1、數據的收集 2、數據抽樣 :注意其代表性和隨機性 代表性指的是樣本與總體的接近程度;隨機性反映樣本被抽中純屬偶然 例如:在對總體質量狀況一無所知的情況下,採用簡單隨機抽樣最爲合理;在對總體質量有一定的瞭解情況下,採用分層隨機或系統隨

原创 MATLAB函數——dir、fullfile、join、size函數用法

1、dir函數 files=dir(xxx) 顯示xxx目錄下的文件和文件夾 2、fullfile函數 f=fullfile('dir1', 'dir2', ..., 'filename') 利用文件各部分信息創建併合成完整文件名 實例:

原创 MATLAB實例——評價股票的價值和風險

用定量的方式評價股票的價值和風險:先觀察日期和收盤價的折線圖,再進行線性擬合 (1)對於一支好股票,我們希望股票的增幅越大越好,體現在模型裏就是該曲線的斜率越大越好 (2)對於風險,使用最大回轍來衡量比較好 下面只是一支股票的數據,當有上

原创 MATLAB加載程序包的方法

一、打開MATLAB軟件,並在命令行中輸入matlabroot,敲回車查看存儲路徑。 二、在菜單欄主頁中找到“設置路徑”,再點擊“添加文件夾”,找到你想要添加的文件夾,添加完之後保存即可 三、程序包加載完畢

原创 win7顯示隱藏文件夾的方法

一、雙擊桌面“計算機 二、點擊“工具—文件夾選項—查看—高級設置”,取消“隱藏受保護的操作系統文件”,並點擊“顯示影藏的文件、文件夾和驅動器” 三、點擊“確定”即可 四、恢復隱藏文件夾做相反的操作即可

原创 SAS安裝、更新及問題解決方法

一、安裝SAS前期準備工作: 1. 關閉所有殺毒軟件、不相關程序(QQ等)、系統自帶防火牆。 2. 確認磁盤有足夠空間。 注意事項: (1)安裝時,須右鍵點擊“setup.exe”,選擇“以管理員身份運行” (2)選擇安裝路徑時,路徑中不

原创 《SQL必知必會》學習筆記

二.《SQL必知必會》(一)、初步瞭解1、數據庫:是一個以某種有組織的方式存儲的數據集合;保存有組織的數據的容器(通常是一個文件或一組文件)2、數據庫軟件:稱爲數據庫管理系統(DBMS)。注意:數據庫是通過DBMS創建和操縱的容器3、表:

原创 SQL學習筆記

一.SQL teaching 操作學習Note:斜體爲自己思考內容 已經過實際操作證明下劃線爲提示內容 重點標註內容加粗爲語句關鍵詞SQL語句中以分號“;”來分隔多條語句(有點DBMS不需要,但都加上無壞處)MySQL中粘貼只能用鼠標操作

原创 MATLAB的m文件

m文件是MATLAB的一種腳本文件,就是放一堆命令行程序的文件,功能是可以一次執行多條語句可在MATLAB界面中點擊“新建腳本”實現,把想要一起執行的語句都放在該文件下,然後“保存”,這時可以選擇保存的目錄(當前工作路徑或者其他路徑),但

原创 python中turtle模塊的基本命令

操縱海龜繪圖有着許多的命令,這些命令可以劃分爲兩種:一種爲運動命令,一種爲畫筆控制命令(1)運動命令: (2)畫筆控制命令: 轉自:https://blog.csdn.net/You_are_my_dream/article/detai

原创 Python PCcharm和Ssrape的安裝和調試

       之前看出好多關於使用Python爬蟲的文章,但是都不怎麼全,步驟不是很詳細,對於我這種純小白來說有點難,直到自己真正的安裝 並且調試完,才知道內衣部都不是那麼容易,過程中會出現很多問題,下面我將詳細的說一下我碰到的問題,希望