原创 數據預處理-判斷csv文件中每一行中空格/(數據值)數量(python版)

一:問題描述:         如下圖所示,我們要統計表格中每行數據值(例如藝術,設計,歷史是三個數據值)的個數 二:空格替換逗號         從表格中可以看到有些數據值之間是空格,有些數據值之間是逗號。我們利用excel本身有的搜

原创 Java學習-list《int[]》總結 - list《int》 position = new Arraylist《int》(5)使用

List<int[ ]> position = new ArrayList<int [ ] >(5)的使用以及該結構的形式及內容。 package temp; import java.util.ArrayList; import ja

原创 java學習-求解一個list列表中所有整數的平均數和方差

由於Java中不像python中那樣有現成的numpy包 #求平均數  #arr_mean = np.mean(arr) #求方差 #arr_var = np.var(arr) 因此我們需要根據平均數和方差的定義來求解,具體代碼見下:

原创 數據預處理-Excel表中如何在數據中批量添加(括號)/「尖括號」等

1.問題:         Excel表中如何在數據中批量添加(括號)/<尖括號>等 2.解決辦法:         假設數據在A列,在B1輸入="<"&A1&">",然後通過右下角往下填充就可以了。 3.樣例:         

原创 數據預處理-Excel 兩列合併爲一列中間加空格

一:問題描述         把Excel中兩列數據合併爲一列,並且以空格隔開。 二:方法一         把Excel中的兩列數據複製粘貼到txt文本文檔中,再從txt文本文檔中把數據粘貼到excel中的某一列。       【注意】

原创 數據處理-對Excel文件讀取和操作和存儲(python版)

一:利用python讀取Excel中.xls文件中所有數據 #encoding=utf-8 import xlrd import xlwt from xlwt import * fileName="test01.xls" bk=xlrd

原创 數據預處理-將相同ID的字符串進行合併-時間變量操作/csv文件操作(python)

目錄   一:要解決的問題 二:將時間這列變爲標準時間類型 2.1問題描述 2.2 思路 2.3 輸入輸出文件說明 2.4 源代碼 2.5源代碼涉及到的方法總結 2.5.1  DataFrame  2.5.2 datetime(年,月,日

原创 編程-Java學習- BitSet.cardinality()的一個小技巧

        首先我們知道BitSet.cardinary()是判斷bitset中有一個設置爲1的數量。但是如果我們想知道到底是那幾個被設置爲1了該怎麼做? // 從0開始往後依次尋找 for(int i =0 ; i< bitset

原创 機器學習-隨機森林-總結及源代碼應用(python版)

  隨機森林 摘要        隨機森林是一種比較新的機器學習模型。隨機森林對多元共線性不敏感,結果對缺失數據和非平衡的數據比較穩健,可以很好地預測多達幾千個解釋變量的作用(Breiman 2001b),被譽爲當前最好的算法之一(I

原创 編程-Java學習-一個類中調用另一個類中的變量

         本文要解決的是:在一個Java文件裏面如何調用另外一個Java文件裏面的變量。換句話說:如何從一個類中調用另一個類中的變量。 一:無需實例化舉例 public class A { // a是靜態變量(static

原创 編程學習-大整數加法(C語言版)

編程:大整數加法(C語言版) //題目:大整數加法,假定最多隻有101位 //思路:用字符數組形式進行大整數的輸入,然後將數組前後交換順序(con//vert函數,因爲加法是從最低位加起的),然後將字符數組變成數字形式//(shuzi函數

原创 傳統算法-知識總結-遞推+遞歸+分治+動態規劃+貪心算法+回溯算法+分支(Java版)

傳統算法-知識總結-遞推+遞歸+分治+動態規劃+貪心算法+回溯算法+分支 目錄 一:算法基礎 1.1.算法基礎介紹 1.1.1 算法滿足4條性質: 1.1.2 算法定義: 1.1.3 算法設計過程 1.2.歐幾里德算法介紹 1.2.1 定

原创 數據挖掘-項集挖掘--fpgrowth總結(ppt圖片版)

在這篇博客中主要分享一下我製作的關於fp-growth算法的ppt。          

原创 數據挖掘-項集挖掘--apriori算法(ppt圖片版)

ppt版本來介紹我們的apriori算法

原创 大數據-數據集彙總-各種數據集網站/中心

1.購物籃數據集(網站)     在測試fp-growth算法的時候百度到了這個購物數據集     http://fimi.uantwerpen.be/data/    【注】:這是一個數據中心,還有很多其他的數據集