原创 數據預處理-判斷csv文件中每一行中空格/(數據值)數量(python版)
一:問題描述: 如下圖所示,我們要統計表格中每行數據值(例如藝術,設計,歷史是三個數據值)的個數 二:空格替換逗號 從表格中可以看到有些數據值之間是空格,有些數據值之間是逗號。我們利用excel本身有的搜
原创 Java學習-list《int[]》總結 - list《int》 position = new Arraylist《int》(5)使用
List<int[ ]> position = new ArrayList<int [ ] >(5)的使用以及該結構的形式及內容。 package temp; import java.util.ArrayList; import ja
原创 java學習-求解一個list列表中所有整數的平均數和方差
由於Java中不像python中那樣有現成的numpy包 #求平均數 #arr_mean = np.mean(arr) #求方差 #arr_var = np.var(arr) 因此我們需要根據平均數和方差的定義來求解,具體代碼見下:
原创 數據預處理-Excel表中如何在數據中批量添加(括號)/「尖括號」等
1.問題: Excel表中如何在數據中批量添加(括號)/<尖括號>等 2.解決辦法: 假設數據在A列,在B1輸入="<"&A1&">",然後通過右下角往下填充就可以了。 3.樣例:
原创 數據預處理-Excel 兩列合併爲一列中間加空格
一:問題描述 把Excel中兩列數據合併爲一列,並且以空格隔開。 二:方法一 把Excel中的兩列數據複製粘貼到txt文本文檔中,再從txt文本文檔中把數據粘貼到excel中的某一列。 【注意】
原创 數據處理-對Excel文件讀取和操作和存儲(python版)
一:利用python讀取Excel中.xls文件中所有數據 #encoding=utf-8 import xlrd import xlwt from xlwt import * fileName="test01.xls" bk=xlrd
原创 數據預處理-將相同ID的字符串進行合併-時間變量操作/csv文件操作(python)
目錄 一:要解決的問題 二:將時間這列變爲標準時間類型 2.1問題描述 2.2 思路 2.3 輸入輸出文件說明 2.4 源代碼 2.5源代碼涉及到的方法總結 2.5.1 DataFrame 2.5.2 datetime(年,月,日
原创 編程-Java學習- BitSet.cardinality()的一個小技巧
首先我們知道BitSet.cardinary()是判斷bitset中有一個設置爲1的數量。但是如果我們想知道到底是那幾個被設置爲1了該怎麼做? // 從0開始往後依次尋找 for(int i =0 ; i< bitset
原创 機器學習-隨機森林-總結及源代碼應用(python版)
隨機森林 摘要 隨機森林是一種比較新的機器學習模型。隨機森林對多元共線性不敏感,結果對缺失數據和非平衡的數據比較穩健,可以很好地預測多達幾千個解釋變量的作用(Breiman 2001b),被譽爲當前最好的算法之一(I
原创 編程-Java學習-一個類中調用另一個類中的變量
本文要解決的是:在一個Java文件裏面如何調用另外一個Java文件裏面的變量。換句話說:如何從一個類中調用另一個類中的變量。 一:無需實例化舉例 public class A { // a是靜態變量(static
原创 編程學習-大整數加法(C語言版)
編程:大整數加法(C語言版) //題目:大整數加法,假定最多隻有101位 //思路:用字符數組形式進行大整數的輸入,然後將數組前後交換順序(con//vert函數,因爲加法是從最低位加起的),然後將字符數組變成數字形式//(shuzi函數
原创 傳統算法-知識總結-遞推+遞歸+分治+動態規劃+貪心算法+回溯算法+分支(Java版)
傳統算法-知識總結-遞推+遞歸+分治+動態規劃+貪心算法+回溯算法+分支 目錄 一:算法基礎 1.1.算法基礎介紹 1.1.1 算法滿足4條性質: 1.1.2 算法定義: 1.1.3 算法設計過程 1.2.歐幾里德算法介紹 1.2.1 定
原创 數據挖掘-項集挖掘--fpgrowth總結(ppt圖片版)
在這篇博客中主要分享一下我製作的關於fp-growth算法的ppt。
原创 數據挖掘-項集挖掘--apriori算法(ppt圖片版)
ppt版本來介紹我們的apriori算法
原创 大數據-數據集彙總-各種數據集網站/中心
1.購物籃數據集(網站) 在測試fp-growth算法的時候百度到了這個購物數據集 http://fimi.uantwerpen.be/data/ 【注】:這是一個數據中心,還有很多其他的數據集