原创 Python3各種數據結構下的排序及去重彙總

** 0.Array數組的排序; 1.List的排序; 2.dict的排序; 3.DataFrame和Series的排序;** 4.List的元素去重 5.DataFrame的元素去重 6.List的元素去重 0.Array數組的

原创 Kaggle競賽中最終成爲0.3%的獲獎經驗

自動化數據準備及協作平臺Dataland的聯合創始人Lavanya Shukla,在博客上分享了她在Kaggle競賽中最終成爲0.3%的獲獎經驗。 先放上原文地址: https://www.kaggle.com/lavanyash

原创 恐怖襲擊等級預測量化與ARMIA時間序列建模的例子

一.恐怖襲擊的全球分佈量化圖:(量化分類由k-means算法得) # coding:utf-8 import pandas as pd import mpl_toolkits.basemap #地圖只在S

原创 pd.read_excel()練習

# -*- coding: utf-8 -*- import pandas as pd import numpy as np df11=pd.read_excel("C:/Users/Administrator/Desktop/

原创 Chrome71中HTTP Graph Collector Chrome插件離線安裝方法

httpgraph插件檢測自己主機對web頁面的訪問,並將web頁面間關係用Gephi做可視化。效果圖如下所示: 1.下載插件:HTTP Graph Collector Chrome https://extension.extfan

原创 word2vec 中的數學原理詳解

word2vec 中的數學原理詳解      word2vec 是 Google 於 2013 年開源推出的一個用於獲取 word vector 的工具包,它簡單、高效,因此引起了很多人的關注。由於 word2vec 的作

原创 Echarts繪圖使用經驗

摘要 1.如何查找echarts相對路徑中的數據文件(針對動態加載); 2.他山之石可以攻玉(通過類比echarts其他代碼中的相同鍵值對的書寫,做相同字段的靜態直接替換,或者對近義詞字段直接做替換來繪圖) 1.查找echarts相對

原创 sklearn多標籤分類算法練習

1.例1 import numpy as np import pandas as pd import scipy from scipy.io import arff #數據集 data, meta = scipy.io.arff.lo

原创 DataFrame和Series練習

主要練習DataFrame的 import pandas as pd zhou=[[1,2,3,4],[5,6,7,8]] df=pd.DataFrame(zhou,columns=['x1','x2','x3','x4']) df1

原创 基於SVD分解的簡易菜品推薦系統

簡易推薦系統功能: 1.基於物品相似度,向同一用戶推薦不同的相似商品(user:items=1:N); 2.基於用戶相似度,將同一商品推薦給不同的未購買用戶(users:item=N:1); #coding=utf-8 """ 簡易推

原创 Excel中多個模型的ROC曲線的同時繪製

1.ROC曲線繪製 2.AUC計算原理 1.ROC(receiver operating characteristic curve )曲線,中文名是接受者操作特性曲線,ROC是指在特定刺激條件下,以被試在不同判斷標準下所得的虛報概率P

原创 LDA主題模型練習1

**1.**本文針對LDA主題模型進行學習和聯繫,核心摘要如下: **2.**NLP中的共現對應條件概率(獨立時最特殊),最大似然估計計算字符的共現例子: **3.**LDA主題模型代碼實例 #-*-coding:utf8-*- im

原创 GaussianHMM和ensemble.bagging的例程

import numpy as np import matplotlib.pyplot as plt import matplotlib as mpl from sklearn.linear_model import RidgeCV

原创 迴文字母卡片序列的基元素長度

package CommandPattern1.edu.com; import java.util.Scanner; public class Test4 { public static boolean isHuiWen(

原创 weka和meka的.bat批量處理命令小結

1.weka和meka中都可以先導入數據,然後直接選擇模型配置各項參數,然後右鍵複製模型配置參數,粘貼到記事本中再做少量添加就變成了可執行的命令行命令。命令行執行可以輸出各個樣本預測的概率和標籤。 2.最笨的命令行方式(需要批量處理的