原创 歡迎使用CSDN-markdown編輯器

歡迎使用Markdown編輯器寫博客 本Markdown編輯器使用[StackEdit][6]修改而來,用它寫博客,將會帶來全新的體驗哦: Markdown和擴展Markdown簡潔的語法 代碼塊高亮 圖片鏈接和圖片上傳 LaT

原创 淺談數據挖掘中的關聯規則挖掘

  淺談數據挖掘中的關聯規則挖掘   數據挖掘是指以某種方式分析數據源,從中發現一些潛在的有用的信息,所以數據挖掘又稱作知識發現,而關聯規則挖掘則是數據挖掘中的一個很重要的課題,顧名思義,它是從數據背後發現事物之間可能存在的關聯或者聯

原创 ETL 淺談

ETL是將業務系統的數據經過抽取、清洗轉換之後加載到數據倉庫的過程,目的是將企業中的分散、零亂、標準不統一的數據整合到一起,爲企業的決策提供分析依據。 ETL是BI項目重要的一個環節。 通常情況下,在BI項目中ETL會花掉整個項目至少1

原创 sql---str_replace()用法

str_replace函數的語法很簡單:                      replace("string_expression1", "string_expression2", "string_expression3")  

原创 SQL Server CONVERT() 函數

定義和用法 CONVERT() 函數是把日期轉換爲新數據類型的通用函數。 CONVERT() 函數可以用不同的格式顯示日期/時間數據。 語法 CONVERT(data_type(length),data_to_be_convert

原创 迴歸分析以及r語言實現(一)

一、數據探索階段 1、瞭解變量類型 做迴歸分析前,瞭解數據集是怎樣的?那些是數值型變量,那些是分類變量,這一步是相當重要的。 r代碼: > class(mydata$Middle_Price) [1] “numeric” > cla

原创 R語言學習之關聯規則算法

R語言學習之關聯規則算法  卡卡 2014-03-05 10:42:03 library(arules) #加載arules程序包 data(Groceries) #調用數據文件 frequentsets=eclat(Groc

原创 R語言Data Frame數據框常用操作

Data Frame一般被翻譯爲數據框,感覺就像是R中的表,由行和列組成,與Matrix不同的是,每個列可以是不同的數據類型,而Matrix是必須相同的。 Data Frame每一列有列名,每一行也可以指定行名。如果不指定行名,那麼就是從

原创 R語言中的並行計算

衆所周知,在大數據時代R語言有兩個弱項,其中一個就是隻能使用單線程計算。但是R在2.14版本之後,R就內置了parallel包,強化了R的並行計算能力。 parallel包實際上整合了之前已經比較成熟的snow包和multicore包,m

原创 python零基礎學習2-編輯器選擇

上一篇文章記錄了怎麼安裝Python環境,同時也成功的在電腦上安裝好了Python環境,可以正式開始自己的編程之旅了。但是現在又有頭疼的事情,該用什麼來寫Python程序呢,該用什麼來執行Python程序呢。   其實市面上有很多編輯器都

原创 R語言:基本變量及其之間關係探索分析

一、查看數據結構 dim(iris) # 瞭解數據集的維度,有多少行多少列? names(iris) # 數據有哪些列? str(iris) # 數據的結構如何? attributes(iris) # 數據的列名、行名和數據結構

原创 R語言 RStudio快捷鍵

Pandas讀取數據到Dataframe Python中用Pandas進行數據分析,最常用的就是Dataframe數據結構,之前寫過一篇文章介紹Pandas的基本用法,後來有些朋友問Pandas怎麼從數據庫中讀取數據,怎麼從文件中讀取數

原创 時間序列模型

kings<-scan("http://robjhyndman.com/tsdldata/misc/kings.dat",skip=3) #讀入時間序列數據,忽略前三行 kings kingstimeseries<-ts(kings)#將

原创 python零基礎3——編輯器安裝及破解

於Python開發者來說,選擇pycharm作爲其開發環境真的是一個不錯的選擇,功能強大、界面美觀、支持遠程開發等等一些特點幫助開發者更高效的開發。 百度pycharm 第一個就是官網,官網介紹pycharm有兩個版本:社區版和專

原创 文本分析-相似文章匹配

概念理解: 推薦:在數據挖掘中,推薦包括相似推薦及系統過濾推薦。 1,相似推薦:指當用戶表現出對某人或某物的興趣是,爲他推薦與之相類似的人,或者物,他的核心是,人以羣分,物以類聚 2,協同過濾推薦:指利用已有用戶羣過去的行爲和意見,