原创 用lubridate包創建日期與時間

文章目錄@[toc]簡介當前日期與時間創建日期與時間make_datetime獲取各成分時間間隔 簡介 lubridate包用於處理日期和時間,與基礎R相關時間函數相比,它更加容易、易讀。 當前日期與時間 基礎R通過Sys.Da

原创 用stringr包進行字符串處理

文章目錄@[toc]字符串字符串長度字符串拼接字符串分割取字符串子集大小寫轉換去除空格字符串匹配字符串檢測 stringr提供一系列用於字符串處理的函數。它與stringi包有着微妙的關係,相當於簡化版的stringi包。 它名

原创 用dplyr包進行數據處理

文章目錄@[toc]加載包與數據filter選擇個案arrange排序select選擇變量rename變量重命名mutate創建新變量summarize彙總變量 dplyr包是tidyverse系列用於數據處理的包,常用函數有:

原创 tibble數據格式

tibble是tidyverse系列的核心包之一。用來改進R內置數據框存在的許多問題。 比如使用傳統的data.frame數據框,數據列多於輸出面板的寬度時會多行顯示,顯得比較亂。再比如傳統數據框存在一種情況就是容易把字符串取值當

原创 tidyverse初探

文章目錄@[toc]tidyverse簡介安裝體驗管道函數tibble數據格式可視化 tidyverse簡介 tidyverse是一系列數據處理與可視化包的集合,由Hadley Wickham推出。旨在建立同一規範性的R包,以應

原创 用R語言玩遊戲?

文章目錄Rcadefun 從python轉向R語言之後,一方面漸漸入門寫了個R包滿足個人數據分析需求,另一方面就是在github上找各種R包。 最近在github上找到了一個可以玩遊戲的Rcade包,對R語言娛樂性方面的吐槽聲小了

原创 R語言差異檢驗:非參數檢驗

文章目錄@[toc]Mann-Whitney U檢驗適用條件R語言示例Wilcoxon配對秩和檢驗適用條件R語言示例Kruskal-Wallis檢驗適用條件R語言示例Friedman檢驗適用條件R語言示例 非參數檢驗是在總體方差

原创 R語言數據缺失值處理

文章目錄 處理缺失值的步驟一般爲: 識別缺失值 補全個案或刪除個案 個案、行都是指代一個意思 ###識別缺失值 識別缺失值的方法很多,這裏主要介紹三種。 ####is.na函數 R語言中用NA代表缺失值。使用is.na函數

原创 R語言日期值函數

文章目錄@[toc]描述示例 R語言中日期值通常以字符串形式出現,並轉化爲以數值形式儲存的日期變量。 描述 通過函數as.Date()執行這種轉化。 語法格式爲as.Date(x,'input_format'),其中x是字符型數

原创 R語言統計分析簡述

內容目錄 描述統計統計知識差異檢驗相關性分析線性迴歸 R語言統計分析部分貫穿下描述統計到數據建模的過程。基本思路如下。 描述統計 首先,寫一些基礎的描述統計內容。按照變量類型又分爲連續變量和分類變量。 連續變量連續變量主要涉及平

原创 R語言控制流

文章目錄@[toc]重複和循環for結構while結構條件執行if-else結構ifelse結構swith結構 控制流對R語言來說並不常用。for循環在R語言中的運行速度一直爲人詬病。採用向量化運算方法計算比之快幾十倍。 應當儘

原创 Rmarkdown中文PDF輸出方案

文章目錄TinyTeXrticles Rmarkdown文件編譯爲html格式時,支持對中文的顯示。而編譯爲PDF格式時,如果文件內存在中文會出現各種各樣的問題,比如LaTex的顯示問題。 目前最簡單方便的解決方案就是TinyTe

原创 R語言相關性分析

文章目錄@[toc]Pearson相關係數(積差相關係數)適用條件Spearman等級相關係數適用條件Kendall's Tau相關係數適用條件偏相關適用條件R語言實現Pearson、Spearman、Kendall示例偏相關相

原创 R語言差異檢驗:單因素方差分析

文章目錄@[toc]方差分析介紹適用條件分類R語言單因素方差分析示例數據集示例多重比較評估檢驗的假設條件 t檢驗可以解決單樣本、雙樣本時的均數比較。當要比較的組多於兩個時,t檢驗方法就難以滿足這種需求,此時就需要使用方差分析來進

原创 Rmarkdown簡介

內容目錄 [[TOC]] Rmarkdown可以將R代碼嵌入到markdown格式文件中,動態生成研究報告。 通過knitr、pandoc可以將同一份報告編譯成各種格式(html、word、pdf),同時藉助Rmarkdown