原创 R語言ggplot包之數據分佈彙總

引言 我們經常想觀察一批數據的分佈形態,直方圖、密度圖、箱線圖、小提琴圖和點圖等都是很好的實現形式。在此,我們簡略介紹直方圖、密度圖和箱線圖,這種三種圖形對我們來說更爲常用。 直方圖 很多人沒搞清楚條形圖和直方圖之間的區別。條形圖

原创 R語言ggplot2包之註釋

引言 光光展示數據對可視化來說,遠遠不夠。還有其他很多信息能夠幫助讀者解釋你的數據。除了標籤、座標軸、圖例外,還能夠增加註釋,比如強調圖畫的某一區域,添加描述性文本等。 添加文本註釋 你可以在圖形中添加文本,增加可讀性。我們在an

原创 R語言ggplot2包之畫直方圖

引言 ggplot2包的作圖質量毋庸置疑,但是其作圖語法對新手來說還是有點難度,ggplot2:數據分析與圖形藝術這本書也介紹了ggplot2包的基本哲學思想和操作,個人感覺例子還不夠豐富,所以對該包的用法還是停留在半瓶醋的水平。

原创 R語言ggplot2包之畫散點圖

引言 散點圖是描繪兩個連續型變量之間關係的圖形,特別是在觀察兩個變量之間的相關關係時特別好使。 散點圖基本操作 aes中的x,y值分別表示在x,y軸的變量;geom_point表示增加三點圖圖層,其中的size控制點的大小,sha

原创 利用python3 requests和BeautifulSoup4抓取百度貼吧研究生錄取通知書並展示

引言 又到一年廣大準研究生收穫的季節,各位準研究生陸續收到了待錄取學校的通知書,爲了紀念曾經感動自己的歲月,很多研究生小鮮肉在百度貼吧考研吧版塊發了自己的錄取通知書圖片。樓主對各個學校的研究生錄取通知書挺感興趣,咱們不如做個爬蟲,

原创 一位數據挖掘小夥的個人管理工具(不斷優化中)

引言 做好個人管理非常重要,這會讓你在信息爆炸的社會中減少憂慮。經過不斷的摸索,適合本人的個人管理可以分爲以下幾類:todo管理,信息與資料來源管理,信息儲存管理,知識學習管理,思維管理,健康生活管理,財富管理。 將涉及到的軟件、網站

原创 伍德里奇計量經濟學導論之計算機操作題的R語言實現(多元迴歸:估計)

引言 不知不覺,研一生活已經過去一半了,看自己現在的狀態,不由得慚愧,時間管理不夠好,學習沒有跟上。儘量爭取多寫點博客,算做對自己的安慰。 本博文代碼和rmd文檔見下載 c3.1 ##(1) #B2的符號最有可能爲正,更高的家庭收入意味

原创 多元統計分析上機題之R語言實現(因子分析)

引言 雖然沒有仔細推導書中較爲繁瑣的公式,但是對於以應用爲主的我來說已經夠了。最重要的還是瞭解多元統計的思想和解決問題分析步驟。 因子分析也是一種降維技術,但是它跟主成分分析又有很大不同。主成分分析主要是將多個變量線性組合爲少數幾個變量

原创 利用python將夏普WG-S20輸出的BMP轉化成pdf併合並

使用方式: 1. 命令行下 或者(cmd)進入image2pdf.py 所在文件夾 image2pdf.py下載 2. 輸入 python image2pdf.py EXPORT EXPORT1 EXPORT2 3. EXPOR

原创 python或者postgresql圖形化界面連接postgresql拒絕訪問

##Q1: could not connect to server: Connection refused Is the server running on host "localhost" (::1) and accepting TC

原创 python 安裝pandas 出現InsecurePlatformWarning: A true SSLContext object is not available.

python 安裝pandas 出現InsecurePlatformWarning: A true SSLContext object is not available. 操作系統:ubuntu 14 python 版本:2.7.6 當我

原创 postgresql 出現 Is the server running locally and accepting connections on Unix domain socket "/var/r

postgresql 出現 Is the server running locally and accepting connections on Unix domain socket “/var/run/postgresql/.s.PG

原创 多元統計分析上機題之R語言實現(多元正態分佈)

引言 本學期也開了一門多元統計分析課程,也趁機想把課後上機題實現一遍,以增強理解。 教材使用的是約翰遜的《多元統計分析》第六版,中英文版教材、數據集、講義見 還參考了王斌會老師的《多元統計分析及R語言建模》 本文內容主要爲第4章多元正態

原创 多元統計分析上機題之R語言實現(主成分)

引言 主成分分析是一門降維的技術,即將多個指標用少數幾個綜合指標表示出來。主成分分析可以用於變量的降維和數據的解釋。 本節數據可從多元統計分析上機題之R語言實現(多元正態分佈)下載。 主成分分析基本步驟 1.將原始數據標準化,用scal

原创 伍德里奇計量經濟學導論之計算機操作題的R語言實現(一些重要專題)

引言 本章內容介紹了多元線性迴歸一些好玩且實用的專題: 改變自變量(因變量(對數自變量)當度量單位對因變量(自變量)、係數、t值、F值等的影響 自變量和因變量標準化以後B係數的解釋 對數-水平模型下,B係數當精確解讀以及二次模型來表明