原创 個人Django博客項目

本站是基於的Hexo博客主題 Material X ,改用 Python3.6.3+Django2.17編寫的,後臺集成Markdown編輯器 mdeditor,前端代碼高亮使用的是highlight.js插件。 項目地址: ht

原创 ggplot2學習筆記之構建圖層

傳統的畫圖函數(如plot、qplot)就好比在一張畫布上畫圖,畫好之後不能修改,而且只能使用一個數據集;而圖層的思想是在多張透明的畫布上繪圖,再把這些畫布按順序疊加在一起形成一個完整的圖形。每一張畫布都可以使用不同數據集,可以單

原创 JDK環境變量配置(linux)

作爲筆記使用   下載jdk-7u71-linux-x64.gz壓縮包 1. 新建“/usr/java”文件夾(需要root用戶)   2. 把jdk文件複製到“/usr/java”文件夾下   3. 使用命令“tar zxvf jd

原创 ggplot2學習筆記之qplot

#ggplot2 之從qplot 開始 qplot 是包ggplot2 中的一個快速畫圖函數,如果你已經對R 的基礎包畫圖函數plot基本掌握,那麼qplot 就很容易掌握了。 install.packages(‘ggplot2’

原创 python獲取新浪新聞

1、獲取新浪新聞的標題以及要聞,保存到txt中(目錄以及文件名可以自定義); 2、新聞包括國內新聞、國際新聞、社會新聞(依據提示選擇); 3、運行環境,python2.7、win8.1(64位)、IDE(pycharm4.5)。

原创 爬取淘寶MM圖片

獲取淘寶MM的所有用戶主頁的圖片。以下是代碼(包含註釋),運行環境是win、python2.7.10: #coding:GBK import requests import json,re from lxml import etr

原创 ggplot2學習筆記之位置標度

每一幅圖形一定擁有兩個位置標度,一個指定水平位置(x 標度),另一個是指定豎直標度(y 標度)。ggplot2 提供了連續性、離散型(針對因子型、字符型、邏輯向量)、以及日期型。 對所有的位置座標來說,修改座標軸範圍是一項常見任務

原创 jiebaR中文分詞,並做詞雲(R語言)

使用結巴中文分詞(jiebaR)對之前爬取的新浪新聞 文本進行分詞,統計詞頻之後,使用包wordcloud畫詞雲。 1、讀入數據 以下數據是在這裏爬取的,這裏只對社會新聞類進行測試,文件還是比較大的。分詞完有一千多萬個詞,處理完後

原创 CSS筆記(語法)

CSS 規則: 由選擇器和聲明(一條或多條)組成: 選擇器通常是您需要改變樣式的 HTML 元素; 每條聲明由一個屬性和一個值組成。 CSS聲明總是以分號(;)結束,聲明組以大括號({})括起來: p { color:red

原创 60 個實用的 R 語言技巧(轉載)

本文轉載自: 60 個實用的 R 語言技巧 | EthanDeng +http://ddswhu.com/2015/09/07/60-r-tips/ 轉載請註明以上的原文地址。   本文內容來源於 Rstatistics.net 的 6

原创 centos mysql 安裝及配置

轉自百度經驗 工具/原料 接入Internet的Centos計算機 安裝Mysql 查看mysql-server包列表 yum list mysql-server 當只有一個時候就可直接安裝,過程中選擇Y繼續安裝 yum

原创 初識Scrapy-實戰(一)

接觸爬蟲也有一段時間了,起初都是使用request庫爬取數據,並沒有使用過什麼爬蟲框架。之前僅僅是好奇,這兩天看了一下scrapy文檔,也試着去爬了一些數據,發現還真是好用。 以下以爬 易車網的銷售指數爲例。具體過程就不多說了; 需要的字

原创 使用 dplyr 包進行數據操作與清洗 | EthanDeng(轉載)

本文轉載自:使用 dplyr 包進行數據操作與清洗 | EthanDeng+http://ddswhu.com/2015/02/05/dplyr-data-clean-manipulation/ 轉載請註明以上原文地址。 使用 dply

原创 中文文本聚類(切詞以及Kmeans聚類)

簡介 一 切詞 二 去除停用詞 三 構建詞袋空間VSMvector space model 四 將單詞出現的次數轉化爲權值TF-IDF 五 用K-means算法進行聚類 六 總結 簡介 查看百度搜索中文文本聚類我失望的發現,網上

原创 R語言連接Mysql數據庫的步驟及簡單使用(學習筆記)

實驗環境:win8.1-64操作系統,MySQL5.6 1、下載(mysql-connector-odbc-5.3.4-winx64.msi) 下載地址:http://dev.mysql.com/downloads/conn