原创 NMF非負矩陣分解

參考文獻:Lee D D , Seung H S . Learning the Parts of Objects by Non-Negative Matrix Factorization[J]. Nature, 1999, 401

原创 利用R ggplot2包進行數據可視化(一)

一個好的可視化例子 各國家都喜愛哪些寵物? by La Nación 作品地址   該作品於2017年10月14日發表在《阿根廷國家報》上,並獲得了2018凱度信息之美獎藝術、娛樂與文化類獎項。該作品以GFK研究所對22個國家的

原创 Python爬蟲學習之selenium+ChromeDriver實現爬蟲

selenium+ChromeDriver實現爬蟲 參考:https://blog.csdn.net/u010986776/article/details/79266448 selenium所做的事情,恰恰是驅動真正的瀏覽器去執行

原创 VMware Ubuntu虛擬機學習筆記(一)

密碼設置與更新: 1.    Root密碼的設定     1)    命令:sudo passwd root     2)    輸入兩遍新的密碼     3)    命令:su root-->輸入密碼-->切入root用戶     4)

原创 Python爬蟲學習之API與模擬ajax請求

API的使用 ——通過API向服務器請求數據 優點:簡單直接,高效率地批量爬取;解決動態網頁的爬取。 缺點:通過API的缺點是有些網站會限制API調用的次數和頻率,用戶需要付費來升級成高級用戶來獲取更靈活的API調用。 HTTP協

原创 Python爬蟲學習之下載源文件與數據存儲

下載源文件與數據存儲 下載源文件 urlretrieve 多用於非結構化的數據(圖片等),以下載http://www.pythonscraping.com 上的logo.jpg爲例: '''urlretrieve''' from