原创 【python學習手冊(第3版)】第6章動態類型簡介

python中,類型是在運行過程中自動決定的,而不是通過代碼去聲明。>>>a = 3上面的代碼反映了python語言中所有賦值的操作:創建一個對象來代表值3創建一個變量a,如果它還沒有創建的話將變量與新的對象相連接其中,a代表對象,3代表

原创 解決pyinstall打包python文件遇到的問題

1、環境說明     Windows7,Anconda+Python3.5.2,64位系統。 2、開始安裝 pip install pyinstall 安裝成功,一切看起來很順利,但實際上當你運行打包代碼的時候,可能出現如下問題 py

原创 解決 No module named 'resource' 問題

最近在本地裝了一個pyspark,在運行的過程中,總會遇到這樣的報錯。這是jupter notebook的cmd窗口。 以下是我運行的一段代碼 stringJSONRDD = sc.parallelize((""" { "id":

原创 【利用python進行數據分析】準備與實例(一)

我已經分享了本書的ipynb,所以跟着我一起來實驗吧。如果你不懂怎麼打開ipynb格式的文件,那也沒關係,anaconda3讓一切變得更簡單(我像是打廣告的)。安裝玩anaconda之後,我們在開始裏就可以找到它的文件夾,裏面有一個Jup

原创 【Java】多線程的使用

簡而言之:一個程序是由進程組成,一個進程是由線程組成的。一個程序中可以存在多個進程,一個進程中可以存在多個線程。 單線程:一條主線執行下去,沒有分支。 public class TestMain { public static voi

原创 藉助Kesci的K-Lab平臺進行Iris數據分析

之前參加了Kesci網舉辦的中國聯通“沃+海創”開放數據應用大賽,在比賽中認識了許多大牛,同時也認識了Kesci平臺的一位李哥。應李哥邀請,幫他們推廣一下該平臺的實驗室,前段時間由於自己事情太多,直到最近才閒下來,遂做了一下整理。 嘗試了

原创 手把手教你快速安裝keras

安裝環境:win7+anaconda3.5.12 依次輸入以下命令,注意所有命令都是用得conda命令,因爲conda安裝可能比pip安裝更穩定 conda install theano conda install mingw lib

原创 【Java】方法的重載

問: 什麼是方法的重載呢? 答: 如果同一個類中包含了兩個或兩個以上方法名相同、方法參數的個數、順序或類型不同的方法,則稱爲方法的重載,也可稱該方法被重載了。如下所示 4 個方法名稱都爲 show ,但方法的參數有所不同,因此都屬於方法的

原创 【NLP】如何理解n-gram模型

最近在研究NLP的相關知識,然後就遇到了n-gram這個模型。拜讀了高老師的博客後,覺得通俗易懂,所以對知識進行了以下整理。 維基百科的定義:在計算語言學中,n-gram指的是文本中連續的n個item(item可以是phoneme, sy

原创 數據工程師的成長之路

最近,我和導師、同門一起交流,說到怎麼才能成爲一名合格的數據工程師,要學什麼樣的教材,對於技術的學習是否是有規律可尋進行了探討。談談作爲一名計算機專業的學生,我是如何來進行學習的。 注重基礎,《python學習手冊》無疑是一本不錯的入門手

原创 【利用python進行數據分析】第5章pandas入門

pandas的數據結構介紹 要使用pandas,你首先就得熟悉它的兩個主要數據結構:Series和DataFrame。雖然它們並不能解決所有的問題,但它們爲大多數應用提供了一種可靠的、易於使用的基礎。由於頻繁的使用pandas、Serie

原创 【利用python進行數據分析】第4章numpy基礎

Numpy的ndarray:一種多維數組對象 NumPy最重要的一個特點就是其N維數組對象(即ndarray),該對象是一個快速而靈活的大數據集容器。你可以利用這種數組對整塊數據執行一些數學運算。其語法跟標量元素之間的運算一樣: fro

原创 【python數據抓取技術與實戰】BeautifulSoup

中文翻譯:美麗湯。光聽聽名字就覺得是一個很棒的工具。言歸正傳,說說我們抓取的數據。其實返回的數據都是有結構化的。一般會遇到的三種結構化的返回數據,分別是HTML、XML和json。今天所介紹的BeautifulSoup就是python中處

原创 【python數據抓取技術與實戰】單機數據抓取

1、單機順序抓取這裏使用的是Spynner庫進行單進程抓取,通常用於目標明確及抓取內容數量不是很大的情況。加之我們用的python3,安裝過程也複雜,所以我們就不必在這部分花時間了。但在這裏,我們做一個簡單的介紹。優點:Spynner基於

原创 【python數據抓取技術與實戰】正則表達式

我之所以把正則表達式單獨羅列出來講,是因爲我覺得它在爬蟲技術中的地位真的非常重要。所以,這個章節你也要打起精神學習。先來看看它是個什麼工具正則表達式是處理字符串的有力工具。python中有個re模塊提供了大量的方法,能實現正則表達式相關的