有趣的教程:在PyCharm2019.2版本中集成Jupyter Notebooks!

PyCharm是一種Python IDE,其帶有一整套可以幫助用戶在使用Python語言開發時提高其效率的工具。此外,該IDE提供了一些高級功能,以用於Django框架下的專業Web開發。

嗨,您好!您是否嘗試過在PyCharm 2019.2中集成Jupyter Notebooks?趕快來嘗試一下吧!在這篇博文中,我們將使用PyCharm及其Jupyter Notebook集成來探索一些數據。首先,我們需要所述數據。每當我需要一個新的數據集來玩時,我通常會前往Kaggle,我肯定會找到一些有趣的主題。這一次,一個名爲“ 披薩餐館和他們賣的比薩餅 ”的數據集引起了我的注意。誰不喜歡披薩?讓我們分析一下這些披薩店,並嘗試從中學到一兩件事。

由於這些數據不是我現有任何PyCharm項目的一部分,我將創建一個新項目。

確保使用PyCharm專業版,Community Edition不包括Jupyter筆記本集成。

有趣的教程:在PyCharm2019.2版本中集成Jupyter Notebooks!
提示:在瀏覽器中使用Jupyter Notebooks時,我傾向於爲實驗創建多個臨時筆記本。爲每個項目創建一個PyCharm項目是相當繁瑣的,所以相反,你可以有一個項目用於這樣的實驗。

我喜歡我的東西井然有序,所以一旦項目被創建,我將添加一些結構 - 我將移動下載的數據集的數據目錄,以及筆記本的另一個目錄。

一旦我創建了我的第一個pizza.ipynb筆記本,PyCharm建議安裝Jupyter包並在右上角提供一個鏈接來做到這一點。

有趣的教程:在PyCharm2019.2版本中集成Jupyter Notebooks!
一旦安裝了Jupyter軟件包,我們就準備好了!

90%的數據科學家在他們的Jupyter筆記本中做的第一件事是打字import pandas as pd。此時,PyCharm會建議在這個venv中安裝pandas,只需單擊即可完成:

有趣的教程:在PyCharm2019.2版本中集成Jupyter Notebooks!
一旦我們安裝了pandas,我們就可以將csv中的數據讀入pandas DataFrame:

df = pd.read_csv("../data/Datafiniti_Pizza_Restaurants_and_the_Pizza_They_Sell_May19.csv")
要執行此單元格,請按Shift + Enter,或單擊單元格旁邊的裝訂線中的綠色箭頭圖標。

當您第一次運行單元格時,PyCharm將啓動一個本地Jupyter服務器來執行其中的代碼 - 您無需從終端手動執行此操作。

首先,我們將瞭解該數據集的基本內容 - 它有多少行?列是什麼?數據是什麼樣的?

有趣的教程:在PyCharm2019.2版本中集成Jupyter Notebooks!
我懷疑這些數據僅包含美國餐館的信息。要確認這一點,讓我們計算國家/地區列中的值:

有趣的教程:在PyCharm2019.2版本中集成Jupyter Notebooks!
是的,這個數據集中唯一出現的國家是美國,因此country完全刪除該列是安全的。同樣的,menus.currencypriceRangeCurrency那些價值也是一樣的 - 美元。我也會放棄,menuPageURL因爲它不會給分析增加太多價值,key因爲它會複製其他列(國家,州,城市等)的信息。

我將在這裏做的另一個清理是重命名province列,states因爲它在這個上下文中更有意義,爲了更好的可讀性,我將用狀態的全名替換狀態首字母縮略詞。

有趣的教程:在PyCharm2019.2版本中集成Jupyter Notebooks!
一旦我們完成清理數據,我們如何繪製它?作爲人類,我們更善於在視覺上呈現信息。

首先,讓我們看看我們在這個數據集中最常見的披薩類型。鑑於主題,將它視爲帶有matplotlib的餡餅是合適的

有趣的教程:在PyCharm2019.2版本中集成Jupyter Notebooks!
現在還不是我們的餡餅圖。爲了讓它顯示,我需要%matplotlib inline爲IPython 添加魔術命令,當我在它時,我將添加另一個魔術命令讓IPython知道爲視網膜屏幕適當地渲染圖。

我可以將這些行添加到同一個單元格並再次運行它,但我更喜歡在筆記本的最開始定義這種類型的魔術命令。

要導航到筆記本的最開頭,您可以使用 Cmd+[ (Ctrl+Alt+Left on Windows)。插入新單元格就像鍵入一樣簡單#%%(如果您更喜歡在當前單元格上方插入單元格的快捷方式,Option+Shift+Aon mac, or Alt+Shift+A on Windows)。現在我需要做的就是添加魔術命令並運行下面的所有單元格:

有趣的教程:在PyCharm2019.2版本中集成Jupyter Notebooks!
由餡餅圖可知,現在我們知道最常見的披薩類型是芝士披薩,緊隨其後的是白披薩。

有趣的教程:在PyCharm2019.2版本中集成Jupyter Notebooks!
餐館怎麼樣?我們在數據集中有他們的地理位置,因此我們可以很容易地看到他們所在的位置。

每個餐廳都有一個唯一的ID,並且數據集中可以有多個條目,每個條目代表該餐廳菜單中的披薩。因此,爲了繪製餐廳而不是比薩餅,我們需要按餐館ID對條目進行分組。

有趣的教程:在PyCharm2019.2版本中集成Jupyter Notebooks!
現在我們可以在地圖上繪製它們。對於地理繪圖,我喜歡用情節。確保獲取它的最新版本(4.0.0),以便在PyCharm中很好地渲染圖形輸出。

有趣的教程:在PyCharm2019.2版本中集成Jupyter Notebooks!
人們可以想到我們可以嘗試用這個數據集來回答的一些問題,例如,哪個城市擁有最多/最便宜的Veggie Pizza?或者最常見的比薩餐廳連鎖店是什麼?如果您想玩這個數據集並回答這些或其他問題,您可以蒐集數據並運行您自己的分析。請記住,如果你想用PyCharm試試,請確保你使用的是PyCharm 2019.2專業版。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章