原创 MySQL索引詳解

文章目錄一、索引簡介二、索引的分類與創建2.1、普通索引2.2、唯一索引2.3、主鍵索引2.4、組合索引2.5、全文索引三、索引的弊端與注意事項3.1、弊端3.2、注意事項四、什麼情況需要創建索引4.1、需要創建索引的時候4.2、

原创 jiaba庫之關鍵詞提取(增量更新自定義語料)

一、提取語句關鍵詞 在自然語言處理中,經常會遇見對文章或者信件進行關鍵詞提取。而jiaba庫正給我們提供了兩種簡單的關鍵詞提取方法(TF-idf與TextRank)。本文不講這兩方式提取關鍵詞的原理,只注重如何實現。在Python

原创 《運營之光》讀書筆記

前言         在很多人看來,“運營”這個職位就是一個打雜的,主要是因爲互聯網公司內的運營崗位和運營工作的職責是高度不標準的。不同類型的運營崗位負責的內容天差地別;同一類型崗位不同類型產品的運營鎖負責的內容也不盡相同。因此

原创 pandas.get_dummies (獨熱編碼)詳解

1、pandas.get_dummies使用場景         在對變量進行獨熱編碼時使用,例如:某一列類別型變量是季節,取值爲春、夏、秋、冬,當我們對其進行建模時,需要將其進行獨熱編碼,這時:pandas.get_dummie

原创 爬蟲常見問題彙總

1、webdriver.Chrome設置無界面模式 from selenium import webdriver from selenium.webdriver.chrome.options import Options chr