原创 nltk_data離線安裝時的一些坑

在下載好nltk_data並放到nltk搜索目錄後,有以下幾件事要記得做: 1、 運行代碼 import nltk nltk.download() 然後點all ——> download 2、語料庫裏的壓縮文件要記得解壓縮 3

原创 Python常用庫的文檔彙總

Numpy: Numpy官方文檔 2. Pandas: Pandas中文網 3.pdfplumber: https://github.com/jsvine/pdfplumber#python-library

原创 學習自然語言處理的網站

Chinese NLP: https://chinesenlp.xyz/#/ 我愛自然語言處理: http://www.52nlp.cn/category/chinese-information-processing

原创 當計量經濟學遇上機器學習

文章來源:企鵝號 - DIM數據與信息管理 在第十一屆國際信息管理中國夏季研討會(CSWIM,2017)上,衆多資深信息系統專家就“計量經濟學與機器學習結合”的議題展開討論。本期將各位學者的核心觀點加以綜述,以饗讀者。 計量經濟學與機器

原创 Leetcode - - Python刷題之路(二):

【題目描述】 【方法一】:暴力法 循環套循環,一個個遍歷知道找到 i+j = target class Solution: def twoSum(self, nums: List[int], target: int) -> L

原创 #Chrom#

圖文詳解Chrome插件離線安裝方法 - 2019最新終極指南

原创 Anaconda3安裝外部庫的方法

pip3 install XX conda install XX

原创 中文分詞學習筆記一:jieba分詞介紹

一、中文分詞的概念: 二、中文分詞的方法: 三、中文分詞的工具:jieba https://github.com/fxsjy/jieba 特點 (1)支持三種分詞模式: 【精確模式】試圖將句子最精確地切開,適合文本分析; 【全模式】把句子

原创 #PDF#

一、PDF轉Word的方法彙總: PDF 轉爲 Word 的五重境界,從入門到精通,五個方法再次回顧下:   ❶ 只需要局部內容的時候,複製粘貼即可,利用查找替換批量修改不需要的格式; ❷ 高版本的 Word2013/2016 可以直接打

原创 Python刷題之路(一):資料彙總

刷題網站: Leetcode中國 學習網站: 腳本之家——Python數據結構與算法教程

原创 xgboost-0.90-cp37-cp37m-win_amd64.whl is not a supported wheel on this platform.

原因是下載的庫版本與python版本不一致 解決方法: 先查看自己的python版本: import pip._internal print(pip._internal.pep425tags.get_supported()) 參

原创 python庫批量安裝的方法

在使用python的時候免不了要安裝很多的庫,但是一個一個安裝很不方便,而且國外的源往往下載速度很慢,但是,用下面短短几行代碼就可以批量安裝自己自己想要安裝的庫了,而且用的是豆瓣的源,下載速度快了很多! import os # 導入os

原创 《Python金融大數據挖掘與分析全流程詳解》實戰 筆記整理

1、獲取新浪財經實時股票數據 # ============================================================================= # 9.1 新浪股票實時數據挖掘實戰 by 王

原创 《Python金融大數據挖掘與分析全流程詳解》第10章 PDF文本解析 筆記整理

1、PDF批量下載 步驟: (1)模擬搜索要下載的pdf關鍵詞,得到下載頁面的內容 (2)提取出標題、鏈接、日期;篩選出2018-2019年的 (3)訪問下載鏈接,模擬點擊下載按鈕下載。這裏要注意添加time.sleep()作爲等待下載的

原创 《Python金融大數據挖掘與分析全流程詳解》網頁爬蟲 筆記整理

3.1 提取百度新聞標題、網址、日期及來源 # ============================================================================= # 3.1 百度新聞數據挖掘 b