原创 國慶七天更

Python 3 爬蟲、mysql和自然語言處理的一些問題及解決(預告) 第一次(即將)寫博客,請如有不妥請見諒。 本文將在國慶期間開始更新,具體設計內容包括但不限於以下幾個具體問題: 1.Python3 爬蟲基本知識和Pytho

原创 (三)Python3 NLTK(Natural Language Toolkit)安裝和下載的常見問題

NLTK(Python自然語言工具包)用於諸如標記化、詞形還原、詞幹化、解析、POS標註等任務。該庫具有幾乎所有NLP任務的工具。 1.安裝nltk pip install nltk (不要像一開始我一樣傻傻的以爲pip完就結

原创 C++ 大數相乘算法(類似於列豎式)

#include<iostream> #include<string> #include<cstdio> using namespace std; #define MAX 100 int main() { string

原创 (二)Python3 網頁正文提取的各種方法和技巧

本文僅介紹一些簡單易用的網頁正文提取方法,不涉及正文提取的各種原理。 newspaper 功能非常豐富的一個包,不僅僅支持正文提取,也支持翻譯(無字符限制),關鍵詞獲取,正確率較高,還有NLP相關的語料庫。並且有Python2和P

原创 (一)Python3 爬蟲基本知識和爬蟲常用的庫和方法

爬蟲基本知識 爬蟲概念 爬蟲(網絡爬蟲),是一種按照一定規則自動抓取萬維網信息的程序或者腳本。理論上來說,只要是我們在瀏覽器(客戶端)能夠做的事情,爬蟲都可以做。 網頁的特徵 1.每一個網頁都有一個唯一的url(統一資源定位符),

原创 (六)pymysql 數據庫插入的細節問題

插入數據庫的字符串中含有單引號或雙引號 1.使用函數轉換一下字符串再獲得、執行插入語句: pymysql.escape_string(str_content) 2.讓sql語句在讀取到單/雙引號時知道是字符串文本的單、雙引號,即

原创 (七)Python3 實現不限字符的谷歌翻譯方法

如果要對網頁正文進行翻譯,可直接參考:https://blog.csdn.net/qq_42632840/article/details/101938081 谷歌翻譯介紹 谷歌翻譯網址:https://translate.goog

原创 (五)Python3 pyqt5網頁截圖(長圖)的方法和兼容、未完善問題

廢話不說,直接上代碼: #!/usr/bin/env python # -*- coding:UTF-8 -*- # Author:Leslie-x import sys from PyQt5.QtCore import * fr

原创 0% connecting to archive.ubuntu.com 解決

一般都是IPV6網絡問題 解決: 用任意編輯器(nano,vim,vi,emacs)打開/etc/gai.conf文件。 然後找到以下部分(大概在50多行的樣子): # # For sites which prefer IP

原创 阿里雲服務器推薦

可以參考: https://promotion.aliyun.com/ntms/yunparter/invite.html?userCode=nl8ullmi

原创 JAVA BUG解決: put(JSONObject) is undefined for the type JSONArray

博主在從網上copy的將ResultSet轉化爲JSON的代碼中出現了這個BUG public static String resultSetToJson(ResultSet rs) throws SQLException,JS

原创 Eclipse沒有Dynamic Web Project選項解決

1.點擊Help->install new software 2.跳出如下界面後,選擇work with爲自己的版本 3.展開 ”Web, XML, Java EE and OSGi Enterprise Developmen

原创 根據JDK生成對應jre

用管理員權限打開命令行(cmd),然後再命令行中輸入以下信息即可(cd 到jdk所在目錄)。 cd %JAVA_HOME% bin\jlink.exe --module-path jmods --add-modules java.

原创 fatal: The remote end hung up unexpectedly解決

打開所在項目目錄,點擊git bash here後輸入以下命令即可。 git config http.postBuffer 524288000 或者將.git 文件夾中config裏面的postBuffer調大,比如500M

原创 python谷歌翻譯

https://github.com/ssut/py-googletrans pip install googletrans example: >>> from googletrans import Translator >>>