原创 機器學習——決策樹(一)

決策樹(DT)是用於分類和迴歸的非參數監督學習方法。目標是創建一個模型,通過學習從數據特徵推斷出的簡單決策規則來預測目標變量的值。 例如,在下面的示例中,決策樹從數據中學習以使用一組if-then-else決策規則來近似正弦曲線。樹越深,

原创 Typora語法詳細教程

Typora教程一、簡介二、主要功能2.1整理檔案2.2目錄清晰2.3導入導出2.4統計字數2.5對焦模式和打字機模式2.6自動配對2.7自定主題三、常用快捷鍵四 、常用語法4.1標題Header1Header2Header34.

原创 網絡爬蟲——正則表達式用法及實例

正則表達式 簡單來說,正則表達式就是描述字符串的一套規則。比如,我們想找出一個網頁中的所有URL鏈接,其他的信息需要過濾掉。那麼此時,我們可以觀察鏈接的格式,然後寫一個正則表達式來表示所有的電子郵件。隨後,我們可以利用該表達式從網

原创 python基礎之元組和列表

元組列表一、(列表、元組)知識點概念1.1 序列(sequence)1.2 容器(container)二、(列表、元組)操作2.1 索引2.2 切片2.3 序列相加2.4 乘法2.5 成員資格三、列表3.1 函數list3.2 基

原创 知識圖譜——中文分詞(CoreNLP)

一、準備 安裝 pip install stanfordcorenlp 下載Standard的CoreNLP包,解壓至python的Tools目錄下,處理中文還需要下載中文的模型jar文件,然後放到stanford-corenlp-ful

原创 網絡爬蟲——爬蟲實戰(一)

圖片爬蟲實戰 假如我們想把jd商城的商品圖片下載到本地,通過手工複製粘貼將是一份非常龐大的工程,此時,可以用Python網絡爬蟲實現。我們可以通過Python網絡爬蟲將這些網頁上的圖片全部爬取到本地,這類爬蟲稱爲圖片爬蟲。 首先打

原创 python基礎之(break、continue、pass、del)

break、continue、pass、del簡介1.跳過循環1.1break(直接結束循環)1.2continue(結束本次循環)2. pass 、 del 和 exec2.1 pass(什麼都不做)2.2 del(使用 del

原创 知識圖譜——命名實體識別(NER)

一、NER簡介        NER又稱作專名識別,是自然語言處理中的一項基礎任務,應用範圍非常廣泛。命名實體一般指的是文本中具有特定意義或者指代性強的實體,通常包括人名、地名、組織機構名、日期時間、專有名詞等。NER包含以下model:

原创 網絡爬蟲——簡介

爬蟲筆記(一) 網絡爬蟲(又被稱爲網頁蜘蛛,網絡機器人,在FOAF社區中間,更經常的稱爲網頁追逐者),是一種按照一定的規則,自動地抓取萬維網信息的程序或者腳本(參考百度百科)。 一、爬蟲分類 爬蟲,可分爲四大類(通用爬蟲、聚焦爬蟲