原创 《tensorflow》實戰學習筆記(二)——實現Word2Vec

1 Word2Vec簡介        2013年,Google開源了一款用於詞向量計算的工具——word2vec,引起了工業界和學術界的關注。首先,word2vec可以在百萬數量級的詞典和上億的數據集上進行高效地訓練;其次,該工

原创 python之計算文本相似度

1.安裝包 pip install python-Levenshtein 2.demo import Levenshtein a='abc' b='abcd' wer=Levenshtein.distance(a,b)/len(

原创 《tensorflow》實戰學習筆記(一)——實現自編碼器

1 自編碼器簡介         傳統的機器學習很大程度上依賴於好的特徵工程,比如對數值型,日期時間型,種類型等特徵的提取,特徵工程往往是非常耗時耗力的。尤其是在圖像,語音和視頻中提取到有效的特徵就更難了。深度學習則可以解決人工難

原创 卷積神經網絡的概念理解和簡單實現

  卷積神經網絡的(convolutional neural network,CNN)是一種專門用來處理具有類似網絡結構的數據的神經網絡。卷積是一種特殊的線性運算。本文總結了卷積和池化的深入理解,以及一個簡單的卷積神經網絡的實現。

原创 python之去除文本標點符號

        今天做一個文本相似度的小任務,利用python的“Levenshtein”包可對比兩個文本的相似度。爲了消除標點符號的影響,需要去除標點,python的string模塊下的punctuation包含所有的英文標點符

原创 python之glob模塊以及根據路徑獲取文件名

一. glob模塊         glob是python中用來查找符合特定規則的文件路徑名的函數,類似於windows下的文件搜索。可使用匹配符進行文件查找。例如查找某文件夾下的以‘10’開頭且後綴爲‘.jpg’的所有圖片。 E

原创 SnowNLP包情感分析

情感分析(Sentiment Analysis)是自然語言處理裏面比較高階的任務之一。維基百科上的定義是: 文本情感分析(也稱爲意見挖掘)是指用自然語言處理、文本挖掘以及計算機語言學等方法來識別和提取原素材中的主觀信息。 聽着很高

原创 python error系列之tensorflow篇

        電腦崩了,突然識別不出網卡了,然後萬能解決方法——重裝系統🙃。裝完又要重新配環境。因爲要跑的代碼是tensorflow1.3,自動安裝的版本默認是最新的,即使是pip install tensorflow==1.3

原创 conda常用命令小結

1.配置虛擬環境 1.1 創建環境 conda create -n myenv python==3.6 1.2 激活環境 activate myenv 1.3 刪除環境 conda remove -n myenv --all

原创 python之DataFrame篇

DataFrame是python中Pandas庫中的一種數據結構,類似excel,是一種二維表。DataFrame的單元格可以存放數值,字符串等類型數據。python在處理excel數據時通常都會用DataFrame來讀。 1.讀

原创 Python繪製隨機漫步圖

  最近開始學習Python,由於是在jupyter在線練習,所以創建類和可視化操作都放在同一文件中運行。     需要注意的是,Python中單下劃線和雙下劃線的使用區別以及格式的對齊,Python是根據對齊方式自動區分代碼塊的

原创 python之替換函數

1. replace() 語法: str.replace(old, new, max) 參數: old – 將被替換的子字符串。 new – 新字符串,用於替換old子字符串。 max – 可選字符串, 替換不超過 max 次。(

原创 CTPN論文翻譯——中文版

原文鏈接:https://blog.csdn.net/bbbeoy/article/details/83149476 Detecting Text in Natural Image

原创 Python爬蟲豆瓣影評

         Python爬取豆瓣影評並生成詞雲,網上很多案例,我參考的這一篇 Python爬蟲實戰,具體步驟這篇文章講解的很詳細了,不過我在復現的過程中也遇到了很多問題,所以記錄一下。 #coding:utf-8 impo

原创 python做圖片裁剪

引言          python切割圖片有兩種方法,分別是Pillow和OpenCV,因爲我這部分的處理是基於我之前的python提取xml文件中的座標點(labelimg標記文檔)結果的前提下,將所有標註出來的小圖都截取出來