原创 python開發環境搭建

1、概述 python是目前人工智能開發使用最爲廣泛的語言,隨着深度學習、神經網絡以及tensorflow等人工智能框架的發展。python的應用也變得越來越廣泛。下面截圖是tiobe 2018年10月編程語言的排行榜。 同樣在人工智能

原创 python成語接龍

1、概述 在python開發中要熟練字符串、列表、元組、字典等多種數據類型的使用,本文通過實現簡單的成語接龍,來鞏固python中的基礎功能。 2、處理語料 我們可以從互聯網上下載成語大全等語料,建議建議對語料進行處理和清洗之後讀取到列表

原创 beautiful soup 4.0(bs4)基本應用(1)

1、概述 人工智能行業的發展是以大數據爲基礎的,在人工智能行業當中,數據比模型本身要重要的多。從一定程度上來講大量優質的數據可以彌補模型的缺點。而大數據所所涉及的範疇會非常的廣泛,有很多在垂直行業深耕很多年的企業會積累很多的行業數據。但這

原创 beautiful soup 4.0(bs4)遍歷文檔樹(2)

1、概述 在使用爬蟲程序對爬取的文檔進行處理時,經常要做的一個操作就是遍歷文檔樹。文檔以樹形結構進行組織,所以遍歷文檔的操作又叫遍歷文檔樹。beautiful soup本身提供了很多遍歷文檔樹的方法,本文主要討論遍歷文檔樹的方法。 2、遍

原创 beautiful soup 4.0(bs4)搜索文檔樹(3)

1、概述 在上一篇文章中,主要介紹遍歷文檔樹的方法。遍歷文檔樹主要從文檔的根節點開始,對文檔進行逐一掃描。這是文檔解析中一個非常重要的操作。除了這個操作之外,還有一個非常重要方式就是搜索文檔樹,搜索文檔樹並不是從根節點開始逐一的對文檔進行

原创 beautiful soup 4.0(bs4)使用css選擇器搜索文檔樹(4)

1、概述 上一篇文章中主要介紹了使用bs4搜索文檔樹,主要使用find與find_all方法。但這種搜索的方法主要專注於標籤以及標籤的屬性。其實在html中可以被用來作爲元素選擇器的還有一種就是CSS,在css的任何版本中都有選擇器的相關

原创 敘事文章的生成(論文翻譯)

1、概述 本文章是對國外一篇論文【 2002 Elsevier Science B.V.】的翻譯,主要介紹了一種敘事文章的生成。 一直以來,由於過度關注對故事語法與情節設計,敘事文章的生成的寫作質量很差。此外,迄今爲止的自然語言生成系統還

原创 使用gensim處理文本(2)主題分析與向量轉換

1、概述在之前的文章中我們建立了字典文件,並使用詞袋模型來表示一個文檔,但這種表示方式是基於詞頻的簡單模型。有的時候需要對模型進行轉換。常見的模型有:tfidflsilda等2、tfidf模型我們使用字典文件可以非常直觀生成tfidf模型

原创 知識存儲(1)-neo4j圖形數據庫安裝

1、概述數據存儲的方式有很多種,在常規開發中見到最多的就是關係型數據庫。關係型數據庫以實體關係方式來構建數據。但從數據庫構架的本身來講是重實體輕關係。隨着知識爆炸與互聯網以及大數據人工智能技術的發展。傳統的數據庫已經不能夠滿足人們對於數據

原创 簡單的意圖分析模型(1)-數據處理

1、概述 在聊天場景中有很多情況下需要對用戶的意圖進行分析。這些分析功能基本上就是自然語言分類模型的變種。從技術難度上來講這種模型實現比較簡單。但要保證效果主要受一下幾個方面的制約。 詞向量的準確程度 語料的多少 模型的選擇 詞向量是一個

原创 簡單的意圖分析模型(2)-模型構建

1、概述 在之前文章中已經對數據做了比較充分的處理,而且已經轉化爲張量,可以直接讀取到tensorflow中進行訓練。在本章中將構建神經網絡模型來實現意圖分析的訓練與預測。 2、構建神經網絡 爲了更好的構建模型首先對輸入數據進行簡單分析,