原创 簡單網頁前端設計(圖片搜索引擎)

在wampserver運行的php腳本更改的別人的模板index.php<!DOCTYPE html> <html lang="en"> <head>     <meta charset="utf-8">     <meta http-e

原创 基於極值區域與連通區域的圖片中文本區域定位

一、極值區域極值區域(Extremal Region)是指圖片中一片相似區域的集合,此集合內所有的像素值都與外界的像素值存在着較大的差距。可以理解爲區域外邊界的像素值嚴格大於區域內像素值的區域。極值區域在數學上的定義,首先將圖像I視爲一種

原创 Tensorflow模型數據的存儲與讀取

Tensorflow是谷歌開發的深度學習框架,目前運用已經被廣泛應用各種項目,關於Tensorflow框架的介紹這裏就不詳細闡述了,本文針對那些對Tensorflow有所瞭解,可以根據教程編寫訓練和測試Minist數據集的同志們。運行環境

原创 網站建設與深度學習(PHP調用Python程序)

一、深度學習應用我採用的時Google開發的Tensorflow深度學習框架,基於Python編寫的圖片語義描述深度學習應用。二、PHP調用php中無法帶調用python程序中的方法,但是可以用命令行執行python程序,但是不知道什麼原

原创 基於內容的推薦算法之關鍵詞提取

基於內容的推薦算法是比較早期的易理解的推薦算法,其主要思想就是:我們首先給根據信息的特徵給信息一些屬性(可以稱之爲“標籤”)。對於一篇文章,或者一段話它的屬性就可以理解成它的關鍵詞,這篇文章的主講內容就是文章的關鍵詞提取。一、TF-IDF

原创 Lucene實現中文分詞

在之前的文章中已經介紹過Lucene了,這裏就不多做介紹。一、中文分詞的原理中文分詞是將一個漢字序列切分爲一個一個單獨的詞。分詞就是講連續的字序列安裝一定的規範重新組合成詞序列的過程。隨着機器學習的發展,很多分詞的方法都已經被科研人員實現

原创 簡單垂直搜索引擎入門(java+Lucene)

一、垂直搜索引擎介紹垂直搜索引擎是搜索引擎的一種,是搜索引擎的細分和延伸,可以簡單地理解爲在某個領域的搜索引擎,例如在你的所有文檔中搜索相關內容,在你的項目文件中搜索帶有“test”字眼的文檔。二、Lucene介紹Lucene是一款開源的

原创 信息檢索中的特徵空間變化

一、背景及概述    對於一篇文章或者是一段文字信息,我們想要獲取其中的關鍵信息,如果是中文,我們首先要對其進行分詞的預處理,中文分詞有很多開源的技術,如python就有結巴模塊用來做中文分詞,網上有很多博客詳細講解,這邊不是我們這部分工

原创 Windows平臺下利用WampServer搭建服務器

一、各種環境win10系統,WampServer3二、具體步驟首先到官網上下載WampServer並按照步驟安裝,運行。啓動所有服務,更改相應配置:首先右鍵任務欄中WampServer圖標,在Setting中選擇Meun item :On