原创 Java中Java.util.Date無法導入的問題

昨天我遇到了這個糾結的問題,搞死了快被它,用的是jdk1.80,暑假裏面才裝上的,準備自學的勒,結果被卡在這時間格式化上老半天,我一開始寫的程序是: //import java.text.DateFormat; import java.u

原创 解決vs2010“創建或打開C++瀏覽數據庫文件 發生錯誤”的問題 Microsoft SQL Server Compact 3.5

 有網友說打開vs2010安裝光盤,搜索 SSCERuntime_x86-chs.msi,重新安裝之。於是果斷搜索,發現SSCERuntime_x86-chs.msi,另外發現一個SSCEVSTools-chs.msi果斷兩個都安

原创 Lucene初探之數據格式詳情(五)

Lucene初探之數據格式詳情(五) 在前幾篇文章中我們瞭解了索引文件中關於索引的正向信息和反向信息的存儲格式。除了正向信息和反向信息之外,還有一種不可或缺的信息也保存在索引文件中–索引因子。 我們在開篇幾張中介紹索引的搜索過程時,提到搜

原创 Lucene初探之索引過程分析(一)

Lucene初探之索引過程分析(一) 經過上面的學習,我們對於Lucene的索引文件的存儲原理有了初步的瞭解,不過了解了這些只是爲隨後的操作Lucene打下了一個很小的基礎,我們無法依靠這些知識就去自完成搜索引擎的整個設計。接下來,我們將

原创 Lucene初探

Lucene是一個基於Java的全文檢索庫,它高效、開源。爲什麼叫它全文檢索庫呢?這得從人們生活中的數據結構來說起。 人們在使用各種軟件服務的時候會產生各種的數據,這些數據會被相關軟件服務提供商按照不同的規則存儲起來,當人們需要的時候

原创 maven resources導致打包失敗分析與解決

今天在工作時遇到一個測試環境maven打包失敗的問題。一開始的時候jenkins只顯示了打包失敗,沒有其他的信息展示出來,在將項目拉取到本地之後,項目又可以完好地啓動,於是判斷可能是maven打包時出錯,於是終端進入對應目錄之後,輸入以下

原创 Python3爬取今日頭條有關《人民的名義》文章

Python3爬取今日頭條有關《人民的名義》文章 最近一直在看Python的基礎語法知識,五一假期手癢癢想練練,正好《人民的名義》剛結束,於是決定扒一下頭條上面的人名的名義文章,試試技術同時可以集中看一下大家的腦洞也是極好的。 首先,我們

原创 Lucene初探之計算文章相關性權重

在上一篇文章中,我們大概瞭解瞭如何使用搜索語句對索引進行搜索,但是在搜索完成之後如何對找到的文章進行排序並返回的問題產生了疑惑,那麼我們是如何去判斷搜索出的文檔和搜索語句的相關性的呢?現在,我們來解決如何對文檔之間的相關性進行打分的問題

原创 Lucene初探之數據格式詳情(-)

Lucene初探之數據格式詳情(-) 在前兩篇,我們介紹了Lucene的存儲文件目錄中的各個文件的大致關係。比如以層次規則保存的正向信息: 索引–>段–>文檔–>域–>詞 目錄–>segment_N–>.fdx,.fdt–>.fnm–>

原创 Lucene初探之數據格式詳情(三)

Lucene初探之數據格式詳情(三) 今天,我們來了解一下Lucene的域的元數據信息—>.fnm。 一個段包含多個域,每個域都存儲一下元數據。fnm文件的詳細數據格式大致如下: 如同上面對段的信息的介紹一般,我們來一個個地看一下

原创 Lucene初探之數據格式詳情(二)

Lucene初探之數據格式詳情(二) 接上一篇Lucene初探之數據格式詳情(-) 補充一下Segment_N文件的具體格式: DocStoreOffset DocStoreSegment DocStorelsCompoundFile

原创 Lucene初探之數據格式詳情(六)

Lucene初探之數據格式詳情(六) 在之前的幾篇文章中,我們共同探索了Lucene創建索引文件時正向信息、反向信息和標準因子的存儲方式和原理。在實際的生產應用環境中,由於業務等需要,我們不僅僅只是需要創建索引,有時候我們還需要去刪除或者

原创 關於MongoDB中對於Collection中的Array數組的注意事項

關於MongoDB中對於Collection中的Array數組的注意事項 前兩天在工作中遇到一個對mongoDB的Collection中Array數組查詢的問題,百思不得其解之後豁然開朗,今天給大家分享一下。 當時遇到的問題是,我現在有兩

原创 關於Spring中MongoTemplate.aggregate的一個奇異bug

昨天在完成公司一個項目的時候用了mongoTemplate的aggregate,在使用Aggretaion.match(criteria)來篩選數據,其中criteria語句是Criteria.where("id").ne(xxxId)

原创 Lucene初探之總體架構

從總體上來說,Lucene的可以被概括爲三點: 高效、可擴展的全文檢索庫;基於Java實現;支持對純文本文件進行索引可搜索; Lucene的工作流程和架構如下所示: 通過該圖片,我們可以看出,Lucene的工作流程可以被分爲兩個部