原创 一個簡易的python 爬蟲源碼分析

python 一個簡易的爬蟲源碼分析爬蟲流程代碼倉庫代碼解讀類圖流程圖關鍵知識布隆過濾Queue 爬蟲流程 之前沒了解過相關東西,覺得大體流程無非是發送http request, 然後把爬來的數據進行存儲。 讀了一個相關代碼實現後

原创 如何訓練word2Vec

word2Vec 概述、算法實現過程 一、word2Vec 是什麼,作用什麼 背景 自然語言處理中,比如翻譯,問答系統,都需要一個基礎:如何用數據表示單個的詞呢?只有很好的表徵單個詞以後,才能後續輸入到模型中去訓練。這樣的表徵能使

原创 決策樹算法使用

決策樹 基礎理論 是什麼 決策樹多用於分類任務,本質上就是一棵樹形結構,通過樹形結構中的節點屬性來劃分新的數據屬於哪個分支。形式其實和流程圖一樣 OneTwoThree屬性判斷Result oneResult twoResult

原创 spdlog 代碼分析

spdlog 源碼解析 ##記日誌兩種模式: 同步: 對於basic_file_sink, 日誌每次調用fwrite寫入到文件緩存,即使同步模式,也需要flush_every來定時flush,否則crash 時有丟失日誌風險

原创 c++11 多線程

#c++11 多線程 引入多線程,對於跨平臺開發提供了很大的便捷 mutex lock int g_i = 0; std::mutex mm; void add_one() { for (size_t i = 0; i <

原创 sqlcipher windows 平臺編譯方法

sqlcipher windows 平臺編譯方法 預先準備條件: 1、OpenSSL windows平臺下的庫 2、MingW 環境,包括一些編譯開發工具,如 gcc-g++、tclsh 3、sqlcipher 源碼 對於 1:O