原创 bash run.sh執行python程序的目錄定位問題

命令行執行bash中的傳參相對路徑問題 智能學習算法中,經常靠命令行傳參+Argparse的方式運行,項目結構如下: run.sh的內容如下: 例如對於命令行中-model_path …/models/bert_transfo

原创 python使用docker和jenkins一體化構建

python-docker-使用jenkins一體化構建 python部署方案: python代碼,通過sanic發佈對外接口或者內部運作,由服務端進行docker打包發佈。通過jenkins一體化構建,實現一鍵發佈和回滾操作。本

原创 LSH之simHash算法

徹底弄懂LSH之simHash算法 <div class="postBody"> <div id="cnblogs_post_body"><p><span style="font-family: 楷體; f

原创 jar包調用內置文件和項目調用jar包時動態從系統各個環境中找文件

最近遇到了一個讀取jar資源文件的問題,對於maven項目打包後,項目結構將會改變。打包後,若想讀取jar包內文件需要返回流操作,示例如下: public static InputStream getResourceByNa

原创 餘弦距離、歐氏距離和傑卡德相似性度量的對比分析

1、餘弦距離 餘弦距離,也稱爲餘弦相似度,是用向量空間中兩個向量夾角的餘弦值作爲衡量兩個個體間差異的大小的度量。 向量,是多維空間中有方向的線段,如果兩個向量的方向一致,即夾角接近零,那麼這兩個向量就相近。而要確定兩個向量方向是否一致,這

原创 告訴你爲什麼數據要取對數

平時在一些數據處理中,經常會把原始數據取對數後進一步處理。之所以這樣做是基於對數函數在其定義域內是單調增函數,取對數後不會改變數據的相對關係,取對數作用主要有:1. 縮小數據的絕對數值,方便計算。例如,每個數據項的值都很大,許多這樣的值進

原创 Java Serializable(序列化)的理解和總結

1、序列化是幹什麼的?        簡單說就是爲了保存在內存中的各種對象的狀態(也就是實例變量,不是方法),並且可以把保存的對象狀態再讀出來。雖然你可以用你自己的各種各樣的方法來保存object states,但是Java給你提供一種