原创 【內部項目預研】對信息分類進行探索

分析輸入信息的類別,目前是一個閉集、但是要按照開集的方式來進行分析;名稱越亂越好,讓系統自己來進行劃分。必須首先考慮傳統的方法;優先考慮數據結構的構建;強化監控機制的構建、首先進行認知和技術積累。一、數據情況找到了清華大學整理的關於體育的新

原创 LCEL的具體實驗

一、基本chain from langchain_core.output_parsers import StrOutputParser from langchain_core.prompts import ChatPromptTempla

原创 通過撰寫代碼理解向量計算

embeded模型基於m3e。一、原生向量代碼,自己計算距離import numpy as npfrom numpy import dotfrom numpy.linalg import normfrom sentence_transfor

原创 和chatglm3通信,分別基於chromadb和faiss

一、和chatglm3通信,基於chromadbimport jsonimport requestsimport osfrom pdfminer.high_level import extract_pagesfrom pdfminer.la

原创 基於langchain和文心一言的檢索增強生成(RAG)初級實驗

一、什麼是RAG? RAG的架構如圖中所示,簡單來講,RAG就是通過檢索獲取相關的知識並將其融入Prompt,讓大模型能夠參考相應的知識從而給出合理回答。因此,可以將RAG的核心理解爲“檢索+生成”,前者主要是利用向量數據庫的高效存儲和檢索

原创 Elasticsearch簡明學習(第一天)

工作相關和擴展核心能力的需要,採用較爲簡單的方法來學習Elasticsearch,作相關記錄備查。一、採用Docker安裝sudo docker pull elasticsearch:7.7.0sudo docker imagessudo

原创 高分辨率拼接案例分析【基礎算法】

一、案例來源 本例項目來源於羣裏面網友提問“在流水線上採集到的圖片,相互之間位移基本確定,需要進行進一步精細拼接” 希望得到的結果。 具體而言,這是一塊大型服務器板子,會走點拍100張圖【特定設備】,每張圖有部分重合,算下來應該七百多寬度

原创 如何將MMrotate的識別結果轉換爲dota和fair1m格式

問題來源,在使用mmrotate的過程中,需要能夠對識別的結果進行推斷,結果發現缺乏相關功能: From the demo i know show_result_pyplot can plot the inferred results, I

原创 移植第一!qt在windows下安裝

最新版本的qt爲5.1.1,已經把qt qtcreator 和mingw整合在了一起。其實qt也就是qtcreator qt和mingw的整合。 qt的程序本質上來說,仍然是c++的程序,而c++的程序編寫是我不太熟悉的。這裏仍然是要基於現

原创 Tesseract5+OpenCV4(VS2017+win10)實現OCR識別

一、環境配置 較之前採用cppan進行編譯的方式,vcpkg的方式已經發生了許多變化,帶來的最大不同就是便捷。     對於在NuGet中能夠找到的Vcpkg的export,真的實現了開箱即用     這樣的話對於普通用戶來說就購了;

原创 GOCVHelper圖像處理算法庫實例整編

    GOCVHelper主要包含圖像處理、圖像增強和基礎文件處理三個部分。由於前兩個部分較具有通用性,而且我在不同項目中都進行了反覆使用,爲了進一步說明類庫內容,這裏反過來從項目角度出發,對現有的類庫進行整理;     第三個部分,增

原创 LocalNormalization算法原理、實現和在視頻處理中震鈴效果的發現和去除

    這個名字比較長,但其實說的是一系列問題:LocalNormalization這種圖像增強算法是什麼?有什麼用?如何實現?當這種圖像算法運用到動態視頻的過程中會出現什麼新的問題,如何解決問題獲得做好效果?     感謝labview

原创 將GOCVHelper推向opencv——關於thinning函數的探索

    所以第一步就是opencv opencv_contrib聯合起來。通過gitee來下載,速度非常快。 https://gitee.com/mirrors/opencv_contrib/repository/archive/mast

原创 從條碼識別中學習到的(來自課程《OpenCV計算機視覺產品實戰2》)

零、基本情況 條碼(一維碼)已經廣泛應用於我們日常生產實際, 傳統的條碼識讀方法是使用專用的激光掃描器來掃描條碼,從而獲取條碼中的信息。這個過程人工介入程度較深、一般用於吞吐量較大的專業領域。 近年來隨着圖像處理技術的發展,特別是終端手持設

原创 花40分鐘寫一個-CBIR引擎-代碼公開

   瀏覽網頁的時候發現一篇不錯的文章"用Python和OpenCV創建一個圖片搜索引擎的完整指南 " http://python.jobbole.com/80860/. 作者在瀏覽自己旅遊的照片的時候,發現照片太多了分類不過來,一時技癢寫