實戰：使用 PyTorch 和 OpenCV 實現實時目標檢測系統

點擊下方“AI算法與圖像處理”，一起進步！

重磅乾貨，第一時間送達

一、引言

自動駕駛汽車可能仍然難以理解人類和垃圾桶之間的區別，但這並沒有使最先進的物體檢測模型在過去十年中取得的驚人進步相去甚遠。

將其與 OpenCV 等庫的圖像處理能力相結合，如今在數小時內構建實時對象檢測系統原型要容易得多。在本指南中，我們將嘗試向您展示如何開發用於簡單對象檢測應用程序的子系統，以及如何將所有這些組合在一起。

二、Python與C++

我知道你們中的一些人可能會想，爲什麼我們要使用Python，在某種程度上,它對於實時應用程序來說不是太慢了嗎。

大多數計算重操作，如預測或圖像處理，都是通過PyTrand和OpenCV來執行的，它們都使用C++在場景後面實現這些操作，因此，如果我們在這裏使用C++或Python，則不會有太大的差別。

三、讀取視頻流

輸入的視頻源可以是任何內容，從網絡攝像頭讀取，或解析現有視頻，或從連接到網絡的外部攝像頭。在此示例中，我們將展示如何從 youtube 或網絡攝像頭讀取視頻流。

四、從YouTube讀取

你們可能不想出去創建新視頻，而是使用許多在線可用的視頻。在這種情況下，你們可以從 youtube 讀取視頻流。

import cv2 # opencv2 package for python.import pafy # pafy allows us to read videos from youtube.URL = "https://www.youtube.com/watch?v=dQw4w9WgXcQ" #URL to parseplay = pafy.new(self._URL).streams[-1] #'-1' means read the lowest quality of video.assert play is not None # we want to make sure their is a input to read.stream = cv2.VideoCapture(play.url) #create a opencv video stream.

十二、結論

當然，生產級實時應用程序比這複雜得多，但本文並不打算教授這一點。它是爲了展示 Python 的驚人力量，它使我們能夠在數小時內構建如此複雜的應用程序原型。

Github代碼鏈接：https://github.com/akash-agni

努力分享優質的計算機視覺相關內容，歡迎關注：

  
     
     
     
   
      
      
      個人微信（如果沒有備註不拉羣！）
  
     
     
     
  
     
     
     
   
      
      
      請註明：
   
      
      
      地區+學校/企業+研究方向+暱稱
  
     
     
     
  
     
     
     
   
      
      
      

  
     
     
     


下載1：何愷明頂會分享

在「AI算法與圖像處理」公衆號後臺回覆：何愷明，即可下載。總共有6份PDF，涉及 ResNet、Mask RCNN等經典工作的總結分析

下載2：終身受益的編程指南：Google編程風格指南

在「AI算法與圖像處理」公衆號後臺回覆：c++，即可下載。歷經十年考驗，最權威的編程規範！


   
   
   
 
    
    
    下載3 CVPR2021

   
   
   

   
   
   
 
    
    
    


   
   
   

   
   
   
 
    
    
    在「AI算法與圖像處理」公衆號後臺回覆：
 
    
    
    CVPR
 
    
    
    ，即可下載1467篇CVPR 2020論文 和 CVPR 2021 最新論文

點亮，告訴大家你也在看

本文分享自微信公衆號 - AI算法與圖像處理（AI_study）。
如有侵權，請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”，歡迎正在閱讀的你也加入，一起分享。

實戰：使用 PyTorch 和 OpenCV 實現實時目標檢測系統

現在我們將它們整合到一個調用函數中，在循環中執行整個操作，讓我們回顧一下我們的主要功能必須執行以成功運行應用程序的步驟。

探究職業發展的關鍵：能力模型解讀

如何在低代碼平臺中引用 JavaScript ？

高效率使用windows

智能決策新時代：可視化大屏是否能夠超越傳統白板？

解密Prompt系列28. LLM Agent之金融領域摸索：FinMem & FinAgent

分享幾個.NET開源的AI和LLM相關項目框架

別魔改網絡了，Google研究員：模型精度不高，是因爲你的Resize方法不夠好！

深度學習中圖像分割經典算法和必備知識點整理

算！力！羊！毛！5000核時計算資源終於開放使用了！

部署教程 | ResNet原理+PyTorch復現+ONNX+TensorRT int8量化部署

YOLOS：通過目標檢測重新思考Transformer（附源代碼）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結