铝型材表面瑕疵识别——都都都都都都方案

原創

爱弹ukulele的程序猿

2020-06-22 08:30

文章目录

Baseline

Baseline方案是基于FPN+Faster R-CNN检测框架，加入FPN结构的目的是提高网络对小瑕疵的定位精度。
使用了Mask RCNN提出来的Roi-Align Pooling，主要是想减少不同Roi Pooling带来的量化误差的问题。
使用了空洞卷积，提高顶层特征的感受野。

两种改进，一种是Dual Path Aggregation for Object Detection，另一种是Multi-levels Roi-Align Pooling。

Training Details

Innovations

Dilated convolution

problem

s1 Dual Path Aggregation for Object Detection

在原先Baseline的基础上添加多一路的特征提取，这里想解决的问题是FPN在检测极端长宽比的瑕疵的时候会有Roi映射非最优的情况出现，而极端长宽比的瑕疵（长宽比大于10）在数据集上的比例接近40%，可以说是相当的多。因此利用另一支路的特征来弥补极端长宽比瑕疵下FPN的Roi Mapping非最优所带来的特征损失。

s2 Multi-levels Roi-Align Pooling（MLRP）

也是要解决极端长宽比的情况。FPN在做Roi Mapping的时候是根据Roi的面积来计算的，这会导致当出现极端长宽比情况时，这个映射结果会偏大，导致特征丢失严重。于是我们就想，在做Roi Pooling的时候我同时取映射出来的第kt层以及第kt-1层不就可以了吗？这样即使是在kt偏大的时候kt-1的特征就更加合适了。而且，取两层的特征进行融合还能增加特征的多尺度特性，同时还不会带来额外的计算量。

整合这个结构之后的检测框架长下面这个样子，相比于第一个方案，这个方案更加精炼，虽然精度没那个高，但是检测速度可以达到4帧每秒，还算比较高的了。

SWA

HFE

曲线结果

De-background

Conclusion

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

文心大模型“你说我画”：PaddleHub与PaddleSpeech的协同实践

在人工智能領域中，自然語言處理和計算機視覺是兩個非常活躍的研究方向。隨着深度學習技術的發展，這兩個領域之間的交叉融合產生了許多令人興奮的應用場景。其中，“你說我畫”就是這樣一個結合自然語言處理和計算機視覺技術的創新應用。 “你說我畫”的核心

2024-04-22 11:29:20

深度解析大模型推理框架：原理、应用与实践

在當今數據驅動的時代，大模型推理框架已經成爲人工智能領域的重要支柱。本文將通過簡明扼要、清晰易懂的方式，帶領讀者深入瞭解大模型推理框架的原理、應用領域和實踐經驗，幫助讀者更好地掌握這一技術，並在實際工作中發揮其價值。一、大模型推理框架簡介

2024-04-11 23:28:49

大模型应用与边缘端推理：前沿技术与实现方案

一、大模型概述在人工智能領域，模型的大小和複雜度是衡量其性能的重要指標。大模型通常指的是參數數量龐大、結構複雜的深度學習模型，如GPT-3、BERT等。它們通過訓練大量的數據，能夠捕捉到更豐富的語義信息，從而在各種任務中表現出色。二、大

2024-03-29 11:59:34

大模型推理框架：从理论到实践的全面解析

在數據驅動的時代，深度學習技術已經滲透到各個行業，從圖像識別到自然語言處理，從推薦系統到智能客服，其應用無處不在。然而，深度學習模型的訓練和推理過程往往涉及大量數據和複雜計算，傳統的計算框架難以滿足需求。因此，大模型推理框架應運而生，成爲解

2024-03-23 00:31:01

FastGPT：大模型应用的新里程碑

隨着人工智能技術的不斷進步，大模型在衆多領域的應用已經成爲一種趨勢。FastGPT作爲一種先進的大模型，其強大的自然語言處理能力爲衆多領域帶來了革命性的變革。本文將帶您深入瞭解FastGPT在各個領域的應用，以及大模型應用所面臨的挑戰與前景

2024-03-18 12:35:42

多模态+大模型会带来哪些“化学反应”？

導語：沒人懷疑，2024 年，AI 依然將是科技界的主角。上個月，OpenAI 推出了可以生成 60 秒高清視頻的視頻生成模型 Sora，掀起了對多模態模型的進一輪討論。多模態大模型技術的最新進展如何？這一波新技術，對於行業和消費者的體驗會

2024-03-15 13:45:01

OpenAI文生视频大模型Sora：重塑视频内容生产

在當今信息爆炸的時代，視頻已經成爲了最爲熱門的傳播媒介之一。然而，視頻內容的生產卻是一項極其耗費人力和物力的任務。爲了解決這一問題，美國人工智能公司OpenAI最近發佈了一款名爲Sora的文生視頻大模型，旨在通過AI技術自動化視頻內容的生產

2024-03-04 12:35:26

大模型如何助力开发者打造新质生产力

在當今的AI編程時代，大模型已經成爲了推動技術進步和產業變革的重要力量。大模型，即大型神經網絡，具有海量的參數和複雜的結構，能夠處理更廣泛、更復雜的任務。隨着數據集的擴大和計算能力的提升，大模型在語音識別、自然語言處理、計算機視覺等領域取得

2024-02-26 12:25:04

大模型时代：探索人工智能发展的新动向

在過去的幾年裏，人工智能（AI）已經從一種科幻概念轉變爲現實世界中的實用工具，深刻地改變了我們的生活方式。然而，儘管AI取得了顯著的進步，但它的潛力遠未被完全挖掘。如今，隨着大模型技術的飛速發展，AI正邁入一個新的發展階段，這爲企業和開發者

2024-02-22 12:33:52

文档图像大模型在智能文档处理领域中的应用

隨着人工智能技術的不斷髮展，智能文檔處理已成爲一個備受關注的研究領域。智能文檔處理是指利用計算機技術自動從複雜的非結構化和半結構化文檔中抽取關鍵數據，並將其轉換成結構化數據的過程。在這個過程中，大模型技術發揮着越來越重要的作用。大模型在智

2024-02-19 12:29:56

12 点半！Voxel51 亚太地区计算机视觉线上 Meetup，速来！

7 月 20 日，VOXEL51 亞太地區計算機視覺 Meetup 將於北京時間 12 時 30 分在線上舉行，Zilliz 軟件工程師 Fillip Haltmayer 受邀參與主題分享環節。｜北京時間 20 日中午 12 時 30

2023-07-20 14:17:21

慧博云通加入飞桨技术伙伴计划，共同推动企业AI应用创新

近日，慧博雲通子公司慧博雲通（上海）軟件技術有限公司正式加入飛槳技術夥伴計劃，雙方將共同探索人工智能多場景創新應用，爲企業提供智能化解決方案。慧博雲通慧博雲通科技股份有限公司（股票代碼：301316）成立於2009年，總部位於杭州，公

2023-07-01 00:26:08

视频流整理

碼流的計算分辨率 x軸的像素個數*y軸的像素個數常見的寬高比：16:9 4:3 360P/720P/1K/2K：這些都是16:9的寬高比，其中360P爲640*360；720P爲1280*720；1K爲1920*1080，

2023-04-18 01:38:04

「硬核实操」如何拥有一个自己的数字人模型

作者：京東健康陳剛一、前言近年來，隨着人工智能技術，VR，元宇宙等技術的發展，數字人（Digital Human）逐漸成爲研究的熱點之一，數字人是指通過計算機技術模擬出的具有人類外表，動作和語言能力的虛擬人物，具體可以應用到電影、遊

2023-04-03 11:48:52

同一作者的《OpenCV 4快速入门》与《OpenCV 4详解：基于Python》的对比

《OpenCV 4快速入門》2020出版，407頁《OpenCV 4詳解：基於Python》2021出版，363頁第 1章　初識OpenCV 2 第 1章　初識OpenCV 1 1.1　什麼是OpenCV 2 1．1　什

2023-02-24 00:58:54

24小時熱門文章

最新文章

最新評論文章