边缘设备上的计算机视觉

点击上方“AI算法与图像处理”，选择加"星标"或“置顶”
重磅干货，第一时间送达

几周前，当在全球速卖通(AliExpress)购物时，偶然发现了一个很棒的Maixduino设备。它宣称自带RISC V架构和KPU (KPU是一个通用神经网络处理器)。其不同规格如下;

CPU: RISC-V双核64位，带FPU
图像识别：QVGA@60fps / VGA@30fps
芯片功耗< 300mW

说实话，这个单位很旧了，最近才开始关注。考虑到我对边缘计算的兴趣，我想为一个对象检测示例提供一个完整的端到端指南。这个例子是基于这篇文章： https://www.instructables.com/Object-Detection-With-Sipeed-MaiX-BoardsKendryte-K/

但是，我将全面介绍如何收集图像并对它们进行注释。如果你想知道什么是边缘计算，请阅读下面的文章。

https://medium.com/swlh/what-is-edge-computing-d27d15f843e

让我们尝试建立一个图像检测程序，将能够检测出苹果和香蕉。有了检测器，你可以变得更有创造力。在接下来的讨论中，我们将讨论所需的工具和库。

迁移学习注释

迁移学习是指我们使用预先训练的模型来进一步专业化。简单地说，就是用自己的分类层(或更多层)替换训练过的模型的最后一个预测层。然后冻结除你的自定义层（或一些经过预训练的层）以外的所有层。然后训练网络，以便使用预先训练过的模型的特性来微调你的层，以预测你想要的类。

不幸的是，目前我们要训练的网络没有任何预先训练过的模型。因此，我们将从头开始训练。但这将是一个有趣的实验!

准备数据

我们需要按以下格式准备数据。首先，我们需要有苹果和香蕉的图像。同时，我们需要对它们进行注释，以确定每个水果可能在图像中的位置。这就是目标分类和检测之间的区别所在。我们需要说出物体在哪里。为此，你需要以下工具。

tzutalin / labelImg ： https://github.com/tzutalin/labelImg

LabelImg是一个图形图像标注工具。它是用Python编写的，使用Qt作为图形界面…

或者你可以使用我的工具使用你的背景和对象图像生成注释图像(例如：来自Kaggle的Fruit 360的图像)。阅读更多：

用于对象检测的注释器： https://anuradhawick.medium.com/annotator-for-object-detection-950fd799b651

在我的例子中，我使用以下程序，因为我从网络摄像头捕获。选择简单的方法。下面的程序是用Nvidia jetson nano get started容器编译的。

dusty-nv / camra-capture ： https://github.com/dusty-nv/camera-capture

数据集训练

我们想训练我们的模型，这样它们就可以在maxduino设备上运行。为此，我们可以使用以下存储库。它对模型层进行了所有必要的修改，以适应K210处理器的体系结构。克隆并安装所需的依赖项。所有说明可在以下链接获得;

AIWintermuteAI / aXeleRate ： https://github.com/AIWintermuteAI/aXeleRate

aXeleRate简化了训练，并将计算机视觉模型转换为在各种硬件平台上运行……

我们需要将我们的训练数据组织如下;


   
   
   
 
    
    
    path-to/data
---anns      # store the training annotations
---imgs      # relevant images for the training
---anns_val  # validation annotations
---imgs_val  # validation images

现在我们需要创建一个配置。json设置训练选项。对于我们的例子，它应该如下所示：


   
   
   
 
    
    
    {
    "model" : {
        "type":                 "Detector",
        "architecture":         "MobileNet7_5",
        "input_size":           [224,224],
        "anchors":              [0.57273, 0.677385, 1.87446, 2.06253, 3.33843, 5.47434, 7.88282, 3.52778, 9.77052, 9.16828],
        "labels":               ["Apple", "Banana"],
        "coord_scale" :  1.0,
        "class_scale" :  1.0,
        "object_scale" :  5.0,
        "no_object_scale" :  1.0
    },
    "weights" : {
        "full":     "",
        "backend":              "imagenet"
    },
    "train" : {
        "actual_epoch":         50,
        "train_image_folder":   "data/imgs",
        "train_annot_folder":   "data/anns",
        "train_times":          2,
        "valid_image_folder":   "data/imgs_val",
        "valid_annot_folder":   "data/anns_val",
        "valid_times":          2,
        "valid_metric":         "mAP",
        "batch_size":           4,
        "learning_rate":        1e-4,
        "saved_folder":     "obj_detector",
        "first_trainable_layer": "",
        "augumentation":  true,
        "is_only_detect" :   false
    },
    "converter" : {
        "type":       ["k210"]
    }
}

注意：使用绝对路径可以避免不必要的错误。

接下来，我们可以使用以下命令进行训练;


   
   
   
 
    
    
    python3 aXelerate/axelerate/traing.py -c config.json

现在训练结束了。我们感兴趣的是在项目文件夹中生成的kmodel文件。我们可以把它移到microSD卡上，然后连接到MaixDuino设备上。

预测

下面是我将在maixPy IDE中使用的草图。


   
   
   
 
    
    
    import sensor,image,lcd
import KPU as kpulcd.init()
sensor.reset()
sensor.set_pixformat(sensor.RGB565)
sensor.set_framesize(sensor.QVGA)
sensor.set_windowing((224, 224))
sensor.set_vflip(1)
sensor.run(1)classes = ["Apple", "Banana"]
task = kpu.load("/sd/name_of_the_model_file.kmodel")
a = kpu.set_outputs(task, 0, 7, 7, 35)anchor = (0.57273, 0.677385, 1.87446, 2.06253, 3.33843, 5.47434, 7.88282, 3.52778, 9.77052, 9.16828)
a = kpu.init_yolo2(task, 0.3, 0.3, 5, anchor) while(True):
    img = sensor.snapshot().rotation_corr(z_rotation=90.0)
    a = img.pix_to_ai()
    code = kpu.run_yolo2(task, img)
    
    if code:
        for i in code:
            a = img.draw_rectangle(i.rect(),color = (0, 255, 0))
            a = img.draw_string(i.x(),i.y(), classes[i.classid()],
                color=(255,0,0), scale=3)
            a = lcd.display(img)
    else:
        a = lcd.display(img)a = kpu.deinit(task)

一定要更改输出参数，以适应kpu中训练过的神经网络中的输出参数。set_outputs(task, 0, 7, 7, 35)。现在可以运行程序了。这很容易。查看以下截图。

请注意，质量很低。这是因为maixPy IDE允许我们将LCD显示流传输到计算机。所以质量更差。

该图像检测程序可以在300mA电流下运行。此外，它有类似Arduino nano板的GPIO引脚。所以可能性是很多的。

  
       
       
       
   
        
        
        个人微信（如果没有备注不拉群！）
  
       
       
       
  
       
       
       
   
        
        
        请注明：
   
        
        
        地区+学校/企业+研究方向+暱称
  
       
       
       
  
       
       
       
   
        
        
        

  
       
       
       


下载1：何恺明顶会分享

在「AI算法与图像处理」公众号后台回复：何恺明，即可下载。总共有6份PDF，涉及 ResNet、Mask RCNN等经典工作的总结分析

下载2：终身受益的编程指南：Google编程风格指南

在「AI算法与图像处理」公众号后台回复：c++，即可下载。历经十年考验，最权威的编程规范！


     
     
     
 
      
      
      下载3 CVPR2021

     
     
     

     
     
     
 
      
      
      


     
     
     

     
     
     
 
      
      
      在「AI算法与图像处理」公众号后台回复：
 
      
      
      CVPR
 
      
      
      ，即可下载1467篇CVPR 2020论文 和 CVPR 2021 最新论文

点亮，告诉大家你也在看

本文分享自微信公众号 - AI算法与图像处理（AI_study）。
如有侵权，请联系 [email protected] 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一起分享。

边缘设备上的计算机视觉

迁移学习注释

准备数据

数据集训练

预测

教你用Perl实现Smgp协议

如何通过前端表格控件在10分钟内完成一张分组报表？

win11关闭自动检测病毒删文件

千兆宽带实际网速能到达多少？

別魔改網絡了，Google研究員：模型精度不高，是因爲你的Resize方法不夠好！

深度學習中圖像分割經典算法和必備知識點整理

算！力！羊！毛！5000核時計算資源終於開放使用了！

部署教程 | ResNet原理+PyTorch復現+ONNX+TensorRT int8量化部署

YOLOS：通過目標檢測重新思考Transformer（附源代碼）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結