LSTM 又回來了！新論文使用LSTM挑戰長序列建模的 ViT

原創

2022-05-12 13:04

不到兩年的時間ViT 已經徹底改變了計算機視覺領域，利用transformers 強大的自注意機制來替代卷積，最近諸如 MLP-Mixer 和通過精心設計的卷積神經網絡 (CNN) 等方法也已經實現了與 ViT 相當的性能。

在新論文 Sequencer: Deep LSTM for Image Classification 中，來自Rikkyo University 和 AnyTech Co., Ltd. 的研究團隊檢查了不同歸納偏差對計算機視覺的適用性，並提出了 Sequencer，它是 ViT 的一種架構替代方案，它使用傳統的LSTM而不是自注意力層。Sequencer 通過將空間信息與節省內存和節省參數的 LSTM 混合來降低內存成本，並在長序列建模上實現與 ViT 競爭的性能。

Sequencer 架構採用雙向 LSTM (BiLSTM) 作爲構建塊，並受 Hou 等人的 2021 Vision Permutator (ViP) 啓發，並行處理垂直軸和水平軸。研究人員引入了兩個 BiLSTM，以實現上/下和左/右方向的並行處理，由於序列長度縮短，從而提高了 Sequencer 的準確性和效率，併產生了具有空間意義的感受野。

Sequencer 將不重疊的補丁作爲輸入，並將它們與特徵圖匹配。Sequencer 模塊有兩個子組件：1）BiLSTM 層可以全局地混合空間信息記憶2）用於通道混合的多層感知機（MLP）。與現有架構一樣，最後一個塊的輸出通過全局平均池化層發送到線性分類器。

完整文章

https://avoid.overfit.cn/post/fda6031f019a46199c5730f27a4c0e8e

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

爲什麼要⽤ Foundry

Foundry 爲什麼要⽤ Foundry 快 - 加速開發 Solidity - 減少上下⽂切換功能豐富⾜夠輕量 Foundry 的組件 forge cast anvil 安裝 https://getfoundr

西紅柿愛喫馬鈴薯

2024-04-26 14:31:45

【筆記】動手學深度學習-預備知識

預備知識 2.1 數據操作 import torch x = torch.arange(12) print(x.shape) print(torch.Size(x)) print(x.numel()) X = x.reshape(

2024-04-26 14:29:04

https://stackoverflow.com/questions/419163/what-does-if-name-main-do

https://stackoverflow.com/questions/419163/what-does-if-name-main-do

2024-04-26 14:29:04

py發送帶附件email

import smtplib from email.mime.multipart import MIMEMultipart from email.mime.text import MIMEText from email.mime.base

2024-04-26 14:25:24

docker nginx-proxy 添加自定義https網站

nginx-proxy配置 nginx-proxy: image: jwilder/nginx-proxy container_name: nginx-proxy restart: always por

2024-04-26 14:25:24

Avalonia UI 中 Styles 與 ControlTheme 的區別

目錄目錄介紹使用方式全局主題 (Global Theme) 局部主題 (Local Theme) 控件主題 (ControlTheme) 問題描述問題分析問題1 區別問題2 重寫Template用 Styles

2024-04-26 14:25:24

py發送email

import smtplib from email.mime.text import MIMEText # SMTP服務器設置 smtp_server = 'smtp.qq.com' smtp_port = 587 secure_con

2024-04-26 14:25:24

Kubernetes (k8s) 基礎入門

下面的內容是基於你已經瞭解了 Docker 容器的前提下的，如果還不瞭解什麼是容器，可以先看看之前的文章 https://www.ryanzoe.top/category/docker/ k8s 是什麼 Kubernetes 也稱爲 K8

2024-04-26 14:25:14

PostMan接口測試實用小點

PostMan接口測試實用小點 1. 接口測試變量存取操作在Postman中有很多地方可以存儲一些變量,這裏只介紹經常使用的環境變量.變量設置後,在UI界面可以通過{{變量名}}獲取到對應值. 在環境變量中配置變量url = https:

2024-04-26 14:25:14

使用 k8s 快速部署應用服務

以下是一個完整的例子，展示瞭如何使用Kubernetes部署一個簡單的Web應用程序。這個例子包括一個Deployment和一個Service。首先，創建一個名爲webapp-deployment.yaml的Deployment配置文件：

2024-04-26 14:25:14

windows 新建一個一個後臺服務

Winsw是一個開源工具，用於將命令行應用程序包裝成Windows服務 1. https://github.com/winsw/winsw/releases/tag/v2.12.0 下載 2. 下載完把兩個文件改名字： myservi

2024-04-26 14:23:43

嘗試使用kimi解析體能表格

因爲涉及到體能訓練成績，所以接觸到了很多表格，觸發了對錶格數據的思考：圖表也是重要的數據來源，應該如何來進行處理？圖表的數據不僅關係它本身，而且也和表格形式相關，此外還和背景材料相關。首先從一個比較乾淨的表格開始，它本身是可以編輯的pdf.

2024-04-26 14:23:33

Springboot版本升級

簡介此次升級是爲了解決舊版本的各種漏洞問題。開發軟件：IDEA2019 項目環境：java 8，springboot2.0.5 目標版本：java 8，springboot2.5.5 本文檔前後變化對比，舊代碼使用、// 等表示。依賴

2024-04-26 14:22:43

條款47：請使用 traits classes 表現類型信息

2024-04-26 14:22:03

條款48：認識 template 元編程

2024-04-26 14:22:03

24小時熱門文章

最新文章

最新評論文章