閱讀筆記-ShowandTell

原創

2020-07-07 08:10

文章目錄

3.1 基於LSTM的句子生成器

摘要

提出了一個生成模型，cv+nlp，輸入是圖片，輸出是句子

衡量指標

BLEU-1
SBU

相關工作

Kiros這個人用一個只有前向傳播的神經網絡，根據輸入圖片預測下一個詞。把圖片的向量編碼和文本的向量編碼聯合在了一起。他們的結果好是經過了大量調參。
Mao這個人，用了一個RNN，根據輸入圖片預測下一個詞

本文的工作用了一個更厲害的RNN，然後直接把圖片輸入到RNN裏面，

提出的模型

目標函數如下

$math \theta^{\star}=\arg \max _{\theta} \sum_{(I, S)} \log p(S | I ; \theta)$

其中$ \theta $是模型參數，$ I$是圖片，是正確的轉義結果，就是最後的句子，長度可以不固定，所以比較常見的做法是使用鏈式法則對上式重寫：

$math \log p(S | I)=\sum_{t=0}^{N} \log p\left(S_{t} | I, S_{0}, \ldots, S_{t-1}\right)$

爲了方便起見這裏去掉了依賴參數 $\theta$

訓練結果，每一個樣本是一個 $(S, I )$ 即圖片-文本對，在整個訓練集上對上述loss的和進行優化，踩踏隨機梯度下降的方式

3.1 基於LSTM的句子生成器

只在第一次的時候，輸入圖片信息

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

sorted 在python2和3中的區別

文章目錄sorted 在python2和3中的區別 sorted 在python2和3中的區別 python3中取消了cmp參數 python3中的使用方法如下: from functools import cmp_to_key

2020-07-08 12:31:35

monggoDB學習筆記

1、mongo是什麼關鍵詞：分佈式、可擴展、介於關係與非關係數據庫之間、文檔存儲、JSON格式存儲（可對字段建索引，實現關係數據庫的某些功能）、默認監聽端口27017 MongoDB是一個基於分佈式文件存儲的開源數據庫系統。由C++語言

2020-07-08 12:27:44

Shell編程入門（二）

多練習纔會記得牢這裏的題目來自於（個別刪選）知乎：shell編程如果當前用戶是管理員，則使用yum 安裝 vsftpd,如果不是,則提示您非管理員，不可安裝提示用戶輸入用戶名和密碼,腳本自動創建相應的賬戶及配置密碼。

存在即合理_

2020-07-08 11:22:52

在使用Django出現的疑難雜症

不知道會被笑的點讀法 Django的讀法是 [ˈdʒæŋɡo] 中文發音是迪亞戈重點是D 是輕輔音，讀出來的時候有點像是不發音。版本問題 Python3.0在 2020年是不支持 Django 3.0.4版本的。Djan

存在即合理_

2020-07-08 11:22:52

運維入門（一）

專業名詞出包：項目在執行機上運行，打包出結果，再由運維工程師轉交給開發工程師的一項活動。門禁：門禁指的是CICD的門禁，是指必要的時候進行一系列測試，以保證代碼的質量和其功能是否實現。一般由CI集成工具完成搭建與配置。門禁設

存在即合理_

2020-07-08 11:22:52

Shell編程入門（三）

簡單的Shell 命令 ll /usr/bin/java ll命令顯示詳細信息，如果java是一個目錄，顯示目錄中文件的詳細信息，如果java是一個軟連接，顯示軟連接的指向 ll ‘which java’ 顯示命令的詳細信息

存在即合理_

2020-07-08 11:22:52

Android M 新特性

六大特性： App Permission （軟件權限管理）安裝時候不會提醒權限，而是在使用時候由程序請求權限；用戶也可以在設置中對應用進行相關權限控制Chrome Custom Tags (網頁體驗提升) 登陸網站存儲密碼，自動補全資料

Jay白色风车

2020-07-08 10:03:22

學習筆記----伸展樹

最近在看伸展樹，看到了一個不錯的文章，轉載一下便於以後學習轉載地址：http://dongxicheng.org/structure/splay-tree/ 1、概述二叉查找樹（Binary Search Tree，也叫二

2020-07-08 09:04:26

mini2440開發板學習裸機開發——day1 裸機運行LED燈程序

開發背景：系統：ubuntu18.04系統開發板:mini2440 串口連接工具 J-link連接工具工具：secureCRT J-link 本次學習基於韋東山老師的嵌入式linux應用開發手冊書，結合友善之臂給出的官方資料以

2020-07-08 08:59:17

java入門程序100例學習筆記（005遞歸調用）

問題：兩年期整存零取，每月1000元，年利率1.17，問應存多少錢思路：使用遞歸調用實現：問題：局部變量的問題，變量的定義應該放在哪裏總結：遞歸要掌握好代碼下載鏈接：http://download.csdn.net/detai

2020-07-08 06:59:06

pandas數據分析讀書筆記（五）

plt.xlabel()，畫x軸標題 Plt.ylabel()，畫y軸標題 Plt.savefig(‘figpath.png’)，把圖片保存爲文件 S = pd.Series(np.random.randn(10).cumsum())

2020-07-08 06:46:51

Spring+SpringMVC+Mybatis項目中pom.xml模板

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaL

2020-07-08 06:30:02

Redis在Windows系統下安裝成服務

我們知道Redis沒有Windows系統的安裝版。Windows系統下使用Redis，每次都要打開他的redis-server.exe，並保持cmd窗口不關閉，才能正常使用。要是一不小心關掉cmd窗口，那Redis服務也關閉了。其實Re

2020-07-08 06:30:02

小程序數據請求注意事項

本文僅作爲個人學習經驗總結，如有理解有誤的地方，歡迎在評論區指出，謝謝！1.小程序的請求格式官方文檔中有明確的說明，不懂得可以看官方文檔，微信小程序開發文檔2.微信只支持https的請求方式3.文檔中要求，客戶端的 HTTPS TLS

2020-07-08 04:25:07

[轉]Nginx hash Module

導讀：　　本模塊由第三方提供，不包含在 Nginx 的源碼發佈版中。安裝介紹等請看這裏. 　　The upstream_hash modu

2020-07-08 09:39:19

24小時熱門文章

最新文章

最新評論文章