原创 Mac下安裝TensorFlow

1. 查看Python版本 Mac上默認裝有Python 2.7,先看一下python的版本: 目前推薦使Python 3,有關python的安裝教程請參見python安裝。 安Python 3時會默認安裝pip3。輸入命令pi

原创 Zotero管理文獻

Zotero是一個免費的、易於使用的工具,可以幫助您收集、組織、引用和共享研究。 1. 安裝 可以到Zotero下載界面下載最新版本的Zotero。下載後按普通軟件安裝方法安裝即可。 在下載Zotero的時候,Zotero的下載頁

原创 arXiv論文提交流程

1. arXiv註冊 arXiv登錄或註冊官網:https://arxiv.org/login 註冊賬號時,最好使用學校的edu郵箱註冊,免去可能的上傳權限審覈。 2. Start new submission 註冊或登錄arXi

原创 Relational Reinforcement Learning: An Overview

Abstract 關係強化學習(RRL)既是一個年輕的領域,又是一個古老的領域。 在本文中,我們追溯了該領域的歷史和相關學科,概述了一些當前的工作和有希望的新方向,並調查了未來的研究問題和機會。 Introduction 長期以來

原创 深度強化學習中的泛化

Overfitting in Supervised Learning 機器學習是一門學科,其中給定了一些訓練數據\環境,我們希望找到一個優化目標的模型,但其目的是在訓練期間從未見過的數據上表現出色。通常將其稱爲Generaliza

原创 量化強化學習中的泛化

我們將發佈CoinRun,這是一種訓練環境,它爲agent將其經驗轉移到新穎情況中的能力提供了度量標準,並且已經幫助澄清了強化學習中的長期難題。CoinRun在複雜性方面取得了理想的平衡:環境比傳統的平臺遊戲(如Sonic)簡單,

原创 強化學習及深度強化學習面試題

什麼是強化學習? 強化學習由環境、動作和獎勵組成,強化學習的目標是使得作出的一系列決策得到的總的獎勵的期望最大化。 強化學習和監督學習、無監督學習的區別是什麼? 監督學習帶有標籤;無監督學習沒有標籤;強化學習使用未標記的數

原创 Relational Deep Reinforcement Learning

Abstract 我們介紹了一種深度強化學習的方法,它通過結構化感知和關係推理提高了傳統方法的效率、泛化能力和可解釋性。它使用self-attention來迭代推理場景中實體之間的關係,並指導無模型策略。我們的結果表明,在一種名爲

原创 海外社交媒體最佳圖片尺寸

海外六大主流社交媒體平臺(Facebook、Twitter、Instagram、LinkedIn、Pinterest、YouTube)圖片的最佳尺寸和格式。 Facebook Facebook封面圖片大小:820 x 312

原创 英語語法篇

語法無非三點。第一點是五個基本句型:主謂、主謂賓、主謂賓賓、主謂賓賓補、主系表。任何高階複雜的句子都是從這五種簡單句型演化而來。第二點是三大從句:名詞性從句、狀語從句、定語從句。第三點是其他形式:主語從句、賓語從句、表語從句、同位

原创 CV寫法

CV的完整形式是拉丁文Curriculum Vitae,CV主要是用於申請學術、教育、科研職位,或者申請獎學金等等。現在常常有人把CV和Resume混起來稱爲“簡歷”,其實精確而言,CV應該是“履歷”,Resume纔是簡歷。Cur

原创 英語資源列表

雖然學習英語這麼多年,但是基礎仍然感覺不紮實,特此複習和鞏固英語基礎。 音標 詞彙 語法 發音 參考資源 [1] 知乎-如何學習英語?

原创 期刊會議名縮寫查詢

投往IEEE transactions的論文,其中的參考文獻格式都是採用會議期刊的縮寫。本博客特此記錄如何查詢期刊和會議名的縮寫問題。 1. 期刊名縮寫 SCI論文的參考文獻很多期刊名都是縮寫,如下圖所示。在寫論文時,如何查詢SC

原创 英語詞彙篇--The Oxford 3000

The Oxford 3000是一份從牛津英語語料庫(Oxford English Corpus)精選而出的英語學習者必備常用3000詞表。會使用這3000個詞就可以表達所有英文的含義。 The Oxford 3000是從A1到B

原创 Linux服務器中的文件上傳與下載

使用scp命令 本地文件上傳到服務器: scp /home/work/source.txt [email protected]:/home/work/ #把本地的source.txt文件拷貝到192.168.0.10機器上的/ho