台部落B417科研笔记

文章目錄前言第四章交叉熵方法強化學習方法的分類實用的交叉熵交叉熵法實踐：玩CartPole小遊戲交叉熵的理論背景總結前言重讀《Deep Reinforcemnet Learning Hands-on》，常讀常新，極其深入

2020-06-29 21:54:33

文章目錄前言第三章實例：關於Atari遊戲的生成對抗網絡實現前言重讀《Deep Reinforcemnet Learning Hands-on》，常讀常新，極其深入淺出的一本深度強化學習教程。本文的唯一貢獻是對其進行

2020-06-24 14:28:10

文章目錄前言第一章：強化學習的基本概念學習——監督，無監督與強化學習強化學習的體系與聯繫Reward 獎勵AgentEnvironmentActionsObservation馬爾科夫決策過程馬爾科夫鏈馬爾科夫獎勵過程馬爾科夫決策

2020-06-24 14:28:10

文章目錄前言第二章 OpenAI Gym深入解析Agent介紹框架前的準備OpenAI Gym APISpace 類Env 類step()方法創建環境第一個Gym 環境實踐： CartPole實現一個隨機的AgentGym 的額

2020-06-24 14:28:10

文章目錄前言第三章深度學習：Pytorch的使用Pytorch庫基礎Tensor 張量標量張量張量的操作張量與梯度Pytorch 的神經網絡包：torch.nn自定義網絡層損失函數與優化器損失函數優化器通過Tensorboa

2020-06-24 14:28:10

本文地址：https://arxiv.org/abs/1803.01526 文章目錄前言文章主要貢獻系統模型變分自編碼器引入神經網絡仿真結果前言深度通信網絡專欄|自編碼器:整理2018-2019年使用神經網絡實現通信系統自編碼

2020-06-15 22:34:49

前言最近在翻張賢達的矩陣分析書，看到矩陣方程求解這一塊時，又遇到了老熟人“子空間方法”。之前對這一塊掌握的都不是太熟，順便結合着網上的一些博客以及MIT的課程，寫下這篇，以記錄對子空間的理解。向量空間與子空間首先要介

2020-06-15 22:34:39

前言貝葉斯估計，貝葉斯優化，先驗概率和後驗概率，配上一堆概率論的東西…成功達到了一種嚇唬人的作用，讓人誤以爲是一種高大上的算法。本文希望以最簡單通俗的例子，深入淺出地講述這一貝葉斯體系的算法本質，來闡述這並非什麼高

2020-06-15 22:34:39

在進入5G熱門研究技術：混合波束賦形的介紹之前，筆者想先以這篇文章深入淺出的介紹5G，大規模MIMO以及波束賦形等概念的直觀理解。旨在用最淺顯的語言，儘可能讓零基礎的讀者也能輕易的掌握其本質，從而爲後續對最新混合波束賦形算法的討

2020-06-15 22:34:39

文章目錄背景系統模型文章貢獻NN（Neural Network）設計一些挑戰兩階段設計方法仿真性能結論該論文是實驗室師兄最新發表於WCL(IEEE Wireless Communication Letters)的一篇論文(tq

2020-06-15 22:34:39

前言之前參加深度學習比賽的時候，對計算機視覺有一些小小的積累。雖然不足道，但是還是記錄一下，以便以後碰到這方面的崗位問題時，可以有一些展示的東西。之前參加了華爲贊助的一個漢字識別大賽，要求通過神經網絡，識別出圖片中的

2020-06-15 22:34:39

矢量求導的微分法則：鏈式法則介紹核心原理矢量求導矩陣求導鏈式法則介紹這篇博文推導了矢量情形下，標量函數對矢量進行求導的微分法則，從定義出發推導了鏈式法則的形式。核心原理核心原理：標量情形下，由中學的標量求導知識可知

2020-06-15 22:34:39

系列前一篇文章混合波束成形專欄|基礎：深入淺出5G，毫米波，大規模MIMO與波束賦形，幫助了許多需要幫助的人。這幾個月一直偷懶，沒有寫文章。需要再次強調的是，寫這一系列文章的主旨在於：許多人以把簡單的事情講複雜來顯示自己的

2020-06-15 22:34:39

前言之前寫了許多最新的智能反射面文章的讀後感，現在這一領域的文章也是井噴式爆發。但是網上公佈的代碼非常少，這篇博客就分享下如何用matlab建模仿真智能反射面信道模型主流的智能反射面系統大同小異，這裏就隨便截取了一篇

2020-06-15 22:34:39

文章目錄前言二維隨機變量一維概率密度函數定義分佈函數與概率密度函數邊緣分佈條件分佈相互獨立函數分佈前言只做自己筆記，日後查詢之用。二維隨機變量一維概率密度函數定義 F(x)=∫−∞xf(t)dtF(x)=\int_{-\i

2020-06-15 22:34:39