原创 【深度學習】交叉熵方法

文章目錄前言第四章 交叉熵方法強化學習方法的分類實用的交叉熵交叉熵法實踐:玩CartPole小遊戲交叉熵的理論背景總結 前言 重讀《Deep Reinforcemnet Learning Hands-on》, 常讀常新, 極其深入

原创 【深度強化學習】第一個神經網絡Demo :GAN生成Atari遊戲圖片

文章目錄前言第三章 實例: 關於Atari遊戲的生成對抗網絡實現 前言 重讀《Deep Reinforcemnet Learning Hands-on》, 常讀常新, 極其深入淺出的一本深度強化學習教程。 本文的唯一貢獻是對其進行

原创 【深度強化學習】強化學習的基本概念

文章目錄前言第一章:強化學習的基本概念學習——監督, 無監督與強化學習強化學習的體系與聯繫Reward 獎勵AgentEnvironmentActionsObservation馬爾科夫決策過程馬爾科夫鏈馬爾科夫獎勵過程馬爾科夫決策

原创 【深度強化學習】OpenAI Gym的使用

文章目錄前言第二章 OpenAI Gym深入解析Agent介紹框架前的準備OpenAI Gym APISpace 類Env 類step()方法創建環境第一個Gym 環境實踐: CartPole實現一個隨機的AgentGym 的 額

原创 【深度強化學習】深度學習:Pytorch的使用

文章目錄前言第三章 深度學習:Pytorch的使用Pytorch庫基礎Tensor 張量標量張量張量的操作張量 與 梯度Pytorch 的神經網絡包:torch.nn自定義網絡層損失函數與優化器損失函數優化器通過Tensorboa

原创 深度通信網絡專欄(4)|自編碼器:Blind Channel Equalization using Variational Autoencoders

本文地址:https://arxiv.org/abs/1803.01526 文章目錄前言文章主要貢獻系統模型變分自編碼器引入神經網絡仿真結果 前言 深度通信網絡專欄|自編碼器:整理2018-2019年使用神經網絡實現通信系統自編碼

原创 【線性代數】從子空間到盲矩陣方程的求解

前言 最近在翻張賢達的矩陣分析書, 看到矩陣方程求解這一塊時,又遇到了老熟人“子空間方法”。之前對這一塊掌握的都不是太熟, 順便結合着網上的一些博客以及MIT的課程, 寫下這篇, 以記錄對子空間的理解。 向量空間與子空間 首先要介

原创 理解貝葉斯優化:先驗概率與後驗概率

前言 貝葉斯估計, 貝葉斯優化, 先驗概率和後驗概率, 配上一堆概率論的東西…成功達到了一種嚇唬人的作用,讓人誤以爲是一種高大上的算法。 本文希望以最簡單通俗的例子, 深入淺出地講述這一貝葉斯體系的算法本質, 來闡述 這並非什麼高

原创 混合波束成形專欄|基礎:深入淺出5G,毫米波,大規模MIMO與波束賦形

在進入5G熱門研究技術:混合波束賦形的介紹之前, 筆者想先以這篇文章深入淺出的介紹5G,大規模MIMO以及波束賦形等概念的直觀理解。旨在用最淺顯的語言,儘可能讓零基礎的讀者也能輕易的掌握其本質,從而爲後續對最新混合波束賦形算法的討

原创 基於深度學習的大規模天線陣列混合波束賦形設計

文章目錄背景系統模型文章貢獻NN(Neural Network)設計一些挑戰兩階段設計方法仿真性能結論 該論文是實驗室師兄最新發表於WCL(IEEE Wireless Communication Letters)的一篇論文(tq

原创 【漢字文本識別】:基於卷積神經網絡和循環神經網絡的深度學習方法:CRNN

前言 之前參加深度學習比賽的時候,對計算機視覺有一些小小的積累。 雖然不足道, 但是還是記錄一下, 以便以後碰到這方面的崗位問題時, 可以有一些展示的東西。 之前參加了華爲贊助的一個漢字識別大賽, 要求通過神經網絡,識別出圖片中的

原创 矢量求導的微分法則: 鏈式法則

矢量求導的微分法則: 鏈式法則介紹核心原理矢量求導矩陣求導鏈式法則 介紹 這篇博文推導了矢量情形下, 標量函數對矢量進行求導的微分法則,從定義出發推導了鏈式法則的形式。 核心原理 核心原理: 標量情形下, 由中學的標量求導知識可知

原创 混合波束成形專欄|進階:深入淺出混合波束賦形

系列前一篇文章 混合波束成形專欄|基礎:深入淺出5G,毫米波,大規模MIMO與波束賦形, 幫助了許多需要幫助的人。這幾個月一直偷懶,沒有寫文章。需要再次強調的是,寫這一系列文章的主旨在於: 許多人以把簡單的事情講複雜來顯示自己的

原创 Matlab代碼實現智能反射面的信道仿真

前言 之前寫了許多最新的智能反射面文章的讀後感, 現在這一領域的文章也是井噴式爆發。 但是網上公佈的代碼非常少, 這篇博客就分享下如何用matlab建模仿真智能反射面信道 模型 主流的智能反射面系統大同小異,這裏就隨便截取了一篇

原创 概率論與數理統計(學習筆記)

文章目錄前言二維隨機變量一維概率密度函數定義分佈函數與概率密度函數邊緣分佈條件分佈相互獨立函數分佈 前言 只做自己筆記,日後查詢之用。 二維隨機變量 一維概率密度函數定義 F(x)=∫−∞xf(t)dtF(x)=\int_{-\i