原创 智能熵、智能容量和迭代學習量化分析:智能-通信統一模型和AlphaZero案例分析

Original Title:The Entropy of Artificial Intelligence and a Case Study of AlphaZero from Shannon’s Perspective Orig

原创 信息瓶頸理論-基礎與應用

歷史沿革與導讀 早在2000年,Naftali Tishby就在“The information bottleneck method”一文[1]中提出了信息瓶頸理論,給出了優化問題的數學定義和迭代算法,並且證明了算法的收斂性。 最近深

原创 智能-通信統一模型在AlphaZero中的運用:智能上限和迭代學習過程量化分析

Original Pre-print Learning as Decoding the World to Approach the Intelligence Upper-bound: An Intelligence-Communica

原创 Learning as Decoding the World to Approach the Intelligence Upper-bound: Applying UICM to AlphaZero

This paper would be fully open-access. The recently released AlphaZero algorithm achieves superhuman performance in t

原创 An Unified Intelligence-Communication Model for Multi-Agent System——Part III

An Unified Intelligence-Communication Model for Multi-Agent System: Overview and Case Studies – Chapter Two: Modellin

原创 An Unified Intelligence-Communication Model for Multi-Agent System——Part II

An Unified Intelligence-Communication Model for Multi-Agent System: Overview and Case Studies – Chapter One: A Brief

原创 An Unified Intelligence-Communication Model for Multi-Agent System——Part I

An Unified Intelligence-Communication Model for Multi-Agent System: Overview and Case Studies – Abstract and Outline

原创 信號分析與處理導論-教案開源

信號分析與處理導論-教案開源 筆者曾是一名青椒,曾任職於某985大學計算機學院(後來評了雙一流的世界一流計算機學科),擔任本科生《信號分析與處理導論》課程的主講老師。 《信號分析與處理導論》這門課雖然僅有36課時,但筆者個人理解,它是

原创 信號分析與處理導論-20個參賽用PPT節段全開源

信號分析與處理導論-20個參賽用PPT節段全開源 剛剛開源了參加過教學比賽的《信號分析與處理導論》課程的教學設計(即教案),有同仁問我能不能也提供PPT。 實話說,自己上課是不喜歡用PPT的。經常出現一兩張PPT放在那兒,靠板書畫圖和

原创 智能的具身化

摘要 建立在“認知即計算”這一命題的基礎上,“腦是智能載體”的觀點被廣泛接受,“大腦控制身體”被認爲是常識。但是,“智能的具身化”思想挑戰這一傳統命題,強調認知和智力活動不僅僅是大腦孤立的計算,而是大腦、身體和環境的相互作用。 本文基於

原创 《隱秩序》-第二章:適應性主體——摘錄與評述(Part-2 信用分派算法)

在第二章的Part-1中,筆者摘錄和評述了適應性主體的執行系統。霍蘭用規則這一統一方式描述不同種類主體的性能,而不考慮由於適應所產生的變化。在本篇中,霍蘭給出了基於規則的適應性主體如何在環境中進行學習和適應。 信用分派算法 筆者梳理出霍蘭

原创 RFNoC+GNURadio開源項目摘錄(2018-6-26 持續更新)

摘要 基於RFNoC的GNURadio package(簡稱RFNoC-GR包)開發還比較初步,因爲要涉及FPGA開發,所以學術界的相關波形組件開發和開源肯定比GPP的組件慢,但是在基於RFNoC的Zynq系列越來越普及的情況下,RFNo

原创 RF network on chips (RFNoC)片上網絡淺析

摘要 軟件無線電開發領域常用的GNU-Radio開源開發框架一般是用於GPP架構,由於信號處理都在PC上實現,波形模塊的移植性和可複用性好,並且基於流圖的開發模式很容易上手,易被學術界接受。但是二代的USRP前端FPGA能力較弱,一般只用

原创 基於世界模型的深度強化學習

起源 世界模型[https://zhuanlan.zhihu.com/p/39928037]被lecun認爲是彌補RL不足和通向下一代AI的要點。雖然Model-Based RL不是新概念,但是世界模型的構建方法,以及提升其泛化能力、注意

原创 《隱秩序:適應性造就複雜性》--摘錄與評述

霍蘭(John Henry Holland)是聖菲研究所的代表學者,因發明遺傳算法而聞名。以前對遺傳算法的理解就是一個啓發式的優化方法,但是通過米歇爾的《複雜》一書的科普,我才隱約理解到遺傳算法背後的深刻意義。 作爲複雜適應系統的開拓者之