原创 BERT 是如何構建模型的

本文於 2020/05/08 首發於我的個人博客,未經允許,不得轉載。 Good things take time, as they should. 前面我寫了一篇文章來講 BERT 是如何分詞的,現在,輪到該說說 BER

原创 VSCode Markdown PDF 導出成 PDF 報 phantomjs binary does not exist 錯誤的解決辦法

問題 VSCode 是微軟推出的一款開源的代碼編輯器,從 sublime text 轉過來後感覺還不錯,昨天在用他寫 Markdown 文件時想着直接導出 PDF 文件(之前都是用 Markdown Pad 2),找到一個叫 Ma

原创 Ghost 博客平臺安裝和配置

Ghost 是一個博客發佈平臺,和 Hexo 等類似。本文簡要介紹如何安裝和配置 Ghost,環境爲 Ubuntu 16.04 系統上,假設你已經擁有一個服務器和一個域名。 安裝 安裝過程主要參考官方教程,下面我總結下: 在系

原创 博客變動

現在我有三個博客: Alan Lee,獨立博客 The North Cloud Gate,獨立博客 CSDN 之前我的技術類文章都是在 1 和 3 上同步發表,造成了嚴重的信息冗餘,博客劃分不夠細。因此接下來一段時間我會按照如

原创 使用 Mailgun 配置 Ghost 郵箱

Ghost 可以通過郵箱邀請作者入駐,一起創作,也可以通過郵箱找回密碼。這個郵箱不是隨便一個普通的郵箱就可以,需要一個專門的郵箱賬號,Ghost 官方推薦的是 mailgun 郵箱服務,mailgun 一個月 10000 封郵件免

原创 【TensorFlow】TensorFlow 的卷積神經網絡 CNN - 無 TensorBoard 版

前面 有篇博文講了多層感知器,也就是一般的前饋神經網絡,文章裏使用 CIFAR10 數據集得到的測試準確率是 46.98%。今天我們使用更適合處理圖像的卷積神經網絡來處理相同的數據集 - CIFAR10,來看下準確率能達到多少。

原创 【Python】小談 numpy 數組佔用內存空間問題

之前跟同學討論過numpy數組的佔用空間大小問題,但是今天給忘了,又重新試驗了一下,主要是利用sys模塊的getsizeof函數,使用的版本是 Python3.5。記錄下來,以備後忘。 問題 一個空的numpy數組對象佔用多大

原创 理解主成分分析

譯者注: 本文翻譯自 Rishav Kumar 於 2019 年 1 月 2 日發表的文章 Understanding Principal Component Analysis 文中括號或者引用塊中的 斜體字 爲對應的英文原文

原创 有意思的 lstrip 和 removeprefix(Python 3.9)

廢話不多說,上正文。 對比 Python 3.9 的新特性中,有兩個新的字符串方法:str.removeprefix(prefix, /)、str.removesuffix(suffix, /),前者是去除前綴,後者是去除後綴。

原创 【TensorFlow】TensorFlow 的多層感知器(MLP)

前面有幾篇博文講了使用 TensorFlow 實現線性迴歸和邏輯斯蒂迴歸,這次來說下多層感知器(Multi-Layer Perceptron)的 TensorFlow 實現。 本篇博文的代碼及結果圖片等可以在這裏下載,裏面包含Te

原创 試用開源標註平臺 Label Studio

數據標註是人工智能背後的女人。—— 我說的 初探 在 reddit 上看到一個人提了一個問題:What is your favourite (free) labelling tool?,你最喜歡的(免費)標註工具是什麼。由於我

原创 使用 VSCODE 連接遠程服務器上的容器

自從 VSCODE 出現以來,我就立馬從 pycharm 轉入了。厭倦了 pycharm 的笨重,用了 vscode 之後只能說是真香,編輯器界的 flask。但是和 flask 一樣,雖然輕便,但是自然基本上一切都需要你自己去配

原创 使用 plotly 繪製 Choropleth 地圖

本文將通過繪製中國省級 Choropleth 地圖來解釋如何使用 plotly 繪製 Choropleth 地圖,主要有兩種方法:底層 API plotly.graph_objects.Choroplethmapbox 和高層 A

原创 Check failed: stream->parent()->GetConvolveAlgorithms(&algorithms)解決辦法

由於我很早就在 GitHub 下載了 TensorFlow 的源碼庫沒有更新,在運行 TensorFlow 官方的 CNN 例子的時候,總是報 ImportError 錯誤,找不到 cifar10 模塊,後來發現是 TensorF

原创 Python logging 較佳實踐

未經允許,禁止轉載。 本文只是列出來我自己在實踐中總結出來的幾點,並不一定最佳。當然,我也不認爲有統一的最佳。 記錄日誌是程序中尤其是 web 服務中的重要一環,恰到好處的日誌記錄可以幫助我們瞭解程序運行情況以及 方便排(sh