原创 論文筆記:Attention is All You Need

Google於2017年在NIPS上發表的論文。 Abstract 主流序列轉導模型基於複雜的RNN或CNN,這些神經網絡包含一個編碼器和一個解碼器。 性能最好的模型還通過attention機制將編碼器和解碼器連接起來。 我們提出

原创 面試準備——python知識

1、range和xrange的用法和區別 在Python2中,range()與xrange()功能是一樣的,多用於for循環。但是不同的是range產生的是一個list對象,而xrange是一個生成器對象 。從性能上,xrange

原创 bert今生前世全總結

一、Bert簡介 谷歌AI實驗室的BERT深刻影響了NLP的格局。 BERT之後,許多NLP架構、訓練方法與語言模型如雨後春筍般湧現,比如谷歌的TransformerXL、OpenAI’s GPT-2、 XLNet、ERNIE2.

原创 面試準備——動態規劃(4):合併石頭的最低成本 & 擊爆氣球

題目1:合併石頭的最低成本(leetcode1000題) 有 N 堆石頭排成一排,第 i 堆中有 stones[i] 塊石頭。 每次移動(move)需要將連續的 K 堆石頭合併爲一堆,而這個移動的成本爲這 K 堆石頭的總數。 找出

原创 python字符串、列表、數組、變量等高頻常見使用技巧

兩個list合爲字典 python3返回迭代器: a = [1,2,3];b = [2,3,4] c = dict(zip(a,b)) python2直接返回list類型,不需要類型轉換。 批量轉換list中的數據類型 pyth

原创 python中命令行工具模塊argparse的使用

跑機器學習或深度學習實驗的時候經常需要調各種參數,當把代碼部署到服務器上時,如果直接在代碼中改參數的大小,非常不方便,如果用argparse模塊通過命令行傳遞參數到程序中,會使代碼更方便簡潔有序。 argparse是python用

原创 運籌學中的節約里程法及其python實現

節約里程法簡介 節約里程法,又稱C-W算法 、節約算法或節約法,是由Clarke和Wright於1964年首次提出的,用來解決VRP問題,是重要的物流算法,是用來解決運輸車輛數目不確定的問題的最有名的啓發式算法。 節約里程法核心思

原创 jupyter notebook安裝和基礎使用教程

一、簡介 Jupyter Notebook是基於網頁的用於交互計算的應用程序。其可被應用於全過程計算:開發、文檔編寫、運行代碼和展示結果。 即,Jupyter Notebook以網頁的形式打開,可以在網頁頁面中直接編寫代碼和運行代

原创 pandas常見函數的用法(apply、groupby、agg)

1. apply方法 apply方法就是將函數應用到由列或行形成的一維數組上。可以快速地對列進行處理,尤其是在進行多行計算的時候,相比於傳統的輪循計算要高效很多。 例如: import pandas as pd df=pd.Da

原创 論文筆記:Focal Loss for Dense Object Detection

論文鏈接: https://arxiv.org/pdf/1708.02002.pdf 本篇論文是何愷明及其團隊17年發表在ICCV上的paper。最初用於目標檢測,因爲解決了分類中類別不平衡的問題,nlp中也有應用。 下面是各部

原创 論文筆記:BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

論文地址: BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding(第一版) BERT: Pre-training of D

原创 五大經典算法(貪婪、動態規劃、分治、回溯、分支限界法)及其聯繫和比較

一、貪心法 貪心算法的含義: 貪心算法(也叫貪婪算法)是指在對問題求解時,總是做出在當前看來是最好的選擇。也就是說,不從整體最優上加以考慮,只做出在某種意義上的局部最優解。貪心算法不是對所有問題都能得到全局最優解,得到的是局部最優

原创 論文筆記:XGBoost: A Scalable Tree Boosting System

這篇論文是Tianqi Chen2016年在arXiv上發表的。 陳天奇是機器學習領域著名青年學者,本科就讀於上海交大ACM班,華盛頓大學計算機系博士,開發了XGBoost、MXNet、TVM等知名機器學習工具。 (因爲原文內容較

原创 python正則表達式及常用匹配

6個及6個以上的阿拉伯數字連續出現: re.findall('\d{6,}',line) 匹配時間,冒號前面是一到兩位的數字,後面是兩位數字: (注意防止08:345、102:30這種情況出現,並考慮全角和半角冒號) re.fi

原创 萬門大學PPT技能速成班學習筆記

課程鏈接:https://www.wanmen.org/courses/5d4d398c8ad701b4d644306b/lectures 第一講 對ppt的理解 ppt做的好的人,一定是站在觀衆角度思考的人。 審美決定一切。多看