原创 【工程類】【Linux】用網線連接Windows和Linux臺式機,並實現Linux共享Windows的WiFi網絡

前言 由於工作需要,需要利用網線將自己的筆記本和Linux臺式機進行連接,實現Windows可以遠程登錄Linux機器,並實現Linux共享Windows的WiFi網絡。 網上的很多方法可以實現兩臺機器互ping,但是我這邊一旦連

原创 【程序人生】【目標計劃】目標計劃(更新至2020年)

文章目錄2020.2.201、回顧20192、2020年目標2.1工作目標2.2寫博客2.3微信小程序2.4健身2.5攝影2019.2.161、績效目標2、讀書3、健身4、美食 2020.2.20 1、回顧2019 2019年已經

原创 【工程類】【Hadoop】Hadoop streaming 在使用stream.num.map.output.key.fields命令時注意事項

1、使用HadoopStreaming的一個小case,分享給大家,避免日後出bug: 當我們在用-D stream.num.map.output.key.fields="2"這個參數時,如果map端輸出的長度小於或者等於2,則在

原创 【程序人生】【網址彙總】一名算法工程師常用網址彙總(持續更新中)

一、論文下載 1、sci論文下載 2、paperweekly 3、google學術 二、算法 1、深度學習 1、深度學習詳細資料彙總 2、RNN,attention 2、NLP 3、其他 1、向量傳播算法、向量傳播算法 三、書籍視

原创 【工程類】【Python】一文搞懂Python字符編碼問題

Python的字符編碼很是讓人頭疼,動不動就出現encode和decode ERROR的這些問題,,鑑於此,準備好好研究一番字符編碼的問題,整理成文章。後續也會根據所學繼續加入自己的理解。由於本人並非大神,如有講錯之處也請各位大神

原创 【工程類】【Hadoop】性能調優方法

當我們寫完一個MR程序之後,我們希望能夠加快程序的執行速度,那麼怎麼進行性能的調優呢,有如下幾種方法? 1、mapper的數量 適當調整mapper的數量,使得每個mapper的運行時間在1分鐘爲宜。因爲mapper數量過小,則會

原创 【算法類】【預處理】利用skit-learn分割訓練集測試集

當我們獲取到數據集的時候,會覺得寫一個單獨寫一個分割數據集的函數很費事,要考慮到隨機性和訓練集測試集的比例大小。skit-learn提供了一種分割訓練集測試集的函數 from sklearn.cross_validation im

原创 【工程類】【Python】Python3讀中文亂碼問題彙總

1、open(filepath).readlines()報錯 究極解決辦法: for line in open("yiliao.final",encoding="gb18030",errors='ignore').readlin

原创 【工程類】【python】python筆記

文章目錄1、有序字典OrderedDict2、*args和**args的用法和區別3、for else 用法4、python保留小數點位數5、字符串加入變量6、字典嵌套 1、有序字典OrderedDict 有時候,我們需要獲取輸

原创 【工程類】【python】*args和**args的用法和區別

1、*args 接收任意數量形參。 舉個栗子,一個函數的功能是做菜,要求輸入菜名和其配料,但是配料非常多且不固定,那麼就可以這樣寫 def cook(food_name,*args): print("食物名字是:" + food

原创 【程序人生】【目標計劃】2020年目標計劃(持續更新中)

今天是2020年2月18號,開始立flag 1、回顧2019 2019年已經過去了,回顧2019年的計劃,我覺得很是慚愧,可以說幾個目標幾乎一個都沒達成。 績效目標 本來定的是績效目標中必須有一個A,但是今年所有的績效都是B,究

原创 【工程類】【shell】sort的多列排列

sort -k1,1 -k3nr,3 -t$’\t’ 上述示例表用第一個字段進行排列,同時用第三個字段進行數字降序排列,分隔符爲\t 可以參考鏈接

原创 【算法類】【算法介紹】常用NLP深度學習模型之Basic Embedding Model

本文是常用NLP深度學習模型系列的第一個系列,Basic Embedding Model。 NNLM NNLM模型是2003年由Bengio發表在JMLR的論文,其主要目的是根據語料信息學習語言模型。 模型的基本架構如下圖所示

原创 【算法類】【論文筆記】Siamese Recurrent Architectures for Learning Sentence Similarity

0、 Siamese Recurrent Architectures for Learning Sentence Similarity 1、摘要 論文主要用了一個簡單的LSTM模型,通過對單詞進行編碼,最終計算相似性的一個方法,

原创 【工程類】【c++】cblas常用接口說明

openblas第一彈:openblas 使用說明和常用接口介紹 OpenBLAS API 這篇文章寫得不錯,先留存着,以後有機會了自己寫一篇