原创 【語音】音頻重採樣8K轉16K,將mp3轉化爲wav格式

1、使用python librosa庫 (1)安裝pip install librosa (2)使用 這種方法可以將語音進行重採樣。聲頻信息完整。但不是pcm格式,可能需要使用第3步進行格式轉化。 filename = 'wav_

原创 python中mp3轉wav---安裝、聲音截取、音頻分佈

一、pydub和ffmpeg安裝(失敗) 1、直接pip安裝 pip install pydub pip install FFmpeg 運行下文程序時,報錯:Couldn’t find ffmpeg or avconv - de

原创 【報錯】ValueError: setting an array element with a sequence

使用xgb進行訓練時,報錯:ValueError: setting an array element with a sequence clf = XGBRegressor(objective="binary:logistic",

原创 【報錯】tensorflow時Can not convert a ndarray into a Tensor or Operation解決方案

使用TensorFlow 一批批feed數據時,報錯Can not convert a ndarray into a Tensor or Operation。 原因: feed_dict是寫在一個循環裏的,分批喂數據做訓練或做預測

原创 【報錯】docker 容器中中文亂碼解決方案

在docker容器中python腳本漢字的會亂碼,按下面方法暫時設置容器。編碼可以解決腳本中文亂碼問題 1、進入docker.sh容器 sh docker.sh 2、查看容器語言環境 [root@123 /]# locale L

原创 【報錯】FlaskWeb上jsonify返回的json串是utf-8的編碼,怎麼返回中文

問題:在本地測試時返回的時中文,但Web端調用時,返回的是UTF-8編碼。 解決方案: (1)使用jsonify()方法時 可以在啓動服務器的py文件裏配置flask app.config['JSON_AS_ASCII'] = F

原创 【Pytorch】3. 對Pytorch中梯度的理解

在反向求導是,Pytorch將Variable的梯度放在Variable對象中,隨時可以使用Variable.grad得到對應Variable的grad。剛創建Variable的時候,它的grad屬性初始化爲0.0。 1、Vari

原创 簡單好用的Python Flask框架部署Web服務(機器學習模型)

工作中,線下模型訓練好以後,可以使用Flask Web框架,將其部署上線。用戶通過API藉口傳入參數,對模型進行調用。 一、Flask框架主要分爲一下三個流程: 1、導入Flask類 app = Flask(name) 2、註冊服

原创 【機器學習】boosting集成學習GBDT

一、什麼是集成學習: 1、集成學習的含義 集成學習:指構建多個分類器(弱分類器)對數據集進行預測,然後用某種策略將多個分類器預測的結果集成起來,作爲最終預測結果。它要求每個弱分類器具備一定的“準確性”,分類器之間具備“差異性”。

原创 【Pytorch】5. Pytorch搭建多項式迴歸模型

一、理論介紹 對於一般的線性迴歸模型,由於該函數擬合出來的是一條直線,所以精度欠佳,我們可以考慮多項式迴歸,構造非線性特徵,用的是高次多項式而不是簡單的一 次線性多項式。所謂多項式迴歸,其本質也是線性迴歸。也就是說,我們採取的方法

原创 機器學習和深度學習常用的評價指標

一、分類器評價指標 1、混淆矩陣:衡量的是一個分類器分類的準確程度。適用於多分類器問題。 TP(真正)True Positive:實際爲正,預測爲正 FP(假正)False Positive:實際爲負,預測爲正 FN(假負)Fa

原创 【Pytorch】8. Pytorch中的卷積神經網絡

一、初始Pytorch卷積模塊 1、卷積神經網絡基本結構 (1)輸入層 一般輸入層的大小應該是能夠以被2整出多次的,常用的數字包括32,64,96,224。可以將圖片縮放到常用尺寸,進行輸入 (2)卷積層 應該儘可能使用小尺寸的

原创 【機器學習】boosting集成學習Adaboost

一、什麼是Adaboost AdaBoost,是英文"Adaptive Boosting"(自適應增強)的縮寫,由Yoav Freund和Robert Schapire在1995年提出。它的自適應在於:前一個基本分類器分錯的樣本會

原创 【聊天機器人】Tensorflow構建探索式聊天機器人項目——Ubuntu數據集

本文將介紹和實現一個基於檢索模型的聊天機器人。主要創新點在於採用LSTM方式對問題和答案進行文本表示,並計算相似度得分,根據分數的高低進行排序並得到我們選擇的最佳回覆。檢索模型所使用的回覆數據通常是預先存儲且知道(或定義)的數據,

原创 機器學習和深度學習中常用的損失函數

一、什麼是損失函數 損失函數用來評估模型預測值和真實值之間的差異。模型的損失越小,模型的魯棒性越好。 二、模型與常用損失函數 損失函數 模型 感知損失Perceptron Loss PLA Hinge損失Hing