原创 特徵工程(六): 非線性特徵提取和模型堆疊

來源:https://mp.weixin.qq.com/s/vEWP-xej_aEcyu_9dy5XwQ 當在數據一個線性子空間像扁平餅時 PCA 是非常有用的。但是如果數據形成更復雜的形狀呢?一個平面(線性子空間)可以推廣到一個 流形 

原创 特徵工程(一)數據預處理

來源:機器學習AI算法工程  公衆號: datayx   1、二值化 當某個特徵數據分佈偏態明顯時(如下圖:99%的數據爲24以內,最大值達到9667),將數據做二值化處理,如:將小於1的數據記爲0,將大於1的數據記爲1。 2、固定寬度

原创 特徵工程(七):圖像特徵提取和深度學習

來源:https://mp.weixin.qq.com/s/pZWKECYyvLlkB-Qt8wi0fw 視覺和聲音是人類固有的感覺輸入。我們的大腦是可以迅速進化我們的能力來處理視覺和聽覺信號的,一些系統甚至在出生前就對刺激做出反應。另一

原创 特徵工程(五): PCA 降維

來源:https://mp.weixin.qq.com/s/Zdb_fIb5-zpvq4sTeu3Dww 通過自動數據收集和特徵生成技術,可以快速獲得大量特徵,但並非所有這些都有用。我們前面討論了基於頻率的濾波和特徵縮放修剪無信息的特徵。

原创 特徵工程(二) :文本數據的展開、過濾和分塊

https://mp.weixin.qq.com/s/4WobY9h8A3OOm0VdmFQj6g 如果讓你來設計一個算法來分析以下段落,你會怎麼做? Emma knocked on the door. No answer. She kn

原创 特徵工程(三):特徵縮放,從詞袋到 TF-IDF

來源:https://mp.weixin.qq.com/s/vyJSH3bYTi8B9UOnzzhftw 字袋易於生成,但遠非完美。假設我們平等的統計所有單詞,有些不需要的詞也會被強調。在第三章提過一個例子,Emma and the ra

原创 特徵工程(四): 類別特徵

來源:https://mp.weixin.qq.com/s/Ub-bnil-DvMFNB4np3nOhQ 一個類別特徵,見名思義,就是用來表達一種類別或標籤。比如,一個類別特徵能夠表達世界上的主要城市,一年四季,或者說一個公司的產品(石油

原创 anaconda如何更新TensorFlow版本

打開anaconda自帶的命令行窗口    查看當前版本 python import tensorflow as tf print(tf.version.VERSION) # 退出Python exit() 卸載當前的版本 pip u

原创 TF Girls——Work2vec

視頻:https://space.bilibili.com/16696495/channel/detail?cid=1588 github:https://github.com/CreatCodeBuild/TensorFlow-and-

原创 TF Girls——卷積神經網絡(12-15)

github:https://github.com/CreatCodeBuild/TensorFlow-and-DeepLearning-Tutorial/tree/master/Season1/12-15 視頻:https://spac

原创 TF Girls——TensorBoard可視化(10-11)

數據下載:http://ufldl.stanford.edu/housenumbers/ load.py # encoding:utf-8 # Python2 兼容 from __future__ import print_func

原创 TF Girls——總結(20)

GitHub:https://github.com/CreatCodeBuild/TensorFlow-and-DeepLearning-Tutorial/blob/master/Season1/20/load.py   ### loa

原创 TF Girls——模型調優(16-19)

GitHub:https://github.com/CreatCodeBuild/TensorFlow-and-DeepLearning-Tutorial/tree/master/Season1/16-19   本文內容: Regular

原创 TF Girls——神經網絡(7-9)

GitHub:https://github.com/CreatCodeBuild/TensorFlow-and-DeepLearning-Tutorial/tree/master/Season1/7-9 本文內容: 神經網絡   dp.p

原创 TF Girls——數據探索(4-6)

      本文內容: 4、機器學習 5、數據預處理 6、數據分佈 #《TF Girls 修煉指南》第四期 # 正式開始機器學習 # 首先我們要確定一個目標: 圖像識別 # 我這裏就用Udacity Deep Lear