原创 Windows:Anaconda3安裝TensorFlow

前提 Anaconda3 已經安裝成功第一步:設置 Anaconda 倉庫鏡像,因爲默認連接的是國外鏡像地址,下載速度比較慢,將鏡像地址改爲清華大學開源軟件鏡像站,打開 Anaconda Prompt, 輸入:conda config -

原创 Win7與Ubuntu 16.04 之間實現複製粘貼

安裝 vmware tools: sudo apt install open-vm-tools sudo apt install open-vm-tools-desktop sudo reboot 點贊 1 收藏

原创 程序員面試金典----翻轉子串

假定我們都知道非常高效的算法來檢查一個單詞是否爲其他字符串的子串。請將這個算法編寫成一個函數,給定兩個字符串s1和s2,請編寫代碼檢查s2是否爲s1旋轉而成,要求只能調用一次檢查子串的函數。給定兩個字符串s1,s2,請返回bool值代表s

原创 機器學習----正則化

L1和L2是正則化項,又叫做罰項,是爲了限制模型的參數,防止模型過擬合而加在損失函數後面的一項。 L0正則:模型參數中非零參數個數; L1正則:模型各參數絕對值之和; L2正則:模型各個參數的平方和的開方值。 L1和L2的區別: L1是模

原创 算法分析與設計----動態規劃

動態規劃的原理 基本思想:將待求問題分解成若干個子問題,先求解子問題,然後從這些子問題的解得到原問題的解。 基本要素: 最優子結構  重疊子問題 設計動態規劃算法的步驟: 找出最優解的性質,並刻畫其結構特徵; 遞歸地定義最優值; 以自底向

原创 二分查找總結

1.二分查找又稱折半查找 2.優點:比較次數少;查找速度快;平均性能好 3.缺點:待查表爲有序數組(若爲無序數組,分成兩份查找無意義,排序本身也耗費時間);插入刪除困難(增刪需要移動大量的節點) 4.思想: 在一個有序數組中,取數組的中間

原创 C語言實現----快速排序

1.快速排序是一種交換排序 2.基本思想:         選取一個基準數;         然後將大於和小於基準的元素分別放置於基準數兩邊;         繼續分別對按此方法分治基準數的兩側,直至整個序列有序。 3. 注意問題    

原创 機器學習----過擬合和欠擬合

過擬合 (1)什麼是過擬合? 模型學習能力太強,以至於把噪聲數據的特徵也學習到了,導致模型泛化能力下降,在訓練集上表現很好,但是在測試集上表現很差。 (2)過擬合出現的原因: 訓練集的數量級和模型的複雜度不匹配。訓練集的數量級要小於模型的

原创 機器學習----面試題目總結(一)

以下題目來自:微信公衆號(人工智能頭條)你在簡歷中提到曾經構建過一個文檔挖掘系統,你都做了哪些工作?能否在主題建模(topic modeling)中使用LDA技術實現文檔聚類?假設你有數百兆字節的數據文件,這其中包括PDF文件、文本文件、

原创 機器學習----十大經典算法(總)

一、C4.5算法C4.5是決策樹算法ID3的改進,它繼承了ID3 算法的優點,並用信息增益率選擇劃分屬性,能處理非離散或不完整的數據。二、K均值(K-means)算法K-means是基於距離的聚類算法,師徒找出滿足方差最小的K個聚類。三、

原创 華爲歷年筆試面試機考試題在線練習----取近似值

題目描述寫出一個程序,接受一個正浮點數值,輸出該數值的近似整數值。如果小數點後數值大於等於5,向上取整;小於5,則向下取整。輸入描述:輸入一個正浮點數值輸出描述:輸出該數值的近似整數值示例1輸入複製5.5 輸出複製6#include<st

原创 特徵選擇----TF*IDF

TF*IDF TF 稱爲詞頻,表示詞在一篇文檔中出現的頻率=詞在該文檔中出現的次數 / 該文檔中單詞的總數---TF越大,表示該詞對文檔越重要 DF稱爲文檔頻率,一個詞在多少篇文章中出現過 IDF 稱爲逆文檔頻率=Ln(總文檔數/出現該次

原创 華爲歷年筆試面試機考試題在線練習----輸入一行字符,分別統計出包含英文字母、空格、數字和其它字符的個數。

#include <iostream> #include <string> using namespace std; int main(){ string str; while(getline(cin,str)){

原创 最大子數組之和

一個整數數組中的元素有正有負,在該數組中找出一 個連續子數組,要求該連續子數組中各元素的和最大,這個連續子數組便被稱作最大連續子數組。比如數組{2,4,-7,5,2,-1,2,-4,3}的最大連續子數組爲{5,2,-1,2},最大連續子數

原创 Python下LDA的基礎用法

""" 第一部分:載入數據 """ import numpy as np import lda import lda.datasets # document-term matrix X = lda.datasets.load_reu