原创 常見的損失函數,代價函數以及優化算法彙總

在機器學習和深度學習中,我們通常只需要掌握三個步驟就可以完成訓練了,拿起數據(特徵),搭上模型(目標函數,損失函數,代價函數),不斷優化(優化函數-梯度下降,adam,動量-找到最優的W),就可以完成了 1. 損失函數、代價函數與

原创 數據挖掘之爬蟲獲取網頁信息

抓取的是豆瓣的API信息,並保存 豆瓣的API已經打不開了 import json import urllib.request as urlrequest id_list=[26387939,11803087,20451290]

原创 數據挖掘之數據清洗(缺失值,異常值)

下載數據網站: https://www.kaggle.com/c/airbnb-recruiting-new-user-bookings/data 下載最下面的文件 清洗工具,pandas 清洗內容:日期轉換,缺失值處理,異常值

原创 報"ImportError: DLL load failed: 找不到指定的模塊"的解決辦法

import scipy.io as scio feat = scio.loadmat(datapath) 當我運行以上程序的時候,一直報錯說: 無法啓動報"ImportError: DLL load failed: 找不到指定的

原创 線性迴歸邏輯迴歸以及梯度下降算法講解

梯度下降算法很久之前就看過了,近來想對這些知識做一個整體的梳理,一來是爲了便於對知識的回顧和總結,二來也希望可以幫助到大家更好地掌握到這些知識。 下圖是一個算法最基本的流程圖,接下來會講解爲什麼要使用梯度下降算法,梯度下降算法中步

原创 機器學習算法--決策樹與隨機森林

決策樹的算法比較簡單 主要分爲以下部分: 一、決策樹基本概率以及計算(ID3) 1、決策樹定義 決策樹(Decision Tree),又稱爲判定樹, 是一種以樹結構(包括二叉樹和多叉樹)形式表達的預測分析模型。比如我們會問‘今天出

原创 網絡爬蟲 爬取心血管數據

# ! /usr/bin/python # -*- coding: utf8 -*- # @Time : 2019/10/23 # @Author : zhang import requests from urlli

原创 機器翻譯以及注意力機制

注意力機制就是讓計算機模擬人類大腦,在看東西的時候,將注意力集中在比較感興趣的物體上。 1. 引入注意力機制的目的: 1、計算能力的限制:越複雜的模型才能記住更多的信息,但是當前計算能力依然是限制人工神經網絡發展的瓶頸 2、優化算

原创 斯坦福大學機器學習筆記1---梯度下降

梯度下降算法很久之前就看過了,近來想對這些知識做一個整體的梳理,一來是爲了便於對知識的回顧和總結,二來也希望可以幫助到大家更好地掌握到這些知識。這裏我講解了爲什麼要使用梯度下降算法,以及梯度下降算法中步長的理解,如果文章有錯誤的地方,

原创 WARNING:tensorflow:Variable *= will be deprecated.

最近重裝了keras和tensorflow之後運行程序就會出現這個警告 WARNING:tensorflow:Variable *= will be deprecated. Use variable.assign_mul if you

原创 報"ImportError: DLL load failed: 找不到指定的模塊"的解決辦法(2)

前不久我用python輸入 import scipy.io as scio,報錯:無法啓動報"ImportError: DLL load failed: 找不到指定的模塊"的解決辦法,這個問題解決了,沒想到又出現了同一個類似的錯誤。

原创 win10安裝cuda+cudnn+python+tensorflow-gpu+pycharm踩坑系列詳細講解

本來之前是在win7系統裝的python,後來一直報錯就果斷裝了win10系統。由於經常安裝python,cuda,有時候安裝過程中因爲版本的原因會出現很多問題,這裏就記錄以下安裝步驟以及遇到的問題。 我這裏的版本是cuda9.0+c

原创 安裝cuda 報錯nvcc fatal : Cannot find compiler 'cl.exe' in PATH

當我安裝好了cuda之後,查看cuda是否安裝成功,輸入:nvcc -V 就會報錯:nvcc fatal : Cannot find compiler ‘cl.exe’ in PATH 我在這裏安裝的是Visual Studio 20

原创 K-means聚類算法之程序實現-3維像素級分割

最近看了k-means算法,網上這個算法很多都是用來分割二維圖片的,所以想嘗試用這個算法做一下三維圖片的分割。 那麼我們先來介紹一下二維圖片的分割: 原理是這樣的,我們把二維圖片中的每一個像素點的值作爲一個特徵值,如果是彩色圖片,那麼

原创 常見分佈總結-高斯分佈、伯努利分佈、泊松分佈、幾何分佈、beta分佈

概率分佈 概率分佈是指用於表述隨機變量取值的概率規律,包括連續分佈和離散分佈。 下面作了這些概率分佈的一個思維導圖。 文章目錄概率分佈1、離散概率分佈1.1、兩點分佈2.2、 二項分佈1.3、幾何分佈1.4、超幾何分佈1.5、泊松