原创 案例:通過空氣質量指數AQI學習統計分析並進行預測(上)

本篇博客會帶你學習: 數據分析流程 特徵工程 缺失值、異常值、重複值的處理 箱線圖怎麼判斷異常值 觀察散點圖、箱型圖、箱線圖等進行分析 兩獨立樣本T檢驗 用到的庫:numpy 、pandas、 matplotlib、 s

原创 邏輯迴歸的原理及代碼理解

本篇博客講述邏輯迴歸模型,使用邏輯迴歸實現分類任務。 邏輯迴歸1、目標2、邏輯迴歸模型2.1 模型簡介2.2 算法的分類思想2.3 算法模型2.4 sigmoid函數2.4.1 函數原型2.4.2 sigmoid函數圖像3、邏輯

原创 機器學習之你不懂的 sigmoid函數

sigmoid函數sigmoid函數原型什麼是sigmoid函數?Sigmoid函數的表達式:Sigmoid函數的圖像:函數的基本性質:Sigmoid函數與邏輯迴歸如何繪製sigmoid函數圖像 sigmoid函數原型 對於分類任

原创 我是損失函數,用來表現預測數據與實際數據的差距而存在

損失函數定義 機器學習模型關於單個樣本的預測值與真實值的差稱爲損失。損失越小,模型越好,如果預測值與真實值相等,就是沒有損失。用於計算損失的函數稱爲損失函數。模型每一次預測的好壞用損失函數來度量。 機器通過損失函數進行學習。這是一

原创 一看就懂的推斷分析——假設檢驗

假設檢驗,又稱統計假設檢驗,是用來判斷樣本與樣本、樣本與總體的差異是由抽樣誤差引起還是本質差別造成的統計推斷方法。 顯著性檢驗是假設檢驗中最常用的一種方法,也是一種最基本的統計推斷形式,其基本原理是先對總體的特徵做出某種假設,然後

原创 沒別的!學它——通俗易懂的線性迴歸

線性迴歸1 線性迴歸背景主題目標2 線性迴歸知識要點2.1 數據建模2.1.1 模型概念2.1.2 迴歸分析2.1.2.1 線性迴歸2.1.2.2 擬合2.2 線性迴歸模型2.2.1 簡單線性迴歸2.2.2 多元線性迴歸2.3 損

原创 如何提升Hive執行效率?看這裏!

這裏分享關於如何提升Hive執行效率,幫助你學會企業級的優化技巧,學會思路變換,多種方法解決問題。還在等什麼,讓我們開始吧! 標題目錄技巧1:去重技巧——用group by來替換distinct技巧2:聚合技巧——利用窗口函數g

原创 Hive lateral view 和 explode的區別和使用

1、explode 將一行數據轉換成列數據,可以用於array和map類型的數據。 就是將hive一行中複雜的array或者map結構拆分成多行。 用於array的語法如下: select explode(arraycol)

原创 HiveSQL:看這裏!一看就懂的連接查詢及案例

連接查詢:1、學習目標2、表連接(1)inner join(2)left /right join(3)full joincoalesce函數(4)union allunion all和union的區別 1、學習目標 1、掌握HQL

原创 MySQL基礎語句一

數據庫的操作: 1、新建數據庫: create database name; 2、查詢和選擇數據庫: show databases; use name; #選擇某個數據庫 3、刪除數據庫: drop database name

原创 DataFrame添加數據

添加數據 1、給數據框最後添加一列 例如給如下數組添加一列: 數組名爲df1,給df1加score一列: df1['score']=[80,98,67,90] 可以直接命名列名,賦值數據即可。 注意:增加列的元素個數要跟原數據

原创 利用 Pyecharts 製作詞雲圖

利用 Pyecharts 製作詞雲圖: from pyecharts import options as opts from pyecharts.charts import Page, WordCloud from pyechar

原创 利用 matplotlib 製作條形圖

利用 matplotlib 製作條形圖 排列在工作表的列或行中的數據可以繪製到柱狀圖(條形圖)中。 特點:繪製連離散的數據,能夠一眼看出各個數據的大小,比較數據之間的差別。(統計/對比) 我們用一個例子來描述利用matplotli

原创 利用 Pyecharts 製作餅圖

利用 Pyecharts 製作餅圖: from pyecharts import options as opts from pyecharts.charts import Pie from random import randin

原创 python-報錯關於 cannot import *** from pyecharts的問題解決

拿from pyecharts import options as opts 爲例 在導入 option 時報錯: cannot import name 'option' from 'pyecharts' (F:\anaconda