原创 統計學基礎-數據的圖表展示

理論基礎: 什麼是統計學? 統計學分爲描述統計和推理統計 統計學研究什麼? 統計學沒有固定的研究對象,統計學研究的是來自各個領域的數據,靠解決其他領域內的工作而生存,我們並不能因此就看輕統計學,就好像計算機現在滲透在各行各業、我們生活中

原创 Implement Trie (Prefix Tree)前綴樹系列

208. Implement Trie (Prefix Tree)   class Trie: def __init__(self): """ Initialize your data stru

原创 統計 THE TRAGEDY OF ROMEO AND JULIET (羅密歐與朱麗葉)英文小說中各單詞出現的次數

 作爲python 練手的一個小例子 數據來源: 鏈接:https://pan.baidu.com/s/1u2c7O-617MboXSwBHnoOcA 提取碼:vX47  def words_static(file_path):

原创 minist圖片多分類問題-單層神經網絡

採用打單層隱藏層,使用TensorFlow框架 構建的分類神經網絡 ---入門級小項目 供深度學習(TensorFlow)初學者參考   #!/usr/bin/env python # coding: utf-8 # In[ ]:

原创 統計學習第二彈--描述性統計(理論公式)

  思維導圖(目錄結構):   集中趨勢 衆數:一組數據中出現頻數最多的數值,常用用Mo表示 #求衆數 def Max_number(nums): res = {} for num in nums:

原创 如何通過Tensorflow的變量賦值計算1+2+3+4+5+6+7+8

一、導入tensorflow     import tensorflow as tf 二、定義計算圖   (1)常量初始化     constant_name = tf.constant(value)   (2)變量初始化   創建變量:

原创 hive 表中常用的 增加/修改/替換列操作

1)語法 更新列 ALTER TABLE table_name CHANGE [COLUMN] col_old_name col_new_name column_type [COMMENT col_comment] [FIRST|AFTE

原创 人體溫度、心率和性別數據分析

任務描述 Q1、人體體溫的總體均值是否爲98.6華氏度? Q2、人體的溫度是否服從正態分佈? Q3、人體體溫中存在的異常數據是哪些? Q4、男女體溫是否存在明顯差異? Q5、體溫與心率間的相關性(強?弱?中等?) 數據鏈接:https:/

原创 統計學習-抽樣分佈

常用統計量: 樣本均值 樣本均值(sample mean)又叫樣本均數。即爲樣本的均值。均值是表示一組數據集中趨勢的量數,是指在一組數據中所有數據之和再除以這組數據的個數。它是反映數據集中趨勢的一項指標。 樣本方差 先求出總體各單位變量值

原创 抽樣分佈實踐(python版)

任務描述:     1、驗證數據是否服從正太分佈     2、驗證數據是否服從T分佈     3、驗證數據是否服從卡方分佈 背景知識:     1、什麼是假設檢驗          假設檢驗(hypothesis testing),又稱統

原创 時間預測實踐-汽車銷量的分析預測

背景: 03年到19年第一季度分季度的數據,13年之前只有傳統汽車的銷量,13年之後是傳統汽車+新能源汽車的銷量,需要預測未來三期傳統汽車的銷量 數據鏈接: 具體的實現過程: #loda data data = pd.read_exce

原创 統計學習之時間序列分析

一、什麼是時間序列   1、定義   按照時間的順序把一個隨機事件變化發展的過程記錄下來 就構成了一個時間序列。   對時間序列進行觀察、研究,找尋它變化發展的規律,預 測它將來的走勢就是時間序列分析。   2、栗子 7000年前,古埃及

原创 統計學習-方差分析之單因素方差分析

1、數據背景 有A、B、C、D四個地區,不同地區的銷售量不一樣,現抽取了不同時間段內每個地區的銷售量,試使用方差分析的方法解決: 1、每個地區間的銷售量是否相同? 2、不同月份的銷售量是否相同? 3、不同時間與地區的銷售量是否相同? 2、

原创 統計學習之方差分析

零、案例說明 爲了檢驗某小學六年級教學質量的差異,從該小學六年級的三個班級中分別選取一定數量的學生,分成三個組(三個樣本),對他們期末考試的平均分進行統計分析。如果實驗顯示每個每組的均值相同,即三個班期末考試的成績差異不大,則表明該小學六

原创 UDF、UDAF和UDTF開發模板

0.背景 Hive是一種構建在Hadoop上的數據倉庫,Hive把SQL查詢轉換爲一系列在Hadoop集羣中運行的MapReduce作業,是MapReduce更高層次的抽象,不用編寫具體的MapReduce方法。Hive將數據組織爲表,這