原创 uwsgi 最簡單配置方法

uwsgi 最簡單配置方法 個人uwsgi配置記錄,具體關於uwsgi理論內容另外文章再介紹。 安裝uwsgi uwsgi pip install uwsgi 查看uwsgi版本` uwsgi --version 第一個小測試

原创 特徵工程總結(一):異常值檢驗及處理

一.定義:           異常值,即在數據集中存在不合理的值,又稱離羣點。二.檢驗:(1)簡單統計分析:對屬性值進行一個描述性(經驗)的統計,從而看出哪些值是不合理的。例如年齡,年齡的區間是【0,100】,如果樣本中的年齡不在這個區

原创 Python調用Java

安裝 python -m pip install jpype1 pythonIDE python3.6 java1.8 eclipse4.6.3 PyDev(python在eclipse插件) (不得不說,eclipse很

原创 特徵工程總結(三)特徵相關性分析

一、變量間的關係分析 變量之間的關係可分爲兩類: 1. 存在完全確定的關係——稱爲函數關係 2. 不存在完全確定的關係——雖然變量間有着十分密切的關係,但是不能由一個或多各變量值精確地求出另一個變量的值,稱爲相關關係,存在相關關係

原创 Hive 啓動報錯 ClassNotFoundException: org.apache.hadoop.hive.service.HiveServer

hive –service hiveserver Exception in thread “main” java.lang.ClassNotFoundException: org.apache.hadoop.hive.service.Hi

原创 Hadoop數據倉庫hive的基本知識

Hive是基於Hadoop的數據倉庫工具,可對存儲在HDFS上的文件中的數據集進行數據整理、特殊查詢和分析處理,提供了類似於SQL語言的查詢語言–HiveQL,可通過HQL語句實現簡單的MR統計,Hive將HQL語句轉換成MR任務進行