原创 hadoop安裝hive

hadoop安裝hive1. 卸載MariaDB2. 下載hive,mysql,mysqlconnect2.1 安裝mysql2.2 安裝配置hive3. 掉過的坑3.1 登錄到hive數據倉庫後,輸入一些命令,出現如下錯誤 Ce

原创 特徵工程中缺失值處理

特徵工程中缺失值處理 缺失值極多:把該特徵直接捨棄 非連續特徵缺失值適中:把NaN作爲一個新類別 連續特徵缺失值適中:給定一個step,離散化,把NaN作爲一個type放入到特徵中 缺失值較少: 利用填充的方法進行處理,常見的

原创 CentOS7 + hadoop2.8大數據環境搭建

默認已經在VMware上安裝了系統爲CentOS7的三臺機器,並且設置了三臺機器靜態IP地址。 如果對設置靜態IP地址不熟悉,可以參考博主另外一篇博客。 https://blog.csdn.net/zgf605506394/art

原创 tesseract和PIL對圖片驗證碼進行識別

原圖: 灰度處理+二值化處理,即可得到下邊 類似於這樣的圖片 from PIL import Image import pytesseract def img_handle(img_path): img =

原创 python logging 替代print 輸出內容到控制檯和重定向到文件

在寫程序的時候,尤其是大型的程序,在程序中加入日誌系統是必不可少的,它能記錄很多的信息。剛剛接觸python的時候肯定都在用print來輸出信息,這樣是最簡單的輸出,正是因爲這樣,在調試的時候還要去逐個的去更新print後面

原创 【轉載】python語句中的try-except-else-finally

1、try - except 作用: 捕獲程序在執行時遇到的異常情況,即一些報錯。什麼啥玩意兒沒定義啊,符號又錯了啊之類的你懂得。 意義: 因爲程序在發現某個錯誤時,往往會中斷不再向下執行,如下例子說明問題: 很明顯,我們並

原创 連連支付信息安全白皮書

文章目錄信息安全戰略風險管理框架合規和隱私保護信息安全責任聲明基礎安全安全運營管理 信息安全戰略 落實安全管控責任 規避與降低安全風險 保障業務安全運行 依法依規保護客戶隱私 風險管理框架 合規和隱私保護 ISO9001:

原创 IPC技術與評分卡技術區別

在衆多的小貸技術中,本文主要關注兩個技術,一個是德國IPC公司的小貸技術(以下簡稱德國IPC技術),和德國IPC技術類似的還有很多,比如法國沛豐的小貸技術,印尼人民銀行小貸技術等等,都是偏重於人與人溝通的技術,由信貸員做決策;另一

原创 區塊鏈100問

區塊鏈100問01. 從物物交換到比特幣02. 什麼是比特幣03. 比特幣白皮書的誕生04. 第一個比特幣誕生啦05. 誰是中本聰06. 密碼朋克是什麼07. 比特幣是怎麼發行的08. 披薩居然賣到3億元09. 中本聰的繼承者是誰

原创 Hadoop2.8 HDFS上測試目錄創建,上傳,下載,查看文件

HDFS操作文件操作1.創建目錄2. 上傳本地文件到HDFS3. 查看HDFS文件4. 從HDFS上下載文件到本地 文件操作 1.創建目錄 任何目錄 ${HADOOP_HOME}/bin/hdfs dfs -mkdir /dem