原创 基於Python的機器學習實戰:AadBoost

目錄:1. Boosting方法的簡介2. AdaBoost算法3.基於單層決策樹構建弱分類器4.完整的AdaBoost的算法實現5.總結1. Boosting方法的簡介 返回目錄Boosting方法的基本思想:對於一個複雜的任務來說,將

原创 Python+條件隨機場(crf)+詞性標註

      本文運用字標註法進行中文分詞,使用4-tag對語料進行字標註,觀察分詞效果。模型方面選用開源的條件隨機場工具包“CRF++: Yet Another CRF toolkit”進行分詞。        本文使用的中文語料資源是

原创 impala調優

Impala是Cloudera開發、開源的一個原生於Hadoop的交互式SQL引擎。本身Impala的出現並不是爲了替代Hive、Pig等現有的、常用的ETL工具。實用的場景往往於商業智能密不可分,比如對數據進行聚合(Aggregatio

原创 python邏輯迴歸代碼實例

# -*- coding: utf-8 -*- """ Created on Tue Feb 6 09:00:31 2018 @author: wangqingxin """ import pandas as pd from pand