原创 python畫圖——matplotlib.plot 學習

之前把《利用Python進行數據分析》擼了一遍,其中就有一章專門說數據可視化的,結果這兩天做數據挖掘算法實現想用Python畫個圖,發現腦袋空空如也。所以今天又專門找個時間把Python數據可視化再擼一遍,不過這次就要做個筆記了,

原创 在 Windows 上部署 Gitblit 解決不能 Failed creating java 問題

在 Windows 上部署 Gitblit 教程:在windows部署gitblit或者如何在windows上搭建私有git服務器 在部署的最後一步的時候無法實現註冊服務並啓動,解決方案如下: 原因:JVM是x86的 1.sc d

原创 第1部分 基本流程

一、數據建模基本流程 概念模型邏輯模型物理模型 在建模的不同階段,將數據模型分爲三個層次,每層的作用各不相同。 概念模型:確定系統的核心以及劃清系統範圍和 邊界 邏輯模型:梳理業務規則以及對概念模型的求精 物理模型:從性能、訪問

原创 Python 的 TOP50 數據可視化 圖形(包含代碼)

原文鏈接:https://www.machinelearningplus.com/plots/top-50-matplotlib-visualizations-the-master-plots-py

原创 DataFrame 新增列的五種方法

本文總結了平時對 pandas.DataFrame 進行新增列操作的五種方法:insert、reindex、loc、obj[‘col’]、concat,並用代碼演示出來。 一、準備數據 引入需用的包,並新建DataFrame例

原创 Tableau 跟着固定成員移動的參考線

操作目的:創建一個參考線,在選擇了維度、指標、篩選器之後,參考線的值是維度下某固定成員的指標值,不是最大值、最小值、平均值、固定值等這些tableau上可見的值,而是隨着篩選器的變化,參考線也會變成篩選器選定值下某固定成員的值。

原创 PyQt5 創建數據處理小工具(pycharm+pyqt5+pyinstaller)

一、背景介紹 1.簡介 職業:數據分析師 需求背景:在業務的數據處理過程中,漸漸的形成了一些固定輸入報表類的工作,有一部分不需要進行再加工的就直接開發個報表工具了,有一部分是需要再次加工的,也就是這次我介紹的數據處理小工具。 需求

原创 python 3 類的普通方法、實例方法、靜態方法、類方法的區別

一、類和實例的調用情況 1.新建一個類,包含普通方法、實例方法、靜態方法、類方法 class TestMethod: def fun(): print('fun') def funS

原创 如何才能擁有自己的數據技術工匠?

在杭州,只要你是做數據的,阿里等互聯網公司絕對是繞不過去的,現在到處都可以看到它們的身影,大家都說杭州互聯網氛圍很好,人才好找,但實際競爭激烈,各種獵頭,各種社招,各種關係,無孔不入。 從事大數據工作以來,團隊成員的社會化流動逐漸成

原创 navicat 導入xlsx格式 報錯 “**無法打開文件錯誤**”

多次叢navicat 導入excel數據,主要是xlsx的格式多(因爲這個數據量的範圍很廣),但是經常報“無法打開文件錯誤”的問題,之前的解決方法是保存爲csv或xls格式,但是最近發現了問題並有瞭解決方法: 原因:缺少驅動,需要去微

原创 Anacond+pycharm+PyQt5 安裝及使用測試

整個安裝的過程參考:python3.6,Anaconda3下pyqt5開發環境搭建 但是在最後把ui轉化成py文件後,不是在文件中添加代碼,而是新建一段代碼 import sys import untitled from PyQt5.

原创 30分鐘迅速上手python

我從兩年前接觸python,到現在python已經陪伴我渡過了我的大半個職業生涯,用過Django開發個人博客,用過pandas、numpy做過數據分析,還用過scikit-learn的數據挖掘算法,還使用過spider寫爬蟲,但是種種

原创 如何纔能有效的進行大數據創新?

傳統企業在數字化轉型中,面臨的很大問題就是創新問題,大數據也不例外,最近讀到得到《何凡讀書俱樂部》中關於創新的系列文章,有了一些共鳴和啓發,這裏結合大數據的創新實踐分享一下自己的看法。 一、創新就是在行動中思考 首先講一個團隊建設的遊

原创 公司的數據分析支撐工作,到底外包好還是自主好?

很多企業的IT工作都存在外包現象,其中一個工種是比較特殊的,BI分析或大數據分析,按照性質又可分爲四種,功能型的支撐、事務性的支撐、倉庫模型支撐和數據挖掘的支撐,功能性的支撐就是建設一個BI系統或工具,事務性支撐泛指報表、取數、運維等例行

原创 Python機器學習算法實踐——決策樹(ID3)

一.決策樹模型 決策樹是一種通過對特徵屬性屬性分類對樣本進行分類的樹形結構,包括邊和三類節點 根節點:決策樹的起源,進行分類的第一個特徵屬性,只有出邊沒有入邊; 內部節點:正在進行分類的特徵屬性,有一條入邊,至少有一條出邊; 葉節點:分