原创 一個Python計算時間的腳本(某月第一天最後一天/上週第一天最後一天等)

因爲之前的自動化的工作中幾乎每個腳本都要在時間節點運行,比如每週的第一天,每月第一天和最後一天等等。這就要涉及到時間的計算,但是沒有現成的包,只能自己寫一個(╯‵□′)╯︵┻━┻。 用例 這個腳本里包含了一般自動化報表會用到的時間

原创 Pyhton科學計算工具Numpy(一) 之數組

科學計算工具Numpy(一) 之數組 一個用python實現的科學計算包。包括:  1.一個強大的N維數組對象Array;   2、比較成熟的(廣播)函數庫;  3、用於整合C/C++和Fortran代碼的

原创 Pyhton科學計算工具Numpy(二)之數組索引切片,numpy隨機數及文件生成讀取

科學計算工具Numpy(二)之數組索引切片,numpy隨機數及文件生成讀取 一個用python實現的科學計算包。包括:  1.一個強大的N維數組對象Array;   2、比較成熟的(廣播)函數庫;  3、用

原创 廣告效果聚類分析(KMeans)

前段時間做了一個項目,該客戶是來自教育行業,其主要的宣傳獲客手段就是在各個渠道投放廣告,用廣告將用戶引流至網站。 但是廣告的渠道非常多,哪些渠道效果很好,哪些效果不好。需要對廣告效果分析針對性做廣告效果測量和優化工作。我就想到之前學到

原创 R語言中的抽樣方法與描述統計函數

抽樣方法 常見的抽樣方法 簡單隨機抽樣 分層抽樣 系統抽樣 # 導入數據 # 1 金融 2 建築 3 外語 data <- read.csv("E:\\Github\\code-learning\\R\\data\\第11期

原创 python數據可視化seaborn(四)—— 分類數據可視化

之前的文章關注的是兩個變量都是數值變量的情況,當有一個變量是分類變量的時候,我們就需要其他類型的圖形來展示分析數據。在seaborn中有多種類型的圖形且非常易於上手。 import numpy as np import pandas

原创 python數據可視化seaborn(三)——探索變量之間的關係

python數據可視化seaborn(三)——探索變量之間的關係 我們常常想知道變量之間是否存在關聯,以及這些關聯是否收到其他變量影響。可視化能夠幫助我們非常直觀的展示這些。 import numpy as np import pan

原创 一個計算時間的腳本(上週/月第一天,最後一天等)

因爲之前的自動化的工作中幾乎每個腳本都要在時間節點運行,比如每週的第一天,每月第一天和最後一天等等。這就要涉及到時間的計算,但是沒有現成的包,只能自己寫一個(╯‵□′)╯︵┻━┻。 用例 這個腳本里包含了一般自動化報表會用到的時間節

原创 python數據可視化seaborn(二)—— 分佈數據可視化

這篇文章是Python可視化seaborn系列的第二篇文章,本文將詳解seaborn如何探索數據的分佈。 import numpy as np import pandas as pd import matplotlib.pyplot

原创 python數據可視化seaborn(一)—— 整體樣式與調色板

很久之前對seaborn有過一些涉及但是沒有深入探究,這次有趁着有數據可視化的需求,就好好學一學 Seaborn其實是在matplotlib的基礎上進行了更高級的API封裝,從而使得作圖更加容易,在大多數情況下使用seaborn就能做

原创 python判斷孿生質數對(素數對)並計算個數。

很久前在知乎寫的一個答案,今天把坑填了,順便搬過來。 讓我們定義dn爲:dn=pn+1−pn,其中pi是第i個素數。顯然有d1=1,且對於n>1有dn是偶>>數。 “素數對猜想”認爲“存在無窮多對相鄰且差爲2的素數”。 現給定任意正

原创 Python利用openpyxl來操作Excel(一)

最近一直在做項目裏的自動化的工作,爲了是從繁瑣重複的勞動中掙脫出來,把精力用在數據分析上。自動化方面python是在好不過了,不過既然要提交報表, 就不免要美觀什麼的。pandas雖然很強大,但是無法對Excel完全操作,現學vba有

原创 統計分析——描述統計之數據水平描述

一組樣本數據的數值特徵一般來說可以從三個方面來描述: 數據的水平(也可以稱之爲集中趨勢或位置度量),反映數據的數值大小 數據的差異,反映數據間的離散程度 數據的分佈形狀,反映數據分佈的偏度和峯度 描述水平的統計量 數據

原创 R可視化之圖形控制和佈局基礎

R語言的圖形參數主要由par()函數控制,圖形佈局主要由layout()函數控制 圖形參數 我們以如下數據爲例 劑量(dose) 對藥物A的響應(drugA) 對藥物B的響應(drugB) 20 16 15 30 2

原创 R語言的數據結構

R共有6種儲存數據的對象類型 向量 列表 數組 數據框 矩陣 因子 向量(Vectors) 向量是用於存儲數值型、字符型或邏輯型數據的一維數組。執行組合功能的函數c()可用來創建向量。 # 創建一個向量 apple <- c('