原创 利用python進行數據分析-pandas入門

1.pandas的數據結構介紹 a.Series Series是一種類似於一維數組的對象,它由一組數據以及一組與之相關的數據標籤(即索引)組成。 obj=Series([4,7,-5,3]) print obj 結果爲: 0    4 1

原创 利用python進行數據分析-數據加載、存儲與文件格式2

1.將數據寫出到文本格式 data1=pd.read_csv('data/ex5.csv') data1.to_csv('data/out.csv') 當然,還可以使用其他分隔符 data1.to_csv('data/sys.stdout

原创 利用python進行數據分析-NumPy基礎2

1.利用數組進行數據處理 import numpy as np import matplotlib.pyplot as plt points=np.arange(-5,5,0.01) xs,ys=np.meshgrid(points,po

原创 利用python進行數據分析-pandas入門2

1.索引對象 pandas的索引對象負責管理軸標籤和其它元數據。構建Series或DataFrame時,所用到的任何數組或其它序列的標籤都會被轉換成一個Index obj=Series(range(3),index=['a','b','c

原创 瞭解用戶系列|快速劃分用戶羣

互聯網音樂產品中有哪幾類用戶? 這應該是音樂App的產品經理第一個要考慮的問題。用戶羣細分是最常見的用戶研究手段。一下子去理解所有用戶是很難的,但是分而治之,則會容易很多。這同時也是市場營銷課程的基礎,去理解細分市場是每個營銷人員的必備技

原创 利用python進行數據分析-數據聚合與分組運算1

分組鍵可以有多種形式,且類型不必相同 a.列表或數組,且長度與待分組的軸一樣 b.表示DataFrame某個列的值 c.字典或Series,給出待分組軸上的值與分組名之間的對應關係 d.函數,用於處理軸索引或索引中的各個標籤 df=D

原创 MySQL學習筆記一

整型 浮點型 日期時間類型 字符型 char是定長,varchar是可變的 select database():顯示正在使用的數據庫 創建數據表: create table [if not exists] table_na

原创 產品經理需要了解的宏觀趨勢(共享經濟專題)1/7

題外話: 產品經理除了應該有的產品技能外,需不需要了解一些宏觀經濟呢?當然需要呀!!!尤其是揹負着公司業績KPI的產品總監們,有沒有感同身受啊啊啊…本文是15年底的時候,本人在工作中的梳理,本來是自己學習再加上團隊分享用的,現在決定分享給

原创 Django的安裝

前提: 1.下載django安裝包,從 https://www.djangoproject.com/ 下載django安裝包。 2.python的安裝路徑爲F:\Anaconda 安裝過程: 1.解壓django包到F:\Anacon

原创 利用python進行數據分析-繪圖和可視化2

1.pandas中的繪圖函數 a.線形圖 Series和DataFrame都有一個用於生成各類圖表的plot方法。默認情況下,她們所生成的是線形圖 s=Series(np.random.randn(10),index=np.arange(

原创 利用python進行數據分析-數據規整化2

1.合併重疊數據 你可能有索引全部或部分重疊的兩個數據集。我們使用NumPy的where函數,它用於表達一種矢量化的if-else a=Series([np.nan,2.5,np.nan,3.5,4.5,np.nan],index=['f

原创 瞭解用戶系列|用戶研究的舊瓶裝新酒

當大家在舉辦五一勞動節暨朋友圈攝影大賽的時候,我在這裏碼字。希望大家在玩的爽、吃的爽、啪的爽的同時,也能從這篇巨長的文字中有些收穫。最重要的是,轉發它,能幫你在攝影大賽中脫穎而出,逼格滿分。 傳統的用戶研究方法現在如何運用? 互聯網的用戶

原创 利用python進行數據分析-pandas入門3

1.函數應用和映射 NumPy的ufuncs(元素級數組方法)也可用於操作pandas對象 frame=DataFrame(np.random.randn(4,3),columns=list('bde'),index=['Uath','O

原创 利用python進行數據分析-NumPy基礎

NumPy的ndarray:一種多維數組對象 1.創建ndarray data1=[6,7.5,8,0,1] arr1=np.array(data1) print arr1 結果爲: [ 6.   7.5  8.   0.   1. ]

原创 python的一些函數

numpy函數 1)linspace創建等差數組 它最常用的有三個參數,第一個參數表示起始點,第二個參數表示終止點,第三個參數表示數列的個數,如 a=linspace(1,10,10) print a 結果是:array([1.,2.,