原创 python離散因變量模型

Binary Probit模型 連接函數爲正態 from statsmodels.formula.api import glm formula='Attention~CSI+Company+Loyalty' product_m=glm(

原创 三值邏輯和null

如果not in子查詢用到的表裏被選擇的列中存在null,sql查詢結果永遠爲空     

原创 python方差分析

目錄 ​ 一元方差分析 一元單因素方差分析  一元多因素方差分析 協方差分析    一元方差分析 一元單因素方差分析 場景:5種不同像素的數碼相機(單因素)對銷量(研究的因變量)是否有顯著差異 G = dc_sales['pixel'

原创 numpy方法彙總(切片,組合等)

一、numpy索引 1.1 布爾索引 row_index = (M[:,0] >= 20) & (M[:,0] <= 80) col_index = M[0,:] >= 5 M[row_index,:][:,col_index] 注意:

原创 計算新訪uv次日留存率

select first_date ,count(distinct case when by_day=0 then yxuserid else null end) as day_0 ,count(distinct case whe

原创 python假設檢驗

單樣本均值Z檢驗 適合條件:1.總體方差已知,小樣本/大樣本;2.總體方差未知,大樣本(n>=30) # ho:u<=4,所以value=4,alternative[備擇假設]='lager' sm.stats.DescrStatsW(

原创 categories與set_categories

import pandas as pd import numpy as np df = pd.DataFrame({"id":[1,2,3,4,5,6], "raw_grade":['a', 'b', 'b', 'a', 'a', '

原创 三、內容頁設計

插入-smartart-左側有個左右指的圖標-點中-自動更改文字&回車增加行;點中整個smartart圖形-設置字體顏色;點中某部分矩形-格式-形狀填充(ctrl+Y、F4重複上一次操作) 擋住圖片上的文字:裁剪和該圖片一樣的北京,蓋住

原创 costco

定位:中產階段家庭 :無憂購物無理由退貨+超值的價格+滿足需求且超少的SKU 本田有三個喜歡:讓造車的人喜歡,讓賣車的人喜歡,讓用車的人喜歡 供應鏈穩定的採購+員工的高薪水()+付費會員的蜂擁而至 缺點:大包裝不符合國情;羊毛黨;被電商慣

原创 sql--來自各路面筋

1.pdd CREATE TABLE pdd( u_id VARCHAR(20) NOT NULL, ip INT NOT NULL, timestamp datetime

原创 task5

作業 任務一 1.1統計彙總每個城市大專、本科、碩士、博士的招聘人數,對學歷沒有要求的招聘不計算在內,效果圖如下:  插入——數據透視表——ctrl+A 全選 將字段city拖入行 education拖入列 值拖入education 在列

原创 task3

1.先條件篩選*數據分析*,之後countif計數  2.統計求職者學歷要求情況 3.統計求職者工作經驗要求(同上) 4.各種職位需求(同上 5.不同城市不同行業對數據分析的需求【還不知道怎麼做,待百度】 後面待補充  

原创 task2

任務一 1.1將列salary最低工資提取出來,假如單元格爲“10k以上”、“8k以下”等,最低工資直接爲10和8,效果如下: 答案:=LEFT(P2,FIND("k",P2)-1) 但是不全面,因爲有的K大寫 LEFT(P2,IFER

原创 連續時間問題-sql

問題:con_table(user_id,ttime)  ttime爲用戶登陸時間,現在需要找出來連續登陸時間天數超過3天的用戶 create table con_table ( user_id int not null, ttime

原创 task1

生成一個行高30,列寬15(第六列列寬45),名爲“Excel組隊學習”的表,要求如下: 1、第一列爲職位ID,背景色爲淺藍; 2、第二列爲職位類型,字體顏色爲紅色; 3、第三列爲學歷,每個單元格有下拉列表,選項爲大專、本科、碩士、博士;