原创 美大VS阿里,本地生活的戰爭要結束了嗎?

                      — 1 —年初寫的那篇《新美大和阿里本地生活的競爭趨勢是如何的?》,後來被潘亂老師引用了下,給拉了不少關注度,現在回看難免還是逃不開視角的絕顯,如今判斷上還是有了些變化,在這裏做一些交代。標題

原创 數據百問系列:是一個寬表好還是多個維表好?

0x00 前言本篇的主題是關於數據模型的規範化和反規範化的討論,其實也是一種常見的維度建模的設計和業務使用便捷性的衝突。問題:在設計數據表的時候,是一個寬表好,還是多個維度表好?0x01 討論本話題的原始討論在github上,本文只選取

原创 數據運營系列(二):如何用合成控制法判斷策略實施效果

1. 合成控制法合成控制法最開始是經濟學家用來研究評估某個政策實施在某國家或地區的效果,原理即是反事實框架,假想該地區沒有受政策干預會怎樣,並與事實上受到干預的結果做對比。二者之差即爲“處理效應”。這裏D爲干預變量,X爲解釋變量,Y爲被

原创 數據運營系列(一):生存分析與用戶行爲如何聯繫起來

1. 生存分析生存分析主要用於醫學研究,比如醫療方案對病人壽命的影響。後面用來探究所感興趣的事件的發生的時間的統計方法。比如產品的壽命分析、工程中的失敗時間分析等等。這裏病人死亡、產品淘汰和工程失敗等稱爲事件event。生存分析中有兩個

原创 學 Python 必看書單彙總

學 Python 看什麼書?這是剛接觸 Python 的朋友最疑惑的問題。今天就結合自己入門時的學習歷程和大家來聊一聊如何入門 Python,爲了更有說服性一些,這裏我把入門時看過的一些大佬推薦的書單進行了彙總,最後給出我覺得不錯的書單

原创 【實踐案例分享】菜鳥實時數倉技術架構演進

分享嘉賓:賈元喬 菜鳥 高級數據技術專家編輯整理:夏飛飛內容來源:Flink Forward ASIA出品平臺:DataFunTalk導讀:在開源盛世的今天,實時數倉的建設已經有了較爲成熟的方案,技術選型上也都各有優劣。菜鳥作爲物流供應

原创 【實踐案例分享】OPPO 實時數倉揭祕:從頂層設計實現離線與實時的平滑遷移...

摘要:單日總數據處理量超 10 萬億,峯值大概超過每秒 3 億,OPPO 大數據平臺研發負責人張俊揭祕 OPPO 基於 Apache Flink 構建實時數倉的實踐,內容分爲以下四個方面:建設背景頂層設計落地實踐未來展望重要:公衆號後臺

原创 數據產品到底是幹什麼的?

在上篇文章“你的團隊可能缺了一個數據產品經理!”後,有讀者問:"數據產品是什麼?數據經理是幹嘛的?和業務產品經理的差別是什麼?"所以這篇文章將就這個話題展開,內容分3部分:1.什麼是數據產品?2.數據產品和其他產品的差別是什麼?3.數據

原创 【收藏】它絕對是最適合自學的Python教材!

《Python Data Science Handbook》是一本非常值得推薦和學習的Python教材,深受很多初學者和大佬的喜愛,並且獲得豆瓣9.3分的好成績。該書原作者是美國華盛頓大學的教授Jake VanderPlas,他是Pyt

原创 實戰中,需求優先級怎麼定

走過路過不要錯過點擊藍字關注我們時光荏苒,轉眼間來滴滴已經10個月了。十個月裏也是受益匪淺。除了完成了19年入職之初迫切渴望的實打實做出來一些“數據驅動業務增長”的事情,還承蒙老闆和對接需求方的厚愛,拿了“數據驅動獎”。但生活是最好的老

原创 新美大和阿里本地生活的競爭趨勢是如何的?

上半年的時候,跟兩位BA大廠VP級的老大哥聊起本地生活的業務,趕上最近阿里本地生活開了「商業操作系統」的發佈會,正好規整下當時的一些判斷,記錄下來,當然我們說的也不一定對。本地生活這場仗阿里是輸不起的之前阿里集團明面上對本地生活的定位和

原创 淺談實時數據開發

淺談實時數據開發(一)技術路線圖(二)典型應用場景電商平臺大促期間成交金額;廣告主實時報表(分鐘級更新);實時反作弊;業務場景異常監控。(三)流式技術架構目前流式計算框架相對成熟,以Storm、Spark Streaming爲代表的開源

原创 學習統計學必須掌握的幾個核心概念

作者介紹@大師兄混跡數據江湖十餘載。主要負責大數據商業變現和產品運營工作。“在終極的分析中,一切知識都是歷史;在抽象的意義下,一切科學都是數學;在理性的基礎上,所有的判斷都是統計學。” —C.R.勞 《統計與真理——怎樣運用偶然性》本科

原创 認知環境,環境對產品的影響無孔不入

本文由菩提創作,本文僅菩提個人觀點。一. 開  篇朋友問:“在互聯網公司這麼久,怎麼撐下來的?”Hmm,糟心事真不少。成年人的世界,沒有人輕輕鬆鬆。菩提那老夫聊發少年狂的豪情壯志,時常被裏三層外三層的銅牆鐵壁,包裹的呼吸不到外面的新鮮空

原创 數據百問系列:數倉團隊如何在繁重的需求中體現自己的價值?

數據百問系列:數倉團隊如何在繁重的需求中體現自己的價值?0x00 前言本話題來自於羣友羅麗葉在數據中臺羣中的提問:如何讓數倉團隊在繁重業務數據需求的情況下,依舊能熟悉業務和數據,進而爲業務提供更大的價值?經過整理髮布在知識星球后,有不少