原创 數據百問系列:如何衡量一張或者多張數據表的價值?

0x00 前言本期話題討論:如何衡量一張或者多張數據表的價值?如上,是居士最近看到小夥伴們討論的一個問題,一些朋友也問過類似問題,因此發出來給大家來討論,本文是將大家的討論彙總成文,同時在末尾加上居士自己的理解。0x01 討論觀點分享討

原创 有編程基礎,數學薄弱?一份機器學習手冊送給你!

本系列是一份面向程序員以及有一定coding能力在校學生的機器學習入門指南。分爲:《特徵工程系列》(12篇)和《餅乾機器學習筆記》(40篇)兩部分:特徵工程篇包括:算法教程篇包括:掃碼關注公衆號 數據科學家聯盟後臺回覆 機器學習手冊 六

原创 如何用運營思維找到自己的另一半

互聯網商業其實就是三個核心詞:產品、流量、轉化率。也就是產品的比拼、流量的爭奪、轉化率的優化。這就是互聯網商業競爭的全部。梁寧 《產品思維30講》作爲一枚鵝廠的廣告運營,我在工作中的講的最多的故事就是:品牌要如何跟消費者談戀愛。作爲一個

原创 漫談數據安全

|0x00 數據安全體系全貌|0x01 一般意義上的數據安全流程數據安全流程包括以下幾個步驟:數據的產生:通過數據分級體系對敏感字段打標籤;數據的存儲:需要通過加密的方式存儲相關數據,避免直接存儲Text格式的數據;數據的使用:包括了一

原创 數據百問系列:什麼是 ETL ?ETL 的常見技術方案是什麼?

0x00 前言三年前寫過一篇ETL的文章,最近又被小夥伴問到了,因此略作整理放進數據百問系列。雖然已經過去兩三年了,ETL 領域的一些組件也都有了一些更新,但是整體來看設計的理念變化不是特別大(比如實時處理以前流行的是Spark Str

原创 業務分析師發展路線以及工作內容思考

作者簡介:火焰鼠,教育行業數據分析師,從業三年,目前就職於深圳某在線教育公司業務分析崗位目錄:0x00 前言0x01 工作內容0x02 工作內容優勢0x03 工作內容劣勢0x04 核心能力0x05 發展路線0x00 前言 大家好,我是一

原创 原創 | 深度學習60講453頁pdf下載

關注公衆號後臺回覆 深度學習 即可下載深度學習60講作者簡介機器學習實驗室的號主作爲一名統計專業的碩士畢業生,一路從數據分析師進階到深度學習算法工程師。現於杭州一家AI初創公司擔任深度學習算法工程師,主要研究方向爲計算機視覺。號主在數據

原创 收藏 | 大數據在阿里、滴滴、快手等公司的最佳實踐!PDF限時下載

大數據在阿里、百度、滴滴、快手等公司的最佳實踐?Hadoop的核心競爭力?Spark or Flink?離線平臺與實時計算平臺如何設計?今天,2020 DataFunTalk 精選:《大數據在業界的應用實踐合集》PDF 版限時7天上線啦

原创 你所做的產品,並不是數據產品

你所做的產品,並不是數據產品|0x00 你真的理解數據的價值嗎?前一階段,木東居士分享了一個案例,個人認爲很有代表性,這裏簡略敘述一下,作爲問題的起點:一位朋友從運營晉升爲管理層,開始帶團隊,因爲朋友本身是運營出身的,所以對於業務的訴求

原创 從寶潔到騰訊:我的職場轉型四部曲

距離2013年在寶潔實習的那個夏天,到今年,我的職場生涯都快七年了。如果說這七年裏,唯一不變的是什麼,那就是 “擁抱變化”。我的工作經歷其實很簡單,在寶潔我做消費品的生意,在騰訊我做流量的生意。轉行,這一大跨步,還好沒有劈叉。但要說起我

原创 【好書推薦:第四期】好友的第二本書:《對比Excel,輕鬆學SQL數據分析》

如果讓居士推薦一項數據分析最需要掌握的技能是什麼,那居士一定推薦SQL,這一點在《數據團隊思考:數據人的通用技能要求》一文中也給大家分享過。但是,很多寫SQL的書並不是從數據分析的角度去講SQL的,這就導致了即使了你買了一本SQL書回家

原创 數據百問系列:學習數據倉庫該看什麼書?

0x00 前言關於數據倉庫書的問題被太多小夥伴問到了,因此,即使本文已經發過好幾次了,依舊要在數據百問系列中再次發一遍。已經看過本文的小夥伴可以不用再看了。在我們十多個數據交流羣中,大家經常會問有什麼數據相關的書可以推薦,因此居士建立了

原创 原創的《Python之路實戰40篇》PDF高清版,限時下載!

內容簡介1《Python之路40篇實戰 .pdf》包含Python篇、數據分析篇、機器學習篇等 3 大模塊,目錄如下:下載方式2關注公衆號「Python與算法社區」,後臺回覆一個數字「1」, 即可下載最新版的《Python之路40篇 .

原创 【收藏】SQL經典面試50題 | 附答案

今天給大家分享一份星友對SQL經典面試50題的刷題記錄,稍作了一些修改,以下是星友自述正文:看完了SQL基礎教程,然後再看SQL進階教程感覺有些不是很懂,於是就開始刷題熟悉⼀下基礎知 識,找了⽐較經典的很多⼈都刷過的SQL⾯試50題,B

原创 數據運營系列(三):熵權法如何確定指標權重構建評價體系

1. 熵權法信息論基本原理解釋信息是系統有序性的度量單位,而熵可以度量系統的無序程度;如果某個指標的信息熵越小,該指標提供的信息量越大,指標變異程度(方差)高,因此在綜合評價中所起作用理當越大,權重就應該越高。熵權法的基本原理就是根據指