原创 LeetCode------整數拆分

Java版一: package tencent; /** * 給定一個正整數 n,將其拆分爲至少兩個正整數的和,並使這些整數的乘積最大化。 返回你可以獲得的最大乘積。 * * 示例 1: * * 輸入: 2 輸出: 1

原创 LeetCode------尋找兩個有序數組的中位數

Java版一: package tencent; /** * 給定兩個大小爲 m 和 n 的有序數組 nums1 和 nums2。 * * 請你找出這兩個有序數組的中位數,並且要求算法的時間複雜度爲 O(log(m + n))

原创 Course_clustering_model

|字段|含義|類型| |:–?:–? |interested_travel |旅行偏好|二分類| |computer_owner |是否有家用電腦|二分類| |age |估計的年齡|連續| |home_value |房產價格|連續

原创 chapter11(sklearn)

第十一 講 使用神經網絡進行客戶流失預警 from sklearn.neural_network import MLPClassifier %matplotlib inline import os import numpy as

原创 第二階段:分佈式理論簡介:2.3 一致性、2PC和3PC

1 一致性 1.1 簡述 一致性,是指對每個節點一個數據的更新,整個集羣都知道更新,並且是一致的 假設一個具有N個節點的分佈式系統,當其滿足以下條件時,我們說這個系統滿足一致性: 全認同: 所有N個節點都認同一個結果 值合法: 該結果必須

原创 第二階段:分佈式理論簡介:2.2數據分佈方式

1、數據分佈方式 1)哈希方式:按照數據的某一特徵計算哈希值,並將哈希值與機器中的機器建立映射關係,從而將不同哈希值的數據分佈到不同的機器上。特徵就是key-value中的key,也可以是其他與應用業務邏輯相關的值。   2)按數據範圍

原创 數據分析思維五大誤區

很多同學在問:數據分析有沒有標準思路,有沒有分析思維模式。答案當然是:有。但絕不是大家日常在公衆號看到的各種炫酷名字。什麼SOWT,PEST,二八法、切割法、多維法、業務法……這些名字炫酷有餘,可解決真實商業問題的時候沒一個靠譜的。今天我

原创 第二階段:分佈式理論簡介:2.4 大數據集成架構概述

一、大數據的發展史 2004年 Google前後發表三篇論文,也就是傳說中的“三駕馬車” 分頁式文件系統GFS 大數據分佈式計算框架MapReduce NoSQL數據庫系統BigTable 2006年 Doug Cutting啓動了一個赫

原创 第二階段:分佈式理論簡介:2.1 CAP理論介紹

CAP原則 CAP原則又稱CAP定理,指的是在分佈式系統的設計中,沒有一種設計可以同時滿足 Consistency(一致性)、 Availability(可用性)、Partition tolerance(分區容錯性)3個特性,這三者不可得

原创 第三階段:數據存儲與計算(離線場景):3.3 數據存儲alluxio(1T)

Alluxio概覽 什麼是 Alluxio 優勢 技術創新 快速上手指南 下載和有用資源 什麼是 Alluxio Alluxio 是世界上第一個面向基於雲的數據分析和人工智能的開源的數據編排技術。 它爲數據驅動型應用和存儲系統構建了橋樑,

原创 第三階段:數據存儲與計算(離線場景):3.2 數據存儲hdfs

雲計算 雲計算的看法,是忽悠?還是能帶來真實價值的東西? 雲計算是對現有資源集中優化後,對客戶提供服務,從現在的情況來看雲計算真實的爲大家提供了服務,比如:網盤等。至於雲計算更爲準確的定義爲美國國家標準與技術研究院(NIST)定義:雲計算

原创 python半小時快速上手

機器學習算法day01_python快速上手 課程大綱 Python快速上手 Python簡介 Python集成開發環境 Python基本語法 Python的變量和集合 Python流程控制語法 Python函數

原创 什麼是SVM

一、什麼是SVM SVM主要針對小樣本數據進行學習、分類和預測(有時也叫回歸)的一種方法,有很好的泛化能力 二、SVM原理 舉個例子: 好吧,故事是這樣子的: 在很久以前的情人節,大俠要去救他的愛人,但魔鬼和他玩了一個遊戲。 魔鬼在桌子上

原创 第三階段:數據存儲與計算(離線場景):3.4 數據採集flume

概要 Apache Flume 是一個分佈式,可靠且可用的系統,用於有效地從許多不同的源收集、聚合和移動大量日誌數據到一個集中式的數據存儲區。   Flume 的使用不只限於日誌數據。因爲數據源可以定製,flume 可以被用來傳輸大量事

原创 微表情識別

表情識別 2019.12更新了倉庫依賴。 簡介 使用卷積神經網絡構建整個系統,在嘗試了Gabor、LBP等傳統人臉特徵提取方式基礎上,深度模型效果顯著。在FER2013、JAFFE和CK+三個表情識別數據集上進行模型評估。 環境部署