原创 LeetCode算法刷題——python語法筆記

set() 函數創建一個無序不重複元素集,可進行關係測試,刪除重複數據,還可以計算交集、差集、並集等。 給定一個整數數組,判斷是否存在重複元素。如果任意一值在數組中出現至少兩次,函數返回 true 。如果數組中每個元素都不相同,

原创 LeetCode算法刷題——數組篇

(一). 雙指針(快慢指針) 1 .簡單篇 1.1 給定一個排序數組,你需要在 原地 刪除重複出現的元素,使得每個元素只出現一次,返回移除後數組的新長度。不要使用額外的數組空間,你必須在 原地 修改輸入數組 並在使用 O(1) 額

原创 ubuntu編譯hadoop-2.6.5源碼

1.編譯流程參考博客 https://blog.csdn.net/xingyyn78/article/details/81043263 2.問題解決參考博客 linux安裝maven         https://blog.csdn

原创 《雲計算》 劉鵬 第二版 第三版 PDF

《雲計算》 劉鵬 第二版 PDF版 主要爲了學習有關cloudsim那一章節 鏈接: https://pan.baidu.com/s/1r2lT24dnDNX_uuJfnGM-Tg 提取碼: hcik  另附:《雲計算》 劉鵬 第三版 

原创 CloudSIM 配置到eclipse(另加linux下安裝cloudSIM並運行)——linux環境下

1.cloudSIM配置到eclipse            一、Jdk,Eclipse的安裝與配置。           本人下載的jdk版本是1.8,jdk的相關配置           二、cloudsim的下載、安裝與配置。  

原创 基於用戶的協同過濾電影推薦

基於用戶的協同電影推薦代碼實現: # -*- coding: UTF-8 -*- ''' 基於用戶的推薦算法 ''' from math import sqrt,pow import csv import operator def re

原创 K-means聚類算法的三種改進(K-means++,ISODATA,Kernel K-means)介紹與對比

轉自:https://www.cnblogs.com/yixuan-xu/p/6272208.html   一、概述       在本篇文章中將對四種聚類算法(K-means,K-means++,ISODATA和Kernel K-m

原创 時間序列相關算法與分析步驟

首先,從時間的角度可以把一個序列基本分爲3類: 1.純隨機序列(白噪聲序列),這時候可以停止分析,因爲就像預測下一次硬幣哪一面朝上一樣毫無規律。 2.平穩非白噪聲序列,它們的均值和方差是常數,對於這類序列,有成熟的模型來擬合這

原创 六大常見聚類方法

1. K-Means(K均值)聚類 算法步驟: (1) 首先我們選擇一些類/組,並隨機初始化它們各自的中心點。中心點是與每個數據點向量長度相同的位置。這需要我們提前預知類的數量(即中心點的數量)。 (2) 計算每個數據點到

原创 聚類算法

一、聚類的目標 使同一類對象的相似度儘可能地大;不同類對象之間的相似度儘可能地小。 二、聚類算法分類 1.基於劃分 給定一個有N個元組或者紀錄的數據集,分裂法將構造K個分組,每一個分組就代表一個聚類,K<N。 特點:計算

原创 關係數據庫複習——小白筆記

關係表達式等價變換規則    

原创 大數據之路——阿里巴巴大數據實踐(小白筆記)

第一章 總述 1.阿里巴巴大數據系統體系架構分爲三大部分數據採集層、數據計算層、數據服務層 2.數據採集層     日誌採集系統:Aplus.JS是 web端日誌採集技術方案;UserTrack是APP端日誌採集方案      數據傳輸:

原创 Hadoop學習之HDFS——小白入門筆記

一、分佈式文件系統 1.分佈式文件系統解決問題:海量數據的高效存儲 2.分佈式文件系統是將文件分佈存儲到多個計算機節點上。(此處的計算機爲普通計算機) 3.分佈式文件系統的多個節點分爲兩類:     名稱節點(主節點):文件、目錄的操

原创 安卓 Plugin with id 'com.android.application' not found

新導入項目報錯:Plugin with id 'com.android.application' not found buildscript { repositories { jcenter() }

原创 hive 本地、hdfs數據導入

1.1導入內部表 (1)本地或者hdfs導入:         LOAD DATA[LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLEtablename [PARTITION(partcol1=