原创 LeetCode算法刷題——python語法筆記
set() 函數創建一個無序不重複元素集,可進行關係測試,刪除重複數據,還可以計算交集、差集、並集等。 給定一個整數數組,判斷是否存在重複元素。如果任意一值在數組中出現至少兩次,函數返回 true 。如果數組中每個元素都不相同,
原创 LeetCode算法刷題——數組篇
(一). 雙指針(快慢指針) 1 .簡單篇 1.1 給定一個排序數組,你需要在 原地 刪除重複出現的元素,使得每個元素只出現一次,返回移除後數組的新長度。不要使用額外的數組空間,你必須在 原地 修改輸入數組 並在使用 O(1) 額
原创 ubuntu編譯hadoop-2.6.5源碼
1.編譯流程參考博客 https://blog.csdn.net/xingyyn78/article/details/81043263 2.問題解決參考博客 linux安裝maven https://blog.csdn
原创 《雲計算》 劉鵬 第二版 第三版 PDF
《雲計算》 劉鵬 第二版 PDF版 主要爲了學習有關cloudsim那一章節 鏈接: https://pan.baidu.com/s/1r2lT24dnDNX_uuJfnGM-Tg 提取碼: hcik 另附:《雲計算》 劉鵬 第三版
原创 CloudSIM 配置到eclipse(另加linux下安裝cloudSIM並運行)——linux環境下
1.cloudSIM配置到eclipse 一、Jdk,Eclipse的安裝與配置。 本人下載的jdk版本是1.8,jdk的相關配置 二、cloudsim的下載、安裝與配置。
原创 基於用戶的協同過濾電影推薦
基於用戶的協同電影推薦代碼實現: # -*- coding: UTF-8 -*- ''' 基於用戶的推薦算法 ''' from math import sqrt,pow import csv import operator def re
原创 K-means聚類算法的三種改進(K-means++,ISODATA,Kernel K-means)介紹與對比
轉自:https://www.cnblogs.com/yixuan-xu/p/6272208.html 一、概述 在本篇文章中將對四種聚類算法(K-means,K-means++,ISODATA和Kernel K-m
原创 時間序列相關算法與分析步驟
首先,從時間的角度可以把一個序列基本分爲3類: 1.純隨機序列(白噪聲序列),這時候可以停止分析,因爲就像預測下一次硬幣哪一面朝上一樣毫無規律。 2.平穩非白噪聲序列,它們的均值和方差是常數,對於這類序列,有成熟的模型來擬合這
原创 六大常見聚類方法
1. K-Means(K均值)聚類 算法步驟: (1) 首先我們選擇一些類/組,並隨機初始化它們各自的中心點。中心點是與每個數據點向量長度相同的位置。這需要我們提前預知類的數量(即中心點的數量)。 (2) 計算每個數據點到
原创 聚類算法
一、聚類的目標 使同一類對象的相似度儘可能地大;不同類對象之間的相似度儘可能地小。 二、聚類算法分類 1.基於劃分 給定一個有N個元組或者紀錄的數據集,分裂法將構造K個分組,每一個分組就代表一個聚類,K<N。 特點:計算
原创 關係數據庫複習——小白筆記
關係表達式等價變換規則
原创 大數據之路——阿里巴巴大數據實踐(小白筆記)
第一章 總述 1.阿里巴巴大數據系統體系架構分爲三大部分數據採集層、數據計算層、數據服務層 2.數據採集層 日誌採集系統:Aplus.JS是 web端日誌採集技術方案;UserTrack是APP端日誌採集方案 數據傳輸:
原创 Hadoop學習之HDFS——小白入門筆記
一、分佈式文件系統 1.分佈式文件系統解決問題:海量數據的高效存儲 2.分佈式文件系統是將文件分佈存儲到多個計算機節點上。(此處的計算機爲普通計算機) 3.分佈式文件系統的多個節點分爲兩類: 名稱節點(主節點):文件、目錄的操
原创 安卓 Plugin with id 'com.android.application' not found
新導入項目報錯:Plugin with id 'com.android.application' not found buildscript { repositories { jcenter() }
原创 hive 本地、hdfs數據導入
1.1導入內部表 (1)本地或者hdfs導入: LOAD DATA[LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLEtablename [PARTITION(partcol1=