原创 docker:nodejs :git:EC2:ubuntu

How to Set Up a Node.js Web Server on Amazon EC2 【under ubuntu of EC2】 ssh-keygen -C "**@**.com" ssh -T git@github

原创 docker 構建網站初探

1: 查看已有鏡像 docker images 2: 運行已有鏡像【這裏必須是 雙斜線】 docker run --rm -ti ubuntu //bin/bash 開啓新的一個docker terminal, ipconfig //

原创 docker:nodejs :git:EC2:ubuntu <網站發佈!>

How to Set Up a Node.js Web Server on Amazon EC2 【under ubuntu of EC2】 ssh-keygen -C "**@**.com" ssh -T [email protected]

原创 Docker on Windows--Installation Problems

【1】 Failed to start machine boot2docker-vm exit status:1 a) Enabled VT-x in your BIOS b) Replace uxtheme.dll under wi

原创 SVM基礎及java源碼實現

當權重向量是單位向量時,幾何間隔就是函數間隔! 最速下降法/steepest descent,牛頓法/newton,共軛方向法/conjugate direction,共軛梯度法/conjugate gradient 及其他 【1】最速

原创 架構基礎

代理服務器是介於客戶端和Web服務器之間的另一臺服務器; 代理服務器對外就表現爲一個反向代理服務器; 當客戶機向站點提出請求時,請求將轉到代理服務器。 然後,代理服務器通過防火牆中的特定通路,將客戶機的請求發送到內容服務器。 內容

原创 Spark Streaming 再學習

Hadoop的批處理系統是這樣的:Apache Flume基於最優的HDFS塊大小(64MB)將文件寫入到每小時的桶中每天定時執行MapReduce (Scalding) 任務N次Apache Sqoop

原创 hadoop/Spark Locality

以Spark爲例,我們調用hadoopRDD = sc.textFile(path)告訴Spark開始讀取path中的數據。這個path可能是一個本地文件路徑,更常見的是HDFS路徑。 爲了分佈式 處理的要求,hadoopRDD通常情況

原创 SVM 要點回顧

KKT條件描述:

原创 基礎知識 -- (編程語言)

1.同步與異步 同步和異步關注的是消息通信機制 (synchronous communication/ asynchronouscommunication); 同步需要等待返回結果才能繼續, 異步不必等待,一般需要監聽異步的結果 所

原创 讀 【99%的海量數據處理面試題】 個人理解與歸納

處理海量數據六大方法【原文】: 分而治之/hash映射 + hash統計 + 堆/快速/歸併排序;雙層桶劃分Bloom filter/Bitmap;Trie樹/數據庫/倒排索引;外排序;分佈式處理之Hadoop/Mapreduce 【0

原创 Scala 學習雜記

Java 中 靜態成員是對應類的,所以既可以通過對象名,也可以通過類名訪問,但不能訪問非靜態方法或變量;位於“數據區”,無論多少個對象該變量在內存中都只有一份; Java中非靜態成員是對應對象的,每個對象都會有一個,所以只能通過對象名引用

原创 Javascript 學習

Javascript的面向對象是基於JSON的,而Java是直接使用內存結構

原创 HBase 批量導入測試

導入方法1. 採用mapreduce, 在mapper裏按行產生Put, 然後用HTable.put, 不用reducer. 測試性能不忍直視, 直接排除。 導入方法2. 採用mapreduce, 先生成HFile, 再用LoadInc

原创 分佈式 文件管理系統

基礎知識篇: 文件儲存在硬盤上,硬盤的最小存儲單位叫做"扇區"(Sector)。每個扇區儲存512字節(相當於0.5KB), 操作系統讀取硬盤的時候,是一次性讀取一個"塊"(block)。這種由多個扇區組成的"塊",是文件存取的最小單位。