台部落shell33168

lc 210 把課程關係轉成有向圖，對圖進行深度優先遍歷，checked標記已經訪問過的節點，order保存訪問順序也用到了回溯算法： class Solution: # checked 數組保存已經保存過的節點， vis

2020-05-18 22:47:12

usedlist保存訪問的順序， capacity保存lru的容量，mapping保存映射的數組 class LRUCache: def __init__(self, capacity: int): self.

2020-05-18 22:47:12

leet560 求和等於 K 的子數組數量（1）暴力解法（2）前綴和 sum(i~j) = s(j) - s(i-1) = k s(j) - k = s(i-1) 保存三個狀態： sum,sum-k,cnt def subarr

2020-05-16 12:40:13

1. maven的安裝：改阿里雲的鏡像倉庫 maven in 5 minutes：http://maven.apache.org/guides/getting-started/maven-in-five-minutes.html mav

2019-10-27 15:08:45

Spring 全家桶 Spring framework Spring Boot Spring Cloud Spring Cloud Data Flow Spring framework Spring Core:Ioc(面向對象), Aop

2019-10-27 15:08:45

1. http：https://developer.mozilla.org/zh-CN/docs/Web/HTTP/Overview 2. 三層架構：表現層，業務層，數據訪問層 3. MVC： Model(模型層),View（視圖層）,

2019-10-27 15:08:45

WordCount 遇到shuffle的算子，就會拆stage

2019-06-10 16:07:23

窄依賴：一個父RDD的partition的RDD只能被子RDD的partition最多使用一次寬依賴：一個父RDD的partition的RDD會被子RDD的partition使用多次 coalesce vs repartition

2019-05-13 23:26:39

spark運行架構要背下來 http://spark.apache.org/docs/latest/cluster-overview.html Spark Application： 1個driver + 多個executors A

2019-05-06 20:55:43

爲什麼需要SQL？ SQL用於數據統計分析，關係型數據庫存儲的數量有限制。雲化：關係型數據庫 =》 Hadoop UDF支持原有關係型數據庫內置的函數簡單易用，無門檻轉行支持sql的大數據框架: Hive: MapRedu

2019-05-04 20:58:04

需要添加的依賴 <repositories> <repository> <id>cloudera</id> <name>cloudera</name>

2019-05-03 19:41:35

1. MapReduce的侷限性 1）繁雜本身只有map/reduce算子（沒有reduce的情況：mapjoin裏只有map，沒有reduce）開發層面： low-level(低層次的) ; constrained(限制多

2019-05-01 01:05:49

編譯步驟安裝JDK 安裝maven （需要修改maven默認存儲位置）安裝scala 定位到spark源碼 mvn -Pyarn -Phadoop-2.6 -Dhadoop.version=2.6.0-cdh5.7.0 -Phi

2019-05-01 01:05:49

RDD 讓開發者大大降低開發分佈式應用程序的門檻，提高執行效率。 RDD源碼：https://github.com/apache/spark/tree/master/core/src/main/scala/org/apache/spa

2019-05-01 01:05:49

自我介紹 20-30s，先準備好大數據架構，如何做到精準一次，小文件規避（hadoop元數據存儲，讀寫流程），不要把東西落到具體的業務 hdfs裏面的路徑佔不佔meta的內存？佔，不同版本不一樣小文件會產生什麼樣的問

2019-04-29 17:59:58