原创 快排和歸併排序概述
一、快排 1.1 基本思想 快排是冒泡排序的升級,它們都屬於交換排序類。 快排的基本思想是:通過一趟排序將待排記錄分割成獨立的兩部分,其中一部分記錄的關鍵字均比另一部分的關鍵字小,則可對這兩部分記錄繼續進行排序,以達到整個
原创 ArrayList、LinkedList、Vector對比
一、整體對比 ArrayList : 存儲方式:底層是使用 Object[] 存儲的 插入和刪除的效率:插入和刪除元素的效率低 擴容機制:默認擴容至原來的 1.5 倍 線程安全:線程不安全(可以使用 Coll
原创 最長迴文串
一、題目描述 給定一個包含大寫字母和小寫字母的字符串,找到通過這些字母構造成的最長的迴文串。 在構造過程中,請注意區分大小寫。比如 "Aa" 不能當做一個迴文字符串。 注意: 假設字符串的長度不會超過 1010。 示例 1
原创 Spark Streaming概述
一、SparkStreaming 概述 1.1 SparkStreaming 是什麼 SparkStreaming 是 Spark Core 的擴展,支持可伸縮、高吞吐量、容錯的實時數據流處理。SparkStreaming
原创 作業幫大數據研發一面涼經
一、背景 在 3 月 10 日左右投了作業幫的簡歷,一直沒有回覆,以爲是簡歷被刷了,沒想到 3 月 24 日 hr 打電話說 3 月 25 日下午面試,我心想投了大數據,肯定 hadoop、hive、spark 這些必定少不了
原创 音樂推薦系統——第三週實驗總結
一、完成的工作 1、在網頁上加了攔截器 2、把 ALS 推薦的結果顯示到頁面上 3、把網站部署到 Linux 上 二、遇到的問題 這次實驗的內容與大數據無關,大多是關於前端的內容,遇到最大的一個問題就是把推薦結果顯
原创 3 HDFS
文章目錄一、HDFS 的產生背景及定義1.1 產生背景1.2 定義二、HDFS 優缺點2.1 優點2.2 缺點三、HDFS 架構四、HDFS 塊(Block)五、HDFS 讀寫數據流程5.1 寫數據的流程5.2 讀數據的流程5.2
原创 單鏈表反轉
單鏈表反轉 package LinkListReview; class ListNode { int val; ListNode next; public ListNode(int val) {this
原创 第二週實驗總結
一、完成的工作 spark 讀取 hdfs 中的數據並進行 ALS 建模,使用交叉驗證選取最優的模型 二、遇到的問題 1、通過超參調整,交叉驗證方式獲得最優模型時遇到問題 老師說過超參調整,交叉驗證方式獲得最優模型,還提到
原创 一、Spark 架構及運行模式
一、Spark 是什麼 Spark 是基於內存計算的框架。 二、Spark 產生的背景 Spark 產生的原因主要是爲了解決 Hadoop 的缺點,這裏有一個時間線可以引出 Spark 的誕生。 1、Hadoop 1.x—
原创 3 線性神經網絡
一、線性神經網絡的引入 由於單層感知器不能解決線性不可分的問題(在上篇文章對線性可分做了解釋),如異或問題,這時我們引入了新的結構:線性神經網絡。 二、線性神經網絡與單層感知機的區別 線性神經網絡與單層感知器的結構相似,只
原创 多態
一、如何理解多態 多態可以理解成爲事務的多種形態。 二、什麼是多態 對象的多態性:父類的引用指向子類對象。 三、如何使用多態 虛方法調用:在編譯期間,只能調用父類中聲明的方法;在運行期間,執行子類中重寫的方法。 四、多
原创 面向對象(中)
目錄一、子類對象實例化的過程二、向下類型轉換 (不常用)三、Object 類的剖析四、== 與 equals 比較4.1 不同點4.2 查看源碼驗證五、包裝類5.1、包裝類的引入5.2、自動裝箱與自動拆箱5.2.1 裝箱與拆箱5.
原创 面向對象(上)
目錄一、面向對象程序設計的三條主線二、面向對象的三大特點三、如何理解類和對象在 Java 中,萬事萬物皆對象四、創建一個類的內存解析五、對象數組的內存解析六、屬性(成員變量)和局部變量七、方法的重載八、可變個數的形參九、對構造器的
原创 音樂推薦系統——第一週實驗總結
一、完成的工作 1. 把老師給的代碼成功運行 2. 把數據從 mysql 導入到 hdfs 二、遇到的問題及解決、思考 1. 運行老師的代碼時遇到的問題 問題: 在運行老師的代碼時其實一開始就成功啓動了,但在啓動之後發現總是