原创 快排和歸併排序概述

一、快排 1.1 基本思想 ​ 快排是冒泡排序的升級,它們都屬於交換排序類。 ​ 快排的基本思想是:通過一趟排序將待排記錄分割成獨立的兩部分,其中一部分記錄的關鍵字均比另一部分的關鍵字小,則可對這兩部分記錄繼續進行排序,以達到整個

原创 ArrayList、LinkedList、Vector對比

一、整體對比 ​ ArrayList : ​ 存儲方式:底層是使用 Object[] 存儲的 ​ 插入和刪除的效率:插入和刪除元素的效率低 ​ 擴容機制:默認擴容至原來的 1.5 倍 ​ 線程安全:線程不安全(可以使用 Coll

原创 最長迴文串

一、題目描述 ​ 給定一個包含大寫字母和小寫字母的字符串,找到通過這些字母構造成的最長的迴文串。 ​ 在構造過程中,請注意區分大小寫。比如 "Aa" 不能當做一個迴文字符串。 注意: 假設字符串的長度不會超過 1010。 示例 1

原创 Spark Streaming概述

一、SparkStreaming 概述 1.1 SparkStreaming 是什麼 ​ SparkStreaming 是 Spark Core 的擴展,支持可伸縮、高吞吐量、容錯的實時數據流處理。SparkStreaming

原创 作業幫大數據研發一面涼經

一、背景 ​ 在 3 月 10 日左右投了作業幫的簡歷,一直沒有回覆,以爲是簡歷被刷了,沒想到 3 月 24 日 hr 打電話說 3 月 25 日下午面試,我心想投了大數據,肯定 hadoop、hive、spark 這些必定少不了

原创 音樂推薦系統——第三週實驗總結

一、完成的工作 ​ 1、在網頁上加了攔截器 ​ 2、把 ALS 推薦的結果顯示到頁面上 ​ 3、把網站部署到 Linux 上 二、遇到的問題 ​ 這次實驗的內容與大數據無關,大多是關於前端的內容,遇到最大的一個問題就是把推薦結果顯

原创 3 HDFS

文章目錄一、HDFS 的產生背景及定義1.1 產生背景1.2 定義二、HDFS 優缺點2.1 優點2.2 缺點三、HDFS 架構四、HDFS 塊(Block)五、HDFS 讀寫數據流程5.1 寫數據的流程5.2 讀數據的流程5.2

原创 單鏈表反轉

單鏈表反轉 package LinkListReview; class ListNode { int val; ListNode next; public ListNode(int val) {this

原创 第二週實驗總結

一、完成的工作 ​ spark 讀取 hdfs 中的數據並進行 ALS 建模,使用交叉驗證選取最優的模型 二、遇到的問題 1、通過超參調整,交叉驗證方式獲得最優模型時遇到問題 ​ 老師說過超參調整,交叉驗證方式獲得最優模型,還提到

原创 一、Spark 架構及運行模式

一、Spark 是什麼 ​ Spark 是基於內存計算的框架。 二、Spark 產生的背景 ​ Spark 產生的原因主要是爲了解決 Hadoop 的缺點,這裏有一個時間線可以引出 Spark 的誕生。 1、Hadoop 1.x—

原创 3 線性神經網絡

一、線性神經網絡的引入 ​ 由於單層感知器不能解決線性不可分的問題(在上篇文章對線性可分做了解釋),如異或問題,這時我們引入了新的結構:線性神經網絡。 二、線性神經網絡與單層感知機的區別 ​ 線性神經網絡與單層感知器的結構相似,只

原创 多態

一、如何理解多態 ​ 多態可以理解成爲事務的多種形態。 二、什麼是多態 ​ 對象的多態性:父類的引用指向子類對象。 三、如何使用多態 ​ 虛方法調用:在編譯期間,只能調用父類中聲明的方法;在運行期間,執行子類中重寫的方法。 四、多

原创 面向對象(中)

目錄一、子類對象實例化的過程二、向下類型轉換 (不常用)三、Object 類的剖析四、== 與 equals 比較4.1 不同點4.2 查看源碼驗證五、包裝類5.1、包裝類的引入5.2、自動裝箱與自動拆箱5.2.1 裝箱與拆箱5.

原创 面向對象(上)

目錄一、面向對象程序設計的三條主線二、面向對象的三大特點三、如何理解類和對象在 Java 中,萬事萬物皆對象四、創建一個類的內存解析五、對象數組的內存解析六、屬性(成員變量)和局部變量七、方法的重載八、可變個數的形參九、對構造器的

原创 音樂推薦系統——第一週實驗總結

一、完成的工作 1. 把老師給的代碼成功運行 2. 把數據從 mysql 導入到 hdfs 二、遇到的問題及解決、思考 1. 運行老師的代碼時遇到的問題 問題: ​ 在運行老師的代碼時其實一開始就成功啓動了,但在啓動之後發現總是