非科班的B站驚險之旅,外包Java後端開發三年,年底跳槽兩個月如何應付面試? 知其然不知其所以然,大廠常問面試技術如何複習?

1 操作系統相關

  • 自旋鎖和一般鎖的區別是什麼?爲什麼要使用自旋鎖?

當一個線程在獲取鎖的時候,如果這個鎖已經被其他線程獲取,那麼這個線程不會破門而入,而是循環等待,但是嗷嗷待哺,需要不斷地嗷嗷叫判斷鎖是否被成功獲取,直到獲取到鎖纔會退出循環。

自旋鎖通常會出現哪些問題?

如果某個線程拿着鎖死不放手,其他線程沒法拿到這把鎖,只好等待獲取鎖的線程進入循環等待的狀態,等待不是睡覺,還是會消耗CPU,等待久了就會導致CPU的使用率太高。

那麼自旋鎖和其他鎖到底有啥不同?

從線程狀態來看,自旋鎖的狀態是運行-運行-運行。而非自旋鎖的狀態是運行---阻塞---運行,所以自旋鎖會更高效。

不管是什麼鎖,都是爲了實現保護共享資源而提出的一種鎖機制,都是爲了對某項資源的互斥使用。對於互斥鎖而言,如果資源已經被佔用,那麼資源的申請者只會進入睡眠的狀態。而自旋鎖不會引起調用者睡眠,而是一直循環在那裏查看該自旋鎖的保持着是否已經釋放了鎖。

那麼在Java中如何去實現一個自旋鎖

public class SpinLock {
    private AtomicReference<Thread> cas = new AtomicReference<Thread>();
    public void lock() {
        Thread current = Thread.currentThread();
        // 利用CAS
        while (!cas.compareAndSet(null, current)) {
            // DO 
        }
    }
    public void unlock() {
        Thread current = Thread.currentThread();
        cas.compareAndSet(current, null);
    }
}

上段代碼中,方法lock利用的CAS,當線程A獲取鎖的時候,成功獲取不會進入while循環。如果此時線程A沒有釋放鎖,當線程B來獲取鎖的時候,由於不滿足CAS,就會進入whilei循環,不斷判斷是否滿足CAS,直到線程A調用unlock釋放。

自旋鎖有哪些優點?

  1. 因爲運行在用戶態,沒有上下文的線程狀態切換,線程一直處於active,減少了不必要的上下文切換,從而執行速度較快

  2. 因爲非自旋鎖在沒有獲取鎖的情況下會進入阻塞狀態,從而進入內核態,此時就需要線程的上下文切換,因爲阻塞後進入內核調度狀態,會導致用戶態和內核態之間的切換,影響鎖的性能。

  • 瞭解哪些I/O模型?select是阻塞IO嗎?

首先將IO模型給安排一遍,然後把自己很熟悉的IO模型詳細說一波並介紹出應用場景,這個裝的X就算比較完美,具體的非常詳細的在下一篇文章,這裏簡要說一波。這一部分在上一篇詳細闡述過

阻塞IO

我們知道在調用某個函數的時候無非就是兩種情況,要麼馬上返回,然後根據返回值進行接下來的業務處理。當在使用阻塞IO的時候,應用程序會被無情的掛起,等待內核完成操作,因爲此時的內核可能將CPU時間切換到了其他需要的進程中,在我們的應用程序看來感覺被卡主(阻塞)了。

非阻塞IO

當使用非阻塞函數的時候,和阻塞IO類比,內核會立即返回,返回後獲得足夠的CPU時間繼續做其他的事情。

IO複用模型

當使用fgets等待標準輸入的時候,如果此時套接字有數據但不能讀出。IO多路複用意味着可以將標準輸入、套接字等都當做IO的一路,任何一路IO有事件發生,都將通知相應的應用程序去處理相應的IO事件,在我們看來就反覆同時可以處理多個事情。這就是IO複用

信號驅動IO

在信號驅動式 I/O 模型中,應用程序使用套接口進行信號驅動 I/O,並安裝一個信號處理函數,進程繼續運行並不阻塞。當數據準備好時,進程會收到一個 SIGIO 信號,可以在信號處理函數中調用 I/O 操作函數處理數據。

異步IO

用程序告知內核啓動某個操作,並讓內核在整個操作(包括將數據從內核拷貝到應用程序的緩衝區)完成後通知應用程序。那麼和信號驅動有啥不一樣?

  • 講講select和epoll的區別?

這裏一樣的套路,先說出兩者的用途,然後兩者的優缺點。

select的缺點

  • select返回的是含有整個句柄的數組,應用程序需要遍歷整個數組才能發現哪些句柄發生了事件

  • select的觸發方式是水平觸發,應用程序如果沒有完成對一個已經就緒的文件描述符進行IO操作,那麼之後每次select調用還是會將這些文件描述符通知進程

  • 內核 / 用戶空間內存拷貝問題,select每次都會改變內核中的句柄數據結構集,因而每次select調用時都需要從用戶空間向內核空間複製所有的句柄數據結構,產生巨大的開銷

  • 單個進程能夠監視的文件描述符的數量存在最大限制,通常是1024,當然可以更改數量

epoll實現

epoll在內核中會維護一個紅黑樹和一個雙向鏈表,紅黑樹存放通過epoll_ctl方法向epoll對象中添加進來的事件,所以不需要每次調用epoll_wait都全量複製所有的事件結構。雙向鏈表存放就緒的事件,所有添加到epoll中的事件都會與設備(網卡)驅動程序建立回調關係,也就是說,當相應的事件發生時會調用這個回調方法,這個回調方法在內核中叫ep_poll_callback,它會將發生的事件添加到rdlist雙鏈表中。調用epoll_wait就會直接返回鏈表中的就緒事件,效率高。

  • select適合少量活躍連接,一般幾千。

  • epoll適合大量不太活躍的連接。

  • 樂觀鎖和悲觀鎖瞭解嗎?

這個問題延伸的問題會很多,比如線程安全,CAS原理,優缺點等。

啥是悲觀和樂觀,咋們面試的時候不得樂觀一些。想給面試來一波官方解釋,然後大白話解釋一波就差不多了。

官方:悲觀鎖是總是假設最壞的情況,每次那數據都認爲別人會修改它,所以每次去那數據都要上鎖,這樣別人去拿這個數據就會阻塞。樂觀鎖就不一樣了,總是覺得一切都是最好的安排,每次拿數據都認爲別人不會修改,所以也就不上鎖,但是在更新的時候會判斷這個期間別人有沒有更新這個數據。

  • 什麼是緩存穿透?如何避免?什麼是緩存雪崩?何如避免?

緩存穿透

一般來說,緩存系統會通過key去緩存查詢,如果不存在對應的value,就應該去後端系統查找(比如DB)。這個時候如果一些惡意的請求到來,就會故意查詢不存在的key,當某一時刻的請求量很大,就會對後端系統造成很大的壓力。這就叫做緩存穿透。

如何避免?

對查詢結果爲空的情況也進行緩存,緩存時間設置短一點,或者該key對應的數據insert了之後清理緩存。對一定不存在的key進行過濾。可以把所有的可能存在的key放到一個大的Bitmap中,查詢時通過該bitmap過濾。

緩存雪崩

當緩存服務器重啓或者大量緩存集中在某一個時間段失效,這樣在失效的時候,會給後端系統帶來很大壓力。導致系統崩潰。

如何避免?

在緩存失效後,通過加鎖或者隊列來控制讀數據庫寫緩存的線程數量。比如對某個key只允許一個線程查詢數據和寫緩存,其他線程等待。

做二級緩存,A1爲原始緩存,A2爲拷貝緩存,A1失效時,可以訪問A2,A1緩存失效時間設置爲短期,A2設置爲長期。

不同的key,設置不同的過期時間,讓緩存失效的時間點儘量均勻。

2 redis相關

如果是後端/服務端面試的同學,怎麼說都的去找一本redis書來看看,其出現的概率只有那麼大了,切記切記。看看B站問了哪幾個問題。

  • redis的淘汰刪除策略瞭解嗎?

能說不了解嗎,就算是沒有聽說過,咋們也可以來一句:“不好意思面試官,這一塊還不怎麼深入,但是從字面意思來理解巴拉巴拉”,不至於一臉懵逼。下面我們看看redis的緩存策略

Redis中通過maxmemory參數來設定內存的使用上限,如果Redis所使用內存超過設定的最大值,那麼會根據配置文件中的策略選取要刪除的key來刪除,從而留出新的鍵值空間。主要的六種淘汰key策略

  1. volatile-lru

在鍵空間中設置過期時間,移除哪些最近最少使用的key,佔着茅坑不拉屎的key

  1. allkeys-lru

移除最近最少使用的key

  1. volatile-random

在鍵空間中設置過期時間,隨機移除一個key

  1. allkeys-random

隨機移除一個key

  1. noeviction

當內存使用達到閥值的時候,所有引起申請內存的命令會報錯;

ok,現在知道了需要淘汰哪些key,那我們如何去淘汰這些key

  1. 定時刪除

很簡單,設置一個鬧鐘,鬧鐘響了就刪除即可。這種方式對於內存來說還是比較友好,內存不需要啥額外的操作,直接通過定時器就可保證儘快的刪除。對於CPU來說就有點麻煩了,如果過期鍵比較多,那麼定時器也就多,這刪除操作就會佔用太多的CPU資源

  1. 惰性刪除

每次從鍵空間獲取鍵的時候檢查鍵的過期時間,如果過期了,刪除完事。

  1. 定期刪除

每隔一段時間就去數據庫檢查,刪除過期的鍵

這種方案是定時刪除和惰性刪除的中和方法,既通過限制刪除操作執行的時長來減少對CPU時間的影響,也能減少內存的浪費。但是難點在於間隔時長需要根據業務情況而定。

3 mysql

  • mysql中使用的鎖有哪些?什麼時候使用行鎖,什麼時候會使用表鎖?

InnoDB中的行鎖是通過索引上的索引項實現,主要特點是,只有通過索引條件檢索數據,InnoDB纔會使用行級鎖,否則InnoDB將使用表鎖。

這裏注意,在Mysql中,行級鎖不是鎖記錄而是鎖索引。索引又分爲主鍵索引和非主鍵索引兩種。如果在一條語句中操作了非主鍵索引,Mysql會鎖定該非主鍵索引,再鎖定相關的主鍵索引。

  • 瞭解過間隙鎖嗎?間隙鎖的加鎖範圍是怎麼確定的?

  • 瞭解B+樹嗎?B+樹什麼時候會出現結點分裂?

這個回答在上一篇的B+樹已經詳細說了。這裏簡述一下

  1. 將已滿結點進行分裂,將已滿節點後M/2節點生成一個新節點,將新節點的第一個元素指向父節點。

  2. 父節點出現已滿,將父節點繼續分裂。

  3. 一直分裂,如果根節點已滿,則需要分類根節點,此時樹的高度增加。

  • 事務還沒執行完數據庫掛了,重啓的時候會發生什麼?

  • undo日誌和redo日誌分別是幹嘛的?

redo log重做日誌是InnDB存儲引擎層的,用來保證事務安全。在事務提交之前,每個修改操作都會記錄變更後的數據,保存的是物理日誌-數據,防止發生故障的時間點,有髒頁未寫入磁盤,在重啓mysql的時候,根據redo log進行重做從而達到事務的持久性

undo log回滾日誌保存了事務發生之前的數據的一個版本,可以用於回滾,同時也提供多版本併發控制下的讀。

  • 簡單講講數據庫的MVCC的實現原理?

細說太多了,幾個大寫字母代表啥,這幾個大寫字母又是如何關聯起來完事。細問再深究

  • mysql的binlog日誌什麼時候會使用?

首先應該知道binlog是一個二進制文件,記錄所有增刪改操作,節點之間的複製都會依靠binlog來完成。從底層原理來說,binlog有三個模式

  1. 模式1--row模式

每一行的數據被修改就會記錄在日誌中,然後在slave段對相同的數據進行修改。比如說"update xx where id in(1,2,3,4,5)",使用此模式就會記錄5條記錄

  1. 模式2--statement模式

修改數據的sql會記錄到master的binlog中。slave在複製的時候sql thread會解析成和原來maseter端執行過的相同的sql在此執行

  1. 模式3--mixed模式

mixed模式即混合模式,Mysql會根據執行的每一條具體sql區分對待記錄的日誌形式。那麼binlog的主從同步流程到底是咋樣的

流程簡述:

Master執行完增刪改操作後都會記錄binlog日誌,當需要同步的時候會主動通知slave節點,slave收到通知後使用IO THREAD主動去master讀取binlog寫入relay日誌(中轉日誌),然後使 SQL THREAD完成對relay日誌的解析然後入庫操作,完成同步。

4 基本數據結構

  • 使用LRU時,如果短時間內會出現大量只會使用一次的數據,可能導致之前大量高頻使用的緩存被刪除,請問有什麼解決辦法?

  • 瞭解過循環鏈表嗎?他的長度怎麼計算?

他的主要特點是鏈表中的最後一個節點的指針域指向頭結點,整個鏈表形成一個環。****這裏循環鏈表判斷鏈表結束的標誌是,判斷尾節點是不是指向頭結點

  • 哪種數據結構可以支持快速插入,刪除,查找等操作?

思考這個問題的時候,我們不凡複習下不錯的二分查找,它依賴數組隨機訪問的特性,其查找時間複雜度爲O(log n)。如果我們將元素放入鏈表中,二分查找還好使嗎?這就是今天和大家分享的跳錶

理解跳錶

假設使用單鏈表存儲n個元素,其中元素有序如下圖所示

從鏈表中查找一個元素,自然從頭開始遍歷找到需要查找的元素,此時的時間複雜度爲O(n)。那採用什麼方法可以提高查詢的效率呢?問就是加索引,如何加,我們從這部分數據中抽取幾個元素出來作爲單獨的一個鏈表,如下圖所示]

假設此時咋們查找元素16,首先一級索引處尋找,當找到元素14的時候,下一個節點的值爲18,意味着我們尋找的數在這兩個數的中間。此時直接從14節點指針下移到下面的原始鏈表中,繼續遍歷,正好下一個元素就是我們尋找的16。好了,我們小結一下,如果從原始鏈表中尋找元素16,需要遍歷比較8次,如果通過索引鏈表尋找我們只需要5次即可。

我們繼續查找元素16,此時比較次數變爲4次。這樣看來,加一層索引查找的次數就變少,如果有n個元素到底有多少索引?

假設我們按照每兩個結點就抽出一個結點作爲上一層的索引節點,第一層所以節點個數n/2,第二層爲n/4,第x級索引的結點個數是第x-1級索引的結點個數的1/2,那第x級索引結點的個數就是n/(2x)。假設索引有y級,我們可以得到n/(2y)=2,從而求得y=log2n-1。

這麼多索引是不是就很浪費內存嘞?

假設原始鏈表大小爲n,那第一級索引大約有 n/2 個結點,第二級索引大約有 n/4 個結點,以此類推,每上升一級就減少一半,直到剩下 2 個結點。如果我們把每層索引的結點數寫出來,就是一個等比數列。這幾級索引的結點總和就是 n/2+n/4+n/8…+8+4+2=n-2 。所以,跳錶的空間複雜度是 O(n) 。那還能不能降低一些呢。機智的你應該就考慮到假設每三個結點抽取一個節點作爲索引鏈表的節點。

跳錶與二叉查找樹

兩者其查找的時間複雜度均爲O(logn) ,那跳錶還有哪些優勢?

先看二叉查找樹,

這種結構會導致二叉查找樹的查找效率變爲 O(n),。

跳錶與紅黑樹

說實話,紅黑樹確實比較複雜,面試的時候讓你寫紅黑樹,你就給他大嘴巴子?

紅黑樹需要通過左右旋的方式去維持樹大小平衡。而跳錶是通過隨機函數來維護前面提到的 “ 平衡性 ” 。當我們往跳錶中插入數據的時候,我們可以選擇同時將這個數據插入到部分索引層中。如何選擇加入哪些索引層呢?
我們通過一個隨機函數,來決定將這個結點插入到哪幾級索引中,比如隨機函數生成了值 K ,那我們就將這個結點添加到第一級到第 K 級這 K 級索引中。當我們往跳錶中插入數據的時候,我們可以選擇同時將這個數據插入到部分索引層中。

小結

Redis中的有序集合採用了跳錶的方式來實現,其實還採用了散列表等數據結構進行融合。它在插入,刪除等都有比較快的速度,雖然紅黑樹也可以做到,但是紅黑樹對於按照區間查找數據這個操作,跳錶可以做到 O(logn) 的時間複雜度定位區間的起點,然後在原始鏈表中順序往後遍歷就可以了

5 總結

請記下以下幾點:

  • 公司招你去是幹活了,不會因爲你怎麼怎麼的而降低對你的要求標準。

  • 工具上面寫代碼和手撕代碼完全不一樣。

  • 珍惜每一次面試機會並學會覆盤。

  • 對於應屆生主要考察的還是計算機基礎知識的掌握,項目要求沒有那麼高,是自己做的就使勁摳細節,做測試,只有這樣,才知道會遇到什麼問題,遇到什麼難點,如何解決的。從而可以侃侃而談了。

  • 非科班也不要怕,怕了你就輸了!一定要多嘗試。

知其然不知其所以然,大廠常問面試技術如何複習?

1、熱門面試題及答案大全

面試前做足功夫,讓你面試成功率提升一截,這裏一份熱門350道一線互聯網常問面試題及答案助你拿offer

面試寶典+書籍+核心知識獲取:(點這裏)下載!誠意滿滿!!!

2、多線程、高併發、緩存入門到實戰項目pdf書籍

書,讀書既能學習 也有利於平靜心態!

快速入手通道:(點這裏)下載!誠意滿滿!!!

Java面試精選題、架構實戰文檔傳送門:https://docs.qq.com/doc/DRW1nUkdhZG5zeGVi

3、文中提到面試題答案整理

快速入手通道:(點這裏)下載!誠意滿滿!!!

Java面試精選題、架構實戰文檔傳送門:https://docs.qq.com/doc/DRW1nUkdhZG5zeGVi

4、Java核心知識面試寶典

覆蓋了JVM 、JAVA集合、JAVA多線程併發、JAVA基礎、Spring原理、微服務、Netty與RPC、網絡、日誌、Zookeeper、Kafka、RabbitMQ、Hbase、MongoDB 、Cassandra、設計模式、負載均衡、數據庫、一致性算法 、JAVA算法、數據結構、算法、分佈式緩存、Hadoop、Spark、Storm的大量技術點且講解的非常深入

快速入手通道:(點這裏)下載!誠意滿滿!!!

Java面試精選題、架構實戰文檔傳送門:https://docs.qq.com/doc/DRW1nUkdhZG5zeGVi

整理不易,覺得有幫助的朋友可以幫忙點贊分享支持一下小編~

你的支持,我的動力;祝各位前程似錦,offer不斷!!!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章