【數據結構與算法之美】什麼是數組？引出jvm垃圾回收

原創

2020-03-03 05:47

目錄

一、爲什麼很多編程語言的數組都是從0開始編號的？

二、什麼是數組？

三、數組和鏈表的面試糾錯？

四、容器是否完全替代數組？

五、標記清除算法？

六、警惕數組的訪問越界問題

七、課後思考

1. 描述 Java 語言中 JVM 的標記清除垃圾回收算法。

1）判斷對象是否存活：

2）分代回收

3）可以作爲GC Roots的對象

4）JVM垃圾收集器分類：

2. 根據一維數組的內存尋址公式，寫出二維數組的內存尋址公式。

一、爲什麼很多編程語言的數組都是從0開始編號的？

1、從數組存儲的內存模型上來看，“下標”確切的說法就是一種“偏移”，相比從1開始編號，從0開始編號會少一次減法運算，數組作爲非常基礎的數組結構，通過下標隨機訪問元素又是非常基礎的操作，效率的優化就要儘可能的做到極致。
2、主要的原因是歷史原因，C語言的設計者是從0開始計數數組下標的，之後的Java、JS等語言都進行了效仿，或者說是爲了減少從C轉向Java、JS等的學習成本。

二、什麼是數組？

數組是一個線性數據結構，用一組連續的內存空間存儲一組具有相同類型的數據。
其實數組、鏈表、棧、隊列都是線性表結構；樹、圖則是非線性表結構。

三、數組和鏈表的面試糾錯？

1、數組中的元素存在一個連續的內存空間中，而鏈表中的元素可以不存在於連續的內存空間。
2、數組支持隨機訪問，根據下標隨機訪問的時間複雜度是O(1)；鏈表適合插入、刪除操作，時間複雜度爲O(1）。

四、容器是否完全替代數組？

容器的優勢：對於Java語言，容器封裝了數組插入、刪除等操作的細節，並且支持動態擴容。
對於Java，一些更適合用數組的場景：
1、Java的ArrayList無法存儲基本類型，需要進行裝箱操作，而裝箱與拆箱操作都會有一定的性能消耗，如果特別注意性能，或者希望使用基本類型，就可以選用數組。
2、若數組大小事先已知，並且對數組只有非常簡單的操作，不需要使用到ArrayList提供的大部分方法，則可以直接使用數組。
3、多維數組時，使用數組會更加直觀。

五、標記清除算法？

GC最基礎的收集算法就是標記-清除算法，如同他們的名字一樣，此算法分爲“標記”、“清除”兩個階段，先標記出需要回收的對象，再統一回收標記的對象。不足有二，一是效率不高，二是產生碎片內存空間。

六、警惕數組的訪問越界問題

C 語言代碼的運行結果分析

int main(int argc, char* argv[]){
    int i = 0;
    int arr[3] = {0};
    for(; i<=3; i++){
        arr[i] = 0;
        printf("hello world\n");
    }
    return 0;
}

函數體內的局部變量存在棧上，且是連續壓棧。在Linux進程的內存佈局中，棧區在高地址空間，從高向低增長。變量i和arr在相鄰地址，且i比arr的地址大，所以arr越界正好訪問到i。當然，前提是i和arr元素同類型，否則那段代碼仍是未決行爲。

這段代碼無限循環原因有二，以及一個附加條件:

1. 函數體內的局部變量存在棧上，且是連續壓棧，棧空間從高往低依次分配，i佔4字節，接着arr佔12字節，內存從高往低是這樣：存i的4字節|arr[2]|arr[1]|arr[0]，數組訪問是通過“baseAddr+index乘typeSize”得到，算下來當index=3時，剛好是i的地址
2. 這裏剛好滿足字節對齊，系統爲64位系統，字長64，那麼字節對齊必須是8字節的倍數，剛好i變量和arr變量佔了16字節，對齊了；如果這裏將arr[3]改爲arr[4]，爲了對齊，內存從高往低是這樣：存i的4字節|空4字節|arr[3]|arr[2]|arr[1]|arr[0]，那麼arr[4]剛好是空的4字節，無法影響到i的值，則並不會無限循環
3.附加條件：編譯時gcc默認會自動添加越界保護，此處要達到無限循環效果，編譯時需加上-fno-stack-protector去除該保護

七、課後思考

1. 描述 Java 語言中 JVM 的標記清除垃圾回收算法。

解答：

1）判斷對象是否存活：

採用可達性分析算法來判斷對象是否存活，會遍歷所有 GC ROOTS，將所有 GC ROOTS 可達的對象標記爲存活

2）分代回收

（1）年輕代：複製算法，8:1:1的比例eden區和兩個survivor(survivor0,survivor1)區；

（2）老年代：標記整理

標記階段：首先進行標記；
清除階段：將存活的對象往一端移動，最後直接清除另一段端空間，不會造成對應內存碎片問題
不足：標記和清理效率都不高，少量垃圾產生時纔會高效；

3）可以作爲GC Roots的對象

虛擬機（棧幀中的本地變量表）中引用的對象
方法區中類靜態屬性引用的對象
方法區中常量引用的對象
本地方法棧中JNI（即一般說的native方法）中引用的對象

4）JVM垃圾收集器分類：

（1）新生代

Serial (第一代)

PraNew (第二代)

Parallel Scavenge (第三代)

G1收集器(第四代) JDK1.7後

（2）老年代

Serial Old (第一代)

Parallel Old (第二代)

CMS (第三代)

G1收集器 (第四代) JDK1.7後

2. 根據一維數組的內存尋址公式，寫出二維數組的內存尋址公式。

解答：

一維數組：a[i]_address=base_address+i*type_size
二維數組：二維數組假設是m*n， a[i][j]_address=base_address + (i*n+j)*type_size
三維數組：三維數組假設是m*n*q， a[i][j][k]_address=base_address + (i*n*q + j*q + k)*type_size

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

數據結構算法---遞歸

一、遞歸思想　　遞歸的思想就是把一個問題分解成一個個的子問題和子子問題，然後這些子問題逐級返回，得到最終結果。總結一下遞歸需要滿足的幾個條件：一個問題的解可以分解爲幾個子問題的解。問題與子問題，求解思路完全一樣。存在遞

2020-07-06 04:20:28

回溯法經典—n-皇后問題

n-皇后問題是回溯法中經典中的經典，其基本問題描述是:在一個nxn的格子中放n個皇后，使得每個皇后不能相互攻擊，任意兩個皇后能夠互相攻擊的條件是他們在同一條對角線或者同一行或者同一列上問題可以轉換爲從第0行開始放置皇后一直放到n-1行，

闪电侠的博客

2020-07-06 18:29:00

LRJ生成可重複的排列

#include <iostream> using namespace std; void print_emu(int a[], int x[], int n, int cur) { if (cur == 3) { for

闪电侠的博客

2020-07-06 18:28:59

杭電oj 2544 固定起點終點最短路徑解題報告

注:鄙人最近按照此分類來刷題，假期的最低限度是刷掉所有的DP類，並且每一道題目寫一個解題報告，如果有志同道合的朋友，歡迎加QQ 823797837共同學習交流，也可以加羣ACM新手羣161986576，老鳥飛過 Prob

闪电侠的博客

2020-07-06 18:28:59

杭電2059解題報告

Problem Description 據說在很久很久以前，可憐的兔子經歷了人生中最大的打擊——賽跑輸給烏龜後，心中鬱悶，發誓要報仇雪恨，於是躲進了杭州下沙某農業園臥薪嚐膽潛心修煉，終於練成了絕技，能夠毫不休息得以恆定的速度(VR m

闪电侠的博客

2020-07-06 18:28:59

回溯算法：子集樹和排列樹

假設現在有一列數a[0],a[1], ...a[n-1] ①如果一個問題的解的長度不是固定的，並且解和元素順序無關，即可以從中選擇0個或多個，那麼解空間的個數將是指數級別的，爲2^n,可以用下面的子集樹來表示所有的解(假設這裏n=4)

闪电侠的博客

2020-07-06 18:28:59

把一個字符串的大寫字母放到字符串的後面，各個字符的相對位置不變，不能申請額外的空間

例如AbcDeFGhi ->bceiADFG 這道題目是今年騰訊的面試題，我的想法是基於冒泡的思想，從頭開始掃描，遇到小寫字母就往前面冒初始：AbcDeFGhi 冒'b'： bAcDeFGhi 冒'c'： bcADeFGhi 冒'e'：

闪电侠的博客

2020-07-06 18:28:59

c++中關於explicit的一些總結

首先看下以下代碼 #include <iostream> using namespace std; class A { public: A(int v): value(v) { cout << "構造" << endl;}

闪电侠的博客

2020-07-06 18:28:59

如何判斷一個單鏈表有環，並且求出交匯處

單鏈表有環的情景如下，爲了方便起見，假定入口之前的鏈表長度爲L，循環長度爲K 循環鏈表示意圖我們可以用兩個指針，p1每次移動一格，p2每次移動兩格，初始化都爲頭結點HEAD 隨着指針慢慢推進，一定會出現以下的情況某一時刻兩指

闪电侠的博客

2020-07-06 18:28:59

杭電1176解題報告

原題見這裏關於解題的詳細步驟都已經在代碼註釋裏面了，這裏一定要注意，剛開始gameboy在位置5,因此在第5秒鐘之前，他的活動範圍有限，所以，在循環的時候j的範圍不一定能從0到10 #include <iostream> using

闪电侠的博客

2020-07-06 18:28:59

數據結構算法---二叉樹

一、二叉樹　　在計算機科學中，二叉樹是每個結點最多有兩個子樹的樹結構。通常子樹被稱作“左子樹”（left subtree）和“右子樹”（right subtree）。二叉樹常被用於實現二叉查找樹和二叉堆。　　一棵深度爲k，且有

2020-07-06 04:20:28

數組——數據結構與算法之美【基礎篇】

數組——數據結構與算法之美【基礎篇】什麼是數組線性表連續的內存空間和相同類型的數據爲什麼數組要從0開始編碼什麼是數組線性表數組是一種線性表數據結構，它用一組連續的內存空間，來存儲一組具有相同類型的數據每個線性表上的數據最

2020-07-06 03:14:30

實現佔位符替換接口，同printf

導航語音實現方案(文尾附有源碼) 函數接口如下 char *textTranslate(char *content, …) content：可變參列表中的固定參，包含佔位符的字符串； …：可變參數；返回值：爲替換後的字符串使用

2020-07-04 17:47:17

Java方式實現二叉樹的前中後序遍歷的遞歸及非遞歸算法

最近在研究數據結構算法，發現許多樹類的算法都很靈活，所以研究了一下基礎二叉樹的遞歸以及非遞歸的三種遍歷方式，在這裏記錄下來方便以後回憶。以該樹爲例：二叉樹的遍歷爲三種：前序遍歷、中序遍歷、後續遍歷。前序遍歷（先根遍歷）

追风de少年_SHAOFENG

2020-07-04 13:45:32

AES加密算法原理及java android實現

AES當今最流行的對稱加密算法之一，是DES的替代者。密鑰是AES算法實現加密和解密的根本。對稱加密算法之所以對稱，是因爲這類算法對明文的加密和解密需要使用同一個密鑰。 AES支持三種長度的密鑰：128位，192位，256位平時大家所

2020-07-02 23:37:18

24小時熱門文章

最新文章

最新評論文章