存儲技術發展過程

一直想寫一下存儲的發展,從用烏龜殼記錄文字到我們造出來紙筆書寫語言這其中有無數人在推動文明的發展。漢語或者英語都是文化的延續,最終的目的是讓人讀懂。如何將這些文化存儲起來的問題,從龜殼,竹簡,紙到如今的電子化設備每一個記錄工具的發展都是一段有趣的故事。我們一起走進存儲的世界。

從保存聲音開始

發條音樂盒

每一個孩子的幼年都離不開一個發條音樂盒,媽媽哄睡覺的神器。嚴格來說發條音樂盒並不屬於存儲的範疇,拿到這裏來說,是因爲這個工具在孩童時會讓我們以爲音樂盒裏存儲了一首歌。

音樂盒的組成有最重要的3個部分:

​ 動力源(發條)、芯片(彈簧片)、滾筒

最最重要的就是滾筒:

你能看到上面一個個斑斑點點,它的作用就是流動的音符,通過預設的音符刻在滾筒上,彈簧片在滾筒滾動時摩擦上面的凸起處發出聲音。所以你可以把滾筒理解爲一段音符的存儲器皿。就這麼個小小的零件,當你上滿發條之後就能播放一段美麗的音樂。

你可以把它當做歌曲播放器的雛形,正因爲有前人的創意纔有後繼者用新時代的技術繼續發揚光大。

留聲機

愛迪生這個“大燈泡”一輩子幾乎大部分時間都泡在實驗室,研究電話和電報機的時候無意之中發現了記錄聲音和回放聲音的祕密,在這之前人類從未踏足保存聲音這個領域。

最先發明的是圓筒式機械錄音,圓筒式機械錄音是縱深式錄音,圓筒中間有一根螺絲作軸,用手搖引軸時圓筒會從一端移動到另一端,圓筒表面塗有膠蠟,膠蠟上面有一根錄音刻針,與聲膜相連,聲膜連着喇叭口。

對着喇叭大聲說話,聲膜振動帶動刻針在圓筒膠蠟上滑動,圓筒隨轉而移動就隨說話聲音刻上深淺不同的螺旋聲紋。放音時先退回原位,搖動轉軸刻針在聲紋裏隨着振動,帶着聲膜從喇叭發出說話聲。

爲了能很好錄音,錄音時必須大聲說話。圓筒膠蠟在較高溫度下,接近熔化。放音時要冷都低溫。這是沒有電子放音機技術製作的最早的留聲機。所以最開始的留聲機限制於記錄聲音的材料導致聲音不清晰。

1887年,愛彌爾·柏林納製造了一種新型留聲機。它的特點是,用圓盤形的唱片代替了大唱筒,唱片用兩個手搖轉輪帶動。這種唱片留聲機與唱筒留聲機相比性能有了明顯提高,是現代電唱機的雛形。

​ 手搖圓盤唱片式

記錄聲音的材質一直在發展,從一開始愛迪生使用的的錫箔紙到蠟筒:

從蠟筒到圓盤式唱片的鼻祖-78轉蟲膠唱片:

78轉蟲膠唱片很重、很硬,但很脆弱,在運輸、使用過程中極易破損。這使得它用來記錄聲音的凹槽數量十分有限,一旦刻紋變多就容易損毀。所以78轉蟲膠唱片一面最多隻能刻錄4-5分鐘的音樂,大部頭的古典樂壓根沒有辦法完整記錄下來,總是在精彩的樂章中斷。這才使得唱片公司將目光瞄準後來出現的人工合成材料——聚氯乙烯,也就是如今常見的PVC塑料。

材料的變化讓記錄的聲音越來越清晰,越來越長。電機替代了唱片機上的手搖桿,再也不用專人在機器邊上守着上發條。

進入電氣時代

磁帶機

我們說的磁帶、磁盤都屬於磁存儲的範疇,磁表面存儲器是在不同形狀(如盤狀、帶狀等)的載體上,塗有磁性材料層,工作時靠載磁體高速運動,由磁頭在磁層上進行讀寫操作,信息被記錄在磁層上,這些信息的軌跡就是磁道。磁盤的磁道是一個個同心圓,磁帶的磁道是沿磁帶長度方向的直線。

磁存儲器通過磁頭和記錄介質的相對運動完成讀寫操作。寫入時,記錄介質在磁頭下方勻速通過,根據寫入數據的要求,對寫入線圈輸入一定方向和大小的電流,使磁頭導磁體磁化,產生一定方向和強度的磁場。由於磁頭與磁層表面間距非常小,磁力線直接穿透到磁層表面,將對應磁頭下方的微小區域磁化(叫作磁化單元)。可以根據寫入驅動電流的不同方向,使磁層表面被磁化的極性方向不同,以區別記錄 0 或者 1。

電氣時代的存儲和“原始”時代有本質的區別,存儲 01 要比存儲原始刻錄簡單的多,所以這時候的存儲設備也逐漸變小,但是容量反而遞增。比如一個 4mm 寬的磁帶:

數據傳輸的速度約在 ~150 kB/s, 到 ~500 kB/s 之間,可存儲 空間從 1.3 GB 到 2.0 GB 之間,硬件壓縮可使空間加倍。

磁帶發展之初我們主要用來錄音,因爲燒錄磁帶的過程是讓磁帶繞線圈不斷旋轉以拉取後面未燒取的部分,所以磁帶這種存儲工具不具備隨機存儲的特性。在時代的洪流中雖然它不能提供快捷查找,但是對於冷數據的場景它非常適用。

如今的磁帶技術不僅沒有因爲時代發展而摒棄反而發展的相當矚目。在 2018 年發佈的 IBM 3592 數據磁帶 使用 TS1160 格式最大未壓縮容量可達 20TB,而讀寫速度也可以達到 400MB/s,均超過現在的硬盤。

像博物館、科學研究的歷史數據、地址勘探的數據這些需要保存但又不經常使用的數據使用磁帶來保存就非常合適。價格比同級別的硬盤便宜,不佔空間,適合存儲。

能動的畫面-膠片

聲音的記錄我們已經沒有什麼問題,接下來到了畫面的保存。這又是一個歷史性的時刻。

膠片的誕生要遲於照相機的發明。早在 1826 年,世界上第一架照相機便出現了 - 它由 17 世紀的一種便攜式繪圖儀器的暗箱脫胎而來,看上去有些笨重。聰明的法國人尼埃普斯對暗箱作了一番改造,加上鏡頭、光圈和毛玻璃,就製成了照相機,並在室外花了八個小時曝光,拍下了世界上第一張照片。他給它取了個好聽的名字,叫“日光繪畫”。

這塊寬20釐米、高16.5釐米的錫版,是尼埃普斯拍攝的人類第一張存世照片《窗外風景》,現存於哈里·蘭瑟姆中心。(圖片來蓋蒂博物館)

當時使用的錫板成像曝光時間太長,並且成像質量也不太清晰,一位叫做達蓋爾的設計師通過銀鹽來感光,在曝光後用水銀蒸氣沖洗出潛在的影像,這種方式可以大大縮短曝光時間。成像之後使用硫代硫酸鈉定影液,即大蘇打或稱“海波”,這樣洗出來的照片可以留存很久的時間。

生化材料的發展也給處於不同歷史時期的人提供更多思路支撐,1851年英國人阿徹發明的火棉膠溼版法攝影工藝,採用玻璃作爲片基,並在上面塗上蛋清、碘化鉀以及氯化鈉的混合液。

上圖:美國總統林肯肖像的玻璃溼版轉成正像。
下圖:1864 年2月9日攝影 師 安 東 尼· 伯berger)利用玻璃溼版拍攝的林肯肖像原版。(上下圖片均 來 自Abraham Lincon at Gettysburg)

玻璃處於溼潤的狀態下曝光和顯影,因此攝影師外出拍攝時,必須攜帶着遮光的帳篷、化學藥品、玻璃片、笨重的支架以及一壺水,全套裝備通常是整整一馬車。

在隨後的 20 年裏,一項更偉大的發明誕生了:膠捲。

主要得益於在此前之前誕生的幹版工藝,這種攝影工藝是英國人馬多克斯在1871 年發明出來的,全名爲溴化銀感光乳劑玻璃幹版工藝,它讓攝影師解脫了溼版操作的麻煩。

1879年,美國紐約一位年輕的銀行職員喬治·伊斯曼計劃購買一套相機外出旅行,那個時候玻璃幹版攝影工藝還沒有在美國普及,市場上能買到的只有笨重且麻煩的溼版工藝。伊斯曼在學習使用這套設備期間產生了困惑:假如帶着它遠足,一路上還有什麼樂趣呢!於是他下決心研究更加方便的攝影方式。伊斯曼偶爾在一本英國攝影雜誌上讀到了關於玻璃幹版的介紹,這給他帶來了很大的啓發。1880 年 4 月,伊斯曼辭去銀行職務,在羅徹斯特市創業,開始研製照相干版。儘管幹版比溼版方便了不少,但伊斯曼並不滿意,因爲玻璃沉重而且易碎,也不易攜帶。1884 年,伊斯曼就嘗試用紙張代替玻璃作爲片基,製造出可以捲起來的紙基膠捲。後來他又開始嘗試用透明的賽璐珞代替紙張作爲片基。1888 年,伊斯曼對外正式宣佈,他已經制造出可以捲起來的新型“伊斯曼膠捲”,這就是一直通用至今的標準透明片基膠捲。

至此,人類對於聲音和畫面的存儲已經完成,從刀耕火種時代到數字化時代,我們一直在不斷進步。

光盤

電氣化臨門一腳直接讓我們的信息量幾何倍數遞增,存儲當然也不能落後。01表示的電子正負極稱爲數字存儲的基石。二進制編碼作爲數字化存儲的底層編碼必然要求所有的存儲設備都以利於二進制存儲的狀態出現。

我們想一下我們用什麼形狀的容器來裝這些二進制數據,我們假設用一個方形的容器來存儲二進制數據,是不是感覺很怪,當你的探針移動到右邊界之後還需要先走回來到左邊界才能開始下一行的讀取,這很浪費時間。

所以存儲容器的選擇最好是讓容器轉動而探針不動。符合這個特性的容器也就只有圓形。

有了容器我們就得想辦法把二進制數據放上去。光盤是用極薄的鋁質或金質音膜加上聚氯乙烯塑料保護層製作而成的,表面有很多級細的凹凸不平的數據軌:

這些數據軌就是我們在光盤上燒錄的數據,它裏面的數據軌單位以微米記。所以你如果想用針戳,恐怕是做夢。

想要讀取光盤上面的這些數據你需要用聚焦的氫離子激光束打到光盤表面通過記錄槽的長短不同來判斷是 0 還是 1。

常見的刻錄光盤主要有3種:CD、DVD 和藍光光盤。普通的 CD 光盤的容量大概爲 700M,DVD 的容量最大爲 17G,而藍光光盤單層最大能存儲 27G,如果是多層的話,最大能達到400G。

TF卡和閃存技術

半導體芯片的發展又加速了存儲技術的發展。光盤少說直徑有 15cm,而使用半導體芯片作爲介質存儲則可以把體積縮小到 1cm。不僅便於攜帶,因爲它沒有機械結構,不怕碰撞,沒有噪音。基於電擦寫方式可以做到比傳統機械讀寫快很多倍的速度。

唯一的缺點就是價格比較貴!

常見基於閃存技術出現的 產品有 TF 卡,SD 卡。

閃存技術的底層實現又是什麼呢?那就是三極管。

我們知道三極管具備導通和不導通兩種狀態,這兩種狀態可以用來表示數據 0 和數據 1,因此利用三極管作爲存儲單元的三極管陣列就可作爲存儲設備。柵極與硅襯底之間有二氧化硅絕緣層,用來保護浮置柵極中的電荷不會泄漏。採用這種結構,使得存儲單元具有了電荷保持能力,就像是裝進瓶子裏的水,當你倒入水後,水位就一直保持在那裏,直到你再次倒入或倒出,所以閃存具有記憶能力。

上圖我們看到閃存技術採用的浮珊場效應管跟普通的不一樣,它有兩個珊極。

閃存技術是採用特殊的浮柵場效應管作爲存儲單元,它具有兩個柵極,一個如普通場管柵極一樣,用導線引出,稱爲“選擇柵”;另一個則處於二氧化硅的包圍之中不與任何部分相連,這個不與任何部分相連的柵極稱爲“浮柵”。通常情況下,浮柵不帶電荷,則場效應管處於不導通狀態,場效應管的漏極電平爲高,則表示數據1。由於選擇柵加有高電壓,在電場作用下,這些電子又通過二氧化硅層到達浮柵,並在浮柵上形成電子團。浮柵上的電子團即使在掉電的情況下,仍然會存留在浮柵上,所以信息能夠長期保存。擦除時,源極加上較高的編程電壓,選擇柵接地,漏極開路。根據隧道效應和量子力學的原理,浮柵上的電子將穿過勢壘到達源極,浮柵上沒有電子後,就意味着信息被擦除了。

閃存帶最小存儲單元是晶浮柵晶體管,對應於磁盤中的一個 bit 的存儲單元,難以想象這麼大點的TF卡里面到底有多少晶體管!

閃存卡發展之初是爲了支撐便攜式設備的存儲,1997 年推出的卡種只有128M,現在 SDXC 格式的存儲卡目前最大容量能支持 64G,理論容量能支持 2TB。

硬盤

終於說到了目前存儲的終極形態:磁盤。同磁帶一樣都是基於電磁效應,當閉合電路內的磁場發生變化(磁通量變化)時,閉合電路內會產生感應電動勢。即閉合電路內磁場的變化會使電路內產生感應電流。 電流的方向與磁極方向有關。

絕命毒師第五季第一季中,記錄着老白製毒過程的筆記本電腦被警方獲得並放到了物證室裏。老白利用電磁效應,在物證室外弄了一個大‘磁鐵’破壞了筆記本里面的數據,就是上面的原理。

硬盤主要由碟片、磁頭、電機馬達、接口和控制電路控制芯片組成。

磁頭是一個外面被線圈纏繞着的 U 型磁芯,可以看出當磁頭通電時便會產生磁場,磁場的方向隨電流方向的變化而變化。

磁頭在讀取數據時不與盤片接觸,但是又要越近越好,因爲太遠無法感應到磁粉的極性,這個距離現在已經可以做到人類頭髮絲的千分之一,肉眼看上去是挨着的實則還有億點點距離!

當給磁頭施加不同的電流方向時,使磁盤局部產生不同的磁極,產生的磁極在未受到外部磁場干擾下是不會改變的,這樣便將輸入數據時的電信號轉化爲磁信號持久化到磁盤上。在磁盤讀取時,磁頭就相當於一個探測器,其“掃描”過磁盤面的各個區域時,各個區域中磁顆粒的不同磁化方向被感應轉換成相應的電信號,電信號的變化進而被表達爲 “0” 和 “1”,成爲所有數據的原始譯碼。通過這種雙向的電磁感應作用便完成了磁盤數據的記錄和讀取。

碟片的表面塗有磁性材料,厚度一般在 0.5mm 左右。碟片安裝在主軸馬達的轉軸上,工作時碟片在主軸馬達的帶動下高速旋轉。

盤片有電機帶動做高速旋轉,常見的轉速爲 7200 轉/分,就是指盤片每分鐘轉過的圈數。這樣磁頭就相對盤片做圓周運動,也就能夠按磁道來讀取數據。除此之外,磁頭的機械臂還由步進電機控制,沿盤片半徑做直線運動,以讀取不同磁道的數據。一塊磁盤擁有多個盤片,每個盤片的上下面都可以讀寫數據,而且每個盤面都有對應的磁頭讀寫。例如,如果一塊磁盤有4個盤面,那麼磁頭就有8個,分別編號 0-7。雖然有多個磁頭在工作,但是同一時刻只能有一個磁頭在讀寫數據。 在整個數據的讀取過程中,機械臂的移動稱爲尋道,尋道的時間和盤片旋轉的時間遠大於半導體電路的數據傳輸時間,是阻礙磁盤讀寫性能的最大因素。

盤片這麼大,數據的存儲是怎麼做到定位的呢?肯定是不是滿盤片跑吧!硬盤的設計者把一個盤片如同切西瓜一樣切成很多塊,每一塊被叫做扇區。

扇區是磁盤的最小邏輯存儲單元。早期每個扇區的大小被設定爲 512 kb,現在隨着 Cache 的發展,扇區大小也被標定爲 4096 kb。 數據存儲到扇區之後的尋找數據又是什麼樣的過程呢?

在早期軟盤和硬盤的尋址方式被稱作「柱面-磁頭-扇區尋址」,簡稱 CHS 尋址, 是因爲這三個參數是軟件交給硬件定位到某個具體扇區單元時使用的參數。 首先柱面參數讓磁頭臂移動到某個半徑上,尋址到某個柱面,然後激活某個磁頭,然後隨着盤面旋轉, 磁頭定位到某個扇區上。

這種尋址方式帶來的問題是,由於要求每個磁道的扇區數相等,而外道的周長要大於內道,所以外道的記錄密度要遠低於內道,不僅造成了硬盤空間的浪費,也限制了硬盤的容量。柱面和扇區數是固定的,那麼這就決定了 CHS 的最大尋址範圍:

​ 255 * 1023 * 63 * 512 / 1048576 = 7.837 GB ( 1M =1048576 Bytes )

根據摩爾定律,硬盤存儲的密度越來越大原有的 CHS 映射方案已經不能解決最大尋址範圍問題,所以硬盤廠家引入了邏輯區位尋址的方案即 LBA,操作系統和文件系統直接尋址一個連續地址空間中的扇區號, 不再關心柱面和磁頭之類的物理參數,將這些物理細節交由磁盤控制器。 對操作系統和文件系統這些上層軟件而言,LBA尋址的抽象仍然保證了 連續讀寫提供最快的讀寫速度 ,文件系統仍然會嘗試根據 LBA 地址優化,儘量連續讀寫從而減少尋道時間。

如今的硬盤只有巴掌大一點,那你知道一開始硬盤是什麼樣子的嘛,可能會顛覆你的認知:

沒錯,就是這麼大,一個盤片能大過你的臉!

雖然看着這麼巨無霸,但是早起硬盤同現在的機械硬盤的運行原理並無不同,只是存儲材質的進步使得單位存儲密度得到提升。

硬盤技術發展到現在,存儲密度的提升,存儲材質的提升都對存儲容量和讀寫速度產生了巨大的改變。除了傳統的機械硬盤外,最新的硬盤科技還有 SSD,固態硬盤。在固態硬盤裏面,閃存顆粒則替代了機械磁盤成爲了存儲單元。前面我們說 TF 卡的時候已經說過閃存,體積小、存儲速度快是他的優點。當然弱點就是價格貴!

目前行業內單數據盤最大能支持 32 TB,硬盤廠商 Nimbus Data 推出 ExaDrive DC100 系列固態硬盤,最大容量100TB。放在現在這也是一個巨大無比的容量,夠你把所有的島國小姐姐都放進去。

最後未被破解的存儲之謎:人腦

我想沒有什麼比人腦這種存儲介質更爲神奇的。宇宙中最超凡的東西就在你的頭顱裏,哪怕你穿梭於外太空的每一寸說不定都找不到任何比你頸脖之上這團如海綿般柔軟的東西更爲複雜、神奇的東西。

初始化的大腦就像一團黑暗,寂靜的雲,它從未有任何修飾,也未有任何感覺。從你面世的那天起,你看到了什麼,聽到了什麼,做過了什麼,都會在大腦中記憶,存儲,轉化。它不斷地給你提供搜索能力,整合能力,邏輯推理能力,預測能力,甚至是未知的能力。

光靜靜地坐着什麼都不做,你的大腦在 30 秒內處理的信息就超過了哈勃望遠鏡 30 年的工作量。一塊 1 立方毫米的皮層就能容納 2000TB 的信息。

那拿當前最先進的電腦來說如果問你這是誰,雖然這是張衛健扮演的,但你還是會說這是孫悟空。就這一點來說,電腦也無法在這麼快的時間內做出如此迅捷的反應。

這是目前做的最強大的仿真機器人,它也無法完全模仿人所有的動作機能。比如在泡腳的同時背單詞和喫東西。

比如這樣的一幅美景,如果你是在現場看風景,在你的眼裏大概有幾億像素,可能比你看過最清晰的電影還要清晰幾百倍。像這樣的畫面你每天要看幾個小時,換成二進制存儲每天最少就是TB級別的數據。而大腦能不間斷存儲幾十年,自動壓縮,去重。能隨機提取,按場景提取,按特徵提取。。。如果要用機器來實現,可能你需要祭很多個程序員耗費數千萬資金才能實現這些功能。

重點不是人腦有這些功能,而是人能很輕鬆的同時去運用這些功能。如果讓人類當前創造的機器來做同樣的功能,那估計的把 CPU 跑爆也不一定能實現。

人類神經感知元的操作是層層傳遞的,比如我們的手破了一層皮:

  • 如果你的眼睛看到了手破皮,大腦會給出反饋破皮瞭然後告訴你疼,你會產生疼的反應。
  • 如果你的眼睛沒有看到的前提下,可能是真的疼觸發了手部的神經元進而告訴大腦疼,然後你的眼睛轉向手部看到破皮了。

試想這些操作如果用人類的程序來模擬實現代碼量是巨大的,但是對於人本體來說你不會有什麼負擔,這就是你作爲人本來就應該會的技能。

最早神經科學家 David Hubel 和 Torsten Wiesel 對貓的視覺神經系統的研究證實,視覺特徵在大腦皮層的反應是通過不同的細胞達成的。其中,簡單細胞(Simple Cell)感知光照信息,複雜細胞(Complex Cell)感知運動信息。受此啓發 1980 年,日本學者福島邦彥(Kunihiko Fukushima)提出了一個網絡模型“神經認知機(Neocognitron)。用以識別手寫數字。這種網絡分成多層每層由一種神經元組成。在網絡內部兩種神經元交替出現,分別用以提取圖形信息和組合圖形信息。這兩種神經元到後來演化成了重要的卷積層(Convolution Layer)和提取層(Pooling Layer)。但是這個網絡的神經元都是由人工設計而成,其神經元也不會根據結果進行自動調整,因此也就不具有學習能力,只能限制在識別少量簡單數字的初級階段。

1994年,計算機科學家Yann LeCun在Geoffrey Hinton組內做博士後期間,結合神經認知機和反向傳播算法,提出了用於識別手寫郵政編碼的卷積神經網絡LeNet,獲得了99%的自動識別率,並且可以處理幾乎任意的手寫形式。這一算法在當時取得了巨大的成功,並被應用於美國郵政系統中。

儘管如此,深度學習並沒有因此而熱門。原因之一,就是神經網絡需要更新大量參數(僅2012年提出的AlexNet就需要65萬個神經元和6000萬個參數),需要強大的數據和算力的支持。

所以現如今的神經科學並沒有發展,發展最多的還是深度學習和機器學習方向,我們的重心從人腦的延期方向轉到目前更加切近生活實際的領域,圖像識別,醫學領域,聲音識別,自動駕駛等等。都是從基礎領域入手,一點點模仿人的行爲。相信等到材料學下一次巨大進步的時候,我們能夠實現真正的”機器人“!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章