無組件上傳的原理的研究!

出處:寶玉BLOG

一、無組件上傳的原理
我還是一點一點用一個實例來說明的吧,客戶端HTML如下。要瀏覽上傳附件,我們通過<input type="file">元素,但是一定要注意必須設置form的enctype屬性爲"multipart/form-data":


<form method="post" action="upload.asp" enctype="multipart/form-data">
 <label>
  <input type="file" name="file1" />
 </label>
 <br />
 <input type="text" name="filename" value="default filename"/>
 <br />
 <input type="submit" value="Submit"/>
 <input type="reset" value="Reset"/>
</form>


在後臺asp程序中,以前獲取表單提交的ASCII 數據,非常的容易。但是如果需要獲取上傳的文件,就必須使用Request對象的BinaryRead方法來讀取。BinaryRead方法是對當前輸入流進行指定字節數的二進制讀取,有點需要注意的是,一旦使用BinaryRead 方法後,再也不能使用Request.Form 或 Request.QueryString 集合了。結合Request對象的TotalBytes屬性,可以將所有表單提交的數據全部變成二進制,不過這些數據都是經過編碼的。首先讓我們來看看這些數據是如何編碼的,有無什麼規律可循,編段代碼,在代碼中我們將BinaryRead讀取的二進制轉化爲文本,輸出出來,在後臺的upload.asp中(注意該示例不要上傳大文件,否則可能會造成瀏覽器死掉):
<%
Dim biData, PostData
Size = Request.TotalBytes
biData = Request.BinaryRead(Size)
PostData = BinaryToString(biData,Size)
Response.Write "<pre>" & PostData & "</pre>"  '使用pre,原樣輸出格式
' 藉助RecordSet將二進制流轉化成文本
Function BinaryToString(biData,Size)
 Const adLongVarChar = 201
 Set RS = CreateObject("ADODB.Recordset")
 RS.Fields.Append "mBinary", adLongVarChar, Size
 RS.Open
 RS.AddNew
  RS("mBinary").AppendChunk(biData)
 RS.Update
 BinaryToString = RS("mBinary").Value
 RS.Close
End Function
%>


簡單起見,上傳一個最簡單的文本文件(G:/homepage.txt,內容爲"寶玉:http://www.webuc.net")來試驗一下,文本框filename中保留默認值"default filename",提交看看輸出結果:

-----------------------------7d429871607fe
Content-Disposition: form-data; name="file1"; filename="G:/homepage.txt"
Content-Type: text/plain
寶玉:http://www.webuc.net
-----------------------------7d429871607fe
Content-Disposition: form-data; name="filename"
default filename
-----------------------------7d429871607fe--

可以看出來對於表單中的項目,是用過"-----------------------------7d429871607fe"這樣的邊界來分隔成一塊一塊的,每一塊的開始都有一些描述信息,例如:Content-Disposition: form-data; name="filename",在描述信息中,通過name="filename"可以知道表單項的name。如果有filename="G:/homepage.txt"這樣的內容,說明是一個上傳的文件,如果是一個上傳的文件,那麼描述信息會多一行Content-Type: text/plain來描述文件的Content-Type。描述信息和主體信息之間是通過換行來分隔的。

嗯,基本上清晰了,根據這個規律我們就知道該怎麼來分離數據,再對分離的數據進行處理了,不過差點忽略一個問題,就是邊界值(上例中的"-----------------------------7d429871607fe")是怎麼知道的?每次上傳這個邊界值是不一樣的,還好還好asp中可以通過Request.ServerVariables( "HTTP_CONTENT_TYPE")來獲之,例如上例中HTTP_CONTENT_TYPE內容爲:"multipart/form-data; boundary=---------------------------7d429871607fe",有了這個,我們不僅可以判斷客戶端的form中有無使用enctype="multipart/form-data"(如果沒有使用,那麼下面就沒必要執行啦),還可以獲取邊界值boundary=---------------------------7d429871607fe。(注意:這裏獲取的邊界值比上面的邊界值開頭要少"--",最好補充上。)

至於如何分析數據的過程我就不多贅述了,無非就是藉助InStr,Mid等這樣的函數來分離出來我們想要的數據。

二、分塊上傳,記錄進度
要實時反映進度條,實質就是要實時知道當前服務器獲取了多少數據?再回想一下我們實現上傳的過程,我們是通過Request.BinaryRead(Request.TotalBytes)來實現的,在Request的過程中我們無法得知當前服務器獲取了多少數據。所以只能通過變通的方法了,如果我們可以將獲取的數據分成一塊一塊的,然後根據已經上傳的塊數我們就可以算出來當前上傳了多大了!也就是說,如果我1K爲1塊,那麼上傳1MB的輸入流就分成1024塊來獲取,例如我當前已經獲取了100塊,那麼就表明當前上傳了100K。當我提出分塊的時候很多人覺得不可思議,因爲他們都忽略BinaryRead方法不僅是可以讀取指定大小,而且可以連續讀取的。

寫個例子來驗證一下分塊讀取的完整性,在剛纔的例子基礎上(注意該示例不要上傳大文件,否則可能會造成瀏覽器死掉):

<%
Dim biData, PostData, TotalBytes, ChunkBytes
ChunkBytes = 1 * 1024     ' 分塊大小爲1K
TotalBytes = Request.TotalBytes  ' 總大小
PostData = ""         ' 轉化爲文本類型後的數據
ReadedBytes = 0        ' 初始化爲0
' 分塊讀取
Do While ReadedBytes < TotalBytes
 biData = Request.BinaryRead(ChunkBytes)  ' 當前塊
 PostData = PostData & BinaryToString(biData,ChunkBytes) ' 將當前塊轉化爲文本並拼接
 ReadedBytes = ReadedBytes + ChunkBytes ' 記錄已讀大小
 If ReadedBytes > TotalBytes Then ReadedBytes = TotalBytes
Loop
Response.Write "<pre>" & PostData & "</pre>"  ' 使用pre,原樣輸出格式
' 將二進制流轉化成文本
Function BinaryToString(biData,Size)
 Const adLongVarChar = 201
 Set RS = CreateObject("ADODB.Recordset")
 RS.Fields.Append "mBinary", adLongVarChar, Size
 RS.Open
 RS.AddNew
  RS("mBinary").AppendChunk(biData)
 RS.Update
 BinaryToString = RS("mBinary").Value
 RS.Close
End Function
%>

試驗一下上傳剛纔的文本文件,輸出結果證明這樣分塊讀取的內容是完整的,並且在While循環中,我們可以在每次循環時將當前狀態記錄到Application中,然後我們就可以通過訪問該Application動態獲取上傳進度條。

另:上例中是通過字符串拼接的,如果是要拼接二進制數據,可以通過ADODB.Stream對象的Write方法,示例代碼如下:

Set bSourceData = createobject("ADODB.Stream")
bSourceData.Open
bSourceData.Type = 1 'Binary
Do While ReadedBytes < TotalBytes
 biData = Request.BinaryRead(ChunkBytes)
 bSourceData.Write biData ' 直接使用write方法將當前文件流寫入bSourceData中
 ReadedBytes = ReadedBytes + ChunkBytes
 If ReadedBytes > TotalBytes Then ReadedBytes = TotalBytes
 Application("ReadedBytes") = ReadedBytes
Loop


三、保存上傳的文件
通過Request.BinaryRead獲取提交數據,分離出上傳文件後,根據數據類型的不同,保存方式也不同:

對於二進制數據,可以直接通過ADODB.Stream對象的SaveToFile方法,將二進制流保存成爲文件。
對於文本數據,可以通過TextStream對象的Write方法,將文本數據保存到文件中。
對於文本數據和二進制數據,是可以方便的相互轉換的,對於上傳小文件來說,兩者基本上沒什麼差別。但是兩種方式保存時還是有一些差別的,對於ADODB.Stream對象,必須將所有數據全部裝載完纔可以保存成文件,所以使用這種方式如果上傳大文件將很佔用內存,而對於TextStream對象,可以在文件創建好後,一次Write一部分,分多次Write,這樣的好處是不會佔用服務器內存空間,結合上面分析的分塊獲取數據原理,我們可以每獲取一塊上傳數據就將之Write到文件中。我曾做過試驗,同樣本機上傳一個200多MB的文件,使用第一種方式內存一直在漲,到最後直接提示計算機虛擬內存不足,最可恨是即使進度條表示文件已經上傳完,但是最終文件還是沒有保存上。而使用後一種方法,上傳過程中內存基本上無什麼變化。

四、未解決的難題
我在博客園上看到Bestcomy描述他的Asp.Net上傳組件是可以和Sever.SetTimeOut無關的,而在Asp中我是沒能做到,對於上傳大文件,就只有將Server.SetTimeOut設置爲一個很大的值纔可以。不知道有沒有比較好的解決方法。

如果我們在保存文件時,使用TextStream對象的Write方法,那麼如果用戶上傳時中斷了文件傳輸,已經上傳的那部分文件還是在的,如果可以斷點續傳就好了。關鍵問題是Request.BinaryRead方法雖然可以分塊讀取,但是卻不能跳過某一段讀取!

五、結束語
原理基本上是說清楚了,但是實際代碼要比這複雜的多,要考慮很多問題,最麻煩在分析數據那部分,對於每一塊獲取的數據,要分析是不是屬於描述信息,是表單項目還是上傳的文件,文件是否已經上傳結束……

相信根據上面的描述,您也可以開發出您自己功能強大的無組件上傳組件。我想更多的人關心的只是代碼,而不會自己動手去寫的,也許沒有時間,也許水平還不夠,更多的只是已經成爲了一種習慣……我在CSDN上見過太多技術八股文——一段說明,然後全是代碼。授人以魚不若授人以漁,給你一個代碼,也許你並不會去思考爲什麼,直接拿去用,當下次碰到類似的問題的時候,還是不知道爲什麼,希望此文能讓更多人學到點什麼,最重要是“悟”到點什麼!

 
發佈了18 篇原創文章 · 獲贊 0 · 訪問量 5萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章