DirectX 9高層着色語言介紹1 —— 引言、簡單例子、彙編語言和編譯對象

引言   高層着色語言(HLSL)是DirectX® 9最爲強力的新組件之一。使用這種標準的高級語言, 在進行着色時編寫者可以專注於算法而不用再去理會諸如寄存器的分配,寄存器讀端口限制, 並行處理指令等等硬件細節. 除了把開發者從硬件細節中解放出來之外,HLSL 也具有高級語言所有的全部優勢,諸如:代碼重用容易, 可讀性增強以及存在一個優化過的編譯器。本書和 ShaderX2 - Shader Tips & Tricks 這本書的許多章節就用到了HLSL編寫的着色器. 閱讀完本章引言後,你會很容易理解那些着色器並在工作中用到它們。   這一章, 我們概述語言本身的基本結構以及將HLSL集成到你的應用程序中的方法。 一個簡單的示例   在徹底描述HLSL之前, 讓我們先看一下程序中HLSL頂點着色和HLSL像素着色的實現,這個程序渲染簡單的木紋。下邊顯示的第一個HLSL着色是一個簡單的頂點着色: float4x4 view_proj_matrix; float4x4 texture_matrix0; struct VS_OUTPUT { float4 Pos : POSITION; float3 Pshade : TEXCOORD0; }; VS_OUTPUT main (float4 vPosition : POSITION) { VS_OUTPUT Out = (VS_OUTPUT) 0; // Transform position to clip space Out.Pos = mul (view_proj_matrix, vPosition); // Transform Pshade Out.Pshade = mul (texture_matrix0, vPosition); return Out; } 最開始兩行聲明瞭一對4×4的矩陣,分別命名爲view_proj_matrix和texture_matrix0。在全局矩陣之後,聲明瞭一個結構體。這個VS_OUTPUT有兩個成員:Pos和Pshade。 該着色器的main函數接受一個單精度float4類型的輸入參數並返回一個VS_OUTPUT結構體。float4類型的vPosition是着色器唯一的輸入,返回的VS_OUTPUT結構體定義了 該頂點着色器的輸出。目前不必關心在參數和結構體之後的關鍵字POSITION和TEXCOORD0。它們被稱爲語義,他們的含義將在本章後邊討論。 看一下main函數的實際代碼部分,你可以看到一個內部函數mul,它被用來把輸入的向量vPosition和矩陣view_proj_matrix相乘。在頂點着色器中這個函數最常被用來執行頂點-矩陣的乘法。就這樣,vPosition被作爲列向量,因爲它是mul的第二個參數。如果向量vPosition是mul的第一個參數,它將被作爲行向量。內部函數mul以及其他內部函數將在本章後邊更詳細的討論。在把輸入的vPosition的位置轉換換到裁減空間之後,vPosition與另一個矩陣texture_matrix0相乘以產生3D紋理座標。兩次轉換的結果寫入返回的結構體VS_OUTPUT。一個頂點着色器必須總是以最小值輸出到一個裁減空間位置。任何從頂點着色器輸出的額外值都是 通過貫穿光柵化多邊型插值得到的,也可用來輸入到像素着色器。就這樣,通過一個內插器, 三維的Pshade從頂點着色器被傳遞到像素着色器。 下邊,我們看到一個簡單的HLSL木紋像素着色器。這個像素着色器和剛纔我們描述的頂點着色器一起工作,它將被編譯成模型ps_2_0。 float4 lightWood; // xyz == Light Wood Color float4 darkWood; // xyz == Dark Wood Color float ringFreq; // ring frequency sampler PulseTrainSampler; float4 hlsl_rings (float4 Pshade : TEXCOORD0) : COLOR { float scaledDistFromZAxis = sqrt(dot(Pshade.xy, Pshade.xy)) * ringFreq; float blendFactor = tex1D (PulseTrainSampler, scaledDistFromZAxis); return lerp (darkWood, lightWood, blendFactor); } 最開始幾行在全局範圍內聲明瞭一對浮點類型的四元數組和一個浮點變量。在這些變量之後,聲明瞭一個被稱爲PulseTrainSampler的取樣器。取樣器將在章節後邊討論,目前你可以把它看成一個在顯存中的窗口,它與過濾狀態和紋理座標尋址模式發生關聯。在變量和取樣器聲明後邊是着色器代碼的主體部分。 你可以看到有一個輸入參數Pshade,它是貫穿多邊形插值得到的。它的值是由頂點着色器計算每一個頂點得出的。在像素着色器中,把着色空間Z軸上的笛卡爾距離作爲一維紋理座標來計算,衡量,使用,以存取綁定於PulseTrainSampler的紋理。tex1D()取樣函數返回的顏色標量被用作混合因子,以混合在着色器全局範圍內聲明的兩種相反顏色。像素着色器最終輸出一個混合的四元向量結果。所有的像素着色器至少必須返回一個四元 RGBA 顏色。我們將在稍後章節中討論像素着色器的附加選項。 彙編語言和編譯對象   既然我們已經瞭解了一些HLSL着色器,這裏簡要討論一下如何在代碼中涉及Direct3D,D3DX,彙編着色器模型和你的程序。DirectX 8中第一次把着色器引入了Direct3D。在那個時候,這些虛擬着色器是這樣定義的——每一個大致相當於一個特殊的3D硬件商生產的圖形處理器。每個虛擬着色器都設計有彙編語言。在DirectX 8.0和DirectX 8.1中,編寫這些着色器模型的程序(被命名爲vs_1_1以及ps_1_1直到ps_1_4)相對短小並且一般由開發者直接用合適的彙編語言編寫。如圖1左所示,憑藉D3DXAssembleShader()程序把人們可讀的彙編語言代碼傳遞給D3DX庫並返回着色器的二進制表示,該二進制表示由CreatePixelShader()或CreateVertexShader()依次傳遞給Direct3D。更多傳統彙編着色模型的細節,請參考在線和離線資源,包括Shader X 和DirectX SDK。 圖1. Use of D3DX for Assembly and Compilation in DirectX 8 and DirectX 9   如圖1右所示,在DirectX 9中的情形非常相似,憑藉D3DXCompileShader() API,程序把HLSL着色器傳遞給D3DX並返回編譯後着色器的二進制表示,該二進制表示由CreatePixelShader()或CreateVertexShader()輪流傳遞給Direct3D。生成的二進制彙編代碼是一個函數,它只取決於選擇的編譯對象,而不是什麼用戶或開發者系統上的特殊圖形設備。就是說,生成的二進制彙編程序與平臺無關, 即可在任何地方編譯或運行。事實上,Direct3D運行時本身並不知道HLSL的任何內容,除了二進制彙編着色器模型。這樣做很有好處因爲這就意味着HLSL編譯器的更新不必依賴於Direct3D運行時。事實上,在2003年夏季末本書截稿與首印期之間,Microsoft開始計劃發佈含有更新過的HLSL編譯器的DirectX SDK更新。   除了D3DX中HLSL編譯器的開發之外,DirectX 9.0也提出了另外的彙編層着色器模型以展示最新的3D圖形硬件的功能。 直接使用彙編語言爲新的模型(vs_2_0,vs_3_0,ps_2_0和ps_3_0) 做開發,程序開發人員會感到自由 ,不過我們希望絕大多數開發人員都轉移到HLSL從而專注於着色器的開發。 實際的硬件   當然,僅僅因爲你可以寫一個HLSL程序來表達一個特殊的着色算法不等於它能夠在硬件上運行。前面已經討論過,應用程序通過調用D3DX中的D3DXCompileShader() API把HLSL着色器編譯成二進制彙編程序。這個API的入口參數之一是這樣一個參數:它定義了HLSL編譯器使用哪一個彙編語言模型(或編譯對象)來表示最終着色器代碼。如果一個程序在運行時執行HLSL着色器編譯,程序會檢測Direct3D設備的性能並選擇匹配的編譯對象。如果HLSL着色器中的算法太複雜以至於不能在選擇的編譯對象上執行,編譯將會失敗。這意味着儘管HLSL大大有利於着色器的開發,卻不會把開發人員從這麼一個現實中解放出來:把遊戲封裝後給擁有各種性能圖形設備的用戶。作爲一個遊戲開發人員,你仍然得爲你的圖像處理好一系列步驟,爲更好的顯示卡編寫更好的着色器,爲較老的卡編寫更基本的。不過,有了編寫完善的HLSL,負擔可以大大減輕。 編譯失敗   如上所述, 給定的HLSL着色器編譯特殊對象的失敗說明對於編譯對象來說着色器太過複雜。這就意味着着色器需要大量的資源或是需要一些諸如動態分支(不被所選編譯對象所支持)的功能。例如,某個HLSL着色器可能被編寫用於在一個着色器內存取所給定的六重紋理貼圖。如果這個着色器被編譯成ps_1_1, 編譯將會失敗,因爲ps_1_1模型只支持四重紋理。其他編譯失敗的通常原因是超過了所選編譯對象的最大指令計數器。某個HLSL中表示的算法也許僅僅需要大量指令而使得給定的編譯對象不能被執行。   要重點注意的是所選編譯對象不會限定編寫人員所使用的HLSL語法。例如,着色器編寫人員會使用'for'循環,子程序,'if-else'等等 語句,編譯本身不支持循換,分支或'if-else'語句的對象。這種情況下,編譯器將展開循環,內聯函數調用並同時執行'if-else'語句的兩個分支(譯者注:即if與else後的語句全都執行),根據'if-else'語句中所使用的原始值選擇合適的結果。當然, 如果最後所得到的着色器(程序)太長或相反超出了編譯對象的資源,編譯將失敗。 命令行編譯器: FXC   許多開發人員選擇在着色器被封裝之前把它從HLSL編譯成二進制彙編語言,而不是在正在使用D3DX的客戶機器上當程序載入時或首次運行時編譯HLSL着色器。這保證了HLSL源代碼不被窺視,同時也確保所有其程序能夠永久運行的着色器已經通過其內部質量確認流程。在DirectX 9.0 SDK中提供了一個方便的命令行編譯程序fxc允許開發人員脫機編譯着色器。該程序有許多方便的選項,你不但可以以命令行方式編譯你的着色器,也能產生指定編譯對象的反彙編代碼。如果你想優化你的着色器或只是想更詳細的瞭解虛擬着色器的性能,在開發期間研究輸出的反彙編代碼是非常有用的。表1列出了這些命令行選項。 表1. FXC 命令行選項   -T target編譯對象 (默認: vs_2_0) -E name入口點 name (默認: main) -Od禁止優化 -Vd禁止確認 -Zi允許調試信息 -Zpr按照行順序挑選矩陣 -Zpc按照列順序挑選矩陣 -Fo file輸出目標文件 -Fc file輸出所生成代碼的列表 -Fh file輸出含有生成代碼的頭部 -D id=text定義宏 -nologo沒有版權信息   既然你瞭解了用於着色器開發的HLSL編譯器的內容,我們就可以討論實際的語言結構了。 在我們繼續下面內容的時候,頭腦裏要一直保留着編譯對象的概念以及潛在的彙編着色器模型的不同性能,這很重要。 原文:http://msdn.microsoft.com/library/en-us/dnhlsl/html/shaderx2_introductionto.asp
發佈了35 篇原創文章 · 獲贊 0 · 訪問量 9萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章