GPGPU基礎(二):GPGPU需要用到的OpenGL概念

在計算機圖形學中,紋理映射是實現複雜表面效果的高效方法,即以較小的計算量就可以實現較爲逼真的模芯效果。在GPGPU中,紋理映射也是一個至關重要的概念。由圖形API實現經典GPGPU的原理可以總結爲:用紋理映射實現的科學計算(computation by texturing)。

1.紋理映射的概念

在渲染對象過程中,最簡單的方式是給各個對象表面顯式地塗上各種顏色。但這樣顏色會非常單一。同時,讓設計者手動地給每個像素定義不同顏色顯然也不可能。於是,紋理映射就成爲一個生成較高質量三維表面地高效地這種方案。

紋理映射的原理:首先,由應用程序生成頂點組成的三維模型。然後這些頂點被網格化或三角化,變成若干相連的平面。這是,可以選擇使用一些預定好的二維位圖,在定義好模型後,將這些位圖貼在對象表面。這個過程稱爲紋理映射。映射,也就指的是通過空間中的頂點座標與紋理座標之間的函數關係,用紋理圖爲頂點賦值。

2.幾何圖元

幾何圖元是組成人們熟知地三維模型地基本元素,如點、直線、三角形等,通常由一個頂點列表組成。爲了標誌頂點列表地起始和終止位置,需要使用函數glBegin()和glEnd()。glBegin()地形參是一個幾何圖元對象地名稱。

glBegin(GL_POLYGON);        //GL_POLYGON 是多邊形圖元地標識。這裏表示一個邊長爲2的二維正方形
glVertex2f(-1.-, -1.0);
glVertex2f(-1.0, 1.0);
glVertex2f(1.0, 1.0);
glVertext2f(1.0, -1.0);
glEnd();

常用OpenGL幾何圖元類型

幾何圖元類型註釋
GL_POINTS單個頂點集    
GL_LINES 多組雙頂點線段
GL_POLYGON單個簡單填充凸多邊形
GL_TRIANGLES多組獨立填充三角形
GL_QUADS多組獨立填充四邊形
GL_LINE_STRIP不閉合折線
GL_LINE_LOOP閉合折線
GL_TRIANGLE_STRIP線性連續填充三角形串
GL_TRIANGLE_FAN扇形連續填充三角形串
GL_QUAD_STRIP連續填充四邊形串

同時如果我們給同一個圖元不同頂點指定了不同顏色,OpenGL默認對策是對圖元進行平滑着色,即根據頂點顏色對其他部分線性插值。紋理座標也是每個頂點的屬性,可以使用函數glTexCoor()指定。

幾何圖元可以分爲填充圖元和非填充圖元兩類。直線是非填充圖元,其不具備“內部”。二維多邊形是一種填充圖元,其“內部”可以定義。OpenGL中,填充圖元有三種方式,即頂點方式、邊線方式和填充方式。頂點方式是用頂點組成的點集來繪製;邊線方式是僅繪製多邊形的邊線,其“內部”沒有定義。填充方式是對多邊形進行填充,此時邊線在填充時也是內部的一部分。

3.位圖與流水線

位圖是另一種基本圖元,也稱爲離散圖元。它是一個由向量組成的矩陣。向量的元素數就是位圖的通道數,比如彩色位圖通常是RGB,或者加入透明通道爲RGBA。

與幾何圖元一樣,位圖也是圖形應用程序可以生成的數據形式。同樣會進入圖像流水線。但是,位圖已經是可以存儲在幀緩存裏的二維離散圖元,它不用流經頂點處理單元,而是從另一條並行的流水線流入,在片段處理階段和流過頂點處理單元的數據匯合。


OpenGL對像素的讀寫,具體有三種操作:

1.把像素塊從幀緩存讀到住存儲器中,對應OpenGL函數是glReadPixels()

2.把像素塊從主存儲器寫入光柵化器中,對應OpenGL函數是glDrawPixels()

3.把像素塊從幀緩存複製到光柵化器中,對應OpenGL函數是glCopyPixels()

基本流程如圖:


注意,像素塊在OpenGL中的存儲方式可能和在主存儲器中的不同,如像素中各分量的排列順序。如果想要將像素塊從幀緩存的一部分轉移到另一部分,就需要先讀出像素,然後在另一處寫入。可以使用glReadPixels和glDrawPixels,但頻繁在主機與設備間傳輸數據過於低效,推薦使用glCopyPixels。

4.紋理圖

可以將紋理圖看成一張顏色查找表,根據每個頂點的紋理座標可以從紋理圖上查到該頂點的顏色。通常紋理圖和幀緩存中的位圖一樣,都是由離散的像素構成。爲了區分,我們將紋理圖上的一個像素稱爲紋理元。事實上,由於紋理座標都是經過插值和採樣計算得到的,所以在紋理圖中查找顏色並不是連三的。而是根據相鄰紋理元的顏色插值或最近鄰得到的。因此可以將紋理圖看成連續的數組,它的二維座標都是在實數域內得到定義的。

OpenGL中默認的紋理圖都是邊長爲1的正方形。這樣避免了使用明確座標,用戶就可以在不必知道紋理圖尺寸的情況下使用紋理。但對GPGPU編程卻產生了不便。如,需要知道一個長度爲512的數組的第100個元素,用C語言查找只需要使用下標99即可,但OpenGL需要使用100.0/512.0=0.1953125.

OpenGL中設置紋理圖的函數爲glTexImage2D(),一個指定4個分量、每個分量爲1個字節的二維紋理圖:

#define nImageWidth 64
#define nImageHeight 64
static Glubyte ubImage[nImageHeight][nImageWidth][4];
//填充數組
glEnable(GL_TEXTURE_2D);
glTexImage2D(GL_TEXTURE_2D,0,GL_RGBA,nImageWidth,nImageHeigght,0,GL_RGBA,GL_UNSIGNED_BYTE, ubImage);

當不需要對整幅紋理圖進行操作時,可以使用函數glTexSubImage2D()來定義一幅子紋理圖。

當使用glTexImage2D時,OpenGL就會在顯卡上分配一塊紋理緩存,把紋理圖從內存轉移到紋理緩存中。如果已經調用過glTexImage2D,更新紋理圖最好使用glTexSubImage2D,這樣就不用在顯卡上重新分配存儲空間,如果改動較小也不用將整個紋理圖傳輸到顯卡上,以提高效率。這也是GPGPU的典型做法。

5.紋理座標

將紋理圖映射到三維表面是通過爲每個頂點定義紋理座標實現的。與頂點座標一樣,是一個四維向量[s,t,r,q].除第一個分量外(使用時,用戶至少需要使用一維紋理座標,因而s一定由用戶設定),其他分量的默認值爲:t=0,r=0,q=1。設置紋理座標函數爲glTexCoord()。

6.紋理參數

在紋理映射前,還需要對一些參數進行設置。

1.越界取值:當指定的紋理座標值大於實際的取值範圍時,即超出紋理圖的邊界時,GL_TEXTURE_WRAP系列參數用來指定這種情況下,OpenGL採取的措施。總的來說,OpenGL一般有兩種策略。一種是用鉗位算法(clamp)將座標值限制在某個區間內,即大於該範圍的取值就鉗定在區間上限,小於時就鉗定在區間下限。另一種時在邊界以外重複邊界內的取值。


2.放大/縮小紋理圖


7.映射參數

此外,還需要確定映射過程中紋理圖與表面的相互作用,即處理與表面已有顏色的相互關係。通過glTexEnv進行。

8.紋理對象

如果用戶同時使用多塊紋理,則頻繁使用glTexImage來加載過於低效。OpenGL提供了紋理對象來管理紋理,這樣多塊紋理可以在紋理緩存中並存。紋理緩存不足時,OpenGL會按照優先級管理紋理,使加載紋理次數儘可能少。

首先,需要調用glGenTextures()來建立一個紋理對象。其會返回n個有效的整數紋理標識符。這些整數被保存在textureNames數組中。這些返回的紋理表示符都是目前OpenGL未被佔用的,不一定是連續的整數。0是OpenGL預留的紋理標識符,不會被分配。分配到的紋理對象的標識符,只表示該標識符有效,而紋理暫時還是無效的。使用前,用戶需要將它與某種類型的紋理綁定起來glBindTexture()。同時相關程序結束後,可以使用glDeleteTextures()刪除。

9.紋理單元

紋理單元與多重紋理映射息息相關。在圖形任務中,有時需要將多塊紋理映射到同一表面,映射的結果是多重紋理融合的效果。OpenGl使用紋理單元來管理多重紋理映射中使用的不同紋理圖。一個紋理單元就是一個獨立的紋理,除了紋理圖本身外,它還保存了紋理座標和紋理參數等一切使用該紋理需要的信息。同一紋理圖也可以被多個紋理單元使用。

多重紋理映射時,可以使用OpenGL常量GL_TEXTUREi來選擇使用哪個紋理單元,其中i是0到31的整數。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章