GPGPU基礎（二）：GPGPU需要用到的OpenGL概念

在計算機圖形學中，紋理映射是實現複雜表面效果的高效方法，即以較小的計算量就可以實現較爲逼真的模芯效果。在GPGPU中，紋理映射也是一個至關重要的概念。由圖形API實現經典GPGPU的原理可以總結爲：用紋理映射實現的科學計算（computation by texturing）。

1.紋理映射的概念

在渲染對象過程中，最簡單的方式是給各個對象表面顯式地塗上各種顏色。但這樣顏色會非常單一。同時，讓設計者手動地給每個像素定義不同顏色顯然也不可能。於是，紋理映射就成爲一個生成較高質量三維表面地高效地這種方案。

紋理映射的原理：首先，由應用程序生成頂點組成的三維模型。然後這些頂點被網格化或三角化，變成若干相連的平面。這是，可以選擇使用一些預定好的二維位圖，在定義好模型後，將這些位圖貼在對象表面。這個過程稱爲紋理映射。映射，也就指的是通過空間中的頂點座標與紋理座標之間的函數關係，用紋理圖爲頂點賦值。

2.幾何圖元

幾何圖元是組成人們熟知地三維模型地基本元素，如點、直線、三角形等，通常由一個頂點列表組成。爲了標誌頂點列表地起始和終止位置，需要使用函數glBegin()和glEnd()。glBegin()地形參是一個幾何圖元對象地名稱。

glBegin(GL_POLYGON);        //GL_POLYGON 是多邊形圖元地標識。這裏表示一個邊長爲2的二維正方形
glVertex2f(-1.-, -1.0);
glVertex2f(-1.0, 1.0);
glVertex2f(1.0, 1.0);
glVertext2f(1.0, -1.0);
glEnd();

常用OpenGL幾何圖元類型

幾何圖元類型	註釋
GL_POINTS	單個頂點集
GL_LINES	多組雙頂點線段
GL_POLYGON	單個簡單填充凸多邊形
GL_TRIANGLES	多組獨立填充三角形
GL_QUADS	多組獨立填充四邊形
GL_LINE_STRIP	不閉合折線
GL_LINE_LOOP	閉合折線
GL_TRIANGLE_STRIP	線性連續填充三角形串
GL_TRIANGLE_FAN	扇形連續填充三角形串
GL_QUAD_STRIP	連續填充四邊形串

同時如果我們給同一個圖元不同頂點指定了不同顏色，OpenGL默認對策是對圖元進行平滑着色，即根據頂點顏色對其他部分線性插值。紋理座標也是每個頂點的屬性，可以使用函數glTexCoor()指定。

幾何圖元可以分爲填充圖元和非填充圖元兩類。直線是非填充圖元，其不具備“內部”。二維多邊形是一種填充圖元，其“內部”可以定義。OpenGL中，填充圖元有三種方式，即頂點方式、邊線方式和填充方式。頂點方式是用頂點組成的點集來繪製；邊線方式是僅繪製多邊形的邊線，其“內部”沒有定義。填充方式是對多邊形進行填充，此時邊線在填充時也是內部的一部分。

3.位圖與流水線

位圖是另一種基本圖元，也稱爲離散圖元。它是一個由向量組成的矩陣。向量的元素數就是位圖的通道數，比如彩色位圖通常是RGB，或者加入透明通道爲RGBA。

與幾何圖元一樣，位圖也是圖形應用程序可以生成的數據形式。同樣會進入圖像流水線。但是，位圖已經是可以存儲在幀緩存裏的二維離散圖元，它不用流經頂點處理單元，而是從另一條並行的流水線流入，在片段處理階段和流過頂點處理單元的數據匯合。

OpenGL對像素的讀寫，具體有三種操作：

1.把像素塊從幀緩存讀到住存儲器中，對應OpenGL函數是glReadPixels()

2.把像素塊從主存儲器寫入光柵化器中，對應OpenGL函數是glDrawPixels()

3.把像素塊從幀緩存複製到光柵化器中，對應OpenGL函數是glCopyPixels()

基本流程如圖：

注意，像素塊在OpenGL中的存儲方式可能和在主存儲器中的不同，如像素中各分量的排列順序。如果想要將像素塊從幀緩存的一部分轉移到另一部分，就需要先讀出像素，然後在另一處寫入。可以使用glReadPixels和glDrawPixels，但頻繁在主機與設備間傳輸數據過於低效，推薦使用glCopyPixels。

4.紋理圖

可以將紋理圖看成一張顏色查找表，根據每個頂點的紋理座標可以從紋理圖上查到該頂點的顏色。通常紋理圖和幀緩存中的位圖一樣，都是由離散的像素構成。爲了區分，我們將紋理圖上的一個像素稱爲紋理元。事實上，由於紋理座標都是經過插值和採樣計算得到的，所以在紋理圖中查找顏色並不是連三的。而是根據相鄰紋理元的顏色插值或最近鄰得到的。因此可以將紋理圖看成連續的數組，它的二維座標都是在實數域內得到定義的。

OpenGL中默認的紋理圖都是邊長爲1的正方形。這樣避免了使用明確座標，用戶就可以在不必知道紋理圖尺寸的情況下使用紋理。但對GPGPU編程卻產生了不便。如，需要知道一個長度爲512的數組的第100個元素，用C語言查找只需要使用下標99即可，但OpenGL需要使用100.0/512.0=0.1953125.

OpenGL中設置紋理圖的函數爲glTexImage2D()，一個指定4個分量、每個分量爲1個字節的二維紋理圖：

#define nImageWidth 64
#define nImageHeight 64
static Glubyte ubImage[nImageHeight][nImageWidth][4];
//填充數組
glEnable(GL_TEXTURE_2D);
glTexImage2D(GL_TEXTURE_2D,0,GL_RGBA,nImageWidth,nImageHeigght,0,GL_RGBA,GL_UNSIGNED_BYTE, ubImage);

當不需要對整幅紋理圖進行操作時，可以使用函數glTexSubImage2D()來定義一幅子紋理圖。

當使用glTexImage2D時，OpenGL就會在顯卡上分配一塊紋理緩存，把紋理圖從內存轉移到紋理緩存中。如果已經調用過glTexImage2D，更新紋理圖最好使用glTexSubImage2D，這樣就不用在顯卡上重新分配存儲空間，如果改動較小也不用將整個紋理圖傳輸到顯卡上，以提高效率。這也是GPGPU的典型做法。

5.紋理座標

將紋理圖映射到三維表面是通過爲每個頂點定義紋理座標實現的。與頂點座標一樣，是一個四維向量[s,t,r,q].除第一個分量外（使用時，用戶至少需要使用一維紋理座標，因而s一定由用戶設定），其他分量的默認值爲：t=0,r=0,q=1。設置紋理座標函數爲glTexCoord()。

6.紋理參數

在紋理映射前，還需要對一些參數進行設置。

1.越界取值：當指定的紋理座標值大於實際的取值範圍時，即超出紋理圖的邊界時，GL_TEXTURE_WRAP系列參數用來指定這種情況下，OpenGL採取的措施。總的來說，OpenGL一般有兩種策略。一種是用鉗位算法(clamp)將座標值限制在某個區間內，即大於該範圍的取值就鉗定在區間上限，小於時就鉗定在區間下限。另一種時在邊界以外重複邊界內的取值。

2.放大/縮小紋理圖

7.映射參數

此外，還需要確定映射過程中紋理圖與表面的相互作用，即處理與表面已有顏色的相互關係。通過glTexEnv進行。

8.紋理對象

如果用戶同時使用多塊紋理，則頻繁使用glTexImage來加載過於低效。OpenGL提供了紋理對象來管理紋理，這樣多塊紋理可以在紋理緩存中並存。紋理緩存不足時，OpenGL會按照優先級管理紋理，使加載紋理次數儘可能少。

首先，需要調用glGenTextures()來建立一個紋理對象。其會返回n個有效的整數紋理標識符。這些整數被保存在textureNames數組中。這些返回的紋理表示符都是目前OpenGL未被佔用的，不一定是連續的整數。0是OpenGL預留的紋理標識符，不會被分配。分配到的紋理對象的標識符，只表示該標識符有效，而紋理暫時還是無效的。使用前，用戶需要將它與某種類型的紋理綁定起來glBindTexture()。同時相關程序結束後，可以使用glDeleteTextures()刪除。

9.紋理單元

紋理單元與多重紋理映射息息相關。在圖形任務中，有時需要將多塊紋理映射到同一表面，映射的結果是多重紋理融合的效果。OpenGl使用紋理單元來管理多重紋理映射中使用的不同紋理圖。一個紋理單元就是一個獨立的紋理，除了紋理圖本身外，它還保存了紋理座標和紋理參數等一切使用該紋理需要的信息。同一紋理圖也可以被多個紋理單元使用。

多重紋理映射時，可以使用OpenGL常量GL_TEXTUREi來選擇使用哪個紋理單元，其中i是0到31的整數。

GPGPU基礎（二）：GPGPU需要用到的OpenGL概念

1.紋理映射的概念

2.幾何圖元

3.位圖與流水線

4.紋理圖

5.紋理座標

6.紋理參數

7.映射參數

8.紋理對象

9.紋理單元

美團一面：項目中有 10000 個 if else 如何優化？想了半天，被問懵了！

京東面試：如何進行JVM調優？

Python 將PowerPoint (PPT/PPTX) 轉爲HTML

SQL優化-20231016

在Android端實現基於OPENGL ES 的深度學習前向傳播框架

Cython Tutorial 基本用法

基於attention機制實現 CRNN OCR文字識別

opencv 加載tensorflow pb模型

window下編譯opencv python3

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結