John carmark在idtech6 ,光線追蹤,物理的談話 第二部分

原文地址 https://www.pcper.com/reviews/Graphics-Cards/John-Carmack-id-Tech-6-Ray-Tracing-Consoles-Physics-and-more/Multi-GPU-graphi

多GPU圖形和結論

PCPER:您對多GPU系統目前的情況有何看法?你認爲這是一個真正的好處,你認爲開發人員能夠輕鬆地利用這些硬件配置嗎?

CARMACK:從開發人員的角度來看,令人不安的事實是,控制檯功能真的主宰了今天的發展決策。如果你看現在的標題和他們在控制檯上的做法,你知道,高端行動基於GPU的東西,控制檯是如此主要的因素,很難設置,所以你可以做很多事情來利用真正的極端的高端桌面設置。傳統上你會得到更多的分辨率,一個控制檯遊戲可能設計爲720p,高端的PC你可以運行1080p甚至更高的分辨率,這是一件明顯的事情。你啓動了分辨率。當您有1GB的視頻內存可用時,您關閉壓縮。通常情況下,您可以從30 Hz的控制檯遊戲到60 Hz的PC遊戲。 

Doom 3 / id Tech 4,2004 - 由MobyGames.com提供

PCPER:你認爲NVIDIA和AMD是否太依賴於多GPU技術,而不是推出真正的下一代GPU?多GPU系統是否仍然可以選擇?

CARMACK:我一直是這些高端精品系統的大支持者 - 從3dfx的早期開始,我一直以爲這是一個真正的羽毛,他們可以付出更多的錢,擁有更大的系統,有它的雙倍,只是走得更快。我認爲這是一個非常好的選擇,肯定像NVIDIA和AMD這樣的公司正在投入所有可能的資源來製造更新的下一代顯卡。但是,爲了能夠擁有這樣的能力,只需要付出更多的錢,並從當前一代獲得更多的表現是非常有用的事情。遊戲擁有這些一千美元的顯卡是否有意義,這是非常有爭議的,但它對開發人員來說真的很好。 爲了能夠瞄準三年後即將出現的高端產品,今天能夠支付更多的錢,增加2倍的功率。當然,整個高端仿真業務從可擴展圖形商品化中受益匪淺。

 

儘管在這方面很清楚,幾年前,當一切都以一種相當簡單的算法方法進行,就像您剛剛渲染到幀緩衝區的圖形引擎一樣,它們很容易前進,並將該幀緩衝區塊任意數量的片斷。但是,現在圖形渲染和GPU之間的耦合要更加緊密,那裏有各種各樣的反饋,渲染到子緩衝區,來回移動,獲得依賴的條件查詢結果,這使得它變得更難這樣的問題。但這是從一開始就是多處理的全部故事; 我們正在與多個CPU進行戰鬥。這是提高計算性能的主要問題。

Quake 4 / id Tech 4,2005 - 由MobyGames.com提供  

 

這是我很大的收穫消息,很多人關於即將到來的一代通用計算GPU; 很多人似乎不太清楚頂點片段光柵化方法如何計算機圖形無疑是最成功的多處理解決方案。如果您回顧了40多年的研究,以及人們在嘗試使用多個處理器來解決問題的過程中所做的工作,事實上,我們可以使用頂點片段模型輕鬆實現這一點,這實際上證明了它的價值。很多人只是認爲“哦,當然我希望有更多的靈活性,我希望有多個CPU可以做所有這些不同的事情”,還有很多人不太瞭解那些痛苦會像我們一樣走過去 這當然正在進行,因爲軟件試圖移動的東西,而不是“只是你的應用程序的線程”。任何人說這是基本上是一個白癡,不讚賞這些問題。所有這一切都有深刻的一面,從一開始就一直是象牙塔研究項目,這絕對沒有解決。 

 

PCPER:NVIDIA和AMD驅動團隊必須打入遊戲才能使其在多GPU系統上獲得最佳效果,而且今天比以往更難。你認爲開發人員對控制檯市場的依賴,這是今天單GPU的一個原因呢?

CARMACK:這可能使PC卡傢伙變得更加困難,因爲開發人員隨着我們在控制檯上的低級訪問而變得越來越複雜,渲染引擎變得越來越難,在後臺自動分割成多個GPU。我們在單GPU上做更復雜的事情 - 有更多的數據傳輸來回傳遞,更新的狀態必須被複制到多個GPU,屏幕的相關部分做不同的事情。它仍然是可能的,但它是一種毛茸茸的工作,我絕對不會羨慕那些司機作家或他們的任務。

 

PCPER:來自AMD和NVIDIA的3-4個GPU系統的任何想法?矯枉過正?

CARMACK:對於許多應用程序,對於那些僅僅處理像笨幀緩衝區的應用程序,他們真的會提前4倍,特別是如果你只是想在那裏的4倍的分辨率,這很簡單。毫無疑問,如果您以一定的分辨率拍攝要以幀速率播放的遊戲,則4核 GPU解決方案通常能夠前進並渲染4x像素,或者非常接近線性縮放。 

Rage / id Tech 5,2007 - 由FreakyGaming.com提供

 

但是,不可能做的是以給定的名義分辨率運行20 FPS的遊戲,然後使該遊戲運行60 FPS。您可能會遇到不是原始GPU吞吐量的東西,通常是遊戲中的CPU吞吐量。

 

PCPER:您已經選擇了AGEIA嘗試使用硬件物理插件卡的單詞。現在,他們已經離開現場,由NVIDIA購買,你對過去的情況有什麼想法?

CARMACK:這是從一開始就是一個愚蠢計劃的事情之一,我真的希望NVIDIA沒有付出太多的代價,因爲我發現整個事情是虛僞的。許多人從一開始就表示,他們的整個業務戰略是被收購的,因爲對於每個人來說,附加物理卡的市場不是那麼明顯。市場證明不是在那裏。關於建立一家公司,基本上是向消費者說謊的事情,這是一個好主意,爲了從一家大公司出錢出售,我看到整個事情都非常令人厭惡。很明顯,我們知道AGEIA開始的時候,幾代人將在GPU上擁有這些通用的計算資源。而現在我們現在就是可以實現物理學的CUDA,你現在不能很好地混合搭配,這樣重的系統會改變,但將來的版本會變得更好。最終,您將使用一組可以運行通用數據並行的資源與非常高效的光柵化工作的資源。至於PhysX硬件,雖然他們會有一點談論他們的架構如何在某種程度上更適合物理處理,而且它可能會更適合,因爲它從來沒有告訴任何人如何或爲什麼。最終,您將使用一組可以運行通用數據並行的資源與非常高效的光柵化工作的資源。至於PhysX硬件,雖然他們會有一點談論他們的架構如何在某種程度上更適合物理處理,而且它可能會更適合,因爲它從來沒有告訴任何人如何或爲什麼。最終,您將使用一組可以運行通用數據並行的資源與非常高效的光柵化工作的資源。至於PhysX硬件,雖然他們會有一點談論他們的架構如何在某種程度上更適合物理處理,而且它可能會更適合,因爲它從來沒有告訴任何人如何或爲什麼。

 

PCPER:你認爲將物理學移動到GPU是一個好處嗎?

CARMACK:現在,要卸載這樣的任務,你必須能夠繼續前進,把它們粘在一個相當深入的管道中,所以它不符合人們現在在他們的遊戲中做物理建模的方式。但是,隨着人們選擇改變架構,在物理碰撞檢測的報告中允許一幀延遲,或者我們得到更精細的粒度並行化,你沒有這麼長的延遲時間,你可以強制立即模式調用對GPU操作,然後我們開始使用這些方式,我們執行SSE指令或我們當前的代碼庫中的某些東西。那麼,是的,我們絕對會用這樣的計算資源或碰撞檢測物理學。 

 

PCPER:NVIDIA有Novodex,英特爾有Havok - 會在市場上造成碎片嗎?你認爲微軟將它們組合成物理API,就像DirectX一樣嗎?

CARMACK:看到播放效果會很有趣,因爲當我在微軟的圖形API方面遇到一些問題時,我非常瞭解,我真的認爲微軟最終得到DX9類的好處,有一個非常聰明的標準,每個人都被迫遵守。這是一件好事。但當然,我擔心這個一般的計算主題,因爲如果MS花了9個嘗試來取得正確的...好的。他們現在可能對這個整個過程有一些積累的智慧,但總是有機會讓MS超越他們的實際經驗,並制定一個不好的標準。他們的標準幾乎總是演變成好東西,如果他們在DX計算的第一步得到正確的話,  或任何它將要。我不會呼吸,因爲這真的是所有這一切仍在研究。有了圖形,我們真的是在很大程度上遵循SGI模型很長一段時間,給了行業一個真正的腿。現在,這回到了前面的一點:每個人仍然在爲我們在這裏做的奇妙的事情揮霍手,但我們真的沒有這些例子更不用說應用程序了。所以當實際上並沒有那麼多經驗的基礎時,進入並開始制定具體標準是一個危險的時刻。現在,這回到了前面的一點:每個人仍然在爲我們在這裏做的奇妙的事情揮霍手,但我們真的沒有這些例子更不用說應用程序了。所以當實際上並沒有那麼多經驗的基礎時,進入並開始制定具體標準是一個危險的時刻。現在,這回到了前面的一點:每個人仍然在爲我們在這裏做的奇妙的事情揮霍手,但我們真的沒有這些例子更不用說應用程序了。所以當實際上並沒有那麼多經驗的基礎時,進入並開始制定具體標準是一個危險的時刻。

Rage / id Tech 5,2007 - 由FreakyGaming.com提供

 

就物理API而言,我確實希望任何一個API可以幫助廣泛的遊戲開發者支持,無論是去Novodex還是Havok,他們都必須有後端,至少可以使用任何加速技術。只是顯而易見的是,英特爾顯然不會使CUDA的實現速度非常快,但是有些人會因爲它至少具有與插頭兼容的CUDA實現。也許NVIDIA將最終爲其API提供封裝。但這只是今天發展的現實。除非您是Microsoft技術開發人員或與Xbox 360平臺相關的內容,否則開發人員將無法選擇“我們將使用英特爾的東西,而不是在當前控制檯一代運行”。這只是不會發生的。 

結論與分析

在這裏有很多信息要與約翰談話
永遠不會失望。我們來試試幾分鐘,
總結一下他的評論在射線
跟蹤,控制檯,物理等方面的反映。

第一點分析是關於光線跟蹤的討論; 
約翰顯然覺得英特爾目前在使用
傳統光線跟蹤算法進行遊戲的方式不可能贏得
下一代渲染技術。這
對英特爾來說顯然不是一個好消息,因爲儘管約翰不是唯一的遊戲
編程天才,但他的看法似乎比
行業內的任何人都更重要。約翰或多或少
地回答了柯克博士認爲,光柵化具有太多的天生性能優勢
,可以通過光線跟蹤來處理。
無論英特爾成功地將Larrabee架構拉伸到令人難以置信的性能水平。 





約翰確實看到光線跟蹤有用的是
他創建的一個非常具體的數據模型,稱爲“稀疏體素八度”,允許他以 使用光線跟蹤方法
輕鬆訪問的方式存儲大量數據
。這並不意味着約翰認爲
使用這些光線直接進行渲染,只是
光線跟蹤的理論和算法對於他的具體目的是有用的。 根據John的說法,
針對id Tech 6的這種新的數據模型和算法將允許

世界上幾乎無限量的幾何細節,沒有在鑲嵌引擎中看到的問題,或試圖在
本地存儲千兆字節的數據。
雖然我們要求一些圖表或截圖,可能會顯示約翰指的是什麼樣的細節
,但我們還沒有得到任何東西; 這
是預期這個早期的發展。



約翰·卡馬克(John Carmack),2007年,由Quakecon.org提供 

約翰的意見認爲,任何新技術都需要採用概念驗證,與我關於英特爾爲
Havok和Project Offset等公司花錢的理論一致。他們需要創建一個演示或引擎,使人們跳起來,讓人印象深刻
,以保證新的硬件和軟件設計。英特爾只是在光線跟蹤上展示了上一代媒體,因此還沒有引起整個軟件界的關注。然而約翰說,

他計劃在今年的某個時候,使用稀疏體素八叉樹方法來證明自己的技術及其好處。

John和David Kirk也認爲,混合和匹配傳統光柵化渲染與光線跟蹤不僅是可能的,但很可能儘管英特爾團隊以前討論過一些保留。

不僅如此,作爲一個現代化的控制檯和移動開發者,John完全不理會將光線跟蹤引擎移動到便攜式設備或UMPC,成爲一個“荒謬的論據”。 

約翰和我討論了多GPU系統的狀況。隨着NVIDIA和AMD正在使用兩臺,三臺甚至四臺GPU計算機的推動約翰認爲,在某些
情況下,遊戲引擎簡單易用,可以輕鬆地將其切片,能夠將功能的兩倍或兩倍一個系統至少對開發人員來說非常棒。當
麻煩來的,雖然是引進DX9C和DX10,擁有的功能,如反饋,子緩衝器和條件查詢,切片爲多個GPU來地址的工作越來越困難得多。

開發人員將控制檯和端口重點放在PC上,而不是反之亦然,這也是許多人認爲PC遊戲減少的原因。由於開發人員在財務上需要瞄準
PS3和Xbox 360 的更大和更有利可圖的受衆羣體,因此花費大量時間或金錢來改變媒體或算法是沒有意義的,以利用高端PC可以提供

的額外功率。

約翰說,在PC上提高分辨率和幀速率是很容易的,但真正改變PC市場的東西對開發人員來說並不是很有意義。 

最後,約翰一直對AGEIA和他們的硬件物理推動感到厭惡,他們
今天對我們來說非常好。顯然,從個人和專業層面來看,他不同意AGEIA在做什麼,但是看到GPU被用於物理和
其他遊戲相關問題的未來通用計算能力。在不久的將來,將圖形渲染轉換爲GP計算的能力
太慢,無法在當前引擎中輕鬆使用,但隨着硬件更改或開發人員更新其軟件以適應略微增加的延遲,該處理可以包括在內。

我想感謝約翰·卡馬克(John Carmack)花時間與我談論這些話題,希望我們的讀者將這些信息看作是
革命性的,像我一樣激動人心。在和約翰談話時總是這樣,你會在短時間內獲得很多奇妙的信息,
並花時間消化他在這裏所發表的一切,這可能需要比這篇文章更長的時間。 






發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章