Archives

January 2010 の記事

モバイル系の API はほぼ OpenGL ES 2.0 で統一されつつあります。

Direct3D Mobile は DirectX8 ベースのサブセットで、固定機能パイプラインだけが
残されています。OpenGL ES 1.0 世代と同等、機能的には DirectX7 相当と言って
差し支えないかもしれません。

プログラマブルシェーダーの仕様を取り込んで Direct3D9 相当の仕様まで進んだのは
OpenGL ES 2.0 だけでした。WindowsCE 採用の端末でも 3D API としては
OpenGL ES 2.0 が用いられていることが多いようです。

そこで最近は OpneGL 上でも動くよう、互換性を考えて描画エンジンやライブラリを
作ることが多くなりました。普段デスクトップ PC では Direct3D を使いつつも、
モバイル系への応用を考えて OpenGL にも対応しています。

幸いなことにプログラマブルシェーダーが一般化しており、座標系や Matrix の扱い方
などはプログラマに開放されています。
もはやレガシーな入門書の通りに従う必要は無くなりました。

双方とも一番下の描画 API だけ使う分にはほとんど差がありません。どちらの API を
使おうとも動いているハードウエアは同じなので、当たり前といえば当たり前です。

Direct3D の方が経験が長いので、個人的には Direct3D 互換のまま使えた方が便利です。
これまで溜め込んだ 3D のライブラリ群やシェーダー、ツールを活用することができるからです。

逆に Direct3D での蓄積が特に無く、OpenGL 用の上位ライブラリやツール類を使う予定が
あるなら、素直に OpenGL の流儀に従った方が混乱は少ないでしょう。



● OpenGL を左手座標系で使用する方法

過去に下記のエントリで触れています。

OpenGLES2.0 D3D座標系

基本的に何もする必要が無く、使う側でどちらか一方に定義してしまえば終わりです。
カリングの向きだけ違うので変更しています。

座標系の違いは文字コードの違いのようなもので、どちらかの流儀で統一してしまえば
混乱はありません。中途半端に混在していると、相互に変換が必要になったりと
ややこしいことになります。



● OpenGL と Direct3D の座標系の違い

OpenGL 座標系と Direct3D 座標系の違いは、左手系、右手系以外にもあります。
Clip 座標系の Z の範囲が異なります。これは VertexShader の出力値に相当します。

OpenGL: -w ~ w
Direct3D: 0 ~ w

w の範囲はどちらも n~f なので、OpenGL では -n ~ f, Direct3D では 0 ~ f の値を
とります。Direct3D 用に作られた Projection Matrix を用いて OpenGL の VertexShader
から出力を行うと Z の範囲が狭くなっているわけです。

OpenGL 用のドライバは -w ~ w の値を期待しているので VertexShader の出力値も
あわせて補正します。

vec4    opos= vec4( POSITION.xyz, 1.0 ) * ProjectionViewWorld;
opos.z= 2.0 * opos.z - opos.w; // 0~w → -w~w
gl_Position= opos;

符号が異なるものの、この変換を事前に Matrix に畳み込んだのが OpenGL の
Projection Matrix といえます。

どちらも最終的には Z バッファ格納時に 0~1.0 の範囲に変換されます。
ドライバなり何らかの追加ハードウエアによって、上で追加した補正と逆の変換が行われて
いると予想できます。
OpenGL の VertexShader のあとに、変換するためのシェーダー命令がいくつか挿入されて
いるのかもしれません。仮に PostVertexShader としておきます。
Direct3D の場合は最初から 0起点で求まるので、VertexShader 後段での z 変換は
w 除算のみと単純になっています。

この違いはシャドウマップを扱うとよくわかります。


● OpenGL と Direct3D のシャドウマップ

バッファに格納された depth 値は 0~1.0 の範囲なので、ハードウエアシャドウマップも
この範囲で比較が行われます。

Vertex Shader の出力は Clip 座標であるため、その後の 0~1.0 への変換は触れない
ところにありドライバに任されています。

ところがシャドウマップ参照時に比較に用いる depth シェーダー側で用意しなければ
なりません。光源の Projection Matrix 適用後に Z 範囲を 0~1.0 に変換するわけです。
結局 PostVertexShader が Z をどう変換しているのか知っておく必要があります。

OpenGL 用の HW Shadow Map のサンプルを見ていると、Texture 座標変換 Matrix に
X,Y (u,v) だけでなく Z にも 0.5 のスケーリングと 0.5 のオフセットが加えられて
いるのがわかります。

これは Direct3D では存在しないパラメータで、PostVertexShader が行っている
補正と同じことです。実質 OpenGL でも Shadow Map 時には、Direct3D 相当の Matrix を
作っていると言えるかもしれません。

Direct3D の場合はそのまま z/w だけで 0~1.0 になるため比較的シンプルです。


●まとめ

今のところ Culling、VertexShader 出力 z 値の補正、の 2点だけで Direct3D と全く同じ
データや演算ライブラリを使っています。今後他にも変更点が出てくる可能性があります。

API の使い方とかリソースの変換も必要ですが、そのあたりは過去のエントリでも
触れています。


関連エントリ
OpenGLES2.0 DDS テクスチャを読み込む
OpenGLES2.0 Direct3D とのフォーマット変換
OpenGLES 2.0 頂点フォーマットの管理
OpenGLES2.0 の頂点
OpenGLES2.0 D3D座標系
OpenGLES2.0 シェーダー管理


一ヶ月遅れですが RADEON に戻したのでドライバを更新しました。
こちら と比べるとわかるとおり、Concurrent Creates 対応になっています。

RADEON HD 5850 Catalyst 9.12 Windows7 x64

Direct3D 11
   Feature Level                   D3D_FEATURE_LEVEL_11_0
   Driver Concurrent Creates       Yes
   Driver Command Lists            No
   Double-precision Shaders        Yes
   Compute Shader 4.x              Yes
D3D_FEATURE_LEVEL_11_0
   Shader Model                    5.0
   Geometry Shader                 Yes
   Stream Out                      Yes
   Compute Shader                  Yes
   Hull & Domain Shaders           Yes
   Texture Resource Arrays         Yes
   Cubemap Resource Arrays         Yes
   BC4/BC5 Compression             Yes
   BC6H/BC7 Compression            Yes
   Alpha-to-coverage               Yes
   Extended Formats (BGRA, etc.)   Yes
   10-bit XR High Color Format     Yes

Command Lists がまだなので、スレッド完全対応もあともう少しです。

他にも OpenGL 3.2 対応など機能拡張されているようです。
気がついた点としては、GeForce と同じように最初から OpenGL 3.2 の Context を
返してくること。従来は 2.x ベースでした。
ただ 3.2 の API できちんと動いていない部分があるので、API だけ 3.1 に落として
使っています。3.1 context を作っても GLSL は 1.5。

※ 2010/01/31追記: Catalyst 10.1 (2010/01版) では改善されており、RADEON 上で OpenGL 3.2 がきちんと動いています。


2枚目用に補助電源無しの GeForce が必要になったので、
DirectX 10.1 対応のGeForce GT 240 を買ってみました。

GeForce GT 240 Driver 195.62 Windows7 x64

Direct3D 11
   Feature Level                   D3D_FEATURE_LEVEL_10_1
   Driver Concurrent Creates       Yes
   Driver Command Lists            No
   Double-precision Shaders        No
   Compute Shader 4.x              Yes
D3D_FEATURE_LEVEL_10_1
   Shader Model                    4.x
   Geometry Shader                 Yes
   Stream Out                      Yes
   Compute Shader                  Optional (Yes)
   Hull & Domain Shaders           No
   Texture Resource Arrays         Yes
   Cubemap Resource Arrays         Yes
   BC4/BC5 Compression             Yes
   BC6H/BC7 Compression            No
   Alpha-to-coverage               Yes
   Extended Formats (BGRA, etc.)   Optional (Yes)
   10-bit XR High Color Format     Optional (Yes)

GeForce ながら 10.1 に対応していることがわかります。
Shader Model に 4.x と表記されているのは 4.1 のことです。
もっと細かい違いとか踏み込んで調べたいところですが、時間的にしばらくは無理そうです。
そうこうしているうちに Fermi も出てきそうですね。
後発は機能拡張に積極的なので Fermi 系 2世代目が出るあたりには D3D の次の
バージョンが見えてくるのかもしれません。年末あたりでしょうか。


関連エントリ
DirectX 11 / Direct3D 11 と RADEON HD 5870 の caps