2010/01/31
OpenGL を Direct3D 互換で使う
モバイル系の API はほぼ OpenGL ES 2.0 で統一されつつあります。
Direct3D Mobile は DirectX8 ベースのサブセットで、固定機能パイプラインだけが
残されています。OpenGL ES 1.0 世代と同等、機能的には DirectX7 相当と言って
差し支えないかもしれません。
プログラマブルシェーダーの仕様を取り込んで Direct3D9 相当の仕様まで進んだのは
OpenGL ES 2.0 だけでした。WindowsCE 採用の端末でも 3D API としては
OpenGL ES 2.0 が用いられていることが多いようです。
そこで最近は OpneGL 上でも動くよう、互換性を考えて描画エンジンやライブラリを
作ることが多くなりました。普段デスクトップ PC では Direct3D を使いつつも、
モバイル系への応用を考えて OpenGL にも対応しています。
幸いなことにプログラマブルシェーダーが一般化しており、座標系や Matrix の扱い方
などはプログラマに開放されています。
もはやレガシーな入門書の通りに従う必要は無くなりました。
双方とも一番下の描画 API だけ使う分にはほとんど差がありません。どちらの API を
使おうとも動いているハードウエアは同じなので、当たり前といえば当たり前です。
Direct3D の方が経験が長いので、個人的には Direct3D 互換のまま使えた方が便利です。
これまで溜め込んだ 3D のライブラリ群やシェーダー、ツールを活用することができるからです。
逆に Direct3D での蓄積が特に無く、OpenGL 用の上位ライブラリやツール類を使う予定が
あるなら、素直に OpenGL の流儀に従った方が混乱は少ないでしょう。
● OpenGL を左手座標系で使用する方法
過去に下記のエントリで触れています。
・OpenGLES2.0 D3D座標系
基本的に何もする必要が無く、使う側でどちらか一方に定義してしまえば終わりです。
カリングの向きだけ違うので変更しています。
座標系の違いは文字コードの違いのようなもので、どちらかの流儀で統一してしまえば
混乱はありません。中途半端に混在していると、相互に変換が必要になったりと
ややこしいことになります。
● OpenGL と Direct3D の座標系の違い
OpenGL 座標系と Direct3D 座標系の違いは、左手系、右手系以外にもあります。
Clip 座標系の Z の範囲が異なります。これは VertexShader の出力値に相当します。
w の範囲はどちらも n~f なので、OpenGL では -n ~ f, Direct3D では 0 ~ f の値を
とります。Direct3D 用に作られた Projection Matrix を用いて OpenGL の VertexShader
から出力を行うと Z の範囲が狭くなっているわけです。
OpenGL 用のドライバは -w ~ w の値を期待しているので VertexShader の出力値も
あわせて補正します。
符号が異なるものの、この変換を事前に Matrix に畳み込んだのが OpenGL の
Projection Matrix といえます。
どちらも最終的には Z バッファ格納時に 0~1.0 の範囲に変換されます。
ドライバなり何らかの追加ハードウエアによって、上で追加した補正と逆の変換が行われて
いると予想できます。
OpenGL の VertexShader のあとに、変換するためのシェーダー命令がいくつか挿入されて
いるのかもしれません。仮に PostVertexShader としておきます。
Direct3D の場合は最初から 0起点で求まるので、VertexShader 後段での z 変換は
w 除算のみと単純になっています。
この違いはシャドウマップを扱うとよくわかります。
● OpenGL と Direct3D のシャドウマップ
バッファに格納された depth 値は 0~1.0 の範囲なので、ハードウエアシャドウマップも
この範囲で比較が行われます。
Vertex Shader の出力は Clip 座標であるため、その後の 0~1.0 への変換は触れない
ところにありドライバに任されています。
ところがシャドウマップ参照時に比較に用いる depth シェーダー側で用意しなければ
なりません。光源の Projection Matrix 適用後に Z 範囲を 0~1.0 に変換するわけです。
結局 PostVertexShader が Z をどう変換しているのか知っておく必要があります。
OpenGL 用の HW Shadow Map のサンプルを見ていると、Texture 座標変換 Matrix に
X,Y (u,v) だけでなく Z にも 0.5 のスケーリングと 0.5 のオフセットが加えられて
いるのがわかります。
これは Direct3D では存在しないパラメータで、PostVertexShader が行っている
補正と同じことです。実質 OpenGL でも Shadow Map 時には、Direct3D 相当の Matrix を
作っていると言えるかもしれません。
Direct3D の場合はそのまま z/w だけで 0~1.0 になるため比較的シンプルです。
●まとめ
今のところ Culling、VertexShader 出力 z 値の補正、の 2点だけで Direct3D と全く同じ
データや演算ライブラリを使っています。今後他にも変更点が出てくる可能性があります。
API の使い方とかリソースの変換も必要ですが、そのあたりは過去のエントリでも
触れています。
関連エントリ
・OpenGLES2.0 DDS テクスチャを読み込む
・OpenGLES2.0 Direct3D とのフォーマット変換
・OpenGLES 2.0 頂点フォーマットの管理
・OpenGLES2.0 の頂点
・OpenGLES2.0 D3D座標系
・OpenGLES2.0 シェーダー管理
Direct3D Mobile は DirectX8 ベースのサブセットで、固定機能パイプラインだけが
残されています。OpenGL ES 1.0 世代と同等、機能的には DirectX7 相当と言って
差し支えないかもしれません。
プログラマブルシェーダーの仕様を取り込んで Direct3D9 相当の仕様まで進んだのは
OpenGL ES 2.0 だけでした。WindowsCE 採用の端末でも 3D API としては
OpenGL ES 2.0 が用いられていることが多いようです。
そこで最近は OpneGL 上でも動くよう、互換性を考えて描画エンジンやライブラリを
作ることが多くなりました。普段デスクトップ PC では Direct3D を使いつつも、
モバイル系への応用を考えて OpenGL にも対応しています。
幸いなことにプログラマブルシェーダーが一般化しており、座標系や Matrix の扱い方
などはプログラマに開放されています。
もはやレガシーな入門書の通りに従う必要は無くなりました。
双方とも一番下の描画 API だけ使う分にはほとんど差がありません。どちらの API を
使おうとも動いているハードウエアは同じなので、当たり前といえば当たり前です。
Direct3D の方が経験が長いので、個人的には Direct3D 互換のまま使えた方が便利です。
これまで溜め込んだ 3D のライブラリ群やシェーダー、ツールを活用することができるからです。
逆に Direct3D での蓄積が特に無く、OpenGL 用の上位ライブラリやツール類を使う予定が
あるなら、素直に OpenGL の流儀に従った方が混乱は少ないでしょう。
● OpenGL を左手座標系で使用する方法
過去に下記のエントリで触れています。
・OpenGLES2.0 D3D座標系
基本的に何もする必要が無く、使う側でどちらか一方に定義してしまえば終わりです。
カリングの向きだけ違うので変更しています。
座標系の違いは文字コードの違いのようなもので、どちらかの流儀で統一してしまえば
混乱はありません。中途半端に混在していると、相互に変換が必要になったりと
ややこしいことになります。
● OpenGL と Direct3D の座標系の違い
OpenGL 座標系と Direct3D 座標系の違いは、左手系、右手系以外にもあります。
Clip 座標系の Z の範囲が異なります。これは VertexShader の出力値に相当します。
OpenGL: -w ~ w Direct3D: 0 ~ w
w の範囲はどちらも n~f なので、OpenGL では -n ~ f, Direct3D では 0 ~ f の値を
とります。Direct3D 用に作られた Projection Matrix を用いて OpenGL の VertexShader
から出力を行うと Z の範囲が狭くなっているわけです。
OpenGL 用のドライバは -w ~ w の値を期待しているので VertexShader の出力値も
あわせて補正します。
vec4 opos= vec4( POSITION.xyz, 1.0 ) * ProjectionViewWorld; opos.z= 2.0 * opos.z - opos.w; // 0~w → -w~w gl_Position= opos;
符号が異なるものの、この変換を事前に Matrix に畳み込んだのが OpenGL の
Projection Matrix といえます。
どちらも最終的には Z バッファ格納時に 0~1.0 の範囲に変換されます。
ドライバなり何らかの追加ハードウエアによって、上で追加した補正と逆の変換が行われて
いると予想できます。
OpenGL の VertexShader のあとに、変換するためのシェーダー命令がいくつか挿入されて
いるのかもしれません。仮に PostVertexShader としておきます。
Direct3D の場合は最初から 0起点で求まるので、VertexShader 後段での z 変換は
w 除算のみと単純になっています。
この違いはシャドウマップを扱うとよくわかります。
● OpenGL と Direct3D のシャドウマップ
バッファに格納された depth 値は 0~1.0 の範囲なので、ハードウエアシャドウマップも
この範囲で比較が行われます。
Vertex Shader の出力は Clip 座標であるため、その後の 0~1.0 への変換は触れない
ところにありドライバに任されています。
ところがシャドウマップ参照時に比較に用いる depth シェーダー側で用意しなければ
なりません。光源の Projection Matrix 適用後に Z 範囲を 0~1.0 に変換するわけです。
結局 PostVertexShader が Z をどう変換しているのか知っておく必要があります。
OpenGL 用の HW Shadow Map のサンプルを見ていると、Texture 座標変換 Matrix に
X,Y (u,v) だけでなく Z にも 0.5 のスケーリングと 0.5 のオフセットが加えられて
いるのがわかります。
これは Direct3D では存在しないパラメータで、PostVertexShader が行っている
補正と同じことです。実質 OpenGL でも Shadow Map 時には、Direct3D 相当の Matrix を
作っていると言えるかもしれません。
Direct3D の場合はそのまま z/w だけで 0~1.0 になるため比較的シンプルです。
●まとめ
今のところ Culling、VertexShader 出力 z 値の補正、の 2点だけで Direct3D と全く同じ
データや演算ライブラリを使っています。今後他にも変更点が出てくる可能性があります。
API の使い方とかリソースの変換も必要ですが、そのあたりは過去のエントリでも
触れています。
関連エントリ
・OpenGLES2.0 DDS テクスチャを読み込む
・OpenGLES2.0 Direct3D とのフォーマット変換
・OpenGLES 2.0 頂点フォーマットの管理
・OpenGLES2.0 の頂点
・OpenGLES2.0 D3D座標系
・OpenGLES2.0 シェーダー管理
一ヶ月遅れですが RADEON に戻したのでドライバを更新しました。
こちら と比べるとわかるとおり、Concurrent Creates 対応になっています。
Command Lists がまだなので、スレッド完全対応もあともう少しです。
他にも OpenGL 3.2 対応など機能拡張されているようです。
気がついた点としては、GeForce と同じように最初から OpenGL 3.2 の Context を
返してくること。従来は 2.x ベースでした。
ただ 3.2 の API できちんと動いていない部分があるので、API だけ 3.1 に落として
使っています。3.1 context を作っても GLSL は 1.5。
※ 2010/01/31追記: Catalyst 10.1 (2010/01版) では改善されており、RADEON 上で OpenGL 3.2 がきちんと動いています。
2枚目用に補助電源無しの GeForce が必要になったので、
DirectX 10.1 対応のGeForce GT 240 を買ってみました。
GeForce ながら 10.1 に対応していることがわかります。
Shader Model に 4.x と表記されているのは 4.1 のことです。
もっと細かい違いとか踏み込んで調べたいところですが、時間的にしばらくは無理そうです。
そうこうしているうちに Fermi も出てきそうですね。
後発は機能拡張に積極的なので Fermi 系 2世代目が出るあたりには D3D の次の
バージョンが見えてくるのかもしれません。年末あたりでしょうか。
関連エントリ
・DirectX 11 / Direct3D 11 と RADEON HD 5870 の caps
こちら と比べるとわかるとおり、Concurrent Creates 対応になっています。
RADEON HD 5850 Catalyst 9.12 Windows7 x64 Direct3D 11 Feature Level D3D_FEATURE_LEVEL_11_0 Driver Concurrent Creates Yes Driver Command Lists No Double-precision Shaders Yes Compute Shader 4.x Yes D3D_FEATURE_LEVEL_11_0 Shader Model 5.0 Geometry Shader Yes Stream Out Yes Compute Shader Yes Hull & Domain Shaders Yes Texture Resource Arrays Yes Cubemap Resource Arrays Yes BC4/BC5 Compression Yes BC6H/BC7 Compression Yes Alpha-to-coverage Yes Extended Formats (BGRA, etc.) Yes 10-bit XR High Color Format Yes
Command Lists がまだなので、スレッド完全対応もあともう少しです。
他にも OpenGL 3.2 対応など機能拡張されているようです。
気がついた点としては、GeForce と同じように最初から OpenGL 3.2 の Context を
返してくること。従来は 2.x ベースでした。
ただ 3.2 の API できちんと動いていない部分があるので、API だけ 3.1 に落として
使っています。3.1 context を作っても GLSL は 1.5。
※ 2010/01/31追記: Catalyst 10.1 (2010/01版) では改善されており、RADEON 上で OpenGL 3.2 がきちんと動いています。
2枚目用に補助電源無しの GeForce が必要になったので、
DirectX 10.1 対応のGeForce GT 240 を買ってみました。
GeForce GT 240 Driver 195.62 Windows7 x64 Direct3D 11 Feature Level D3D_FEATURE_LEVEL_10_1 Driver Concurrent Creates Yes Driver Command Lists No Double-precision Shaders No Compute Shader 4.x Yes D3D_FEATURE_LEVEL_10_1 Shader Model 4.x Geometry Shader Yes Stream Out Yes Compute Shader Optional (Yes) Hull & Domain Shaders No Texture Resource Arrays Yes Cubemap Resource Arrays Yes BC4/BC5 Compression Yes BC6H/BC7 Compression No Alpha-to-coverage Yes Extended Formats (BGRA, etc.) Optional (Yes) 10-bit XR High Color Format Optional (Yes)
GeForce ながら 10.1 に対応していることがわかります。
Shader Model に 4.x と表記されているのは 4.1 のことです。
もっと細かい違いとか踏み込んで調べたいところですが、時間的にしばらくは無理そうです。
そうこうしているうちに Fermi も出てきそうですね。
後発は機能拡張に積極的なので Fermi 系 2世代目が出るあたりには D3D の次の
バージョンが見えてくるのかもしれません。年末あたりでしょうか。
関連エントリ
・DirectX 11 / Direct3D 11 と RADEON HD 5870 の caps