SIMD関係：千里の道も一歩から：So-netブログ

	ブログをはじめるログイン

SIMD関係　[C++] [編集]

http://hillbig.cocolog-nifty.com/do/2007/12/ssewavelet_9ab8.html
SSEとかWaveletとか

MMXなどのアセンブラが必要な部分をマクロでラップしてるヘッダがついてるらしい。
VC2005には存在を確認。
VC2003やVC6は未確認。VC6ではProcessorPack入れれば入るらしいとのこと。

MMX -> mmintrin.h
SSE -> xmmintrin.h
SSE2 -> emmintrin.h
SSE3 -> pmmintrin.h
3DNow! -> mm3dnow.h

で、このままだとアセンブラわかってないと使いにくい。

http://download.intel.com/jp/developer/jpdoc/fvecfcs_j.pdf
http://www.ec.hokudai.ac.jp/documents/Intel/intel_ccl_80/c_ug/index.htm

ベクトルをクラス化して、C++お得意の演算子のオーバーロードをして
使いやすくしたものがついてるらしい

MMX -> Ivecクラス
SSE -> Fvecクラス
SSE2 -> Dvecクラス

それぞれ

#include ＜ivec.h＞

などを追加すればOK

どっちにしろ、どういうデータを並列で処理したいか、というのは当然プログラマーが決める部分なので、はじめから並列化を念頭に組んでたプログラムでもない限りは、それなりの手間はかかる。
（complex型使って書いていたDFTをfvec32で無理やり書き直したところ倍近く遅くなってしまった。）

http://forums.microsoft.com/MSDN-JA/ShowPost.aspx?PostID=258824&SiteID=7
また、こんな不具合もあるようなので、要注意。

またSIMDを使ってまで高速化したい場合は、そもそもが別のところで気にしたほうがいいことが多い。
ネタはすべてへるみさんのところから。

・アライメントに気をつける（特にdoubleのアライメントがうまくいってない場合はえらい遅くなる）
・VC2005を使っている場合、floatとdoubleの区別がついていてdoubleが遅いので、オプションに気をつける
・VC2005で文字列を使っている場合、C++のisspaceはlocaleの関係でむちゃくちゃ遅くなっているので、ASCIIに限って使うのであれば、C版もしくは自分で実装したほうが早い

２００５で速度がでないなーってときは２００３やVC6でコンパイルして比較する癖は必要ですね・・・

んで、Xvidを高速化する余地はあるのかとちょっと調べて見たが
はじめからあらゆるアーキテクチャに最適化されたコードで書かれているので、コンパイラで変わる様な要素はほとんど無かった。

ベンチマークテストがあったので、動かして見たところ、Athlon64X2な環境では
・３DNOWを使うと遅くなるので使わないほうがよい
・SSE2対応が一番早い
・SMP対応はしてるんだかしてないんだかわからない

という結果が出てしまい、それだったら、最初からSSE2が早いIntel系のほうがいいんじゃないか　という結論になってしまった。Xvidの内部的にはH.263をベースに動いているようで、計算を計算機がやりやすいようにしたH.264ではないのが、リアルタイムでキャプチャーできたかどうかの違いのように思えてきた。

2007-12-13 11:55 nice!(0) コメント(0) トラックバック(0)

nice! 0

コメントを書く

トラックバック 0

悪魔のゲーム｜アセンブラによる無限ループ、再起動の回避ブログトップ

日	月	火	水	木	金	土
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

RSS1.0 | RSS2.0

千里の道も一歩から

SIMD関係　[C++] [編集]

nice! 0

コメント 0

コメントを書く

トラックバック 0

woodyring さん

カレンダー

記事検索

Twitter

カテゴリー

最新記事一覧

最近のコメント

読んでいるブログ（RSS）

Google-Analytics

千里の道も一歩から

SIMD関係 [C++] [編集]

nice! 0

コメント 0

コメントを書く

トラックバック 0

woodyring さん

カレンダー

記事検索

Twitter

カテゴリー

最新記事一覧

最近のコメント

読んでいるブログ（RSS）

Google-Analytics

SIMD関係　[C++] [編集]