umezawatakeshi / utvideo

Ut Video Codec Suite - fast lossless video codec
http://umezawatakeshi.github.io/utvideo/
GNU General Public License v2.0
288 stars 12 forks source link

Add AVX2-optimized routines / AVX2 版のルーチンを追加する #13

Closed umezawatakeshi closed 6 years ago

umezawatakeshi commented 7 years ago

Add AVX2-optimized routines. (may be small performance increase)

AVX2 版のルーチンを追加する。ただし、効果は小さいかもしれない。

umezawatakeshi commented 7 years ago

現時点でのプロファイルの結果を見る限り、 AVX2 により理想的に高速化できた(つまり、ベクトル化可能な部分が倍速になった)場合でも、 7~10% の高速化に留まることが分かった。

umezawatakeshi commented 6 years ago

20 で想定されている新しい圧縮アルゴリズムは既存の圧縮アルゴリズムより高速であり、当初この issue で想定していたルーチンが処理時間に占める割合が相対的に増加するため、結果として AVX2 化による高速化の効果は非常に高くなると考えられる。(おおむね30%程度と予測している)