次期製品 「TMPGEnc 3.0 XPress」 最新のHTテクノロジ インテルPentium 4 プロセッサ (コード名: Prescott) に最適化
―SSE3に最適化することにより、8%~12%の高速化を実現―
2004年2月3日

株式会社ペガシスは、次期製品「TMPGEnc 3.0 XPress(ティーエムペグエンク 3.0 エクスプレス)」において、最新の「HTテクノロジ インテル Pentium 4 プロセッサ (コード名: Prescott)」の「ストリーミングSIMD拡張命令3 (SSE3)」に正式対応すると発表いたします。

 インテル ストリーミングSIMD拡張命令3 (以下SSE3)とは、インテル社が90nmプロセス技術で製造する、新しい 「HTテクノロジ インテル Pentium 4 プロセッサ (コード名: Prescott)」に搭載されるマルチメディア拡張命令セットで、このSSE3 に最適化を行ったソフトウェアは従来までのものと比較し、より効率的かつ高度な処理を実現します。
 現在、次期製品として開発中である製品 「TMPGEnc 3.0 XPress (※1)」(2004年春発売予定) では、従来のインテル Pentium 4 プロセッサに加えて、SSE3を導入した最新のHTテクノロジ インテル Pentium 4 プロセッサへの最適化を行っております。
(※1) 現在、弊社製品である「TMPGEnc Plus 2.5」ユーザー向けに、β版プログラムの配布を行っております。 詳しくはこちらをご覧下さい。

 尚、本発表にあたりインテル株式会社 マーケティング本部長 ケヴィン・セラーズ氏より下記のコメントを頂戴しています。

「インテルは、最新のHTテクノロジ インテル Pentium4 プロセッサにチューンされたTMPGEnc 3.0 XPress のリリースを歓迎いたします。高い処理性能が要求されるビデオのエンコーディングの作業に、90nmプロセスで製造される最新のHTテクノロジ インテル Pentium4 プロセッサは、卓越した環境を提供します。」
インテル株式会社 マーケティング本部長 ケヴィン・セラーズ


TMPGEnc 3.0 XPress での SSE3 の実際の高速化適用について
 TMPGEnc 3.0 XPressでは最新のHTテクノロジ インテル Pentium 4 プロセッサに追加されたSSE3新命令のうち、メモリアクセスを強化する命令を利用して、MPEG-1/2エンコーダを中心として最適化を行っています。特に、動き検索の高速化では、SSE3が大きな効果を発揮しております。また、従来から最適化を行っていたプログラムも、HTテクノロジ インテル Pentium 4 プロセッサが持つパフォーマンスを更に活かせるように、全体的な見直しと高速化を行っています。
以上により、


1. MPEGエンコードにおける重要な処理である動き検索時のメモリアクセス処理

2.
プログラム全体のメモリアクセスペナルティの軽減

3.
従来のHTテクノロジ インテル Pentium 4 プロセッサとの単体性能比較による コード最適化 
を達成致しました。

■SSE3最適化済みTMPGEnc 3.0 XPressの弊社でのベンチマーク結果■

素材
こちらで公開中のTMPGEnc 3.0 XPress デモムービー (6Mbps 48.5MB)
CRI Middleware様の提供デモ 「機神」
(C)2003 CRI Middleware Co.,LTD
テスト内容
上記ファイルをTMPGEnc 3.0 XPress MPEG-2 リーダーにて読み込み、MPEG-2 エンコードを行う
エンコード設定
DVD NTSC設定 CBR 6000kbps 動き検索「高精度」 音声MP2 384kbps
エンコード設定ファイル
環境設定
CPU関連 CPU毎に可能な命令は全て有効
マルチスレッド関連 全て有効
キャッシュ設定 無効
ハードウェア環境
同一HDDへMPEG2 ファイルの書き出し

SINGLE CPU ベンチマーク結果 (参考値)
CPU
OS
クロック
所要時間
Pentium4
(SSE3 有効)
Prescott
Windows XP Professional
3000MHz
2:00
Pentium4
Northwood
Windows XP Professional
3200MHz
2:01
Pentium4
(SSE3 無効)
Prescott
Windows XP Professional
3000MHz
2:13
Athlon64
ClawHammer
Windows XP Professional
3200+
3:01
AthlonXP
Barton
Windows XP Professional
2800+
3:13
Celeron
Northwood
Windows XP Professional
2000MHz
4:48
Pentium4M
Northwood
Windows XP Home
1500MHz
6:11
Pentium3
Coppermine
Windows 2000 Professional
1000MHz
11:27
Crusoe
TM5600
Windows 2000 Professional
600MHz
57:51:00

DUAL CPU ベンチマーク結果 (参考値)
CPU
OS
クロック
所要時間
Pentium4 Xeon
Northwood
Windows XP Professional
3060MHz×2
1:13
Opteron
SledgeHammer
Windows XP 64Bitβ
2000MHz×2
1:34
Pentium4 Xeon
Northwood
Windows server 2003
2400MHz×2
1:47

※株式会社ペガシス調べ
※このベンチマーク結果はマシン環境(メモリ、HDD等)などが個々のマシンにより異なりますので、あくまで参考値となります


このベンチマークテストの結果、SSE3 最適化によるエンコード速度の向上によって、ワンランク動作クロックの高い従来 HT テクノロジ インテル Pentium4 プロセッサ 3.2GHz に、最新のHTテクノロジ インテル Pentium 4 プロセッサ 3GHz が勝る処理速度を発揮していることを確認することができます。

 TMPGEnc を Opteron, Athlon64 上で実行した場合、SSE2命令を有効にすると、無効である場合に比べて実行速度が低下することが確認されています。これはSSE, SSE2 の浮動小数点命令と整数命令を互いに依存関係がある状況の下、混在して使用すると、著しくパフォーマンスが低下する(※2)と言うOpteron, Athlon64 の特性が原因であり、将来的にCPU側の仕様が変更されることにより改善するものと思われます。
TMPGEnc内では主にDCTやNRフィルタをはじめとして、各部に該当するコードが存在しています。
(※2) 命令単位で通常の10倍以上の時間がかかりますが、結果そのものには差異はありません。

 今後も弊社では、TMPGEnc 3.0 XPressの開発にあたり、より一層のプログラムの最適化を行い、ソフトウェアの品質向上に努めさせていただきます。


※ 製品の仕様は予告無く変更される場合がございます。
※ Windows は米国 Microsoft Corporation 及び、その他の国における登録商標です。
※ その他の表記されている各種名称、商品名、社名などは各社の商標または登録商標です。また、本文中では(TM)、(R)マークは省略させていただきました。


本リリースに関するお問い合わせ先

Webによるお問い合わせはこちら

・URL : https://www.pegasys-inc.com/




前のページに戻る