株式会社ペガシスは、次期製品「TMPGEnc 3.0 XPress(ティーエムペグエンク 3.0 エクスプレス)」において、最新の「HTテクノロジ インテル Pentium 4 プロセッサ (コード名: Prescott)」の「ストリーミングSIMD拡張命令3 (SSE3)」に正式対応すると発表いたします。
インテル ストリーミングSIMD拡張命令3 (以下SSE3)とは、インテル社が90nmプロセス技術で製造する、新しい 「HTテクノロジ インテル Pentium 4 プロセッサ (コード名: Prescott)」に搭載されるマルチメディア拡張命令セットで、このSSE3 に最適化を行ったソフトウェアは従来までのものと比較し、より効率的かつ高度な処理を実現します。
現在、次期製品として開発中である製品 「TMPGEnc 3.0 XPress (※1)」(2004年春発売予定) では、従来のインテル Pentium 4 プロセッサに加えて、SSE3を導入した最新のHTテクノロジ インテル Pentium 4 プロセッサへの最適化を行っております。
(※1) 現在、弊社製品である「TMPGEnc Plus 2.5」ユーザー向けに、β版プログラムの配布を行っております。
詳しくはこちらをご覧下さい。
尚、本発表にあたりインテル株式会社 マーケティング本部長 ケヴィン・セラーズ氏より下記のコメントを頂戴しています。
「インテルは、最新のHTテクノロジ インテル Pentium4 プロセッサにチューンされたTMPGEnc 3.0 XPress のリリースを歓迎いたします。高い処理性能が要求されるビデオのエンコーディングの作業に、90nmプロセスで製造される最新のHTテクノロジ インテル Pentium4 プロセッサは、卓越した環境を提供します。」
インテル株式会社 マーケティング本部長 ケヴィン・セラーズ
|
TMPGEnc 3.0 XPress での SSE3 の実際の高速化適用について
TMPGEnc 3.0 XPressでは最新のHTテクノロジ インテル Pentium 4 プロセッサに追加されたSSE3新命令のうち、メモリアクセスを強化する命令を利用して、MPEG-1/2エンコーダを中心として最適化を行っています。特に、動き検索の高速化では、SSE3が大きな効果を発揮しております。また、従来から最適化を行っていたプログラムも、HTテクノロジ インテル Pentium 4 プロセッサが持つパフォーマンスを更に活かせるように、全体的な見直しと高速化を行っています。
以上により、
|
1. |
MPEGエンコードにおける重要な処理である動き検索時のメモリアクセス処理
|
|
2.
|
プログラム全体のメモリアクセスペナルティの軽減
|
|
3.
|
従来のHTテクノロジ インテル Pentium 4 プロセッサとの単体性能比較による
コード最適化
|
を達成致しました。
■SSE3最適化済みTMPGEnc 3.0 XPressの弊社でのベンチマーク結果■
素材
|
こちらで公開中のTMPGEnc 3.0 XPress デモムービー (6Mbps 48.5MB)
CRI Middleware様の提供デモ 「機神」 (C)2003 CRI Middleware Co.,LTD
|
テスト内容
|
上記ファイルをTMPGEnc 3.0 XPress MPEG-2 リーダーにて読み込み、MPEG-2 エンコードを行う
|
エンコード設定
|
DVD NTSC設定 CBR 6000kbps 動き検索「高精度」 音声MP2 384kbps
エンコード設定ファイル
|
環境設定
|
CPU関連 CPU毎に可能な命令は全て有効
マルチスレッド関連 全て有効
キャッシュ設定 無効
|
ハードウェア環境
|
同一HDDへMPEG2 ファイルの書き出し
|
SINGLE CPU ベンチマーク結果 (参考値)
|
CPU
|
OS
|
クロック
|
所要時間
|
Pentium4
(SSE3 有効)
|
Prescott
|
Windows XP Professional
|
3000MHz
|
2:00
|
Pentium4
|
Northwood
|
Windows XP Professional
|
3200MHz
|
2:01
|
Pentium4
(SSE3 無効)
|
Prescott
|
Windows XP Professional
|
3000MHz
|
2:13
|
Athlon64
|
ClawHammer
|
Windows XP Professional
|
3200+
|
3:01
|
AthlonXP
|
Barton
|
Windows XP Professional
|
2800+
|
3:13
|
Celeron
|
Northwood
|
Windows XP Professional
|
2000MHz
|
4:48
|
Pentium4M
|
Northwood
|
Windows XP Home
|
1500MHz
|
6:11
|
Pentium3
|
Coppermine
|
Windows 2000 Professional
|
1000MHz
|
11:27
|
Crusoe
|
TM5600
|
Windows 2000 Professional
|
600MHz
|
57:51:00
|
DUAL CPU ベンチマーク結果 (参考値)
|
CPU
|
OS
|
クロック
|
所要時間
|
Pentium4 Xeon
|
Northwood
|
Windows XP Professional
|
3060MHz×2
|
1:13
|
Opteron
|
SledgeHammer
|
Windows XP 64Bitβ
|
2000MHz×2
|
1:34
|
Pentium4 Xeon
|
Northwood
|
Windows server 2003
|
2400MHz×2
|
1:47
|
※株式会社ペガシス調べ
※このベンチマーク結果はマシン環境(メモリ、HDD等)などが個々のマシンにより異なりますので、あくまで参考値となります
このベンチマークテストの結果、SSE3 最適化によるエンコード速度の向上によって、ワンランク動作クロックの高い従来 HT テクノロジ インテル Pentium4 プロセッサ 3.2GHz に、最新のHTテクノロジ インテル Pentium 4 プロセッサ 3GHz が勝る処理速度を発揮していることを確認することができます。
TMPGEnc を Opteron, Athlon64 上で実行した場合、SSE2命令を有効にすると、無効である場合に比べて実行速度が低下することが確認されています。これはSSE, SSE2 の浮動小数点命令と整数命令を互いに依存関係がある状況の下、混在して使用すると、著しくパフォーマンスが低下する(※2)と言うOpteron, Athlon64 の特性が原因であり、将来的にCPU側の仕様が変更されることにより改善するものと思われます。
TMPGEnc内では主にDCTやNRフィルタをはじめとして、各部に該当するコードが存在しています。
(※2) 命令単位で通常の10倍以上の時間がかかりますが、結果そのものには差異はありません。
今後も弊社では、TMPGEnc 3.0 XPressの開発にあたり、より一層のプログラムの最適化を行い、ソフトウェアの品質向上に努めさせていただきます。
※ 製品の仕様は予告無く変更される場合がございます。
※ Windows は米国 Microsoft Corporation 及び、その他の国における登録商標です。
※ その他の表記されている各種名称、商品名、社名などは各社の商標または登録商標です。また、本文中では(TM)、(R)マークは省略させていただきました。
|