VPU vs CPU 品質比較 — Akamai Tech Meetup Tokyo

Akamai Tech Meetup Tokyo — VPU vs CPU 品質比較

← プレイヤーへ

画質選択（両プレイヤー同時）

VPU

NETINT Quadra + AI前処理

h264_ni_quadra_enc + HVS_plus L2_NR2 + look-ahead 16

ストリーム接続中...

解像度 —

ビットレート —

品質レベル —

エンコーダ NETINT Quadra VPU

CPU

libx264 medium

libx264 -preset medium（AI前処理なし）

ストリーム接続中...

解像度 —

ビットレート —

品質レベル —

エンコーダ CPU libx264

リアルタイム負荷モニター LIVE

設定項目	NETINT Quadra VPU	CPU libx264
エンコーダ	h264_ni_quadra_enc	libx264 -preset medium
AI 前処理	HVS_plus L2_NR2（Quadra DNN）	— なし
ABR バリアント数	5 本（1080p / 720p / 480p / 360p / 240p）	1 本のみ（1080p）← 性能不足
リアルタイム処理速度	> 1.0x（余裕あり）	〜 1.12x（1 本が限界）
インスタンス月額 Akamai Cloud 公式価格	$306.60/月 T1U x1 Small（1 VPU + 8 vCPU）	$157.68/月 Dedicated 16GB（8 vCPU / 同等スペック）
ストリーム単価（月）インスタンス費用 ÷ 最大処理能力	~$9.58 / ストリーム $306.60 ÷ 32 本（T1U 定格: 32× 1080p30）	$157.68 / ストリーム $157.68 ÷ 1 本（実測: medium × 1本で CPU 75%）

NETINT Quadra VPU

プロセス CPU

—

VPU エンコーダ

—

AI エンジン

—

CPU libx264 (fast)

プロセス CPU

—

過去 5 分間の推移（5 秒間隔） · CPU 使用率は 8 コア合計に対する割合

ライブエンコーディング詳細比較 ENGINEER REFERENCE

パイプライン構成

ステージ	NETINT Quadra VPU	CPU libx264
入力プロトコルFFmpeg -i	srt://0.0.0.0:9000 ?mode=listener&latency=2000 OBS → SRT 直受信	udp://127.0.0.1:9001 ?fifo_size=6291456&buffer_size=4194304 VPU FFmpeg → UDP 内部リレー経由
入力バッファ遅延・溢れ耐性	SRT latency=2000ms パケットロス再送ウィンドウ	fifo_size=6 MB (≈4s@12Mbps) overrun_nonfatal=1 エンコード速度変動を吸収; 溢れても継続
AI 前処理フィルタfilter_complex	ni_quadra_ai_pre= nb=HVS_plus_1080p_L2_NR2.nb Quadra DNN エンジン: HVS + L2 ノイズ除去	— なし
スケーリング処理解像度変換	ni_quadra_hwupload → ni_quadra_scale=W:H VPU ハードウェア処理 (CPU 負荷ゼロ)	scale=W:H libswscale / CPU ソフトウェア処理
同時出力1 FFmpeg プロセスあたり	HLS 5 バリアント 1080p / 720p / 480p / 360p / 240p + UDP relay	HLS 1 バリアントのみ 1080p のみ — CPU 性能限界

FFmpeg エンコーダパラメータ

パラメータ	NETINT Quadra VPU	CPU libx264
コーデック-c:v	h264_ni_quadra_enc	libx264
プリセット / 品質プロファイル	-xcoder-params RcEnable=1:hvsQPEnable=1: cuLevelRCEnable=0: EnableRdoQuant=1:lookAheadDepth=16 VPU 専用オプション群 (xcoder-params)	-preset medium -x264opts aq-mode=2:trellis=1 -rc-lookahead 16 libx264 標準オプション
Look-ahead先読みフレーム数	lookAheadDepth=16 VPU HW オフロード — CPU 負荷なし	-rc-lookahead 16 CPU で 16フレーム先読み解析 — スレッド並列化が必要
QP 適応制御視覚的品質の均質化	hvsQPEnable=1 Human Visual System 特性に基づく QP 割り当て	aq-mode=2 分散均等化 AQ (Auto-Quantization) — 複雑領域にビット集中
RDO 量子化Rate-Distortion 最適化	EnableRdoQuant=1 VPU がフルRDO量子化 (CPU 負荷なし)	trellis=1 MB レベルのみ (trellis=2 sub-MB は CPU が間に合わず除外)
レート制御粒度RC granularity	cuLevelRCEnable=0 CU 単位 RC 無効 → フレームレベル RC で画質一貫性を優先	— (libx264 非対応項目)
ビットレート / バッファ1080p バリアント	-b:v 12000k -maxrate 13200k -bufsize 24000k	同一設定 (identical)
GOP / キーフレーム	-g 120 -keyint_min 120 固定 4 秒 GOP (30fps × 4s)	同一設定 (identical)
HLS セグメント出力フォーマット / バージョン	-f hls -hls_time 4 -hls_segment_type mpegts -hls_flags program_date_time+ delete_segments+independent_segments +independent_segments → HLS v6 / ABR シーク品質向上	同一設定 (identical)
音声エンコードAAC / EXT-X-MEDIA	AAC 192k × 1 本 EXT-X-MEDIA (agroup:aud) 全バリアントが同一 audio rendition を参照 → AAC エンコード 1 回に削減	AAC 192k × 1 本 EXT-X-MEDIA (同様)
音量正規化EBU R128 / loudnorm	loudnorm I=-16.0 LRA=11.0 TP=-1.5 YouTube/Twitch 業界標準 -16 LUFS; TP=-1.5 dBTP でクリップ防止	同一パラメータ（独立適用）
master.m3u8 更新-master_pl_publish_rate	publish_rate=1 毎セグメント再書き込み（EXT-X-MEDIA 使用時は必須）	同一設定 (identical)

リソース消費（実測値）

指標	NETINT Quadra VPU	CPU libx264
プロセス CPU 使用率ps %cpu / 8コア換算	~84% (≈10.5% / 8コア) エンコードは VPU HW が担う	~304% (≈38% / 8コア) trellis=1 で辛うじてリアルタイム達成 (trellis=2 では 576%)
FFmpeg スレッド数実行時	VPU 内部スケジューリング FFmpeg 側は FIFO 駆動 (ほぼ待機)	42 スレッド (libx264 auto) rc-lookahead=16 のフレーム並列解析に多スレッドが必要
ハードウェアオフロード	エンコード (VPU) + AI 処理 (DNN エンジン) NETINT Quadra T1U 搭載チップ	— なし (全処理が汎用 CPU)
最大スループット同一インスタンス	32× 1080p30 同時 NETINT T1U 定格スペック	1× 1080p30 が限界 8 vCPU 占有率 ~38% でリアルタイム到達 — 複数バリアント追加不可
ストリーム単価 (月)インスタンス費 ÷ 最大処理能力	~$9.58 / ストリーム $306.60 ÷ 32本 (T1U 定格)	~$157.68 / ストリーム $157.68 ÷ 1本 (実測限界)