Akamai Tech Meetup Tokyo — VPU vs CPU 品質比較
← プレイヤーへ
画質選択(両プレイヤー同時)
VPU

NETINT Quadra + AI前処理

h264_ni_quadra_enc + HVS_plus L2_NR2 + look-ahead 16

ストリーム接続中...
解像度
ビットレート
品質レベル
エンコーダ NETINT Quadra VPU
CPU

libx264 medium

libx264 -preset medium(AI前処理なし)

ストリーム接続中...
解像度
ビットレート
品質レベル
エンコーダ CPU libx264

リアルタイム負荷モニター LIVE

設定項目 NETINT Quadra VPU CPU libx264
エンコーダ h264_ni_quadra_enc libx264 -preset medium
AI 前処理 HVS_plus L2_NR2(Quadra DNN) — なし
ABR バリアント数 5 本(1080p / 720p / 480p / 360p / 240p) 1 本のみ(1080p)← 性能不足
リアルタイム処理速度 > 1.0x(余裕あり) 〜 1.12x(1 本が限界)
インスタンス月額
Akamai Cloud 公式価格
$306.60/月
T1U x1 Small(1 VPU + 8 vCPU)
$157.68/月
Dedicated 16GB(8 vCPU / 同等スペック)
ストリーム単価(月)
インスタンス費用 ÷ 最大処理能力
~$9.58 / ストリーム
$306.60 ÷ 32 本(T1U 定格: 32× 1080p30)
$157.68 / ストリーム
$157.68 ÷ 1 本(実測: medium × 1本 で CPU 75%)
NETINT Quadra VPU
プロセス CPU
VPU エンコーダ
AI エンジン
CPU libx264 (fast)
プロセス CPU
過去 5 分間の推移(5 秒間隔) · CPU 使用率は 8 コア合計に対する割合

ライブエンコーディング詳細比較 ENGINEER REFERENCE

LIVE ENCODING PIPELINE OBS Studio SRT 出力 latency=2s SRT AKAMAI CLOUD — ACCELERATED COMPUTE 8 vCPU + NETINT T1U VPU VPU FFmpeg AI 前処理 ni_quadra_ai_pre HVS_plus L2_NR2 Quadra DNN Engine ノイズ除去 + HVS 最適化 VPU Encode × 5 h264_ni_quadra_enc 1080p · 720p · 480p 360p · 240p HLS MPEG-TS HLS PUT UDP relay (-c copy) udp://127.0.0.1:9001 fifo_size=6MB · buffer_size=4MB CPU FFmpeg CPU Encode × 1 libx264 -preset medium 1080p のみ(性能限界) HLS PUT MSL5 HTTP PUT Primary + Backup Akamai CDN HLS 配信 cpcode: 2009456 VPU Player HLS.js 5 バリアント ABR ← このページ左 CPU Player HLS.js 1 バリアントのみ ← このページ右
パイプライン構成
ステージ NETINT Quadra VPU CPU libx264
入力プロトコルFFmpeg -i srt://0.0.0.0:9000
?mode=listener&latency=2000 OBS → SRT 直受信
udp://127.0.0.1:9001
?fifo_size=6291456&buffer_size=4194304 VPU FFmpeg → UDP 内部リレー経由
入力バッファ遅延・溢れ耐性 SRT latency=2000ms パケットロス再送ウィンドウ fifo_size=6 MB (≈4s@12Mbps)
overrun_nonfatal=1 エンコード速度変動を吸収; 溢れても継続
AI 前処理フィルタfilter_complex ni_quadra_ai_pre=
nb=HVS_plus_1080p_L2_NR2.nb Quadra DNN エンジン: HVS + L2 ノイズ除去
— なし
スケーリング処理解像度変換 ni_quadra_hwupload
→ ni_quadra_scale=W:H VPU ハードウェア処理 (CPU 負荷ゼロ)
scale=W:H libswscale / CPU ソフトウェア処理
同時出力1 FFmpeg プロセスあたり HLS 5 バリアント
1080p / 720p / 480p / 360p / 240p + UDP relay
HLS 1 バリアントのみ
1080p のみ — CPU 性能限界
FFmpeg エンコーダパラメータ
パラメータ NETINT Quadra VPU CPU libx264
コーデック-c:v h264_ni_quadra_enc libx264
プリセット / 品質プロファイル -xcoder-params
RcEnable=1:hvsQPEnable=1:
cuLevelRCEnable=0:
EnableRdoQuant=1:lookAheadDepth=16 VPU 専用オプション群 (xcoder-params)
-preset medium
-x264opts aq-mode=2:trellis=1
-rc-lookahead 16 libx264 標準オプション
Look-ahead先読みフレーム数 lookAheadDepth=16 VPU HW オフロード — CPU 負荷なし -rc-lookahead 16 CPU で 16フレーム先読み解析 — スレッド並列化が必要
QP 適応制御視覚的品質の均質化 hvsQPEnable=1 Human Visual System 特性に基づく QP 割り当て aq-mode=2 分散均等化 AQ (Auto-Quantization) — 複雑領域にビット集中
RDO 量子化Rate-Distortion 最適化 EnableRdoQuant=1 VPU がフルRDO量子化 (CPU 負荷なし) trellis=1 MB レベルのみ (trellis=2 sub-MB は CPU が間に合わず除外)
レート制御粒度RC granularity cuLevelRCEnable=0 CU 単位 RC 無効 → フレームレベル RC で画質一貫性を優先 — (libx264 非対応項目)
ビットレート / バッファ1080p バリアント -b:v 12000k -maxrate 13200k
-bufsize 24000k
同一設定 (identical)
GOP / キーフレーム -g 120 -keyint_min 120
固定 4 秒 GOP (30fps × 4s)
同一設定 (identical)
HLS セグメント出力フォーマット / バージョン -f hls -hls_time 4
-hls_segment_type mpegts
-hls_flags program_date_time+
delete_segments+independent_segments
+independent_segments → HLS v6 / ABR シーク品質向上
同一設定 (identical)
音声エンコードAAC / EXT-X-MEDIA AAC 192k × 1 本
EXT-X-MEDIA (agroup:aud)
全バリアントが同一 audio rendition を参照 → AAC エンコード 1 回に削減
AAC 192k × 1 本
EXT-X-MEDIA (同様)
音量正規化EBU R128 / loudnorm loudnorm
I=-16.0 LRA=11.0 TP=-1.5
YouTube/Twitch 業界標準 -16 LUFS; TP=-1.5 dBTP でクリップ防止
同一パラメータ
(独立適用)
master.m3u8 更新-master_pl_publish_rate publish_rate=1
毎セグメント再書き込み(EXT-X-MEDIA 使用時は必須)
同一設定 (identical)
リソース消費(実測値)
指標 NETINT Quadra VPU CPU libx264
プロセス CPU 使用率ps %cpu / 8コア換算 ~84% (≈10.5% / 8コア) エンコードは VPU HW が担う ~304% (≈38% / 8コア) trellis=1 で辛うじてリアルタイム達成 (trellis=2 では 576%)
FFmpeg スレッド数実行時 VPU 内部スケジューリング FFmpeg 側は FIFO 駆動 (ほぼ待機) 42 スレッド (libx264 auto) rc-lookahead=16 のフレーム並列解析に多スレッドが必要
ハードウェア オフロード エンコード (VPU) + AI 処理 (DNN エンジン) NETINT Quadra T1U 搭載チップ — なし (全処理が汎用 CPU)
最大スループット同一インスタンス 32× 1080p30 同時
NETINT T1U 定格スペック
1× 1080p30 が限界
8 vCPU 占有率 ~38% でリアルタイム到達 — 複数バリアント追加不可
ストリーム単価 (月)インスタンス費 ÷ 最大処理能力 ~$9.58 / ストリーム
$306.60 ÷ 32本 (T1U 定格)
~$157.68 / ストリーム
$157.68 ÷ 1本 (実測限界)