同一ビットレート・同一 ABR ラダー(1080p〜240p)で、VPU + AI 前処理と CPU libx264 の画質差をリアルタイムで比較できます。
h264_ni_quadra_enc + HVS_plus L2_NR2 + look-ahead 16
libx264 -preset medium(AI前処理なし)
| 設定項目 | NETINT Quadra VPU | CPU libx264 |
|---|---|---|
| エンコーダ | h264_ni_quadra_enc | libx264 -preset medium |
| AI 前処理 | HVS_plus L2_NR2(Quadra DNN) | — なし |
| ABR バリアント数 | 5 本(1080p / 720p / 480p / 360p / 240p) | 1 本のみ(1080p)← 性能不足 |
| リアルタイム処理速度 | > 1.0x(余裕あり) | 〜 1.12x(1 本が限界) |
| インスタンス月額 Akamai Cloud 公式価格 |
$306.60/月 T1U x1 Small(1 VPU + 8 vCPU) |
$157.68/月 Dedicated 16GB(8 vCPU / 同等スペック) |
| ストリーム単価(月) インスタンス費用 ÷ 最大処理能力 |
~$9.58 / ストリーム $306.60 ÷ 32 本(T1U 定格: 32× 1080p30) |
$157.68 / ストリーム $157.68 ÷ 1 本(実測: medium × 1本 で CPU 75%) |
| ステージ | NETINT Quadra VPU | CPU libx264 |
|---|---|---|
| 入力プロトコルFFmpeg -i | srt://0.0.0.0:9000 ?mode=listener&latency=2000 OBS → SRT 直受信 |
udp://127.0.0.1:9001 ?fifo_size=6291456&buffer_size=4194304 VPU FFmpeg → UDP 内部リレー経由 |
| 入力バッファ遅延・溢れ耐性 | SRT latency=2000ms パケットロス再送ウィンドウ | fifo_size=6 MB (≈4s@12Mbps) overrun_nonfatal=1 エンコード速度変動を吸収; 溢れても継続 |
| AI 前処理フィルタfilter_complex | ni_quadra_ai_pre= nb=HVS_plus_1080p_L2_NR2.nb Quadra DNN エンジン: HVS + L2 ノイズ除去 |
— なし |
| スケーリング処理解像度変換 | ni_quadra_hwupload → ni_quadra_scale=W:H VPU ハードウェア処理 (CPU 負荷ゼロ) |
scale=W:H libswscale / CPU ソフトウェア処理 |
| 同時出力1 FFmpeg プロセスあたり | HLS 5 バリアント 1080p / 720p / 480p / 360p / 240p + UDP relay |
HLS 1 バリアントのみ 1080p のみ — CPU 性能限界 |
| パラメータ | NETINT Quadra VPU | CPU libx264 |
|---|---|---|
| コーデック-c:v | h264_ni_quadra_enc | libx264 |
| プリセット / 品質プロファイル | -xcoder-params RcEnable=1:hvsQPEnable=1: cuLevelRCEnable=0: EnableRdoQuant=1:lookAheadDepth=16 VPU 専用オプション群 (xcoder-params) |
-preset medium -x264opts aq-mode=2:trellis=1 -rc-lookahead 16 libx264 標準オプション |
| Look-ahead先読みフレーム数 | lookAheadDepth=16 VPU HW オフロード — CPU 負荷なし | -rc-lookahead 16 CPU で 16フレーム先読み解析 — スレッド並列化が必要 |
| QP 適応制御視覚的品質の均質化 | hvsQPEnable=1 Human Visual System 特性に基づく QP 割り当て | aq-mode=2 分散均等化 AQ (Auto-Quantization) — 複雑領域にビット集中 |
| RDO 量子化Rate-Distortion 最適化 | EnableRdoQuant=1 VPU がフルRDO量子化 (CPU 負荷なし) | trellis=1 MB レベルのみ (trellis=2 sub-MB は CPU が間に合わず除外) |
| レート制御粒度RC granularity | cuLevelRCEnable=0 CU 単位 RC 無効 → フレームレベル RC で画質一貫性を優先 | — (libx264 非対応項目) |
| ビットレート / バッファ1080p バリアント | -b:v 12000k -maxrate 13200k -bufsize 24000k |
同一設定 (identical) |
| GOP / キーフレーム | -g 120 -keyint_min 120 固定 4 秒 GOP (30fps × 4s) |
同一設定 (identical) |
| HLS セグメント出力フォーマット / バージョン | -f hls -hls_time 4 -hls_segment_type mpegts -hls_flags program_date_time+ delete_segments+independent_segments +independent_segments → HLS v6 / ABR シーク品質向上 |
同一設定 (identical) |
| 音声エンコードAAC / EXT-X-MEDIA | AAC 192k × 1 本 EXT-X-MEDIA (agroup:aud) 全バリアントが同一 audio rendition を参照 → AAC エンコード 1 回に削減 |
AAC 192k × 1 本 EXT-X-MEDIA (同様) |
| 音量正規化EBU R128 / loudnorm | loudnorm I=-16.0 LRA=11.0 TP=-1.5 YouTube/Twitch 業界標準 -16 LUFS; TP=-1.5 dBTP でクリップ防止 |
同一パラメータ (独立適用) |
| master.m3u8 更新-master_pl_publish_rate | publish_rate=1 毎セグメント再書き込み(EXT-X-MEDIA 使用時は必須) |
同一設定 (identical) |
| 指標 | NETINT Quadra VPU | CPU libx264 |
|---|---|---|
| プロセス CPU 使用率ps %cpu / 8コア換算 | ~84% (≈10.5% / 8コア) エンコードは VPU HW が担う | ~304% (≈38% / 8コア) trellis=1 で辛うじてリアルタイム達成 (trellis=2 では 576%) |
| FFmpeg スレッド数実行時 | VPU 内部スケジューリング FFmpeg 側は FIFO 駆動 (ほぼ待機) | 42 スレッド (libx264 auto) rc-lookahead=16 のフレーム並列解析に多スレッドが必要 |
| ハードウェア オフロード | エンコード (VPU) + AI 処理 (DNN エンジン) NETINT Quadra T1U 搭載チップ | — なし (全処理が汎用 CPU) |
| 最大スループット同一インスタンス | 32× 1080p30 同時 NETINT T1U 定格スペック |
1× 1080p30 が限界 8 vCPU 占有率 ~38% でリアルタイム到達 — 複数バリアント追加不可 |
| ストリーム単価 (月)インスタンス費 ÷ 最大処理能力 | ~$9.58 / ストリーム $306.60 ÷ 32本 (T1U 定格) |
~$157.68 / ストリーム $157.68 ÷ 1本 (実測限界) |