WebRTC C++ 实现是模块化类库,需手动集成信令、网络、编解码与渲染;须从源码编译libwebrtc,依赖depot_tools和Chromium构建系统,核心类包括PeerConnectionFactory、PeerConnection及MediaStream等,不提供开箱即用通话接口。

WebRTC 的 C++ 实现主要面向嵌入式、桌面客户端或服务端媒体处理场景,比如自研音视频 SDK、浏览器外的 P2P 通信、边缘媒体服务器等。它不直接提供开箱即用的“一键通话”接口,而是以模块化 C++ 类库形式交付,需要你手动组装信令、网络、编解码、渲染等环节。
核心依赖:先编译好 libwebrtc
官方不发布预编译二进制包,必须从源码构建。主流方式是用 depot_tools 拉取 Chromium 源码并编译:
- 克隆 depot_tools,加入 PATH
- 运行 fetch --nohooks webrtc 下载完整 WebRTC 源码(约 15GB)
- 执行 gclient sync 同步子模块
- 用 gn 生成 ninja 构建配置(例如:gn gen out/Debug --args='is_debug=true is_clang=false target_cpu="x64"')
- 运行 ninja -C out/Debug rtc_sdk 编译出 libwebrtc.a(Linux/macOS)或 webrtc.lib(Windows)
注意:编译耗时长、磁盘占用大,建议在 Linux/macOS 上操作;Windows 需 Visual Studio 2022 + Windows SDK 10.0.22621+。
关键类与最小通信流程
C++ API 围绕几个核心类展开,典型 P2P 连接流程如下:
立即学习“C++免费学习笔记(深入)”;
- PeerConnectionFactory:全局工厂,创建所有其他对象(需传入网络、音频/视频设备、线程管理器)
- PeerConnection:核心连接对象,负责 SDP 协商、ICE 收集、DTLS/SRTP 加密、媒体传输
- MediaStream / AudioTrack / VideoTrack:封装音视频流和轨道,通过 SetLocalDescription 和 SetRemoteDescription 参与信令交换
- VideoEncoder/DecoderFactory:默认使用内置 VP8/VP9/H.264 编解码器,也可注入自定义硬件编码器(如 NVENC、QuickSync)
你不需要自己实现 RTP 组包/拆包或 SRTP 加解密——这些由底层 webrtc::RtpTransport 和 webrtc::DtlsTransport 自动完成。
信令与网络层你得自己搭
WebRTC C++ 不包含信令通道(offer/answer/ice-candidate 交换),也不绑定具体网络协议:
- 信令可走 WebSocket、HTTP POST、MQTT 或任意自定义 TCP/UDP 协议
- 网络 I/O 由你提供 webrtc::NetworkInterface 实现(通常基于 socket 封装),或直接复用 rtc::SocketServer + rtc::Thread
- ICE Agent 默认使用 webrtc::BasicPortAllocator,支持 STUN/TURN,但 TURN 凭据、URL 需手动配置
示例片段:创建 PeerConnection 时传入自定义 port allocator 和 observer:
rtc::scoped_refptr<:peerconnectioninterface> pc = pc_factory->CreatePeerConnection(allocator, &config, nullptr, nullptr, observer);音视频采集与渲染要对接系统层
WebRTC C++ 不自带摄像头/麦克风驱动,需桥接平台 API:
- Linux:用 V4L2 读取摄像头,ALSA/PulseAudio 采集音频 → 封装为 webrtc::VideoCapturer 和 webrtc::AudioSourceInterface
- macOS:用 AVFoundation 获取 AVCaptureSession 输出 → 转成 I420 帧送入 webrtc::VideoTrackSource
- Windows:用 Media Foundation 或 DirectShow → 注意线程模型与 RTC 内部 rtc::Thread 对齐
- 渲染侧:继承 webrtc::VideoRendererInterface,把 OnFrame() 回调的 webrtc::VideoFrame 绘制到 OpenGL/Vulkan/DX11 窗口
音频播放同理,需实现 webrtc::AudioSinkInterface 并写入声卡缓冲区。











