1. 引言

近年来,直播竞答、网络游戏直播等新的实时音视频通讯场景不断推陈出新,并成为引领互联网娱乐风向的弄潮儿。实时音视频应用的爆发,也使得WebRTC(Web Real-Time Communication,网页实时通信技术,)技术成为了人们关注的焦点。如何打造自己的WebRTC 服务器呢?下面我先来介绍一下WebRTC 服务器的一些基本内容:

首先,我们会先来了解下一些开源的服务器是怎么做的,我们做事情,在没有头绪的基础上,参考和模仿可能是一种必然流程,毕竟站在巨人的肩膀上,我们的视野才更加开阔。

其次,通过形形色色的开源服务器介绍和理解,我们初步的去分析一个WebRTC 服务器究竟包含哪些模块,又是一个什么样的组织架构和层次关系。后面在服务器搭建后面临的丢包和多人通话问题又有什么解决方式。最后就是展望一下整个WebRTC未来发展。

2. 开源的WebRTC 服务器介绍

我们进入第一部分:WebRTC开源服务器介绍,这个模块我选择了我认为很有代表意义的3种类型的WebRTC 开源服务器

大而全的Kurento

之所以称Kurento为大而全,是因为Kurento 强大的滤镜和计算机视觉,我们看这张图:

webrtc技术简介(如何打造自己的WebRTC)(1)

Kurento功能图

通过这张图我们了解到Kurento不仅仅包含了普通流媒体服务器的SFU MCU Transcoding Recording等基本功能,还包含了强大的滤镜和计算机视觉处理功能,而且,在整体的功能上不仅仅包含WebRTC 模块还有很多其他协议支持,诸如SIP RTMP RTSP 等协议,更准确的说Kurento 更像是一个融合通信平台,而且Kurento,基于插件式编程方式,很容易扩展自己的功能模块。

Kurento 在应用中有哪些问题,或者说,哪些是优势,哪些是劣势呢,我们看下面:

优势:

劣势:

小而美的Mediasoup

Mediasoup是一个很新的WebRTC服务器,专注WebRTC 的相关功能开发,专注做好这一件事,很小确很美。下面这样图是Mediasoup 大致的一个基本架构图:

webrtc技术简介(如何打造自己的WebRTC)(2)

Mediasoup 架构

Mediasoup

优势:

劣势:

务实主义的Licode

说了两款极端的WebRTCserver ,我们最后讲一个务实主义的Licode ,为什么称Licode 为务实主义?Licode 这款服务器完全是站在一个PAAS 平台,一个业务的角度去思考问题,去构建整个系统,很务实,很实际,我们看Licode架构图:

webrtc技术简介(如何打造自己的WebRTC)(3)

Licode 架构图

架构很清晰:

用户端:

服务端:

开发者方面:

业务接入的API模块

服务器内部:

整个服务架构内部各个服务模块通过MQ 消息总线进行数据通信,做了一个服务器要做的基本功能,同时微服务化,很符合现在服务器开发的方向。

Licode 作为WebRTC 服务器有很多优势:

缺点:

总结

webrtc技术简介(如何打造自己的WebRTC)(4)

这么多服务器怎么选择呢?看自己的业务需求,团队能力,项目周期。

有能力的团队可以尝试选Kurento,讲求平衡快速选择Licode,追求极致Mediasoup 很符合选择。

相关视频推荐:

C/C 程序员进入互联网公司的捷径-WebRTC开发_哔哩哔哩_bilibili

手把手实现WebRTC音视频通话|WebRTC音视频通话逻辑剖析、如何通过代码实现音视频通话_哔哩哔哩_bilibili

学习地址:【免费】FFmpeg/WebRTC/RTMP/NDK/Android音视频流媒体高级开发-学习视频教程-腾讯课堂

需要更多ffmpeg/webrtc..音视频流媒体开发学习资料加群812855908领取

webrtc技术简介(如何打造自己的WebRTC)(5)

3 WebRTC 服务端分析

到底WebRTC 是个什么东西,又包含哪些模块呢,我们从下面几个方面逐一分析:

基本组件

webrtc技术简介(如何打造自己的WebRTC)(6)

基本模块

图中我列出了基本的组件:

Rtp/Rtcp Dtls ICE是基本组件相对实现比较容易,这个我们不做过多介绍,我们着重介绍下SDP 这个协议

SDP 演进

SDP 伴随着WebRTC 的发展,经历了很多变化,我把这个过程归纳为两个阶段:

PlanA

每个stream 对应一个peer 多个stream 对应多个peer,整体运行图如下:

webrtc技术简介(如何打造自己的WebRTC)(7)

PlanA

下面是PlanA 的SDP 结构:

webrtc技术简介(如何打造自己的WebRTC)(8)

没什么新奇的地方,大家都应该比较熟悉了,我们不做介绍了。

PlanB UnifiedPlan:

one peer multi stream, 单个peer 可以拥有多个steam ,整体运行图如下:

webrtc技术简介(如何打造自己的WebRTC)(9)

PlanB UnifiedPlan

其中PlanB 是Chrome SDP 多流方案,而UnifiedPlan是Firefox 的多流标准同时也是JSEP的标准多流方案,所以UnifiedPlan是我们关注的重点。

我们先来看看PlanB 的多流SDP 大致内容:

webrtc技术简介(如何打造自己的WebRTC)(10)

PlanB SDP

PlanB 和 PlanA 相比,基本组织形式是相同的。我们看标红的地方,PlanB 组织多流的方式是通过msid来完成,每个msid 对应一条媒体流. 每个msid下面是自己的传输信息,所以在PlanB 方案下,我们可以通过msid来标记用户。

我们再来看看UnifiedPlan,下面是一个UnifiedPlan 部分SDP:

webrtc技术简介(如何打造自己的WebRTC)(11)

UnifiedPlan

UnifiedPlan通过加多个m 标签,来组织多流,每条流分配一个m 标签,后面跟着自己的attribute 描述,另外group 行业进行了修改,以每个track 进行描述。当然UnifiedPlan 里面也是msid 可以用来标记用户。

相比 PlanB,UnifiedPlan SDP更加清晰,自然,当然问题是数据量比计较大,因为有很多冗余字段,当然作为JSEP 的标准,我们必须更加关注UnifiedPlan 方案。另外Firefox 里面mid 长度不能超过16位,在大家的服务器上产生UnifiedPlan 格式的SDP时注意一下。

PlanBUnifiedPlan 方案优势:

WebRTC 层次架构

说完基本组件,我们开始介绍WebRTC 服务端,分3个层面:

接口层

接口层主要为PeerConnectionInterface接口实现,主要提供诸如一下内容:

webrtc技术简介(如何打造自己的WebRTC)(12)

控制层

控制层也就是我们所说的SDP 模块,控制整个系统的运行表现,包括编解码参数,流控方式,Dtls 加解密参数以及ICE穿透用的地址候选。

webrtc技术简介(如何打造自己的WebRTC)(13)

传输层

先看图:

webrtc技术简介(如何打造自己的WebRTC)(14)

传输层分为3个层次,媒体打包(RTP/RTCP),数据安全(DtlsTransport),Ice P2P 传输模块(IceTransport)。

了,这里我们了解全部系统组件,将系统组件叠加,我们就得到了,下面是一个完整的WebRTC 组件的一个层次结构:

webrtc技术简介(如何打造自己的WebRTC)(15)

分为3层:接口层,提供基本的peer 接口功能,控制层,主要是SDP 的解析和生成工作,最后传输层,提供媒体打包,传输,流控,安全,ICE 等功能。

4. 通信优化

分两个层面去讲:

对抗丢包

使用场景 low RTT 或者延时不敏感场景

冗余换取实时性和丢包。增强带宽抢占能力,这才是FEC 最主要的用途。

两种方式各有优缺点,NACK代价是延时,FEC的代价是带宽,显然在高清会议中不适用FEC 方式。比较可取的方式是FEC NACK, 低延时环境下,尽量采用重传,高延时生成适度的FEC数据包,对数据进行选择性重传。

多人通信

多人通信是一个令人的头疼的问题,因为面临以下几个问题:

不同用户网络带宽

先看第一个,我们都知道在通信中,用户的带宽往往是不对等的,怎么样做到按需供给,总体来说我们有一下几种方式:

先转码方案:

webrtc技术简介(如何打造自己的WebRTC)(16)

服务端对用户发来的数据进行二次编码,服务端根据用户的网络情况,提供给用户不同质量的码流,这种方式服务压力大,延迟大,硬件成本高,比较适合小规模视频会议,或者发言人较少的场景。

SVC方案:

编码器产生的码流包含一个或多个可以单独解码的子码流,子码流可以具有不同的码率,帧率和空间分辨率。

分级的类型:

时域可分级(Temporalscalability):可以从码流中提出具有不同帧频的码流。

空间可分级(Spatialscalability):可以从码流中提出具有不同图像尺寸的码流。

质量可分级(Qualityscalability):可以从码流中提出具有不同图像质量的码流。

webrtc技术简介(如何打造自己的WebRTC)(17)

分层结构图

SVC可以组合提供不同质量的码流,服务器可以根据用户网络情况选择一路进行转发,

SVC 应该是最好的对抗丢包的方式,可惜WebRTC 不能用,这里我们不做深入研究,H264SVC RTP打包情况可以参考rtc6190

Simulcast(多流) 方案:

如图:

webrtc技术简介(如何打造自己的WebRTC)(18)

客户端同时发送多种码率到服务端,然后服务端进行选择性转发,这种方案,发送端上传压力大,而且编码压力也大,但是,这是唯一一种WebRTC 支持的针对多人通话的技术。

下面我们看看如何开启这种技术:

Chrome并没有提供直接的接口用于开启多流方案,我们在Chrome 系列中只能通过修改的本段的SDP 来开启多流方案,如图:

webrtc技术简介(如何打造自己的WebRTC)(19)

通过修改SDP 加入SIM 标志开启多流,开启几条,就多加入几条ssrc 信息

Firefox 提供了直接的接口用于开启多流方案,如下图:

webrtc技术简介(如何打造自己的WebRTC)(20)

Firefox直接通过RtpSender 的 SetParameters 接口开启多流,简单方便,这也是Firefox 相比较Chrome更好的地方,更加遵从WebRTC标准。

另外在Rtp的传输上Chrome和Firefox 是不同的:

>>>Chrome:

通过ssrc 对应多流方案,每个ssrc对应一种多流

a=ssrc-group:SIM2098403539(low) 2098403540(medium) 2098403541(high)

>>>Firefox:

通过urn:ietf:params:rtp-hdrext:sdes:rtp-stream-idRtp协议头的扩展来完成多流和ssrc 的对应关系,进而完成传输。

不同运营商

webrtc技术简介(如何打造自己的WebRTC)(21)

中国运营商主要有电信 移动和联通,另外包括很多小运营上和结构运营商,运营商很多,而且由于运营商之间的网络宽口问题,跨网通信延迟大,网络不稳定,针对这种情况,我们基于DNS重定向,分配给用户运行商相同的服务器,这里说一句,运营商分类的判断,需要很久的运维经验和数据作为支撑,这也是我们的PP云的优势所在,我们PP云有十几年的运营数据作为支撑,这些数据不仅帮我们构建更加快速的服务器网络,而且还可以帮我们为用户定位到最优的服务器,进而解决最后一英里的网络传输问题。

5 WebRTC 未来展望为AI 赋能

AI 的发展,赋予了WebRTC更多的应用空间,比如基于人脸和语音识别的网站和APP 登录系统,前端通过WebRTC 进行视频数据的采集和传输,后台通过AI智能分析比对结果,进而完成登录,简单,方便。

安防领域

我们知道安防领域比较多的协议包括ONVIF,GB28181 RTSP,这几个协议在网页端无法直接观看,智能借助于插件,插件面临兼容和安全问题,体验很差,有的摄像头支持RTMP观看,但是很遗憾,2020年flash 将退出历史舞台,HLS延时大,而无插件,极速都是WebRTC 的优势所在,我相信不救的将来WebRTC 在安防领域会占据一席之地。

6. 结语:

WebRTC1.0 已经定稿,这为WebRTC的未来发展提供了方向,并且WebRTC 无论是应用还是社区都处于高速发展状态,并且Google也在不断地提供和完善WebRTC 的相关功能,我相信WebRTC 的未来无可限量。

,