|
基于SIP协议的视频通讯
刘劲
1. SIP协议及其发展
Sip(Session Initiation Protocal)称为会话发起协议,是由IETF(Internet
Engineering Task Force)组织于1999年提出的一个在基于IP网络中,特别是在Internet这样一种结构的网络环境中,实现实时通讯应用的一种信令协议。而所谓的会话(Session),就是指用户之间的数据交换。在基于SIP协议的应用中,每一个会话可以是各种不同的数据,可以是普通的文本数据,也可以是经过数字化处理的音频、视频数据,还可以是诸如游戏等应用的数据,应用具有巨大的灵活性。
作为一个IETF提出的标准,SIP协议在很大程度上借鉴了其他各种广泛存在的Internet协议,
如HTTP(超文本传输协议)、SMTP(简单邮件传输协议)等,和这些协议一样SIP也采用的基于文本的编码方式,这也是SIP协议同视频通讯领域其他现有标准相比最大的特点之一。
SIP协议的提出和发展,是伴随着Internet的发展而发展的,到目前为止它走过了一下几个阶段:
· 1996年首先出现了SIP的概念,这时SIP的主要应用是针对Internet上的各种文本应用,如电子邮件、文字聊天等;
· 1999年3月,ITEF的多方多媒体会晤控制(MMUSIC)工作组提出了RFC2543建议,供各厂商和机构讨论;
· 1999年9月,SIP工作组从MMUSIC中分离并独立出来,成立了SIP工作组,并与2000年7月发表了SIP的草案;
· 2002年6月,ITEF的SIP工作组又发表了RFC3261建议,以取代RFC2543。
由于网络环境以及相关多媒体技术的不足,在SIP协议首次提出的时候,仅仅针对各种文本应用,随着技术的发展,并通过和IETF中IP电话工作组(IPTEL)、IP网中电话选路(TRIP)工作组等兄弟工作组配合工作,在SIP协议中大大加强了对多媒体通讯的支持。
由于Internet的飞速发展,在最近的两年时间内, SIP已经开始被ITU-T SG16、ETSI
TIPON(欧洲标准化组织),IMTE等各种标准化组织所接受,并在这些组织中成立了与SIP相关的工作组。特别是作为ITU-T
SG16主要成员的RADVISION公司,在多年发展H323应用的基础上,针对SIP应用在视频领域的特点,提出了SIP的应用指导,并推出了相应的SIP协议栈,使得ITU的成员实现了这两种协议之间的互通性。并且在该技术的指导下,RADVISION公司的ViaIP产品极大地丰富了基于SIP协议产品在视频通讯领域地应用,不但解决了SIP视频终端无法实现多方会议的缺陷,同时实现了在同一个会议中,SIP终端和H323终端互通这一革命性的应用,从而极大地扩展了SIP协议在视频通讯领域的生命力。
2 SIP系统的基本组成
按逻辑功能区分,SIP系统由4种元素组成:用户代理,SIP代理服务器,重定向服务器以及SIP注册服务器。
· SIP用户代理
SIP用户代理,又称为SIP终端,是SIP系统中的端用户,在RFC3261中将它们定义为一个应用。根据它们在会话中扮演的角色的不同,又可分为用户代理客户机(UAC)
和用户代理服务器(UAS)2种。其中前者用于发起呼叫请求,后者用于响应呼叫请求。
· SIP代理服务器(SIP Proxy Server)
SIP 代理服务器,是一个中间元素,它既是一个客户机又是一个服务器,具有解析名字的能力,能够代理前面的用户向下一跳服务器发出呼叫请求。然后服务器决定下一跳的地址。
· 重定向服务器 (Redirect Server)
重定向服务器是一个规划SIP呼叫路径的服务器,在获得了下一跳的地址后,立刻告诉前面的用户,让该用户直接向下一跳地址发出请求而自己则退出对这个呼叫的控制。
· SIP注册服务器 (SIP Register Server)
SIP注册服务器用来完成对UAS的登录,在SIP系统的网元中,所有UAS都要在某个登录服务器中登录,以便UAC通过服务器能找到它们。
图一所示为一个SIP呼叫建立过程的示意图,如图中所示,一个SIP终端发起呼叫后,通过访问SIP代理服务器以及重定向服务器,找到目标终端,并实现连接。

图1 SIP呼叫建立过程
3 SIP同H323的关系
同SIP的应用目的类似, H323同样对基于包交换的网络上的多媒体通讯应用作出了相关定义。由于H323和SIP标准最初是由两个面对行业领域有所不同的标准组织所提出的,虽然目的都是为实现多媒体通讯,但由于不同的应用目标,决定了这二个标准有其各自不同的特点,不能简单地就将二者对立起来,指出哪个标准更先进、更科学。
以下针对它们的应用目标、标准结构、系统组成以及系统实现的难易程度等几个方面进行简单分析。
· 标准的应用目标
H323标准是ITU-T组织 1996年在H320/H324的基础上建立起来的,其应用目标是,在基IP的网络环境中,实现可靠的面向音视频和数据的实时应用。目前经过多年的技术发展和标准的不断完善,H323已经成为被广大的ITU成员以及客户所接受的一个成熟标准族,基于H323的产品之间不但可以实现可靠的互通,而且在同基于H320、H324的多媒体通讯网络之间也实现了可靠的互通互联。
SIP标准是ITEF组织在1999年提出的,其应用目标是在基于Internet环境,实现数据、音视频实时通讯,特别是通过Internet将视频通讯这种应用大众化,引入到千家万户。由于SIP协议相对于H323而言,现对简单、自由,厂商可以使用相对小的成本就可以构造满足应用的系统。例如仅仅使用微软基于SIP协议的MSN,和RTC就可以构造一个简单的,基于Internet应用环境的视频通讯环境。这样网络运营商就可以在尽量少的成本基础上,利用现有的网络资源开展视音频通讯业务的扩展工作。
· 标准的体系结构
H323不是一个单一标准,而是一个关于在IP环境中实时多媒体应用的完整标准族,对于呼叫的建立、管理以及所传输媒体格式等各个方面都有完善而严格的规定。一个遵守H323标准建立的多媒体系统,可以保证实现客户稳定完善的多媒体通讯应用。
SIP标准严格意义上讲是一个实现实时多媒体应用的信令标准,由于它采用了基于文本的编码方式,使得它在应用上,特别是点到点的应用环境中,具有极大的灵活性、扩充性以及跨平台使用的兼容性,这一点使得运营商可以十分方便的利用现有的网络环境实现大规模的推广应用。
但是SIP协议自身不支持多点的会议功能以及管理和控制功能,而是要依赖于别的协议实现,影响了系统的完备性,特别是对于需要多点通讯的要求,应用单纯的SIP系统难以实现。针对这些不足,以RADVISON公司为首的ITU-T
SG16小组提出了SIP的运用规范,并实现了SIP和H323之间的互通互联,并成功的解决了SIP在多点环境下的应用难题。
图2所示为SIP和H323混合应用的示例,在该示例中用户的SIP视频终端和H323的视频终端实现了互通,并可以实现多方会议。

图2 SIP和H323系统的混合应用
· 系统的组成结构
由图1我们不难看出,单纯SIP系统同H323系统相比较,在系统的组织成员以及呼叫流程方面都有相近之处。
首先,在系统主要组成成员的功能性方面进行类比,SIP的UA等价于一个H323的终端,实现呼叫的发起和接收,并完成所传输媒体的编解码应用;SIP代理服务器、重定向服务器以及注册服务器的功能则等价于H323的Gatekeeper,实现了终端的注册、呼叫地址的解析以及路由。
其次,虽然在呼叫信令和控制的具体实现上不同,但一个基于SIP的呼叫流程与H323的Q931相类似,SIP所采用的会话描述协议(SDP)则类似于H323中的呼叫控制协议H245。
由于SIP的Internet背景,使得SIP系统在构造上较基于端到端应用的H323系统要灵活的多,特别是在需要大规模应用的背景环境下,使用SIP系统更容易构造复杂的拓扑结构,并将应用引入到网络的末端-用户家中。
· 系统实现的难易性
H323标准的信令信息是采用符合ASN.1 PER的二进制编码,并且在连接实现全过程都要严格标准的定义,系统的自由度小,如要实现大规模的应用,需要对整个网络的各个环节进行规划。
SIP标准的信令信息是基于文本的,采用符合ISO10646的UTF-8 编码,并且全系统的构造结构相对灵活,终端和服务器的实现也相对容易成本也较低,从网络运营商的角度考虑,构造一个大规模视频通讯网络,采用SIP系统的成本要廉价许多,而且也更具有可实现性。
4 总结
通过对SIP和H323协议之间进行比较,我们不难看出,H323和SIP之间不是对立的关系,而是在不同应用环境中的相互补充。SIP作为以Internet应用为背景的通讯标准,是将视频通讯大众化,引入千家万户的一个有效并具有现实可行性的手段。而H323系统和SIP系统有机结合,又确保了用户可以在构造相对廉价灵活的SIP视频系统的基础上,实现多方会议等多样化的功能,并可靠的实现SIP系统与H323系统之间的互通,在最大程度上满足用户对未来实时多媒体通信的要求。
|