长期以来,数字音频的核心技术基本掌握在美、日、欧等国家和地区的跨国巨头手中,应用比较广泛的有杜比、DTS、索尼等,包括中国在内的音频终端厂家需要向专利权人缴纳专利费,才得以采用上述主流的音频技术。这笔专利费并非小数,据统计,目前杜比、DTS以及MPEG等国外企业或组织,每年从我国收取的数字音频技术许可费用高达数亿美元。
数字音频核心技术与标准的缺失,意味着国内企业只能充当“制造商”的角色,数字音频产业的大部分利润将被国外专利组织攫取,更重要的是,我国企业因此而丢掉音频产业未来发展的主动权。
改写我国音频产业被动格局的时间点,指到2007年1月20日,信息产业部正式发布了中国数字音频电子行业标准——《多声道数字音频编解码技术规范》。该标准具有中国自主的知识产权,它的出台被业内评价为“中国数字音频产业打了一个翻身仗”。
标准研发前的专利困局
“《多声道数字音频编解码技术规范》的原型是DRA数字音频编码技术,其研发始于2001年6月。”全国音视频标准化技术委员会秘书长赵新华在接受《中国电子报》记者采访时表示。
站在《多声道数字音频编解码技术规范》研发历史原点的关键人物是游余立博士。在游余立供职美国DTS公司时,曾到中国推介DTS技术标准。相关领导的邀请使他在中国与DRA数字音频技术迅速结缘。
数字音频编解码技术是数字音视频领域的一项核心基础技术。MP3、VCD、DVD等的视频和音频都是经过压缩编码的,只是所采用的编解码技术标准不同。
从全球整个市场看,流行的是六大音频标准:
一是美国杜比公司的AC-3标准。从某种程度上说,杜比AC-3技术标准是目前应用最为普及的音频技术标准。它具备单声道、立体声和5.1环绕声功能,在数字电视、DVD、影院系统等多方面得到广泛的应用。目前美国ATSC、欧洲DVB、澳大利亚等国家数字电视纷纷采用杜比AC-3作为数字电视的伴音标准,使其应用更为广泛。
二是MPEG-1音频技术标准。它是上世纪80年代中期随着MPEG技术标准的不断成熟而推出的音频编码技术标准,其目的是为数字视频节目伴音,其伴音具备8声道(用于多语言重放)。由于其设计的目标适合于多种语言环境的伴音,特别适用于语言环境复杂的地区。目前,欧洲DVB标准中将MPEG作为音频伴音标准。
三是MPEG-2。它是在MPEG-1的基础上开发的一种视频编码,质量远远好于MPEG-1,是从立体声转换成了环绕声,所以被运用在了DVD-Video上面。MPEG-2是DVD-Video唯一指定的视频编码。MPEG-2不光运用于DVD-Video,现在大部分HDTV(高清电视)也采用MPEG-2编码,分辨率达到了1920×1080。
四是MPEG2 AAC标准。AAC是MPEG2音频编码技术标准之一,在MPEG2技术标准中的第七部分进行了标准化(ISO/IEC 13818-7)。杜比公司从1998年开始管理AAC的知识产权池,目前VIA LICENSING公司负责管理其知识产权池的工作,代理AT&T、杜比、Fraunhofer IIS和索尼等公司收取相关的知识产权费。
五是DTS标准。DTS是数字影院系统的缩写,其系统设计的目的是给电影院系统提供环绕立体声的音频编码技术方案。目前在美国有超过数万座DTS影院,一般认为其环绕声效果比AC-3好。
六是WMA标准。它是微软公司开发的基于互联网流媒体应用的数字音频压缩算法,广泛应用于互联网中音频的压缩。由于其具有更低的码率,目前已经成为网络音频资源的重要标准之一,继微软提出VC-1技术标准后,WMA成为微软推荐的事实标准之一。
由以上可以看出,全球市场上可提供音频编码技术完整方案的公司并不多,核心技术基本掌握在美、日、欧等国家和地区的跨国巨头手中,包括美国的杜比、DTS、Lucent、微软,欧洲的飞利浦、Fraunhofer和日本的索尼。不过,这些跨国巨头近年来明显加快了对中国市场的掠夺和瓜分,比如杜比AC-3和DTS在DVD、数字影院行业,MPEG在广电行业,MP3在个人多媒体播放器领域几乎达到了垄断的程度。
包括中国在内的音频终端厂家需要向上述跨国巨头缴纳专利费,才能采用主流的音频技术。这笔专利费并非小数,据统计,目前杜比、DTS以及MPEG等国外企业或组织,每年从我国收取的数字音频技术许可费用高达数亿美元!
在跨国巨头公司通过控制标准的制定或造成事实标准,获取高额而稳定的收益的同时,中国市场上,相关自主音频编解码技术标准的研发,一直没有实质性成果。
面对数字音频领域严峻的形势,我国政府前期投入了大量的资金,扶持民族数字音频技术研究。国家重点扶持的清华大学和中国电子科技集团第三研究所等机构对此做了很多深入工作,但主要集中于学术性研究,还没有计划开发一套完整的能产业化的技术标准体系;以中科院计算所为主体的AVS工作组,在2006年3月公布了视频标准之后,其音频部分至今尚未取得实质性突破;由北京阜国数字技术有限公司开发,曾被EVD标准采用的ExAC音频技术由于受到专利归属纠纷的影响,至今前景不明。
数字音频核心技术与标准的缺失,意味着国内企业只能充当“制造商”的角色,数字音视频产业的大部分利润将被国外专利组织攫取,更重要的是,我国企业因此而丢掉音视频产业未来发展的主动权。
游余立说:“这些专利费的流出,就像一根大水管将中国的资金和创新能力源源不断地抽走,却不能带来就业、消费。”
基于要做出中国自主知识产权的音频标准的考虑,游余立2001年从美国回国后,在广东中山小榄镇组建了一家合资知识产权公司——中山正音数字技术有限公司,在不到一年的时间里,开发出“中山正音”数字音频编码技术,申请了12项国内专利。
2003年3月,游余立采取比以往更先进的技术路线,开发出一套全新的数字音频编解码算法——DRA多声道数字音频编解码算法。直到同年11月,他用C++开发完DRA编码和解码软件,DRA算法由此正式定型。2004年1月,他又在Motorola DSP 56367芯片上开发出实时DRA解码软件。
“这个标准的诞生过程并非如外界想像得那样波澜起伏,它是一个很平滑的过程。我们在其间做的只是一点一滴的技术积累,一步一步的技术完善,厚积薄发,由此标准研发成功。”内敛而低调的游余立和很多技术狂人一样,全部心思只在于捕捉最先进的技术,而对自己在其中的是非功过及诸多细节,不做过多的评述。
2002年,广东省发改委副主任张军获知游余立的“中山正音”技术后,意识到自主知识产权的音频标准对信息产业的巨大价值,于是开始给予大力支持,并当起了游余立和一家企业之间的“月老”,一个由企业提出、省部联动的标准故事由此开篇。
企业提出“省部联动”
2007年1月20日,这家企业因起草以DRA数字音频技术为基础的《多声道数字音频编解码技术规范》,从幕后走向了前台。这家企业就是广东企业广晟数码技术有限公司(以下简称“广晟数码”),此前业界对这家企业知之甚少。