全国整治互联网色情信息专项行动正在如火如荼地进行。现在,除传统的甄别网络色情信息内容的手段与方式外,又有一个新的“武器”加入到围剿网络不良信息的战役中来,这就是刚刚实施的通信行业标准《宽带网络接入服务器内容过滤技术要求》。该标准从技术角度出发,规定了宽带网络接入服务器实现内容过滤相关功能的技术要求,包括功能概述、功能要求和性能要求等内容,力争从网络源头实现对内容的有效过滤,净化网络环境,实现“绿色上网”。
据悉,宽带网络接入服务器是一种能提供端到端宽带连接的网络接入设备,通常位于骨干网的边缘,作为用户接入网和骨干网之间的网关,终结或中继来自用户接入网的连接,提供接入到宽带核心业务网的服务。“宽带接入服务器的内容过滤功能,是指设备通过特定的方式对特定网络信息相关的网址、文本和图像等内容进行过滤、限制或禁止用户访问相应信息内容的能力。”标准主要起草者、工业和信息化部电信研究院杨剑锋说:“设备对网络信息内容进行过滤的结果可包括允许、修改后允许、不允许、记入日志、报警等。”
杨剑锋告诉记者,宽带网络接入服务器实施内容过滤,根据信息内容和过滤手段的不同,通常可分为直接内容过滤和间接内容过滤两类。所谓直接内容过滤,就是直接对各类网络信息内容进行过滤的形式;间接内容过滤则是指通过网络信息和资源的级别访问权限控制、网址过滤等手段,以禁止或限制用户访问的形式,实现内容的过滤。
据介绍,在过滤手段上,直接内容过滤主要包括文本过滤、图像过滤、音/视频过滤3种;间接内容过滤则包括网址过滤和内容分级过滤两种。
一般来讲,网络上传播的信息既包括文字这样的纯文本信息,还包括图片、音频和视频等大量多媒体信息。对于这些信息,新标准以直接内容过滤的方式予以了拦截和甄别,主要手段是对文本信息内容进行识别和分析,对图像信息内容和音/视频信息内容进行识别、特征提取和分析,从而实现对特定内容和信息的过滤和拦截。而作为网络获取网络信息的“源泉”,网址是网络传播内容的重要载体。对此,标准要求能对信息相关的网址的访问请求进行过滤和拦截,一旦网址的内容涉嫌违规,网络有可能无法打开相应的网页。
据悉,网络内容的分级可由自主分级和第三方分级等方式实现。支持内容分级过滤功能的宽带网络接入服务器,可根据网络内容中内嵌的相关分级标记、设备预置的分级/分类等档案信息,对相应的网络内容按照特定等级、类别的访问许可和权限进行控制和过滤。
在内容过滤方式上,标准主要提供了名单、特征匹配、语义分析及高级智能4种方式。依照网络信息内容的不同,网络资源被分为黑名单、白名单和只允许名单。进入“黑名单”的网络内容和信息资源,将会被过滤和拦截,禁止或限制用户访问与使用;如果进入“白名单”,用户则可以放心大胆地自由浏览;而进入“只允许名单”的,则是允许用户访问的特定网络资源。这些名单并非一成不变,而是可以手工添加、删除、编辑,以及批量导入、导出和自动下载、更新。
所谓内容特征匹配方式,则是指通过将特定类型的目标内容信息特征与相应类型内容信息的特征/样本数据库记录进行匹配比对,实现对特定类型内容的过滤。这种特征/样本数据库主要包括网址数据库、文本关键字库、图像特征库等。同时,标准还要求可根据信息内容的同义、反义、歧义等语义分析结果进行过滤,这就是语义分析内容过滤。
除此之外,网络信息内容的过滤还具有自己的“智慧”,即高级智能分析,它主要是通过听觉/视觉特征分析过滤、人工智能分析过滤等方式,对网络上的文本、图像以及音视频内容信息进行过滤。“所有这些过滤手段和方式,既可单独使用,也可组合使用。目的是防范互联网不良信息侵扰,净化网络空间,营造绿色上网环境。”组织标准制定的中国通信标准化协会相关负责人说。