科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网安全频道垃圾短信“叫停”面临技术门槛

垃圾短信“叫停”面临技术门槛

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

市场上流行的过滤技术有两种,一种是“关键词”过滤,即通过定义个别的词达到“过滤”效果,一种是“语义”过滤技术。

作者:CCW 来源:CCW 2008年4月22日

关键字: 内容过滤 过滤防护

  • 评论
  • 分享微博
  • 分享邮件

  继315晚会对“垃圾短信”进行重点披露后,新成立的工业和信息化部挥出第一记重拳,正式公布已联合国务院新闻办、公安部起草了《通信短信息服务管理规定》,明确对短信息服务和管理问题进行系统规范,并禁止发送违法内容和违规发送垃圾短信行为。

  很明显,工业和信息化部希望通过电信设备和电信业务入手治理短信,充分发挥政策作用进行强制性的“源头堵截”。记者就其动态进行了跟踪采访。

  有关专家猜测,目前的市场环境下,单靠政策很难完全清除垃圾短信,这其实与垃圾短信的定义有关。按照工业和信息化部方案,要求移动通信厂商免费为用户提供客户端用自定义的方式来控制垃圾短信,只有在用户反复收到,已经明确其为垃圾短信的情况下才能设置。实际上,更多的垃圾短信是让人防不胜防,难辨真伪的。比如,今年2月在京城大面积传播的汽油价格上涨,使北京所有加油站“车满为患”,造成了交通的极大拥堵,以致第二天,北京各大媒体纷纷辟谣,给社会造成了极大的负面影响的“谣言”短信。这样的短信才是大批量的、更令人头疼的。

  对待上述情况,专家认为“源头堵截”方式就会产生疏漏,还需要进行半路的拦截,这就需要借助内容过滤”技术来实现。具体来讲,一方面,“过滤”技术往往建有强大的已知“知识库”,可以依靠以往经验准确定义“垃圾短信”的特征。只要符合定义特征,立刻“拦截”;另一方面,过滤的同时,本身还包含“舆情”捕捉功能,当某个信息反复出现,程短时爆发状态上升时,“过滤”技术便能准确识别出来,将其排在首位,然后再通过人工迅速判断信息真伪。一旦发现有误,立刻阻止其进一步传播和蔓延。这样“已知”和“未知”垃圾都可得到有效遏制。

  目前,市场上流行的过滤技术有两种,一种是“关键词”过滤,即通过定义个别的词达到“过滤”效果,一种是“语义”过滤技术。两者技术区别在于,后者除了关键词之外,还添加了语境的分析,也就是褒贬义分析和立场判断,分析一句话到底是批评还是赞扬,肯定还是否定,从而达到准确过滤的目的,避免“错杀无辜“的现象出现。关键词技术和语义过滤技术孰优孰劣一段时间争论不休。

  记者为此专门走访了我国语义分析专家——中科院声学所研究院黄曾阳先生,黄先生指出“关键词技术基于西方拉丁语系而来,西语是表音的文字,而汉语是音形义结合的文字。中文本身非常复杂,不同于西语“非此即彼”的表达方式,表述形式更为多样。用电脑模拟人脑语言感知过程,从逻辑思维角度对语义进行判断,从领域、情景、背景三方面分析得到结果,即 HNC (Hierarchical Network of Concepts 概念层次网络)理论,使中文语言处理实现了实质性的突破,消除了语言多重模糊,搜索过滤更为精准。”

  北京大正语言研究院一直以来承担着该理论研究与应用开发任务。据其院长陈小盟介绍,目前,HNC理论已经非常成熟,先后被列为国家重点科技支撑中文信息处理应用研究与系统开发项目、国家973计划项目、国家863计划项目及中科院知识创新工程等项目。针对垃圾短信,研究院早已研发出手机短信过滤方案,眼下正在针对电信应用做专门优化。他表示研究院愿意积极与运营商方面展开进一步的合作,打破手机短信过滤技术门槛。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章