随着数字经济加速发展,数据已成为重要生产要素。在我国数字经济进入快车道的时代背景下,如何开展数据安全治理,提升全社会的“安全感”,已成为普遍关注的问题。在日前召开的“2021中国数字经济城市峰会”上,联通数字科技有限公司数据智能事业部副总经理周华接受了信息化和软件服务网记者的独家采访,分享了新时期中国联通的发展新范式,以及联通数科在数据安全和数据治理领域取得的一些重要成果。
联通数字科技有限公司数据智能事业部副总经理 周华
信息化和软件服务网:中国联通重磅发布5大主责主业,联通数科数据智能事业部在其中承担哪些支撑工作?
联通数科周华:在12月初召开的“2021中国联通合作伙伴大会”上,中国联通董事长刘烈宏发布了中国联通新战略。中国联通将全面发力数字经济主航道,将“大联接、大计算、大数据、大应用、大安全”作为主责主业,实现发展动力、路径和方式的全方位转型升级,更好地开辟新发展空间、融入新发展格局。
联通数科数据智能事业部是中国联通的大数据对外商用服务的唯一出口,同时,中国联通的AI创新应用中心和区块链创新应用中心两个重要部分也在数据智能事业部。因此,在中国联通全面发力数字经济主航道中,联通数科数据智能事业部将起到重要的支撑作用。我们的最终目标是:做深大链接、做强大计算、做活大数据、做优大应用、做精大安全,打造数字经济“‘国家首席、政府首选、人民首信’的安全第一盾”。
信息化和软件服务网:您怎么看待数据安全?联通数科积累了哪些安全能力?
联通数科周华:进入数字经济时代,数据成为关键生产要素,数据价值日益凸显,数据安全问题愈发突出,这就要求我们着力解决数据安全领域的突出问题,有效提升数据安全治理能力。随着《网络安全法》、《数据安全法》和《个人信息保护法》的正式实施,安全法规领域的“三驾马车”正式组成,为进一步促进数据安全产业的健康发展,提升行业数据安全治理水平指明了方向。
在数据安全领域,联通数科始终坚持“安全合规是生命线、敏感数据不出门、安全事件零容忍”三大原则,并以防止数据泄漏与数据滥用为目标,参照国际规范、国家标准,从组织人员、安全策略、安全技术和安全运营四个层面,建立形成覆盖数据全生命周期的大数据安全体系。同时落实“三同步”工作原则,在大数据要素价值转化过程中,做好安全的同步规划、同步建设、同步使用。
联通数科数据智能事业部始终坚持自主研发,以“数据、人、场景”为核心,打造“6+2”产品体系,包括:数据安全态势感知、数据安全监测与审计、数据资产地图、数据追踪溯源、数据安全网关、数据脱敏、数据出口审计、大数据基线安全检测系统、数据安全指标评估等,全面覆盖数据安全技术、管理和运营,可提供全网、全链路的安全监管和综合一体化的解决方案。
我们认为,数据安全治理不仅仅是数据的绝对安全,而是以数据安全保障为基础,通过数据开发利用促进产业发展。
信息化和软件服务网:请您结合具体案例介绍下联通数科的数据安全产品或能力。
联通数科周华:联通数科在安全领域落地了大量实践案例,在海南、安徽、浙江等省市的数字政府建设项目中都能看到联通数科的身影,以“浙江省公共数据安全项目”为例子为大家做一下分享。
浙江省之所以在公共数据安全建设项目中选择联通数科,是看到了中国联通的数据安全能力。我们以云网数一体的大安全理念为基石,围绕人、数据、场景三个维度,帮助浙江省建立了制度、技术和运行三维一体的数据安全体系。
在管理体系层面,制定数据、用户、系统、运维、业务流程等方面的管理规范,按照全覆盖、分重点、分梯度的管理原则,进行关键环节的管控,实现内部的内审内控。
在技术体系方面,通过数据资产管理地图、数据分级、数据分类等具体产品的应用,实现应急处置时间缩短90%以上、数据泄露等问题规避了5-7个、数据访问权限统一管理数千个,以及数据操作安全风险规避了5类以上。
在运行体系方面,帮助浙江省建立了集风险识别、安全防御、安全检测、安全响应等功能于一体的闭环运行机制,能够满足实时监控、主动改善、快速响应的需求。
同时,我们还帮助浙江省建立了省市县三级数据安全一体化保障机制,助力推进浙江省省市县三级全链路数据安全管控体系建设,实现省市县三级数据的依法有序自由流动。目前市一级和县一级项目正在落地实施中。
结语
当前,我国的数据安全防控方式正从被动防控转向提升技能、升级设备、系统性的主动防控,只有准确把握数据安全形式、内容和态势的变化及需求,主动探索捍卫数据安全的路径,才能有效应对各种数据安全挑战。中国联通依托全网数据一点集中、集约运营的优势,在海量数据处理、多元数据应用场景驱动下,以“安全合规是生命线、安全事件零容忍、敏感数据不出门”的三大安全合规原则为指导,建立形成覆盖数据全生命周期的大数据安全体系,能够有效的保护用户个人隐私,保障国家安全。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。