Cambridge Analytica公司收集数百万用户资料以利用个人恐惧并影响2016的美国总统大选的事件近期持续升温,而Facebook公司也因此遭到各方的口诛笔伐。
Cambridge Analytica公司掌握的数据还得到另一家厂商Global Science Research(简称GSR)的补充——后者对成千上万名用户进行了个性测试,并要求对方同意将数据用于学术用途。而与此同时,GSR方面会收集受测者的Facebook好友信息,并借此建立起一套极为庞大的用户档案数据库。Facebook公司的政策只允许收集好友数据用以改善用户体验,且禁止对这些数据进行出售或用于广告宣传。然而遗憾的是,Facebook公司从未证明过这些数据政策是否得到严格遵守,而从现在的情况来看答案显然是否定的。
此类工作正是大数据管理与治理任务的核心。此次事件向从事大数据的企业发出警告,即大数据的安全性与传统数据系统同样重要。
遗憾的是,大多数企业对于每天对其大数据造成威胁的各类安全漏洞及数据违规问题还没有做好充分的应对准备。
那么,首席数据官与大数据项目经理们应该如何解决这些日益升级的大数据安全挑战?
1.确定业务风险
作为典型代表,Facebook公司遭遇的问题无疑将严重损害其品牌形象与收入水平——而这一切都源自过于松散的大数据治理与安全实践。尽管实施保护手段并防止数据泄露问题是IT部门的职责,但如果CIO、CSO以及CDO无法以简单方式向CEO以及公司董事会解释安全隐患以及客户信息外泄可能给企业造成的严重后果,那么这类问题将很难得到实际解决。因此,在具体表述时,请采用“客户数据泄露会导致我们的客户对公司失去信任,并转向其它竞争对手”这类说法,而非“客户数据泄露会危害我们的系统,IT部门需要两天时间才能修复完成。”
2. 获取正确的助力
企业之所以在大数据安全方面表现得较为滞后,一大原因在于相当一部分企业目前仍缺乏内部安全专业知识,而人才市场也很难及时提供这类知识。当然,请不要被这样的现实所吓倒。相反,请积极引入外部咨询资源,这将帮助大家有效应对持续存在的系统入侵与信息窃取行为。黑客不会等待,我们也不能等待。
3.关注社交工程
如果数据负责人能够及时跟进,并确保相关人员能够按照约定返还相关数据——而非将其分享给他人,那么Facebook公司遇到的大部分问题本应得以避免。也许是员工无意中采取了与数据安全实践相违背的操作,进而造成数据泄露。对于这类由企业内部员工所造成的数据泄露或安全违规问题,社交工程往往是引发破坏的罪魁祸首。正因为如此,一切企业都应当高度关注对员工进行数据安全实践培训。此外,企业还应定期根据数据安全水平实施补充性培训。
4. 强调预防,而非检测
检测工作能够帮助我们在系统遭受入侵时快速发现威胁。但可以肯定的是,完全防止入侵无疑更为重要。大家可以立足网络边缘筛选入侵文档、电子邮件及其它形式的大数据,从而实现这项目标。通过这种严格的把控方式,中央网络与系统将拥有更为可靠的安全保障。
好文章,需要你的鼓励
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。