全网销售总额2539.7亿元、产生包裹13.8亿个、无线设备交易占比超90%……2017年11月12日零时,一年一度的“双十一”网购狂欢带着这样震撼世人的表现落下帷幕。历经几年跨越式的发展,“双十一”早已从当年天猫发起的网络购物节,进化为一次人类科技史、商业史上的一座奇观。其涉及行业之广、覆盖用户之多、产生金额之巨都足以引发IT行业的整体思考与创新。
在阿里巴巴最新公布的数据中可以看到,2017年双十一交易峰值期间,平均每秒发起交易32.5万笔,每秒创建支付25.6万笔,实时数据每秒处理4.72亿条……不难想见,这样巨量并发式的网络行为,不仅对天猫,同时也对银行、运营商、物流公司乃至大型电商都提出了前所未有的挑战。来自应用交付领域领导厂商的F5公司中国区总经理张毅强先生认为,对于这样前所未见的网络应用行为,为保证最终用户能够获得较好的使用体验,其各个环节的企业首先要做到未雨绸缪。很显然,任何一家企业的IT资源都很难应对这样突发的挑战,而临时增加购买从成本考虑也不可行。因此,只有借助混合云的理念,将企业自身的数据中心与灾备中心池化、或者将部分应用临时迁移至公有云中进行交付,以更弹性的方式、借助云端近乎无限的运算资源进行交付服务,才能在最大程度上保证用户的购买过程顺畅。为帮助用户更加便捷的部署混合云环境,F5自2016年就已经开始在企业数据中心应用交付、以及云端应用交付领域同时发力。一方面,通过诸如F5 Application Connector这样的解决方案,用户可以用更加智能、高效的方式在私有数据中心与公有云间调配、管理应用,从而解决了应用跨云迁移的难题。此外,F5也与AWS、微软Azure、华为乃至阿里等云服务商展开了深入的合作,帮助企业在公有云环境中使用F5应用交付解决方案,从而使用户能够以更加一致的策略管理跨云应用,从而更加自如的面对如“双十一”这样事件带来的巨量应用请求。
与此同时,随着“双十一”这个“普天同买”的特殊事件形态越来越复杂,更多的中间环节也就意味着更多安全隐患可能深藏其中。一方面,消费者作为这一事件的主角,在欢享购物的同时,每笔交易的资金安全势必影响着整个购买的使用体验;另一方面,商家在推出各种打折、送券、秒杀的时候,也在为如何保证用户得到实惠,而不是投机分子通过技术手段获取利益而苦恼。因此,能够在任何环境、甚至混合云环境下的端到端应用安全链就显得尤为重要。张毅强先生指出,基于对应用行为的深厚理解,F5一直走在应用安全领域的最前端。通过F5的解决方案,用户可以对应用行为进行智能化甄别,这也是F5应用安全与传统网络安全最为不同的区别所在。举例来说,对于传统网络安全而言,微秒级的秒杀行为无法被快速识别为不合规行为;而从应用角度出发的安全解决方案则可以将其作为可疑行为隔离或报告,从而在很大程度上避免了通过程序或机器人不当获利。此外,F5不仅针对页面注入、钓鱼网站等不法行为推出了针对性的解决方案;用户甚至可以将F5设备视为跨环境的全代理设备,从应用请求之初便可通过F5设备对所有信息加密,直到服务提供端的F5设备上进行解密后进行处理。通过这种方式,即便环节中出现信息泄露,不法分子截取的将只是意义不明的乱码,这就在最大程度上保护了用户的信息与财产安全。
张毅强先生最后表示,“双十一”这一形式将向什么方式发展、明年将到达什么规模都尚未可知。唯一能够明确的是明年必然会有更多不同行业、不同形态乃至不同国家的企业参与其中,而线上线下结合的促销形式今年也已初见端倪。这就意味着“双十一”将不再是一个平台、单纯网民的购物狂欢,而会向着全民化的“现象级”事件演变。唯一不变的则是支撑这一事件的,依然会是网络与IT。因此,如果参与的各方能够从应用的思路出发,去部署自身的IT架构,则必将会为广大用户带来一届更加精彩纷呈的“双十一”。
好文章,需要你的鼓励
ETH Zürich等机构研究人员提出TrustVLM框架,解决视觉-语言模型预测可信度问题。该方法利用模型中存在的"模态差距",创新性地结合图像到文本和图像到图像的相似度,实现无需重新训练即可大幅提升误分类检测性能。在17个数据集的严格测试中,TrustVLM相比现有方法在关键指标上提升显著,同时改善了零样本分类准确率。此成果为AI系统在自动驾驶、医疗等安全关键领域的可靠部署提供了重要保障。
这项研究提出了个性化安全概念,解决大语言模型对不同用户采用统一安全标准的问题。研究团队创建了PENGUIN基准测试集评估模型在处理高风险场景时的个性化安全能力,并开发了RAISE框架高效获取关键用户信息。实验表明,提供用户背景可使安全分数提高43.2%,而RAISE框架通过平均仅2.7次交互即可提高安全分数31.6%。这一创新方法将AI安全从"一刀切"转向"个性定制",为高风险领域的AI应用提供了新思路。
明尼苏达大学研究团队提出了一种创新方法,通过回合级信誉分配显著提升大语言模型(LLM)智能体的多回合推理能力。传统方法只对整个过程进行评价,而他们的MT-GRPO算法能够精确评估每个决策步骤的价值,就像为每一步提供具体反馈。在维基百科搜索工具使用场景中,该方法实现了100%的工具执行成功率和50%的答案精确匹配率,远超传统方法。这一突破不仅提高了AI在多步骤任务中的表现,也为开发更复杂的AI系统提供了重要思路。
这篇研究介绍了PISCES——一种能精确从大语言模型参数中移除特定概念知识的创新技术。与现有方法不同,PISCES通过解缠器模型识别概念相关特征,直接编辑模型参数,实现了更精准的知识移除。在Gemma和Llama模型上的测试表明,该方法不仅有效降低了目标概念的准确率(低至7.7%),还保持了模型在无关领域的高性能,并显著提高了对"重新学习"的抵抗力。这一突破为AI系统的安全部署和合规使用提供了新的可能性。