ZD至顶网安全频道 02月16日 综合消息: 每一年,旧金山的RSA大会都会在其加密专项讨论环节中,吸引到全球最出色及最睿智的头脑,而其探讨核心也非常简单——摆脱一切热门及炒作性因素,集中精力考虑如何实现更出色、更简洁且更安全的编程成果。
研讨小组各成员对于人工智能安全系统(尽管其已经在DARPA Cyber挑战赛中取得成功)的动向毫不关心,并表示目前探讨此类系统的可靠性还为时过早,同时警告称相当一部分此类设想将永远无法变为现实。
“我对于AI在安全领域的应用持怀疑态度,”麻省理工学院教授兼RSA三巨头中的“R” Ronald Rivest表示。“我们发现AI机器人的聊天表现已经成为像去年总统大选一样热门但无聊的议题。至少还要十到十五年,我们才会真正难以在一堆聊天机器人中发现真正的人类。”
而前RSA成员、现任魏兹曼研究所计算机科学教授Adi Shamir对于AI系统在安全领域的作用亦同样抱有怀疑。对此类设备进行训练可能带来一些有趣的问题。
“十五年之后,如果我们将全部数据都交给AI系统打理,其可能会认为为了保护互联网,最好是将其彻底毁灭,”他打趣道。“互联网本身是无可挽救的; 我们必须找到更理想的起点。”
一部分AI系统也许确实能够用于IT防御,Shamir坦言,这是因为未来的计算机将能够处理规模更大的数据集并检查其中的异常状况。然而大家仍然需要人为介入以发现零漏洞以及与之相关的攻击行为。
Shamir同样对量子计算系统与量子加密技术表达了不屑,他表示这些“不在我的考虑范围内”。他更关心如何利用大规模计算来破解现有加密算法。
伍斯特理工学院网络安全政策教授Susan Landau则表示她对量子计算系统相当担忧。目前行业在利用量子计算能力建立防御性算法方面缺少足够的研究,她坚持认为这很可能成为安全领域的一大致命短板。
与此同时,公钥加密机制发明者之一Whitfield Diffie指出,目前安全业界面临的问题在于,各类潜在风险绝不可能被AI或者量子技术一股脑奇迹般地解决。相反,行业内需要重新回归基础,他建议称。
“如果能够将投入到防火墙及反病毒软件等交互式安全方案的资源用于改进设备的逻辑功能并显著提升编程质量,我们将能够得到更好的结果,”Diffie总结称。
好文章,需要你的鼓励
这项研究提出了HoPE(混合位置编码),一种针对视觉语言模型的新型位置编码技术,专门解决长视频理解的挑战。传统位置编码技术在处理长视频时表现不佳,HoPE通过两个创新解决了这一问题:混合频率分配策略(为空间信息分配高频,时间维度使用零频率)和动态时间缩放机制(根据视频速度灵活调整时间编码)。实验证明,HoPE在长视频理解和检索任务上分别提升了8.35%和22.23%,为AI更准确理解长视频内容开辟了新途径。
东京大学研究团队推出MangaVQA基准和MangaLMM模型,专门用于评估和提升AI对日本漫画的理解能力。MangaVQA由526个高质量手动创建的问答对组成,用于评估AI系统对漫画内容的深入理解;MangaOCR则专注于漫画页内文本识别。基于这两个基准,研究团队从开源多模态模型Qwen2.5-VL微调出MangaLMM,能同时处理文本识别和内容理解任务。实验显示,即使是GPT-4o等顶尖商业模型在处理漫画的独特复杂性时也面临挑战,而专门训练的MangaLMM表现出色。
这项研究由ISTA和谷歌研究院联合开发的"影响力蒸馏"方法,通过利用二阶信息为训练样本分配最优权重,实现了大语言模型训练数据的高效选择。该方法在数学上有坚实理论支持,并创新性地引入"地标"近似技术,仅需计算少量样本的精确影响力,再高效传播到其他样本,大幅降低计算成本。实验证明,该方法在多种模型和任务上均优于或匹配现有技术,同时实现了高达3.5倍的速度提升,为大模型训练开辟了更高效的路径。
来自哈佛大学等顶尖学府的研究团队在这篇论文中挑战了传统观念,认为Token压缩不仅仅是提高AI模型运行效率的工具,更应成为生成式AI模型设计的核心原则。研究表明,精心设计的Token压缩策略可以促进多模态深度整合、减轻AI"幻觉"问题、增强处理长序列输入的能力,并提高训练稳定性。论文详细分析了现有方法的局限性,并提出了算法创新、强化学习指导和硬件协同设计等未来研究方向。