新训练方法提高AI模型准确率和透明度

2026-04-08 10:16 来源:科技日报
查看余下全文
(审核:叶玮)
光影之间
光影之间
记者专栏

首页 > 推荐阅读 > 正文

新训练方法提高AI模型准确率和透明度

2026年04月08日 10:16   来源:科技日报   

科技日报讯 (记者张梦然)在医疗诊断、自动驾驶等高风险场景中,人工智能(AI)模型决策的可解释性至关重要。据美国麻省理工学院官网近日消息称,为了提高透明度,该校团队开发出一种新方法,能够从已训练好的计算机视觉模型中自动提取关键概念,并迫使模型使用这些人类易于理解的概念进行解释和预测。这项进展有望在提升模型准确性的同时,增强用户对“黑盒”AI的信任。

概念瓶颈模型是增强AI可解释性的常见技术。它是指在模型决策过程中增加一个中间步骤:先识别图像中与任务相关的、可被人理解的“概念”,再基于这些概念做出最终预测。例如,在肿瘤诊断中,模型可能先识别“成簇的棕色斑点”这一概念,再判断是否为黑色素瘤。

然而,传统方法依赖人类专家或大语言模型预先定义概念集,这些概念可能与具体任务关联性不强,或缺乏足够细节,从而影响模型性能。另外,模型在训练时也可能“暗中”使用了定义之外的其他特征,导致解释与真实不符。

此次,团队利用一个经过海量数据预训练的视觉模型,认为其内部已蕴含了完成任务所需的知识。他们设计了一种两阶段流程来提取和转化这些知识。首先,使用一个称为稀疏自编码器的专用模型,提取出最相关的特征,并将其压缩为少量核心概念。接着,由一个多模态大语言模型将这些特征转化为简洁的自然语言描述,并自动为数据集中图像标注这些概念真实与否。最后,利用这些标注数据训练一个概念瓶颈模块,并将其整合到原始模型中,强制模型仅使用这套提取的概念进行预测。

团队在过程中限制了模型每次预测最多只能使用五个概念,迫使模型筛选出最关键的几个特征,使生成的解释既精炼又直接相关。

测试中,鸟类物种识别和皮肤病变诊断等任务结果均表明,新方法在提供更精确、与图像更贴合的概念解释的同时,也取得了比现有概念瓶颈模型更高的预测准确率。这意味着,该方法不仅能更好地“解读”模型的思考过程,还能维持更优的性能。

团队未来的工作还将致力于解决信息泄露等问题,并探索利用更强大的多模态大模型来标注更大规模的数据,以进一步提升方法的效能。


(审核:叶玮)

推荐阅读

血凝胶纤维机器人:脑内的药物“速递达人”

大脑颅内肿瘤,尤其是位于脑深部或者临近重要功能脑区的肿瘤,一直是临床治疗中的重要挑战。为验证血凝胶纤维机器人在颅内肿瘤靶向治疗中的可行性与疗效,研究人员在18头小型猪中构建了脑胶质瘤模型,并将其分为三组:空白对照组、假手术组和治疗组。未来,团队将进一步聚焦于血凝胶纤维机器人的结构优化、运动控制精度... [详细]

钙钛矿有机电池光电转换效率纪录刷新

新加坡国立大学科研团队研制出一款新型钙钛矿有机串联太阳能电池,经权威认证,其1平方厘米有效面积内的光电转换效率达到26.4%,创下同类设备的世界纪录。在具体实施中,研究团队先将这种高性能有机子电池与顶层的钙钛矿电池叠加,再通过透明导电氧化物互连层将二者有机结合。这一成果不仅刷新了钙钛矿有机电池的纪录,... [详细]

低温下精准控制量子比特的芯片问世

量子计算机要真正实现大规模实用化,关键在于如何稳定、精准地控制海量量子比特。研究团队研制出一种可在毫开尔文温度条件下控制自旋量子比特的硅芯片。实验结果表明,只要控制系统设计得当,即使量子比特与不到一毫米远的晶体管芯片共存,其量子态几乎不会受到干扰。研究人员认为,该低温电子平台不仅可助力量子计算,... [详细]