我国科学家研究揭示多模态大模型概念表征机制

2025-06-10 06:13 来源:新华社
查看余下全文
(审核:欧云海)
光影之间
光影之间
记者专栏

首页 > 推荐阅读 > 正文

我国科学家研究揭示多模态大模型概念表征机制

2025年06月10日 06:13   来源:新华社   

   记者6月9日从中国科学院自动化研究所获悉,该所与中国科学院脑科学与智能技术卓越创新中心的联合团队在《自然·机器智能》发表相关研究,首次证实多模态大语言模型能够自发形成与人类高度相似的物体概念表征系统,为人工智能认知科学提供了新路径,也为构建类人认知结构的人工智能系统提供了理论框架。

   “人类能够对自然界中的物体进行概念化,这一认知能力长期以来被视为人类智能的核心。”论文通讯作者、中国科学院自动化研究所研究员何晖光说,当人们看到“狗”“汽车”或“苹果”时,不仅能识别它们的物理特征,如尺寸、颜色、形状等,还能理解其功能、情感价值和文化意义,这种多维度的概念表征构成了人类认知的基石。

   而随着ChatGPT等大语言模型的爆发式发展,一个问题引起科学家们的注意——这些大模型能否从语言和多模态数据中发展出类似人类的物体概念表征?

   传统人工智能研究聚焦于物体识别准确率,却鲜少探讨模型是否真正“理解”物体含义。何晖光说:“当前人工智能可以区分猫狗图片,但这种‘识别’与人类‘理解’猫狗的本质区别仍有待揭示。”

   研究团队从认知神经科学经典理论出发,设计了一套融合计算建模、行为实验与脑科学的创新范式,并构建了人工智能大模型的“概念地图”。

   何晖光介绍,研究团队从海量大模型行为数据中提取出66个“心智维度”,并为这些维度赋予了语义标签。通过研究发现这些维度是高度可解释的,且与大脑类别选择区域的神经活动模式显著相关。研究还对比了多个模型在行为选择模式上与人类的一致性,结果显示多模态大模型在一致性方面表现更优。

   此外,研究还揭示了人类在做决策时更倾向于结合视觉特征和语义信息进行判断,而大模型则倾向于依赖语义标签和抽象概念。本研究表明大语言模型内部存在着类似人类对现实世界概念的理解。(记者宋晨)


(审核:欧云海)

推荐阅读

研究:鸟类短尾出现时间被往前推了2000万年

据英国《新科学家》周刊网站2月12日报道,一具距今1.5亿年的化石可能是世界上已知最早的鸟类。这一发现证明,作为现代鸟类特征的短尾进化出来的时间远比人们此前认为的更早。鸟类是在侏罗纪时期由兽脚亚目恐龙进化而来的。而始祖鸟一直被认为是化石记录中最古老的鸟类之一。但始祖鸟在进化树上的地位存在争议,因为尽管... [详细]

6000米以下深海生物如何“抗压”?

历经10余年努力,我国科学家首次通过基因组学对深渊钩虾、深渊鱼类、微生物等进行研究,揭开深渊生物高压下得以生存的部分秘密,多篇成果3月7日在国际学术期刊《细胞》(Cell)上发表,为深入理解生命如何适应深渊环境提供了新的见解,也为研究深渊生态系统提供了宝贵的数据资源。 [详细]

新研究:真菌可减少牛打嗝排放甲烷

在土壤中发现的一种真菌可以用来喂牛,从而减少其打嗝时产生的强效温室气体甲烷。澳大利亚初创公司罗姆农业公司的马修·卡拉汉说:“这是一种真菌汤。”该公司计划在生物培养皿中大量培育这种真菌。不过,该公司并不打算直接给牛喂食这种真菌,而是计划提取其中能减少甲烷排放的成分溴仿,并将其制成可食用粉末添加到饲... [详细]