AI研究突破:ChatGPT 4.0在临床神经学考试中表现卓越
这项实验结果由海德堡大学医院和海德堡德国癌症研究中心的一组研究人员于12月7日发布,该测试于5月31日进行,测试对象包括两个大型语言模型,即ChatGPT 3.5及其更高版本ChatGPT 4.0。
研究人员使用了美国精神病学和神经病学委员会的神经病学考试题库,以及欧洲神经病学委员会的一小部分问题。
旧版本的ChatGPT得分为66.8%,正确回答了1956个问题中的1306个问题,而较新的版本ChatGPT 4.0得分为85%,正确答案为1662个。
— 广告 —
— 大洋海产 加拿大的急冻海鲜先锋 —
ChatGPT 4.0在行为、认知和心理相关问题上的表现优于人类用户,并有效“通过”了神经学考试,因为70%的正确答案通常被教育机构视为及格分数。
然而,这两种模型在需要“高阶思维”的任务中的表现,都比仅需要“低阶思维”的问题表现得更弱。
根据进行实验的研究人员小组的说法,这些结果可以作为在一些修改后在临床神经病学中使用ChatGPT的建议。
他们指出:“这些发现表明,通过进一步完善,大型AI语言模型可以在临床神经病学中具有重要的应用。”
研究人员指出,目前仍存在一些保留意见。尽管在文档和决策支持系统中应用ChatGPT有一个明确的前景,但神经学家应该谨慎对待它们在实践中的使用,因为它们在高阶认知任务方面仍然不完善。
该研究的作者之一Varun Venkataramani博士在接受采访时表示:“我们将目前的研究更多地视为对ChatGPT能力的概念验证。”
“AI语言模型仍然需要发展,甚至可能需要进行具体的微调,以使其正确适用于临床神经病学,”他补充道。
实际上,当前AI已经在致力于医疗保健领域的一些重大任务,例如为阿斯利康寻找癌症治疗方法,或是对抗香港抗生素的过度处方。
来源:FX168财经