AI研究突破：ChatGPT 4.0在临床神经学考试中表现卓越

点此按钮收听本文语音

OpenAI公司旗下最新研发的大型语言模型ChatGPT 4.0已通过临床神经学考试，在概念验证研究中回答了85%的正确答案。研究作者认为，经过一些微调，ChatGPT就可以在临床神经病学中具有“重大应用”。当前，人工智能(AI)已在为阿斯利康寻找癌症治疗方法，还有对抗香港抗生素的过度处方。

这项实验结果由海德堡大学医院和海德堡德国癌症研究中心的一组研究人员于12月7日发布，该测试于5月31日进行，测试对象包括两个大型语言模型，即ChatGPT 3.5及其更高版本ChatGPT 4.0。

研究人员使用了美国精神病学和神经病学委员会的神经病学考试题库，以及欧洲神经病学委员会的一小部分问题。

旧版本的ChatGPT得分为66.8%，正确回答了1956个问题中的1306个问题，而较新的版本ChatGPT 4.0得分为85%，正确答案为1662个。

— 广告 —

— 大洋海产加拿大的急冻海鲜先锋 —

值得关注的是，普通人类平均得分为73.8%。这意味着，ChatGPT 4.0的能力已超越了人类平均。

ChatGPT 4.0在行为、认知和心理相关问题上的表现优于人类用户，并有效“通过”了神经学考试，因为70%的正确答案通常被教育机构视为及格分数。

然而，这两种模型在需要“高阶思维”的任务中的表现，都比仅需要“低阶思维”的问题表现得更弱。

根据进行实验的研究人员小组的说法，这些结果可以作为在一些修改后在临床神经病学中使用ChatGPT的建议。

他们指出：“这些发现表明，通过进一步完善，大型AI语言模型可以在临床神经病学中具有重要的应用。”

研究人员指出，目前仍存在一些保留意见。尽管在文档和决策支持系统中应用ChatGPT有一个明确的前景，但神经学家应该谨慎对待它们在实践中的使用，因为它们在高阶认知任务方面仍然不完善。

该研究的作者之一Varun Venkataramani博士在接受采访时表示：“我们将目前的研究更多地视为对ChatGPT能力的概念验证。”

“AI语言模型仍然需要发展，甚至可能需要进行具体的微调，以使其正确适用于临床神经病学，”他补充道。

实际上，当前AI已经在致力于医疗保健领域的一些重大任务，例如为阿斯利康寻找癌症治疗方法，或是对抗香港抗生素的过度处方。

来源：FX168财经

轻松加拿大网站文章连续朗读功能：所见既所闻--可以在通勤（开车、公交）、做家务（做饭、清洁）、锻炼身体等场景下，连续收听多篇相关文章（如社区新闻、加国新闻、北美新闻、政策更新、深度新闻报道）。无需中断当前活动去手动切换文章，最大化利用碎片时间，高效获取信息，真正实现“一心多用”。

欢迎 Sorella Event Co.｜活动策划入驻黄页！

推出加华车行 Bay Green Auto 上线黄页！

分享文章到为新朋友圈

订阅评论

0 评论

最旧