冠状病毒的全球大流行,使得“医疗资源挤兑”一词进入大众视野。大量的医护人员前往社区抗疫,恐慌的患者涌入医院,公共卫生机构运行秩序被迫打乱,使得原本就较为紧张的医疗资源,变得更加短缺。在疫情的催化之下,以自然语言处理、机器学习等为代表的AI技术,正在加速渗透医疗体系,成为医疗服务水平提升的重要驱动力之一。其中,通过训练AI模型进行医疗知识问答的工作,可以极大地帮助提高医疗资源的使用效率,一方面可以帮助一线医生节约体力与时间,另一方面可以通过分流医疗常识、常见病、慢性病等问诊需求,把资源留给更需要的急症、重症患者,提升医疗服务的可及性。
AI大模型助力医疗
近日,IDEA研究院认知计算与自然语言研究中心(IDEA Research CCNL)与NLPCC 2022联合发布了NLPCC2022测评任务Task 1:用医疗AI模型完成知识问答。赛题数据集今日起开放下载,优胜队伍将有机会获IDEA研究院实习名额。本文将为您介绍赛题详情与参赛方式。
任务定义
参赛者用给定的医疗领域文本,训练一个语言模型,使其理解给定医疗文本中的知识。在测试阶段,参赛者训练的模型接受医疗领域的提问,通过生成文本的方式产生正确答案。答案的生成应该完全依赖于语言模型的记忆和推理,而不能访问给定医疗文本。
数据集说明
数据集词例
数据源来自PubMed开源医疗数据集,IDEA研究院CCNL从中挑选了2019年爆发以来新型冠状病毒肺炎的相关数据,以及生命时报《算数·健康(2018)》大数据报告中,国民较为关心的十大疾病相关的数据,主要采自期刊杂志、论文综述等文献。
数据集样例
Baseline Model:“余元”
IDEA研究院CCNL将提供“余元-3.5B”作为Baseline Model为参赛选手提供参考。“余元”是IDEA研究院CCNL“封神榜”开源大模型计划中的系列医疗模型,“余元-3.5B”是国内目前最大的开源GPT2医疗模型,其对医疗事实判断准确率接近90%。而这次我们又专门提供了“余元QA”模型,它是基于基础的“余元”模型微调而来,具备良好的问答能力。
“余元QA”模型效果示意
参赛队伍可以使用我们提供的“余元”系列模型,作为基线模型,也可以用其他语言模型,要求语言模型的参数规模不能超过“余元”模型(35亿参数)。
“封神榜”开源大模型计划全方位地开源了一系列的自然语言预训练大模型,除了医疗领域,还会覆盖更多不同专业领域,各模型结构、模型尺寸也不相同。可通过阅读《IDEA大会发布|“封神榜”大模型开源计划》继续了解。
赛程安排
Timeline
关键时间:
本次比赛不截止报名,参赛选手应在5月5日后、截止日5月25日0时前于挑战赛主页的排行榜中提交结果
评估指标:
使用的评估指标为rouge和bleu分
排名机制:
该排行榜将保持动态刷新,5月25日刷新截止后,即可确定最终排名
注意事项:
参赛队伍回答评估问题的时候,不能使用检索、抽取式等方式
报名方式
下载报名表→填写报名表→发送到IDEA研究院CCNL公共邮箱
报名表下载地址:
https://idea.edu.cn/ccnl-act/NLPCC2022.SharedTask1.RegistrationForm.doc
IDEA研究院CCNL公共邮箱:
扫描下方二维码进入赛题页面,可直接下载报名表、数据集与Baseline Model“余元”,并即时掌握比赛新消息。
奖项设置
前三名队伍将获得NLPCC测评比赛获奖证书,其中表现优秀者将有机会获得IDEA研究院实习名额。
如何帮助预训练大模型更好地回应时代的医疗与健康需求?IDEA研究院CCNL诚邀您与我们共同书写这份回答,点击左下角阅读原文,可直接进入挑战赛主页。
关于 IDEA Research CCNL
IDEA研究院认知计算与自然语言研究中心(Cognitive Computing and Natural Language, CCNL)致力于推动预训练大模型为代表的新一代认知与自然语言基础前沿技术的进一步发展,力图解决大模型实际落地过程中的全部技术问题,构建对话机器人、知识抽取、知识体系等自然语言领域的新的技术架构,打造认知人工智能的新技术范式。
扫描下方二维码,加入IDEA研究院CCNL。
文章评论