近日,天津大学医学部药学院吴晶教授在医学领域顶级期刊BMJ-British Medical Journal(中科院1区TOP期刊,2023 IF = 93.7)发表题为 Efficiency Must Not Compromise Trustworthiness in Rating Certainty and Formulating Recommendations in AI Era的观点文章。文章指出,人工智能(AI)可加速Core GRADE证据质量评价的技术环节,但无法替代人类在证据评级和临床建议制定中的细微判断与价值考量。

Core GRADE证据质量评价体系是基于GRADE(Grading of Recommendations Assessment, Development and Evaluation)证据质量评价体系制定的证据质量评价的核心方法,其有效引导了全球临床指南制定与卫生技术评估中对证据质量的科学评价。该评论文章指出,AI工具在自动化证据质量评价体系中的某些技术性任务方面展现出潜力,能显著提高效率、降低成本并实现信息实时更新。然而,AI目前存在根本性局限,即它无法胜任Core GRADE方法所要求的、依赖情境和临床推理的细微判断,更无法处理从证据到建议转化过程中必须整合的多维度因素。
要使AI有效辅助证据评估和指南制定,必须严格遵循透明性、结构化判断和以患者为中心的Core GRADE原则。关键在于人类团队必须预先做出关键决策(如明确定义结构化问题、设定评级阈值、先验假设、分析模型选择、具体评级标准等),并将这些详细规范嵌入AI提示中,确保AI输出透明、可验证的记录。即便如此,后续涉及价值观、偏好、可行性、成本和公平性的复杂判断仍需人类专家完成。文章强调,效率提升不能以牺牲可信度为代价,在AI时代坚守Core GRADE原则是确保生成既及时又可靠的临床建议的基础。
天津大学医学部药学院为本论文第一单位,吴晶教授为论文第一作者。加拿大麦克马斯特大学荣誉教授Gordon Guyatt、新加坡南洋理工大学助理教授Liang Yao为本文的共同作者。
全文链接:https://doi.org/10.1136/bmj.r1105