创建临床研究报告 (CSR) 高度手动且耗时,需要其他医学作者对表格中的数字、安全叙述和其他文档中的信息进行质量控制。CSR 的大量信息来自其他来源,例如协议、SAP、安全叙述、正文表格等。附录部分由 CRF、TLF 等构成。利用机器学习、自然语言处理和自然语言生成 (ML/NLP/NLG) 等新兴技术自动创建 CSR 将有效减少手动工作量。本文将讨论一种在工具中实现的机器学习算法。该工具旨在生成预填充的 CSR,其中包含来自协议、SAP 和其他来源的信息,并解释遵循 ICH-E3 指南的模板相应部分中的正文表格。这种方法可以为医学作者节省 70%-80% 的时间,使他们能够专注于讨论要点、研究结果的解释和结论。