背景:用于临床试验的知情同意书(ICF)变得越来越复杂,由于合法的术语和冗长的内容而引起的参与者的理解和参与通常会阻碍参与者。大型语言模型(LLMS)的最新进展为简化ICF创建过程的机会,同时改善可读性,可理解性和可行性。目标:本研究旨在评估Mistral 8x22b LLM在生成具有提高可读性,可理解性和可行性的ICF时的性能。具体来说,我们评估了模型在生成可读,可理解和可行的ICF时的有效性,同时保持准确性和完整性。方法:我们使用Mistral 8x22b模型从IMass Chan医学院的机构审查委员会中处理了4项临床试验方案,以生成ICF的关键信息部分。由8位评估者组成的一个多学科团队,包括临床研究人员和健康信息家,评估了针对人类生成的对应物的生成的ICF,以完成完整性,准确性,可读性,可理解性和可行性。关键信息指标的可读性,可理解性和可行性,其中包括18个二进制项目,用于评估这些方面,得分较高,表明信息的可访问性,可理解性和可行性更高。统计分析,包括Wilcoxon等级总和测试和类内相关系数计算,用于比较输出。与人类生成的版本相比,LLM生成的内容在可操作性上取得了完美的分数(100%vs 0%; P <.001)。结果:LLM生成的ICF表现出与关键部分之间人类生成版本相当的性能,准确性和完整性没有显着差异(p> .10)。LLM在可读性(可读性,可理解性和可行得分76.39%vs 66.67%vs 66.67%; FLESCH-KINCAID等级的7.95 vs 8.38)和可理解性(90.63%vs 67.19%; P = .02)中的超过了人类生成的ICF(可读性,可理解性和可行性; 7.95 vs 8.38)。 评估者一致性的类内相关系数为0.83(95%CI 0.64-1.03),表明整个评估的可靠性良好。 结论:Mistral 8x22b LLM在不牺牲准确性或完整性的情况下增强了ICF的可读性,可理解性和可行性方面表现出了有希望的能力。 llms为ICF生成提供了可扩展的,有效的解决方案,潜在地增强了参与者的理解和临床试验中的同意。超过了人类生成的ICF(可读性,可理解性和可行性; 7.95 vs 8.38)。评估者一致性的类内相关系数为0.83(95%CI 0.64-1.03),表明整个评估的可靠性良好。结论:Mistral 8x22b LLM在不牺牲准确性或完整性的情况下增强了ICF的可读性,可理解性和可行性方面表现出了有希望的能力。llms为ICF生成提供了可扩展的,有效的解决方案,潜在地增强了参与者的理解和临床试验中的同意。
国际计算机应用和信息技术研究杂志(IJRCAIT)第8卷,第1期,Jan-Feb 2025,pp。2410-2422,文章ID:IJRCAIT_08_01_175在线可在https://iaeme.com/home/issue/issue/ijrcait?volume=8&issue=1 ISSN印刷:2348-0009; ISSN在线:2347-5099;期刊ID:0497-2547影响因子(2025):14.56(基于Google Scholar引用)doi:https://doi.org/10.34218/ijrcait_08_01_175©iaeme Publication
培训过程LLM对来自Internet,书籍,文章,网站的大量文本数据进行了“培训”,基本上是用书面语言的所有内容。在培训期间,它学习了单词,短语和概念之间的模式,联系和关系。它不仅记住文本,而且还学习了语言通常如何流动以及不同的想法在输入提示(通常是问题或命令)中的模式识别中如何连接到LLM,它将分析输入并预测最有可能基于培训期间学到的所有模式来进行下一个文本。不断计算哪些单词和短语最有可能彼此关注的概率。响应生成它通过一次预测一个单词来生成响应,始终选择在上下文中有意义的下一个单词。这很快就会发生,使响应感觉自然而连贯的是要理解的关键是,LLM并没有像人类那样真正“理解”语言 - 他们擅长根据统计模式预测和生成文本,但它们没有真正的理解或意识。当您提出问题时,LLM不会搜索数据库以寻求答案。相反,它在数学上计算了逻辑上遵循输入的最可能的单词序列。
分析临床试验数据对于评估新疗法的功效和安全性至关重要。传统上,此过程需要在生物医学,临床研究,生物统计学和数据科学方面的专业专业知识,通常使其劳动密集型,耗时且昂贵[1]。对于缺乏数据分析培训的临床医生和研究人员,复杂的统计要求可能会成为重大障碍,从而导致将研究结果转化为临床实践的延迟。以大数据集和多个终点为特征的现代临床试验的复杂性日益加剧,加剧了这些挑战[2]。临床试验越来越依赖的不同原始和次要数据源的整合进一步强调了对处理复杂的,异质数据的先进分析工具的需求。介入的临床试验依赖于严格的协议下的一致记录保存,涉及多个学科的专家,包括 - 疾病生物学,专科临床护理,毒理学,转化科学,生物统计学,生物分析科学,监管事务,监管事务和生物医学伦理学。每个领域都为试验设计提供了重要的要素,以确保试验的各个方面都符合监管标准和科学严格的严格性,以产生有关治疗功效和安全性的证据。
Originals Received: 12/27/2024 ACCEPTANCE FOR PUBLICATION: 01/17/2025 DANIELA VOGEL Master's student in Engineering, Management and Knowledge Media Institution: Federal University of Santa Catarina (UFSC) Address: Florianópolis, Santa Catarina, Brazil E-mail: danielavogel@gmail.com Alexandre Moraes Ramos Doctor in Production Engineering Institution (UFSC) Address: UFSC大学)弗洛里亚诺波利斯,圣卡塔琳娜,巴西电子邮件:Alexandre.m.r@ufsc.br ana MariaBenccimãoFranzoniPhd in Geosciences and Envorymity Institation:Paulista State State Universityjúliode Mesquita filho(UneSp)地址:Florianópolis,Santa catarazil: ana.franzoni@ufsc.br本文使用综合文献审查方法分析了大语言模型(LLMS)的使用。 该研究探讨了这些技术的好处,挑战和未来观点,重点是它们在自定义学习和开发高级教育工具中的应用。 遵循了综合审查方法的六个阶段,包括主题的定义,包容性和排除标准,研究和选择研究,分类,分析和解释结果的分析和解释以及知识综合的介绍。 研究考虑了从Scopus和Science数据库中提取的2023年至2024年之间发表的文章,从而分析了29项研究。 主题分析确定了四个Originals Received: 12/27/2024 ACCEPTANCE FOR PUBLICATION: 01/17/2025 DANIELA VOGEL Master's student in Engineering, Management and Knowledge Media Institution: Federal University of Santa Catarina (UFSC) Address: Florianópolis, Santa Catarina, Brazil E-mail: danielavogel@gmail.com Alexandre Moraes Ramos Doctor in Production Engineering Institution (UFSC) Address: UFSC大学)弗洛里亚诺波利斯,圣卡塔琳娜,巴西电子邮件:Alexandre.m.r@ufsc.br ana MariaBenccimãoFranzoniPhd in Geosciences and Envorymity Institation:Paulista State State Universityjúliode Mesquita filho(UneSp)地址:Florianópolis,Santa catarazil: ana.franzoni@ufsc.br本文使用综合文献审查方法分析了大语言模型(LLMS)的使用。该研究探讨了这些技术的好处,挑战和未来观点,重点是它们在自定义学习和开发高级教育工具中的应用。遵循了综合审查方法的六个阶段,包括主题的定义,包容性和排除标准,研究和选择研究,分类,分析和解释结果的分析和解释以及知识综合的介绍。研究考虑了从Scopus和Science数据库中提取的2023年至2024年之间发表的文章,从而分析了29项研究。主题分析确定了四个
解决复杂的计划问题需要大型语言模型(LLMS)明确对状态过渡进行建模,以避免规则违规,遵守限制并确保操作性 - 这是由自然语言固有的歧义所阻碍的任务。为了克服这种歧义,规划域定义语言(PDDL)被杠杆化为一种计划,以实现精确和正式的状态描述。使用PDDL,我们可以生成一个象征性的世界模型,其中经典的搜索算法(例如A ∗)可以无缝地找到最佳计划。但是,由于缺乏PDDL培训数据,直接生成具有当前LLM的PDDL域仍然是一个开放的挑战。为了应对这一挑战,我们建议扩大LLMS的测试时间计算以增强其PDDL推理功能,从而使高质量的PDDL域的产生。具体来说,我们引入了一种简单而有效的算法,该算法首先采用了最佳的N采样方法来提高初始解决方案的质量,然后通过口头化的机器学习以细粒度的方式优化解决方案。我们的方法在PDDL域的产生中大大优于O1-Mini,在两个任务上达到了超过50%的成功率(即,从自然语言描述或PDDL问题中生成PDDL域)。这是在不需要额外培训的情况下完成的。通过利用PDDL作为状态抽象,我们的方法能够在几乎所有竞争级的计划任务上都超过当前最新方法。
摘要在当今世界上,由于信息传播的速度和社交媒体的影响,虚假信息的问题变得越来越相关。本文探讨了假新闻对社会及其政治,经济和社会后果的影响。特别注意使用大语模型(LLMS)来自动进行事实检查过程。描述了LLM在验证信息中的功能,包括文本分析,与可靠来源的比较以及上下文化。同时,突出显示了使用LLMS创建假新闻的风险。提出了一种基于AI的虚假信息检测工具的体系结构,其中包括查询处理模块,数据库,使用Web资源和结果分析。此方法旨在提高信息验证的效率和准确性。
摘要 - 药物的建议是智能医疗保健系统的重要方面,因为它涉及根据患者的特定健康需求规定最合适的药物。不幸的是,当前正在使用的许多复杂模型倾向于忽略医疗数据的细微差别语义,同时仅依靠身份。此外,这些模型在处理涉及第一次访问医院的患者的病例中面临重大挑战,因为他们缺乏以前的处方历史。为了解决这些问题,我们利用大语模型(LLM)的强大语义理解和投入性特征。我们的研究旨在使用LLMS转变现有的药物建议方法。在本文中,我们介绍了一种名为“大语言模型”提炼药物建议(领导者)的新方法。我们首先创建适当的提示模板,使LLM能够有效建议药物。然而,LLM直接整合到推荐系统中会导致特定于药物的孔外问题。我们通过使用新颖的输出层和精制的调谐损耗函数来调整LLM来处理它。尽管基于LLM的模型表现出显着的功能,但它们在推理过程中受到高度计算成本的困扰,这对医疗保健行业来说是不切实际的。为了减轻这种情况,我们开发了一种功能级知识蒸馏技术,该技术将LLM的熟练程度转移到了更紧凑的模型中。为了简化实验的可重复性,我们在线发布实施代码1。在两个现实世界数据集(MIMIC-III和MIMIC-IV)上进行的广泛实验表明,我们提出的模型不仅可以提供有效的结果,而且还具有有效的效率。