1分子生物学和免疫学医学生物化学系,塞维利亚大学医学院,塞维利亚大学41009,西班牙塞维利亚41009,西班牙2塞维利亚研究所,塞维利亚,IBIS,IBIS,IBIS,IBIS,Virgen delRocío Valladolid,47005 Valladolid,西班牙4 47003 Valladolid大学护理系,西班牙Valladolid,西班牙5 5号,瓦拉多利德大学(University of Valladolid),瓦拉多利德大学(University of Valladolid),瓦拉多利德大学(University of Valladolid),valladolid,valladolid,valladolid,valladolid,valladolid,valladolid,valladolid,valladolid,valladolid,valladolid,valladolid,valladolid,valladolid,valladolid,valladolid。 alfredo.corell@us.es†Alfredo Corell以前在该部门(3);目前处于隶属关系1和2。 div>
检查算法的输出,并质疑所使用的人工智能系统和工具中固有的偏见。考虑人工智能工具对环境、人类或社会的益处和危害。重要的是,考虑数据集如何在我们的社会中重现偏见。
1 加利福尼亚大学洛杉矶分校大卫格芬医学院,加利福尼亚州洛杉矶;2 首尔国立大学医院,韩国首尔;3 高丽大学安岩医院,韩国首尔;4 首尔国立大学医学院,首尔国立大学盆唐医院,韩国城南;5 德克萨斯大学 MD 安德森癌症中心,德克萨斯州休斯顿;6 奥克斯纳医疗中心,路易斯安那州新奥尔良;7 峨山医疗中心,韩国首尔;8 乔治弗朗索瓦勒克莱尔中心,法国第戎;9 贝尔戈尼研究所 - 波尔多及西南地区癌症防治中心,法国波尔多;10 普瓦捷大学医院中心,法国普瓦捷;11 Arcus Biosciences, Inc.,加利福尼亚州海沃德;12 Gilead Sciences, Inc.,加利福尼亚州福斯特城; 13 耶鲁大学医学院,康涅狄格州纽黑文
个性化的基于剂量的治疗计划需要准确且可重复的非侵入性测量,以确保安全性和有效性。使用SPECT估算剂量是可能的,但对于α(A) - 粒子 - 由于复杂的G-发射光谱,极低的计数以及各种跨扫描仪 - 扫描仪 - 少量的杂物构造而进行的,发射放射性药物治疗(A -RPT)。Through the incorporation of physics-based considerations and skipping of the potentially lossy voxel-based recon- struction step, a recently developed projection-domain low-count quantitative SPECT (LC-QSPECT) method has the potential to provide reproducible, accurate, and precise activity concentration and dose measures across multiple scanners, as is typically the case in multicen- ter settings.为了评估这一潜力,我们进行了一项硅成像试验,以评估基于223 RA的A-RPT的LC-QSPEPT方法,该试验概括了患者和成像系统的变异性。方法:一项虚拟成像试验,名为《硅成像试验》中的量化精度(ISIT-QA)的虚拟成像试验的设计旨在评估在多个扫描仪中LC-Qspect方法的性能的目的,并将其与基于常规的重建量化量化方法进行比较。在这项试验中,我们模拟了280例现实的虚拟虚拟患者患有骨 - - 抑制前的前列腺癌,并用基于223 RA的A-RPT治疗。该试验是使用9个模拟SPECT扫描仪 - 准直仪配置进行的。最后,在测试 - 重测研究中评估了该方法的可重复性。该试验的主要目的是通过计算LC-QSPECT来评估多个扫描仪 - 准直仪配置的剂量估计值的可重复性,通过计算类内相关系数。此外,我们比较了可重复性,并评估了两种考虑的量化方法在多个扫描仪 - 准直仪配置方面的准确性。结果:在这项试验中,使用268 223 RACL 2治疗的虚拟前列腺癌患者(共2,903个病变)评估LC-QSPECT。lc-qspect提供了9个扫描仪 - 准直仪配置的剂量估计值(类内相关系数。0.75)和高精度(恢复系数的集合平均值范围为1.00至1.02)。与常规重建 -
a 通过腰椎 IT 推注给药。参与者将在 24 周的治疗期间接受多剂研究药物(ION717 和安慰剂)。剂量顺序是盲法的。b 列表并不全面。c 在知情同意时。患者必须有一名年满 18 岁且能够并愿意在整个试验期间尽其所能促进患者参与的看护者;看护者还必须能够并愿意在整个试验期间提供有关他们自己和患者的信息。d 异常包括但不限于:阻塞性脑积水、存在用于引流脑脊液的功能性脑室腹腔分流术、植入中枢神经系统导管;已知的脑或脊髓疾病会干扰腰椎穿刺过程、脑脊液循环或安全性评估;或研究者认为会导致患者不适合入组或可能干扰患者参与或完成研究的任何其他情况。 1. ClinicalTrials.gov。访问日期:2024 年 2 月 5 日。https://www.clinicaltrials.gov/study/NCT06153966/ 2. Ionis Pharmaceuticals。Ionis 反义管道。访问日期:2024 年 2 月 6 日。https://www.ionispharma.com/ionis-technology/antisense-pipeline/ 3. Ionis Pharmaceuticals。存档数据。
本文探讨了以下假设:在生成任务中熟练的大型语言模型(LLMS)同样熟练于评估者。我们使用Triviaqa的三个LLM和一个开源LM的性能(QA)和评估任务(Joshi et al。,2017)数据集。结果表明有明显的差异,与生成任务相比,LLMS在评估任务中的性能较低。有趣的是,我们发现了不忠评估的情况,模型可以准确评估他们缺乏能力的领域的答案,从而强调了表达LLMS作为评估者的忠诚和信任度的需求。这项研究有助于理解“生成ai para-dox”(West等人,2023年),强调了探索卓越和评估能力之间的相关性以及仔细审查模型评估中忠实方面的必要性。
传统上,由于人工解读、微生物形态(形状、群集等)的不可预测性以及人眼的自然检测限,单个操作员容易在同一块培养皿上计数出不同数量的微生物。1 必须定义一个标准化的 CFU 计数来评估当前方法的性能。为了获得这个黄金标准,我们开发了一种方法来使用从培养开始捕获的所有图像生成的数据来校正实际操作员计数。我们将其定义为“参考传统计数”。
如果没有禁忌使用贝伐单抗。hr,危险比; ORR,客观响应率; OS,整体生存; PFS,无进展的生存; TEAE,治疗紧急不良事件
方法与结果:纳入了接受踝臂指数测试的连续患者(2015 年 4 月 1 日至 2020 年 12 月 31 日)。患者被随机分配到训练、验证和测试子集(60%/20%/20%)。深度神经网络在静息胫后动脉多普勒波形上进行训练,以预测 5 年时的主要不良心脏事件、主要不良肢体事件和全因死亡。然后根据训练集中每个预测分数的四分位数对患者进行分组分析。在总共 11 384 名患者中,10 437 名患者符合研究纳入标准(平均年龄 65.8±14.8 岁;40.6% 为女性)。测试子集包括 2084 名患者。在 5 年的随访期间,共有 447 人死亡、585 起重大不良心脏事件和 161 起男性事件。调整年龄、性别和 Charlson 合并症指数后,胫后动脉波形的深度神经网络分析可独立预测 5 年内的死亡(风险比 [HR],2.44 [95% CI,1.78–3.34])、主要不良心脏事件(HR,1.97 [95% CI,1.49–2.61])和主要不良肢体事件(HR,11.03 [95% CI,5.43–22.39])。