这项工作旨在作为先前主张的讨论中的声音,即基于变压器模型体系结构的验证大型语言模型(LLM)可能是一种陈述。已经对LAMDA模型提出了此类主张,也是关于LLM驱动的聊天机器人(例如Chatgpt)的当前浪潮的。如果确认,由于广泛使用类似模型,该主张将在自然语言处理(NLP)社区中产生严重的影响。但是,在这里,我们认为这样的大语言模型无法意识到,尤其是LAMDA比其他类似的模型没有任何进步。我们通过通过综合信息理论分析变压器架构来证明这一点。我们将感性的主张视为在NLP报告中使用拟人化语言的更广泛倾向的一部分。不管主张的真实性如何,我们认为这是一个合适的时机,可以盘点语言建模的进步并考虑任务的道德含义。为了使这项工作对NLP社区以外的读者有所帮助,我们还提出了语言建模的必要背景。
自 1961 年首次发现骨髓来源的多能干细胞以来,干细胞研究取得了长足进步 [ 1 ]。干细胞是一种独特的细胞,能够通过有丝分裂不断复制,从而形成更多的细胞。该过程会产生两种不同的细胞类型:一种会进化为特定细胞类型,另一种则保留自我更新的能力 [ 2 ]。干细胞大致可分为三类:诱导多能干细胞 (iPSC)、胚胎干细胞 (ESC) 和成体干细胞 (ASC) [ 3 ]。由于 iPSC 和 ESC 能够转化为三个胚层:外胚层、中胚层和内胚层,因此它们被归类为多能干细胞 (PSC)。2006 年,Kazutoshi Takahashi 和 Shinya Yamanaka 通过使用病毒载体引入 Oct4、Sox2、Klf4 和 c-Myc 等特定转录因子,成功将小鼠体细胞转化为 iPSC [ 4 ]。此后,人们使用各种方法将不同类型的小鼠和人类体细胞重新编程为 iPSC [ 5 ]。这种重新编程人类细胞的创新方法引起了科学和医学领域的极大兴趣。iPSC 作为多能细胞来源,为人类 ESC 提供了一种替代方案。诱导多能干细胞的一个显著优势是它们来源于可以非侵入性获得的体细胞。这些细胞携带个体的遗传特征,可以降低免疫排斥的风险 [ 6 ]。现代医学领域对基于 iPSC 的疗法的关注度正在提高。它们在疾病建模、药物筛选和再生医学中的应用正在呈指数级增长 [ 7 ]。iPSC 因其自我更新能力和分化为所有人体细胞类型的能力而在疾病建模中发挥着关键作用。这使得它们成为创建各种疾病模型以供研究的理想选择 [ 8 – 10 ]。患者特异性 iPSC 在制定有针对性的治疗策略和药物开发方面特别有价值。此外,来自正常细胞和患病细胞的 iPSC 可以分化为神经元、肝细胞、心肌细胞等,以评估毒性和副作用,这是治疗分子开发的关键因素 [11]。在再生医学中,iPSC 用于修复或再生受损或退化的组织。这是通过在实验室中从 iPSC 创建器官组织并将其移植到受伤区域来实现的。这种疗法有望用于治疗造血系统疾病、肌肉骨骼损伤、脊髓损伤和肝损伤等疾病 [ 12 – 14 ]。已经开发出各种用于创建 iPSC 的技术,例如使用逆转录病毒或慢病毒进行基因转导和化学诱导。然而,生成 iPSC 的过程通常很慢且效率不高,啮齿动物细胞需要大约 1-2 周,人类细胞需要 3-4 周,成功率通常较低。此外,通过检查菌落形态来评估 iPSC 的质量容易出现人为错误,这是一个重大挑战,在进行进一步的实验或治疗用途之前必须解决这一问题。尽管在提高 iPSC 培养的效率和速度方面取得了进展,但该过程仍然耗费资源,因此需要开发自动化系统以最大限度地减少错误并增强 iPSC 分析。最近,人工智能 (AI) 技术,包括机器学习 (ML) 和深度学习 (DL),已被用于增强再生疗法。这些 AI 驱动方法的实施可以改进
自疫情爆发以来,各组织一直在积极寻求提高组织敏捷性和弹性 (regility) 的方法,并转向人工智能 (AI) 来获得更深入的理解并进一步提高其敏捷性和弹性。各组织正在将人工智能作为实现这些目标的关键推动因素。人工智能通过快速准确地分析大型数据集来增强组织的能力,从而实现更快的决策并建立敏捷性和弹性。这种战略性地使用人工智能为企业带来了竞争优势,并使其能够适应快速变化的环境。如果不优先考虑敏捷性和响应能力,可能会导致成本增加、错失机会、竞争和声誉受损,并最终导致客户、收入、盈利能力和市场份额的损失。可以通过利用可解释的人工智能 (XAI) 技术来确定优先级,阐明人工智能模型如何做出决策并使其透明、可解释和可理解。基于之前关于使用人工智能预测组织敏捷性的研究,本研究重点关注将可变形人工智能技术(例如 Shapley 加法解释 (SHAP))整合到组织敏捷性和弹性中。通过确定影响组织敏捷性预测的不同特征的重要性,本研究旨在揭开使用可变形人工智能的预测模型的决策过程的神秘面纱。这对于人工智能的道德部署、在这些系统中培养信任和透明度至关重要。认识组织敏捷性预测中的关键特征可以指导公司确定要集中精力在哪些领域以提高其敏捷性和弹性。
蛇咬伤每年导致 81,000-138,000 人死亡,另有 400,000 人致残,主要发生在热带和亚热带非洲、亚洲和拉丁美洲。如果我们想了解蛇咬流行国家威胁不同人群的蛇的多样性,我们必须能够正确识别咬人的蛇。这是改善蛇咬伤流行病学数据、确保在特定国家适当分配抗蛇毒素以及在被流行蛇咬伤时使用这些抗蛇毒素对患者进行特定治疗的关键。然而,蛇的种类繁多,医疗保健提供者缺乏识别它们的专业知识,即受害者将蛇带到医院或拍照。在这里,我们使用来自世界各地的数千张蛇照片和计算机视觉来开发一个 AI 模型来对蛇进行分类。我们首次展示了 AI 可以准确地对来自世界各地的大量有毒和无毒蛇进行分类,包括来自蛇咬流行国家的相似物种。这项研究为蛇咬流行病学家和医疗保健提供者、爬虫学家和普通公众开发全球、区域或国家蛇类识别支持系统奠定了基础。
2017 年,全球新增前列腺癌病例 140 万例,导致 416 000 人死亡 [1]。发病率上升和人口老龄化导致前列腺癌病例自 2007 年以来增加了 42% [1]。事实上,前列腺癌患者的管理是一个复杂的过程,涉及不断扩大的多学科团队,包括泌尿科、放射科、病理科和放射治疗科。这些部门之间有效的信息交换对于提供适当的高质量护理和减少不良影响至关重要。然而,在大多数组织中,相关数据分散存储在不同的 IT 系统中,各部门基本上独立运作 [2-4]。部门之间的这些技术差距阻碍了临床医生全面了解患者的个体状况 [5,6]。在日常临床实践中,临床医生花费大量时间收集、整合和评估患者数据以护理患者 [7]。为了让医生全面了解患者的病情,需要跨系统和部门进行无缝的信息交换 [8-10]。需要整合最佳实践指南支持的有效数据集成工具可以从多个来源提取和组合数据,以确保持续的跨学科患者护理 [6,11-13]。此外,数据表示必须适应每个接收者的个人需求和选择及其在护理供应链中的目的,以避免信息缺失或过载 [6]。在过去三年中,我们与行业合作伙伴西门子医疗合作,根据欧洲医学联合会前列腺癌指南定义的最佳实践,开发了针对特定途径的临床决策支持系统原型。这项工作包括数据映射、数据集成和前端数据表示的开发。在这里,我们在前列腺癌治疗决策的背景下评估了这一发展的第一个 CE 认证版本。
根据世界卫生组织的《世界残疾报告》,全球残疾患病率接近 20% [1]。在西方社会,导致严重运动残疾和丧失独立性的最常见原因是获得性脑损伤(血管性或创伤性)和脊髓损伤(创伤性和非创伤性;以下简称 SCI)[2]。2016-2017 年估计创伤性脑损伤 (TBI)、中风和 SCI 的发病率分别为每年每 10 万人中 315 人、162 人和 27 人 [3,4]。在欧洲,15 岁以上人口中有 6.6% 患有严重运动残疾,定义为严重限制或无法行走和/或爬楼梯。残疾的患病率随着年龄的增长而显著增加:超过三分之一的依赖行动和个人护理的人年龄超过 75 岁,其中一半是女性(43.7%)[5]。严重的行动不便会给社会生活带来重大限制。不到一半的严重行动不便者可以依靠支持性关系网络。由于许多残疾人 (PWD) 独居 (27.4%),与家人或其他人一起生活无法确保足够的个人自主功能水平。尽管残疾数据令人震惊,而且与神经发生和神经可塑性相关的知识也在不断进步,但没有短期解决方案能够确保基于受损神经组织再生的完全康复 [6]。因此,在致残疾病的非急性期,增强功能活动可能更适合参与目标,而不是神经系统损伤的恢复。在这种情况下,辅助技术 (AT) 代表了有益的解决方案。AT 将所有可用于增强、稳定或提高残疾人功能能力的物体、设备或系统聚集在一起 [7]。或者,AT 是“个人因健康状况而使用的所有设备或装置,用于帮助完成活动” [8]。人们希望组织再生技术能尽快成为可行的解决方案,同时,由安装了“智能神经假体”的人工智能协议组成的 AT 系统目前正在引起研究关注 [9,10]。智能神经假体是用人工智能协议打造的机器人设备,通过替代受损的神经网络来恢复失去的感觉运动功能。具体来说,这些设备可以利用从大脑记录的信号,将其转化为电子臂、腿或轮子和桌子的运动 [11,12]。从 21 世纪初开始,脑机接口促进了神经信号的获取,以规划和执行运动动作。主要记录来自额叶皮层 [11,13–15]。然而,它们在手势规划方面的成功并没有导致手势执行。从后顶叶皮层 (PPC) 获取的神经元的解码似乎更为成功 [16, 17]:感觉和运动信息有效地引导了四肢瘫痪患者移动的机械臂 [18, 19]。多年来,研究最终用户需求与 AT 的匹配计划的研究表明存在一些局限性。对于市场上的 AT,如果人与技术的匹配不精细,影响技术的流失率很高 [7]。阻碍 AT 采用的一些障碍包括对 AT 成本、最终用户的身体状况、产品安全性和可靠性控制不力。具体而言,研究建议重点分析最终用户对 AT 的态度、控制体验、易用性、最终用户与其主要照顾者的需求之间的匹配性以及 AT 可以提供的解决方案 [7]。此外,独立性和自主性成为最终用户期望 AT 能够保障的主要因素 [20]。有关确保智能神经假体的可接受性的心理社会计划的证据越来越多[21-24]。这些系统的出现提供了利用患者大脑活动控制外部设备(例如机械臂)的可能性[25]。一些研究表明,利用人类运动大脑区域提取的皮质信号可以重建运动轨迹和终点目标[15,26-28]。然而,只有少数研究涉及人类
死海古卷是圣经古代抄写文化的有力证据。本研究采用创新的古文字学方法(研究古代手写体)作为了解这种抄写文化的新切入点。古文字学的问题之一是在书写风格近乎统一的情况下确定作者的身份或差异。大以赛亚书卷(1QIsa a)就是一个例子。为此,我们使用模式识别和人工智能技术对古文字学进行创新,并开拓个人抄写员的微观层面,以开放了解圣经古代抄写文化。我们报告了该古文字学系列栏目中出现断点的新证据。在没有事先假设作者身份的情况下,基于降维特征空间的点云,我们发现手稿前半部分和后半部分的列最终位于这种散点图的两个不同区域,特别是对于一系列数字古文字工具而言,每个工具都涉及脚本样本非常不同的特征方面。在二次独立分析中,现在假设作者存在差异并使用另一种独立特征方法和几种不同类型的统计测试,在列系列中发现了一个切换点。在第 27-29 列中出现了明显的相变。我们还展示了距离方差的差异,因此手稿第二部分的方差更高。鉴于两半之间存在统计学上的显著差异,我们通过目视检查字符热图和脚本中最具区分力的 Fraglet 集,进行了第三级事后分析。这项研究表明,两位主要抄写员(各自表现出不同的书写模式)负责抄写《以赛亚书卷》,该研究通过提供新的、切实的证据,揭示了圣经的古代抄写文化,证明古代圣经文本并非仅由一位抄写员抄写,而是多位抄写员在仔细模仿另一位抄写员的书写风格的同时,可以就一份特定的手稿密切合作。
我们的心理和情感健康主要通过语言来传达,因此精神病专业人员历来依靠临床对话和患者叙述来评估心理健康。然而,人工智能 (AI) 的最新发展为该领域带来了新的见解,通过可以从更多样化的数据来源推断情感含义的技术 [1-3]。计算语言学和情感分析学科一直是这一过程的核心 [2-5]。在计算语言学中,“自然语言处理” (NLP) 是一种用于构建可解释原始人类语言数据的计算模型的技术 [2-5]。情感分析是人工智能的一个子集,用于测量、理解和响应人类情感的语言表达。NLP 和情感分析的结合使数据科学家能够构建可从书面文本中理解人类情感的模型 [3]。在医学方面,这些模型目前正被用于提供关于患者情绪和心理健康的丰富信息[6-11]。在过去几年中,NLP 模型已用于从临床记录中识别自杀意念、在线预测自杀风险,并在推特上挖掘精神病患者的自我披露[7,10-13]。这些模型既可用于个体患者护理,也可用于更广泛的公共卫生政策。人口层面的应用包括 NLP 算法,它可以有效地绘制美国各地的行为健康疾病图,并与疾病控制和预防中心 (CDC) 的公共卫生数据相关联[8]。在个人层面,研究人员已证明,他们能够通过在线数据高度准确地预测哪些母亲会患上产后抑郁症[9,14]。尽管这些技术备受青睐,但我们必须在现有医疗保健转型的大背景下考虑它们。数字健康与医学的融合正在给医疗领域带来快速变化,我们现在做出的决定将对未来的病患护理产生深远影响。目前,研究人员和开发人员在构建这些工具时假设现有医疗实践是“黄金标准”,尽管该领域长期存在歧视性实践、偏见和医疗错误[15-23]。例如,长达40年的塔斯基吉审判证明了医学领域种族主义研究的历史;20世纪的“歇斯底里”诊断积极伤害了患有器质性疾病的女性;对同性恋的病理化反映了医学学科长期存在的性别歧视[15、17、24]。医学史上充斥着基于身份的偏见性有害实践的例子,我们在今天的临床实践中仍然看到这种历史的影响。如果我们要创建不伤害弱势患者群体的模型,那么我们必须首先质疑这些模型建立的基础。正在进行的对医学中现存偏见的研究为此提供了理想的资源。当前的公共卫生研究表明,当女性和男性出现相同的医学症状时,女性的症状更有可能被解读为社会心理症状,从而导致治疗延误[15]。药理学研究表明,将少数群体排除在药物试验之外导致的干预措施并不能以相同的速度使所有患者受益[15,25-27]。此外,由于医学课程和诊断框架的偏见而导致的基于性别的误诊使女性面临更大的心脏事件不良后果风险[15,16]。
高密度脂蛋白 (HDL) 的抗炎和抗氧化特性的发现引发了一个问题:HDL 是否可用于治疗疾病中的炎症。胰岛素抵抗主要依赖于肝脏炎症,研究表明,组成性活性肝核因子 κB (NF- κ B)(驱动炎症反应的中枢介质)会导致小鼠模型中的胰岛素抵抗状态 [ 1 ]。我们之前证明,单独(无脂质)或作为含有 PLPC 的重组 HDL(rHDL)的一部分施用载脂蛋白 A-I (apoA-I) 可预防肝脏炎症并改善高脂喂养的 C57Bl/6 小鼠的胰岛素抵抗 [ 2 ]。虽然结果令人鼓舞,但 apoA-I 颗粒的产生很大且耗时。载脂蛋白 A-I (apoA-I) 模拟肽已被开发和设计,其功能类似于全长 apoA-I,但效力更强,药代动力学特征也比全长 apoA-I 更好 [ 3 , 4 ]。这些模拟肽比 rHDL 有许多优势,包括成本相对较低、生产简单,并且能够修改其结构以允许口服给药。ApoA-I 模拟肽的特点是其苯丙氨酸残基附着,苯丙氨酸残基的增加与疏水性的增加及其与磷脂结合的能力相关 [ 4 ]。根据序列中疏水性苯丙氨酸残基的数量,研究最深入的是 4F 和 5F apoA-I 模拟肽。它们具有与 apoA-I 相同的 A 类两亲性螺旋结构 [ 5 ]。D-4F 和 L-5F 的区别在于两亲性螺旋疏水面上存在的苯丙氨酸数量,并且 D-4F 由 D-氨基酸合成,而 L-5F 由 L-氨基酸合成。对于口服给药,与 L-氨基酸相比,D-氨基酸被发现更能抵抗酶促降解。然而,吸收后,D-氨基酸不会降解,这可能导致毒性和其他副作用 [ 6 ]。L-氨基酸在循环中的毒性较小,但它们不能抵抗口服的酶促降解。两者都曾在生物学研究中使用过,据报道具有强大的抗炎和抗氧化作用 [ 7 – 12 ]。我们表明,模拟治疗显着在本研究中,我们直接测试了使用 apoAI 模拟肽 D-4F 和 L-5F 治疗是否可以改善高脂饮食 (HFD) 喂养小鼠的胰岛素敏感性,从而降低肝脏炎症。