我们都考虑在写作中使用生成式人工智能(GenAI)**(根据提示生成新作品的人工智能)和大型语言模型(将许多文本组合成语料库来训练预测模型),而关于是否/何时/如何允许在你的大学课程写作过程中使用 GenAI 的最佳资源之一就是你的课程导师。
高性能事件检测系统是进行某些预测研究所需的全部。在这里,我们介绍 AURA:一种使用未标记的实时数据训练的自适应预测模型,使用内部生成的近似标签进行实时训练。通过利用时间序列数据的相关性质,一对检测和预测模型耦合在一起,使得检测模型自动生成标签,然后用于训练预测模型。AURA 依赖于几个简单的原则和假设:(i) 目标应用中事件预测/预报模型的性能仍然低于事件检测模型的性能,(ii) 检测到的事件被视为弱标签,并被认为足够可靠,可用于在线训练预测模型,以及 (iii) 系统性能和/或系统响应反馈特性可以针对被测对象进行调整。例如,在医疗患者监测中,这可以实现个性化预测模型。癫痫发作预测被认为是 AURA 的理想测试案例,因为发作前脑电波因患者而异,根据患者情况定制模型可以显著提高预测性能。AURA 用于为 10 名患者生成个人预测模型,结果显示灵敏度平均相对提高 14.30%,误报率降低 19.61%。本文提出了一个概念验证,证明了在时间序列神经生理数据流上进行在线迁移学习的可行性,为低功耗神经形态神经调节系统铺平了道路。
课程描述 本课程让未来的技术领导者了解开发和部署人工智能系统的道德考量 - 使用大型数据集训练预测模型并根据其输出采取行动的计算系统。学生将学习人工智能伦理的核心概念,并将其应用于领导者面临道德挑战的现实场景。我们将评估人工智能在全球范围内的影响,在尊重不同社会和文化价值观的同时解决复杂问题。课程结束时,学生将了解人工智能作为更大的社会技术系统的一部分,并能够评估其对全球社会和个人的影响。最终目标是促进负责任地开发安全和有益的人工智能。成功完成后,您将获得 3 个课程学分。课程目标:
课程描述 本课程让未来的技术领导者了解开发和部署人工智能系统的道德考量 - 计算系统使用大型数据集来训练预测模型并根据其输出采取行动。学生将学习人工智能伦理的核心概念,并将其应用于领导者面临道德挑战的现实场景。我们将评估人工智能在全球范围内的影响,在尊重不同社会和文化价值观的同时解决复杂问题。在课程结束时,学生将了解人工智能作为更大的社会技术系统的一部分,并能够评估其对全球社会和个人的影响。最终目标是促进负责任地开发安全和有益的人工智能。成功完成后,您将获得 3 个课程学分。 课程目标:
偏向多数人群的算法偏差对机器学习在精准医疗中的应用构成了关键挑战。在本文中,我们评估了脑功能磁共振成像行为表型预测模型中的这种偏差。我们使用两个由混合族裔/种族组成的独立数据集(青春期前与成年)检查了预测偏差。当使用以白人美国人(WA)为主的数据训练预测模型时,非裔美国人(AA)的样本外预测误差通常高于 WA。这种对 WA 的偏差对应于模型学习到的更多类似 WA 的大脑行为关联模式。当仅使用 AA 训练模型时,与仅使用 WA 或相同数量的 AA 和 WA 参与者进行训练相比,AA 预测准确度有所提高,但仍低于 WA。总体而言,结果表明,需要谨慎对待当前大脑行为预测模型在少数族裔人群中的应用,并进行进一步研究。
药物建议系统在医疗保健方面已获得了显着的优势,作为根据患者的临床信息提供量身定制和有效的药物组合的一种手段。但是,现有方法通常遭受公平问题的困扰,因为与罕见情况相比,对于常见疾病患者的建议往往更准确。在本文中,我们提出了一种新型模型,称为鲁棒和准确的药物建议(RAREMED),该模型利用前 - 最终的学习范式来提高稀有疾病的准确性。RAREMED采用了具有统一输入序列方法的变压器编码器来捕获疾病和程序代码之间的复杂关系。此外,它介绍了两个自制的预训练预测任务,即匹配预测(SMP)和自我重新制定(SR),以学习临床代码之间的专业药物需求和相互选择。两个现实世界数据集的实验结果表明,RAREMED为稀有疾病和普通疾病患者提供了准确的药物集,从而减轻了药物建议系统中的不公平性。该实施可通过https://github.com/zzhustc2016/raremed
摘要采用高级数据分析技术,为疾病预测进行更准确的决策支持系统的努力正在上升。根据世界卫生组织的说法,与糖尿病有关的疾病和死亡率正在上升。因此,早期诊断尤为重要。在本文中,我们提出了一个自动中等的框架,该框架包括使用基于距离的算法(AutoEcodB)的增强类异常值检测的自动版本,并结合了自动多层perceptron(automlp)的合奏。自动eCodb是通过自动化参数调整以优化离群检测过程来构建的。自动ECODB通过删除离群值清洁数据集。然后,预处理数据集用于使用Automlps集合来训练预测模型。对公开可获得的PIMA印度糖尿病数据集进行了一组实验:(1)自动中等方法与文献中报道的其他最先进的方法进行了比较,其中自动中等中心实现了88.7%的准确性; (2)将AutoMLP与其他学习者进行比较,包括个人(专注于基于神经网络的学习者)和整体学习者; (3)将自动ECODB与其他预处理方法进行比较。此外,在Framework的OrderTovalIdateTeheritality中,Auto-MedisineIsineSineSteDonAnanAnothothothipliclyAvailablebiovablebiovablebiostatDaibettesdataset在其中优于现有报告的结果,精度达到97.1%。
摘要:机器学习 (ML) 已显示出加速各种材料系统合成规划的潜力。然而,由于缺乏用于开发材料合成 ML 工作流程的系统方法或启发式方法,许多材料科学家仍然无法使用 ML。在这项工作中,我们报告了一种选择 ML 算法来训练预测纳米材料合成结果的模型的方法。具体来说,我们开发并使用了一个自动化批量微反应器平台来收集大量 CdSe 量子点热注射合成结果的实验数据集。此后,该数据集用于训练使用各种 ML 算法预测合成结果的模型。针对不同大小和添加不同噪声量的实验数据集,比较了这些算法的相对性能。基于神经网络的模型显示出对吸收和发射峰的最准确预测,而预测半峰全宽的级联方法被证明优于直接方法。SHapley Additive exPlanations (SHAP) 方法用于确定不同合成参数的相对重要性。我们的分析表明,SHAP 重要性分数高度依赖于特征选择,并强调了开发固有可解释模型以从材料合成的 ML 工作流程中获取见解的重要性。
尽管使用多电极阵列记录的数据具有高维性,但与行为相关的神经群体活动被认为是固有的低维。因此,使用潜在变量模型预测神经群体记录的行为已被证明是最有效的。然而,随着时间的推移,单个神经元的活动可能会漂移,并且由于植入的神经探针的移动,不同的神经元将被记录下来。这意味着,在某一天训练预测行为的解码器在另一天测试时表现更差。另一方面,有证据表明,行为的潜在动态即使在数月和数年内也可能保持稳定。基于这个想法,我们引入了一个模型,该模型能够从同一动物记录的以前未见过的数据中推断出与行为相关的潜在动态,而无需重新校准解码器。我们表明,无监督域自适应与经过多次训练的顺序变分自动编码器相结合,可以实现对未见过数据的良好泛化,并正确预测传统方法无法预测的行为。我们的研究结果进一步支持了行为相关的神经动力学低维且随时间稳定的假设,并将使脑机接口技术更加有效和灵活地使用。
曾经被认为是中性的同义突变,现在被认为对多种疾病,尤其是癌症具有重要意义。必须在人类癌症中识别这些驱动程序的同义突变是必不可少的,但是当前方法受数据限制的约束。在这项研究中,我们最初研究了基于序列特征的影响,包括DNA形状,物理化学特性和核苷酸的一式编码以及基于BERT的预训练的化学分子语言模型的深度学习衍生特征。随后,我们提出了EPEL,这是使用集合学习的同义突变的效应预测指标。EPEL结合了五个基于树的模型,并优化了效率选择,以提高预测精度。值得注意的是,从化学分子中掺入DNA形状的效果和深度学习的特征代表了评估同义突变对癌症的影响的开创性效果。与现有的最新方法相比,EPEL在独立的测试数据集上展示了出色的性能。此外,我们的分析揭示了各种癌症类型的效果评分与患者结局之间的显着相关性。有趣的是,虽然深度学习方法在其他领域显示出希望,但其DNA序列表示并不能显着增强本研究中驾驶员同义突变的识别。总体而言,我们预计EPEL将促进研究人员更精确地靶向驱动器同义词突变。EPEL的用户友好网络服务器可在http://ahmu.epel.bio/上获得。EPEL的设计具有灵活性,使用户可以重新训练预测模型,并为人类癌症中的同义突变产生效果分数。