动机:由于缺乏 ML 和/或编码专业知识,许多具有领域专业知识的研究人员无法轻松地将机器学习 (ML) 应用于他们的生物信息学数据。迄今为止提出的自动化 ML 方法大多需要编程经验以及专家知识来正确调整和应用算法。在这里,我们研究一种使用基于 Web 的 AI 平台自动化生物医学数据科学的方法,以推荐模型选择并进行实验。我们有两个目标:首先,使构建复杂的生物医学过程模型变得容易;其次,提供一个完全自动化的 AI 代理,可以根据用户的实验以及先前的知识为用户选择和开展有希望的实验。为了验证这个框架,我们对 165 个分类问题进行了实验,并与最先进的自动化方法进行了比较。最后,我们使用此工具开发重症监护患者脓毒症休克的预测模型。结果:我们发现基于矩阵分解的推荐系统在自动化 ML 方面优于元学习方法。该结果反映了其他领域早期推荐系统研究的结果。在为数据集选择最佳算法配置方面,所提出的 AI 与最先进的自动化 ML 方法具有竞争力。在我们预测脓毒症休克的应用中,AI 驱动的分析产生了一个称职的 ML 模型(AUROC 0.85 6 0.02),其性能与这项任务的最先进的深度学习结果相当,但计算工作量要少得多。它根据 GNU 公共许可证 (GPL) 版本 3 分发。可用性和实施:PennAI 可免费使用,并且是开源的。联系方式:lacava@upenn.edu 或 jhmoore@upenn.edu 补充信息:补充数据可在 Bioinformatics 在线获取。
人力资本是信息系统研究中一个备受关注的话题。公司需要专门的员工来开发和使用 IT 工件。在使用人工智能等复杂技术时尤其如此。人工智能的两个主要领域是计算机视觉 (CV) 和自然语言处理 (NLP)。本文从就业市场的角度分析和比较了 CV 和 NLP 专家所需的技能。为此,我们利用基于文本挖掘的分析管道来剖析人工智能的招聘广告。具体来说,从一个大型国际在线招聘平台上抓取了两个子学科的招聘广告,并使用命名实体识别和术语向量进行了分析。可以看出,两个职位所需的技能不同。人工智能专家没有通用的要求概况,需要差异化考虑。
发掘过程中的抽象堵塞是机械挖掘中的常见问题之一。在切割器头部堵塞的影响因素中,我们可以提到细土颗粒(200个网状筛),土壤水分和土壤类型的百分比。在这项研究中,为了研究实验室中的隧道发掘机制,设计和构建了隧道开挖机实验室模拟器。该设备的特征是其水平操作,切割机头的低旋转速度,测试过程中销与新鲜土壤的连续接触,以及在测试过程中连续的添加剂与特定的注入压力。研究了研究细粒度,土壤含量和泡沫注入比(FIR)对堵塞,消耗能量以及切割工具的平均磨损的影响。结果表明,随着细土颗粒百分比从90%增加到100%,切割工具的堵塞增加了50%。同样,随着土壤水分从干燥状态增加到5%的水分含量,切割机头的堵塞是微不足道的,此后,随之而来的是,水分从10%增加到25%,堵塞量增加了178%,每次测试中消耗的能量量增加了84%。此外,通过将泡沫注入比从40%增加到60%,平均堵塞减少了81%,而切割工具的磨损平均降低了62%。
帕金森病 (PD) 是一种常见的、进行性的、目前无法治愈的神经退行性运动障碍。PD 的诊断具有挑战性,特别是在帕金森病的鉴别诊断和早期 PD 检测中。由于机器学习具有学习复杂数据模式和为个体做出推断的优势,机器学习技术越来越多地应用于 PD 的诊断,并已显示出一些有希望的结果。基于机器学习的成像应用使得在许多神经影像学研究中自动区分帕金森病和早期检测 PD 成为可能。对比研究表明,基于机器学习的 PD SPECT 图像分析应用在检测 PD 相关多巴胺能变性方面优于传统的半定量分析,表现与专家的目视检查相当,并有助于提高放射科医生对 PD 的诊断准确性。在这些应用中使用组合多模态(成像和临床)数据可以进一步增强 PD 的诊断和早期检测。为了将基于机器学习的诊断应用集成到临床系统中,需要进一步验证和优化这些应用,使其准确可靠。预计机器学习技术将进一步帮助改善帕金森病的鉴别诊断和帕金森病的早期发现,这可能会降低帕金森病诊断的错误率,并有助于在运动前阶段检测帕金森病,以便能够进行早期治疗(例如神经保护治疗),以减缓帕金森病的进展,防止出现严重的运动症状,并减轻患者的痛苦。
摘要。本文介绍了一种使用流程挖掘和基于规则的人工智能方法来分析和理解学生学习路径的方法,该方法基于校园管理系统数据和学习计划模型。流程挖掘技术用于表征成功的学习路径,以及检测和可视化与预期计划的偏差。这些见解与从考试规定中提取的相应学习计划的建议和要求相结合。在这里,事件演算和答案集编程用于提供学习计划模型,这些模型支持规划和一致性检查,同时对可能的学习计划违规行为提供反馈。流程挖掘和基于规则的人工智能相结合,用于支持学习规划和监控,通过得出规则和建议来指导学生走上更合适的学习路径,获得更高的成功率。将实施两个应用程序,一个用于学生,一个用于学习计划设计者。
技术进步在推动创新,塑造经济增长和影响竞争战略方面起着至关重要的作用(Akter等,2023)。当前的业务景观正在经历重大的数字转换,主要是由于非结构化数据的快速增长所推动的(Elia等,2022)。随着公司处理以各种格式提出的大量信息,将这些数据用于战略优势的关键需求变得越来越清晰(Zhang等,2021)。值得注意的研究表明,典型公司中约80%的数据是非结构化的(Faccia等,2022),这意味着未遵守任何数据模型,并强调从信息领域的大部分信息中管理和提取价值的重大挑战(Möhring等人(Möhring等,20222))。与Oester Reich等人对齐。(2022),在数字化转型的旅程中,组织在从数据存储库中提取价值方面面临挑战。这场斗争围绕着通过创新(Ahamat&Sin,2022)来适应内部运营以及外部产品和服务产品的必要性,从而确保了不断发展的景观的竞争力(Tagscherer&Carbon,2023)。这涉及研究能够从非结构化数据中提取有价值的见解的先进技术,最终加快了组织的数字化转型。COVID-19(Martínez等,2022)的影响显着加速了这一过程,并可以改善公司绩效(Heredia等,2022)。
生成式人工智能 (gen AI) 的出现,对于希望引领组织走向未来的领导者来说,既是挑战,也是重大机遇。机会有多大?麦肯锡研究估计,gen AI 每年可为经济增加 2.6 万亿至 4.4 万亿美元,同时将所有人工智能的影响提高 15% 至 40%。在技术、媒体和电信 (TMT) 领域,新一代 AI 用例预计将产生 3800 亿至 6900 亿美元的影响——电信领域为 600 亿至 1000 亿美元,媒体领域为 800 亿至 1300 亿美元,高科技领域为约 2400 亿至 4600 亿美元。事实上,在未来三年内,任何与 AI 无关的东西似乎都可能被视为过时或无效的。
摘要我们研究了基于物理的模拟器如何复制一个真实的车轮装载机在一堆土壤中填充水桶。比较使用车辆运动和驱动力的场时间序列进行比较,负载质量和全部工作。车辆被建模为具有摩擦触点,传动系统和线性执行器的刚性多体系统。对于土壤,我们测试了不同分辨率的离散元素模型,并且没有多尺度加速。时空分辨率在50-400 mm至2-500毫秒之间,计算速度比实时快1/10,000至5倍。发现模拟到现实差距约为10%,并且对实现水平的依赖性较弱,例如与实时模拟兼容。此外,研究了在不同的模拟操作之间转移下的优化力反馈控制器的敏感性。尽管域间隙约为15%,但观察到域偏置会导致5%的性能降低。
摘要 在可持续药物开发过程中,药物-靶标相互作用的计算机预测是一个关键阶段,特别是当研究重点是利用现有药物的重新定位时。然而,开发这样的计算方法并非易事,但却非常必要,因为当前预测潜在药物-靶标相互作用的方法存在高假阳性率。在这里,我们介绍了 DTiGEMS +,一种使用图嵌入、图挖掘和基于相似性的技术预测药物-靶标相互作用的计算方法。DTiGEMS + 结合了基于相似性和基于特征的方法,并将新型药物-靶标相互作用的识别建模为异构网络中的链接预测问题。DTiGEMS + 通过使用另外两个互补图(即:药物-药物相似性、靶标-靶标相似性)扩充已知的药物-靶标相互作用图来构建异构网络。DTiGEMS + 结合了不同的计算技术来提供最终的药物靶标预测,这些技术包括图嵌入、图挖掘和机器学习。 DTiGEMS+ 在应用相似性选择程序和相似性融合算法后,将多种药物-药物相似性和靶标-靶标相似性集成到最终的异构图构造中。使用四个基准数据集,我们表明 DTiGEMS+ 与其他用于预测药物-靶标相互作用的最先进的计算机模拟方法相比,显著提高了预测性能,在所有数据集中实现了最高的平均 AUPR(0.92),与最先进方法比较中表现第二好的模型相比,错误率降低了 33.3%。关键词:药物重新定位、药物-靶标相互作用、机器学习、图嵌入、异构网络、基于相似性、相似性集成、生物信息学、化学信息学
当代的大规模视觉语言模型(VLM)具有强大的表示能力,使它们无处不在,可以增强图像和文本理解任务。他们经常以对比的方式受到大量图像和相应的文本字幕的对比方式进行训练。尽管如此,VLMS经常在构图推理任务上挣扎,这些任务对对象及其属性的复杂相互作用进行了精细的了解。此失败可以归因于两个主要因素:1)对比的方法传统上专注于从现有数据集中开采负面示例。但是,该模型可能不难区分阳性检查。替代采矿的替代方法是负样本2),但现有的生成方法主要集中于生成与给定图像相关的硬性负面文本。在另一个方向上进行挖掘,即生成与给定文本相关的负面图像样本已被忽略。为了克服这两种限制,我们提出了一个框架,不仅在两个方向上矿山,而且在这两种方式(即图像和文本)中产生了有挑战性的负面样本。利用这些生成硬性负样本,我们在涉及多模式综合推理的任务中显着提高了VLMS的性能。我们的代码和数据集在https://ugorsahin.github.io/enhancing-- vlm.html上发布。