摘要:近几十年来,脑机接口 (BCI) 的研究变得更加民主,使用基于脑电图 (EEG) 的 BCI 的实验急剧增加。协议设计的多样性和对生理计算日益增长的兴趣要求同时改进 EEG 信号和生物信号(如皮肤电活动 (EDA)、心率 (HR) 或呼吸)的处理和分类。如果一些基于 EEG 的分析工具已经可用于许多在线 BCI 平台(例如 BCI2000 或 OpenViBE),那么在线使用算法之前,执行离线分析以设计、选择、调整、验证和测试算法仍然至关重要。此外,研究和比较这些算法通常需要编程、信号处理和机器学习方面的专业知识,而许多 BCI 研究人员来自其他背景,对这些技能的培训有限或没有培训。最后,现有的 BCI 工具箱专注于 EEG 和其他脑信号,但通常不包括其他生物信号的处理工具。因此,在本文中,我们描述了 BioPyC,这是一个免费、开源且易于使用的 Python 平台,用于离线 EEG 和生物信号处理和分类。基于直观且引导良好的图形界面,四个主要模块允许用户遵循 BCI 过程的标准步骤,而无需任何编程技能:(1)读取不同的神经生理信号数据格式,(2)过滤和表示 EEG 和生物信号,(3)对它们进行分类,以及(4)可视化并对结果进行统计测试。我们在四项研究中说明了 BioPyC 的使用,即根据 EEG 信号对心理任务、认知工作量、情绪和注意力状态进行分类。
ART课程的状态•Python编程基础•数据科学生命周期•数据预处理•数据可视化•机器学习与深度学习的基础知识•工业专业人员进行的Capstone项目
pyforestscan是一个开源python库,旨在根据光检测和范围(LIDAR)点云数据计算森林结构指标。它计算了关键的生态指标,例如树叶高度多样性(FHD),植物面积密度(PAD),冠层高度,植物面积指数(PAI)和数字地形模型(DTMS),有效地处理大型激光雷达数据集,并支持包括输入格式,包括输入格式,包括Entwine Point Tile(ept)形式(ETT)形式(Mannning)和2024.24和202。文件。除了指标计算外,该库还支持Geotiff输出的产生,并与地理空间库(如Point Cloud Data Abstraction库(PDAL)(PDAL))集成(Butler等,2021,2024),使其成为用于森林,碳核算和生态研究的宝贵工具。
通常,交通流量模拟器分为两个主要类别:显微镜和宏观。前者专注于详细的单个车辆行为,而后者则侧重于大规模(例如城市规模)交通的集体行为。介观交通模拟器有时分为宏观的交通模拟器是两者的混合物。尽管他们在某种程度上描述了个人车辆行为,但其主要目的是模拟大规模流量的集体行为。中镜模拟器对于建模大规模的交通管理和操作特别有用,例如拥塞定价,乘车共享和自动化的车队管理,这些天数越来越突出。几个显微镜交通模拟器被发表为开源软件,例如Sumo(Lopez等,2018)。据作者所知,介质和宏观模拟器的可用性是有限的。
PyBaMM 包含一个可互换模型库,允许用户测试不同的方法。没有用于交换电池数据处理方法的等效方法,导致研究人员的工作重复。因此,需要一个开源数据处理包,研究人员可以在一个框架内开发新的分析工具。PyProBE 的分析模块编写为模块化和直观的,具有一致的数据结构和内置的 Pydantic 数据验证(Colvin 等人,2024 年)。随着新方法的开发,可以添加它们并立即与现有方法进行比较。
我们介绍了 Geomstats,一个用于非线性流形计算和统计的开源 Python 工具箱,例如双曲空间、对称正定矩阵空间、变换李群等等。我们提供面向对象且经过广泛单元测试的实现。除此之外,流形还配备了黎曼度量族,以及相关的指数和对数映射、测地线和并行传输。统计和学习算法提供了在流形上进行估计、聚类和降维的方法。所有相关操作都被矢量化以用于批量计算,并为不同的执行后端提供支持,即 NumPy、PyTorch 和 TensorFlow,从而实现 GPU 加速。本文介绍了该软件包,将其与相关库进行了比较,并提供了相关的代码示例。我们表明,Geomstats 提供了可靠的构建块来促进微分几何和统计学的研究,并使黎曼几何在机器学习应用中的使用更加民主化。源代码可根据 MIT 许可证在 geomstats.ai 上免费获取。
摘要 — 机器学习社区对微分几何的应用兴趣日益浓厚。然而,由于缺乏参考实现,相关几何计算的采用受到了阻碍。这种实现通常应允许用户:(i) 通过实践方法获得微分几何概念的直觉,而传统教科书通常不提供这种直觉;(ii) 无缝运行几何机器学习算法,而无需深入研究数学细节。为了解决这一问题,我们介绍了开源 Python 包 geomstats,并介绍了依赖于它的微分几何和几何机器学习算法(几何学习)的实践教程。代码和文档:github.com/geomstats/geomstats 和 geomstats.ai。
该项目着重于使用Python设计强大的信用卡欺诈检测系统,利用其丰富的数据科学库和框架生态系统。主要的挑战在于解决欺诈数据集固有的极端类不平衡,在该数据集中,合法交易大大超过了欺诈行为(通常不到总数据的1%)。这种不平衡会偏向模型的性能,从而导致较高的假阴性率和传统准确度指标无效。为了克服这一点,探索了诸如综合少数群体过采样技术(SMOTE),类加权和异常检测算法之类的技术,以增强对欺诈模式的模型敏感性。
仿真是培训深度学习模型的越来越多的数据源。在机器人技术中,模拟已成功地用于学习诸如导航,步行,飞行或操纵之类的行为。模拟中数据生成的价值主要取决于场景布局的多样性和规模。现有数据集(Ehsani等,2021; Garcia-Garcia等,2019; Mo等,2019; Nasiriany等,2024)在这方面受到限制,而纯粹的生成模型仍然缺乏在物理模拟中可以使用的场景(HOLLEIN及2023 al。el。,et e e eT el。 2024)。其他程序管道要么专注于学习视觉模型(Denninger等,2023; Greff等,2022; Raistrick等,2023),要解决特定的用例,例如自主驾驶(Fremont等,2020; Hess等; Hess等,2021),或者很难扩展和自定义的平台(它们是一个特定的平台(它们是一个与众不同的平台(DET)(DEIT)(DEIT)(DEIT)(DEIT)(DEIT)(DETIT)(DETER)(DETER)。 )。使用scene_synthesizer我们提出
生存分析是癌症,心血管疾病和传染病等各种领域的公共卫生和临床研究的基石(Altman&Bland,1998; Bradburn等,2003)。传统的参数和半参数统计方法,例如COX比例危害模型,通常用于生存分析(Cox,1972)。但是,这些方法有几个局限性,尤其是应用于复杂数据时。一个主要问题是需要限制性假设,例如比例危害和预定义的功能形式,在复杂的,现实世界中的医疗保健数据中可能不正确(Harrell,2015; Ishwaran等,2008)。此外,这些方法通常在高维数据集上遇到困难,从而导致过度拟合,多重共线性以及处理复杂的相互作用的问题(Ishwaran等,2008; Joffe等,2013)。