对电池健康的了解非常重要。它提供了对给定系统能力的洞察力,并允许操作员更效率地计划。,但是测量电池的健康状态(SOH)是不同的,并且需要时间。更重要的是,需要将电池从操作中取出,以正确分析。本文旨在根据易于获取的操作数据评估预测电池健康的提议的线性回归方法。主要预测变量是电压偏差,这是电池电压/放电周期期间电池电压的特征。使用此方法,唯一需要提取电池的时间就是收集培训数据。然后,该模型可用于类似的电池来预测其SOH。这意味着这些系统永远不需要停止,从而提高生产率。本文的结果是所使用的数据不适合线性回归。残留物的异质性和非正态性存在问题,但主要是电压偏差与SOH之间关系的估计参数与已建立的理论相反。不能忽略。因此,估计的模型不应用于预测SOH。为了实现准确的SOH预测的目标,应进行更多的研究并使用更好的样本。
摘要 与许多其他现代编程语言一样,Pharo 将其应用扩展到计算要求高的领域,例如机器学习、大数据、加密货币等。这就需要快速的数值计算库。在这项工作中,我们建议通过外部函数接口 (FFI) 调用高度优化的外部库(例如 LAPACK 或 BLAS)中的例程来加速低级计算。作为概念验证,我们基于 LAPACK 的 DGELSD 例程构建了线性回归的原型实现。使用三个不同大小的基准数据集,我们将我们的算法的执行时间与纯 Pharo 实现和 scikit-learn(一种流行的机器学习 Python 库)进行比较。我们表明 LAPACK&Pharo 比纯 Pharo 快 2103 倍。我们还表明,scikit-learn 比我们的原型快 8-5 倍,具体取决于数据的大小。最后,我们证明纯 Pharo 比纯 Python 中的等效实现快 15 倍。这些发现可以为未来为 Pharo 构建快速数值库并进一步在更高级的库(如 pharo-ai)中使用它们奠定基础。
动机:模块化响应分析(MRA)是从turg turgation数据中推断生物网络的良好方法。经典,MRA需要线性系统的解决方案,结果对数据和扰动强度中的噪声敏感。由于噪声传播,对10个或更多节点网络的应用很难。结果:我们提出了将MRA作为多线性回归问题的新表述。这使得能够在更大,过度确定且更稳定的方程式系统中整合所有重复和潜在的扰动。可以获得更相关的网络参数的置信区间,我们显示了大小高达1000的网络的竞争性能。以已知零边缘形式的先验知识整合进一步改善了这些结果。可用性和实现:用于获得呈现结果的R代码可从GitHub获得:https:// github.com/j-p-borg/bioinformatics
摘要 与许多其他现代编程语言一样,Pharo 将其应用扩展到计算要求高的领域,例如机器学习、大数据、加密货币等。这就需要快速的数值计算库。在这项工作中,我们建议通过外部函数接口 (FFI) 调用高度优化的外部库(例如 LAPACK 或 BLAS)中的例程来加速低级计算。作为概念验证,我们基于 LAPACK 的 DGELSD 例程构建了线性回归的原型实现。使用三个不同大小的基准数据集,我们将我们的算法的执行时间与纯 Pharo 实现和 scikit-learn(一种流行的机器学习 Python 库)进行比较。我们表明 LAPACK&Pharo 比纯 Pharo 快 2103 倍。我们还表明,scikit-learn 比我们的原型快 8-5 倍,具体取决于数据的大小。最后,我们证明纯 Pharo 比纯 Python 中的等效实现快 15 倍。这些发现可以为未来为 Pharo 构建快速数值库并进一步在更高级的库(如 pharo-ai)中使用它们奠定基础。
在开发新药和确定其副作用时 [ 1 ],制药科学依赖于统计学和计算机科学等相关科学分支的发现。此过程中的一个重要步骤是确定药物与药理靶标之间的相互作用。尽管可以通过体外结合试验可靠地确认相互作用的存在(例如,参见 [ 2 – 5 ]),但此类方法昂贵且耗时 [ 6 ]。为了解决这一瓶颈,已经设计并实施了计算方法来估计相互作用的概率。因此,可以根据计算机方法选择最有希望进行体外实验的候选药物。药物开发的成本进一步强调了预测药物-靶标相互作用的重要性。虽然估计数字各不相同,但他们一致认为,将一种新药推向市场需要花费数亿美元,有关概述例如,参见 [ 7 ]。此外,该过程可能总共需要 10 多年。药物-靶标相互作用预测(DTI)技术有望减少上述成本和时间,并支持药物重新定位[8],即使用现有药物来治疗尚未用该药物治疗的疾病。
这项研究证明了使用包括人口统计学,生理和传感器衍生的变量的数据集估算血糖水平来估算血糖水平的应用。通过严格的数据准备和假设验证,包括使用Box-Cox转换,模型的有效性和性能得到了增强。逐步选择和假设检验促进了该模型的重新构建,保留了关键预测因子,例如年龄,性别,赫特拉特和糖尿病患者,这些预测因素明显增添了葡萄糖水平。排除了NIR阅读和最后食用的非贡献变量,改善了模型的可解释性,而不会损害其预测精度。结果强调了基于回归的非侵入性葡萄糖监测方法的潜力,为糖尿病管理中具有成本效益且可访问的解决方案提供了基础。虽然FNDING突出显示了明显的预测指标和稳健的模型性能,但未来的工作可以探索高级传感器技术和非线性建模技术的集成,以进一步提高预测精度。这些进步可以显着促进改善糖尿病护理,并促进更广泛的非侵入性监测解决方案的采用。
使用线性最小二乘回归技术,以 250 米的空间分辨率概括了经多尺度卷积、形态和纹理变换过滤的免费数字高程模型 (DEM) 全球数据中建筑区的垂直分量估计值。选择了六个测试案例:香港、伦敦、纽约、旧金山、圣保罗和多伦多。根据 60 种线性、形态和纹理过滤组合以及不同的概括技术,对五个全球 DEM 和两个 DEM 复合材料进行了评估。引入了四种广义的建筑区垂直分量估计值:平均建筑总高度 (AGBH)、平均净建筑高度 (ANBH)、建筑总高度标准差 (SGBH) 和净建筑高度标准差 (SNBH)。研究表明,ANBH 和 SNBH 给出的净 GVC 最佳估计值总是比 AGBH 和 SGBH 给出的相应总 GVC 估计值包含更大的误差,无论是平均值还是标准差。在本研究评估的源中,使用单变量线性回归技术估计建筑区 GVC 的最佳 DEM 源是使用联合运算符 (CMP_SRTM30-AW3D30_U) 的 1 弧秒航天飞机雷达地形测绘任务 (SRTM30) 和先进陆地观测卫星 (ALOS) 世界 3D-30 米 (AW3D30) 的组合。使用 16 颗卫星开发了一个多元线性模型
2.1 概述。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。4 2.2 数据收集。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。4 2.3 简单线性回归。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。6 2.4 多元线性回归。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。7 2.5 模型评估。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。8 2.6 假设诊断。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。10
CisSig 评分 IC50(连续)简单线性回归全部相关系数 0.51 CisSig 评分 IC50(连续)简单线性回归五分位数相关系数 0.74 所有基因表达 IC50(连续)弹性网线性回归全部相关系数 0.63 所有基因表达 IC50(连续)弹性网线性回归五分位数相关系数 0.79 所有基因表达 IC50(连续)L1 线性回归全部相关系数 0.63 所有基因表达 IC50(连续)L1 线性回归五分位数相关系数 0.79 所有基因表达 IC50(连续)L2 线性回归全部相关系数 0.63 所有基因表达 IC50(连续)L2 线性回归五分位数相关系数0.81 所有基因表达 IC50(二元)简单逻辑回归所有 AUC 0.79 所有基因表达 IC50(二元)简单逻辑回归五分位数 AUC 0.90 所有基因表达 IC50(二元)弹性网络逻辑回归所有 AUC 0.82 所有基因表达 IC50(二元)弹性网络逻辑回归五分位数 AUC 0.94 所有基因表达 IC50(二元)L1 逻辑回归所有 AUC 0.82 所有基因表达 IC50(二元)L1 逻辑回归五分位数 AUC 0.94 所有基因表达 IC50(二元)L2 逻辑回归所有 AUC 0.81 所有基因表达 IC50(二元)L2 逻辑回归五分位数 AUC 0.95 所有基因表达 IC50(二元)SVM(线性核)所有 AUC 0.82 所有基因表达 IC50(二元) SVM(线性核)五分位数 AUC 0.93 所有基因表达 IC50(二元)SVM(多项式核)所有 AUC 0.78 所有基因表达 IC50(二元)SVM(多项式核)五分位数 AUC 0.94 所有基因表达 IC50(二元)随机森林所有 AUC 0.81 所有基因表达 IC50(二元)随机森林五分位数 AUC 0.91