摘要 与许多其他现代编程语言一样,Pharo 将其应用扩展到计算要求高的领域,例如机器学习、大数据、加密货币等。这就需要快速的数值计算库。在这项工作中,我们建议通过外部函数接口 (FFI) 调用高度优化的外部库(例如 LAPACK 或 BLAS)中的例程来加速低级计算。作为概念验证,我们基于 LAPACK 的 DGELSD 例程构建了线性回归的原型实现。使用三个不同大小的基准数据集,我们将我们的算法的执行时间与纯 Pharo 实现和 scikit-learn(一种流行的机器学习 Python 库)进行比较。我们表明 LAPACK&Pharo 比纯 Pharo 快 2103 倍。我们还表明,scikit-learn 比我们的原型快 8-5 倍,具体取决于数据的大小。最后,我们证明纯 Pharo 比纯 Python 中的等效实现快 15 倍。这些发现可以为未来为 Pharo 构建快速数值库并进一步在更高级的库(如 pharo-ai)中使用它们奠定基础。
*作者按字母顺序列出。SH感谢ERC合并器Grant 864863的资金,该资金支持他和LB的时间。我们感谢Nick Bloom,Germain Gauthier,Evan Munro,David Rossell和Leif Thorsrud以及Aarhus,Bocconi,Bocconi,Bse,Bates,Bates,Columbia,Columbia,Eth Zurich,Eth Zurich,Zurich,LSE,LSE,LSE,LSE,LSE,澳大利亚储备银行,UCSD,UCSD,USC,USC,Wardich,Wardich,Wardrich,3岁文本 - 达塔(Text-As-Data)讲习班,2024年BSE夏季学院,2024年Fineml会议(USI Lugano),2024年2024年经济学夏季大会的机器学习(UCHICAGO),2024 NASM(Vanderbilt)(Vanderbilt),Esif-aiml(Cornell)(Cornell)和Esam(Monash)(Monash)con-Intortial in Internations on International and Parrence in International and Parron和2024 2024年Econdat秋季会议。我们还要感谢Kirill Safonov的出色研究帮助。
as.matrix.confusionatatrix。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>4 avnnet。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>5袋。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>8 bagearth。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 11 Bagfda。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 13个血脑箱。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div>8 bagearth。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>11 Bagfda。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 13个血脑箱。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div>11 Bagfda。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>13个血脑箱。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div>13个血脑箱。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>15 BoxCoxtrans。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>15校准。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>17 CaretsBF。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div>17 CaretsBF。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。。。。。。。。。。。。。。。。。。。20辆车。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。21 classdist。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。22混乱matrix。。。。。。。。。。。。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>24 ConfusionAtatrix.Train。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>27 COX2。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 29 CREATTATAPATTITION。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div>27 COX2。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>29 CREATTATAPATTITION。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>30默认为Mommary。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>32个点图。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>35 DFR。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div> 。 div>35 DFR。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。36个差异。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。37点。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。39 dotplot.diff.resplass。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。40个下样本。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。41个Dummyvars。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。41个Dummyvars。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。 div>。 div>。 div>42 42提取物。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>46特征图。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>48 FilterVarimp。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。 div>。。。。。。。49找到相关性。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。50 findlinearcombos。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。52格式。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。53 gafs.default。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。54 GAFSCONTROL。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 58 gafs_initial。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。54 GAFSCONTROL。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。58 gafs_initial。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。61 Germancredit。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。63 getSmplingInfo。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。64 ggplot.rfe。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。64
摘要:糖尿病疾病在全球范围很普遍,预测其进展至关重要。已经提出了几种模型来预测这种疾病。这些模型仅确定疾病标签,从而使发展疾病的可能性不清楚。提出一个预测疾病进展的模型至关重要。因此,本文提出了一个逻辑回归模型,以预测糖尿病综合征发病率的可能性。使用Sigmoid函数的模型利用逻辑回归的功能。使用PIMA印第安人糖尿病数据集评估了模型的性能,并表现出很高的精度,灵敏度和特异性。预测准确率为77.6%,灵敏度为72.4%,特异性为79.6%,I型误差为27.6%,II型误差为20.4%。此外,该模型表明了使用实验室测试的可行性,例如妊娠,葡萄糖,血压,BMI和糖尿病性重复功能,以预测疾病进展。提出的模型可以帮助患者和医生了解疾病的进展并及时进行干预措施
艺术符号回归状态(SR)当前构建专业模型,而大语模型(LLMS)的应用仍未得到探索。在这项工作中,我们介绍了将LLMS用于SR任务的第一个综合框架。我们提出了一种SR方法,它提出了一种SR方法,该方法迭代地改善了具有LLM的功能形式,并使用外部光学器来终止其系数。ICSR利用LLMS的强数学先验,同时提出一组可能的功能,并根据其误差来完善它们。我们的发现表明,LLMS能够成功找到适合给定数据,匹配或超越四个流行基准的最佳SR基线的整体性能的符号方程,同时产生了更简单的方程,同时又能提供更好的分布概括。
统计的核心挑战之一是从样本到人群概括。自然的第一步是调整样本和人群之间的已知,预期或假定差异1。但是,即使是这种基本的纠正水平也可能具有挑战性,尤其是当样本和人口在许多方面差异时(例如,社会调查中的年龄,性别,性别,教育,种族,地理和政治隶属关系)。加权是总结调整的一种方式:样本中的每个项目都有非负权重,该权重与人口中的代表成正比。人口估计。经典的调查权重出现了四个困难:重量,不确定性估计,小区域估计和回归建模。重量的构造很困难,因为现实世界调查需要针对许多因素进行调整,并且基于延伸后或采样估计概率的简单方法通常会导致高度嘈杂的权重。噪声较高的权重导致加权估计的效率损失:权重中存在的可变性越多,加权调查估计的效率就越小(Korn and Graubard,1999)。This in turn motivates more complicated approaches based on smoothing or modeling the weights, which can be done but at the cost of many choices in modeling and estimation (Little, 1991; Gelman and Little, 1998; Elliott and Little, 2000; Little and Vartivarian, 2003; Chen et al., 2006; Gelman, 2007; Chen et al., 2012, 2017; Xie et al., 2020; Si et al., 2020; Ben-Michael等人,2024年)。
隐私的机器学习是一类密码方法,旨在分析私人和敏感数据的同时保留隐私,例如在大型加密数据上使用同型逻辑回归培训。在本文中,我们提出了一种有效的算法,用于使用同态加密(HE)对大加密数据进行逻辑回归训练,这是使用更快的渐变变体称为Quadratic梯度的最新方法的迷你批量版本。据称,二次梯度可以将曲线信息(Hessian矩阵)集成到梯度中,因此可以有效地加速一阶梯度(下降)算法。当加密的数据集如此之大,以至于必须以迷你批次方式加密时,我们还实现了其方法的全批量版本。我们将迷你批次算法与我们的全批量实施方法进行了比较,这些方法由422,108个带有200粒的样本组成的真实财务数据进行了比较。鉴于HES的效率低下,我们的结果令人鼓舞,并证明了大型加密数据集的Logistic回归培训具有可行性,这标志着我们理解的重要里程碑。
应将通信发送到Selvarani N:N.Selvarani@psnacet.edu.edu.edu.in Info Info Machine and Computing杂志(http://anapub.co.ke.ke.ke/journals/jmc/jmc/jmc/jmc.html) 2024;从2024年8月18日修订; 2024年8月12日接受接受,2024年10月5日©2024作者。由Anapub出版物出版。这是CC BY-NC-ND许可证下的开放访问文章。(http://creativecommons.org/licenses/by-nc-nd/4.0/)摘要 - 为了确保在电动汽车中使用清洁能源的安全,可靠和负担得起的性能,对LIB的精确负荷状态的估计非常重要。在本文中,提出了具有不同内核函数的SOC预测的高斯过程回归,并通过良好的健康和福祉进行了评估和分析的表现。使用GPR的一个有用的好处是能够量化和估计不确定性,从而评估社会估计的可靠性。内核函数是提高GPR性能的关键超参数。GPR认为电池的温度和电压彼此独立,因为它们各自的输入参数与行业,创新和基础架构相关联,而目标依赖性变量是电池SOC。最初,训练过程涉及确定内核函数的理想超参数以准确表示数据的特征。使用测试数据评估预测电池SOC的准确性。根据仿真结果,基于指数核函数的平方元函数估计SOC具有很高的准确性和较低的RMSE和MAE,从而确保了能源效率和Q Uality Education。关键字 - 充电状态,GPR,内核功能,RMSE,Lib-Lithium Ion电池,能源效率和优质教育。
摘要阿尔茨海默氏病(AD)是一种神经退行性疾病,其特征是认知能力下降,β-淀粉样蛋白(Aβ)斑块的积累在其进展中起关键作用。β-分泌酶1(BACE1)是Aβ产生的关键酶,使其成为AD治疗的主要治疗靶标。但是,由于选择性差和血脑屏障的渗透性有限,设计有效的BACE1抑制剂一直在挑战。为了应对这些挑战,我们在定量结构活性关系(QSAR)模型中使用支持向量回归(SVR)采用了机器学习方法来预测潜在的BACE1抑制剂的抑制活性。我们的模型在Chembl数据库的7,298种化合物的数据集上训练,使用分子描述符准确地预测了PIC 50值,在测试集中实现了R²为0.690。该模型的性能证明了其在优先考虑候选药物的优先级方面的实用性,可能会加速药物发现。这项研究强调了计算方法在优化药物发现方面的有效性,并表明进一步的完善可以增强该模型对AD疗法的预测能力。
机器学习(ML)算法正在各个行业中出现,作为传统数据回归方法的强大补充/替代方案。主要原因是,与确定性模型不同,即使没有详细的现象学知识,它们也可以使用。毫不奇怪,在传热应用中也探索了ML算法的使用。在处理复杂几何形状和潜在现象的系统中特别感兴趣(例如流体相变,多相流量,大量结垢堆积)。然而,传热系统提出了需要解决的特定挑战,例如高质量数据的稀缺性,已发表的数据源之间的不一致,输入的复杂(且经常相关)的影响,培训和测试集之间的数据拆分以及有限的划线能力,无法进行统一条件。试图克服这些挑战中的一些,更重要的是,为了提供系统的方法,本文回顾并分析了ML算法在传热应用中的应用中的过去努力,并提出了将其部署的回归框架以估算关键数量(例如传热系数),用于改进热交换器的设计和操作。该框架由六个步骤组成:i)数据预处理,ii)特征选择,iii)数据分裂理念,iv)训练和测试,v)调整超参数,而VI)具有特定指标的性能评估,以支持准确且可靠的模型的选择。相关案例研究涉及缩合传热系数在微囊管中的估计来说明所提出的框架。根据其估计和外推能力对两种数据驱动算法,深神经网络和随机森林进行了测试和比较。结果表明,与过去研究中提出的众所周知的半经验相关性相比,ML算法在预测传热系数方面通常更准确,其中最合适的ML模型的平均绝对误差为535 [𝑊𝑚2𝐾-1],与使用1061 [𝑊𝑚22-−1]的误差相比,与使用误差相比。在外推方面,所选的ML模型的平均绝对误差为1819 [𝑊𝑚2𝐾-1],而相关性为1111 [𝑊𝑚2𝐾-1],表明使用半经验模型的劣势,尽管对比较并不完全适合,但鉴于相关性不适合使用。此外,功能选择还启用了仅取决于可能与目标变量最重要的功能的更简单的模型。需要特别注意,因为部署这些模型时会遇到的过度拟合和有限的外推能力是常见的困难。