由于一系列的冲击,包括COVID-19的大流行,能源危机和地缘政治紧张局势升高,近年来,近年来抽象的生产力发展变得越来越不确定。尽管如此,试图将最新生产率增长趋势的尝试受到限制,通常集中在特定职业或行业内的微观生产率上。迄今为止,尚未努力为广泛国家的劳动生产率增长的宏观经济衡量 - 本文寻求解决的差距。本文介绍了40个经合组织和加入国家的小组的劳动生产率增长。本文的主要新颖性是在面板框架内将机器学习技术与混合频率模型的集成在一起,从而可以最佳地利用更高的频率数据。该方法将混合频率设置与各种模型相结合,包括动态因子模型,惩罚回归(Lasso,Ridge,Elasticnet)和基于树的模型(梯度增强的树木,随机森林)以及出版物滞后的解释。性能提高与40个国家 /地区的自回归基准平均值约35%。机器学习模型,特别是梯度增强的树木,在大多数国家 /地区都优于替代品。与40个国家 /地区的30个国家强加的权重相比,发现具有估计重量的MIDAS规格带来了其他信息。关键字:现觉,机器学习,面板,劳动生产力。JEL代码:C4,C53,C23,E24。
本课程应用多个回归技术,包括线性和逻辑模型拟合,推理和诊断。降低文本采矿的应用。将强调具有大量功能的数据集的特殊适用性的方法。示例包括但不限于前后选择,套索和脊正规化。模型复杂性,偏差差异和模型验证的问题将在大型数据集的背景下进行研究。也少于分布假设的方法也被引入,包括交叉验证和非参数方法。 学生还将被介绍给文本分类和神经网络。 还包括 EDEN,历史和工业方面的数据科学,以及机器学习在会计,经济学,财务,信息系统,管理,市场,媒体和社会学等领域的特定应用。 本课程的重要部分将涵盖大型语言模型,单词嵌入,情感分析以及将其应用于大型文本库所需的所有相关定量和编程背景。 在这些讲座中,我们关注机器学习,文本挖掘和业务交集的最新论文。 学生将学习方法论背后的直觉,假设和权衡,重点是现实世界中的问题。 所有编程工作将在Python进行。 完成本课程后,学生将能够:也少于分布假设的方法也被引入,包括交叉验证和非参数方法。学生还将被介绍给文本分类和神经网络。EDEN,历史和工业方面的数据科学,以及机器学习在会计,经济学,财务,信息系统,管理,市场,媒体和社会学等领域的特定应用。本课程的重要部分将涵盖大型语言模型,单词嵌入,情感分析以及将其应用于大型文本库所需的所有相关定量和编程背景。在这些讲座中,我们关注机器学习,文本挖掘和业务交集的最新论文。学生将学习方法论背后的直觉,假设和权衡,重点是现实世界中的问题。所有编程工作将在Python进行。完成本课程后,学生将能够:
方法:组装了255名被诊断为晚期G/ GEJ腺癌的成年患者的数据集。将影响整体生存(OS)至显着程度的IRAE识别为候选变量,并将其整合为候选变量,以及其他12个候选变量。These included gender, age, Eastern cooperative oncology group performance status (ECOG PS) score, tumor stage, human epidermal growth factor receptor 2 (HER2) expression status, presence of peritoneal and liver metastases, year and line of anti-PD-1 treatment, neutrophil-to-lymphocyte ratio (NLR), controlling nutritional status (CONUT) score, and Charlson comorbidity index (CCI)。为了减轻与伊拉斯有关的时机偏见,采用了具有里程碑意义的分析。使用最小绝对收缩和选择算子(LASSO)回归进行了变量选择以查明明显的预测因子,并应用了方差障碍因子来解决多重共线性。随后,使用正向似然比方法进行了COX回归分析来开发生存预测模型,排除未能满足比例危害(PH)假设的变量。该模型是使用整个数据集开发的,然后通过Bootstrap重新采样进行内部验证,并通过另一家医院的同类进行外部验证。此外,创建了一个列图来描述预测模型。
背景。预测抑郁症的过程对于个性化治疗是必要的。受损的葡萄糖代谢(IGM)是作为有希望的抑郁生物标志物引入的,但未达成共识。这项研究旨在在抑郁诊断时预测IgM,并检查长期预后与预测结果之间的关系。方法。从韩国的四个电子健康记录中提取临床数据。研究人群包括抑郁症患者,结果在1年内为IgM。一个数据库用于使用三种算法来开发模型。使用三个数据库中的最佳算法进行外部验证。计算曲线下的面积(AUC)以确定模型的性能。kaplan - 作为长期预后,Meier和Cox的抑郁症风险的生存分析。在四个数据库中对长期结局进行了元分析。结果。使用3,668人的数据开发了一个预测模型,AUC为0.781,绝对收缩和选择运算符(LASSO)逻辑回归。在外部验证中,AUC为0.643、0.610和0.515。通过预测的结果,进行了生存分析和荟萃分析。预计患有IGM的患者抑郁症的危险比为1.20(95%置信区间[CI] 1.02 - 1.41,P = 0.027),在3年的随访中。结论。我们在一年内开发了IgM发生的预测模型。预测的结果与抑郁症的长期预后有关,这是与抑郁症的预后有关的有希望的IGM生物标志物。
背景:拒绝阻碍了肺移植中的长期生存,并且没有广泛接受的生物标志物来预测排斥风险。这项研究旨在使用实验室数据开发和验证预后模型,以预测肺移植受者首次拒绝发作的时间。方法:回顾性收集来自160个肺移植受者的数据。单变量COX分析评估了患者特征对时间拒绝发作的影响。Kaplan-Meier生存分析,LASSO回归和多元COX分析用于选择预后指标并开发风险分数模型。使用Kaplan-Meier分析,时间依赖性ROC曲线和多元COX回归评估模型性能。结果:患者特征与第一个拒绝发作的时间没有显着相关。六个实验室指标 - 激活的部分凝血石时间IL-10,估计的肺内分流器,50%溶血补体,IgA和补体组件3-被确定为重要的预测因子并整合到风险范围内。风险距离表现出良好的预测性能。它优于个人指标,是拒绝的独立风险因素,并在验证数据集中得到了验证。结论:风险尺度模型有效地预测了肺移植受者中首次拒绝发作的时间。关键字:肺移植,拒绝,预后模型,实验室指标
COVID-19的大流行和正在进行的政治和地区冲突对全球供应链产生了极大的有害影响,从而导致物流运营和国际运输造成重大延误。最紧迫的问题之一是围绕产品可用性日期的不确定性,这对于公司生成有效的物流和运输计划的关键信息。因此,准确预测可用性日期在执行成功的物流运营中起着关键作用,最终最大程度地减少了总运输和库存成本。我们利用数值和分类功能研究了通用电动(GE)气体功率的产品可用性日期的预测日期。我们评估了几种回归模型,包括简单回归,拉索回归,脊回归,弹性网,随机森林(RF),梯度增强机(GBM)和神经网络模型。基于实际数据,我们的实验表明,基于树的算法(即RF和GBM)提供了最佳的概括误差,并且优于测试的所有其他回归模型。我们预计,我们的预测模型将帮助公司管理供应链中断并降低供应链的风险。
全身性炎症和相互器官的相互作用与保留的射血分数(HFPEF)的心力衰竭的病理生理学有关。然而,未探索临床价值,尤其是炎症的诊断预测能力和HFPEF的心外器官功能障碍。在这项横断面研究中,根据纳入和排除标准,从2014年1月至2022年6月在Chihfpef队列中的1808例住院患者被完全招募。使用Logistic回归中的Chihfpef-Cohort的数据开发了带有常规血液检查以及HFPEF的肝脏和肾功能障碍的标记的诊断模型,并通过接收器工作特征曲线(ROC)和Brier评分进行评估。然后,该模型通过十倍的交叉验证验证,并以诺姆图和基于Web的在线风险计算器的形式呈现。多变量和LASSO回归分析表明,年龄,血红蛋白,中性粒细胞与淋巴细胞比,AST/ALT比率,肌酐,尿酸,心房颤动和肺动脉高压与HFPEF相关。预测模型表现出合理准确的歧视(ROC,0.753,95%CI 0.732-0.772)和校准(Brier评分为0.200)。随后的内部验证显示出良好的歧视和校准(AUC = 0.750,Brier评分为0.202)。参加HFPEF的病理生理,炎症和多器官相互作用具有HFPEF的诊断预测值。筛查和优化炎症和多器官相互作用的生物标志物代表了一个新领域,以改善HFPEF的无创诊断工具。
摘要 - 驾驶员的嗜睡状态是广泛讨论的话题,因为它在造成交通事故中的重要作用。本研究提出了一种新的方法,该方法结合了模糊的常见空间模式(CSP)优化的相位内聚序列(PC)表示和模糊CSP优化的信号振幅表示。该研究旨在检查机敏状态和嗜睡状态之间脑电图(EEG)同步的变化,通过分析脑电图数据,预测驱动因素的反应时间,并随后确定嗜睡的存在。该研究的发现表明,这种方法成功地区分了警报和昏昏欲睡的精神状态。通过使用基于自动编码器的深度编码器数据融合技术和回归模型,例如支持向量回归(SVR)或最少的绝对收缩和选择运算符(LASSO),该提出的方法使用与回归器模型组合的单个特征集优于单个特征集。通过评估均方根误差(RMSE),平均绝对百分比误差(MAPE)和相关系数(CC)来衡量这种优势。换句话说,基于自动编码器的振幅EEG功率功能和PCS功能的融合在回归中,单独在回归器模型中使用这些功能中的任何一个。具体而言,与仅使用单个振幅EEG功率功能和回归相比,与基线模型相比,提议的数据融合方法的RMSE降低了14.36%,MAPE降低25.12%,CC降低了10.12%。
近年来,基于脑电图(EEG)数据的情感计算吸引了人们的注意力越来越多。作为经典的EEG特征提取模型,Granger因果关系分析已被广泛用于情感分类模型,该模型通过计算EEG传感器之间的因果关系并选择关键的EEG特征来构建大脑网络。传统的EEG Granger因果关系分析使用L 2规范从数据中提取特征,因此结果容易受到脑电图的影响。最近,一些研究人员提出了基于绝对收缩和选择操作员(Lasso)和L 1/2规范的Granger因果关系分析模型来解决此问题。但是,常规的稀疏Granger因果关系分析模型假设每个传感器之间的连接具有相同的先验概率。本文表明,如果可以将每个传感器的脑电图数据之间的相关性添加到Granger因果关系网络中,则可以作为先验知识,则可以增强稀疏Granger因果模型的EEG特征选择能力和情感分类能力。基于这个想法,我们提出了一个新的情感计算模型,该模型将基于传感器相关(SC-SGA)的稀疏Granger因果关系分析模型。SC-SGA基于L 1 /2规范框架进行特征提取,将传感器作为先验知识之间的相关性与Granger因果关系分析,并使用L 2 Norm Logistic回归作为情感分类算法。我们使用两个真实的脑电图数据集报告了实验的结果。这些结果表明,SC-SGA模型的情绪分类准确性比现有模型的情绪分类精度高出2.46–21.81%。
急性髓样白血病(AML)是最常见的造血恶性肿瘤之一,其结果不利,复发率很高。自噬在对白血病的发展和治疗反应中起着至关重要的作用。这项研究确定了潜在的自噬相关签名来监测AML患者的预后。转录组促进液(GSE37642)作为训练集,而TCGA-AML和GSE12417则用作验证同类。单变量回归分析和多变量逐步回归分析分别应用于确定与自噬相关的签名。识别与患者的总体生存率(OS)显着相关的单变量COX回归分析(ARGS)识别32个自噬相关基因(ARGS),并且主要在自噬,p53,ampk和TNF的信号传导途径中富含。一个预后签名,包括八个ARG(BAG3,Calcoco2,Camkk2,Canx,Canx,Dapk1,P4HB,TSC2和ULK1),并且通过Lasso - Cox spepwise Recression分析建立了良好的预测能力。发现高风险患者的OS比低风险组的患者短得多。调整临床病理参数后,该签名可以用作独立的预后预测指标,并在两个外部AML集合进行验证。在两组中分析的差异表达基因参与了炎症和免疫信号通路。潜在的可药物与OS相关的ARG。本研究对肿瘤效果免疫细胞的分析证实了高危患者具有强烈的免疫抑制微环境。