随着共同的19日大流行的结束,政府发现自己面临着新的挑战:激励公民恢复经济活动。这样做是什么有效的方法?我们使用在城市Covid-19锁定结束后立即在中国郑州市进行的领域实验调查了这个问题。使用参与者手机的自我报告和GPS轨迹数据,我们评估了提供有关恢复经济活动的参与者邻居比例的信息的效果。我们发现,在那些低估了恢复经济活动的邻居比例的参与者中,向个人访问餐厅的计划通知个人访问餐厅的计划将访问餐厅的比例增加12个百分点(37%)。那些高估的人没有通过减少餐厅出勤而做出回应,因此干预措施没有“ Boomerang”影响。我们探索主持人,风险感知和公园的安慰剂干预。所有这些分析都表明,我们的干预措施通过减少去餐馆的风险来进行。
•随机森林•梯度提升•基于直方图的梯度提升•XGBOOST•袋装•逻辑回归•SGD分类器•K-Nearest邻居•多层感知器•TABPFN
从粗制的数据中发现细粒类别是一项实用且挑剔的任务,可以在对细粒度分析的需求和高注释成本之间弥合差距。以前的作品主要集中在实例级别的歧视上,以学习低级特征,但忽略了数据之间的半敏化相似性,这可能会预见这些模型学习紧凑的集群表示。在本文中,我们提出了DeNOCORE的邻域聚集(DNA),这是一个自我监督的框架,将数据的系统结构编码到嵌入空间中。特别是,我们检索了查询的k neart邻域,作为其积极的键,以捕获数据之间的语义相似性,然后从邻居那里汇总信息以学习紧凑的群集表示,这可以使细粒类别变得更加差异。但是,检索到的邻居可能会嘈杂,并且包含许多假阳性钥匙,从而可以降低学习式床的质量。为了应对这一挑战,我们提出了三个原则,以解决这些虚假的邻居以更好地表示学习。此外,我们从理论上证明我们框架的学习目标与聚类损失相同,该损失可以捕获数据之间的语义相似性以形成紧凑的细粒簇。在三个基准数据集上进行了广泛的例证表明,我们的方法可以检索更准确的邻居(准确性提高21.31%),并以较大的利润率(平均提高了三个指标的平均9.96%)。我们的代码和数据可在https://github.com/lackel/dna上找到。
•深度学习 /常规人工神经网络•并行数据处理(背景和变化检测,卷积等)•线性代数(MVM,交叉相关,L1-NORM等)•经典机器学习(SVMS,K-Nearest邻居,群集,群集)
- 常见算法:线性回归,决策树,支持向量机(SVM),K-Nearest邻居(K-NN)。- 深度学习是机器学习的一个子集,它使用具有多个层(深神经网络)的神经网络来对大型数据集中的复杂模式进行建模。
这项纵向研究利用了FASA成人队列研究(FACS)的数据。该研究最初包括在伊朗FASA农村地区35-70岁的1018名参与者,并在5年后使用随机抽样进行了3,000名参与者的随访。在机器学习(ML)模型中总共包括160个变量,并使用特征缩放和单热编码进行数据处理。Ten supervised ML algorithms were utilized, namely logistic regression (LR), support vector machine (SVM), random forest (RF), Gaussian naive Bayes (GNB), linear discriminant analysis (LDA), k-nearest neighbors (KNN), gradient boosting machine (GBM), extreme gradient boosting (XGB), cat boost (CAT), and light Gra-streent Boosting Machine(LGBM)。超参数调整是使用超参数的各种组合来识别最佳模型的。合成少数民族过度抽样技术(SMOTE)用于平衡训练数据,并使用Shapley添加说明(SHAP)进行了特征选择。