ODS Excel 目标以 Microsoft Office Open XML SpreadsheetML 文件格式 (XLSX) 生成输出。此目标通过创建可演示的 Excel 电子表格,自动从 SAS®9 和 SAS Viya 直接生成 Microsoft Excel 工作表。此目标有许多亮点,但最重要的是能够消除手动工作。选项提供的一些最常用的功能包括命名和着色工作表选项卡、冻结行和列标题、添加过滤器、在特定位置开始输出等。其他功能包括使用 SAS/GRAPH ® 和 ODS Graphics 添加图形、添加公式以及为每个工作簿添加多个工作表。示例 1 显示了如何使用此目标创建类似于下面的输出 1 的自定义输出。
开箱即用的公平性和偏差评估突出显示了在指定的“敏感”变量中不同组的模型性能和预测的潜在差异。SAS Model Studio 的“公平性和偏差”选项卡显示性能偏差奇偶性、预测偏差奇偶性、性能偏差、预测偏差、偏差指标和偏差奇偶性指标图。SAS Viya 还提供偏差缓解功能,以在训练模型时主动减少偏差。指数梯度减少 (EGR) 算法使用一种缓解偏差的过程内方法,在训练过程中主动调整模型参数,以创建产生公平预测和分类的模型。
摘要:机器学习(ML)技术的应用是协助诊断复杂疾病的可靠方法。最近的研究将肠道微生物的组成与自闭症谱系障碍(ASD)的存在有关,但到目前为止,结果主要是矛盾的。这项工作建议使用机器学习研究肠道微生物组组成及其在ASD早期诊断中的作用。我们使用肠道微生物组成分的公开数据,将支持向量机(SVM),人工神经网络(ANN)和随机森林(ANN)和随机森林(RF)算法分类为神经型(NT)或具有ASD的受试者。天真的贝叶斯,k-neart邻居,合奏学习,逻辑回归,线性回归和决策树也经过训练和验证;但是,提出的表现最好的性能和解释性。使用SAS VIYA软件平台开发了所有ML方法。使用16S rRNA测序技术确定微生物组的组成。ML的应用产生的分类准确性高达90%,灵敏度为96.97%,特异性较高达到85.29%。在ANN模型的情况下,与第一个数据集对NT受试者进行分类时不会发生任何错误,这表明与传统测试和基于数据的方法相比,分类结果显着。使用两个数据集重复这种方法,一个来自美国,另一个来自中国,导致了类似的发现。所获得的模型中的主要预测指标在分析的数据集之间有所不同。从分析的数据集中确定的最重要的预测因素是细菌,lachnospira,anaerobutyricum和ruminococcus torques。值得注意的是,在每个模型中的预测因子中,由于其相对丰度较低,因此存在细菌在微生物组组成中通常被认为是微不足道的。这种结果增强了对微生物组对ASD发展的影响的常规理解,在这种情况下,微生物群的组成的不平衡会导致宿主 - 微生物稳定的破坏。考虑到以前的几项研究集中在最丰富的属,并且被忽略了较小的(并且经常在统计学上显着)微生物群落,因此对此类社区的影响进行了很差的分析。基于ML的模型表明,更多的研究应集中在这些不太丰富的微生物上。一个新的假设解释了这一领域的矛盾结果,并提倡对可能不会表现出统计学意义的变量进行更深入的研究。获得的结果似乎有助于解释有关ASD的矛盾发现及其与肠道菌群组成的关系。虽然某些研究将杆状杆菌/杆菌的比例较高,而其他研究则相反。这些差异与微生物组组成中的少数族裔有密切相关,这在人群之间可能有所不同,但具有相似的代谢功能。因此,在ASD表现中,杆菌/杆菌的比率可能不是决定因素。