摘要。随着机器学习(ML)场的迅速发展,ML管道的数量,复杂性和组件不断增长。在线平台(例如OpenML,Kaggle)旨在收集和传播ML实验。但是,可用知识的分散,每个平台代表ML过程的不同组成部分或相互区域的组件,但以不同的方式。为了解决这个问题,我们利用语义Web技术来建模和集成ML数据集,实验,软件和科学作品纳入MLSEA,这是一种资源:(i)MLSO,一种模拟ML数据集,管道和实现的本体论; (ii)MLST,分类法,其中包含ML知识的收集为受控词汇; (iii)MLSEA-kg,一个RDF图,其中包含来自不同来源的ML数据集,管道,实现和科学作品。MLSEA为改善ML管道的搜索,解释性和可重复性铺平了道路。
libxmtp,它们对可扩展消息传输协议(XMTP)的生锈实现,它是在Web3环境中建立在消息层安全性(MLS)上的,用户将其现有的基于区块链的身份利用其基于区块链的身份进行身份验证。该应用程序是由OpenML的基础,并提供了XIP-46中所述的自定义身份验证服务,该服务建立了将多个钱包地址与单个自我管理的身份相关联的框架。审查是由三个顾问在三周的时间内进行的,总共努力为25人。在2024年11月18日的一周进行了一次重新测试,发现11个发现中有9个已固定。其余2个发现被视为“接受风险”,XIP-46更新了集成应用程序的设计选择和责任。
局部添加说明方法越来越多地用于了解复杂机器学习(ML)模型的预测。最常用的广告方法,塑造和石灰,遭受文献中很少测量的局限性。本文旨在使用六个定量指标来衡量对OpenML数据集(304)数据集的这些限制,还评估了基于新兴联盟的方法来解决其他方法的弱点。我们在特定的医疗数据集(Sa Heart)上说明和验证结果。我们的发现表明,石灰和沙普的大约在高维度上特别有效,并产生了可理解的全球解释,但是在更改方法的pa-rameters时,它们缺乏精确度,并且可能是不需要的行为。基于联盟的方法在高维度上在计算上昂贵,但提供了更高质量的本地解释。最后,我们提出了一个路线图,总结了我们的工作,指出了最合适的方法,具体取决于数据集维度和用户的目标。