Loading...
机构名称:
¥ 1.0

化学物质的调节需要了解其对大量目标物种的毒理作用。传统上,这些知识是通过体内测试获得的。最近为基于机器学习寻找替代方案的努力并没有集中于保证透明度,可比性和可重复性,这使得很难评估这些方法的优势和缺点。此外,还需要可比的基线表现。在这项研究中,我们在[Schür等人,《自然科学数据》,2023年提出的Adore“ T-F2F”挑战上训练了回归模型,以预测鱼类上有机化合物的LC50(致命浓度50),以LC50(致命浓度50)测量。我们训练了拉索,随机森林(RF),XGBOOST,高斯工艺(GP)回归模型,并发现了一系列稳定的方面,这些方面均稳定:(i)使用质量或摩尔浓度不会影响性能; (ii)性能仅微弱地取决于化学物质的表示方式,但(iii)强烈地取决于数据的分配方式。总体而言,基于树的型号RF和XGBoost表现最好,我们能够预测log10转换的LC50,其根平方误差为0.90,这对应于原始LC50量表上的数量级。在本地一级,模型无法准确预测单个化学物质的毒性。对单个化学物质的预测主要由几种化学性质,分类性状并未被模型充分捕获。因此,模型尚不适用于监管过程。尽管如此,这项工作有助于就如何将机器学习整合到监管过程中的持续讨论。

基于机器学习的急性死亡率的预测

基于机器学习的急性死亡率的预测PDF文件第1页

基于机器学习的急性死亡率的预测PDF文件第2页

基于机器学习的急性死亡率的预测PDF文件第3页

基于机器学习的急性死亡率的预测PDF文件第4页

基于机器学习的急性死亡率的预测PDF文件第5页

相关文件推荐