根据已确定药物的数据预测未知或/和正在研究的药物的靶标不仅对于理解各种药物和分子相互作用过程非常重要,而且对于开发新药也非常重要。这里我们介绍 TarDict,一种基于 RandomForestClassifier 的软件,它基于化学物质的 SMILES 预测靶标通路或蛋白质。TarDict 接收 SMILES 并返回可能类似药物的列表,然后向用户导出药物所起作用的靶标列表。20442 个条目的训练数据集和测试显示准确率为 %95。
摘要:确保主动检测交易风险对于金融机构来说至关重要,尤其是在管理信用评分的情况下。在这项研究中,我们将不同的机器学习算法有效,有效地比较。The algorithms used in this study were: MLogisticRegressionCV, ExtraTreeClassifier,LGBMClassifier,AdaBoostClassifier, GradientBoostingClassifier,Perceptron,RandomForestClassifier,KNeighborsClassifier,BaggingClassifier, DecisionTreeClassifier, CalibratedClassifierCV, LabelPropagation, Deep 学习。数据集是从Kaggle存放处收集的。它由164行和8列组成。与不平衡数据集的最佳分类器是LogisticRegressionCV。精度为100.0%,进动100.0%,召回100.0%和F1得分100.0%。但是,使用平衡数据集的最佳分类器是LogisticRegressionCV。精度为100.0%,进动100.0%,召回100.0%和F1得分100.0%。