摘要:脑磁共振成像 (MRI) 中肿瘤区域的检测和分割在过去二十年中起着重要作用。本文提出了一种用于脑肿瘤检测的高效视觉几何组卷积神经网络架构,该架构由预处理模块、DWT 模块和分类模块以及分割模块组成。基于缩放的数据增强方法用作预处理技术,并使用 DWT 变换分解数据增强的缩放图像。根据这些分解系数构建小波特征图,并使用 EVGG-CNN 架构对其进行分类。该架构将脑图像识别为胶质瘤或健康脑图像。通过将所提出的方法应用于 BRATS 2021 和 Kaggle 数据集中的脑图像,验证了本文所述这些开发方法的有效性。从灵敏度、特异性和准确性方面分析了所提出的 EVGG-CNN 架构的性能。
Santanu Pattanayak 目前是高通公司研发部门的一名机器学习研究员,也是深度学习书籍《使用 TensorFlow 进行深度学习:用 Python 进行高级人工智能的数学方法》的作者。他拥有大约 12 年的工作经验,其中 8 年从事数据分析/数据科学领域。加入高通之前,Santanu 曾在 GE、RBS、凯捷和 IBM 工作。他毕业于加尔各答的贾达夫普尔大学,获得电气工程学位,并在印度理工学院 (IIT) 海得拉巴分校获得数据科学硕士学位。Santanu 是一名狂热的数学爱好者,喜欢参加 Kaggle 比赛,他在全球排名前 500 名。Santanu 在印度西孟加拉邦出生和长大,目前与妻子居住在印度班加罗尔。
抽象的心脏是负责整个身体循环血液的主要器官,在社会中引起的心脏病引起了极大的关注。诊断心脏病给医生带来了重大挑战。研究人员已经探索了多种预测方法来解决此问题。这些预测的准确性仍然是关键的考虑因素。在这项研究中,我们专注于五种不同的机器学习算法,包括随机森林,决策树分类器,逻辑回归,k-neartiment邻居分类器以及带有网格搜索的决策树分类器。此外,我们开发了一个合奏模型,其主要目标是准确预测心脏病。我们的分析利用了Kaggle的心脏病数据集,在检查的五种算法中,决策树分类器的精度最高为92%。这一发现突出了其在预测心脏病方面的有效性。
摘要本文旨在概述我们的方法,以区分人类生成的文本和具有模型融合方法的生成AI模型。我们的方法包括三个步骤:首先,我们将PAN的竞争数据集扩展到Clef 2024的竞争数据集,其中包括来自著名的数据科学和机器学习竞赛平台Kaggle的外部数据集,并应用Levenshtein距离算法算法纠正拼写错误的单词。然后,基于共享主题并将培训,验证和测试数据集形成文本对的数据集。第二,我们训练一个微调的BERT作为基本模型和使用R-Drop方法的BERT来减轻过度拟合问题。最后,这两个模型是使用合奏学习技术和投票策略组合的。我们的实验结果表明,融合模型的ROC-AUC度量为0.932,比基线模型Fast-DetectGpt(Mistral)提高了5.6%。
心力衰竭(HF)是一种心血管疾病(CVD),是一种普遍的疾病,可能导致危险情况。每年,全球大约有1790万患者死于这种疾病。对于心脏专家和外科医生来说,准确预测心力衰竭是具有挑战性的。幸运的是,可以使用分类和预测模型,可以使用医疗数据有效地帮助医疗领域。这项研究的目的是通过预测由11个患者属性的五组数据组成的Kaggle数据集来提高心力衰竭预测的准确性。使用多种机器学习方法来了解数据和医学数据库中心力衰竭的可能性。结果和比较表明,预测心力衰竭的精度得分明显提高。将此模型整合到医疗系统中将有助于帮助医生预测患者心脏病的预测
摘要。随着机器学习(ML)场的迅速发展,ML管道的数量,复杂性和组件不断增长。在线平台(例如OpenML,Kaggle)旨在收集和传播ML实验。但是,可用知识的分散,每个平台代表ML过程的不同组成部分或相互区域的组件,但以不同的方式。为了解决这个问题,我们利用语义Web技术来建模和集成ML数据集,实验,软件和科学作品纳入MLSEA,这是一种资源:(i)MLSO,一种模拟ML数据集,管道和实现的本体论; (ii)MLST,分类法,其中包含ML知识的收集为受控词汇; (iii)MLSEA-kg,一个RDF图,其中包含来自不同来源的ML数据集,管道,实现和科学作品。MLSEA为改善ML管道的搜索,解释性和可重复性铺平了道路。
所有数据均由 Leash Biosciences 内部生成,比赛将由 Kaggle 举办。由于 DEL 化学的重叠性质,测试训练拆分必然会减少比赛期间可用的数据量(例如,对于测试集中的给定构建块,必须从训练和验证集中删除包含该构建块的所有分子)。我们为每种蛋白质提供大约 98M 个训练示例、200K 个验证示例和 360K 个测试分子。这些数据集非常不平衡:大约 0.5% 的示例被归类为命中。在这里,示例是标记为结合剂或不是结合剂的小分子;我们使用了 3 轮选择,共三次,以通过实验识别结合剂。比赛结束后,Leash 将提供所有数据以供将来使用(3 个目标 * 3 轮选择 * 3 次重复 * 1.33 亿个分子,或 3.6 亿次测量)。
随机挑战很重要,因为它们是研究人员和从业人员(尤其是年轻的专业人士)的指南针,他们正在思考值得解决的问题,测试可能性的界限!挑战任务还激发了参与者的竞争精神,这一点从 Kaggle 竞赛(以及其中的论坛讨论)中大量活跃的参与者可以看出。获胜者还将获得奖金和研究炫耀权。国防高级研究计划局大挑战 1 和 X 奖 2 是一些最著名的成功项目,它们帮助在应用人工智能 (AI) 的许多领域取得了重大进展。随着大挑战的完成,除了解决方案带来的长期利益之外,它们获得的正面报道有助于团结社会支持该领域。涓滴效应包括公民对科学技术的重新尊重和信任,以及对科学、技术、工程和数学教育的重视。
在每个业务中,服务提供商的数量都在迅速增加。在这些日子里,银行业的客户选择将钱放在哪里的选择不足。因此,客户流失和参与已成为大多数银行的主要问题之一。使用机器学习技术来预测银行中客户流失的方法,这是人工智能的一个分支。该研究通过使用机器学习算法(例如KNN,SVM,决策树和随机森林分类器)来分析客户行为来促进对客户行为的探索。另外,已经采用了一些功能选择方法来找到更相关的功能并验证系统性能。实验是在Kaggle的搅拌模型数据集上进行的。将结果进行比较,以找到具有更高精度和可预测性的合适模型。因此,在准确性方面,与其他模型相比,过采样后的随机森林模型的使用更好。
摘要 本文致力于开发一种对脑肿瘤(包括胶质瘤、脑膜瘤、垂体瘤和非肿瘤)的 MRI 图像进行分类的模型。数据集是从 Kaggle 收集的。然后,它被组织起来并上传到 GitHub。这项工作利用了 Python 的不同库,即 Matplotlib、NumPy 和 Sci-Kit Learn。Google Collaboratory 已用于执行环境,存储要求有限,为 108 GB。图像从名为“Brain-Tumor”的 GitHub 存储库克隆到 Google Collaboratory。该存储库包含一个对应于所有指定类型肿瘤图像的数据集。支持向量机算法已用于分类。所提出模型的准确率在 84% 到 92% 之间。关键词:Google Collab、图像分类、MRI 图像、机器学习、存储库、支持向量机 (SVM)