生物数据库中的大量数据泛滥提供了医疗保健和生命科学领域的各种信息。这些数据库为研究人员,科学家和工作专业人员提供了加速发现,开发新的假设并确定新型模式的机会[1]。另一方面,这些数据库需要实现复杂的存储和检索系统来从这些大数据库中检索信息。这成为研究人员和科学家的挑战[2]。作为RDF知识图发布的大多数生物数据库都依赖于SPARQL(SPARQL协议和RDF查询语言)等复杂的查询语言[3]来从数据库中检索信息。没有技术知识或有限的技术知识,研究人员和域用户无法编写准确且可靠的SPARQL查询,这可能会成为利用这些数据库的全部潜力的瓶颈[3] [1]。SPARQL是一种查询语言,可以使用户从数据库中查询信息[4] [3]。许多生物数据库利用RDF(资源描述框架)数据模型,其中RDF表示信息为适用于蛋白质功能(例如蛋白质功能,基因相互作用)的复杂生物学关系的互连三元组(受试者,谓词,对象)[2] [2] [4]。RDF数据可通过SPARQL端点提供,而SPARQL查询语言是专门设计用于查询RDF数据的,可以有效
摘要 - 通过在密集的互连网络中启用低延迟的大数据处理,该网络构成了车辆,侵蚀,行人,行人和云。自动驾驶汽车非常依赖机器学习(ML),并且可以从边缘生成的大量感官数据中受益,这要求采取措施调和模型培训,并保留敏感用户数据的隐私。联合学习(FL)是一种有希望的解决方案,可以在车辆网络中培训复杂的ML模型,同时保护道路使用者的隐私并减轻沟通开销。本文研究了尖端Yolov7模型的联合优化,以解决数据异质性,包括不平衡性,概念漂移和标签分布偏向的实时对象检测。为此,我们介绍了FedPylot,这是一种基于MPI的轻质原型,以模拟高性能计算(HPC)系统的联合对象检测实验,在此使用混合加密,我们可以在其中维护服务器 - 客户层通信。我们的研究因素,准确性,沟通成本和推理速度,从而为自动驾驶汽车面临的挑战提供了平衡的方法。我们证明了FL在IOV中的适用性的有希望的结果,并希望FedPylot将为将来研究联合实时对象检测提供基础。源代码可在https://github.com/cyprienquemeneur/fedpylot上获得。
允许将本工作的全部或一部分供个人或课堂使用的数字或硬副本授予,而没有费用,只要副本不是盈利或商业优势,并且副本带有此通知和首页上的完整引用。必须尊重他人拥有的这项工作的组件版权。允许用信用摘要。否则复制或重新出版以在服务器上发布或重新分配到列表,需要事先特定的许可和/或费用。请求权限从permissions@acm.org。
摘要 - 创伤性脑损伤(TBI)是一个重大的全球健康问题,通常会导致长期残疾和认知障碍。对TBI的准确及时诊断对于有效的治疗和管理至关重要。在本文中,我们提出了一个新型联邦卷积神经网络(FEDCNN)框架,用于在分散的健康监测中对TBI进行预测分析。该框架在Python中实现,利用了三个不同的数据集:CQ500,RSNA和中心-TBI,每个数据集都包含与TBI相关的带注释的脑CT图像。该方法包括数据预处理,使用灰度级别共发生矩阵(GLCM)的特征提取,采用蚱hopper优化算法(GOA)的特征选择以及使用FEDCNN进行分类。与现有方法(例如Dann,RF和DT和LSTM)相比,我们的方法的精度为99.2%,超过1.6%。FEDCNN框架提供了分散的隐私性 - 在各个网络之间保存培训,同时与中央服务器共享模型参数,从而确保健康监控中的数据隐私和分散化。评估指标在内,包括准确性,精度,召回和F1得分表明了我们方法在准确分类与TBI相关的正常和异常脑CT图像方面的有效性。ROC分析进一步验证了FedCNN框架的判别能力,强调了其作为TBI诊断的先进工具的潜力。我们的研究通过为TBI管理提供了可靠,有效的方法,为分散的健康监测领域做出了贡献,从而在患者护理和医疗保健管理方面提供了重大进步。未来的研究可以探索扩展FedCNN框架以结合其他模式和数据集,并集成先进的深度学习体系结构和优化算法,以进一步提高医疗保健应用程序中的性能和可扩展性。
摘要联盟学习作为一种协作机器学习方法引起了人们的关注,允许多个用户在不直接交换原始数据的情况下共同训练共享模型。本研究通过引入创新的混合方法来解决分布式学习中平衡数据隐私和实用性的基本挑战,该方法将差异隐私与联合学习(HDP-FL)融合在一起。通过对EMNIST和CIFAR-10数据集进行细致的实验,这种混合方法可取得重大进步,与EMNIST和CIFAR-10的模型获得的值得注意的4.22%和高达9.39%的增强相比,与传统的Fudeer-10相比,分别提高了9.39%。我们对参数的调整强调了噪声如何影响隐私,展示了混合DP方法在打破隐私和准确性之间取得平衡的有效性。跨不同FL技术和客户数量的评估强调了这一权衡,特别是在非IID数据设置中,我们的混合方法有效地抵消了准确的准确性下降。对标准机器学习和最先进的方法的比较分析始终展示了我们所构图模型的优越性,而Emnist的比较精确度为96.29%,而CIFAR-10的优势为82.88%。这些见解提供了一种战略方法,可以在不损害数据隐私的情况下安全地在物联网设备之间进行协作和共享知识,从而确保分散的网络工作中有效且可靠的学习机制。
摘要 —分布式训练可以促进大型医学图像数据集的处理,并在保护患者隐私的同时提高疾病诊断的准确性和效率,这对于实现高效的医学图像分析和加速医学研究进展至关重要。本文提出了一种创新的医学图像分类方法,利用联邦学习 (FL) 来解决数据隐私和高效疾病诊断的双重挑战。传统的集中式机器学习模型尽管广泛用于疾病诊断等医学成像任务,但由于患者数据的敏感性,引发了严重的隐私问题。作为替代方案,FL 成为一种有前途的解决方案,它允许在本地客户端之间训练集体全局模型而无需集中数据,从而保护隐私。本研究重点关注 FL 在磁共振成像 (MRI) 脑肿瘤检测中的应用,证明了联邦学习框架与 EfficientNet-B0 和 FedAvg 算法相结合在增强隐私和诊断准确性方面的有效性。通过精心选择预处理方法、算法和超参数,以及对各种卷积神经网络 (CNN) 架构的比较分析,该研究发现了图像分类的最佳策略。实验结果表明,EfficientNet-B0 在处理数据异质性方面优于 ResNet 等其他模型,并且实现了更高的准确率和更低的损失,凸显了 FL 在克服传统模型局限性方面的潜力。该研究强调了解决数据异质性的重要性,并提出了进一步的研究方向,以扩大 FL 在医学图像分析中的适用性。
道路车辆的客运运输占全球总二氧化碳排放量的15%,电池电动汽车(BEV)提供了减少这一数字的重要方法。但是,拥有电动汽车的最常见障碍之一是范围焦虑 - 担心电池可能无法为汽车所有者到达目的地的充电不足,而使他们陷入困境。一项调查发现,有58%的驾驶员说范围焦虑阻止了他们购买电动汽车。
量子量子联合学习(QFL)是一个新颖的框架,将分类联合学习(FL)的优势与量子技术的计算能力相结合。这包括量子计算和量子机学习(QML),使QFL能够处理高含量的复杂数据。QFL可以在经典和量子通信网络上部署,以使信息受益 - 理论安全级别超过传统的FL框架。在本文中,我们对QFL的挑战和机遇进行了首次全面调查。我们特别检查了QFL的关键组成部分,并确定在经典和量子网络中部署它时会出现的独特挑战。然后,我们开发新的解决方案并阐明可以帮助应对所确定挑战的研究方向。我们还提供了可行的建议,以推进QFL的实际实现。
联合学习是一种新的学习范式,它通过多方计算和模型聚合来分解数据收集和模型培训。作为一种流行的学习设置,联合学习有可能与其他学习框架集成。我们与其他学习算法进行了针对联邦学习的重点调查。特别是,我们探索了各种学习算法,以改善联合平均算法的香草,并审查模型融合方法,例如自适应聚集,正则化,聚类方法和贝叶斯方法。遵循新兴趋势,我们还讨论了与其他学习范式的交叉路口中的联合学习,称为联合X学习,其中X包括多任务学习,元学习,转移学习,
摘要 - 在联合学习,安全的聚合(SA)促成(S&P'23)和Lerna(Asiacrypt'23)等诸如恶意模型中已实现了有效的多轮SA。但是,他们的每一轮聚合需要至少三个客户服务器往返通信,并且缺乏对聚合结果验证的支持。可验证的SA方案,例如Versa(TDSC'21)和Eltaras等。(TIFS'23),根据服务器不与任何用户相关的安全性假设提供可验证的聚合结果。尽管如此,这些方案会产生高沟通成本,并且缺乏对有效的多轮聚合的支持。完全在SEAR中(TDSC'22)中完全在受信任的执行环境(TEE)中执行SA,可以保证隐私和可验证的聚合。但是,T恤中的有限物理内存带来了重要的计算瓶颈,尤其是在汇总大型模型或处理众多客户时。在这项工作中,我们介绍了OPSA,这是一种基于TEE的多轮安全聚合框架,以实现有效的通信,简化的计算和可验证的聚合。OPSA采用了一种新的策略,可以在TEE中揭示共享键,并实例化两种类型的掩盖方案。 此外,结果验证模块设计为与在OPSA框架下实例化的任何类型的SA协议兼容,并且安全性假设较弱。 与最先进的方案相比,OPSA在多轮聚集中达到了2个〜10×速度,同时也支持结果验证。OPSA采用了一种新的策略,可以在TEE中揭示共享键,并实例化两种类型的掩盖方案。此外,结果验证模块设计为与在OPSA框架下实例化的任何类型的SA协议兼容,并且安全性假设较弱。与最先进的方案相比,OPSA在多轮聚集中达到了2个〜10×速度,同时也支持结果验证。OPSA对具有高网络延迟和大规模模型聚合的方案更友好。