联邦学习在统计和系统异质性方面面临重大挑战,以及高能量消耗,需要有效的客户选择策略。传统方法,包括启发式和基于学习的方法,无法解决这些复杂性。为了回应,我们提出了FedGC,这是一种新颖的生成客户选择框架,它可以创新将客户选择过程作为一项固定的任务重新铸造。从大语模型中使用的方法中汲取灵感,FedGC能够在连续表示空间内编码丰富的决策知识,从而实现了有效的基于梯度的优化,以搜索将通过生成而产生的最佳客户选择。框架组合四个步骤:(1)使用经典客户端选择方法自动收集“选择得分”对数据; (2)在此数据上训练编码器 - 评估器 - 编码器框架以结构连续的表示空间; (3)在此空间中启用基于梯度的优化,以进行最佳客户选择; (4)通过使用光束搜索训练有素的解码器来生成最佳客户端选择。FedGC通过更全面,可推广和高效,同时选择模型性能,延迟和能力消费来优于传统方法。通过广泛的实验分析证明了FedGC的有效性。
摘要:最近,为创建健康数字双胞胎(HDT),用于临床应用的数字双胞胎做出了重大努力。心脏模拟是增长最快的领域之一,它有利于HDT的有效应用。HDTS的临床应用将在医疗服务的未来越来越广泛,并且具有成为医学主流的一部分的巨大潜力。但是,它需要开发模型和算法来分析医学数据,并且基于人工智能(AI)的算法的进步已经彻底改变了图像分割过程。精确的病变细分可能有助于有效的诊断过程和更有效的靶向疗法选择。在本文中,对心脏病学领域的HDT技术的最新成就进行了简要概述,包括介入心脏病学。HDT。特别强调自动细分问题。看来,数据处理中的启示还将集中于医学成像的自动分割,除了三维(3D)图片,以重新构建可以在基于XR的设备中显示的心脏和躯干的解剖结构。这将有助于有效的心脏诊断。AI,XR和基于HDT的解决方案的组合将有助于避免技术错误,并作为个性化心脏病学发展的通用方法。此外,我们描述了潜在的应用,局限性和进一步的研究方向。
在计算机科学中,教科书谈到了“垃圾进,垃圾出”(GIGO)的概念;即低质量的输入数据会产生不可靠的输出或“垃圾”。当我们处理高度复杂的数据模式(例如 X 光片和计算机断层扫描)时,GIGO 就变得更加紧迫。任何深度网络的性能都直接取决于它学习的数据集的质量。可靠数据集的一个例子是像 Cancer Imaging Archive [ 1 ] 这样拥有大量专家工作成果的知名存储库 [ 2 ]。遵守 DICOM 标准并确保图像正确链接到支持元数据对于构建精心策划的数据集至关重要。最近几周,我们观察到一种趋势,即匆忙使用不当数据来训练 COVID-19 深度网络。AI 爱好者似乎不耐烦地创建自己的医学图像数据集,而没有寻求临床合作者来指导他们。这些数据集更像是通过手动收集可公开访问的图像(例如在线期刊和非同行评审档案中的预印本)而形成的“玩具集”。大多数时候,没有临床或医学能力的人工智能研究人员会创建自己的实验性“玩具”数据集,以进行初步调查并建立算法挑战框架。需要明确的是,从医学成像角度来看,“玩具数据集”并不是因为非常小且不符合 DICOM 标准而成为玩具,更重要的是因为它是由工程师和计算机科学家创建的,而不是由医生和医学/临床专家创建的。此类 COVID-19 图像数据集已在互联网上出现,
抽象背景:神经胶质瘤是一种恶性脑肿瘤;它的位置很复杂,很难通过手术去除。诊断性脑肿瘤,医生可以使用医学图像精确地诊断和定位该疾病。 然而,计算机辅助诊断的脑肿瘤诊断仍然是问题,因为脑肿瘤的粗糙分割使肿瘤的内部成绩不正确。 方法:在本文中,我们提出了一个用于脑肿瘤分割的聚集和注意网络。 提出的网络将U-NET作为主链,汇总多尺度语义信息,并专注于至关重要的信息以执行脑肿瘤分割。 为此,我们提出了一个增强的下采样模块和上采样层,以补偿信息损失。 多尺度连接模块是结构编码器和解码器之间的多触发语义融合。 此外,我们设计了一个双重注意融合模块,该模块可以提取和增强磁共振成像的空间关系,并在所提出的网络的不同部分中应用深度监督的策略。 结果:实验结果表明,与ART网络相比,提出的框架的性能是BRATS2020数据集中最好的。 所提出的框架的性能超过了所有比较网络,其四个索引的平均精度分别为0.860、0.885、0.932和1.2325。 关键词:脑胶质瘤,图像分割,医学诊断,卷积神经网络诊断性脑肿瘤,医生可以使用医学图像精确地诊断和定位该疾病。然而,计算机辅助诊断的脑肿瘤诊断仍然是问题,因为脑肿瘤的粗糙分割使肿瘤的内部成绩不正确。方法:在本文中,我们提出了一个用于脑肿瘤分割的聚集和注意网络。提出的网络将U-NET作为主链,汇总多尺度语义信息,并专注于至关重要的信息以执行脑肿瘤分割。为此,我们提出了一个增强的下采样模块和上采样层,以补偿信息损失。多尺度连接模块是结构编码器和解码器之间的多触发语义融合。此外,我们设计了一个双重注意融合模块,该模块可以提取和增强磁共振成像的空间关系,并在所提出的网络的不同部分中应用深度监督的策略。结果:实验结果表明,与ART网络相比,提出的框架的性能是BRATS2020数据集中最好的。所提出的框架的性能超过了所有比较网络,其四个索引的平均精度分别为0.860、0.885、0.932和1.2325。关键词:脑胶质瘤,图像分割,医学诊断,卷积神经网络结论:拟议框架的框架和模块是科学和实用的,可以提取和汇总有用的语义信息并增强神经胶质瘤分割的能力。
本文介绍了腾讯人工智能实验室 - 上海交通大学 (TAL-SJTU) 针对 WMT22 共享任务的低资源翻译系统。我们参与了英语⇔利沃尼亚语的一般翻译任务。我们的系统基于 M2M100 (Fan 等人,2021),并采用了使其适应目标语言对的新技术。(1) 跨模型词嵌入对齐:受跨语言词嵌入对齐的启发,我们成功地将预训练的词嵌入转移到 M2M100,使其能够支持利沃尼亚语。(2) 逐步适应策略:我们利用爱沙尼亚语和拉脱维亚语作为辅助语言进行多对多翻译训练,然后适应英语-利沃尼亚语。(3) 数据增强:为了扩大英语-利沃尼亚语的平行数据,我们以爱沙尼亚语和拉脱维亚语为枢轴语言构建了伪平行数据。(4) 微调:为了充分利用所有可用数据,我们使用验证集和在线反向翻译对模型进行微调,进一步提升性能。在模型评估方面: (1) 我们发现以前的研究(Rikters et al.,2022 )由于 Unicode 规范化不一致而低估了利沃尼亚语的翻译性能,这可能导致高达 14.9 BLEU 分数的差异。(2) 除了标准验证集外,我们还使用往返 BLEU 来评估模型,我们发现这更适合这项任务。最后,我们的无约束系统在英语与利沃尼亚语之间的互译中取得了 17.0 和 30.4 的 BLEU 分数。1
扩展高质量的辅导仍然是教育中的主要挑战。由于不断增长,许多平台雇用了新手教师,这些新手与经验丰富的教育者不同,他们难以解决学生的错误,因此未能抓住主要的学习机会。我们的工作探讨了大型语言模式(LLMS)在修复数学错误时缩小新手 - 专家知识差距的潜力。我们贡献了桥梁,这种方法使用认知任务分析将专家的思维过程转化为一个决策模型进行补救。这涉及识别(a)学生错误,(b)修复策略的例外,以及(c)在产生响应之前的进程。我们结构了一个由700个实际辅导转换的数据集,由专家及其决定的专家注释。我们在数据集中评估了最新的LLMS,并发现专家的决策模型对于LLMS缩小差距至关重要:与专家决策(例如,“简化问题”)的GPT4响应是 +76%的首选。补充,上下文敏感的决策对于缩小教学差距至关重要:随机决策与专家决策相比,GPT4的响应质量降低-97%。我们的工作表明了嵌入专家思维过程的潜力,以增强他们的帽子,以弥合新手 - 专家知识差距。我们的数据集和代码可以在以下网址找到:https://github.com/rosewang2008/bridge。
和进一步经历了同性恋,导致多价相互作用和LLP的诱导。VP16被募集到CMV最小启动子提供的转录起始位点,并诱导报告基因表达。(b)调整转化因子冷凝物的材料特性。要修改凝结物材料特性,采用了两种策略:首先,通过将CRY2换成Cry2 Olig,从而增加了相互作用的价值,而Cry2 Olig构成了高阶寡聚物;其次,通过共转染编码融合到麦克里(可视化)和fus n和nLS的cry2 olig的结构来提高价值和浓度。与CRY2-EYFP-FUS N -VP16或CREY2 OLIG -EYFP-FUS N -VP16构建体(黄色和绿色数据点)共转染了编码CIBN-TER和基于TETO 4的SEAP报告基因。可选地,添加了编码Cry2 Olig -MCH -MCH -FUS n -nls的构造(以2:1的质粒量比为2:1相对于含VP16的构建体,红色和黑色数据点)。在进行FRAP分析之前,将细胞在黑暗中培养32小时。蓝光照明10分钟后(2.5 µmol m -²S-1)开始。 图像在液滴漂白之前直接显示出反应性核。比例尺= 5 µm。 图显示了根据n≥7凝结物回收曲线的非线性拟合计算出的移动部分的平均值和单个值(请参见右图)。 使用学生的t.test(*=p≤0.05; **** =p≤0.0001)进行成对比较。。图像在液滴漂白之前直接显示出反应性核。比例尺= 5 µm。图显示了根据n≥7凝结物回收曲线的非线性拟合计算出的移动部分的平均值和单个值(请参见右图)。使用学生的t.test(*=p≤0.05; **** =p≤0.0001)进行成对比较。
我们解决了在秘密共享计划中检测和惩罚股东集结的问题。我们在最近提出的称为“个人密码学”(Dziembowski,Faust和Lizurej,Crypto 2023)的加密模型中这样做,该模型假设存在单个机器可以有效地计算的任务,但可以通过多个(相互不信任的设备)进行计算有效地计算。在此模型中,我们引入了一种名为Snitching(SSS)的新颖原始性,其中每次尝试非法重新构建共享的秘密𝑆𝑆导致证明可以用来证明这种不当行为(例如,例如财务上对区块链上的作弊者进行财务惩罚)。即使股东试图不重建整个秘密,但只能学习一些部分信息,这在很强的意义上也很强。 我们的概念还捕获了使用多方计算协议(MPC)进行的攻击,即恶意股东使用MPC来计算𝑆的部分信息的攻击。 SSS的主要思想是可以证明和惩罚任何ille-gal重建,这足以阻止非法秘密重建。 因此,我们的SSS计划有效地阻止了股东的勾结。 我们提供了阈值(𝑡-out-out-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-out-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-)。 然后,我们展示如何以𝑡=𝑛构建它,然后我们使用此构造来为任意𝑡构建SSS方案。 为了证明我们的构建安全性,我们引入了随机Oracle模型的概括(Bellare,Rogaway,CCS 1993),该模型允许在MPC内进行建模哈希评估。这在很强的意义上也很强。我们的概念还捕获了使用多方计算协议(MPC)进行的攻击,即恶意股东使用MPC来计算𝑆的部分信息的攻击。SSS的主要思想是可以证明和惩罚任何ille-gal重建,这足以阻止非法秘密重建。因此,我们的SSS计划有效地阻止了股东的勾结。我们提供了阈值(𝑡-out-out-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-out-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-)。然后,我们展示如何以𝑡=𝑛构建它,然后我们使用此构造来为任意𝑡构建SSS方案。为了证明我们的构建安全性,我们引入了随机Oracle模型的概括(Bellare,Rogaway,CCS 1993),该模型允许在MPC内进行建模哈希评估。
我们的人工智能系统需要进一步关注(即对话、研究、指导方针、政策)和跨学科合作,以将需求构造发展为一种实用工具,用于塑造未来人工智能能够和应该实现的目标。需求是一个常见的词(例如“我需要咖啡”),因此人们很容易忽视这个词具有特定的含义、定义、内涵和力量。例如,它的力量源于语句的对象(如上例中的咖啡)似乎是绝对必要的并且没有替代品的内涵。换句话说,只有咖啡才能满足隐含的需求。咖啡可能不够,但茶或水绝对不行。我们通常会利用这种力量(政客和广告商也是如此),当我们使用“需求”这个词来有效地排除其他选择(比如,“人工智能公司需要政府监管”,而其他可行的选择可能是基于市场的手段、共同监管、自我监管和教育[5])。我们这样做是因为需求陈述通常会诱导期望的相关行为(比如选择监管而不是其他替代方案);尽管这通常会给定义需求的人和负责满足需求的人带来道德困难。在这些情况下,需求是一个非常强大的概念——然而我们对它仍然知之甚少或难以达成一致。值得强调的是,有需要(以及相应地满足需求)并不局限于个人。需求可以与不同类型的系统相关联(例如生命形式、组织、社会)。因此,需求感知的人工智能系统理想情况下应该可持续地考虑不同系统在不同层次和不同环境下的需求(复数)。
在标准信号处理中,采样理论指出,以高于奈奎斯特速率采样的带限信号可以完美重建。这一重要特性是欧几里得信号采样的基石。然而,当信号定义在更复杂的域上时,自适应采样策略的设计仍然是一个活跃的热门话题。为了处理位于不规则域上的信号,图信号处理 (GSP) [1, 2] 已成为标准方法的有力替代方案。在这种形式化中,图定义了一个支持,信号(现在称为图信号)在此支持上定义。这允许捕获信号演变的结构,从而提供比单独考虑信号更多的信息。通过将信号处理的概念和工具推广到图上记录的信号,GSP 已证明其在滤波 [3]、重构 [4] 和采样 [5] 等许多任务中都取得了成功。对于后者,在单变量情况下提出的一个想法是利用其底层图,从某些节点的测量中重建图信号。这种称为图采样集选择(或子集采样)的方法现在已得到充分研究 [6, 7, 8]。例如,(在无噪声设置下)假设图信号是带限的,可以证明随机选择合理数量的样本/节点足以以高概率实现完美重建 [9]。不幸的是,此类方法存在一些主要局限性。首先,到目前为止,大多数文章都集中在单变量信号上。然而,GSP 中最近的出版物主张需要多域图信号处理,以便处理张量数据或矢量数据 [10, 11]。事实上,在传感器网络等多个应用环境中,数据流被记录为在网络上演变的多变量时间序列,从而定义至少