摘要 - 本文介绍了超维计算(HDC)域中数据的聚类。在先前的工作中,已经提出了一个基于HDC的聚类框架,称为HDCluster。但是,现有的HDCluster的性能并不强大。在初始化步骤中随机选择簇的高量向量,HDCluster的性能被降解。为了克服这种瓶颈,我们通过探索编码数据的相似性(称为查询过量向量,分配了初始群集过度向量。组内过度向量的相似性比组间高向量具有更高的相似性。利用查询过量向量之间的相似性结果,本文提出了四种基于HDC的聚类算法:基于相似性的K-均值,相等的Bin宽度直方图,相等的BIN高度直方图和基于相似性的亲和力传播。实验结果说明:(i)与现有的HDCluster相比,我们提出的基于HDC的聚类算法可以实现更好的准确性,更健壮的性能,更少的迭代和更少的执行时间。基于相似性的亲和力提出优于八个数据集上的其他三种基于HDC的聚类算法,而聚类准确性则高于2%约38%。(ii)即使对于一通聚类,即没有群集高量向量的任何迭代更新,我们提出的算法也可以提供比HDClter更强大的聚类精度。(iii)在八个数据集上,当八分之一的数据集投影到高维空间上时,八分之一可以达到更高或可比的精度。传统聚类比HDC更可取,当时簇数k的数量很大。
摘要:在当代社会中,生成AI(Genai)渗透日常生活的快速发展,学校必须跟上发展的发展。未来后代具有Genai技能和知识,就像传统扫盲是当今的招聘条件一样。学校课程需要整合这项新技术,以支持学生的学习和发展。关于人工教育的研究(AIED)已报告了Genai参与教学和学习的挑战,也报告了Genai作为研究支持的挑战。不落后于许多学校,就开始采取AIED计划,这需要研究如何以有用的方式在教学活动中应用Genai。指导这项研究的研究问题是:在视觉形式中使用GAI可以如何支持学生在中学环境中的学习过程和动机?总体研究策略是一种定性案例研究方法,研究员三角剖分。数据是在研讨会会议和半结构访谈中的观察结果中收集的。与老师和学生一起。在六步归纳性主题分析中,编码数据摘录,汇总到类别并提出。的发现表明,用于产生图像的Genai工具可以对学习产生积极影响。同时支持信息的记忆,对动机和学生满意度也产生了积极影响。图像生成工具的参与不是替代品,而是对传统教学活动的补充。结论是,在教育中使用AI可以提供新的学习机会,并且随着Genai的使用越来越多,对于学生和老师的步伐至关重要。但是,这将需要更多的时间和资源来为AIED的教师专业发展。
Number of Publications Included Publications Proprioception and Body Schema Illusions 8 (8.89%) - Rubber Hand Illusion 3 (3.33%) [ 3 , 26 , 100 ] - Virtual Hand Illusion 3 (3.33%) [ 80 , 105 , 117 ] - Other 2 (2.22%) [ 94 , 124 ] Phantom Sensations 24 (26.67%) - On-Body 11 (12.22%) [ 22 , 25 , 31 ,52,56,61,79,79,81,93,103,119] 139 , 145 ] Geometry Illusions 9 (10.00%) - Shape Illusion 5 (5.56%) [ 7 , 8 , 12 , 21 , 133 ] - Size Illusion 4 (4.44%) [ 6 , 11 , 132 , 147 ] Weight Illusions 17 (18.89%) - Size-Weight Illusion 3 (3.33%) [ 43 , 82 , 116 ] - Visual simulation of moving objects inside 2 (2.22%) [ 55 , 146 ] - Asymmetric oscillation 2 (2.22%) [ 1 , 128 ] - Control-display ratio 5 (5.56%) [ 58 , 92 , 108 , 112 , 115 ] - Other 5 (5.56%) [ 2 , 59 , 85 , 96 , 120 ] Stiffness Illusions 13 (14.44%) - Visual texture deformation 4 (4.44%) [ 4 , 57 , 67 , 144 ] - Control-display ratio 2 (2.22%) [ 20 , 141 ] - Simulated deformation sounds 2 (2.22%) [ 69 , 134 ] - Friction grain model 4 (4.44%) [ 46 , 47 , 60 , 63 ] - Restricting Deformation 1 (1.11%) [ 129 ] Surface Texture Illusions 13 (14.44%) - Cursor representation 3 (3.33%) [ 71 , 72,87] - 滚动屏幕2(2.22%)[62,136] - 叠加的视觉/听觉纹理5(5.56%)[14,23,33,34,149] - 天鹅绒手幻觉2(2.22%)[101,148] [101,148] - manipulate velecity 1(1.11%) 113]环境错觉1(1.11%)[16]表1。在调查的出版物中发现的触觉幻觉的分布,首先由其针对的主要触觉财产分类。这些群体不构成全面的分类法,而是源自我们的编码数据中的群集。
由于开源软件包漏洞而引起的软件系统的复杂性日益增长,使软件漏洞检测成为关键的优先级。传统的脆弱性检测方法,包括静态,动态和混合方法,通常在高阳性速率和有限的效率方面挣扎。最近,基于图的神经网络(GNN)和变形金刚模型通过表示代码作为捕获语法和语义的图表来提高漏洞检测准确性。本文介绍了一个混合框架,结合了门控图神经网络(GGNN)和变压器编码器以利用多个图表表示:抽象语法树(AST),数据流程图(DFG),控制流程图(CFG)(CFG)和代码属性图(CPG)。GGNN提取图级特征,而变压器在图形编码数据中增强了顺序上下文理解。该模型使用这些功能来检测功能级代码段中的漏洞。评估我们在OWASP WebGoat数据集上的框架的评估证明了在五种主要漏洞类型中不同图形表示的有效性:命令注入,弱加密,路径遍历,SQL注入和跨站点脚本。实验结果表明,GGNN+CpG配置始终产生高度弱点的较高回忆,而GGNN+CFG在检测基于控制的基于控制的漏洞(例如命令注射)方面表现出色。这些发现突出了混合GNN-Transformer框架在增强网络安全应用程序的代码漏洞检测方面的潜力。GGNN和变压器模型的集成导致在所有漏洞类型中的准确性,精度,回忆和F1得分方面显着增强,每个图表表示对代码结构和脆弱性模式都有独特的见解。
摘要背景:我们开发了一个系统,可以自动对 Twitter 消息中对疫苗接种的态度进行分类,重点关注持消极态度的消息。这样的系统可以监控社交媒体上持续不断的消息流,从而提供切实可行的见解,了解公众对疫苗接种的犹豫态度。目前,这种监控是通过常规情绪分析进行的,在检测对疫苗接种的消极态度方面表现不佳。对于提到疫苗接种相关关键词的荷兰 Twitter 消息,我们注释了他们对疫苗接种的立场和感受(前提是他们提到了这个话题)。随后,我们使用这些编码数据来训练和测试不同的机器学习设置。为了最好地识别对疫苗接种持消极态度的消息,我们比较了数据集大小增加、可靠性降低、要区分的类别数量增加以及分类算法不同的设置。结果:我们发现,使用严格和宽松标记数据与更细粒度标记相结合进行训练的支持向量机产生了最佳结果,F1 得分为 0.36,ROC 曲线下面积为 0.66,远远优于当前使用的情绪分析,后者产生了 F1 得分 0.25,ROC 曲线下面积为 0.57。我们还表明,我们的系统的召回率可以优化到 0.60,而精度几乎没有损失。结论:我们的研究结果表明,仅通过计算机系统进行立场预测是一项具有挑战性的任务。尽管如此,该模型在识别负面推文方面表现出足够的召回率,从而减少了查看消息的手动工作量。我们对系统的数据和行为的分析表明,需要一种方法,在该方法中,将使用更大的训练数据集与人机交互为系统提供有关其预测的反馈的环境相结合。
I。与合成和测序技术的发展一起,更多的研究组表明了体外DNA储存的潜力。参见例如[1],[2],[4],[5],[7],[13],[22],[23]。典型的DNA存储系统由三个组成部分组成:(1)包含编码数据的链的合成。在当前技术人员中,每个链都有数百万份,这些链的长度通常限制为250-300个核苷酸。 (2)存储合成DNA链的存储容器; (3)读取链的DNA测序仪,其中读取了测序计算机的输出序列。这种新颖的技术具有几种与数字同行根本不同的属性,而最突出的技术是错误的副本以无序的方式存储在存储容器中(请参见例如[12])。克服这一挑战的最常见解决方案是使用作为链的一部分存储的索引。相对于所有其他链,将每条链带有一些指示链的位置的核苷酸。这些索引通常使用错误校正代码(ECC)[2],[4],[11],[13],[22]保护这些指数。输入信息的检索通常由以下三个步骤完成。第一步是将所有读取分为簇中,以使每个群集的读取都是相同信息链的所有嘈杂副本。我们的观点第二步在每个群集上应用了重建算法,以检索原始输入链的近似值。在最后一步中,用于纠正其余错误并检索用户的信息。虽然以前的作品独立解决了每个步骤(例如,请参见[1],[2],[4],[13],[20],[22]),这项工作旨在将它们全部解决。这是通过限制DNA存储系统中的存储消息来完成的,因此对于任何两个输入消息,所有可能的输出的集合将是相互脱节的。我们称此代码为DNA校正代码。
章节摘要您已收集数据。现在您将如何处理收集的一大堆信息?就像先前的步骤一样,数据分析涉及您需要做出的一系列决策。本章介绍了使用定量研究收集的数据。总结和组织数据涉及四个步骤:1。确定要包含并将其排除在您的报告中的数据。2。选择汇总原始数据的类别。3。编码数据根据所选类别进行分类。4。以汇总形式介绍数据,有助于得出结论。数据可以通过许多不同的方式进行分类和汇总,包括表,图表和图表。应变表(盘列表)描述了两个变量的值之间的关系。条形图和饼图是显示汇总数据的另外两种手段。这两个从视觉上描述了有多少/许多事物。通过将测量的每个实例指向由图的两个轴定义的网格,产生一个散点图。沿着单位标记的两条线称为轴,它们之间的空间由由从每个单位点沿两个轴从每个单位点绘制的相交线形成的网格定义。构造散点图的第一步是决定要在每个轴上使用的单元的比例。的含义或平均值通常用于比较组并提供数据的摘要结果。(第225页)线图类似于一个散点图,除了连续点与线路连接,构成一个完整的线路连接所有数据点。您使用的表,图形和/或图表将取决于最适合显示或表示您数据的内容。关键术语条形图(直方图)自变量对变量变量的影响的视觉表示。该图显示为一系列沿X轴(水平轴)对齐的条。(p。228)交叉表量的定量研究中使用的术语,指的是创建一个表,其中包括一个自变量对一个因变量的影响。
背景:预计糖尿病前期和2型糖尿病(T2D)的指数增加的趋势预计将继续在全球范围内继续上升。体育活动可以帮助预防T2D以及疾病的进展和并发症。因此,我们需要为个人创造机会,以获取必要的知识和技能,以通过体育锻炼来自我管理慢性状况。eHealth是一种潜在的资源,可以促进自我管理并改善人口健康。但是,对用户对eHealth的看法在促进初级保健环境中的体育锻炼方面的研究有限。目的:本研究旨在探索糖尿病前和eHealth T2D的医疗保健专业人员和个人的观点,以促进初级保健的体育锻炼。方法:使用糖尿病前期或T2D的个体(四个组的14名参与者)和医疗保健专业人员(两组的10名参与者)之间的焦点小组讨论采用定性方法。讨论是音频记录和逐字抄录的。定性内容分析被归纳用于编码数据。结果:出现了三个主要类别:实用程序,采用过程和问责制。eHealth的实用性被描述为一种激励性,娱乐性和刺激性工具。每天的医疗测量和生活方式参数的注册被认为是增强自我管理技能的潜在资源。采用过程包括eHealth,以增加护理的可及性并个性化体育活动的支持。但是,参与者指出,数字技术可能只适合某些人,并且可能会增加医疗保健提供者的行政负担。问责制是指优化eHealth并确保数据完整性和安全性的知识和技能。结论:患有糖尿病前和T2D和医疗保健专业人员的人积极地观察了eHealth技术在初级保健中的整合以促进体育锻炼。建议使用个人指标,目标设定和社会支持来促进体育锻炼。这项研究确定了eHealth文盲,不平等,隐私,机密性以及对医疗保健专业人员的工作量增加,这是将eHealth整合到初级保健中时所关注的因素。据报道,有必要持续发展eHealth能力,以优化初级保健中eHealth技术的实施。据报道,有必要持续发展eHealth能力,以优化初级保健中eHealth技术的实施。
摘要背景:医疗创新带来了巨大的希望。然而,如果社会要实现医疗创新的成果并避免其陷阱,那么很可能需要在治理(法律、政策、道德)方面进行类似的创新。随着人工智能 (AI) 创新的快速发展,多个学科的学者都在表达对与健康相关的人工智能的担忧,这些担忧可能需要法律回应以确保必要的平衡。这些学术观点可能为最紧迫的挑战提供关键见解,这些挑战将有助于塑造和推动未来的监管改革。然而,据我们所知,目前还没有全面的文献总结来研究与健康相关的人工智能的法律问题。因此,我们旨在使用范围界定审查方法总结和绘制研究与健康相关的人工智能法律问题的文献。方法:范围界定审查框架由 Arksey 和 O'Malley (2005) 开发,并由 Levac 等人扩展。 (2010)和系统评价的首选报告项目和范围界定评价的荟萃分析扩展(PRISMA-ScR)指导了我们的协议制定。在与训练有素的图书管理员密切协商后,我们将开发一种高灵敏度的 MEDLINE(OVID)搜索方法,并使其适用于多个数据库,旨在全面捕捉法律、医学、护理、药学、其他医疗专业(如牙科、营养学)、公共卫生、计算机科学和工程学领域的文本。如果英语和法语记录探讨与健康相关的人工智能、描述或优先考虑与健康相关的人工智能中的法律问题或提出解决方案,并且是在 2012 年或以后发表的,则将包括在内。资格评估将在所有审查阶段独立进行,并重复进行。编码数据将按主题进行分析,并跨特定学科的文献进行分层。讨论:这项史无前例的范围审查将总结现有文献,审查、记录或优先考虑与健康相关的人工智能的法律问题,以推动法律和政策改革。审查还可能揭示特定学科的问题、优先事项以及针对这些问题的拟议解决方案。从而确定未来改革应重点关注的优先领域以及改革过程中利益相关者可用的监管选项。范围审查注册:该协议已提交给开放科学基金会注册数据库。请参阅 https://osf.io/zav7w。关键词:健康法、人工智能、机器学习、健康、范围审查
机器学习正在个人和人口层面使用,以支持风险分层、预测模型和诊断与治疗的决策支持。由于这些模型是根据现实世界的数据开发的,因此算法反映了当前和历史偏见,这些偏见可能会加剧种族和民族、性别认同、性取向、残疾、年龄、社会阶层和地理位置的不平等。此回应将重点关注 NIH 需要解决的数据和系统问题,以支持 AI/ML 公平研究。为了解决公平问题,NIH 需要多样化的数据来源,涵盖广泛的人口统计、社会经济和健康相关数据。这些应提供社会和经济背景以及心理社会风险因素,例如种族、年龄、性别、经济状况、既往病史、住房状况、临床接触内外的患者体验,以及充分代表人群多样性的数据。由于临床诊疗之外的数据不是以常规或标准化方式捕获的,因此在获取和管理这些高度复杂和敏感的数据方面存在重大挑战。强大的信息学方法包括:1)了解报告数据的当前状况,包括评估报告数据是否代表公平相关的努力,以及是否足以识别在这些数据上训练的算法中的偏见。2)确定和实施策略以提高现有数据的质量和完整性。这些应包括:a)持续的数据质量识别、解决和验证,以解决差距、不准确性和偏见;b)预先识别数据质量问题,以便快速分类到报告实体;c)统计估算措施以填补空白。3)跟踪这些策略的有效性以改进现有数据。4)识别新的数据来源。这些来源可能包括诊所层面的社会需求筛查、大型公共卫生队列(如国家健康和营养检查调查 (NHANES))和监测系统(如行为风险因素监测系统 (BRFSS))、大型研究队列研究(如美国国立卫生研究院的精准医学计划、我们所有人研究计划和国家 COVID 队列协作 (N3C))——它们整合了参与者从不同群体收集的数据源。其他潜在来源包括移动或遥感设备和在线地理编码数据,这些数据可能提供有关公平性的宝贵见解。5) 模型评估。虽然有不断发展的分析技术来评估和解释可能反映社会偏见的算法偏见,但开发、测试和使用这些模型的研究人员需要对意外结果保持敏感,并识别数据中和训练模型的专家中的偏见。社区参与和包括那些代表性不足的人(偏见最受影响的人)的观点是必不可少的一步。