表 7 列出了本研究中考虑的细节类型。根据要考虑的复杂程度,列表可能会更长或更短。决定采用此特定列表是因为它与 TSCF [3] 使用的列表非常接近。在制定此列表时,考虑因素之一是该列表必须与本项目疲劳部分使用的列表兼容。该研究使用的细节列表比此处使用的列表更为详尽。例如,不包括任何类型的支架,也不包括一些细节,例如中心线大梁。人们认为,细节列表越大意味着自由度的大幅增加意味着每次分析的样本量减少,从而降低了对结果的信心。由于腐蚀的可变性,在这种类型的研究中,重要的是获得尽可能大的样本量,以便任何统计数据都能准确反映现实。选择 TSCF 基本细节列表作为基础,既能满足简要概括的要求,又能与疲劳研究兼容。
实验或随机对照试验 (RCT) * 被认为是最可靠的评估方法。通过在符合条件的受益者中随机分配干预措施,分配过程本身会创建可比较的治疗组和对照组,这些组在样本量适当的情况下在统计上是等同的。
• 系统使用哪种数据进行训练?• 训练数据的来源是什么?• 标签/基本事实是如何产生的?• 训练数据的样本量是多少?• 系统不使用哪些数据集?• 数据的潜在局限性/偏差是什么?• 训练数据的大小、比例或分布如何?
表1:欧几里得距离与自我监督公制学习的距离之间的性能比较。d是数据的维度,k是因子的数量,s是下游任务中的样本量,σ2测量不同视图的变化,λ测量样本差异的变化,µ是类之间的预期差异。
表1:确定巨大食肉动物活性受气温控制的程度的模型选择结果。最佳拟合模型是通过校正小样本量(AICC)的Akaike的信息标准来识别的。所有模型均包含围绕单个巨型武术的随机截距。参数值显示在logit量表上。
将复杂的人类行为形式化的计算模型有助于研究和理解此类行为。然而,收集估计此类模型参数所需的行为数据通常非常繁琐且耗费资源。因此,作为数据收集规划的一部分,估计数据集大小(也称为样本量确定)对于减少行为数据收集的时间和精力,同时保持对模型参数的准确估计非常重要。在本文中,我们针对特定的人类行为逆向强化学习 (IRL) 模型提出了一种基于不确定性量化 (UQ) 的样本量确定方法,分为两种情况:(1) 事前实验设计——在收集任何数据之前的规划阶段进行,以指导估计要收集多少样本;(2) 事后数据集分析——在收集数据后进行,以确定现有数据集是否具有足够的样本以及是否需要更多数据。我们在实验中用具有以下特征的人的真实行为模型验证了我们的方法:
框A。内部一致性是否?1的比例包括效应指标,即是基于反射模型吗?x设计要求是不是吗?2是丢失物品的百分比吗?x 3是否有关于如何处理丢失物品的描述?x 4内部一致性分析中的样本量是否足够?x 5是检查比例的单维性吗?即是因素分析还是应用IRT X模型?6中的样本量是否包含在单维性分析中?x 7是分别计算出每个(一维)(sub)比例x的内部一致性统计量?8研究的设计或方法中是否有重要缺陷?x统计方法是否是经典测试理论(CTT)的NA 9:Cronbach的Alpha是否计算出来?x 10的二分法得分:Cronbach的Alpha还是KR-20计算的?x 11 for irt:在全球级别上是否有拟合统计量的优点?例如χ2,可靠性x估计潜在特征值的系数((主题或项目)分离索引)
在MAIC进行调整后,ELRA和TEC之间选择了选定的钥匙基线特征。对于除OS以外的所有端点,在基本情况下,ELRA的匹配后有效样本量(ESS)为75,在灵敏度分析中为89。对于OS,ESS分别为73和87。与TEC相比,Elra为
ibm1:您如何对这些类型的AI进行熟练程度和专业经验?样本量:数据科学家= 39N,应用开发人员= 37N,系统开发人员= 52N,AI开发人员= 82N,ML Engineer = 46n,软件工程师= 277N,软件开发人员= 273N,AI工程师= 95n,IT工程师= 162n注意:
ibm1:您如何对这些类型的AI进行熟练程度和专业经验?样本量:数据科学家= 39N,应用开发人员= 37N,系统开发人员= 52N,AI开发人员= 82N,ML Engineer = 46n,软件工程师= 277N,软件开发人员= 273N,AI工程师= 95n,IT工程师= 162n注意: