摘要 — 从“互联网人工智能”时代到“具身人工智能”时代,出现了一种新兴的范式转变,人工智能算法和代理不再从主要来自互联网的图像、视频或文本数据集中学习。相反,他们通过与环境的互动从类似于人类的自我中心感知中进行学习。因此,对具身人工智能模拟器的需求大幅增长,以支持各种具身人工智能研究任务。对具身人工智能日益增长的兴趣有利于对通用人工智能 (AGI) 的更大追求,但目前还没有对这一领域的当代和全面的调查。本文旨在为具身人工智能领域提供百科全书式的调查,从其模拟器到其研究。通过评估我们提出的七个特征的九个当前具象人工智能模拟器,本文旨在了解模拟器在具象人工智能研究中的用途及其局限性。最后,本文调查了具象人工智能的三个主要研究任务——视觉探索、视觉导航和具象问答 (QA),涵盖了最先进的方法、评估指标和数据集。最后,通过调查该领域发现的新见解,本文将为任务模拟器的选择提供建议,并为该领域的未来方向提供建议。
目标:本文的主要目标是比较使用数字和模拟测力计在推/拉任务过程中测量的力,展示第一种设备的优势,并提出测量解释指南,特别关注从业者的需求。方法:本文包括比较模拟和数字测力计的可重复性以及使用 Borg CR-10 量表确定测量力和主观评价之间关系的程序。结果:给出了使用原始方法用数字测力计进行的测量示例,说明了优点和局限性。观察者间/观察者内验证测试证实了数字测力计优于模拟测力计。给出了测量数据和主观力评定之间的比较,并证实了良好的相关性。结论:结果证实,使用所提出的原始方法的数字测力计比模拟测力计产生更准确的信息。该方法可能对未来修订 ISO 标准有用。强调了未解决的问题以促进进一步的研究。关键词:推拉;风险评估;模拟和数字测力计;初始力和持续力; Borg-CR10 量表; ISO 11228-2
老龄驾驶员数量迅速增加,他们面临着因退化过程而导致的残疾,从而影响他们的驾驶表现。本研究的主要目的是确定老龄驾驶员的心理工作量,而第二个目的是比较老龄驾驶员和对照组的心理工作量。研究方法包括包含三个情境复杂度等级的道路实验性驾驶任务。对 30 名驾驶员进行了 NASA 任务负荷指数 (NASA-TLX) 和脑电图 (EEG) 测量。NASA-TLX 得分显示,在中等复杂情境和非常复杂情境中,老龄驾驶员的平均体力需求得分最高,分别为 37.25 和 43.50。同时,对于脑电信号的波动,结果表明情境复杂性对通道位置 FZPZ 和 O1O2 的 RPθ 和 RPα 有显著影响。在简单情况下,老龄司机和对照组的加权工作量得分存在显著差异,而所有通道位置的 RPθ 和 RPα 频段均无显著差异。这些发现将有助于设计师、制造商、开发商和政策制定者为老龄司机设计更好的驾驶环境。
描述标记标识位置(1)和设备(1)2概述与选定的人/动物实验相关的程序2确定与选定的人/动物实验1相关的过程1个次序4包括独立变量1包含相关变量1个次序1个总数2总数6个答案包括在实验室中的不同词,•使用不同的范围•不同的词/特殊的范围/不同的对象/一个不同的对象/投影/投影/投影/投影,一个/投影,一个/投影,一个/投影,一个/投影,一个/投影的范围/投影。图像/单词/食物在不同的视野内•自变量和因变量正确反映了选定的实验
RNA在将遗传指令转化为功能外的功能中起着关键作用,强调了其在生物过程和疾病机构中的重要性。尽管出现了许多深度学习方法,尤其是通用RNA语言模型,但仍缺乏标准化的基准来评估这些方法的有效性。在这项研究中,我们介绍了第一个全面的RNA基准标签(Be NCHM A RK用于任务和语言模型)。首先,Beacon构成了13项不同的任务,这些任务涵盖了结构分析,功能研究和工程应用的广泛工作,从而可以对各种RNA理解任务的方法进行全面评估。第二,我们检查了一系列模型,包括CNN等传统方法以及基于语言模型的高级RNA基础模型,为这些模型的特定任务性能提供了宝贵的见解。第三,我们研究了从令牌和位置编码方面的重要RNA语言模型组件。值得注意的是,我们的发现强调了单个核苷酸令牌化的优势以及与传统位置编码方法相比,用线性偏见(Alibi)抚养的有效性。基于这些见解,提出了一个简单而强大的基线,称为Beacon-B,可以通过有限的数据和计算资源来实现出色的性能。我们的基准标准的数据集和源代码可在https://github.com/terry-r123/rnabchhench上获得。
4.1可访问性:生成的AI工具以包容性,可访问性和公平性的方式用于残疾人和来自不同背景的人。4.2非歧视:使用生成AI工具最大程度地减少了对个人,社区或群体的机会和反驳,歧视。4.3学术完整性:在评估中使用时,生成的AI工具可以对学生的表现,技能和知识进行公平而公正的评估。4.4文化和知识产权:使用生成AI工具时,学校尊重各种文化群体的文化权利;特别是土著文化和知识产权(ICIP)权利。4.5版权:使用生成AI工具时,学校知道适用的版权权利和义务。
我们介绍了Florence-2,这是一个新型视觉基础模型,具有统一的,及时的代表,用于量级计算机视觉和视觉语言任务。在转移学习方面表现出色时,他们努力通过简单的说明执行各种任务,这意味着处理各种空间层次结构和语义粒度的复杂性。Florence-2旨在将文本推出作为任务说明,并以文本形式产生理想的结果,无论是限制,对象检测,接地还是分割。这种多任务学习设置需要大规模的高质量注释数据。为此,我们使用自动化图像注释和改进的迭代策略,共同开发了1.26亿张图像的FLD-5B。我们采用了一个序列结构,以训练佛罗伦萨-2,以执行多功能和全面的视觉任务。对众多任务的广泛评估表明,佛罗伦萨-2是具有未曾预性零击和微调功能的强大愿景基础模型竞争者。
摘要 - 人工智能(AI)的遗留进展很大程度上是通过缩放来推动的。在机器人技术中,由于缺乏对大型机器人数据集的访问而阻碍了缩放。我们提倡使用现实的物理模拟作为机器人学习方法扩展环境,任务和数据集的一种手段。我们提出了Robocasa,这是一个大规模的模拟框架,用于在日常环境中培训通用机器人。Robocasa以厨房环境为重点的现实和多样化的场景。我们提供了150多种对象类别以及数十个可相互作用的家具和设备的数千个3D资产。我们使用生成的AI工具来丰富模拟的现实性和多样性,例如文本到3D模型的对象资产以及来自文本图像模型的环境纹理。我们设计了一组100个用于系统评估的任务,包括大型语言模型指导产生的复合任务。为了促进学习,我们提供了高质量的人类示范,并整合自动轨迹生成方法,以实质上扩大我们的数据集的人类负担最小。我们的实验显示了使用合成生成的机器人数据进行大规模模仿学习的明确缩放趋势,并在利用现实世界任务中的仿真数据方面显示出巨大的希望。视频和开源代码可在项目网站上找到。
如果 Σ i 中存在点 qi ,而 Σ j 中存在点 qj ,使得存在从 qi 到 qj ,或从 qj 到
多模式的大型语言模型(LLMS)在大量数据集中受过培训的多模型在许多情况下变得越来越有能力。但是,此类模型的capabilies通常在狭窄的任务中进行评估,就像标准的机器学习模型接受了针对特定目标的训练一样。,我们通过将最新的LLM代理通过其步调进行一般任务来解决不同的策略,以解决三个受欢迎的游戏 - Wordle,Face Quiz和Flashback。这些游戏很容易被人类解决,但他们要求一定程度的自我意识和更高层次的能力来实验,从错误中学习并计划。我们发现LLM代理在这些一般任务中表现出不同的性能。他们缺乏从错误和自我纠正能力中学习的意识。llms在最复杂的认知子任务中的性能可能不是其在现实世界环境中部署的限制因素。相反,重要的是要通过包含多个齿轮任务的一般测试来评估吸气LLM的功能,从而使它们能够解决完整的现实世界应用。