即时重播和视频审查作为专业运动员培训过程的一部分,历史悠久。但是,法律发现性是在手术专业中采用基于视频的培训和评估的主要障碍。无缝的视频捕获和编辑也是一个主要障碍。在2000年代初期,大多数手术室都安装了光线照相机;但是,很快指出,使用该技术捕获的视频经常被外科医生的头部阻塞。因此,在手术室中使用光线摄像机时,错过操作最重要的方面并不少见。广泛采用的最低侵入性的经验已大大提高了手术期间手术工作流程的高质量,毫无开动的观点的可用性。因此,对于使用微创技术进行的手术程序,手术视频捕获和编辑已经显着增加。手术视频的可用性增加引发了人们对使用人工智能(AI)来分析外科视频的兴趣。1在2017年,约翰·霍普金斯(Johns Hopkins)的计算机视觉工程师发布了第一个公共数据集,以帮助推动AI潜在使用自动任务识别。数据集包含使用DA Vinci机器人的三个任务的同步视频和运动数据:缝合,针,传递和
摘要:使用高光谱图像(HSIS)的对象跟踪获得令人满意的结果,以区分具有相似颜色的对象。然而,当目标发生变形时,跟踪算法往往会失败。在本文中,提出了基于暹罗Pn的高光谱跟踪器来解决此问题。首先,基于遗传优化方法的频带选择方法设计用于快速降低HSI中信息的冗余。特别是选择了三个具有最高关节熵的条带。为了解决SiamRPN模型中模板中的信息随着时间的流逝而衰减的问题,从一般目标跟踪基准中对数据集进行了更新网络的培训,该基准可以获取有效的累积模板。使用光谱信息的累积模板的使用使跟踪变形目标更容易。此外,预先训练的SiamRPN的转移学习旨在为HSIS获得更好的模型。实验结果表明,提出的跟踪器可以在整个公共数据集中获得良好的跟踪结果,并且当目标变形在定性和定量上比较时,它比其他流行的跟踪器要好,从而达到57.5%的总体成功率,变形挑战率的成功率为70.8%。
人工智能 (AI) 是一种已融入人类生活的现象,技术与人类之间的这种共生关系将继续存在。AI 的一种用途是深度伪造。将 AI 用于深度伪造可以说是最具争议的话题之一,因为它引发了道德问题。深度伪造是经过令人信服的修改和操纵的图像或录音,以歪曲某人的行为或言论,而实际上他们并没有做或说。这些操纵在政治舞台上蓬勃发展,最近在色情行业中也是如此,其中女性的脸被蒙在其他身体上以产生视频幻觉,导致非自愿性形象虐待和其他伤害。毫不奇怪,深度伪造技术的恶意使用促使出台了《美国国防授权法案》(NDAA)等监管立法,以及最近批准的《数字服务法案》(DSA)修正案,将恶意深度伪造定为犯罪。学者、倡导者和受害者继续呼吁制定更具体、更严格的法律来规范深度伪造,并对不遵守规定的行为处以罚款。本文及时分析了作为一种基于图像的性虐待的深度伪造色情内容,以及法律对恶意使用深度伪造技术的立场。还讨论了《通用数据保护条例》下的数据保护问题,以及补救、控制和根除的政策建议和措施。关键词:人工智能、网络欺凌、深度伪造、数字媒体、道德、法律、图像处理、性虐待 介绍
尽管近年来,自发性知觉经络反应 (ASMR) 现象在墨西哥显著发展,但当地 YouTube 频道缺乏有效和持续的数字营销策略和战术,这反映在他们的赞助视频中,与最受欢迎的 YouTube ASMR 频道(基本上是英语频道)形成鲜明对比。在对 YouTube 进行详细审查后,本文对这两组进行了比较,并认为,只要进行一些改变,墨西哥 ASMR 创作者就可以从其他国家更受欢迎的创作者使用的营销策略中受益。通过这样做,墨西哥创作者可以乘上新兴的注意力经济浪潮,这种浪潮认为认知是一种可以货币化的商品。对这两组频道的分析发现,与更受欢迎的国际同行相比,墨西哥 ASMR 创作者往往表现出较低的制作质量、对基本营销概念的了解甚少,以及发布频率低于英语视频。这些发现将在覆盖率、相关性和共鸣的营销概念以及注意力经济结构下进行讨论。
摘要:大多数评估品牌 CSR 活动有效性的研究都集中在通过自我报告问卷收集数据的基础上得出结论。虽然这些研究为评估 CSR 沟通方法的有效性提供了见解,分析了所传达的信息、使用的沟通渠道以及信息接收者的显性大脑反应,但它们缺乏完全概括传达环境信息的问题的能力,因为它们没有考虑接收者的隐性大脑反应。因此,本研究旨在通过基于神经科学的评估,从接收者的隐性自我的角度研究与环境问题相关的 CSR 视频通信的有效性。为了检查隐性大脑感知,使用了脑电图 (EEG),并通过三个被确定为对人类行为影响最大的指标来分析收集的数据。这三个指标是情绪价、大脑参与度和认知负荷。这项研究针对希腊塞萨洛尼基的千禧一代进行,记录了他们对七个品牌商业视频的隐性大脑反应。这七个视频是针对环境问题的 CSR 活动的一部分。同时,收集了参与者的自我报告结果,以比较显性和隐性大脑反应。这项研究的主要发现之一是,显性和隐性大脑反应不同,以至于未来必须考虑 CSR 视频通信的大脑友好性,以确保成功。研究结果为未来有效的 CSR 通信的创建过程、概念化、设计和内容提供了见解,涉及环境问题。
我们研究了特定于视频的自动编码器,这些自动编码器允许人类用户探索,编辑和有效传输视频。先前的工作已经独立研究了这些问题(和子问题),并提出了不同的表述。在这项工作中,我们在特定视频的多个帧上训练一个简单的自动编码器(从头开始)。我们观察到:(1)通过视频特定的自动编码器捕获该视频的空间和时间属性所学的潜在代码; (2)自动编码器可以将样本外输入投影到特定于视频的歧管上。这两个属性允许我们使用一个学到的表示形式探索,编辑和有效地传输视频。对于例如,在潜在代码上的线性操作允许用户可视化视频的内容。关联视频的潜在代码和流动投影使用户可以进行所需的编辑。插值潜在代码和歧管投影允许在网络上传输稀疏的低分辨率框架。
摘要:执行功能障碍代表帕金森氏病(PD)中常见的非运动症状,对日常功能和生活质量产生了重大负面影响。因此,使用生态工具评估行政职能(EFS)至关重要。传统神经心理学测试的生态局限性导致虚拟现实和360◦基于环境的工具的使用增加,以评估现实生活中的EFS。这项研究旨在评估执行功能创新工具360◦(出口360°)的效率和可用性,这是一种基于360◦基于PD评估EFS的工具。25个患有PD和25个健康对照组(HC)的人将通过常规的神经心理学电池进行评估,并通过头部安装显示器交付360◦出口。出口360◦将显示出复杂性增加的国内场景和七个不同的子任务,并将收集口头反应,反应时间和生理数据。我们预计将判断出360◦将被判断为可用,引人入胜且具有挑战性。此外,我们希望找到高度收敛的(常规测试和出口360°)和诊断有效性(PD与HC的个体)。出口360的验证将允许采用快速,生态和有用的PD筛查工具,可能会改变诊所和患者的评估。
摘要:随着沉浸式计算设备的出现,自我中心感知迅速发展。人类注视预测是分析自我中心视频的一个重要问题,主要通过基于显着性的建模或高度监督的学习来解决。我们定量分析了监督深度学习模型在看不见的域外数据的自我中心注视预测任务中的泛化能力。我们发现它们的性能高度依赖于训练数据,并且仅限于训练注释中指定的域。在这项工作中,我们解决了在不使用任何训练数据的情况下联合预测人类注视点和自我中心视频时间分割的问题。我们引入了一个无监督的计算模型,该模型汲取了事件感知的认知心理学模型的灵感。我们使用 Grenander 的模式理论形式来表示时空特征,并将惊讶建模为预测注视点的机制。对两个公开数据集(GTEA 和 GTEA+ 数据集)的广泛评估表明,所提出的模型可以显著超越所有无监督基线和一些监督凝视预测基线。最后,我们表明该模型还可以对以自我为中心的视频进行时间分割,其性能可与更复杂、完全监督的深度学习基线相媲美。
科学顾问Maaike博士Maaike Pols博士从乌得勒支大学获得了细胞生物学博士学位,她参与了教学和研究。她在昆士兰州大学做了一个文档,然后在2017年加入Jove之前搬到伦敦担任F1000 Research的编辑,
在虚拟舞台上为人造角色制作动画需要精确描述身体和空间运动的所有细节以及要执行的动作,特别是在要求合理行为时。行为人工智能,即一种自动适应环境的角色动画机制,有助于减少工作量,但开发起来很困难。本文讨论了交互式培训视频的制作流程,该流程允许三个利益相关者——定义练习的教学设计师、从虚拟现实中拍摄人造角色视频片段的导演以及创建行为模型的开发团队——通过嵌套需求/实施/测试周期进行有效合作。良好的需求和适当的人工智能技术(通常是面向目标的编程和统计模型的混合)允许创建可用于许多练习的行为模型,从而与临时脚本相比大大降低成本。