摘要。视频时间基础旨在确定与给定自然语言查询最相关的未修剪视频中的视频片段。现有的视频时间本地化模型依靠特定的数据集进行培训,数据收集成本很高,但在跨数据库和分发(OOD)设置下表现出较差的概括能力。在本文中,我们提出了一种降雨,以利用预先训练的大型模型的能力,从而利用了EDEO T EMPORAL G圆形(TFVTG)方法。天真的基准是在视频中列举建议,并使用预先训练的视觉语言模型(VLM)根据视觉语言对齐来选择最佳建议。然而,大多数Exting VLM都经过图像文本对或修剪的视频剪辑对训练,这使得(1)抓住关系并区分同一视频中多个事件的时间边界; (2)在视频中理解并敏感事件的动态过渡(从一个事件到另一个事件的过渡)。要解决这些问题,首先,我们建议利用大型语言模型(LLMS)分析查询文本中包含的多个子事件,并分析这些事件之间的时间顺序和关系。其次,我们将一个子事件分为动态过渡和静态状态部分,并使用VLMS提出动态和静态评分功能,以更好地评估事件和描述之间的相关性。代码可在https://github.com/minghangz/tfvtg上找到。最后,对于LLMS提供的每个子事件描述,我们使用VLMS定位与描述最相关的TOP-K提案,并利用LLMS提供的子事件的OR-DER和关系来过滤和集成这些建议。我们的方法在Charades-STA和ActivityNet字幕数据集上的零照片视频基础上实现了最佳性能,而无需进行任何培训,并在跨数据库和OOD设置中展示了更好的通用功能。
在深入挑战之前,我们希望确保女童子军首先了解什么是云技术。对于此活动,如果您有白板或图纸,最好创建一个视觉效果来配合。我们创建了一个示例,您可以在最后的资源部分找到它。说:有人在连接到互联网的手机或平板电脑上使用任何应用程序吗?那些应用程序是什么?在旁边创建一个简短的列表。你应该得到像 Netflix、Disney Plus、TikTok、Instagram、Amazon、Door Dash、Uber 这样的答案……说:太好了,你列出的所有这些应用程序都使用云技术来运行。有人知道云是什么吗?等待答案。想象互联网是天空中一朵巨大的隐形云。它就像存储您所有喜爱的应用程序、网站和文件的地方。现在,云技术就像是一种神奇的方式来使用和存储这片云上的东西。数据中心是存储允许云技术工作的设备的大型建筑物。就像您需要一部手机来操作应用程序一样 - 我们需要数据中心来操作云。说:那么,让我们以 Instagram 这样的应用程序为例。我们想在那里存储什么类型的东西,或者我们要把什么数据放入应用程序中?等待答案并列出清单。(图片、标题、评论、故事、喜欢)太好了,现在如果这只是一个存储站点,那么这个云就像一个虚拟背包,携带着我们所有的数字文件,只要有互联网连接,我们就可以在任何地点访问这些文件。说:但这更复杂吧?你认为它与存储驱动器有何不同?等待答案。当我们将云用于应用程序或游戏时,云技术使您可以通过计算机、手机或平板电脑访问它们。没有云,大多数应用程序和游戏都无法运行。所以,把云想象成互联网上的一个地方,我们可以随时随地存储和访问东西(比如照片、视频或游戏)。
标题:标题标明了主题、主题或作者的论点或论据。想想标题。你已经知道了什么?将标题变成一个问题,你可以在阅读时寻找答案。 标题:标题是进入章节或选集每个部分的门户。像标题一样,它们可以变成问题,让你有理由阅读该部分文本。当你根据标题提出问题时,试着将它与标题联系起来。还要注意副标题。它们通常可以提供你从标题中提出的问题的答案。 介绍:章节的介绍可以通过提供重要的背景信息来让你了解某个主题。一定要读它。如果你正在阅读一个部分,请阅读第一段以了解将要讨论的内容。 每个段落的每个第一句话:教科书段落的第一句话通常是段落的主题句或主要思想。因此,通过阅读它们,你将获得大量有关该主题的信息。你还会遇到没有标题的选段,所以段落的第一句话是你进入内容的入口。它们会帮助你预测作者将要讨论的内容。 词汇: 你正在阅读的学科的语言可能是新的和不熟悉的,所以每次阅读时都要准备好增加你的词汇量。如果你提前花点时间看看新单词,这将有助于你在阅读时更顺利地浏览选段。 注意那些单词,它们通常在章节开头、文本中以粗体显示、写在页边空白处或在结尾处进行回顾,并附有定义。突出显示这些单词。大声朗读。阅读它们的定义。 视觉效果: 教科书提供图片或视觉效果来解释和说明所教的内容,因此请务必在阅读文本之前查看它们。阅读说明、标题、描述和关键点。许多人在“看到”一个想法的视觉呈现时能最好地记住和理解。常见的视觉材料包括:照片、绘画、图形、数字、图表、卡通和地图。
我很荣幸站在你们面前,参加我作为主席的第一次年度股东大会。AI-Media 在 2024 财年经历了另一个重要的转型年。自 2021 年 5 月收购总部位于纽约的 EEG 以来,我们已成功转型传统的人力服务业务,为全球多样化的客户提供一套人工智能驱动的技术解决方案。这一转变使我们能够深化和拓宽我们的客户群,扩展到新的领域和细分市场,并过渡到更多经常性、更高利润的收入,同时提高服务质量和客户满意度。从 FY23 到 FY24,总收入增长 7% 至 6620 万美元,息税折旧摊销前利润 (EBITDA) 增长 24% 至 410 万美元。在 FY24,技术销售收入为 3290 万美元,较上年增长 37%,首次超过我们总收入的 50%。随着我们继续推动技术产品的普及,我们仍致力于增加技术收入,并计划到 2025 年 12 月使这一部分占总收入的 80% 以上。24 财年技术销售的增长主要得益于 LEXI 3.0 在 2023 年 5 月的成功推出。LEXI 3.0 是我们旗舰实时自动字幕解决方案的全新改进版本,它利用了人工智能领域的最新创新。LEXI 3.0 提供的结果可与人工字幕相媲美,但成本仅为其一小部分。24 财年,人工智能首次提供比人类更好的质量(快三秒),LEXI 的准确性和质量现已超越人工字幕。在 24 财年,我们很高兴扩大和多样化我们的收入组合和客户群,包括体育版权持有者、地方、州和联邦政府以及越来越多的大型企业和大学。为了继续扩大我们的技术销售和 iCap 网络,我们通过增加参加主要行业展会的机会来增强我们的全球影响力,并建立了新的战略分销合作伙伴关系。这些举措使我们在 2024 财年赢得了大量新合同并续签合同,并为 2025 财年的强劲销售渠道做出了贡献。
为社会工作者提供了跟踪客户进步的实用方法。独特的系列的一部分,该系列可帮助高级学生将核心能力应用于专业领域。本书显示了如何利用跟踪进度的反馈来帮助客户实现目标。它重点介绍社会工作者在各种环境中提供的直接服务,包括学校和医疗保健设施。文本使用现实世界的示例来展示概念并突出社会工作者遇到的客户的多样性。此信息对于心理学家,辅导员和治疗师等其他医疗保健专业人员也很有用。在本书结束时,读者应该能够:帮助客户根据进度跟踪做出明智的决定;分析和解释客户的进度;认识到系统进步跟踪对社会工作者的重要性;并确定影响数据质量的潜在问题。本文提供了《基于结果的证据实践》一书的概述,这是核心竞争力系列的一部分。本书提供了衡量和监控客户进度的实用方法,帮助社会工作者量身定制干预措施以实现预期的结果。关键特征包括案例示例,不同的现实世界上下文以及影响数据质量的测量问题的报道。Terri Combs-orme博士是田纳西大学社会工作学院的著名教授,得克萨斯大学阿灵顿大学和圣路易斯华盛顿大学的学术背景很强。她在顶级社会工作,公共卫生和医学期刊上发表了许多文章。在加入田纳西大学教职员工之前,她在包括路易斯安那州立大学,马里兰大学和约翰·霍普金斯大学等几个尊敬的机构任教。Combs-orme博士的教学专业知识涵盖了寿命的发展,并在各个程度上撰写了批判性文献评论。她的研究兴趣在于婴儿的脑发育和育儿,她是田纳西州孟菲斯城市儿童研究所的来访者。她的最新书籍与约翰·奥尔姆(John Orme)合着,“与离散变量的多元回归”提供了有关测量和监视客户进度的实用指导。这种综合资源是Advancunity Core Captions系列的一部分,该系列为学生提供技能,以在专业领域应用CSWE的核心竞争力。该书强调了为向客户提供直接服务的社会工作者,包括临床环境,学校,医疗保健设施和其他社会服务机构的服务的“基于结果的循证实践”。通过使用现实世界的案例示例,Combs-orme博士帮助读者发展基本技能,例如图形,分析和解释客户的进步,以及识别影响数据质量的测量问题。本文对于心理学,精神病学,咨询,护理,物理治疗,职业治疗和其他相关领域的专业人员特别有价值。完成本书后,读者应该能够应用其知识,以帮助客户通过测量和监视进度,相应地修改干预措施以及系统地定期跟踪结果来帮助客户做出明智的决策。结果知情的基于证据的实践提高了核心能力。未经结果的循证实践PDF免费。结果知情的基于证据的实践。是基于证据的实践。基于循证的循证实践PDF。什么是证据知情的实践。基于证据的结果。借用结果知情的基于证据的实践。
2024年8月Anavi:使用室内室内视觉效果进行导航的音频噪声意识。Vidhi Jain,Rishi Veerapanini,Yonatan Bisk。在德国慕尼黑的机器人学习会议(CORL)会议上接受。纸|网站2024年3月FlexCap:在图像中生成丰富,本地化和灵活的字幕。Debidatta Dwibedi,Vidhi Jain,Jonathan Tompson,Andrew Zisserman,Yusuf Aytar。在加拿大温哥华的神经信息处理系统(Neurips)的会议上接受。纸|网站2024年1月VID2ROBOT:端到端的视频条件策略学习,跨注意变形金刚。Vidhi Jain , Maria Attarian, Nikhil J Joshi, Ayzaan Wahid, Danny Driess, Quan Vuong, Pannag R Sanketi, Pierre Sermanet, Stefan Welker, Christine Chan, Igor Gilitschenski, Yonatan Bisk, Debidatta Dwibedi, In Proceedings of Robotics: Science and Systems (RSS) 2024年,荷兰代尔夫特。纸|网站|视频2023年11月,如何提示您的机器人:用代码作为政策的操纵技巧的促进书。Montserrat Gonzalez Arenas, Ted Xiao, Sumeet Singh, Vidhi Jain , Allen Z. Ren, Quan Vuong, Jake Varley, Alexander Herzog, Isabel Leal, Sean Kirmani, Dorsa Sadigh, Vikas Sindhwani, Kanishka Rao, Jacky Liang, Andy Zeng.在国际机器人与自动化国际会议上(ICRA)2024年,日本横滨。2023年11月的纸张开放X-设备:机器人学习数据集和RT-X模型。开放X-授权协作。在国际机器人与自动化国际会议上(ICRA)2024年,日本横滨。(最佳纸)纸|网站2023年6月,巴掌:空间关注政策。Priyam Parasher,Vidhi Jain,Xiaohan Zhang,Jay Vakil,Sam Powers,Yonatan Bisk,Chris Paxton。在美国亚特兰大的机器人学习会议论文集(CORL)2023年,论文|网站2023年6月:荷马植物:开放式摄影库移动操作。Sriram Yenamandra, Arun Ramachandran, Karmesh Yadav, Austin S Wang, Mukul Khanna, Theophile Gervet, Tsung-Yen Yang, Vidhi Jain , Alexander Clegg, John M Turner, Zsolt Kira, Manolis Savva, Angel X Chang, Devendra Singh Chaplot, Dhruv Batra, Roozbeh Mottaghi,Yonatan Bisk,Chris Paxton。在美国亚特兰大的机器人学习会议论文集(CORL)2023年。纸|网站|竞赛 @ Neurips 2023 2022年12月,变压器是适应性的任务计划者。Vidhi Jain,Yixin Lin,Eric Undersander,Yonatan Bisk,Akshara Rai。在新西兰奥克兰2022年机器人学习会议论文集(CORL)。纸|网站|视频|代码
摘要:人工智能(AI)是制造智能机器,尤其是智能计算机程序的科学和工程。医疗保健中的AI并不是什么新鲜事;实际上,目前,它以许多与护士和护理教育有关的护士相关的方式使用。它包括许多改变护士角色并增强患者护理的医疗技术。它减轻了护士的负担,减少了护士的工作量。道德原则在AI中很重要,因为该技术不仅可能影响单个患者的最终结果,而且可能会影响其在整个开发设计和测试过程中的医疗保健中的用途及其整合和持续使用。护理AI工具包括临床决策支持,移动健康和基于传感器的技术,包括语音助手和机器人技术。护士应参与AI的概念化,发展和实施,尤其是在影响护理实践的情况下。关键字:人工智能,护理,医疗保健,实践,教育1。简介什么是人工智能?当我们想到人工智能或人工智能时,可能会像我们想到很多事情一样 - “ AI表示机器人”或“ AI技术是新的??”或“ AI工具帮助_and_hurt患者护理”或“ AI可以替代护士??”等等AI已经是我们日常生活的一部分,我们一直以某种方式使用它来使我们的工作更轻松。和医疗保健世界没有什么不同。护理中的人工智能只是产生其全部影响的悬崖。智能家居设备,移动地图应用程序,Siri,Alexa,Google Assistant,在线银行业务,行为改变应用程序等语音助手以及无数其他内容需要以某种方式使用AI。人工智能或AI是计算机系统的开发,该系统能够执行通常需要人类智能的任务,例如决策,对象检测,解决复杂问题等。AI可以分为两个主要子场:机器学习(ML)和深度学习。机器学习专注于通过获取新数据来提高技术的性能。深度学习使用人工神经网络 - 经过人工训练的算法 - 模仿人脑从大量数据中学习以执行任务的方式。例如:在YouTube上自动生成的字幕,并在数字照片库中解锁电话或分组照片。AI John McCarthy的历史,也称为AI的父亲,在1956年创造了人工智能一词。 尽管AI技术已经以某种形式存在多年,但其在护理教育和实践中的充分利用。 帮助护理教育与AI扩展保持同步,护士保持高级AI John McCarthy的历史,也称为AI的父亲,在1956年创造了人工智能一词。尽管AI技术已经以某种形式存在多年,但其在护理教育和实践中的充分利用。帮助护理教育与AI扩展保持同步,护士保持高级
脚注和作者评论:将脚注放在页面底部,而不是放在正文末尾作为尾注。在整篇文章中连续编号。不要在文章标题后的作者姓名后放置脚注编号或星号。编号脚注只能在正文中使用。作者评论应放在第一页底部的规则下,不带脚注编号、星号或其他符号。间距:文本应为单倍行距,包括块引用、脚注、说明、图例和长标题,它们应为单倍行距,项目之间留有空格。标点符号后仅使用一个空格。字体和大小:所有稿件应为 Times New Roman 字体。副标题应为 12 号粗体。正文、标题和副标题使用 12 号字体。一级标题应左对齐,并采用粗体。二级标题应左对齐,并采用粗体斜体。脚注、作者评论以及所有来源和注释信息应使用 10 号字体,并直接放在表格和图片下方。表格和图片:表格和图片应正确引用,且所有方面必须清晰易读。请勿使用任何粗体字体。标题应位于表格和图片上方的中央。拼写和引用:出于标准化目的,引用遵循兰登书屋韦氏 Una-bridged 词典和芝加哥格式手册:Th
[2] Hsiang-fu Yu,Cho-Jui Hsieh,Kai-Wei Chang和Chih-Jen Lin,当数据无法填充记忆中时,大型线性分类,第16届ACM SIGKDD国际知识发现与数据挖掘和数据挖掘的国际会议(KDD 2010)(KDD 2010),最佳研究论文,最佳研究论文,最佳研究论文。[3] Liunian Harold Li, Pengchuan Zhang, Haotian Zhang, Jianwei Yang, Chunyuan Li, Yiwu Zhong, Lijuan Wang, Lu Yuan, Lei Zhang, Jenq-Neng Hwang, Kai-Wei Chang , and Jianfeng Gao, Grounded Language-Image Pre-training, the Computer Vision and Pattern Recognition Conference (CVPR 2022)。最佳纸决赛入围者,在8161个提交中,有33名,最高0.4%[4] Kuan-Hao Huang,Varun Iyer,I.-Hung Hsu,Anoop Kumar,Kai-Wei Chang和Aram Galstyan。“ Paraamr:AMR反翻译的大规模句法释义数据集。”在计算语言学协会年度会议中(ACL 2023)。区域椅子奖(语义曲目中的顶纸)[5] Nikil Roashan Selvam,Sunipa Dev,Daniel Khashabi,Tushar Khot和Kai-Wei Chang。“尾巴摇晃狗:社会偏见基准的数据集建筑偏见。”在计算语言学协会年会(ACL Short)的年度会议中,2023年。杰出纸奖[6] Hritik Bansal,Yonatan Bitton,Idan Szpektor,Kai-Wei Chang和Aditya Grover。videocon:通过对比标题进行稳健的视频语言对齐。在计算机视觉和模式识别会议上(CVPR,2024)。在ICLR研讨会上有关基础模型数据问题的最佳纸张奖。[7] Pan Lu,Hritik Bansal,Tony Xia,Jiacheng Liu,Chunyuan Li,Hannaneh Hajishirzi,Hao Cheng,Kai-Wei Chang,Michel Galley和Jianfeng Gao。MathVista:评估视觉上下文中基础模型的数学推理。在国际学习表征会议上(ICLR,2024)。被选为口头(7,000份提交中的85个,前1.2%)[8] Hritik Bansal,Nishad Singhi,Yu Yang,Fan Yin,Aditya Grover和Kai-Wei Chang。“ CleanClip:减轻多模式对比学习中的数据中毒攻击。”在国际计算机愿景会议上(ICCV,2023)。为口头选择(在8088个意见中,有195个,前2.5%),ICLR的最佳纸张奖,涉及可信赖和可靠的大型机器学习模型。[9] Tao Meng,Sidi Lu,Nanyun Peng和Kai-Wei Chang。在神经信息处理系统中具有神经化甲骨文的可控文本生成(Neurips 2022)。被选为口头,201311年中有201名最高1.9%[10]洪川张,liunian Harold Li,Tao Meng,Kai-Wei Chang和Guy van den Broeck。“关于从数据中进行推理的悖论。”在人工智能国际联合会议中(IJCAI 2023)。ijcai-23中的前3个引用的论文[11] Sheng Shen,Liunian Harold Li,Hao Tan,Mohit Bansal,Anna Rohrbach,Kai-Wei Chang,Zhewei Yao和Kurt Keutz,Keurt Keutz,剪辑可以剪辑多少愿望和语言?国际学习代表会议(ICLR 2022)。iClr-22 [12] W. Ahmad,S。Chakraborty,B。Ray,K.-W。张。旨在进行程序理解和生成的预先培训。计算语言学协会北美分会(NAACL 2021),NAACL-21的前3个引用论文。太阳。[13] Z. Hu,Y。Dong,K。Wang,K.-W。 Chang和Y。gpt-gnn:图神经网络的生成预训练。ACM SIGKDD国际知识发现与数据挖掘会议(KDD 2020),在KDD-20的前10名引用论文。[14] M. Alzantot,Y。Sharma,A。Elgohary,B.-J。HO,M。Srivastava,K.-W。张。 生成自然语言对抗性示例。 自然语言经验方法会议HO,M。Srivastava,K.-W。张。生成自然语言对抗性示例。自然语言经验方法会议
不受位置变化的影响。生物控制论,36(4),193-202。 https://doi.org/10.1007/BF 00344251 Goodfellow, I.、Bengio, Y. 和 Courville, A. (2016)。深度学习。麻省理工学院出版社。 (Schmidt、I. Schiffman、Y. Schaefer、A. 化学工程师和仪器仪表(2018)Graves、A.、Wayne、G. 和 Danihelka、I.(2014)。神经图灵机。 arXiv。 Ha, D. 和 Schmidhuber, J. (2018)。世界模特。 arXiv。 https://arxiv.org/abs/1803.10122 Han, K., Wang, Y., Chen, H., Chen, X., Guo, J., Liu, Z., Tang, Y., Xiao, A., Xu, C., Xu, Y., Yang, Z., Zhang, Y., & Tao, D. (2020 年)。关于视觉变压器的调查。 arXiv。 https://arxiv.org/abs/2012.12556 Higgins, I., Amos, D., Pfau, D., Racaniere, S., Matthey, L., Rezende, D., 和 Lerchner, A. (2018)。迈向解开表征的定义。 arXiv。 https://archiv. org/abs/1812.02230 美国国立卫生研究院(AI)(2020 年)。 2020 年人工智能市场:5 年历史的人工智能创新和 5 年历史的临床试验 LeCun, Y., Bengio, Y., & Hinton, G. (2015 年)。深度学习。自然,521,436-444。 http://dx.doi.org/10.1038/nature 14539 Mansimov, E., Parisotto, E., Ba, JL 和 Salakhutdinov, R. (2015)。利用注意力机制根据标题生成图像。 arXiv。 https://archiv.org/abs/1511.02793 纽约(2015 年)。 我的一位朋友是角川家族的成员(2016年)(2016年)。 http://dx.doi.org/10.1037/0033-295X.101.1.13 McCulloch, WS 和 Pitts, W. (1943)。神经活动中蕴含的观念的逻辑演算。数学生物物理公报,5(4),115-133。 https://doi.org/10.1007/BF02478259 Nakkiran, P.、Kaplun, G.、Bansal, Y.、Yang, T.、Barak, B. 和 Sutskever, I. (2019)。深度双重下降:更大的模型和更多的数据会带来危害。 arXiv。 https://arxiv.org/abs/ 1912.02292 Perez, J.、Marinkovic, J. 和 Barcelo, P.(2019 年 5 月 6-9 日)。论现代神经网络架构的图灵完备性。 ICLR 2019:第七届学习表征国际会议。路易斯安那州新奥尔良。美国。 Radford , A.、Kim , JW、Hallacy , C.、Ramesh , A.、Goh , G.、Agarwal , S.、Sastry , G.、Askell , A.、Mishkin , P.、Clark , J.、Krueger , G. 和 Sutskever , I. (2021)。从自然语言监督中学习可转移的视觉模型。 arXiv。 https://arxiv.org/abs/2103.00020 Ramachandran, P., Zoph, B., 和 Le, QV (2017)。寻找激活函数。 arXiv。 https://arxiv.org/abs/ 1710.05941 Razavi, A., van the Word, A. 和 Vinyals, O. (2019)。使用 VQ-VAE-2 生成各种高保真图像arXiv。 https://arxiv.org/abs/1906.00446 Reed, S.、Akata, Z.、Yan, X.、Logeswaran, L.、Schiele, B. 和。