人工智能(AI)已经在日常交流中广泛使用,但是尽管担心AI对社会的负面影响,但在很大程度上尚未探索使用它的社会后果。我们研究了最普遍的AI应用程序之一,算法响应建议(“智能答复”)的社会后果,这些建议每天发送数十亿条消息。两个随机实验提供了证据,表明这些类型的算法推荐系统会改变人们在亲社会和反社会方式上互相互动和感知的方式。我们发现,使用算法响应会改变语言和社会关系。更具体地说,它增加了沟通速度,积极的情感语言的使用,并且对话伙伴相互评估,以更接近和更合作。然而,与对AI的不利影响的共同假设一致,如果怀疑他们使用算法响应,对人们的评估更为负面。因此,即使AI可以提高沟通速度并改善人际观念,但AI的主要反社会含义会破坏这些潜在的好处,如果使用公开使用。
• 鼓励学生利用技术,包括生成式 AI 工具,来加深对课程材料的理解。• 学生可以在本课程中使用人工智能工具(包括生成式 AI)作为学习辅助工具或帮助完成作业。但是,学生最终要对他们提交的作业负责。• 学生必须将人工智能工具生成的任何内容以及用于生成内容的提示作为作业的附录提交。• 人工智能工具生成的任何内容都必须适当引用。许多发布标准引用格式的组织现在提供有关引用生成式 AI 的信息(例如 MLA:https://style.mla.org/citing-generative-ai/ )。• 学生可以选择在完成本课程的作业时使用生成式 AI 工具;此用途必须记录在每个作业的附录中。文档应包括使用了哪些工具、如何使用它们以及如何将 AI 的结果纳入提交的作品中。
通过将自然语言纳入附加指导来实现单眼深度估计的最新进展。尽管产生了令人印象深刻的结果,但语言先验的影响,尤其是在发生和鲁棒性方面,仍未得到探索。在此过程中,我们通过量化此之前的影响来解决这一差距,并引入方法以在各种环境中基准其有效性。我们生成“低级”句子,传达以对象为中心的三维空间关系,将它们纳入其他语言先验,并评估其对深度估计的下游影响。我们的关键发现是,当前语言引导的深度估计仅通过场景级别的描述和违反直觉的效果最佳地发挥作用。尽管利用了其他数据,但这些方法对于对抗性攻击并随着分配变化的增加而对性攻击和绩效下降并不强大。fi-nally,为了为未来的研究提供基础,我们识别出失败点,并提供见解以更好地理解这些缺点。使用语言进行深度估算的越来越多的方法,我们的发现突出了需要仔细考虑在现实世界中有效部署的机会和陷阱。1
在线对话支持——聊天——是增长最快的客户服务渠道,是千禧一代获得客户服务的首选方式。如今,通过该渠道支持国际客户主要是通过使用讲不同语言的人工代理——一种稀缺且昂贵的资源。语言技术(机器翻译和对话系统)在过去几年中取得了巨大进步,使其成为多语言客户服务的有吸引力的工具。然而,当前的系统仍然过于脆弱和不切实际:首先,它们需要太多数据和计算能力,在标记数据稀缺的领域或语言中失败;其次,它们不捕获上下文信息(例如,当前的机器翻译系统以逐句为基础工作,忽略对话上下文);第三,全自动系统缺乏人类同理心,在意外情况下会失败,导致客户满意度低
无缝的人类机器人相互作用(HRI)需要机器人对人类的多模式输入的熟练处理,包括语音,凝视和面部表情,以准确评估人类的影响并相应地提供帮助。同时,机器人必须通过多模态输出渠道清楚地将自己的意图清楚地传达给人类,包括语音,手势和凝视。传统上,在机器人系统中实现此功能通常需要复杂的设计。在意图估计的领域中,以前的研究通常合并意图识别模块,以基于多模式输入[3,17]对人类意图进行分类。一些系统还具有用于检测人类情感状态的专用模块,对于建立社会细微差别的互动至关重要[10,16,18]。但是,这些方法的缺点在于它们耗时且昂贵的培训过程。在输出方面,许多先前的系统集成了情绪状态[8,11]模块,以控制人形输出提示,例如音调,凝视或面部表情,增强了向人类反馈的透明度和生动性。关于运动产生,提出了多种方法,包括预先建立的运动集的混合和图表[19,25],以及使用运动捕获数据[5,9,15]。值得注意的是,这涉及与特定状态相关的每种输出模式的动作手动设计。通过利用文本理解,推理和计划的能力,在短时间内提出了许多机器人应用[7,12,14,20,21,28]。例如,Zhang等人。大型语言模型(LLM)的最新进展,诸如聊天机器人,数据过程和代码生成之类的域中的表现令人印象深刻的功能正在揭示其在机器人技术领域的潜在应用。其中一个通常的例子是“ Saycan”机器人[1],它能够解释人的自然语言命令,分析环境并生成具体的可执行操作序列,以通过使用LLMS来满足人类的要求。但是,机器人和人之间的互动提示仅限于语音命令,即使没有语音输出。最近,一些研究人员还试图将这种技术应用于HRI领域。利用LLM来估计人类有多少信任机器人[30]; Yoshida等人,使用LLMS生成低级控制命令来推动人形机器人运动以进行社会表达[29],而不是用于实践援助。Baermann等人,部署了LLM不仅遵循人类的言语命令,而且还通过人类的自然语言反馈来纠正其错误[2]。然而,通信主要依赖语音相互作用,而较少关注多模式感应和表达能力。ye等。[27]驱动了一个LLM驱动的机器人系统,该系统能够与人类在VR环境中的组装任务中合作。,但是该系统仅限于处理人类语言输入并控制虚拟空间中的单臂。通常,与快速
从单个视图中恢复3D场景几何形状是计算机视觉中的基本问题。虽然经典的深度估计方法仅推断出2.5D场景表示为图像平面,但最新的基于辐射范围的aperach是重建完整的3D代表。然而,这些方法仍然在被占地的区域困难,因为没有视觉观察的几何形状需要(i)周围的语义知识,以及(ii)关于空间上下文的推理。我们提出了Kyn,这是一种单视场景重建的新方法,其原因是语义和空间上下文来预测每个点的密度。我们引入了一个视觉模块模块,以使用细粒度的语义信息丰富点特征。我们通过语言引导的空间注意机制在整个场景中汇总了点表示,以产生意识到3D语义环境的每点密度预测。我们表明,与预测每个3D点的密度相比,Kyn改善了3D形状的恢复。我们在Kitti-360上实现了最新的场景和对象重建结果,并且与先前的工作相比,零弹性概括的改进。项目页面:https://ruili3.github.io/kyn。
学习建模字符串之间的关系的学习是什么教授大型语言模型(LLMS)关于Vi-Sual世界的?我们系统地评估了LLMS生成和识别出增加复杂性的各种视觉概念的能力,然后演示如何使用文本模型来培训预先的视觉表示学习系统。由于语言模型缺乏将视觉信息作为像素消耗或输出视觉信息的能力,因此我们使用代码来表示研究中的图像。尽管LLM生成的图像看起来不像自然图像,但图像产生的结果以及模型校正这些固定图像的能力表明,字符串的精确建模可以教授有关Vi-Sual World的许多方面的语言模型。此外,使用文本模型生成的图像进行了自我监督的视觉表示学习的实验,突出了能够训练能够使用LLMS对自然IM的语义评估进行训练视觉模型的潜力。
当代的大规模视觉语言模型(VLM)具有强大的表示能力,使它们无处不在,可以增强图像和文本理解任务。他们经常以对比的方式受到大量图像和相应的文本字幕的对比方式进行训练。尽管如此,VLMS经常在构图推理任务上挣扎,这些任务对对象及其属性的复杂相互作用进行了精细的了解。此失败可以归因于两个主要因素:1)对比的方法传统上专注于从现有数据集中开采负面示例。但是,该模型可能不难区分阳性检查。替代采矿的替代方法是负样本2),但现有的生成方法主要集中于生成与给定图像相关的硬性负面文本。在另一个方向上进行挖掘,即生成与给定文本相关的负面图像样本已被忽略。为了克服这两种限制,我们提出了一个框架,不仅在两个方向上矿山,而且在这两种方式(即图像和文本)中产生了有挑战性的负面样本。利用这些生成硬性负样本,我们在涉及多模式综合推理的任务中显着提高了VLMS的性能。我们的代码和数据集在https://ugorsahin.github.io/enhancing-- vlm.html上发布。
本文论文讨论了这种新的DNABERT模型,并解决了它对生物学和健康产生影响的程度。在这里,与当前现有模型相比,DNABERT是否是革命性的。通过比较先前研究中预测模型的准确性与DNABERT的准确性,我得出的结论是,DNABERT可以在剪接位点预测上获得出色的性能,并且可以获得最高的准确性,但无法获得启动子预测的出色性能。因此,我的目的是确定DNABERT的工作原理,以便可以获得可能可以用于进一步优化和自定义的理解。因此,分析了DNABERT的K-MER令牌化方法和字节对编码。这是通过采用Ji等人的DNABERT的所述方法来进行的。(2021)和Zhou等人的DNABERT-2。(2023)。从此分析中可以得出结论,两种方法都比现有的DNA/RNA预测方法更好,但是BPE是最有前途的。之后,使用DNABERT(DNABERT-PROM)重点介绍了启动子预测,以清楚地了解其过程以及如何进行预培训。为了获得此信息,Ji等人的DNABERT-PROM方法的描述。(2021)进行了调整。在这里,可以确定的是,使用具有TATA-Box存在或不存在的远端启动子,对DNABERT-PROM进行了培训,以预测Homo Sapiens。此外,使用EPDNEW数据库获取启动子的数据。为此,Ji等人的DNABERT的描述特性。在分析了DNABERT-PROM之后,我得出的结论是,它是一个高效的模型,可以预测Homo Sapiens中的启动子。最后,我选择提供更广泛的DNABERT观点,以研究如何在生物学和健康领域中应用。(2021)进行了调整,并将其与生物学和健康中的当前限制进行了比较。在这里,我得出的结论是,DNABERT是生物学和健康中转录调节预测的最有前途的模型,因为它可以解决上下文所需的信息。我得出的结论是,DNABERT也应该是执行其他类型的DNA/RNA预测的“第一选择”方法,尽管它们的用法绝不能替代研究和诊断中的决策。尽管DNABERT已经是一个非常充分的预测模型,但仍需要进一步的优化和自定义来扩大其对生物学和健康中顺序预测的贡献。