摘要“SuperCook”项目是一个开创性的设计项目,探索了人工智能与烹饪应用程序的融合。它旨在通过个性化的食谱推荐、实时烹饪指导和交互式膳食计划,将用户与新的、可访问的烹饪冒险联系起来,从而彻底改变厨房体验。通过利用人工智能技术,“SuperCook”不仅提高了用户的便利性和效率,而且还促进了更深入的烹饪参与度并提倡更健康的饮食习惯。本论文深入研究了设计过程、用户测试和迭代改进,最终为现代烹饪爱好者提供了以用户为中心、直观且视觉上吸引人的 UI/UX 解决方案。在设计“SuperCook”时,我们注重选择直观的 UI 元素和流畅的交互设计,以促进轻松愉快的烹饪过程。论文的这一部分详细阐述了在菜谱发现中,选择食材和动态过滤的滑动手势的选择,旨在提高用户参与度并简化烹饪过程。此外,还讨论了人工智能推荐和个性化用户资料的战略性使用,强调了它们在根据个人喜好定制应用程序和为不同技能水平的用户简化整体烹饪过程中的作用。论文将详细介绍“SuperCook”人工智能功能背后的创意和技术流程。具体来说,将探索用于生成个性化食谱、利用用户偏好和可用烹饪数据的算法。还将讨论将用户反馈整合到食谱定制过程中,阐明“SuperCook”如何适应和发展以满足个人用户需求。此外,还将引用烹饪领域现有的AI模型和技术,提供在菜谱生成和用户体验增强方面成功的AI应用示例。“SuperCook”的设计过程涉及使用Figma,Midjourney和After Effects,从而能够创建直观的低保真线框,高保真原型,交互式原型和引人入胜的UI动画。该应用程序的设计优先考虑用户友好性,简单性和交互性,具有简洁且吸引人的UI,可激发用户的烹饪创造力。总之,“SuperCook”预示着数字烹饪创新的范式转变,展示了AI在定制和增强烹饪体验方面的变革力量。关键词该项目强调了人工智能的实用性与直观用户界面和视觉设计元素的融合,为个人与烹饪和食物准备工具的互动方式设定了新标准。
摘要 - 互动感知使机器人能够操纵环境和对象将它们带入有利于感知过程的状态。可变形物体在基于视觉的感知中的严重操纵难度和遮挡,对此构成挑战。在这项工作中,我们通过涉及活动相机和对象操纵器的设置解决了这样的问题。我们的方法基于一个顺序的决策框架,并明确考虑了耦合相机和操纵器的运动规律性和结构。我们为构建和计算一个称为动态活动视觉空间(DAVS)的子空间的方法有效地利用了运动探索中的规律性。在模拟和真实的双臂机器人设置中都验证了框架和方法的有效性。我们的结果证实了可变形对象的交互感中的主动摄像头和协调运动的必要性。
交互式3D环境是对体现的AI代理进行培训和评估的关键,这使得对现实的大型3D数据集的可用性对于该地区未来的杂志至关重要。然而,现代的最先进的模拟数据库很少包含一百多个相互影响的场景[26] [19] [14],因为手动场景既耗时又耗时且昂贵。虽然已经努力从头开始生成模拟场景[5],但在这些环境中训练AI代理的结果并不令人满意[12],可能是因为这些解决方案使用过度简单的规则,导致了不现实的世代。同时,扫描真实环境构建的3D重建数据集可能包含数千个现实的场景[4] [42] [40],而缺乏交互所需的物理对象注释。在此项目中,我们引入了一个解决方案,该解决方案利用了在线可用于在两个阶段的程序生成的在线可用的Abun dant 3D重建数据。首先,我们使用接地的SAM [33],这是一个强大的开放式对象检测和半分割工具来分割和注释输入3D网格,并使用用户定义的对象类别。第二,我们使用剪辑[28]图像表示和上一步预测的类标签找到了每个检测到的对象的最近数据库对象(语义和方向上的类似)。此过程可用于将任何3D网格场景(重建或生成)转换为具有较高的环境,通过用丰富的注释数据库对象替换其原始网格顾问来通过重新流动。
已发表版本引文(哈佛):Zeng, N, Jiang, L, Vignali, G & Ryding, D 2023,奢侈品零售中的客户互动体验:人工智能聊天机器人在互动营销中的应用。CL Wang(编辑),《帕尔格雷夫互动营销手册》。Palgrave Macmillan,第 785-805 页。https://doi.org/10.1007/978-3-031-14961-0_34
摘要 - 零击对象导航(ZSON)使代理能够在未知环境中朝着开放式摄制对象导航。ZSON的现有作品主要集中于遵循单个说明,以查找通用对象类,忽略了自然语言互动的利用以及识别特定用户特定对象的复杂性。为了解决这些限制,我们引入了零击交互式个性化对象导航(Zipon),在与用户进行对话时,机器人需要导航到个性化目标对象。要解决Zipon,我们提出了一个新的框架,称为开放世界交互式个性化导航(Orion)1,该框架使用大型语言模型(LLMS)来做出顺序决策,以操纵不同的模块以进行感知,导航和交流。实验结果表明,可以利用用户反馈的交互式剂的性能会显示出显着改善。但是,对于所有方法,在任务完成与导航和互动效率之间获得良好的平衡仍然具有挑战性。我们进一步提供了更多有关不同用户反馈表对代理商绩效的影响的发现。
大型语言模型 (LLM) (如 GPT-4)彻底改变了自然语言处理,展现出卓越的语言能力和推理能力。然而,它们在战略多智能体决策环境中的应用受到重大限制的阻碍,包括数学推理能力差、难以遵循指令以及容易产生错误信息。这些缺陷阻碍了它们在战略和交互任务中的表现,这些任务需要遵守细致入微的游戏规则、长期规划、在未知环境中探索以及预测对手的动作。为了克服这些障碍,本文提出了一种新型的 LLM 智能体框架,该框架配备了记忆和专门的工具来增强其战略决策能力。我们将这些工具部署在许多具有经济重要性的环境中,特别是双边谈判和多智能体和动态机制设计。我们使用定量指标来评估该框架在各种战略决策问题中的表现。我们的研究结果表明,我们增强的框架显著提高了 LLM 的战略决策能力。虽然我们强调了当前 LLM 模型的固有局限性,但我们通过有针对性的增强展示了改进,为交互式环境中 LLM 应用的未来发展提供了一个有希望的方向。
摘要 - 机器人需要预测和对人类动作做出反应,以在没有冲突的情况下在人群中导航。许多现有的方法将预测与计划的预测无法解释机器人和人类动作之间的相互作用,并且可能导致机器人被卡住。我们提出了SICNAV,这是一种模型预测控制(MPC)方法,该方法共同解决了机器人运动并预测闭环中的人群运动。我们在人群中对每个人进行建模,以遵循最佳的倒数避免避免(ORCA)方案,并将该模型嵌入机器人的本地规划师中,从而导致了双重非线性MPC优化问题。我们使用KKT改制将双重问题作为单个级别施放,并使用非线性求解器进行优化。我们的MPC方法可以影响行人运动,同时明确满足单机器人多人类环境中的安全限制。我们在两个模拟环境中分析了SICNAV的性能,并使用真实机器人进行了室内实验,以证明可以影响周围人类的安全机器人运动。我们还验证了在人类轨迹数据集上孔口的轨迹预测性能。代码:github.com/sepsamavi/saf-interactive-crowdnav.git。
生成人工智能(AI)的发展在音乐综合领域取得了显着的进步。然而,在生成的内容中缺乏创造力,引起了公众的重大关注。为了解决这个问题,本文介绍了一种新颖的方法,以进行个性化音乐的合成,并结合了人类的一代。此方法利用以捕获用户的喜好和生成的对抗网络而闻名的交互式进化计算的双重强度,以其自主产生高质量音乐的能力而闻名。这种整合的主要目标是增强音乐合成中生成AI的可信度和多样性,在人类中的计算艺术创造力。此外,一个用户友好的交互式音乐播放器旨在促进音乐合成过程中的用户。所提出的方法表明了一个范式,其中用户通过人机互动来操纵潜在空间,从而强调了人类在综合多样化和创意音乐中的关键作用。
摘要 - 本研究旨在调查英语作为外语(EFL)学生对使用交互式学习应用的看法。研究方法是定量的,使用问卷收集有关学生对交互式学习应用程序及其在这方面的偏好的看法的数据。此外,还包括学术绩效数据。研究人群包括印度尼西亚北苏门答腊的教师培训和教育科学学院(Stkip)Al Maksum的所有学生。该样本由2021/2022学年的英语系学习计划中的20名学生组成。研究结果表明,学生对互动学习应用的看法会影响他们对学习应用的选择,最终影响他们的学习成果。根据学生对学习应用的看法的总分,学生更倾向于选择Kahoot供EFL使用。这是因为,在有效性,享受和感知到的学习方面,此应用程序在quizizz方面表现出色。
互动对话 1:振兴小岛屿发展中国家经济,实现加速和可持续增长 1.0 会议目的 考虑到小岛屿发展中国家在可持续发展的三个维度上面临的挑战以及外部冲击、气候变化、海平面上升、海岸快速侵蚀造成的挑战,讨论应确定集体行动,以加强小岛屿发展中国家的经济多样化,建立复原力和灾后恢复能力,并通过战略、政策和举措推动可持续发展。这一主题将侧重于实际步骤、伙伴关系和政策,包括利用蓝色经济实现小岛屿发展中国家的可持续增长、旅游业、海洋管理、海洋产业扩张、可再生能源和生态系统保护。 时间和日期:2024 年 5 月 28 日星期二上午 11:00 至下午 1:00 简报标题:促进可持续的海洋经济,以建立复原力并支持太平洋小岛屿发展中国家的国民经济。 2.0 问题背景信息