摘要 - 云机器人技术使机器人能够将复杂的计算任务卸载到云服务器以进行性能和易于管理。但是,云计算可能是昂贵的,云服务可能会偶尔遭受停机时间,并且机器人和云之间的连接可能是网络服务质量(QoS)的变化。我们通过引入多云扩展名来自动复制独立的无状态机器人服务,将请求路由到这些副本,并指导第一响应回复,以减轻这些问题,以减轻这些问题。随着复制,即使云服务提供商降低或QoS较低,机器人仍然可以从云计算中受益。此外,许多云计算提供商提供了低成本的“点”计算实例,这些实例可能会无法预测。通常,这些低成本实例不适合云机器人技术,但是Fogros2-ft的容错性质可以可靠地使用它们。我们在模拟(视觉对象检测,语义分割,运动计划)和1个物理机器人实验(Scan-Pick-Pick-Pick-and-place)中,在3个云机器人方案中演示了FogroS2-FT的容错能力。在相同的硬件规范上运行,Fogros2-ft实现运动计划,最高2.2倍的成本降低,并在99%(P99)长尾潜伏期上降低了5.53倍。fogros2-ft在网络放缓和资源争议下,对象检测和语义分割的P99长尾延迟分别减少了2.0倍和2.1倍。视频和代码可在https://sites.google.com/view/fogros2-ft上找到。
大和运输株式会社(总部:东京都中央区,代表董事兼总裁:长尾丰)与Alfresa于2019年成立了医药品流通研究组,并致力于构建新的医药品流通网络。在此过程中,该集团认为,创造一个消费者可以轻松接受符合其生活方式的医疗服务的环境,可能是促进早期治疗和防止尚未接受治疗或已中断治疗的患者病情恶化的有效措施,从而推动了在线医疗服务的发展。
我是一个全面的机器人,致力于实现安全可靠的现实世界自主权。我对将大规模数据驱动的方法与可证明的安全方法巧妙地结合在一起特别感兴趣。我喜欢在多个安全关键领域工作,例如无人驾驶汽车,无飞行员飞机和自动驾驶,并在人体机器人互动中应用,强大的风险意识计划,长尾不确定性量化和运动预测。我当前的效果专注于使用大型视觉语言动作模型来提高机器人技术的运行时安全性。
在第一部分中,学生将探索构成现代网络安全战略的基础概念和方法。首先,他们将进行现状评估,回顾传统和现代攻击技术,了解这些技术的发展历程及其对现代后漏洞利用场景的影响。随后,本部分将深入探讨高级网络防御原则,强调威胁检测和响应措施从被动到主动的转变。本部分将介绍关键技术、模型和框架,例如 MITRE ATT&CK、CIS Controls、OWASP LLM Top 10、零信任和长尾分析,提供概念工具包,以更好地理解和缓解威胁。学生将学习如何利用这些框架,更好地将防御措施与已知的对手战术和技术相结合。
尽管进度令人印象深刻,但当前的机器学习系统具有重大局限性。培训算法需要实质性的计算能力并访问大量数据集,因此只有少数组织才能追求最雄心勃勃的发展。机器学习算法对于分类(而不是连续)变量或输入是异源时的作用不能很好地工作。算法的输出本质上是脆弱的,很容易被专门设计的输入愚弄。成功的模型几乎不可能解释或理解,从而使他们的认证成为挑战。将“获得的知识”转移到其他问题很困难,这限制了我们攻击“日常任务的长尾”的能力。最后,当前的机器学习范式无法很好地处理日常生活中遇到的多种类型的问题,在这种情况下,环境具有高度动态和不可预测的,具有模棱两可或矛盾的多种目标,并且嵌入了人类和社会价值的隐式系统中。
3D语义分割是驱动感知中最关键的任务之一。基于学习的模型准确感知密集的3D周围环境的能力通常可以确保自动驾驶汽车的安全操作。但是,基于激光雷达的3D语义分割数据库由依次获得的激光扫描组成,这些激光扫描是长尾且缺乏训练多样性的。在本报告中,我们引入了MixSeg3d,这是强度点云分割模型与先进的3D数据混合策略的复杂组合。具体来说,我们的方法将Minkunet家族与Lasermix和Polarmix集成在一起,这是两种场景 - 比例扩展方法,这些方法将LIDAR点沿Ego-Scene的倾斜度和方位角融合在一起。通过经验实验,我们证明了MixSeg3d在基线和先前的艺术中的优越性。我们的团队在2024 Waymo Open数据集挑战赛的3D语义Segmen track中获得了第二名。
摘要。近年来,已经在自动驾驶中调查了大型视力和语言模型(VLM),以解决长期存在的问题,包括推理,概括和长尾方案。但是,将VLM的有效整合到自主驾驶框架中仍然是一个悬而未决的问题。在本文中,我们提出了VLP,这是一个新颖的视觉语言规划框架,它利用了大型视觉语言模式来弥合语言理解与自动驾驶之间的差距。VLP是一种训练方法,它通过提出对比度学习目标来提炼VLM的力量到端到端模块化自主驾驶。在开路和闭环任务上进行了广泛的实验,验证了VLP的实用性。尤其是,VLP通过与先前的最佳方法相比,分别在平均L2错误和碰撞率方面,在Nuscenes数据集上实现了状态的端到端计划绩效。
图 5. 收集或得出的 CO(在 m/z = 28 处检测到)的飞行时间分布。纯氧(O/O 2 )光束(黑色)的 CO 信号已按 0.29 的倍数缩放,以给出在没有任何氮影响的情况下混合氧/氮光束(蓝色)的预测 CO TOF 分布。红色曲线是用混合氧/氮光束检测到的实际 CO 信号。红色分布中的长尾是由于在 m/z = 28 处使用氧/氮光束和纯氮(N/N 2 )光束收集的飞行时间分布形状略有不同(见图 3),这可能是由于两种光束从源室长时间逸出的 N 2 特性略有不同所致。当假设不受氮影响的情况下得出的 CO 信号乘以 1.6 倍时,所得信号幅度与使用混合氧/氮束测得的实际 CO 信号(绿色曲线)的幅度相匹配。
文本对图像(T2I)生成模型最近成为一种强大的工具,可以创建照片现实的图像并引起多种应用。然而,将T2i模型的有效整合到基本图像分类任务中仍然是一个悬而未决的问题。促进图像锁骨表现的一种普遍的策略是通过使用T2I模型生成的合成图像来增强训练集。在这项研究中,我们仔细检查了当前发电和常规数据增强技术的缺点。我们的分析表明,这些方法努力产生既忠实的(就前景对象)而且针对领域概念的多样化(在背景上下文中)。为了应对这一挑战,我们引入了一种创新的类数据增强方法,称为diff-mix 1,该方法通过在类之间执行图像翻译来丰富数据集。我们的经验结果是,DIFF-MIX在信仰和多样性之间取得了更好的平衡,从而导致各种图像分类场景之间的性能显着提高,包括域名数据集的少量,常规和长尾分类。
摘要 - 构建语义3D地图对于搜索官方,仓库,商店和房屋感兴趣的对象很有价值。我们提出了一个映射系统,该系统会逐步构建一种语言包裹的高斯splat(腿):详细的3D场景表示形式,该表示同时编码外观和语义是在统一的表示中。腿在网上训练,因为机器人遍历其环境,以便可以定位开放式对象查询。我们在4个房间场景上评估了腿部,在该场景中我们查询场景中的物体,以评估腿如何捕获语义含义。我们将腿与LERF [1]进行了比较,并发现尽管两个系统都具有可比的对象查询率,但腿的训练速度比LERF快3.5倍。结果表明,多相机设置和增量捆绑捆绑调节可以提高受约束的机器人轨迹的视觉重建质量,并建议腿可以定位开放式播放器和长尾对象查询,其精度高达66%。请参阅项目网站:berkeleyautomation.github.io/legs