详细内容或原文请订阅后点击阅览
雪貂 - UI 2:掌握跨平台的通用用户界面理解
建立用于用户界面(UI)理解的通才模型,这是由于各种基础问题(例如平台多样性,解决方案变化和数据限制)而具有挑战性的。在本文中,我们介绍了雪貂UI 2,这是一种多模式大语言模型(MLLM),旨在跨越包括iPhone,Android,Android,iPad,WebPage和AppleTV在内的广泛平台上的通用UI理解。 Ferret-UI 2以雪貂UI的基础为基础,引入了三个关键创新:对多种平台类型的支持,通过自适应缩放和高级任务的高分辨率感知……
来源:Apple机器学习研究