Yandex 开放了最大的自动驾驶汽车数据集

Yandex 发布了用于机器学习和自主运输领域研究的无人驾驶车辆数据集。它是世界上同类中最大的公开数据集,包含 1,600 多个小时的驾驶时间,分为 600,000 个带标签的片段,记录了俄罗斯、以色列和美国在晴朗天气、雨雪天气下在道路上行驶的情况。

来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)

Yandex 发布了用于机器学习和自主运输领域研究的无人驾驶车辆数据集。它是世界上同类中最大的公开数据集,包含 1,600 多个小时的驾驶时间,分为 600,000 个带标签的片段,记录了俄罗斯、以色列和美国在晴朗天气、雨雪天气下在道路上行驶的情况。

该数据集是为 Shifts Challenge 竞赛发布的,Yandex 将与牛津大学和剑桥大学的科学家一起在 NeurIPS 2021 国际会议上举办该竞赛。竞赛的目的是引起人们对机器学习中“数据转移”问题的关注。

转变挑战

“如果你习惯了在小城市开车,那么在莫斯科你不会立即适应交通,很可能一开始在路上会更加小心。这是数据转移。您可以评估其规模并调整您的行动。机器训练的模型应该能够做同样的事情——估计转变的幅度并在新条件下有效地采取行动。其应用的广度将取决于算法在转移数据时的工作效果。”Yandex Research 高级研究员 Andrey Malinin 说道。

只要机器学习模型遇到不确定性(不熟悉的情况和未知的数据),数据转移就可能发生。对于 Shifts 挑战,Yandex 选择了三个领域:预测道路上车辆和行人的轨迹、天气预报和文本机器翻译。竞赛参与者必须创建抗剪模型。例如,一个机器翻译模型经过小说训练,但可以有效地翻译推文和 YouTube 视频。