本文介绍了 Facebook AI 提交的 WMT20 共享新闻翻译任务。我们专注于低资源设置并参与两对语言对,即泰米尔语 ↔ 英语和因纽特语 ↔ 英语,其中域外双语文本和单语数据有限。我们使用两种主要策略解决低资源问题,利用所有可用数据并使系统适应目标新闻领域。我们探索了利用所有语言的双语文本和单语数据的技术,例如自监督模型预训练、多语言模型、数据增强和重新排名。为了使翻译系统更好地适应测试域,我们探索了数据集标记和域内数据的微调。我们观察到,根据语言对的可用数据,不同的技术提供了不同的改进。基于这一发现,我们将这些技术集成到一个训练流程中。对于 En → Ta,我们探索了一种无约束设置,其中包含额外的泰米尔语双语文本和单语数据,并表明可以获得进一步的改进。在测试集上,我们提交的最佳系统分别对 Ta → En 和 En → Ta 实现了 21.5 和 13.7 BLEU,对 Iu → En 和 En → Iu 分别实现了 27.9 和 13.0。
摘要 社交媒体上有关疫苗的错误信息越来越受到医疗专业人士、医学专家和研究人员的关注。尽管这种担忧通常与许多利益相关者群体在线产生的信息流总量有关,但疫苗接种争议往往因时间、地点和所讨论的疫苗而异。我们研究了丹麦三个 Facebook 页面上管理员生成的内容,这三个页面旨在促进有关人乳头瘤病毒 (HPV) 疫苗接种的批判性辩论。我们开发了一个定性编码框架,使我们能够根据流行主题和通过链接和共享整合的互文材料来分析管理员的帖子。我们对从 2012 年 11 月(第一个页面建立时)到 2019 年 5 月期间超过三分之一的帖子(n = 699)进行了编码。我们发现这些页面主要涉及 HPV 疫苗接种后的不良事件报告和(感知到的)医疗保健系统反应不足。为了构建其核心信息,这些页面汇集了不同的来源,主要是来自丹麦新闻媒体的报道,但也包括个人叙述、科学信息、政治主张等。我们得出结论,HPV 疫苗接种网站(如这些页面)是异质的和上下文相关的。它们不是统一的疫苗批评网站,而是似乎在回应和交换它们所处的通信环境中的信息和错误信息。
1 Info Studio doo Sarajevo,波斯尼亚和黑塞哥维那 2 萨拉热窝大学电气工程学院,波斯尼亚和黑塞哥维那 摘要 本文提出了一个框架,该框架能够准确预测零售业的未来销售情况,并根据预期的预测可靠性水平对产品组合进行分类。 该框架基于 Facebook 的 Prophet 算法和回测策略,对任何从事零售业的公司都非常有用。 在波斯尼亚和黑塞哥维那最大的零售公司之一的生产环境中通过实验获得的真实销售预测基准数据用于评估该框架并在真实用例场景中展示其能力。 关键词 销售预测、真实数据集、Prophet、回测、分类 1. 引言 在零售业中,生成产品级销售预测是一个至关重要的因素,因为库存控制和生产计划在任何为客户提供商品的公司竞争力中都起着重要作用。虽然准确可靠的预测可以促进更好的生产和库存规划、有竞争力的定价和及时的促销计划,从而节省大量成本,但事实证明,糟糕的销售估计会在这个领域代价高昂,因为众所周知,商品短缺会导致利润降低,并很容易导致客户不满。此外,不仅过剩的库存会迫使商店以较低的价格出售商品,甚至更糟的是导致库存注销,高于所需的库存水平也会增加仓储成本。在现实世界中,零售业的商业环境高度动态且经常波动,这主要是由节日效应和竞争对手的行为造成的。因此,与用于演示和基准测试各种时间序列预测方法的广泛可用的学术数据集相反,该领域的实际销售数据面临各种挑战,例如高度非平稳的历史数据、不规则的销售模式和高度间歇性的销售数据。一个能够以相当高的准确度预测销售额的模块,加上根据预期可预测性水平对产品组合进行高度可靠的分类的模块,对于任何从事零售业的公司来说都是非常有用的。为了弥补在零售业的现实场景中应用时间序列预测的差距,这项工作的重点是开发可靠的
摘要 本研究旨在了解用户在社交媒体平台(如 Facebook)或其他可能对用户产生情绪影响的软件产品上执行某些任务时情绪如何波动。具体来说,我们探讨了 Facebook 常用用户和新用户在可用性方面的差异。这项研究涉及对 18 名参与者的定性研究,其中 9 名是 Facebook 用户,9 名是非 Facebook 用户,他们在参与本研究之前从未使用过 Facebook。在测试过程中,要求用户完成 Facebook 上的几项任务,同时使用 EEG(脑电图)采集系统记录他们大脑的电生理活动。当然,这项研究可以应用于任何软件产品,在产品发布之前,通过了解新用户与常用用户相比的用户友好程度来改进其用户界面。此外,还研究了新用户和常用用户之间的用户友好度相关性。此外,这项研究将帮助我们辨别大脑的哪些部分在群体之间具有最显著的差异,并讨论个人情绪状态背后的动机,这与用户体验有关。基于对特征脑波功率谱的分析,这项研究确定了新用户和常客之间存在显著的统计差异。此外,研究还发现新用户和常客的中央叶、颞叶和枕叶之间存在显著差异。这些结果将有助于开发人员创建最佳且用户友好的软件产品。
我们正在调查在 2014 年改变平台之前可以访问大量信息的每个应用程序。调查过程正在全面展开,分为两个阶段。首先,全面审查以确定每个可以访问如此大量 Facebook 数据的应用程序,并重点关注那些有理由进行深入调查的应用程序。其次,如果我们有疑虑,我们将进行访谈,提出信息请求 (RFI) — 即询问一系列有关应用程序及其可以访问的数据的详细问题 — 并使用专业公司进行审计,其中可能包括现场检查。我们拥有庞大的内部和外部专家团队,正在努力尽快调查这些应用程序。迄今为止,我们已经调查了数千个应用程序,大约 200 个应用程序已被暂停 — 等待彻底调查它们是否确实滥用了任何数据。如果我们发现这些或其他应用程序确实滥用数据的证据,我们将禁止它们并告知人们。