该研究的问卷是由OFCOM设计的,并由YouGov进行了审查,以确保问题能成功地在线翻译。调查表的结构是确保受访者仅询问与他们报告使用的设备相关的语音助手。例如,三星Bixby仅被问及表明他们使用三星设备的受访者,而Apple Siri仅在报告使用Apple设备的人中只查询过Apple Siri。同样,也没有询问受访者与他们的设备生态系统不符的语音助手,例如智能手机上的Microsoft Cortana。
95 Online Systems Software 195844 Individual AI Yoga Guru Saanvi Tayal Rahul Public School Delhi New Delhi 96 Online Systems Software 196523 Individual Valuable Trash Pranet Hiranandani The Cathedral and John Connon School Maharashtra Mumbai 97 Online Systems Software 197246 Individual Parkinson Disease Detection Using Markerless Video Arav Dhoot Neerja Modi School拉贾斯坦斋浦尔98在线翻译医学科学196411团队洞察力Arya Neel Aryel Arjun Raks Raks Pallikooodam Tamil Nadu Coimbatore 99在线转化医学科学196372个体视野内部的游戏研究阿尔茨海默氏症的评分算法Prisha Goyal Scope公立学校Madhya Bhopal 101在线转化医学科学196966 Team Parkinstep:电子监视器 - 揭幕帕金森氏症的步态
该研究包括五个封闭的模型(OpenAI的GPT 3.5和4,Google的Gemini 1.5 Pro,Yandexgpt 2和3)和两个开放型模型(Meta的Llama 2和Aya,是Cohere的大型多语言模型)。实验是在与不同任务相对应的六个数据集上进行的 - 问题回答,因果推理,中学数学问题,机器翻译和拼写校正。三个数据集是专门为这项研究准备的。正如预期的那样,哈萨克(Hazakh)任务上LLM的质量低于平行英语任务。GPT-4显示出最佳的结果,其次是双子座和AYA。通常,LLM在分类任务上的表现更好,例如回答多项选择问题,并与语言生成任务(例如拼写校正)斗争。因此,在线翻译服务(例如Google Translate)仍然是在哈萨克语和英语以及哈萨克语和俄罗斯之间翻译的更可靠的选择。我们预计更多了解哈萨克的LLM的出现,评估的方法和数据集变得至关重要。
OECD 将 AI(人工智能)系统定义为“一种基于机器的系统,它可以通过为给定的一组目标产生输出(预测、建议或决策)来影响环境。它使用机器和/或基于人类的数据和输入来(i)感知真实和/或虚拟环境;(ii)通过自动(例如,使用机器学习)或手动分析将这些感知插入模型;(iii)使用模型推理来制定结果选项。人工智能系统旨在以不同程度的自主性运行”(OECD,2019a)。这一定义将人工智能与最近引起技术进步兴奋的技术类型联系起来:机器学习。机器学习是计算统计学的一个分支,专注于设计算法来根据新数据进行预测,而无需明确编程解决方案。自 2012 年以来,机器学习作为一种预测技术的使用大幅增长。机器学习现在已经很常见:Pandora 学习如何根据用户的喜好做出更好的音乐推荐; Google 学会了如何根据在线翻译的文档将内容自动翻译成不同的语言;Facebook 则学会了如何根据已知用户的数据库识别照片中的人物。一组称为“深度学习”的机器学习算法已被证明对各种预测任务特别有用且具有商业可行性。深度学习算法是一种神经网络,它几乎不需要程序员的指导就能解决大型复杂数据集中的问题。神经网络是一种程序,它使用权重和阈值的组合将一组数据输入转换为输出预测,测量这些预测与现实的“接近度”,然后调整它使用的权重以缩小预测与现实之间的距离。通过这种方式,神经网络可以在输入更多数据时进行学习。它之所以被称为“深度”学习,是因为程序会自动生成多个网络作为数据的抽象层来识别模式。1
语言障碍已经挑战了人类的交流数百年来,推动了对有效翻译解决方案桥梁语言鸿沟的持久追求。随着时间的流逝,已经出现了各种方法来解决语言差异的复杂性,从而使跨文化的流体相互作用更多。在当今相互联系的世界中,关键信息和信息通常以各种官方语言传达,具体取决于国家。这种多样性在丰富的同时,可能会阻碍旅行者和专业人士,他们可能很难理解和行动重要的信息,而无需熟练当地语言。传统工具,例如口袋字典和在线翻译服务,提供了一些支持,但通常缺乏实时响应能力和上下文敏感精度所需的细微理解。随着全球化的增长,对高质量,实时翻译的需求变得更加紧迫。这个项目,具有自适应增强学习的实时语言翻译器,介绍了一个突破性解决方案:一个基于Web的应用程序,将实时翻译功能与增强学习结合在一起,以根据用户反馈来提高翻译质量。使用简洁的交互式界面构建,该应用程序利用Google翻译API进行准确的语言翻译,同时实现了Q学习算法,该算法会随着时间的推移适应并增强其性能。通过此系统,用户可以选择源和目标语言,输入文本进行翻译,并接收即时,高质量的翻译输出。机器翻译(MT)是将文本从一种语言转换为另一种语言的过程,随着深度学习模型(例如sequence-tosequence(SEQ2SEQ)和Transformer模型)的进步,已经显着发展。及其编码器模型的Seq2Seq模型将输入句子转换为生成目标语言翻译的上下文向量。与此同时,在“注意就是您需要的全部”中引入的变压器模型(Vaswani等,2017),使用自我注意的机制来指出相关的句子组件,从而大大提高了翻译质量。在此项目中,增强学习(RL)用于通过创建一个自适应反馈循环来增强MT过程,该反馈环将转换为用户需求量。转换模型在此设置中充当“代理”,根据用户评分做出翻译决策并接收反馈或“奖励”。通过QLearning算法处理的此反馈使该模型能够更新其策略,并完善未来翻译以最大程度地提高用户满意度。随着用户的审查和评估翻译,系统将学习输出的输出最佳的用户满意度,个性化体验并随着时间的推移提高整体准确性。这种高级机器翻译和自适应学习的独特混合物不仅增强了翻译质量,而且还创建了一个以用户为中心的工具,该工具对个人偏好有反应,提供了一种无缝,直观的体验。通过MT和RL的这种创新融合,该项目旨在重新定义跨语言交流,创建智能的自适应翻译系统,从而弥合语言差距并增强全球互动。