Linguaskill 通用阅读和听力初级测试 1 Linguaskill 通用阅读和听力初级测试 2 Linguaskill 通用阅读和听力中级测试 1 Linguaskill 通用阅读和听力中级测试 2 Linguaskill 通用阅读和听力高级测试 1 Linguaskill 通用阅读和听力高级测试 2
摘要。在过去的几年中,歧视性和生成性的大语言模型(LLM)已成为自然语言处理的主要方法。,尽管取得了重大进步,但在比较跨语性生物医学概念归一化中判别和生成性LLM的性能仍然存在差距。在本文中,我们对几个LLM进行了比较研究,涉及跨语言生物医学概念通过致密检索的具有挑战性的任务。我们利用涵盖10种语言的XL-BEL数据集来评估模型在不进一步适应的情况下在各种语言环境中概括的能力。实验发现表明,E5是一种判别模型,表现出卓越的性能,而生物分类出现为表现最佳的生成LLM。复制实验的代码可在以下网址提供:https://github.com/hrouhizadeh/zsh_cl_bcn。
按照掩蔽语言建模 (MLM) 目标进行训练的多语言预训练语言模型 (multiPLM) 通常用于双语文本挖掘等跨语言任务。然而,这些模型的性能对于低资源语言 (LRL) 仍然不是最优的。为了改进给定 multiPLM 的语言表示,可以进一步对其进行预训练。这称为持续预训练。先前的研究表明,使用 MLM 进行持续预训练,随后使用翻译语言建模 (TLM) 进行预训练可以改进 multiPLM 的跨语言表示。然而,在掩蔽期间,MLM 和 TLM 都会给予输入序列中的所有标记相同的权重,而不管标记的语言属性如何。在本文中,我们引入了一种新颖的掩蔽策略,即语言实体掩蔽 (LEM),用于持续预训练步骤,以进一步改进现有 multiPLM 的跨语言表示。与 MLM 和 TLM 相比,LEM 将掩码限制在语言实体类型名词、动词和命名实体上,这些实体在句子中占据更重要的地位。其次,我们将掩码限制在语言实体范围内的单个标记上,从而保留更多上下文,而在 MLM 和 TLM 中,标记是随机掩码的。我们使用三个下游任务评估 LEM 的有效性,即双语挖掘、并行数据管理和代码混合情感分析,使用三种低资源语言对英语-僧伽罗语、英语-泰米尔语和僧伽罗语-泰米尔语。实验结果表明,在所有三个任务中,使用 LEM 持续预训练的多 PLM 优于使用 MLM+TLM 持续预训练的多 PLM。
大型语言模型 (LLM) 已展示出对各种用户查询生成流畅响应的卓越能力。然而,这也引发了人们对此类文本在新闻、教育和学术界可能被滥用的担忧。在本研究中,我们致力于创建能够检测机器生成文本并查明潜在滥用的自动化系统。我们首先介绍一个大规模基准 M4,它是一个用于机器生成文本检测的多生成器、多领域和多语言语料库。通过对该数据集的广泛实证研究,我们表明检测器很难很好地概括来自看不见的领域或 LLM 的实例。在这种情况下,检测器往往会将机器生成的文本错误地归类为人类编写的。这些结果表明问题远未解决,还有很大的改进空间。我们相信,我们的数据集将使未来的研究能够更稳健地解决这一紧迫的社会问题。该数据集可在https://github.com/mbzuai-nlp/M4获得。
背景:舌板厚度,密度和与牙齿的接近性与第三摩尔提取相关的各种并发症的风险因素联系在一起。目前的研究旨在使用锥形束计算机断层扫描评估下颌第三摩尔区域的舌板厚度和密度,并估算其与影响的类型和水平,根,年龄和性别作为风险因素方法的相关性:这是对648 Mandibular第三细胞的CBCT图像的回顾性研究。评估了三种不同根部水平的舌板厚度 - 颈椎,中根和顶点以及牙齿的位置,根数,舌板的密度,年龄和性别的密度。测量是在Invivo 5-Anatoge软件上完成的。分类变量的统计比较是通过卡方检验进行的,Fisher的精确测试,使用二项式逻辑回归进行单变量和多变量分析。结果:颈椎,根和顶点处的第三磨牙的舌板厚度为1.28 mm,1.42 mm和.01 mm(平均)。在21-30岁的年龄组中,在根根(P值= 0.01)和Apex(p值= 0.05)的受试者比例明显更高。舌骨密度与中根处的舌板的厚度显着相关。在中间水平的较薄的舌板比例明显较高,与位于中位置的第三磨牙相关(p值= 0.002)。结论:我们的研究表明,舌板厚度与年龄,角度和根部数量有很强的关联。对这些危险因素的了解在第三磨牙影响的管理过程中必须是必不可少的。关键字:舌板,第三磨牙,骨密度,下颌骨,锥形梁计算机层造影
系统发育模型已经变得越来越复杂,系统发育数据集在规模和丰富度方面都扩大了。但是,当前的推理工具缺乏模型指定语言,可以简单地描述完整的系统发育分析,同时独立于实施细节。我们引入了一种新的轻巧和简洁的模型规范语言“ lphy”,该语言被设计为人类和机器可读性。图形用户界面伴随“ lphy”,允许用户构建模型,模拟数据并创建描述模型的自然语言叙述。这些叙述可以作为手稿方法部分的基础。此外,我们提出了一个命令行界面,用于将LPHY指定模型转换为与BEAST2软件平台兼容的分析规范文件(XML格式)。总的来说,这些工具旨在增强植物研究中描述的清晰度和概率模型的报告,最终促进结果的可重复性。
尽管许多现代人工智能系统通常能够学习自己的表征,拥有令人惊讶的强大功能,但人们对它们的不可捉摸性以及与人类互动能力随之而来的问题感到非常不满。虽然已经提出了神经符号方法等替代方案,但对于这些方法的具体内容缺乏共识。通常有两个独立的动机:(i) 符号作为人机交互的通用语言;(ii) 符号作为人工智能系统在其内部推理中使用的系统生成的抽象。关于人工智能系统是否需要在其内部推理中使用符号来实现一般智能能力,目前尚无定论。无论答案是什么,人机交互中对(人类可理解的)符号的需求似乎非常引人注目。符号,就像情绪一样,可能不是智能本身的必要条件,但它们对于人工智能系统与人类互动至关重要——因为我们既不能关闭我们的情绪,也不能没有我们的符号。特别是在许多人为设计的领域,人类会对提供明确的(符号)知识和建议感兴趣——并期望机器以同样的方式进行解释。仅此一点就要求人工智能系统维护一个符号界面以便与人类互动。在这篇蓝天论文中,我们论证了这一观点,并讨论了需要追求的研究方向,以实现这种类型的人机互动。