附录 A - 通过公司内联网发送给 120 名设计工程师的调查问卷 附录 B - 显示不同类别工程师的表格 附录 C - 专家消息人士名单及其为早期调查提供的口头数据 附录 D - 访谈数据中工程师提到的问题列表 附录 E - 工程师的写作技巧 - 自我评价 附录 F - 工程师花在写作上的时间。附录 G - 制作系统手册 - [稻草人] 案例研究 附录 H - 技术说明的定义 附录 I - 电子邮件调查:问题 4 至 8 的答复摘要草稿 附录 J - 规格和要求 附录 K - 陀螺仪的新概念 附录 L - 模型提案的稻草人大纲结构 附录 N - 执行摘要的 NVivo 编码栏 附录 O - 类别编码的第一个粗略列表 附录 P - 产品/解决方案说明或声明 IC 的节点编码报告 附录 Q - 执行摘要节点的 NVivo 报告 附录 R - 摘自 YGO46 的早期笔记 附录 S - 咨询的工程师和专家线人 附录 T - 显示所有编码类别的 NVivo 打印件 附录 U - VSG 团队设计的通用提案 附录 A - 通过公司内部网发送给 120 名设计工程师的问卷附录 V - 振动结构陀螺仪
在实际教育应用中,广泛需要对书籍级长文本进行可读性评估。然而,目前大多数研究都集中在段落级可读性评估,对超长文本的处理工作很少。为了更好地处理长序列的书籍文本并利用难度知识增强预训练模型,我们提出了一种新颖的模型 DSDR、难度感知片段预训练和难度多视图表示。具体来说,我们将所有书籍分成多个固定长度的片段,并采用无监督聚类来获得难度感知片段,这些片段用于重新训练预训练模型以学习难度知识。因此,长文本通过对具有不同难度级别的多个片段向量进行平均来表示。我们构建了一个新的儿童分级读物数据集来评估模型性能。我们提出的模型取得了令人满意的结果,优于传统的 SVM 分类器和几种流行的预训练模型。此外,我们的工作为书籍级可读性评估建立了一个新的原型,为未来相关研究提供了重要的基准。
方括号“[...]”。这可能是必要的,例如,如果 AI 包含不存在或不正确的来源,则应将其删除。如果直接引用的 AI 生成文本中的参考资料被更正或补充,则应添加作者的姓名首字母。工程学(使用标准引用的数字系统):“AI 生成文本 […] AI 生成文本 [1,由 HC 补充] AI 生成文本” [OpenAI,2023,提示号1] 自己的文本经济学(带有标准引用详细信息):“AI 生成文本 […] AI 生成文本 [cf.Mustermann,2017 年,第1,由HC补充] AI生成的文本” (OpenAI,2023,提示号1) 自己的文本 在经济学中,方括号也用于表示遗漏或添加,与标记直接引用中更改的标准一致。使用“cf.”是必要的,因为AI生成的文本中引用的来源通常不是AI逐字引用的。最多,补充来源的内容是重新表述的。注意:AI生成的文本通常包括虚构或“幻觉”来源,应仔细验证。3.在解释完全由AI生成的文本(即间接引用)时,应该
摘要。生成人工智能 (genAI) 创新为最终用户带来了新的潜力,影响到年轻人和缺乏经验的人。然而,作为一项创新技术,genAI 有可能产生无法识别的错误信息。非凡的人工智能输出可以提高可信度。最终用户评估系统对于揭露对错误响应的毫无根据的依赖是必要的。本文确定了评估系统的要求,以防止最终用户高估对生成文本的信任。因此,我们根据文献综述和两项国际调查进行了需求工程。结果证实了在处理 genAI 时实现人类保护、人类支持和内容真实性的要求。高估信任的根源在于校准错误;了解 genAI 及其提供者对于解决这一现象至关重要,并且需要人工验证。因此,我们的研究结果为未来以人为本的 genAI 信任解决方案的信息系统研究的重要性提供了证据。
按照解释学的思路,我们提出了一种通过从给定文本中提取相关模式来进行风格表征的知识发现过程,重点是风格的句法维度。这个知识发现过程包括两个主要步骤,一个顺序模式挖掘步骤,然后应用一些兴趣度度量。特别是,提取给定长度的所有可能的句法模式被提出作为在探索性场景中提取有趣特征的一种特别有用的方法。显然,模式的激增和人类难以理解大量结果是这种方法的主要障碍。因此,我们在这种情况下使用兴趣度度量来处理和减少如此大量的模式,以识别最相关的模式。我们建议对三种提出的兴趣度测量方法进行实验评估并报告结果,每种方法都基于不同的理论语言学和统计背景。
由于可视化在每天的生活中变得越来越重要,因此了解它们实际上有多帮助,尤其是与文本相比,至关重要。此最先进的报告概述了人类对静态可视化或文本是否更快,哪个是更好的综合性。为此,讨论了19项研究,两个荟萃分析和一篇文章。一般而言,没有任何全球范围都无法找到,因为只有少数研究直接将文本与没有其他文本的可视化进行比较,而这些研究产生了冲突的结果。大多数研究将文本与文本与其他拟合性进行了比较,并显示出其积极和负面影响。在处理时间时,根本没有比较研究。关于可理解性,研究显示了一些有趣的结果。如果仅存在可视化或仅文本,则两者似乎同样可以理解。在大多数情况下,将可视化添加到文本中的可理解性。装饰图片可以提高情绪并增加学习的表现,但他们也可以将注意力从重要方面转移出来。此外,尤其是年幼的孩子和贫穷的学习者可能会遇到链接文本和可视化信息的问题。
美国国会图书馆出版品目数据 名称:Neuman, Yair, 1968- 编辑。| Danesi, Marcel, 1946- 编辑。| Vilenchik, Dan, 1977- 编辑。 标题:使用人工智能与文本对话:从心理学到电影和文学/Yair Neuman、Marcel Danesi、Dan Vilenchik。 其他标题:使用人工智能与文本对话 说明:纽约,纽约州:劳特利奇,2023 年。| 系列:劳特利奇专注于语言学 | 包括参考书目和索引。 标识符:LCCN 2022029268(印刷版)| LCCN 2022029269(电子书)| ISBN 9781032363271(精装本)| ISBN 9781003331407(电子书)主题:LCSH:批评——数据处理。| 文学与技术。| 人工智能。| 文本数据挖掘。| 诠释学。分类:LCC PN98.E4 U85 2023(印刷版)| LCC PN98.E4(电子书)| DDC 801/.95028563–dc23/eng/20220826 LC 记录可在 https://lccn.loc.gov/2022029268 上找到 LC 电子书记录可在 https://lccn.loc.gov/2022029269 上找到
近年来,由于深度学习方法的出现,机器翻译 (MT) 得到了迅猛发展,而神经机器翻译 (NMT) 则显著提高了自动翻译的质量。虽然大多数工作涵盖了技术、法律和医学文本的自动翻译,但机器翻译在文学文本中的应用以及人类在这一过程中的作用尚未得到充分探索。为了弥补这一研究不足领域的空白,本文介绍了一项研究的结果,该研究旨在评估三种机器翻译系统对两种不同文学体裁、两部小说(乔治·奥威尔的《1984》和简·奥斯汀的《傲慢与偏见》)和两首诗(艾米莉·狄金森的《我感受到了大脑中的葬礼》和玛格丽特·阿特伍德的《海妖之歌》)的性能,这代表了不同的文学时期和时间线。评估通过自动评估指标 BLEU 进行,以客观评估机器翻译系统在每种体裁中的表现。本研究还概述了其局限性。
摘要:表型包括应用算法来识别与特定,潜在复杂,性状或条件相关的个人,通常是从电子健康记录(EHRS)集合中的。由于EHR的许多临床信息都在文本中,因此文本的表型在依赖EHR的次要使用的研究中起着重要作用。但是,临床文本的内容和形式的异质性和高度专业化的方面使这项任务特别繁琐,并且是观察研究中时间和成本限制的来源。为了促进表型管道的开发,评估和可重复性,我们开发了一个名为MED KIT的开源Python库。它可以启用由易于重复使用软件砖制成的数据处理管道,名为MedKit Operations。除了图书馆的核心外,我们还共享我们已经开发的运营和管道,并邀请表型社区重新使用和丰富。
语音识别是计算语言学的一个重要领域[CRS05、CFL13]。多年来,研究人员已经开发出各种技术和工具来识别口语中的单词和短语[JM14、BMG∗16、HM15a]。最近,人工智能技术,特别是深度学习网络,已经具有革命性,因为它们超越了以前的方法,并且在语音转文本的结果中带来了高质量和低错误率[HDY∗12、MLJ∗14]。许多大公司已经使用深度学习模型提供基于云的语音转文本服务,例如微软[Mic]、谷歌[Goo19]等。来自多个领域的用户都渴望将这些人工智能工具用于实际应用,如进行实地调查和收集用户意见 [BZK12、HM15b、Muh15]。然而,转录结果仍然存在一系列实际问题,包括:(1)完整的语音被识别为一组片段,这些片段通常不能代表说话者的自然句子或段落;(2)音频识别错误不可避免,且质量差异很大;(3)语音识别算法给出的单词和片段的置信度得分有时不能反映出真实的误识别概率。这些问题已经阻碍了语音转文本工具的更广泛使用 [KRS17]。领域科学家在收集来自多个说话者的长音频时面临着有效完成以下任务的挑战: