摘要 - 我们开发并验证了一种仪器,以衡量数据可视化中感知的可读性:previs。研究人员和从业人员可以轻松地使用此工具作为评估的一部分,以比较不同视觉数据表示的可读性。我们的工具可以补充有关用户任务性能的受控实验的结果,或在开发新技术时在深入的定性工作中提供其他数据。尽管可读性被认为是数据可视化的基本质量,但到目前为止,在视觉表示的背景下还没有对构造的统一定义。因此,研究人员通常缺乏确定如何要求人们评估其可视化可读性的指导。为了解决这个问题,我们进行了一个严格的过程,以开发针对视觉数据表示的主观可读性的第一个验证工具。我们的最终仪器由4个维度的11个项目组成:可理解性,可理解性清晰度,数据值的可读性和数据模式的可读性。我们将调查表作为文档提供,其中包含OSF.IO/9CG8J的实施指南。除了该工具之外,我们还讨论了研究人员以前如何评估可视化的可读性,以及对视觉数据表示中感知可读性的因素的分析。
社会科学的研究人员对越来越多的机构的后果感兴趣。可能在国家之间进行协商的机构可能会在微观上产生后果,因为当地人口调整了他们的期望,甚至最终甚至最终将其行为考虑到机构规则。然而,大尺度的细粒分析测试了该机构本地机构的复杂证据很少见。本文侧重于关键机构:国际边界。使用计算机视觉技术,我们表明可以产生特定地理,验证和可复制的方式来表征边界的透明度,这意味着我们意味着能够视觉检测物理空间中国际边界的存在。我们开发和比较了计算机视觉技术,以自动估计来自世界上每个边界的627,656个图像瓷砖的可读性得分。我们评估了统计和数据驱动的计算机视觉方法,发现在一小部分人类判断的一小部分审计的视觉识别模型中,我们能够在全球范围内产生与人类可读性概念良好相符的局部知名度得分。最后,我们将这些分数解释为国家边界取向的有用近似,这一概念以前的文献用来捕获国家在边境地区进行的可见投资,以维持管辖权的领土。我们使用人类判断和五个法令验证指标来验证我们的测量策略。
在实际教育应用中,广泛需要对书籍级长文本进行可读性评估。然而,目前大多数研究都集中在段落级可读性评估,对超长文本的处理工作很少。为了更好地处理长序列的书籍文本并利用难度知识增强预训练模型,我们提出了一种新颖的模型 DSDR、难度感知片段预训练和难度多视图表示。具体来说,我们将所有书籍分成多个固定长度的片段,并采用无监督聚类来获得难度感知片段,这些片段用于重新训练预训练模型以学习难度知识。因此,长文本通过对具有不同难度级别的多个片段向量进行平均来表示。我们构建了一个新的儿童分级读物数据集来评估模型性能。我们提出的模型取得了令人满意的结果,优于传统的 SVM 分类器和几种流行的预训练模型。此外,我们的工作为书籍级可读性评估建立了一个新的原型,为未来相关研究提供了重要的基准。
IDCC25 作者和审稿人使用生成式 AI 工具的指南 本指南基于:Lin, Z. (2024)。面向学术出版的 AI 政策框架,认知科学趋势,28(2),85-88。检索自 https://doi.org/10.1016/j.tics.2023.12.002 定义 生成式 AI 是一种人工智能技术,可以生成各种类型的内容,包括文本、图像、音频和合成数据。示例包括但不限于 ChatGPT、NovelAI、Gemini、Jasper AI、Rytr AI、DALL-E 等。出版道德 | 爱思唯尔政策。(nd)。爱思唯尔。 2024 年 5 月 9 日检索自 https://www.elsevier.com/about/policies-and-standards/publishing-ethics 作者指南 如果使用生成式人工智能开发投稿或投稿的任何部分,则必须描述其用途和目的。作者应准备好提供有关其投稿中所用工具和生成内容的提示的信息。作者有责任对人工智能生成的内容进行适当审查,以避免不准确和抄袭。使用生成式人工智能创建内容并不意味着相关工具的作者身份。 为本指南提供指导的出版商政策:出版伦理最佳实践指南 | Wiley。(nd)。2024 年 5 月 9 日检索自 https://authorservices.wiley.com/ethics-guidelines/index.html#22 ChatGPT 和生成式人工智能。(2023 年 1 月 27 日)。 SAGE Publications Inc. https://us.sagepub.com/en-us/nam/chatgpt-and-generative-ai 审稿人指南 审稿人不得将稿件或稿件的任何部分上传到生成式 AI 工具中,即使是为了改善其审稿的语言和可读性。这是基于对稿件中个人数据和/或专有信息的机密性的尊重,以及通过防止它们成为训练数据集的一部分来尊重知识产权。此外,审稿过程是一项人类活动
在本研究中,我们分析了大量英语在线媒体文章,这些文章涵盖了全基因组关联研究 (GWAS),体现了使用计算方法研究生物科学科学传播的趋势。我们分析了 2005 年至 2018 年间发布的 5,000 多个网站中的媒体报道、可读性、主题以及对伦理和社会问题的提及趋势,这些网站来自 3,555 篇关于 1,943 种不同特征的 GWAS 出版物,这些出版物通过 GWAS 目录使用文本挖掘方法确定,以提供有关遗传素养和媒体报道的讨论。我们发现 22.9% 的 GWAS 论文引起了媒体的关注,但大多数论文的描述语言过于复杂,公众无法理解。伦理问题很少被提及,而对翻译的提及随着时间的推移而增加。我们使用回归模型 (r2 = 38.7%),根据出版年份、已识别的遗传关联数量、研究样本量和期刊影响因子预测了媒体关注度。我们发现,睡眠类型、教育程度、酒精和咖啡消费、性取向、晒黑和头发颜色受到的关注度远远超过回归模型的预测值。我们还评估了“一个基因,一种疾病”标题的流行程度(例如,“科学家说他们发现了导致乳腺癌的基因”),发现它正在下降。总之,在线媒体对 GWAS 的报道应该更容易理解,引入更多现代遗传学术语,并在适当的时候提及 ELSI。科学传播研究可以从大数据和文本挖掘技术中受益,这些技术使我们能够研究数千个媒体渠道的报道趋势和变化。您可以在我们为本文建立的网站上以交互方式浏览结果:https://jjmorosoli.shinyapps.io/newas/ 。
摘要:化学家现在已经合成了在标准Terran DNA中发现的四种标准核苷酸(鸟嘌呤,腺嘌呤,胞嘧啶和胸腺嘧啶)中添加核苷酸的新型DNA。今天在分子诊断中使用了这种“人为扩展的遗传信息系统”;支持定向进化以创建医学上有用的受体,配体和催化剂;并探索与生命早期演变有关的问题。进一步的应用受到无法直接序列DNA含有非标准核苷酸的限制。纳米孔测序非常适合此目的,因为它不需要酶促合成,扩增或核苷酸修饰。在这里,我们采取了第一步来实现8个字母“ Hachimoji”的纳米孔测序,通过使用MSPA(smegmacterium smegmatis porin a)纳米孔评估其纳米孔信号范围,扩展了DNA字母。我们发现Hachimoji DNA在纳米孔测序中表现出比单独标准DNA更广泛的信号范围,并且Hachimoji单碱基取代是可以高度置信的。由于纳米孔测序依赖于分子电机来控制DNA的运动,因此我们通过跟踪Hachimoji DNA的单个Hel308分子的易位来评估HACHIMOJI DNA的易位,从而评估了HACHIMOJI DNA的hel308运动酶与非标准核苷酸的兼容性,从而监测了酶基因酶的eNzeme disnzeme disnzeme disna。我们发现HEL308与Hachimoji DNA兼容,但是与N-糖苷相比,在C-糖苷核苷上行走时会更频繁地分离。c-糖化核苷通过HEL308中的特定位点会诱导更高的解离可能性。这强调了优化纳米孔测序电机以处理不同的糖苷键的需求。它还可以为未来的替代DNA系统的设计提供信息,这些系统可以与现有电动机和毛孔进行测序。
从我们醒来的那一刻到我们结束一天的那一刻,我们都在使用由书面文字构建的界面。几个世纪以来,文本信息仍然是人类信息获取的基石。智能手机、平板电脑、电子阅读器和个人电脑的广泛普及,已将大部分阅读从僵硬的纸张转移到数字内容。在过去 15 年中,我们通过数字阅读获取的信息量迅速增长,并且还在继续增长。与此同时,美国的识字率却低得惊人:1.3 亿 16 至 74 岁的美国成年人(占总人口的 54%)的阅读水平低于六年级(Rothwell,2020 年)。令人震惊的是,根据美国国家教育统计中心 2022 年的一份报告,幼儿阅读成绩出现了自 1990 年以来的最大降幅(美国教育部,2022 年)。此外,阅读障碍是最常见的语言学习障碍,影响着 15-20% 的人口,占所有学习障碍患者的 80-90%(国际阅读障碍协会,2022 年;耶鲁阅读障碍与创造力中心,2022 年)。正如我们在此所述,可读性研究从根本上针对每个读者的需求采取了个性化的方法。每个读者,即使是那些可能没有困难的读者,都有自己的阅读障碍。
万维网的发展使得人们可以随时随地轻松访问大量信息源,这为更多人依赖在线新闻媒体而非印刷媒体铺平了道路。这种情况加速了在线新闻行业的快速增长,并带来了巨大的竞争压力。在这项工作中,我们提出了一组混合特征,用于在发布前预测在线新闻的流行度。从新闻文章中提取了两类特征,第一类是常规特征,包括元数据、时间、上下文和嵌入向量特征,第二类是增强特征,包括可读性、情感和心理语言学特征。除了分析常规特征和增强特征的有效性外,我们还将这些特征结合起来,得出了一组混合特征。我们整理了一个印度新闻数据集,该数据集由来自评分最高的印度新闻网站的新闻文章组成,用于研究,并为未来的研究贡献了数据集。对印度新闻数据集 (IND) 进行评估,并使用各种监督机器学习模型将其与基准可混合数据集上的性能进行比较。我们的结果表明,所提出的增强特征与常规特征的混合对于在发布前预测在线新闻流行度非常有效。
本文提及的多种产品和公司名称可能是其各自公司的商标和/或注册商标。GS1 US 代表参与制定本文的各方发布本文,并不表示本文中讨论或推荐的任何方法、产品和/或系统不侵犯任何第三方的知识产权。GS1 US 尚未进行搜索以确定实施本文中包含的任何策略或建议可能侵犯哪些知识产权。GS1 US 在此声明,对于任何一方因实施本文中包含的任何策略或建议而侵犯知识产权的行为,GS1 US 不承担任何责任。