de从蛋白质设计代表了蛋白质工程中的基本追求,但是当前的深度学习方法仍受其狭窄的设计范围的限制。在这里,我们提出了一个大规模的边界框架,其中包括160亿个参数,并接受了17亿个蛋白质文本对的训练,它将其与蛋白质设计空间相融合,将人类的意图转化为新的蛋白质序列。Pinal不是直接的端到端文本到序列生成,而是实现了一个两个阶段的过程:基于语言指令的首次生成蛋白质结构,然后设计以生成的结构和语言输入为条件的序列。该策略通过在更可牵引的结构域中运行有效地约束了搜索空间。通过全面的实验,我们证明,与现有方法相比,Pinal的性能优于同时工作ESM3,同时表现出对PDB数据库以外的新型蛋白质结构的强大概括。在线演示可在http://www.denovo-pinal.com/上获得。
摘要:从个人工作管理到商业操作,虚拟助手至关重要。机器学习(ML)和自然语言处理(NLP)在本文中用于改善虚拟助手系统。建议的方法始于用于强大任务自动化和预测建模的ML算法。虚拟助手可以通过研究用户行为和历史数据,提高生产率和用户体验来预测用户需求,自动化重复过程并积极建议。NLP还可以让虚拟助手理解并响应自然语言请求。助手可以使用情感分析,实体识别和语义理解来准确掌握用户意图并进行上下文回复。该框架还通过使用隐私保护ML算法并遵守数据保护法律来处理隐私和数据安全问题。用户反馈和持续学习允许虚拟助手随着时间的推移而发展。通过测试和评估,建议的框架证明了其准确性,效率和用户满意度。升级的虚拟助理系统用于客户服务,医疗保健,教育和智能家庭自动化。这项研究通过使用ML和NLP来构建符合数字环境中不同用户需求的智能,适应性和用户的系统来推动虚拟助理技术。
从远古时代到今天,人类已经进行了许多研究,以使他们的生活更轻松。由于这些研究,他们旨在发现新事物。随着工业革命,开始生产石化材料。这些材料经历了各种化学阶段的事实已成为对人类健康的威胁。此外,石油衍生的材料在本质上仍然存在数百年而没有降解,而环境问题的平行增加使人类无法寻找不同的资源。在这项工作中,提供了有关从纤维素获得的衍生物类型的一般信息,这在本质上是最常见的。©2023 DPU保留所有权利。关键字:纤维素;纤维素衍生物;纤维素乙醚衍生物;纤维素酯衍生物
该工作组由教育工作者、网络安全专家、人工智能专家、商界领袖和政府官员组成,以混合形式举办了五场公开会议。这些会议以专家小组成员和讨论为特色,分别在芝加哥、斯普林菲尔德、大都会东区、四城地区和南伊利诺伊州举行。讨论的主题包括消费者保护、生成式人工智能在课堂上的使用、利用人工智能改善公共服务、保障公民自由、解决劳动力和环境影响以及加强网络安全。通过这些会议以及多个工作组的工作,该工作组探索了 GenAI 在众多领域的当前和未来影响。
语言是人类互动核心的独特人类特征。人们使用的语言通常反映出他们的个性,意图和心态。将互联网和社交媒体整合到日常生活中,大部分人类交流都被记录为书面文本。这些在线交流形式(例如,博客,评论,社交媒体帖子和电子邮件)为人类行为提供了一个窗口,因此为行为科学提供了丰富的研究机会。在这篇综述中,我们描述了如何使用自然语言处理(NLP)来分析行为科学中的文本数据。首先,我们回顾了行为科学中文本数据的应用。第二,我们描述了NLP管道并解释基本建模方法(例如,基于字典的方法和大型语言模型)。我们讨论了这些方法对行为科学的优势和缺点,尤其是关于可解释性和准确性之间的权衡。最后,我们为使用NLP提供了可行的建议,以确保严格和可重复性。
正是在这样的背景下,伊利诺伊州颁布了立法,成立了生成式人工智能和自然语言处理工作组 (20 ILCS 1370/1-80),目的是研究 GenAI 和自然语言处理 (NLP) 技术带来的机遇和挑战。工作组的任务是研究这些技术在多个关键领域的影响,并充当一个论坛,讨论这些技术对伊利诺伊州居民和机构的影响。工作组由教育工作者、网络安全专家、人工智能专家、商界领袖和政府官员组成,以混合形式举办了五次公开会议。这些会议以专家小组成员和讨论为特色,在芝加哥、斯普林菲尔德、大都会东区、四城和南伊利诺伊州举行。讨论的主题包括消费者保护、生成式人工智能在课堂上的使用、利用人工智能改善公共服务、维护公民自由、解决劳动力和环境影响以及加强网络安全。通过这些会议以及多个工作组的工作,工作组探索了 GenAI 在众多领域的当前和未来影响。
此预印本版的版权持有人于2024年12月17日发布。 https://doi.org/10.1101/2024.12.16.628764 doi:biorxiv Preprint
HAL 是一个多学科开放存取档案库,用于存放和传播科学研究文献,无论这些文献是否已出版。这些文献可能来自法国或国外的教学和研究机构,也可能来自公共或私人研究中心。
自然语言解释(NLE)是阐明大语模型(LLM)决策背后推理的案例。已经开发了许多技术来使用LLM生成NLS。但是,像人类一样,LLM可能并不总是在第一次尝试时产生最佳的NLE。受到人类学习过程的启发,我们引入了C Ross -R Efine 1,该1分别通过部署两个LLM作为生成器和评论家来采用角色建模。代理人输出了第一个NLE,然后使用评论家提供的反馈和建议来完善这种易于解释。c ross -r efine不需要任何有监督的培训数据或附加培训。我们通过自动和人类评估使用三个最新的开源LLM验证了三个NLP任务中的C ROSS -R efine。我们选择S ELF -R Efine(Madaan等人,2023)作为基线,它仅利用自我反馈来完善解释。我们从自动评估中的发现和用户研究表明,C ROSS -R efine的表现优于S ELF -R efine。同时,C ross -r efine可以使用较少的功能LLM有效地执行,而S Elf -R efine仅通过ChatGpt产生强劲的结果。此外,我们进行了一项消融研究,以评估反馈和建议的重要性。他们俩在完善解释中起着重要作用。我们在英语和德语的双语数据集上进一步评估了c ross -r efine。
摘要。神经符号人工智能 (NeSy) 的倡导者断言,将深度学习与符号推理相结合将产生比单独使用任何一种范式都更强大的人工智能。尽管深度学习取得了成功,但人们普遍认为,即使是我们最好的深度学习系统也不太擅长抽象推理。而且由于推理与语言密不可分,因此直觉上自然语言处理 (NLP) 将成为 NeSy 的特别合适的候选对象。我们对将 NeSy 用于 NLP 的研究进行了结构化审查,目的是回答 NeSy 是否确实实现了其承诺的问题:推理、分布外泛化、可解释性、从小数据中学习和推理以及可转移到新领域。我们研究了知识表示(例如规则和语义网络、语言结构和关系结构)的影响,以及隐式或显式推理是否有助于提高承诺分数。我们发现,将逻辑编译到神经网络中的系统可以实现大多数 NeSy 目标,而其他因素(例如知识表示或神经结构类型)与实现目标没有明显的相关性。我们发现在推理的定义方式上存在许多差异,特别是与人类水平的推理有关,这会影响有关模型架构的决策并导致结论在各个研究中并不总是一致的。因此,我们主张采用更有条理的方法来应用人类推理理论以及制定适当的基准,我们希望这可以更好地理解该领域的进展。我们将数据和代码放在 github 上以供进一步分析。1
