NLP关键词检索结果

2026 年主题建模技术:种子建模、LLM 集成和数据摘要

Topic Modeling Techniques for 2026: Seeded Modeling, LLM Integration, and Data Summaries

种子主题建模、与 LLM 集成以及汇总数据训练是 NLP 工具包的新鲜部分。2026 年主题建模技术帖子:种子建模、LLM 集成和数据摘要首先出现在《走向数据科学》上。

EcoFinBench – 经济和金融自然语言处理基准

EcoFinBench – a natural language processing benchmark for economics and finance

Max Ahrens、Dragos Gorduza 和 Michael McMahon 在这篇英格兰银行论文中提出了一种新的自然语言处理基准:我们引入了 EcoFinBench,这是一个适用于经济和金融领域的自然语言处理 (NLP) 基准套件。我们跨多个特定领域的数据集全面测试大量 NLP 模型,以进行句子分类。具体来说,[...]

评估数据质量在训练双语语言模型中的作用

Assessing the Role of Data Quality in Training Bilingual Language Models

双语和多语言语言模型为跨不同语言和用户扩展 NLP 系统提供了一条有前途的道路。然而,它们的性能通常在不同语言之间存在很大差异,因为先前的研究表明,添加更多语言可能会降低某些语言(例如英语)的性能,同时改善其他语言(通常是数据受限的语言)。在这项工作中,我们通过比较双语和单语语言模型来调查这些不一致的原因。我们的分析表明,不平等的数据质量(而不仅仅是数据数量)是性能的主要驱动因素......

语义掌握:通过高级自然语言理解增强法学硕士

Semantic Mastery: Enhancing LLMs with Advanced Natural Language Understanding

大型语言模型(LLM)极大地提高了执行 NLP 任务的能力。然而,更深入的语义理解、上下文连贯性和更微妙的推理仍然很难获得。本文讨论了通过更先进的 NLU 技术(例如语义解析、知识整合和上下文强化学习)推进法学硕士发展的最先进方法。我们分析了结构化知识图、检索增强生成(RAG)以及将模型与人类理解水平相匹配的微调策略的使用。此外,我们解决...