How Automated NLP Pipelines Cut Oncology Data Abstraction from Weeks to Hours
Cognizant 高级数据科学家兼 IEEE 会议发言人 Abhijit Nayak 讨论了为癌症研究构建生产级信息提取系统,以及为什么领域专业知识比模型大小更重要。 《人工智能评论》7 月份的一项调查分析了 156 项肿瘤学 NLP 研究,并发现了一种模式:Transformer 模型在研究基准上表现出色,然后崩溃 [...]
Topic Modeling Techniques for 2026: Seeded Modeling, LLM Integration, and Data Summaries
种子主题建模、与 LLM 集成以及汇总数据训练是 NLP 工具包的新鲜部分。2026 年主题建模技术帖子:种子建模、LLM 集成和数据摘要首先出现在《走向数据科学》上。
EcoFinBench – a natural language processing benchmark for economics and finance
Max Ahrens、Dragos Gorduza 和 Michael McMahon 在这篇英格兰银行论文中提出了一种新的自然语言处理基准:我们引入了 EcoFinBench,这是一个适用于经济和金融领域的自然语言处理 (NLP) 基准套件。我们跨多个特定领域的数据集全面测试大量 NLP 模型,以进行句子分类。具体来说,[...]