Evaluating OCR-to-Markdown Systems Is Fundamentally Broken (and Why That’s Hard to Fix)
评估将 PDF 或文档图像转换为 Markdown 的 OCR 系统远比看上去复杂。与纯文本 OCR 不同,OCR 到 Markdown 需要模型同时恢复内容、布局、阅读顺序和表示选择。今天的基准测试试图通过字符串匹配、启发式的组合来对此进行评分
Academic writing and spaces of resistance
作者:凯特·卡拉瑟斯·托马斯 (Kate Carruthers Thomas) 在 SRHE 2025 年年会上,我发表了一篇论文,其中认为社区、合作和关怀是我为女性学者推动的写作小组和静修会的关键要素。我使用了梅西的启发式装置……继续阅读 →