Pico-Banana-400K: A Large-Scale Dataset for Text-Guided Image Editing
多模态模型的最新进展展示了卓越的文本引导图像编辑功能,GPT-4o 和 Nano-Banana 等系统树立了新的基准。然而,由于缺乏根据真实图像构建的大规模、高质量且可公开访问的数据集,研究界的进展仍然受到限制。我们推出 Pico-Banana-400K,这是一个用于基于指令的图像编辑的综合 400K 图像数据集。我们的数据集是通过利用 Nano-Banana 从 OpenImages 集合中的真实照片生成不同的编辑对来构建的。有何区别......
This Puzzle Shows Just How Far LLMs Have Progressed in a Little Over a Year
GPT-4o 需要 2 个小时才能解决的问题,Sonnet 4.5 只需 5 秒就能解决。这篇文章《这个谜题显示了法学硕士在一年多一点的时间里取得了多大进展》首先出现在《走向数据科学》上。