文本对图像(T2I)模型驱动了许多用例,例如在图像生成和编辑中以及场景理解。在此技术报告中,我们概述了Google Imagen家族中最新模型的培训和评估,Imagen3。在其默认配置下,Imagen 3以1024×1024分辨率生成图像,然后可以进行2×,4×或8×UPS采样。我们对其他最先进的T2I模型描述了我们的评估和分析。我们发现Imagen 3比其他模型更优选。特别是,它在光真相和遵守长而复杂的用户提示方面表现良好。部署T2i模型引入了许多新的挑战,我们详细描述了专注于了解与该模型家族相关的安全性和责任风险,以及我们为减少潜在危害的努力。
Imagene 凭借其经过验证的准确性从竞争解决方案中脱颖而出。它建立了接近临床流程的基础设施和部署模型,以验证临床环境中的生物标志物检测模式。该公司了解在临床环境中证明其解决方案的独特价值的重要性。Imagene 进行了多项合作研究和验证。Ichilov 和 Sheba 医疗中心的肺癌患者也在接受新技术的测试。最近与 Sheba 医疗中心在《现代病理学》上发表了一篇科学论文,研究:“使用深度学习算法从苏木精和伊红染色的载玻片中直接识别非小细胞肺癌中的 ALK 和 ROS1 融合”呈现出前所未有的准确度,可与金标准技术相媲美。4