点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
我们的模型综合了超声心动图研究中的全部信息,包括不同视角的多个视频和长达 512 个标记的临床报告文本。这标志着比以前的医学基础模型(如 BioMedCLIP 和 EchoCLIP)有了显着改进,后者仅处理单个视角、单个图像并处理长达 77 个标记的文本。为了测试此设计的影响,我们执行了视频到文本和文本到视频的零样本跨模态检索(
主要关键词