Gregory G. Dess是德克萨斯大学达拉斯分校的Andrew R. Cecil管理主席。他的主要研究兴趣是战略管理,组织环境关系和知识管理。他在学术和从业者期刊上发表了许多有关这些主题的文章。他还在各种以从业者为导向和学术期刊的编辑委员会中任职。在2000年8月,他被入选《管理学院名人堂》作为其特许成员之一。DES教授在美国,欧洲,非洲,香港和澳大利亚进行了执行计划。在1994年,他是葡萄牙Oporto的富布赖特学者。2009年,他获得了伯尔尼大学(瑞士)的荣誉博士学位。他获得了华盛顿大学(西雅图)的工商管理博士学位,并获得了佐治亚理工学院的BIE学位。
# Springer-Verlag Berlin Heidelberg 2011 本作品受版权保护。保留所有权利,无论涉及全部还是部分材料,具体而言是翻译、重印、重新使用插图、朗诵、广播、以缩微胶片或任何其他方式复制以及存储在数据库中的权利。 仅根据 1965 年 9 月 9 日现行版本的德国版权法的规定,才允许复制本出版物或其中的部分内容,并且必须始终获得 Springer 的使用许可。违反者将根据德国版权法受到起诉。 本出版物中使用的一般描述性名称、注册名称、商标等并不意味着(即使在没有具体声明的情况下)这些名称不受相关保护法律和法规的约束,因此可以自由使用。
摘要。视觉语言预处理(VLP)模型已在众多计算机视觉应用中被证明。在本文中,我们基于图像扫描和电子健康记录中的文本介绍,为医疗领域开发VLP模型,以促进计算机辅助诊断(CAD)。为了实现这一目标,我们介绍了MedBlip,这是一种轻巧的CAD系统,该系统启动了从架子冻结的预训练的图像编码器和大型语言模型中启动VLP。我们合并了一个MEDQFormer模块,以弥合3D医学图像和2D预训练的图像编码器和语言模型之间的差距。为了评估MEDBLIP的有效性,我们从五个公共阿尔茨海默氏病(AD)数据集中收集了30,000多个图像量:ADNI,NACC,OASIS,OASIS,AIBL和MIRIAD。在这个大规模的广告集中,我们的模型在健康,轻度认知障碍(MCI)和AD主题的零摄像分类中表现出了令人印象深刻的表现,并且还显示了其在M3D-VQA-AD数据集中的医学视觉问题An-Swering(VQA)中的能力。代码和预训练模型可在https://github.com/qybc/medblip上找到。
本文解决了生成法定说明(CES)的挑战,涉及识别和修改最少的必要特征,以使分类器对给定图像的预测进行预测。我们提出的方法是反事实e xplanations(Time)的tept to-i mage m odels,是一种基于蒸馏的黑盒反事实技术。与以前的方法不同,此方法仅需要图像及其预测,从而忽略了分类器的结构,参数或梯度的需求。在生成反事实之前,时间将两个不同的偏见引入了文本嵌入的形式稳定扩散:与图像的结构相关联的上下文偏差和类别偏见,与目标分类器学到的类特异性特征相关。学习了这些偏见后,我们发现了使用类预测的类令牌的最佳潜在代码,并使用目标嵌入作为条件,从而产生了符合性的解释。广泛的经验研究证明,即使在黑色盒子设置中运行时,时间也可以产生可比性的解释。
• 使用潜意识、操纵或欺骗手段扭曲行为,妨碍知情决策,造成重大伤害。 • 利用与年龄、残疾或社会经济状况相关的弱点扭曲行为,造成重大伤害。 • 生物特征分类系统推断敏感属性(种族、政治观点、工会会员资格、宗教或哲学信仰、性生活或性取向),但标记或过滤合法获取的生物特征数据集,或执法部门对生物特征数据进行分类的情况除外。 • 社会评分,即根据社会行为或个人特征对个人或群体进行评估或分类,对这些人造成有害或不利的待遇。 • 仅根据分析或性格特征评估个人犯罪的风险,但用于增强基于与犯罪活动直接相关的客观、可验证事实的人类评估的情况除外。 • 通过从互联网或闭路电视录像中无针对性地抓取面部图像来编制面部识别数据库。 • 在工作场所或教育机构推断情绪,医疗或安全原因除外。 • 在公共场所为执法部门提供“实时”远程生物特征识别 (RBI),但以下情况除外:
由于其广泛的应用范围,从文本描述中产生人类动作已引起了越来越多的研究兴趣。但是,只有少数作品将人类场景的互动与文本条件一起考虑,这对于视觉和物理现实主义至关重要。本文提出了在3D门场景中产生人类动作的任务,鉴于人类习惯的文本描述。由于文本,场景和运动的多种形式性质以及对空间推理的需求,此任务提出了挑战。为了应对这些挑战,我们提出了一种新方法,将复杂的概率分解为两个更可管理的子问题:(1)目标对象的语言接地和(2)以对象为中心的信息产生。对于目标对象的语言基础,我们利用大型语言模型的力量。对于运动生成,我们设计了一个以对象为中心的场景代表生成模型,以专注于目标对象,从而降低场景的复杂性并促进人类运动与对象之间关系的建模。实验证明了与基准相比,我们的方法的更好运动质量并验证了我们的设计选择。代码将在链接上可用。
文本引导的图像编辑可以在支持创意应用程序方面具有变革性的影响。关键挑战是生成忠于输入文本提示的编辑,同时与输入图像一致。我们提出了Imagen Edor,这是一种构建的级联扩散模型,通过对文本引导的图像插入的微调[36]构建。Imagen ed- Itor的编辑忠实于文本提示,这是通过使用对象探测器在培训期间提出涂料面罩来提出的。此外,成像编辑器在输入图像中通过对原始高分辨率图像进行调节管道来详细信息。为了证明定性和定量评估,我们介绍了EditBench,这是用于文本指导图像插入的系统基准。EditBench评估在Natu-ral和生成的图像上探索对象,属性和场景的图像。Through extensive human evaluation on EditBench, we find that object-masking during training leads to across- the-board improvements in text-image alignment – such that Imagen Editor is preferred over DALL-E 2 [ 31 ] and Stable Diffusion [ 33 ] – and, as a cohort, these models are better at object-rendering than text-rendering, and handle mate- rial/color/size attributes better than count/shape attributes.
近年来,生成模型取得了重大进展,尤其是在文本到图像合成领域。尽管取得了这些进展,但医学领域尚未充分利用大规模基础模型的功能来生成合成数据。本文介绍了一种文本条件磁共振 (MR) 成像生成框架,解决了与多模态考虑相关的复杂性。该框架包括一个预先训练的大型语言模型、一个基于扩散的提示条件图像生成架构和一个用于输入结构二进制掩码的附加去噪网络。实验结果表明,所提出的框架能够生成与医学语言文本提示一致的逼真、高分辨率和高保真的多模态 MR 图像。此外,该研究根据文本条件语句解释了生成结果的交叉注意力图。这项研究的贡献为未来文本条件医学图像生成的研究奠定了坚实的基础,并对加速医学成像研究的进步具有重要意义。
抽象的消费者生成的评论在建立信任和促进数字平台上的交易方面起着决定性的作用。但是,先前的研究表明了各种问题,例如,只有少数提供评论,伪造评论和不确定的评论的消费者。我们在餐厅预订平台的背景下使用一个实验来研究不一致的评论对消费者交易决策期限的影响。在第二个实验中,我们研究了审查不一致的情况下的审查组件的相对重要性。利用双重过程理论和媒体丰富性理论,我们预测不一致的评论会导致消费者交易决策(H1)所需的更长的时间,并导致用户的交易决策主要基于定性组成部分(H2)。尽管我们没有找到不一致的餐厅评论对交易决策的持续时间不一致的一般支持,但我们发现证据表明,对于不一致的餐厅评论,定性组成部分的极性对于交易决策的持续时间和决策本身至关重要。
Atlassian是Jira,Trello和Confluence背后的公司,在其产品中收到了大量的客户反馈。最初,他们依靠手动分析和基于NLP的工具来分类和解释这些数据。但是,随着反馈量的增长,NLP的局限性变成了瓶颈。
