生成对抗网(GAN)[4]被提议为计算机视觉领域中的生成建模框架。gan从训练数据样本中学习了概率分布,因此从Random Noises生成了新图像。此“学习和生成”机制建立在对手上,一个分类器作为判别模型,以确定是否直接从数据中采样图像还是由发电机生成,也是另一个具有从随机噪声生成图像的代理组件。损失功能鼓励发电机使歧视器将生成的图像分类为实际数据。正如CS231N讲座中所讨论的那样,由于生成模型的本质是检测现有数据中的概率密度,然后对Vanilla Gan及其变体产生,因此这些gan犯罪者的最终输出的最终输出被模型为输入图像的可能性,是从数据中采样的实际图像,而不是生成的。这在以前的工作中被证明是有效的。但是,我们可以考虑其他方法,其中之一是Wasserstein-Gan(Wgan),它不训练歧视者(评论家)作为分类器输出
将他们的海报分类为正确的流派是一个问题,它可以使自己可以卷积的网络网络进行卷积,并且可以证明对广告商,制作人和观众带来了巨大的好处,因为它可以帮助观众与观众更容易使观众与观众更容易使观众与Browse and Browse and browse and browse and browse和sece lect se lect电影相结合。Movie-Genre分类的先前工作已经尝试从海报中提取低级功能,使用电影本身的功能以及使用KNN和NaéveBayes的标准Resnet50体系结构。在本文中,我探讨了更深入的预先训练的传统网络(如VGG19和Resnet101)以及Alexnet的应用,以探索转移学习的生存能力和此问题的不同架构。使用IMDB电影海报数据集使用Resnet101实现了42%的最高准确性。 其他网络似乎很好地表明,改进的表现可能更多地取决于平衡数据集和功能工程,而不是在这3个网络架构之间进行更改。使用IMDB电影海报数据集使用Resnet101实现了42%的最高准确性。其他网络似乎很好地表明,改进的表现可能更多地取决于平衡数据集和功能工程,而不是在这3个网络架构之间进行更改。
月球板是攀岩社区中的标准化攀岩板弹出板,攀岩概率分为离散类别。当前,没有完美的分类器来确定概率的等级。在这里,我们提出了一种新颖的方法,用于通过提供爬升的图像作为视觉模型的输入来攀登月板攀爬。为此,我们制定了一个数据集,其中每个攀登都有一个相应的图像,其中可用。然后,我们训练了定制的CNN和预定型模型,以将这些攀爬分类为正确的难度。我们在测试数据集上实现了40%的性能,这与先前的非视觉方法相当。由于数据集显着不平衡,因此我们试图通过平均加权不同类别来平衡学习。在以这种方式平衡学习的同时,并不能改善总体结果,但导致平均班级准确性的显着提高。这里提出的另一个新颖的方法是将这个问题构建为回归而不是分类:这导致稍差的恢复,但批判性地,逐一的准确性(我们也认为,当问题放在邻近的困难中时,它是正确分类的)。最后,我们显示了显着图,以指示模型用于分类的特征,以及对错误分类问题的定性讨论。
近年来,随着 Transformer 等深度学习技术的飞速发展,深度学习已逐渐融入社会的各个领域,用于处理音频、语言和视觉等各种任务。深度学习有助于减轻医疗负担并解决复杂问题,例如模拟蛋白质折叠。随着强大的 Transformer 模型的不断发展,最近的一个重点领域是开发基础模型,以迈向通用人工智能。DINOv2 是一种最近发布的稳健特征提取模型,作为基础模型,在执行各种医疗任务(例如疾病分类和器官分割)方面取得了良好的效果。在本文中,我们尝试将 DINOv2 编码器集成到不同的模型中,从简单的自动编码器模型到更复杂的卷积 Transformer 模型,以解决更复杂的 MRI 成像图像配准问题。结果表明,DINOv2 在 Transformer 模型中有望用于解决 MRI 配准问题,未来需要研究如何集成 DINOv2 以实现更强大的 MRI 配准特征提取。
Joel Emer,Vivienne Sze,Yu-Hsin Chen,Tien-Ju Yang,Isca 2019 2019年深神经网络的教程有效处理,Vivienne Sze,Yu-Hsin Sze,Yu-Hsin Chen,Tien-Ju Yang Yang,Joel Emer,Joel Emer,Morgan,Morke emer,Morke and Morke and Claypool出版商,2020 Yakun sophia sophia shao shao shao shao shao shao shao shao shao,ucia shao,ucy ucia ucy ucy ucy u e eeee, 2020 CS231N卷积神经网络视觉识别,斯坦福大学,2020年
