BalCapRL: A Balanced Framework for RL-Based MLLM Image Captioning
图像字幕是计算机视觉中最基本的任务之一。由于其开放性,它在多模态大语言模型(MLLM)时代受到了极大的关注。为了追求更加详细和准确的字幕,最近的工作越来越多地转向强化学习(RL)。然而,现有的字幕强化学习方法和评估指标通常强调字幕质量的狭隘概念,从而导致字幕核心维度之间的权衡。例如,以实用为导向的目标可能会鼓励嘈杂、幻觉或过长的字幕……
Rapid directed evolution guided by protein language models and epistatic interactions | Science
蛋白质工程受到通过高维序列空间寻找协同突变组合的低效搜索的限制。传统方法使用逐步突变堆叠,而机器学习方法需要广泛的...
Advanced Pandas Patterns Most Data Scientists Don’t Use
学习方法链接、pipe()、高效联接、优化的 groupby 操作和向量化逻辑,以编写更快、更清晰的 pandas 代码
ProVenTL:用于预测来自蛇毒的肽-蛋白质相互作用用于癌症治疗的迁移学习框架摘要肽-蛋白质相互作用(PepPI)的准确预测对于推进基于肽的抗癌药物设计至关重要。在本研究中,我们介绍了 ProVenTL,这是一种计算机辅助分子设计框架,它利用迁移学习和蛋白质语言模型嵌入来增强 PepPI 预测的准确性和可解释性。探索了两种互补策略:(i) 使用 Calloselasma rhodostoma 毒液肽和癌症相关蛋白的精选数据集对来自蛋白质数据库 (PDB) 的大规模 PepPI 数据进行预训练的 CAMP 模型,以及 (ii) 将 ProtT5 嵌入与堆叠自动编码器深度神经网络 (SAE-DN