在量子磁学实验室 (LQM),我们进行磁学和相关电子材料的基础研究。我们的核心活动包括新材料的合成、内部实验技术、低温、高压和高磁场、中子和 X 射线散射以及理论和建模。LQM 隶属于洛桑联邦理工学院 (EPFL),该学院是世界著名的研究和教育中心,提供理想的学术环境以及与工业的良好联系。
自由电子激光器(FEL)设施的激光优化是一项耗时且具有挑战性的任务。不是由经验丰富的运营商手动操作,而是实施机器学习算法为FEL激光优化提供了快速且适应性的方法。最近,在真空紫外线设施-Dalian Cooherent Light Source(DCLS)上进行了这样的实验。已采用了四种算法,即标准和基于神经网络的遗传算法,深层确定性的策略梯度和软演员评论家加强学习算法,通过优化电子束轨迹来增强FEL强度。这些算法在增强FEL激光方面表现出显着的功效,尤其是仅在大约400次迭代范围内实现了收敛的增强学习。这项研究证明了机器学习算法用于FEL激光优化的有效性,从而提供了关于DCL自动操作的前瞻性观点。
已有15年了,基因疗法一直被视为遗传性视网膜疾病的希望的灯塔。许多临床前研究都集中在具有最大基因表达能力的载体周围,但是尽管基因转移有效,但在各种纤毛病中仍观察到了最小的生理改善。色素型视网膜炎28(RP28)是FAM161A中Bi-Callelic null突变的结果,Fam161a是连接纤毛(CC)结构的必不可少的蛋白质。在缺席的情况下,纤毛杂乱无章,导致外部片段崩溃和视力障碍。在人类视网膜中,FAM161A有两个同工型:带外显子4的长度,而没有它的短。为了恢复FAM161A中的CC,在纤毛混乱开始后不久,我们将AAV载体与启动子活性,剂量和人类同工型进行了比较。虽然所有矢量都改善了细胞存活,但仅使用弱FCBR1-F0.4启动子启用了两种同工型的组合,启用了CC中的精确FAM161A升级和增强的视网膜功能。我们对RP28的FAM161A基因置换的调查强调了精确治疗基因调节,适当的载体给药和两种同工型的递送的重要性。此精度对于涉及FAM161A等结构蛋白的安全基因疗法至关重要。
结果:我们开发了一种基于指导的学习范式,该范式将生物医学NER从序列标记任务转换为一代任务。此范式是端到端的,并通过自动重新利用先前存在的生物医学NER数据集来简化培训和评估过程。,我们使用拟议的范式将llama-7b作为基础LLM进一步开发了Bioner-lalama。我们对三个公认的生物医学数据集进行了对Bioner-lalama的广泛测试,该数据集由与疾病,化学物质和基因有关的实体组成。结果表明,与具有不同生物医学实体的数据集中的GPT-4相比,Bioner-lalama始终达到的F1得分范围从5%到30%。我们表明,通用域LLM可以与严格微调的PubMedbert模型和PMC-llama(生物医学特异性语言模型)相匹配。我们的发现强调了我们提出的范式在开发一般域LLM中的范式,这些范式可以与生物医学和健康应用中的多任务,多域中的SOTA表现相媲美。
为高性能选择应用设计二维卤化物钙钛矿需要深入了解控制其兴奋性行为的结构 - 陶艺关系。然而,尚未开发出由A位点和间隔阳离子进行修饰的内部和层间结构的设计。在这里,我们使用压力来协同调整内部和层间结构,并发现结构调制,从而改善了光电子的性能。在施加的压力下,(Ba)2(ga)Pb 2 I 7表现出72倍的光致发光和光电导率增长10倍。基于观察到的结构变化,我们引入了一个结构描述符χ,该结构描述χ描述了内部和间层间特性,并在χ和光致发光量子量产率之间建立了一般的定量关系:较小的χ与最小化的捕获激子的激子以及来自自由激子的最小生效发射。根据此原理构建,我们设计了一个钙钛矿(CMA)2(FA)Pb 2 I 7,该7 7具有较小的χ和令人印象深刻的光致发光量子产率为59.3%。
Diffusion models [17, 33, 35] have emerged as a promising generative approach to produce high- quality samples, which is observed to outperform generative adversarial nets on image and audio synthesis [9, 23], and underpins the recent success in text-to-image creators such as DALL · E2 [30] and Stable Diffusion [31], and the text-to-video generator Sora [26]。尽管不同的使用模型可以捕获复杂且高维数据分布,但它们可能与偏见或公平关注的来源相比[25],并且训练过程(尤其是对于上述大型模型)会占据相当大的时间和extert。就产生的样品质量和可控性而言,对改善分解模型的兴趣越来越大。一种直接的方法是使用预验证的(Di usion)模型作为基本模型来定制为特定任务定制的采样器。例如,在图像/视频生成中,我们旨在提高散析模型,以增强美学质量并防止扭曲的内容。随着人类相互交互平台(例如Chatgpt)的出现,有很大的需求将生成模型与用户/人类的偏好或反馈保持一致。最近的工作[2,11,12]提出了通过增强学习(RL)和[44]通过直接偏好优化进行填充模型。在这些工作中,奖励功能是通常学习的统计模型,例如图像生成中的美学奖励是人类评估者真正美学偏好的排名模型。上面的方法允许将扩散模型填充以生成具有较高名义奖励的样品。有限数量的人类评级。)但是,它们可能导致灾难性的遗忘或奖励崩溃[36],这是一种指的现象,指的是过度付出的奖励(例如,由例如换句话说,就某些可能无法概括的人等级分数而言,分散模型是对某些人评分的细分。专门利用奖励也损害了多样性,这是生成建模的核心。为了减轻奖励崩溃并增强多样性,[41]提议在损失目标中添加相对于预算模型的熵调节器。这产生了熵调查的细胞调整,这是预处理模型产生的倾斜度倾斜,可以看作是“软”的分歧指导[9,18]。开发了一种随机控制方法来效仿
外部腔内波长激光,其特征在于其特殊的时间连贯性和广泛的调谐范围,它是尖端的纤维感应,例如纤维传感,刺激和光谱镜的至关重要的光源。光学通信技术的新兴增长升级了对线宽和广泛调整范围狭窄的激光器的需求,从而促进了外部波长 - 腔内扫描二极管激光及其多样化应用的迅速发展。本文全面地介绍了这些激光器的配置和操作原理,并对其发展状态进行了深入的审查,专门针对那些具有狭窄线宽和较宽调整范围的人。目的是为参与波长激光的开发和应用的研究人员提供宝贵的参考。
摘要:这个问题已经从固体吸附剂是否可以在直接空气捕获(DAC)技术中起作用,而固体吸附剂在经济上更加优势。由于许多不同但相互联系的吸附特性对CO 2捕获成本的影响,确定这一点是具有挑战性的。现有的DAC经济模型通过将其视为简单的替代率,忽略了诸如容量损失率和形式之类的关键因素,从而使吸附剂的稳定性过高。为了应对这一挑战,我们已经开发了一种经济模型,该模型解释了DAC过程中吸附剂的退化。通过考虑随着时间的推移能力损失的考虑,我们的模型提供了与DAC相关的成本的更准确估计,并突出了吸附剂更换的最佳时间。然后,我们确定了吸附剂的特征和过程特征,这些特征和过程特征使碳足迹和捕获的CO 2的成本最小化。为了进一步研究吸附特性和DAC成本的相互作用,我们构建了一系列烷基和环氧功能化的多胺吸附剂。吸附剂的CO 2吸收,吸附热和容量褪色的热量通过一步修改调节,改变了原发性,次级和第三级胺的比例。然后,我们将实验测量的参数(包括退化的形式)集成到了我们的经济模型中,以探测哪种吸附特性的组合导致DAC的最低成本对于固定工作条件。结果为吸附性能指标提供了指南和优先级,这些指标将产生最具成本效益的DAC技术。
摘要在广泛的自然语言处理应用程序中大型语言模型(LLM)的最新成功为通往新的问答系统而不是知识图表的途径开辟了道路。然而,阻止其实施的主要障碍之一是缺乏将问题转化为相应的SPARQL查询的培训数据,尤其是在特定领域的KG中。为了克服这一挑战,在这项研究中,我们评估了几种策略,以微调Openllama LLM,以回答有关生命科学知识图的问题。特别是,我们提出了一种端到端数据增强方法,用于将一组现有查询扩展到给定知识图上,向较大的语义丰富的问题到SPARQL查询对的较大数据集,即使对于这些对稀缺的数据集也可以进行微调。在这种情况下,我们还研究了语义“线索”在查询中的作用,例如有意义的变量名称和内联评论。最后,我们评估了对现实世界中BGEE基因表达知识图的方法,并且与具有随机变量名称的基线相比,语义线索可以将模型性能提高高达33%,而没有评论。
(未经同行评审认证)是作者/资助者。保留所有权利。未经许可不得重复使用。此预印本的版权所有者此版本于 2024 年 1 月 31 日发布。;https://doi.org/10.1101/2023.10.30.564829 doi:bioRxiv preprint