本文是合作成果。所有作者均做出了同等贡献,因此按字母顺序排列。该项目由霍普金斯健康商业计划 (HBHI) 的试点拨款资助。本文表达的观点为作者的观点,不一定代表亚特兰大联邦储备银行或联邦储备系统的观点。任何剩余错误均由作者负责。作者及其所属机构为:迈克尔·达登 (Michael Darden) 和丹尼尔·波尔斯基 (Daniel Polsky),约翰霍普金斯大学凯瑞商学院;大卫·道迪 (David Dowdy)、梅丽莎·马克思 (Melissa Marx) 和伊丽莎白·斯图尔特 (Elizabeth Stuart),约翰霍普金斯大学彭博公共卫生学院;劳伦·加德纳 (Lauren Gardner),约翰霍普金斯大学土木与系统工程系;巴顿·汉密尔顿 (Barton Hamilton),华盛顿大学圣路易斯分校奥林商学院;凯伦·科佩基 (Karen Kopecky),亚特兰大联邦储备银行;尼古拉斯·帕帕乔治 (Nicholas Papageorge) 和马修·扎恩 (Matthew Zahn),约翰霍普金斯大学经济学系;金伯利·鲍尔斯 (Kimberly Powers),北卡罗来纳大学吉林斯全球公共卫生学院。有关内容的问题,请向 Nicholas W. Papageorge 提出,邮箱地址为 papageorge@jhu.edu。亚特兰大联邦储备银行的工作文件(包括修订版)可在亚特兰大联邦储备银行的网站 www.frbatlanta.org 上找到。点击“出版物”,然后点击“工作文件”。要接收有关新文件的电子邮件通知,请使用 frbatlanta.org/forms/subscribe。
人类基因组项目是一个巨大的成就,为人类物种的遗传学和基因组学探索了无数的基础。多年来,人类基因组参考序列仍然不完整,并且缺乏人类遗传多样性的代表。最近,已经出现了两个重大进展来解决这些缺点:完全无间隙的人类基因组序列,例如由端粒到telomere群结的结合所开发的,以及高质量的pangenomes,例如由人类Pangenome Pangenome参考联盟中的dna序列组成和基因组合的依赖性,例如,由人类Pangenome PangeNome参考核心组成的核心和基因组合的核心,历史上难以顺序的区域,包括着丝粒,端粒和分段重复。同时,Pangenomes捕获了全世界种群中广泛的遗传多样性。共同发展了基因组学研究的新时代,增强了基因组分析的准确性,铺平了精确医学的道路,并有助于更深入地了解人类生物学。
在这项工作中,我们将Phishllm作为一种新型的基于参考的网络钓鱼检测器,无明确的预定参考列表。我们的理由在于,现代LLM的编码比任何预定义的列表都更广泛的品牌域信息。此外,检测许多网页语义(例如获得资格意图分析)更像是语言问题,但现在它们被作为视觉问题进行处理。因此,我们设计了Phishllm来解码(或检索)从LLM中解码(或检索)域品牌关系,并有效地解析网页的凭证意图,而无需维护和更新外部参考列表的成本。此外,为了控制LLMS的幻觉,我们引入了基于搜索引擎的验证机械,以消除错误信息。我们的广泛经验表明,菲什洛姆(Phishllm)的表现明显优于诸如西犬和属施氏菌(Phishpedia and Phishintention)等先进的解决方案,将召回率提高了21%,至66%,而精度为昂贵。我们的现场研究表明,Phishllm涵盖(1)零日网页的6倍,即与现有方法(例如?thimintention)相符的零日网页,(2)即使是王朝增强的零日网页网页,也要多2倍。我们的代码可在https://github.com/code-philia/phishllm/上找到。
人类基因组的测序是一个具有里程碑意义的成就,它彻底改变了我们对人类生物学的理解,从而深刻了解了特征和疾病的遗传基础以及人类进化史(53,55,86)。在人类基因组参考序列的可用性之前,人类遗传学领域在很大程度上依赖于家庭的谱系分析,细胞遗传学技术和低分辨率的遗传测定,以研究遗传疾病的原因(70)。这些早期方法有助于为统计方法奠定基础,例如关联测试,培养遗传咨询的概念,并为更复杂的分子遗传研究铺平了道路。然而,缺乏人类基因组参考序列限制了洞察力的深度和广度,尤其是对于受众多基因座基因组影响的复杂性状。从2001年的历史出版物开始(86),人类的基因组参考序列已发挥了多种作用。最重要的是作为控制人类发展,生理学和病理学许多方面的基因和调节序列的全面目录。通过诸如DNA元素百科全书(Eckode)(46)和路线图表观基因组学(124)项目等倡议增强,参考序列也使人们更深入地了解了调节元件的复杂网络,这些元件的复杂网络跨越了基因表达,塑造细胞功能和生物体跨健康和疾病状态的基因表达。在线Mendelian在MAN(OMIM)数据库中的继承证明了这一进展,该数据库现在分类了近7,000个疾病和特征的遗传基础(9)。通过促进基于家庭的联系分析和关联研究,参考序列指数级加速了突变,基因和途径的发现和表征,这些突变,基因和途径介导了各种特征和疾病中的变化。也已经确定了许多常见的遗传危险因素;截至2023年10月,全国人类基因组研究研究所 - 欧洲生物毒素格式化研究所全体基因组协会研究(GWASS)(96)包含> 500,000个关联,> 500,000个关联,> 6,500个已发表的研究。人类基因组参考序列的另一个变革性方面是其在遗传变异的鉴定和分析中的作用,这推动了人口基因和比较基因组学领域(19,80)。在最基本的级别上,参考序列充当一个分析资源和坐标系,可以精确地映射DNA序列变化。关于人群内部和人群之间遗传多样性的结果信息已提高了对进化过程的更深入的了解,例如历史迁移,人口规模的变化以及对新环境的遗传适应性。随着我们的前进,人类的基因组参考序列将在人类遗传学的不断发展的叙事中仍然是一个基石。但是,使用最广泛的参考序列
cules),文章标题用引号括起来,期刊名称用斜体表示,卷数(如果适用),期数,日期,页数(Audrey Hurel,“南威群岛:东南亚冲突的根源”,Stratégique,第 63 期,3/96,第 42 页)。
研究贡献在指挥独立研究计划已有二十年的历史时,格林博士处于绘制,顺序和了解哺乳动物基因组的努力的最前沿。他的工作包括对人类基因组项目的显着,从头到尾的参与。这些努力最终在比较基因组学方面成长为一项高生产力的计划,这些计划提供了有关基因组结构,功能和进化的重要见解。他的实验室还进行了人类遗传学研究,并鉴定了几种人类疾病基因,包括与某些形式的遗传性耳聋,血管疾病和周围神经病有关的基因。
除了总参考外,雇主还具有工资或依赖薪金的税款。这始终由:DGA SV(=社会保险公司),DB(=雇主对家庭负担补偿基金的贡献),DZ(=雇主附加费=商业经济征费的一部分= KU2),市政税(= COME),雇员外交人员收入(= MVB)用于雇员通过地下雇员。
收到2023年8月31日; 2023年12月7日接受;于2024年1月4日出版了作者分支:1麦吉尔大学医学系,蒙特利尔,魁北克H4A 3J1,加拿大; 2个细菌共生体进化,加拿大魁北克H7V 1B7,Inrs-Centre-Centre Armand-FrappierSantéBiotechnologie; 3宾夕法尼亚州立大学宾夕法尼亚州立大学动物科学系16802-3500; 4 McGill International TB Center,McGill University,蒙特利尔,魁北克H4A 3S5,加拿大。*信件:路加·哈里森(Luke B.基于参考的对齐;参考基因组。缩写:AIC,Akaike的信息标准; ATCC,美国类型文化收藏;床,浏览器可扩展数据; GATK,基因组分析工具包; Hal,分层对齐; IGV,综合基因组观众; MRCA,最终的共同祖先; MTBC,结核分枝杆菌复合物; NCBI,国家生物技术信息中心; NGS,下一代测序; PGAP,原核基因组注释管道; PHAST,具有空间/时间模型的系统发育分析; Rd,差异区域; RVD,[H37] RV-DETEATION; SNP,单核苷酸多态性; SRA,序列阅读档案; TBD1,结核分枝杆菌 - 特异性缺失1。数据语句:文章或通过补充数据文件中提供了所有支持数据,代码和协议。本文的在线版本可以使用五个补充表和三个补充数据。001165©2024作者