早期药物发现受到初始命中识别和先导化合物优化及其相关成本的限制(1)。超大型虚拟筛选(ULVS)涉及对大量分子进行虚拟评估以与大分子靶标结合,能够显著缓解这些问题,正如最近多项研究所证明的那样(2-7)。尽管 ULVS 具有巨大潜力,但迄今为止,它仅探索了化学空间和可用对接程序的一小部分。在这里,我们介绍了 VirtualFlow 2.0,这是第一个专用于超大型虚拟筛选的开源药物发现平台的下一代产品。VirtualFlow 2.0 提供了来自 Enamine 的 REAL Space,其中包含 690 亿个“即用型对接”格式的类药物分子,这是迄今为止同类库中最大的一个。我们提供了一个 18 维矩阵,可通过 Web 界面直观地探索库,其中每个维度对应于配体的分子特性。此外,VirtualFlow 2.0 支持多种可大幅降低计算成本的技术,包括一种称为自适应靶标引导虚拟筛选 (ATG-VS) 的新方法。通过对库的代表性稀疏版本进行采样,ATG-VS 可识别超大化学空间中与靶位点结合潜力最大的部分,从而大幅降低计算成本,最高可达 1000 倍。此外,VirtualFlow 2.0 支持最新的基于深度学习和 GPU 的对接方法,可将速度进一步提高两个数量级。VirtualFlow 2.0 支持 1500 种独特的对接方法,提供靶标特定和共识对接选项以提高准确性,并能够筛选新型配体(如肽)和靶标受体(包括 RNA 和 DNA)。此外,VirtualFlow 2.0 还具有许多先进的新功能,例如增强的 AI 和云支持。我们在 AWS 云中展示了高达 560 万个 CPU 的完美线性扩展行为,这是并行云计算的全球新纪录。由于其开源特性和多功能性,我们预计 VirtualFlow 2.0 将在未来的早期药物发现中发挥关键作用。
• 截至 3 月底的 Versa 使用情况:5 亿个代币和 2 万美元/月 ACR。4 月底:4 万美元/月 ACR 和 10 亿个代币。10 月底:6 万美元/月 ACR 和 50 亿个代币。• UCSF 正在讨论购买 Azure OpenAI (PTU) 的预留容量• 在所有 GenAI 资源中,他们目前每月推送 5 亿多个代币。
“基于 RISC-V 的大规模采用,我们预测到 2025 年市场将总共消耗 624 亿个 RISC-V 内核”
人工神经网络已成为人类语言处理的计算上可行的模型。对这些模型的一个主要批评是,它们接收的训练数据量远远超过人类在语言学习过程中接收的数据量。在这里,我们使用两种互补的方法来探究训练数据量如何影响模型捕捉人类对句子的 fMRI 反应的能力。首先,我们根据 fMRI 基准评估了用 100 万、1000 万、1 亿或 10 亿个单词训练的 GPT-2 模型。我们认为 1 亿个单词的模型在训练数据量方面在发展上是可行的,因为这个数量与儿童在生命的前 10 年估计接触到的数据量相似。其次,我们测试了在 90 亿个标记数据集上训练的 GPT-2 模型的性能,以在训练的不同阶段达到人类基准上最先进的下一个单词预测性能。通过这两种方法,我们发现:(i) 在发展上可行的数据量上训练的模型在捕捉句子的 fMRI 反应方面已经实现了接近最大的性能。此外,(ii) 较低的困惑度(衡量下一个单词预测性能的指标)与与人类数据的更强的一致性相关,这表明经过足够训练以实现足够高的下一个单词预测性能的模型也会获得可以预测人类 fMRI 反应的句子表征。同时,这些发现表明,尽管一些训练对于模型的预测能力是必要的,但发展上可行的训练量(约 1 亿个单词)可能就足够了。
最近,媒体上出现了几篇关于人工智能风险的热门报道,其中包括高盛投资银行关于人工智能对全球经济影响的一项研究。他们估计,未来 10 年,人工智能和自动化可能会取代多达 3 亿个工作岗位,但同时也会推动全球 GDP 增长 7%(或近 7 万亿美元)1。WTTC 的数据显示,疫情前全球旅游业创造了近 3 亿个工作岗位,这相当于未来十年每个旅游业工作岗位的流失。因此,一些工会表示“深切担心就业法跟不上人工智能革命的步伐”,并呼吁对使用人工智能进行招聘、解雇、绩效评估和设定工作条件进行监管。
• 封闭式 CART 平台流程: • 为支持剂量范围,使用 CAR T 细胞开发了两种扩增策略:一步法扩增不到 100 亿个总活细胞,两步法扩增超过 100 亿个总活细胞。两种策略均能产生高活细胞 (>85%) • 封闭式浓缩/清洗、最终配方和填充平台参数可产生 >70% 的回收率和活细胞率。 • 由于准备好了物料清单、模板批次记录、经过培训的操作员和合格的共享制造套件,因此时间效率高
属性 可用于本地推理的公共权重(MIT 许可证) 多种模型大小,高达 15 亿个参数(“大”) 经过 68 万小时的 YouTube 内容训练
2029 年:我们预见到量子纠错技术的进步,这将使我们能够推出 IBM Quantum Starling,该系统能够在 200 个逻辑量子位上运行具有 1 亿个门的电路
许多技术预测者预测,至少要到 2045 年,业界才能生产出可以与人脑相媲美的人工智能 (AI) 技术,以人脑突触数量或 AI 参数来衡量。请注意,我们这里不是在谈论终结者式的 AI,或“通用 AI”。我们谈论的是可以处理单个但复杂任务的 AI,例如自然语言处理。人类大脑皮层平均有大约 800 亿到 1000 亿个神经元和 120 万亿个突触。为了论证的目的,我们假设 AI 模型中的参数大致等于突触。有史以来训练的最大的 AI 是来自 OpenAI.org 的 GPT3 自然语言模型,有 1750 亿个参数,大约是大脑大小的 1/1000。因此,120 万亿是巨大的,大约是当今最先进技术的 1000 倍。