杰拉米·亚当斯(Jeramie Adams)于2008年从怀俄明大学(UW)获得了化学博士学位,并在接下来的四年中继续担任博士后研究员,讲述了均质有机金属催化剂和高度氧化激发态光活性材料的发展。在UW期间,他还探索了超分子化学,无机光化学,深度有机磷酸化学,烷烃的脱氢,氢硅烷基化和烯烃聚合。亚当斯博士于2012年加入WRI,并管理了各种行业领先的计划,商业项目和联邦项目,包括重石油研究联盟,有问题的CRUDES研究联盟的加工改善,沥青行业研究联盟,最近的DOE项目联盟以及美国的DOE Project Insport Insportium,以实现美国公司的负担得起的碳纤维。许多项目强调化学与物理特性或其他现象之间的关系。其他积极研究的领域包括化学表征碳氢化合物,包括煤提取物,原油,蜡,沥青质,焦化的沥青质,界面沥青质,沥青,沥青和俯仰材料;调节原油乳液;沥青吸附;蜡质原油的处理;石油,煤和生物质中氧官能团的化学修饰;各向同性煤炭沥青和石油螺距转化为各向异性中间机,以换成碳纤维;热交换器污染;焦在近似延迟的Coker条件下进行材料的协调;部分升级;从煤中提取液体;高级碳材料;大气到高真空蒸馏;并通过化学合成生产新的恢复活力,PG性能增强剂和抗氧化剂产品。
在描述早期数学干预对儿童结果的影响时,研究人员通常依赖评估中正确答案的比例。在这里,我们建议将重点转移到问题解决策略的相对复杂程度上,并为有兴趣研究策略的研究人员提供方法指导。我们利用来自幼儿园样本的随机教学实验的数据,该实验的详细信息在 Clements 等人 (2020) 中概述。首先,我们描述我们的问题解决策略数据,包括如何以易于分析的方式对策略进行编码。其次,我们探索哪些类型的序数统计模型最符合算术策略的性质,描述每个模型对问题解决行为的暗示,以及如何解释模型参数。第三,我们讨论“治疗”的效果,将其操作化为与算术学习轨迹 (LT) 相一致的教学。我们表明,算术策略的发展最好被描述为一个连续的逐步过程,并且接受 LT 教学的儿童在后评估中使用更复杂的策略,相对于在针对目标的技能条件下的同龄人。我们引入潜在策略复杂性作为与传统 Rasch 因子分数类似的指标,并证明它们之间存在中等相关性(r = 0.58)。我们的研究表明,策略复杂性所包含的信息与传统的基于正确性的 Rasch 分数不同,但与之互补,这促使其在干预研究中得到更广泛的使用。
人工智能 (AI) 在行为健康领域的应用引起了人们对使用机器学习 (ML) 技术识别人们个人数据模式的兴趣,目的是检测甚至预测抑郁症、躁郁症和精神分裂症等疾病。本文通过对三个自然语言处理 (NLP) 训练数据集的情境分析,研究了人工智能介导的行为健康背后的数据科学实践和设计叙述。通过将数据集视为与特定社会世界、话语和基础设施安排密不可分的社会技术系统,我们发现数据集构建和基准测试的技术项目(行为健康领域人工智能研究的当前重点)与行为健康的社会复杂性之间存在一些不一致。我们的研究通过阐明无序数据集的敏感概念,为日益增长的人工智能系统关键 CSCW 文献做出了贡献,该概念旨在有效地扰乱行为健康领域中人工智能/机器学习应用的主导逻辑,并支持研究人员和设计师反思他们在这个新兴且敏感的设计领域中的角色和责任。
材料合成路线的开发通常基于启发式和经验。一种可能的新方法是应用数据驱动的方法,从过去的经验中学习合成模式,并利用它们来预测新材料的合成。然而,由于缺乏大规模的合成配方数据库,这条路线受到了阻碍。在这项工作中,我们应用先进的机器学习和自然语言处理技术构建了一个从科学文献中提取的 35,675 个基于溶液的合成程序的数据集。每个程序都包含必要的合成信息,包括前体和目标材料、它们的数量以及合成操作和相应的属性。每个程序还都增加了反应公式。通过这项工作,我们将免费提供第一个基于溶液的无机材料合成程序的大型数据集。
读取以映射和比对到单个参考基因组。使用墨西哥虾夷扇贝,本研究强调了当与两个不同的可用基因组组装比对时,来自同一样本的单细胞数据集的解释如何变化。我们发现,与不同的组装比对时,检测到的细胞数量和表达基因有很大不同。当将基因组组装与其各自的注释单独使用时,细胞类型识别会混淆,因为一些经典的细胞类型标记是组装特异性的,而其他基因在两个组装之间显示出不同的表达模式。为了克服多基因组组装带来的问题,我们建议研究人员与每个可用的组装比对,然后整合结果数据集以生成最终数据集,其中可以同时使用所有基因组比对。我们发现这种方法提高了细胞类型识别的准确性,并通过捕获所有可能的细胞和转录本最大限度地增加了可以从我们的单细胞样本中提取的数据量。随着 scRNAseq 变得越来越广泛,单细胞社区必须意识到基因组组装比对如何改变单细胞数据及其解释,尤其是在审查非模型生物的研究时。
∗ We thank Johannes H¨orner, Mehmet Ekmek¸ci, Kalyan Chatterjee, H¨ulya Eraslan, Paola Manzini, Utku ¨Unver, Tayfun S¨onmez, Rakesh Vohra, George Mailath, Vijay Krishna, Herv´e Moulin, Larry Ausubel, Michael Ostrovsky, Ed Green, Ron Siegel, Luca Rigotti, Sevgi Y¨uksel, Alexey Kushnir, Alex Teytelboym, William Thomson, Peter Troyan, Charlie Holt, Ruben Juarez, Francis Bloch, Leeat Yariv, Laura Doval, Piotr Dworczak, Nicholas Yannelis, and all seminar participants at Stanford (NBER Market Design ),纽约大学,赖斯,马里兰州,波士顿大学,匹兹堡大学,卡内基·梅隆,宾夕法尼亚州立大学(PETCO),弗吉尼亚州,弗吉尼亚州,达勒姆,悉尼,悉尼,悉尼大学,比尔肯特大学,比尔肯特大学,伊特,伊特,巴黎·多台恩,约克,达尔霍伊斯,苏塞克斯和许多有用的讨论和建议。Sel¸cuk ¨ Ozyurt especially thanks M. Remzi Sanver, David Pearce, Eric Maskin, Harvard Uni- versity Department of Economics, Tepper School of Business, and Sabancı University Economics Group for their mentoring, support and hospitality during this project, and the European Commission for the funding from Euro- pean Union Horizon 2020 research and innovation programme under the Marie Sklodowska-Curie grant agreement No 659780。†(通讯作者)悉尼大学经济学学院(onur.kesten@sydney.edu.au)•约克大学,经济学系(ozyurt@yorku.ca)1参见,例如,请参见Ali(2018),以进行最近的调解改革。
Hi-C 是一种样品制备方法,它使高通量测序能够捕获 DNA 分子之间的全基因组空间相互作用。该技术已成功应用于解决具有挑战性的问题,例如染色质的 3D 结构分析、大型基因组组装的支架以及最近的元基因组组装基因组 (MAG) 的精确解析。然而,尽管不断改进,但制备 Hi-C 文库仍然是一个复杂的实验室协议。为了避免代价高昂的失败并最大限度地提高成功的可能性,建议进行认真的质量管理。当前的湿实验室方法仅提供对 Hi-C 文库质量的粗略分析,而使用的关键测序后质量指标迄今为止依赖于基于参考的读取映射。当参考可访问时,这种依赖会引发对质量的担忧,其中不完整或不准确的参考会扭曲最终的质量指标。我们提出了一种新的、无参考的方法,该方法推断出邻近连接产物的读取对的总分数。这种 Hi-C 文库质量量化仅需要少量测序数据,并且与其他特定应用标准无关。该算法建立在以下观察基础之上:邻近连接事件可能会产生样本中不会自然出现的 k 聚体。据我们所知,我们的软件工具 (qc3C) 是第一个实现无参考 Hi-C QC 工具的工具,并且还提供基于参考的 QC,使 Hi-C 能够更轻松地应用于非模型生物和环境样本。我们在模拟和真实数据集上描述了新算法的准确性,并将其与基于参考的方法进行了比较。
许多公司提供 AI 驱动的软件平台,用于对临床测序数据(例如 NGS、WES、WGS)进行基因组分析和解释,例如使用 VCF 文件作为输入(表 1)。分析任务包括比对、变异解释、变异调用、注释和分析以及文献整理。AI 驱动方法的优势包括大大缩短周转时间并提高诊断产量。还有基于监督学习(例如 ISOWN)、机器学习(例如 BAYSIC、MutationSeq、SNooPer、SomaticSeq)、卷积神经网络(例如 Clairvoyante)、深度卷积神经网络(例如 DeepSea)、深度循环神经网络(例如 Deep Nano)、深度神经网络(例如 DANN)和人工神经网络(例如 Skyhawk)的基于 AI 的变异调用算法(一些可免费获得),这些算法最近都得到了调查和评论(Bohannan and Mitrofanova 2019;Karimnezhad et al 2020;Koboldt 2020;Liu et al 2019;Xu 2018)。
基因组编辑实验正在生成越来越多的靶向测序数据,其中的特定突变模式表明实验的成功和克隆细胞系的基因型。我们介绍了 EdiTyper,这是一种高通量命令行工具,专门用于分析来自 CRISPR 基因编辑的多克隆和单克隆细胞群的测序数据。它只需要简单输入测序数据和参考序列,并提供全面的输出,包括汇总统计数据、图表和 SAM/BAM 比对。模拟数据分析表明,EdiTyper 在检测单核苷酸突变和插入缺失方面非常准确,对测序错误具有很强的鲁棒性,并且速度快且可扩展到大型实验批次。EdiTyper 可在 github(https://github.com/LappalainenLab/edityper)上根据 MIT 许可证获得。