频率分布的构建:示例:拉赫曼先生是X大学的教授。他希望准备一份报告,显示学生每周学习的小时数。他选择了30名学生的随机样本,并确定上周学习的每个学生的小时数。
STAR ( Spliced Transcripts Alignment to a Reference )是用于将 RNA-seq 读取数据与 参考基因组序列进行高度准确和超快速的剪接感知( splice aware ) 比对的工具。注意, STAR 是一个专门针对 RNA-seq 数据映射的比对工具,这意味着不能用于比对 DNA 数据。与 其它的 RNA-seq 比对工具相比,其具有较高的准确率,映射速度较其他比对软件高 50 多 倍。 STAR 在识别经典和非经典剪接位点方面具有很高的精确性,还可以检测到嵌合(融 合)转录本。除了映射短读取数据(例如 ≤ 200 bp ), STAR 还可以准确地映射长读取数据 (例如来自 PacBio 或 Ion Torrent 的数 Kbp 读取数据)。 STAR 在变异检测( SNP 和 INDEL ) 方面具有更好的灵敏度,因此, STAR 被用于 GATK 最佳实践工作流程,用于从 RNA-seq 数据 中识别短变异。
摘要 — 我们引入了嵌入式数据表示,即使用与数据所指的物理空间、对象和实体深度集成的数据的视觉和物理表示。轻量级无线显示器、混合现实硬件和自动驾驶汽车等技术使得在上下文中显示数据变得越来越容易。虽然研究人员和艺术家已经开始创建嵌入式数据表示,但描述和比较这些方法所需的优势、权衡,甚至语言仍未得到探索。在本文中,我们形式化了物理数据指称的概念——数据对应的现实世界实体和空间——并研究了指称与其数据的视觉和物理表示之间的关系。我们区分了情境表示,即在数据指称附近显示数据,以及嵌入式表示,即显示数据以便它在空间上与数据指称重合。借鉴可视化、普适计算和艺术领域的例子,我们探索了空间间接性、尺度和交互对于嵌入式表示的作用。我们还研究了非情境化、情境化和嵌入式数据显示之间的权衡,包括可视化和物理化。根据我们的观察,我们发现了嵌入式数据表示的各种设计挑战,并提出了未来研究和应用的机会。
摘要 —我们介绍嵌入式数据表示,即使用与数据所指的物理空间、对象和实体深度集成的数据的视觉和物理表示。轻量级无线显示器、混合现实硬件和自动驾驶汽车等技术使得在上下文中显示数据变得越来越容易。虽然研究人员和艺术家已经开始创建嵌入式数据表示,但描述和比较这些方法所需的优势、权衡,甚至语言仍未被探索。在本文中,我们形式化了物理数据指称的概念——数据对应的现实世界实体和空间——并研究指称与其数据的视觉和物理表示之间的关系。我们区分了情境表示(显示靠近数据指称的数据)和嵌入式表示(显示数据以使其在空间上与数据指称相重合)。通过借鉴可视化、普适计算和艺术中的例子,我们探讨了空间间接、尺度和交互在嵌入式表示中的作用。我们还研究了非情境化、情境化和嵌入式数据显示之间的权衡,包括可视化和物理化。根据我们的观察,我们发现了嵌入式数据表示的各种设计挑战,并提出了未来研究和应用的机会。
在向共同居住的受众传达演示文稿时,我们通常会使用带有文本和2D图形的幻灯片来补充口语叙事。尽管在2D媒体上探索了演示文稿,但增强现实(AR)允许演示设计师在dis-plot的现有物理基础架构中添加数据和增强。这种耦合可以为观众提供更具吸引力的体验并支持理解。使用氢气,我们提出了一种新颖的应用,该应用利用了数据驱动的讲故事的好处,以解释Hy-Drogen分配器可靠性的独特挑战。利用物理道具,位置数据以及虚拟增强和动画,氢气是一种独特的演示工具,尤其对利益相关者,旅游组和VIP至关重要。氢气是与当地氢燃料研究团队进行多种合作设计迭代的产物,并通过对团队成员的访谈以及与最终用户的用户研究进行评估,以评估交互式AR体验的可用性和质量。通过这项工作,我们为AR数据驱动的演示文稿提供了设计注意事项,并讨论了如何将AR用于除传统基于幻灯片的演示外的创新内容。
免责声明:本文件是作为美国政府资助工作的记录而编写的。尽管我们认为本文件包含正确的信息,但美国政府及其任何机构、加利福尼亚大学董事会及其任何员工均不对所披露的任何信息、设备、产品或流程的准确性、完整性或实用性做任何明示或暗示的保证,也不承担任何法律责任,也不表示其使用不会侵犯私有权利。本文中以商品名、商标、制造商或其他方式提及任何特定商业产品、流程或服务,并不一定构成或暗示美国政府或其任何机构或加利福尼亚大学董事会对其的认可、推荐或支持。本文中表达的作者的观点和意见不一定代表或反映美国政府或其任何机构或加利福尼亚大学董事会的观点和意见。
突变或遗传工程,及其涉及的 DNA 或 RNA, 载体 ( 如质粒 ) 或其分理、制备 或纯化;所使用的宿主 Mutation or genetic engineering; DNA or RNA concerning genetic engi- neering, vectors, e. g. plasmids, or their isolation, preparation or purifica- tion; Use of hosts therefor 酶;酶原;其组合物、制备、活化、抑制、分离或纯化酶的方法 Enzymes, e. g. ligases; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating, or purifying enzymes 微生物本身,如原生动物;及其组合物;繁殖、维持或保藏微生物或其组 合物的方法;制备或分离含有一种微生物的组合物的方法;及其培养基 Microorganisms, e.g. protozoa; Compositions thereof; Processes of propa- gating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorgan- ism; Culture media therefor 具有多于 20 个氨基酸的肽;促胃液素;生长激素释放抑制因子;促黑激 素;其衍生物 Peptides having more than 20 amino acids; Gastrins; Somatostatins; Mela- notropins; Derivatives thereof 饲养或养殖其他类不包含的动物;动物新品种 Rearing or breeding animals, not otherwise provided for; New breeds of animals 包含酶、核酸或微生物的测定或检验方法;其组合物;这种组合物的测定方法 Measuring or testing processes involving enzymes, nucleic acids or microor- ganisms; Compositions therefor; Processes of preparing such compositions
在 AI 训练数据集中对不同人口群体的多样化表示对于确保模型适用于大量用户非常重要。为此,最近在 AI 公平性和包容性方面的努力主张创建在种族、性别、社会经济地位和残疾状况方面均衡的 AI 数据集。在本文中,我们通过关注年龄的表示来为这项工作做出贡献,询问老年人在 AI 数据集中的代表性是否与总体人口成比例。我们研究了有关 92 个面部数据集的公开信息,以了解它们如何编纂年龄,并以此作为案例研究,以调查如何记录受试者的年龄以及老一代是否有代表性。我们发现老年人的代表性非常不足;研究中明确记录受试者年龄封闭区间的五个数据集包括老年人(定义为 65 岁以上),而只有一个数据集包括最年长的老年人(定义为 85 岁以上)。此外,我们发现只有 24 个数据集在其文档或元数据中包含与年龄相关的信息,并且这些数据集中没有采用一致的方法来收集和记录受试者的年龄。我们认识到在年龄方面创建代表性数据集的独特困难,但将其作为对包容性 AI 感兴趣的研究人员和工程师应该考虑的一个重要维度。