Sparsh Mittal 博士与他的研究学者 Poonam Rajput 女士和 Subhrajit Nag 先生共同领导了这项研究。Sparsh 博士在这项研究的大部分时间里都在印度理工学院海得拉巴分校的 CSE 系工作,最近他加入了印度理工学院鲁尔基分校。这项研究的成果已被同行评审会议“2020 年国际智能物体与社会公益技术会议”接受,该会议于 2020 年在比利时举行。在谈到这项研究的重要性时,Sparsh Mittal 博士说:“手机已经深深渗透到人们的生活中。手机成瘾已成为许多家长、立法者以及教育机构和办公室当局的一大担忧。手动大规模检测手机是不可能的。因此,有必要为此开发自动化技术。我们相信我们的技术具有巨大的潜力。它可以通过防止过度或不合时宜地使用手机来帮助提高生产率。它可以帮助避免因驾驶时分心而发生的事故。此外,加油站、考场、大使馆、军事基地和法院等许多地方都禁止使用手机。我们的技术可用于查找手机是否在这些区域使用。最后,现在很多金融交易都是通过手机进行的,因此手机丢失可能会带来严重后果。通过追踪手机,我们的技术可以帮助检测手机丢失或被盗。”
本文介绍了一种新颖的“公平性”数据集,以衡量 AI 模型对不同年龄、性别、表观肤色和环境光照条件的稳健性。我们的数据集由 3,011 名受试者组成,包含 45,000 多个视频,平均每人 15 个视频。这些视频是在美国多个州录制的,参与者是不同年龄、性别和表观肤色组的成年人。一个关键特征是每个受试者都同意参与并使用他们的肖像。此外,我们的年龄和性别注释由受试者自己提供。一组训练有素的注释者使用 Fitzpatrick 皮肤类型量表标记受试者的表观肤色 [ 6 ]。此外,还提供了在低环境光下录制的视频的注释。作为衡量跨某些属性的预测稳健性的应用,我们评估了最先进的表观年龄和性别分类方法。我们的实验从公平对待来自不同背景的人的角度对这些模型进行了彻底的分析。
简介 本文档为地籍国家空间数据基础设施 (PLSS CadNSDI) 数据集的公共土地测量系统 (PLSS) 标准化数据提供支持文档。常见问题 (FAQ) 部分提供了对那些熟悉 PLSS 并开始使用此数据集在地理信息系统 (GIS) 中表示 PLSS 的人士最常问的问题的回答。关键概念和定义部分提供了源文档的链接,这些文档提供了与 PLSS、地籍数据、相关数据标准以及土地管理局 (BLM) 地籍测量中用于确定 PLSS 角落坐标位置的特定程序和流程相关的关键术语和概念的更多细节和背景。概念在标准化数据中的应用部分概述了 PLSS 的一些关键概念及其在标准中的表现。本节提供了 PLSS 的一些特性的通俗描述。PLSS CadNSDI 描述部分描述了 PLSS CadNSDI 数据集的具体内容。这是标准的数据字典。附录 A 是首字母缩略词列表。附录 B 是对 PLSS 数据中一些较常见异常的描述。在整个文档中,要素类名称都以斜体显示。字段名称(属性)以大写字母显示。ArcMap 是 BLM 使用的 Esri 制图软件,也是 im 中使用的软件
P. Fretwell 1,* , H. D. Pritchard 1,* , D. G. Vaughan 1 , J. L. Bamber 2 , NE Barrand 1 , R. Bell 3 , C. Bianchi 4 , R. G. Bingham 5 , D. D. Blankenship 6 , G. Casassa 7 ,G.卡塔尼亚 6 , https://doi.org/10.1103/PhysRevLett.199.1121,Google Scholar Crossref,CAS 11。D. Callens 8,H. Conway 9,A. J. Cook 10,H. F. J. Corr 1,D. Damascus 11,V. Damm 11,F Ferraccioli 1、R. Forsberg 12、S. Fujita 13、P. Gogineni 14、J. Chem。A. Griggs 2 , R. C. A. Hindmarsh 1 , P. Holmlund 15 , J. W. Holt 6 , R. W. Jacobel 16 , A. Jenkins 1 , W. Jokat 17 , T. Jordan 1 , E. C. King 1 , J. Kohler 18 , W克拉比尔 19 岁,理学硕士Riger-Kusk 20、K.A. Langley 21、G. Leitchenkov 22、C. Leuschen 14、B.P. Luyendyk 23、K. Matsuoka 24、Y. Nogi 25、O.A. Nost 24 , S. V. Popov 26 , E. Rignot 27 , D. M. Rippin 28 , A. Riviera 7 , J. Roberts 29 , N. Ross 30 , M. J. Siegert 2 , A. M. Smith 1 , D. Steinhage Studinger 31 , B.周日 32 、BK Tinto 3 、BC 韦尔奇 17 、DA[div] Young 6 、C.Xiangbin 32 和 A.Zirizzotti 33
纳米孔测序是第三代测序技术,具有生成长阅读序列并直接测量DNA/RNA分子的修改,这使其非常适合生物学应用,例如人类端粒对象至tomemere(T2T)基因组组装,Ebola Virus Surveillance和Covid-19 Mrna vaccine vaccine vacine vaccine vacine vaccine vaccine vaccine vacine。但是,纳米孔测序数据分析的各种任务中计算方法的准确性远非令人满意。例如,纳米孔RNA测序的碱基调用精度约为90%,而目标的基础精度约为99.9%。这凸显了机器学习社区的迫切需要。一种阻止机器学习研究人员进入该领域的瓶颈缺乏大型集成基准数据集。为此,我们提出了纳米巴塞利布(Nanobaselib),这是一个综合的多任务台上数据集。它将16个公共数据集与纳米孔数据分析中的四个关键任务进行了超过3000万个读取。为了促进方法开发,我们已经使用统一的工作流进行了预处理所有原始数据,并以统一的格式存储了所有中级结果,分析了针对四个基准测试任务的各种基线方法分析的测试数据集,并开发了一个软件包来轻松访问这些结果。纳米巴斯利布可在https://nanobaselib.github.io上找到。
本文通过利用大型预训练模型来探讨合成数据的潜力,尤其是在面对分布变化时。al-尽管生成模型的最新进展已经阐明了跨分布数据发生的几项先前的作品,但它们需要模型调整和复杂的设置。为了绕过这些缺点,我们介绍了主要的g a a a a a a a a embeddings(doge),这是一个跨分布的插件语义数据augpection框架,几乎没有射击设置。我们的方法以潜在形式提取源和所需数据分布之间的差异,然后引导生成过程,以补充无数多种合成样本的训练集。我们的评估是在几个射击范式下进行亚种群偏移和三个领域适应方案进行的,表明我们的多功能方法改善了各个任务的性能,需要进行动手干预或复杂的调整。Doge铺平了毫不费力地生成遵循测试分布的现实,可转让的合成数据集的道路,从而加强了下游任务模型的现实世界效率。
如果没有DOE Wind Energy Technologies Office的支持,将不可能创建风力整合国家数据集(WIND)工具包长期集合数据集(WTK-LED)。多年来,团队特别感谢帕特里克·吉尔曼(Patrick Gilman)和布雷特·巴克(Bret Barker)的支持。Various teams and researchers across the National Renewable Energy Laboratory (NREL) contributed to the WTK-LED by either giving input in the design stage or using the data and thereby shaping the final version of the WTK-LED: Eric Lantz, Greg Brinkman, Trieu Mai, Cong Feng, Ryan King, Brandon Benton, Dmitry Duplyakin, and Zagi Zisman.,我们还感谢太平洋西北国家实验室的电网团队审查了网格整合研究的数据。我们感谢Wind Resource数据库的开发团队提供一个简单的数据查看和下载平台:Rachel Barton,Paul Edwards,Jason Ferrier,Nick Gilroy,Nick Gilroy,Amber Mohammad,Reid Olson和Paul Susmarski。
在自主系统[22,24](例如自动驾驶汽车(SDC))的背景下开发工具,由于研究人员和从业人员依赖昂贵的计算硬件和仿真软件,因此很耗时且昂贵。我们提出了Sensodat,这是一个由32,580个执行基于仿真的SDC测试用例的数据集,该测试案例用SDC的最新测试发电机生成。数据集由轨迹日志和来自SDC的各种传感器数据组成(例如,RPM,车轮速度,制动热,传输等)表示为时间序列。总共Sensodat提供了来自81个不同模拟传感器的数据。在使用Sensodat时,SDC领域的未来研究不一定取决于执行昂贵的测试用例。此外,有了大量和多种传感器数据,我们认为感觉模型可以为研究做出贡献,尤其是用于AI开发,用于基于模拟的SDC测试的回归测试技术,模拟中的片段等。链接到数据集:https://doi.org/10.5281/zenodo.10307479
在数字人文科学中,文本仍然是表达和分析的主要媒介(Manovich,2020; McPherson,2009; Meeks,2013; Sayers,2018)。这导致了一些学者将该领域定义为“文本重,可视化光和模拟较差”(Champion,2017年)。但是,大量可用的视觉数据的兴起以及计算分析的能力为奖学金开辟了新的可能性。Wevers and Smits(2020)将这种“视觉转弯”归功于使用深层神经网络来理解图像的复杂计算机视觉算法的扩散和进步。这些网络可以识别层次模式,并将过滤器应用于图像的不同部分(例如识别形状,边缘和纹理),逐渐形成了对输入数据的更复杂和细微的理解。这些模型的准确性和影响仅在数字人文科学中才被探索,但它们被认为是为了极大地改变对文化数据的分析,批评和解释(Arnold等,2022; Arnold&Tilton,2019; di Lenardo&di Lenardo et al。 Pustu-Iren等人,2020年;