AgiBot launches ‘by far the largest dataset’ for humanoid robots
专注于开发人形机器人的机器人初创公司 AgiBot 推出了它所称的“迄今为止最大的人形机器人操作数据集”。AgiBot 称,这个名为“AgiBot World”的数据集是第一个专门为推进多用途机器人政策而设计的大型机器人学习数据集。这个综合生态系统不仅包括 [...]
'Star Wars: Skeleton Crew' episode 5: What's hidden inside Skull Ridge Mountain?
《骷髅船员》第 5 集是一场丰富多彩的冒险,穿越一个豪华度假村,那里充满了奇怪的外星人、新的朋友和敌人,以及许多隐藏的秘密。
完成网络:识别南非蜘蛛调查中的采样偏差和知识差距(蛛形纲、蜘蛛目)摘要物种分布数据集是宏观生态研究的基础,尽管总体上需要确保这些数据集代表整个群落。生物多样性数据集中的不足或知识差距源于多种原因,并可能导致得出错误的结论或建议。空间尺度会影响多样性模式的解释,因此是一个需要考虑的重要方面。南非拥有丰富的蜘蛛采样历史,因此,可以研究空间和分类尺度对该国蜘蛛知识库完整性的整体解释的影响。为此,我们利用精选的自然历史蜘蛛收藏,并确定蜘蛛群落在十二种独特的分类和空间尺度组合中的完整性。总体而言,我们从七个收藏中获得了 121 605 条可用记录,蜘蛛记录和多样性集中在南非东部和沿海地区。我们发现,随着
Dataset Decomposition: Faster LLM Training with Variable Sequence Length Curriculum
大型语言模型 (LLM) 通常在由固定长度的标记序列组成的数据集上进行训练。这些数据集是通过随机连接不同长度的文档,然后将它们分块为预定目标长度的序列 (concat-and-chunk) 来创建的。最近的注意力实现掩盖了跨文档注意力,减少了标记块的有效长度。此外,由于注意力的二次成本,对长序列的训练在计算上变得难以承受。在本研究中,我们引入了数据集分解,一种新颖的可变序列长度……
Navigating the E-Portfolio Process: Tips, Tricks and Tales from the Trenches
发布日期:2024 年 11 月 13 日,作者:Gabe Farmer 您是否即将完成 MLIS 课程?臭名昭著的电子作品集是否在您的待办事项清单中占据重要地位?您并不孤单,您不必费力就能找到对电子作品集流程感到紧张的同学。为了帮助揭开这个过程的神秘面纱,我与 SJSU iSchool 教授 Michael Stephens 博士以及两位同学 Ellie Keene 和 Rose Harless 进行了交谈,他们目前正处于电子作品集流程的最后阶段。阅读更多
S4E8: Christopher Such on Practical Approaches to Science of Reading Implementation
欢迎回到《渐进式错误》,这是由 Hodder Education 的 John Catt 赞助并由我 Zach Groshell 博士主持的节目。John Catt 出版了一些教育领域的最佳书籍,包括我的书《告诉他们:解释和明确教学的力量》。在 SpotifyYouTubeApple PodcastsWordPress 上收听和订阅《渐进式错误》这集是……继续阅读 S4E8:Christopher Such 谈阅读科学实施的实用方法
The Guardian view on the other influencers: a golden era for science education | Editorial
YouTube 并不总是一个令人昏昏欲睡的引擎。好奇的孩子和其他自学成才的人拥有无与伦比的知识获取渠道。Numberphile YouTube 频道内容高雅,但制作价值却低得惊人,可能被视为该平台最大成功的对立面。虽然像备受争议的 MrBeast 这样的明星会精心策划特技和赠品,但 Numberphile 视频中数学家会详细讨论复杂的概念。偶尔会有来自隐形摄影师的问题或提示。道具通常是一张棕色的纸和一支记号笔。最接近点击诱饵的剧集是 Tau vs Pi Smackdown 或 The Lazy Way to Cut Pizza 等标题;典型的视频是 More on Bertrand’s P
Comparing ANN and CNN on CIFAR-10: A Comprehensive Analysis
您是否好奇不同的神经网络如何相互叠加?在本博客中,我们将使用流行的 CIFAR-10 数据集深入研究人工神经网络 (ANN) 和卷积神经网络 (CNN) 之间的激动人心的比较。我们将分解 ANN 和 CNN 的关键概念、架构差异和实际应用。加入我们,揭秘哪种模型在图像分类任务中占据主导地位以及原因。让我们开始吧!数据集概述 CIFAR-10 数据集是机器学习和计算机视觉任务中广泛使用的数据集。它由 10 个不同类别的 60,000 张 32x32 彩色图像组成,其中有 50,000 张训练图像和 10,000 张测试图像。类别包括飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、船和卡车。本博客探讨了人
Tech companies like Microsoft, NVIDIA, and Apple trade trust for data and talent
在疯狂争夺人工智能行业的主导地位的过程中,科技巨头们正在突破道德界限,测试公众信任的极限。最近的一系列披露敲响了数据隐私、公平竞争以及权力和人才集中的警钟。首先,Proof News 和 WIRED 的一项调查发现,Apple、NVIDIA、Anthropic 和 Salesforce 一直在使用包含超过 170,000 个 YouTube 视频字幕的数据集来训练他们的 AI 模型。这个被称为“YouTube 字幕”的数据集是在未经内容创建者同意的情况下编制的,可能违反了 YouTube 的服务条款。这种数据挖掘的规模The post Tech company like Microsoft,
Land Use Policy and Climate Change: A Conversation with Charles Taylor
2024-07-08土地使用和环境政策与自然资源可持续性和气候变化的交集是最新一期“环境洞察:哈佛环境经济学计划的政策和实践讨论”的讨论焦点,该节目由哈佛肯尼迪学院公共政策助理教授查尔斯泰勒主持。播客由哈佛环境经济学计划制作。
S3E20: Casey Sovo on Improving Reading Outcomes for Indigenous Students
欢迎回到 Progressively Incorrect,我是您的主持人 Zach Groshell 博士。本集是我在本周末与 Paul Kirschner 一起推出 Progressively Incorrect 第 3 季大结局之前发布的两集 DI 播客中的第二集。 《Progressively Incorrect》由 John Catt Educational 出版,该公司出版了一些最好的书籍……继续阅读 S3E20:Casey Sovo 谈如何提高土著学生的阅读成绩
European natural gas demand tracker
欧洲天然气需求跟踪器henry.naylorWed, 05/29/2024 - 10:51首次发布:2022 年 10 月 5 日最新更新:2024 年 5 月 29 日如有任何意见或要求,请发送至 Ben McWilliams (ben.mcwilliams@bruegel.org)。任何有关替代数据源的建议都将不胜感激。欧洲能源价格高涨且波动剧烈,这是由能源市场供需平衡异常紧张所致,尤其是天然气市场。两种可能的解决方案是增加供应(欧盟已经这样做了,进口了创纪录数量的液化天然气1https://www.bruegel.org/dataset/european-natural-gas-impo
Virus Field Research: Policy Options to Help Reduce Risks and Enhance Benefits
GAO 发现了什么病毒实地研究显示了应对疫情爆发的好处和一些预测能力。然而,确定此类研究的具体预防益处具有挑战性,部分原因是很难确定研究对预防结果的影响。专家告诉我们,为阻止疫情爆发而采取的预防措施有很多例子,部分原因是从病毒现场研究中获得的知识。病毒现场研究人员面临着各种环境、职业和传染风险同时进行病毒实地研究。此外,病毒现场样本采集受到不同程度的监管。因此,病毒联邦现场研究实践各不相同,各机构使用自己的暴露和感染报告指南。替代方法可以帮助降低病毒现场研究活动的风险,但病毒现场样本收集是诸如此类技术的必要数据来源。作为疾病模型,可以帮助预测潜在的传播和爆发。还有一些技术和方法可用于减少这些样
Choosing the Right Speech Recognition Dataset for Your AI Model
想象一下与 Siri 或 Alexa 互动。它们理解我们语音的能力令人着迷。这种能力源于它们训练中使用的数据集。这些数据集是来自不同语言和口音的大量口语单词、短语和句子的集合。它们为训练 AI 模型提供了原始材料。随着技术的发展,对 […]
What If There Were No Animals?
如果没有动物,世界会是什么样子?生态学家、播客和熊崽爱好者 Rae Wynn Grant 为我们描绘了动物消失后会发生什么,并解释了我们如何阻止这种情况发生。我们将了解《濒危物种法案》如何在过去 50 多年里拯救濒危物种,以及我们如何为下一代做得更好。感谢 Elliana,以及 Hadley 和 Roman 的提问!本集是儿童播客派对的一部分!Tumble 和其他儿童播客正在制作剧集,以纪念《濒危物种法案》颁布 50 周年。想听更多吗?查看 Smash Boom Best 及其关于水豚与科莫多巨蜥的剧集。在我们的 Patreon 上的额外采访剧集中,patreon.com/tumblepodc
在上一篇文章中,我讨论了给定数据集的 DNF 最小化的复杂性。具体来说,给定一个输入/输出对的数据集,计算与 一致的最小 DNF 有多难?在这篇文章中,我们将研究这个问题的一个变体,其中要求数据集为 中的每个点指定一个标签。DNF 真值表最小化。DNF 真值表最小化是 DNF 最小化的变体,其中输入数据集是函数 的真值表。对数据集的额外约束只能使问题变得更容易,实际上,使用 Set-Cover 的贪婪近似,可以在多项式时间内将真值表最小化近似到 的一个因子以内。第一个下界由 Masek 于 1979 年证明,表明确切的变体是 NP 难的。他的结果从未发表过,尽管后来 Umans、Villa 和
Coupled Digital Engineering Solutions in Podracing: More Bang for your Republic Credits!
作者注:虽然我对星球大战的铁杆粉丝怀有极大的敬意,但我必须承认,在我的成长过程中,第一集是我最喜欢的。也许是达斯·摩尔的双光剑的魅力、塔图因令人肾上腺素飙升的飞梭赛车,或者娜塔莉·波特曼(无需赘述)吸引了我幼小的心灵。虽然 5 月 4 日已经阅读更多... 文章《飞梭赛车中的耦合数字工程解决方案:让您的共和国积分物超所值!》首次出现在 Turbomachinery 博客上。
U.S. Army updates anatomical representation to improve modeling
马里兰州阿伯丁试验场 - 寻找包容性和包容性的数据集是生物医学插图社区面临的一个主要障碍。然而,通过...