Massive cosmic dataset made open to scientists, novices and AI
霍比-埃伯利望远镜暗能量实验 (HETDEX) 已向公众发布了其所有庞大且信息丰富的数据库。
Build a test suite that grows with your agent with dataset management in Amazon Bedrock AgentCore
当您将快速移动的在线信号与稳定的离线基线相结合时,代理评估最为强大。要了解您的代理是否真正随着时间的推移而改进,您需要一个固定的基准以及不断变化的现实世界流量。将评估基线的测试用例作为 Amazon Bedrock AgentCore 中的数据集进行管理,带来了版本化测试装置的规范 [...]
Auditing Model Bias with Balanced Datasets with Mimesis
了解如何使用 Mimesis 库生成平衡的反事实数据集,帮助分析模型中的潜在偏差。
PEBEC push for inter-agency data integration, to streamline business services
联邦政府通过总统授权商业环境委员会 (PEBEC) 表示,正在加紧努力整合阅读更多 PEBEC 推动机构间数据集成,以简化商业服务
中小学生和学生 - 国家技术倡议 (NTI) 俱乐部运动的参与者 - 开始收集数据集,用于训练识别神经生成疾病的神经网络。
Exploring Patterns of Survival from the Titanic Dataset
使用 Pandas、Matplolib 和 Seaborn 进行探索性数据分析的初学者教程《从泰坦尼克号数据集中探索生存模式》一文首先出现在《走向数据科学》上。
Dataset for Recognition and Detection Based on Solar Radio Spectrogram Data by Yan et al
太阳射电爆发及其精细光谱结构包含与等离子体不稳定性、高能粒子加速和其他重要过程相关的关键物理信息。因此,它们成为研究太阳活动和太空天气的重要观测手段。随着太阳射电谱图观测数据量的不断增加,基于深度学习的太阳射电爆发识别与检测已成为重点研究方向。然而,大多数关于米波太阳射电的研究[...]Yan 等人基于太阳射电频谱图数据的识别和检测后数据集首次出现在 CESRA:欧洲太阳射电天文学家社区。
MIT researchers teach AI models to interpret charts
新的 ChartNet 训练数据集可以提高视觉语言模型的准确性,帮助分析业务趋势或解释科学数据。
Fundamental’s Large Tabular Model NEXUS is now available on Amazon SageMaker JumpStart
在本文中,我们将向您展示如何在 Amazon SageMaker JumpStart 上开始使用 NEXUS、逐步完成部署过程,并演示如何针对企业数据集运行预测。
Exploring Income Patterns with Python Pandas, Matplotlib, and Seaborn
对美国人口普查数据集的探索性数据分析 使用 Python Pandas、Matplotlib 和 Seaborn 探索收入模式一文首先出现在 Towards Data Science 上。
Amazon Quick integration with time-series databases for market intelligence using MCP
在这篇文章中,我们将介绍使用 KDB-X MCP 服务器与 Amazon Quick 集成的实际实施,演示交易者和分析师如何使用对话语言提出问题并从数据集中获取可操作的见解。您可以在各个领域应用相同的集成模式,从金融市场分析到物联网传感器监控,再到 DevOps 性能仪表板,您需要在这些领域简化对时间序列见解的访问。
Ensuring Data Integrity with Cryptographic Hashing and the Ethereum Blockchain
将区块链原语应用于数据集版本控制、出处和完整性保证《使用加密哈希和以太坊区块链确保数据完整性》一文首先出现在《走向数据科学》上。
-Slamcore 已将其总资金增加至 4000 万美元,并展现出快速的市场吸引力,在不到两年的时间内扩展到 30 多个设施中的数百个单位。-该公司的 Slamcore Aware 和警报解决方案利用专有的 AI 和立体摄像头来提供即时的现场安全和车队效率改进,而无需昂贵的设施改造或额外的基础设施。-通过大规模跟踪真实世界工业环境中的车辆,Slamcore 正在生成作为下一代物理 AI 的关键构建块所需的大量数据集。
District-level satellite measures of the Indian economy
XKDR 提出了一个有趣的数据集,用于测量地区级卫星数据:该数据集包含印度经济的地区级卫星测量数据:来自 Google 开放建筑 2.5D Temporal 的年度建筑体积(2016-2023 年),以及通过 NighttimeLights.jl 使用 PSTT2021 管道清理的每月 VIIRS 夜间灯光(2014 年至今)。它们共同提供了细致且及时的阅读 [...]
Ростех представил комплекс «Государственность» для дружественных стран
该解决方案将不同的信息系统和数据集整合到一个数字生态系统中,用于管理公司、行业或国家
一项 2026 年的研究分析了 15 年的湖泊数据集,以填补有关气候变化如何影响热带山区环境中湖泊动态的关键知识空白。研究简报:气候变化和厄尔尼诺南方涛动对热带深山湖泊的影响首先发表在《湖泊科学家》上。
Science & Tech Spotlight: Privacy Enhancing Technologies
为什么这很重要公司和组织正在从美国人那里收集比以前更多的个人数据,以改进人工智能等技术。但使用和共享大量数据会带来安全和隐私风险,例如个人信息泄露。据 FBI 称,2024 年美国人因个人数据泄露而损失超过 14 亿美元。隐私增强技术 (PET) 可以帮助降低与收集、使用和共享数据相关的风险。关键要点隐私增强技术正在扩展到新的数据集,并不断发展以对抗恶意行为者。它们还可以实现对敏感信息(例如医疗记录或专有公司数据)的更安全的协作和研究。缺乏联邦指导、高昂的资源成本和劳动力限制会影响这些技术的实施,并可能阻碍广泛使用。该技术是什么?隐私增强技术以难以访问敏感信息的方式修改、隐藏或处理数据。专注于
The economics of Physical AI: Why data quality beats scale
为了达到物理 AI 社区所期望的鲁棒性水平,即在不熟悉的环境中对不熟悉的对象进行零样本部署的通才策略,数据集大小必须增长几个数量级。为了给出规模感,将逻辑扩展到 LLM 规模的数据量(大约 10^2)将需要大约 8000 万个机器人连续运行三年。 The field is therefore bottlenecked not only by compute or model architecture, but more fundamentally by the rate at which high-quality, real-world manipulation data can be gen