数据集关键词检索结果

弥合差距:新数据集将推荐研究推向现实世界规模

Bridging the Gap: New Datasets Push Recommender Research Toward Real-World Scale

在推荐研究中公开可用的数据集当前塑造了该领域。

3个问题:如何帮助学生识别其AI数据集中的潜在偏见

3 Questions: How to help students recognize potential bias in their AI datasets

开发医疗保健AI模型的课程需要更多地专注于识别和解决偏见。

中国研究人员释放天山流域流量数据集

Chinese researchers release Tianshan watershed streamflow dataset

由中国科学院新疆生态与地理研究所(XIEG)的陈·亚宁(Chen Yaning)教授最近的一项研究发行了蒂安山(Tianshan)流域水流(TSWS)数据集(1901- 2019年)。该数据集编译了56个流域的每日流量数据,以及天山山区89个流域的每月数据。

GROK Chat Bot integrates into Telegram yandex发布以打开对音乐首选项的数据集访问 div> gigamon:91%的公司为实施AI div>捐赠安全 hacking rsa转移的量子计算机比以前容易20倍 mishustin:卫星互联网将在两年内公开使用 Java庆祝30周年 在Mincifers中,他们否认了“公共服务”的强制性生物识别计划 Salesforce以80亿美元的价格收购Informatica

Чат-бот Grok интегрируют в Telegram

伊隆面具和帕维尔·杜罗夫(Pavel Durov)之间的交易证明了AI在使者和社交网络行业中的增长价值。

yandex发布以打开对音乐首选项的数据集访问 div>

Gigamon: 91% компаний жертвуют безопасностью ради внедрения ИИ

指导的70%将公共服务视为混合云环境中最风险的组成部分,并希望将其数据归还给私有云。

大型语言模型正在记住旨在测试它们的数据集

Large Language Models Are Memorizing the Datasets Meant to Test Them

,如果您依靠AI推荐观看,阅读或购买的内容,那么新的研究表明,这些系统可能是从记忆中基于记忆而不是技巧的结果:而不是学习提出有用的建议,而是回想起用于评估它们的数据集中的项目,导致高估的性能和建议的大型语言模型是在大型语言模型中记忆了这些数据集,该数据是记忆自己的第一个符合人数。

'covox':用于比较唱歌和语音样式的匹配的人声数据集

'CoVox': A matched vocal dataset for comparing singing and speech styles

人类的声音与指纹一样多样化和个体,可以提供有关情绪,年龄或健康的信息。为了研究声音表演,德国法兰克福大学的Max Planck经验美学研究所(MPIEA)的研究人员创建了一组精选的录音,总共有1,320个语音样本。

#AAAI2025未发纸 - DivShift:探索大规模,自愿收集的生物多样性数据集中的特定领域分配变化

#AAAI2025 outstanding paper – DivShift: Exploring domain-specific distribution shift in large-scale, volunteer-collected biodiversity datasets

诸如Inaturalist之类的公民科学平台的知名度增加,从而推动了生物多样性基础模型的快速发展。但是,此类数据固有地存在偏见,并以机会主义的方式收集,通常偏向某些位置,时间,物种,观察者经验水平和状态。我们的作品,标题为“ Divhift:探索特定于域的分布变化,以志愿者收集的生物多样性[…]

此数据集可帮助研究人员发现LLMS中的有害刻板印象

This data set helps researchers spot harmful stereotypes in LLMs

AI模型带有文化特定的偏见。一个名为Shades的新数据集旨在通过发现有害的刻板印象和其他类型的歧视来帮助开发人员解决问题,这些刻板印象和其他各种语言中的AI Chatbot响应中出现。 AI创业公司拥抱面孔的首席道德科学家玛格丽特·米切尔(Margaret Mitchell)领导了…

全局宏数据库:一个新的国际宏观经济数据集

The Global Macro Database: A new international macroeconomic dataset

由4名经济学家组成的团队 - KarstenMüller,Chenzi Xu,Mohamed Lehbib&Ziliang Chen-已经开发了这个名为Global Macro Database的宏数据库。他们在本文中解释了数据库:全局宏数据库是一个开源的,不断更新的宏观经济统计数据集,可统一和扩展现有资源。通过协调和集成来自32个主要[…]

屡获殊荣的作家Nancy Huddleston Packer曾担任创意写作计划的总监,他去世了 物理学有助于解码肠道细菌的发展 现代支架匹配预防死亡和中风的旁路手术,研究发现 斯坦福大学职业教练分享了有关在屏幕上最好的技巧 mingkwai原型,“中文计算的起源”,在斯坦福大学找到了家 斯坦福大学法律创建了有史以来最大的公共企业合同数据集 doerr摄影大赛说明了生活的复杂性 ‘逐步,我们取得了很大的进步' 论坛处理加利福尼亚野火的经济损失越来越高 斯坦福大学专家解释了稀有疾病的突破性皮肤移植治疗 接纳周末亮点 斯坦福大学的教职员工当选为国家科学院 艺术安装照亮了编码数据的历史 错过的学校是热带气旋的被忽视的结果 新成像技术有助于斯坦福外科医生减少重复的乳房手术 红衣主教赢得第四妇女帆船标题

Nancy Huddleston Packer, award-winning writer who served as director of Creative Writing Program, has died

出生于阿拉巴马州的作者出版了七本书和许多短篇小说。

有缺陷的ICAT飓风损失数据集:气候研究中科学完整性的呼吁

The Flawed ICAT Hurricane Loss Dataset: A Call for Scientific Integrity in Climate Research

Pielke的研究精心记录了ICAT数据集最初是基于他的团队精心策划的飓风损失数据(Pielke等,2008; Weinkle等人,2018年)如何被公司收购后国际灾难保险经理,LLC(ICAT)更改。

数据集揭示了Reddit社区如何适应AI

Dataset reveals how Reddit communities are adapting to AI

Jamillah Knowles / Data People /由CC-BY 4.0许可的Grace Stanley研究人员已发布了从300,000多个公共Reddit社区中提取的数据集,以及一份报告详细介绍了Reddit社区如何改变其政策,以解决AI生成内容的激增。团队从[…]

斯坦福大学法律创建了有史以来最大的公共企业合同数据集

Doerr photo contest illustrates life’s complexity

赢得今年Doerr可持续发展摄影竞赛中的图像传达了我们为可持续性斗争而遇到的危险 - 以及人类为制定变革而努力。

Chatgpt创建的假医学数据集很难发现

Fake medical datasets created by ChatGPT are pretty hard to spot

意大利语和德国科学家使用ChatGpt创建了假医疗数据集,然后寻找将这些数据集标记为Phoiles的特征。该团队使用Chatgpt-4O来生产12个“未精制”数据集,并根据“未精制”数据创建12个“精制”数据集的Chatgpt版本。未精制的数据集包括103个伪造迹象,包括在患者名称和性别之间的不匹配,周末进行的访问以及年龄计算错误。但是,一旦通过自定义Chatgpt进行了完善这些数据集,这些讲述标志中的范围却少得多,分析时有四个精制数据集显得完全真实。该团队总结说,研究结果表明,使用人工智能来创建研究人员分析时看起来完全真实的假医学数据集是多么容易。

NOAA数据集将很快消失

NOAA Datasets Will Soon Disappear

NOAA悄悄地报告说,他们将很快退役与地震,海洋,沿海和河口科学有关的14个数据集,产品和目录。 由美国和印度共同运营的任务将衡量全球土地,冰和生态系统的微小变化。 在金星,火星和木星的月球欧罗巴(Europa)的月球上骨折的地形图像查明了受水影响的环境。 一项新的研究发现,通常在西部边界电流的分离点附近看到的浮游植物盛开,得到了营养供应上升和跨货架运输的支持。 宇宙氯同位素的年代对意大利的断层活性的长期估计,表明地震和静止期在数千年中交替出现。

儿童数据集毕竟不会改变冷暗物质模型。

KiDS dataset doesn't shake up cold dark matter model after all, say researchers

来自4100万个星系的数据毕竟不会动摇标准的宇宙学模型。为此,令他们感到惊讶的是,是一支国际研究人员的团队,包括莱顿天文台教授Koen Kuijken。

新的国防部实验系列目标数据集成

New Defense Department experimentation series targets data integration

GIDE X事件旨在解决技术和系统集成问题,以防止操作员利用命令和控制能力升级。