数据集领域信息情报检索---XiaoMi-AI

经济时报

2026年6月30日 00:26

将行政数据视为国家资产：PK Mishra

Treat administrative data as national asset: PK Mishra

印度首席秘书 PK Mishra 表示，印度的行政数据应被视为国家资产，以加强政策制定和服务提供。他强调需要为人工智能就绪的数据集提供集成、安全的数据系统和强大的治理框架。米什拉强调，虽然人工智能提供了机会，但它绝不能损害官方统计数据的完整性，因为官方统计数据需要信任、独立和严谨。

KDnuggets

2026年6月30日 12:00

2026 年您可以构建的 7 个真实 Python 项目（带指南）

7 Real-World Python Projects You Can Build in 2026 (With Guides)

查看这份实用的 Python 项目列表，涵盖人工智能自动化、机器学习、API、仪表板、数据分析和投资组合就绪应用程序，以及指南、演示、存储库和数据集。

亚马逊云科技 _机器学习

2026年6月24日 18:19

借助 Snowflake 和 Amazon Quick 的人工智能驱动的 BI

AI-powered BI with Snowflake and Amazon Quick

在本文中，您将了解如何在 Snowflake 语义视图和 Amazon Quick 之间构建端到端集成。样本数据是媒体公司的用户评论数据。首先，您将电影评论数据从 Amazon Simple Storage Service (Amazon S3) 加载到 Snowflake 中，在 SQL 中定义语义视图以添加业务含义，通过 Cortex Analyst 使用自然语言查询进行探索，然后生成 Amazon Quick 数据集和仪表板。可以手动或使用提供的自动化脚本创建数据集。最后，您的 BI 团队或 AI 团队可以针对受管数据层提出自然语言问题，并相信每个响应都反映相同的业务逻辑。

Apple机器学习研究

2026年6月23日 00:00

九位法官，两张有效票：相关错误破坏了法学硕士评估小组

Nine Judges, Two Effective Votes: Correlated Errors Undermine LLM Evaluation Panels

法学硕士评委小组汇总来自多个模型的投票，期望不同的模型能产生更可靠的评估。我们开发了一个框架来衡量此类小组的真实信息价值，并量化其可靠性与独立投票理想的差距有多大。在三个自然语言推理数据集（每个项目有 100 个人类注释）上测试来自 7 个模型系列的 9 名前沿法学硕士小组，我们发现 9 名评委实际上只提供了大约 2 个独立投票的信息。大约四分之三的专家组名义上的独立性......

Apple机器学习研究

2026年6月23日 00:00

用于从标签分布中学习的度量相关注释饱和度

Metric-Dependent Annotation Saturation for Learning from Label Distributions

当注释者对某个标签存在分歧时，分歧本身就带有信号，而捕获该信号所需的注释者数量取决于评估指标。我们根据从 ChaosNLI（一个为每个项目提供 100 个独立注释器判断的数据集）二次采样的标签分布来微调 NLI 模型，并识别与度量相关的饱和度。在我们的 3 类 NLI 设置中，熵相关性（模型是否识别哪些项目引起分歧）需要 N ≈ 20-50 个注释器才能收敛，而分布匹配（KL 散度）则达到 N ≈ 10 饱和（五个模型的改进为 87-95%……

美国政府问责局__报告

2026年6月23日 07:31

农村供水基础设施：更好的机构协调可以帮助未获得服务的社区满足其需求

Rural Water Infrastructure: Better Agency Coordination Could Help Unserved Communities Address Their Needs

GAO 发现目前没有饮用水或污水处理设施服务的农村社区（无服务社区）经常面临满足饮用水或污水处理基础设施需求的挑战。美国农业部 (USDA) 和美国环境保护局 (EPA) 有关这些未获得服务的社区的数据有限，但可以通过其机构的计划和数据集获取一些信息。据机构官员称，美国农业部和环保局所知的未获得服务的农村社区通常位于非建制地区，经常受到财务和其他方面的限制，限制了其满足供水基础设施需求的能力。 2024 年阿拉巴马州和西弗吉尼亚州没有废水服务的家庭GAO 确定了 28 个美国农业部和环保局的计划，这些计划可以为未获得服务的农村社区提供财政和技术援助，以帮助建设或改善饮用水或废水基础设施。然而，

营销人工智能研究所

2026年6月18日 13:30

这是 B2B 营销人员需要了解的有关工作未来的信息

This Is What B2B Marketers Need to Know About the Future of Work

《2026 年人工智能商业状况报告》对 2,100 多名专业人士进行了调查，其中 84% 在 B2B 组织工作，其中约三分之一是营销人员。这使得该数据集成为 B2B 专业人士最相关的数据集之一，他们试图了解人工智能正在将他们的职业带向何方。

Novataxa | 物种新发现

2026年6月20日 07:31

[真菌 • 2026] Leptobacillium geminatum • 马来西亚沙巴的 Leptobacillium 新种以及 Simplicillium 和 Leptobacillium（子囊菌门：虫草科）的其他记录

[Fungi • 2026] Leptobacillium geminatum • A New Species of Leptobacillium and Additional Records of Simplicillium and Leptobacillium (Ascomycota: Cordycipitaceae) from Sabah, Malaysia

Leptobacillium geminatumin Shahbaz, De Wint, Rong, Wei, Koid, Fayle, Tan, Abdullah, Palaniveloo et Seelan, 2026.DOI: doi.org/10.1002/nzb2.70107 摘要Simplicillium 和 Leptobacillium 是常与热带生态系统中的节肢动物相关的昆虫病原真菌属，被认为是有前途的候选菌属用于害虫生物防治。然而，这些属在热带地区，特别是马来西亚的多样性，尚未在其分类学和系统发育关系的背景下进行系统研究。本研究旨在利用综合形态学和分子分析研究简单杆菌属和细杆

詹姆斯敦基金会首页

2026年6月11日 22:19

中国的代币经济已初具规模

The PRC’s Token Economy Takes Shape

Executive Summary: Policymakers in the People’s Republic of China (PRC) want to improve “data supply” (数据供给) to “provide sufficient ‘fuel’ for the development and application of artificial intelligence” (为人工智能发展和应用提供充足“燃料”). This is according to a new plan from the National Data Administration (NDA,

数据集关键词检索结果