数值关键词检索结果

了解 K-Fold 目标编码以处理高基数

Understanding K-Fold Target Encoding to Handle High Cardinality

平衡复杂性和性能:深入了解 K 折目标编码照片由 Mika Baumeister 在 Unsplash 上拍摄简介数据科学从业者在处理不同项目中的不同数据类型时会遇到许多挑战,每个项目都需要独特的处理方法。一个常见的障碍是使用传统机器学习模型难以有效处理的数据格式,导致模型性能不佳。由于大多数机器学习算法都针对数值数据进行了优化,因此将分类数据转换为数值形式至关重要。然而,这通常会过度简化复杂的分类关系,尤其是当特征具有高基数(即大量唯一值)时,这会使处理复杂化并妨碍模型准确性。高基数是指特征中唯一元素的数量,具体解决机器学习环境中分类标签的不同计数。当一个特征有许多唯一的分类标签时,它具有高

使用 PCA 进行异常值检测

Using PCA for Outlier Detection

一种识别数值数据中异常值的令人惊讶的有效方法PCA(主成分分析)通常用于数据科学,通常用于降维(通常用于可视化),但它实际上对于异常值检测也非常有用,我将在本文中描述它。本文延续了我的异常值检测系列,其中还包括关于 FPOF、计数异常值检测器、距离度量学习、共享最近邻和兴奋剂的文章。这还包括我书《Python 中的异常值检测》的另一段摘录。PCA 背后的想法是大多数数据集在某些列中的方差比其他列大得多,并且特征之间也存在相关性。其中一个含义是:为了表示数据,通常不需要使用尽可能多的特征;我们通常可以使用更少的特征(有时要少得多)很好地近似数据。例如,对于包含 100 个特征的数值数据表,我们可

离散化解释:初学者的带有代码示例的可视化指南

Discretization, Explained: A Visual Guide with Code Examples for Beginners

数据预处理将数字分类到箱中的 6 种有趣方法!⛳️ 更多数据预处理说明:· 缺失值插补 · 分类编码 · 数据缩放 ▶ 离散化 · 过度和欠采样(即将推出!)大多数机器学习模型都要求数据为数值——所有对象或分类数据必须首先采用数字格式。但实际上,有时分类数据会派上用场(大多数时候,它对我们人类比对机器更有用)。离散化(或分箱)就是这样做的——将数值数据转换为分类数据!根据您的目标,有多种方法可以对数据进行分类。在这里,我们将使用一个简单的数据集来展示六种不同的分箱方法。从等宽到基于聚类的方法,我们将这些数值扫入一些分类箱中!所有视觉效果:作者使用 Canva Pro 创建。针对移动设备进行了优

印度气象局追踪孟加拉湾新低压区,奥里萨邦-西孟加拉邦海岸注意飓风前兆

Pre-cyclone watch for Odisha-West Bengal coast as IMD tracks fresh low-pressure area over Bay of Bengal

数值模型预测的风速表明,海湾水域可能正在形成严重的飓风

2019年9月贸易统计——7-9月外需贡献率环比增长0.2%左右

貿易統計24年9月-7-9月期の外需寄与度は前期比0.2%程度のプラスに

根据财务省10月17日公布的贸易统计数据,2024年9月贸易余额为-2943亿日元,与市场预测几乎一致(QUICK计算:-2121亿日元)日元,我们的预测)结果是 719 亿日元)。出口较上年(8月:5.5%)下降1.7%,为10个月来首次下降,进口较上年(8月:2.3%)保持增长2.1%,贸易差额较上年同期下降。与前一年相比,恶化了3549亿日元。分出口数量和价格来看,出口数量比上年下降6.9%(8月份:-2.7%),出口价格比上年下降5.5%(8月份:8.5%),进口量较上年下降1.3%(8月份:-3.8%),进口价格较上年下降3.4%(8月份:6.4%)。经季节调整的贸易差额连续第40个

全球股市走势(2024年9月)——中国股市因经济和房地产市场支持措施而飙升

グローバル株式市場動向(2024年9月)-中国株は経済・不動産市場支援策により急騰

■摘要2024年9月,全球股市因美国经济指标疲弱而月初下跌,但随后因美国联邦公开市场委员会(FOMC)大幅降息而回升。此外,由于中国宣布经济和房地产市场支持措施,价格大幅上涨。经济合作与发展组织(OECD)预测,全球经济已开始好转,通胀率较低,贸易增长稳健,并将保持强劲。然而,由于地缘政治和贸易紧张局势,人们也担心通胀再次上升的风险。 ■目录 1 -- 经济和房地产市场支持措施推动中国股市飙升 2 -- 国家和行业趋势 3 -- 全球主要公司股价走势 4 -- 未来展望和关注话题 2024 年 9 月受美国经济指标疲弱影响,全球股市月初下跌,但随后因联邦公开市场委员会(FOMC)大幅降息决定而

受弹道冲击的超弹性嵌段共聚物的高速表征和建模

High-Rate Characterization and Modeling of a Hyperelastic Block Copolymer Subjected to Ballistic Impact

摘要:聚苯乙烯-聚异丁烯-聚苯乙烯星型嵌段共聚物 (PS-PIB-PS) 是一种具有粘超弹特性的热塑性弹性体,具有高韧性,在减震应用中表现良好。研究目标是通过实验和数值研究 PS-PIB-PS 耗散动能的能力,并检查其在 200-1,700 m/s 速度范围内受到球形钢弹撞击时的变形和失效模式。首先,使用 Split-Hopkinson 压杆对 PS-PIB-PS 进行表征,以测量高应变率响应并校准超弹性材料模型。其次,对 12 英寸 × 12 英寸 PS-PIB-PS 目标进行弹道测试,这些目标具有不同的厚度,以确定弹道极限和残余速度 (Vr) 与冲击速度 (Vi) 的关系。最后,使用 AL

工程兵团将在马尼斯蒂克港安装临时雷达系统

Corps of Engineers to install temporary radar system at Manistique Harbor

美国陆军工程兵团底特律区正在密歇根州马尼斯蒂克港安装综合雷达监测系统 (IRaMS),以收集 10 月 7 日当周的秋季波浪数据。该系统将沿海岸线停留数月,以观察风暴期间波浪与港口结构之间的相互作用并验证数值波浪模型模拟。数据收集和建模将有助于设计马尼斯蒂克结构的未来修复。

道德判断可能随季节变化而变化

Moral Judgments May Shift with the Seasons

某些数值在春季和秋季比在夏季和冬季更重要

使用 Sentinel-2 影像和辅助地理空间数据自动绘制国际异质景观中的土地覆盖类型

Automated Mapping of Land Cover Type within International Heterogenous Landscapes Using Sentinel-2 Imagery with Ancillary Geospatial Data

摘要:目前尚不存在使用浅层机器学习和低密度时间序列图像进行自动训练数据生成和土地覆盖分类的近全球框架。本研究提出了一种使用 Sentinel-2 颗粒的两个日期在七个国际站点绘制九类、六类和五类土地覆盖的方法。该方法使用一系列光谱、纹理和距离决策函数与修改后的辅助层相结合来创建二进制掩码,从中生成一组平衡的训练数据应用于随机森林分类器。对于土地覆盖掩码,对反射率、光谱指数值和欧几里得距离层应用了逐步阈值调整,评估了 62 种组合。计算了全球和区域自适应阈值。使用年度 95 和 5 百分位 NDVI 合成为决策函数提供时间校正,并将这些校正与原始模型进行比较。精度评估发现,两日期土地覆盖和时间校

2024年8月贸易统计——日元强势和原油价格走低,未来贸易逆差将缩小

貿易統計24年8月-円高、原油安で先行きの貿易赤字は縮小へ

根据财务省9月18日公布的贸易统计数据,2024年8月贸易收支出现赤字▲6,953亿日元,但赤字金额是根据此前市场预测得出的(QUICK计算: ▲133,720亿日元,显着低于我们的预测(-10,587亿日元)。出口同比增长5.6%(7月:同比10.2%),进口同比增长2.3%(7月:同比16.6%),增速均放缓与上月相比,但出口增幅超过进口增幅,贸易收支较上年改善2,448亿日元。从出口数量和价格来看,出口数量同比下降2.7%(7月:-5.2%),出口价格同比下降8.6%(7月:16.3%),进口情况如下。进口数量同比增长-3.8%(7月:4.4%),进口价格同比增长6.3%(7月:11.6

沿海灾害系统 - 南大西洋 (CHS-SA)

Coastal Hazards System–South Atlantic (CHS-SA)

摘要:美国陆军工程兵团完成了南大西洋沿岸研究 (SACS),以量化风暴潮和海浪危害,从而将沿海灾害系统 (CHS) 扩展到南大西洋分部 (SAD) 领域。CHS-SACS 的目标是量化当前条件和未来海平面上升情景下的风暴危害,以降低洪水风险并提高沿海环境的恢复力。CHS-SACS 已在 SAD 领域内的三个地区完成,本报告重点关注南大西洋 (CHS-SA)。本研究应用 CHS 的概率框架和增强元建模预测的联合概率方法 (JPM-AMP) 对热带气旋 (TC) 和温带气旋 (XC) 响应进行概率沿海危害分析 (PCHA),利用新的大气和流体动力学数值模型模拟合成 TC 和历史 XC。本报告记录了

评估具有不均匀堤岸高度的桥梁补充集架空电缆系统

Evaluation of the Bridge Supplement Set overhead cable system with uneven bank heights

摘要:开发了一个数值模型,用于分析环境条件和施工布局对现代化桥梁补充组 (BSS) 结构能力的影响。环境变量包括均匀和不均匀的河岸高度、土壤强度、河流宽度和河流流速条件。施工变量包括塔架位置、塔架拉线方向和悬链线长度。负载条件,即河流对桥梁的拖拽力,保守地应用,假设整个河流宽度的流速均匀,以考虑 BSS 可能使用的广泛操作环境。系统性能分析为 BSS 的几种构造优化提供了参考,以在考虑的广泛条件下最大限度地提高系统能力。发现悬链线长度对系统性能的影响最大,这表明悬链线长度的轻微增加将大大减少 BSS 关键部件的负载,从而提高系统的容量和安全性。开发了一个独立的计算机程序,以快速为各种操作条件提

本周报道及专栏摘要[9/3-9/9期]

今週のレポート・コラムまとめ【9/3-9/9発行分】

▼研究者之眼 ☆赏月×鸡蛋 - 消费的交叉点(7) ☆走向可持续发展 - 是否有必要继续超越SDG的努力? ☆新NISA本来是税收制度优惠待遇的扩大 -我们是否可以将其名称与资产管理的讨论分开? - ☆从当前情况考虑拒绝工作机会的原因以及跟进工作机会的重要性 ------------- ----- ▼《经济学家周刊》☆美国经济前景 - 预计 2024 年下半年经济放缓,但避免衰退☆2024/2025 年经济展望 - 2014 年 4 月至 6 月第二次 GDP 初步报告后修订☆日元贬值快速修正 ~ 展望未来☆ 印度经济前景 ~ 由于政府支出加速和农业部门复苏,印度经济在 6% 的高位徘徊 增长

气候变化和水预算:根据最近的观察解释干旱风险增加的原因

Climate Change and Water Budgets: Accounting for Increased Drought Risk based on Recent Observations

图:1993-2022 年观测到的 SPEI 干旱指数值比较,3 个月累计 D 值:面板 (a) 基于 1981-2010 年观测的 SPEI,面板 (b) 基于 LOCA2 预测的 2031-2060 年条件的 SPEI,以及面板 (c) 基于 WG 预测的 2031-2060 年条件的 SPEI。SPEI ≤-1.5 代表严重干旱条件。根据 1981-2010 年观测到的气候描述 […]

预测使用物理信息神经网络 (PINN) 测量土壤水分含量

Predicting Soil Moisture Content Using Physics-Informed Neural Networks (PINNs)

摘要:近地表土壤含水量等环境条件是物体检测问题中的宝贵信息。然而,如果没有主动感知,通常无法以必要的规模获得此类信息。理查兹方程是一个描述非饱和土壤入渗过程的偏微分方程 (PDE)。求解理查兹方程可以得到有关土壤体积含水量、水力传导率和毛细管压力头的信息。然而,由于理查兹方程的非线性,它很难近似。有限差分法 (FDM) 和有限元法 (FEM) 等数值求解器是近似理查兹方程解的常规方法。但此类数值求解器在实时使用时非常耗时。物理信息神经网络 (PINN) 是依赖物理方程近似解的神经网络。一旦经过训练,这些网络就可以快速输出近似值。因此,PINN 在数值 PDE 社区中引起了广泛关注。该项目旨在将

FUNWAVE 模型是解决船舶尾流问题的可行方案

FUNWAVE Model is a Feasible Solution for Vessel Wake Issues

FUNWAVE 是一种数值波浪模型,可模拟浅水和中水中的海面波浪传播,由 ERDC 开发和更新,并于 1998 年发布。它可用于模拟复杂的沿海过程,例如海啸波、沿海洪水、波浪传播和海浪区尺度的光学特性。

Google AI 推出 NeuralGCM:一种基于机器学习 (ML) 的模拟地球大气的新方法

Google AI Introduces NeuralGCM: A New Machine Learning (ML) based Approach to Simulating Earth’s Atmosphere

大气环流模型 (GCM) 构成了天气和气候预测的支柱,利用数值求解器进行大规模动力学计算,并利用参数化进行小规模过程(如云形成)。尽管不断改进,GCM 仍面临重大挑战,包括长期气候预测和极端天气事件中持续存在的错误、偏差和不确定性。最近的机器学习 (ML) 模型取得了显著的成功。Google AI 推出 NeuralGCM:一种基于机器学习 (ML) 的模拟地球大气的新方法,该文章首次出现在 AI Quantum Intelligence 上。