详细内容或原文请订阅后点击阅览
我在机器学习比赛中赢了10,000美元 - 这是我的完整策略
ML竞赛的特征选择,阈值优化和神经网络体系结构的完整指南,我在机器学习竞赛中赢得了10,000美元的奖金 - 这是我的完整策略首先出现在数据科学方面。
来源:走向数据科学在我的第一次ML比赛中,老实说,我仍然有些震惊。
我在金融科技的数据科学家工作了六年。当我看到Spectral Finance对Web3钱包的信用评分挑战挑战时,尽管有零区块链经验,但我还是决定尝试一下。
这是我的局限性:
- 我使用了我的计算机,没有GPUSI只有一个周末(〜10个小时)才能在ITI上工作,从未触摸过Web3或区块链数据,然后再构建神经网络以进行信用评分
竞争目标很简单:预测哪些Web3钱包可能会使用其交易历史记录默认贷款。从本质上讲,传统的信用评分,但使用DEFI数据而不是银行对帐单。
令我惊讶的是,我获得了第二名,并赢得了1万美元的美元硬币!不幸的是,光谱融资自那以后就占据了竞争地点和排行榜,但这是我赢得的屏幕截图:
第二这种经历告诉我,了解业务问题确实很重要。在这篇文章中,我将通过详细的说明和Python代码片段来确切地向您展示如何进行操作,以便您可以为下一个机器学习项目或竞争重复此方法。
入门:您不需要昂贵的硬件
让我清楚地说,您不一定需要昂贵的云计算设置来赢得ML竞赛(除非数据集太大而无法本地适合)。
您不一定需要昂贵的云计算设置来赢得ML竞赛 。该竞赛的数据集包含77个功能和443K行,无论如何,这并不小。数据是我使用DuckDB下载的.parquet文件。
.parquet
洞察力:
EDA:了解您的数据 信用评分中的第一个问题:班级分布是什么?
EDA:了解您的数据信用评分中的第一个问题:班级分布是什么?