走向数据科学领域信息情报检索

在数据科学领域分享概念、思想和代码。Towards Data Science Inc.是一家在加拿大注册的公司。它为成千上万的人提供了一个交流思想、扩展对数据科学理解的平台。

椰子:LLMS中潜在推理的框架

Coconut: A Framework for Latent Reasoning in LLMs

用简单的术语解释椰子(训练大语言模型以在连续的潜在空间中进行推理)椰子:LLMS中潜在推理的框架首先出现在数据科学方面。

细粒度视觉分类的精致培训配方

A Refined Training Recipe for Fine-Grained Visual Classification

FGVC的目标是如何识别超级类别的多个下属类别的图像,帖子首先出现在数据科学方面。

用伯托

Fine-Tune Your Topic Modeling Workflow with BERTopic

学习如何微调伯托设置,以使其更加集中,可重复和可解释的结果在Post Post-post the Tune Tune Tune您的主题建模工作流程与Bertopic首次出现在数据科学方面。

从无数据估算:从类别中得出连续得分

Estimating from No Data: Deriving a Continuous Score from Categories

使用低容量网络的练习和数学是在仅可用于培训的分类标签时获得细粒度得分的。我们使用它来根据以前情况下仅基于粗糙结果的信息来预测量表上感染的严重性。从无数据估算的帖子:从类别中得出连续得分的帖子首先出现在数据科学上。

从基因到神经网络:从头开始理解和建立整洁的(增强拓扑的神经进化)

From Genes to Neural Networks: Understanding and Building NEAT (Neuro-Evolution of Augmenting Topologies) from Scratch

实用的神经进化:从基因到神经网络的帖子再现了Nyeat的创新和代码演练:从SCRATCH中理解和构建整洁(增强拓扑的神经进化)首先出现在数据科学上。

langgraph + scipy:构建一个读取文档并做出决定的AI

LangGraph + SciPy: Building an AI That Reads Documentation and Makes Decisions

停止猜测您的统计测试。让这个人工智能为您做。

如何设计机器学习实验 - 正确的方式

How to Design Machine Learning Experiments — the Right Way

成功的ML项目的关键并不总是更多的资源,即如何设计机器学习实验 - 正确的方法首先出现在数据科学方面。

如何撰写有见地的技术文章

How to Write Insightful Technical Articles

学习如何撰写信息丰富的技术文章帖子如何撰写有见地的技术文章,首先是迈向数据科学。

神秘的余弦相似性

Demystifying Cosine Similarity

NLP场景的数学直觉和实际考虑因素首先在数据科学上出现了余弦相似性。

时间序列预测变得简单(第3.2部分):深入研究基于黄土的平滑

Time Series Forecasting Made Simple (Part 3.2): A Deep Dive into LOESS-Based Smoothing

探索STL如何使用黄土平滑来提取趋势和季节性组件。帖子时间序列预测变得简单(第3.2部分):深入研究基于黄土的平滑,首先出现在数据科学上。

查找黄金示例:一种更智能的文化学习方法

Finding Golden Examples: A Smarter Approach to In-Context Learning

从随机示例选择到系统的Aupair生成 - 如何使LLM提示实际上是在工作的帖子查找黄金示例:更智能的秘密学习方法首先出现在数据科学方面。

关注渠道的关注|挤压和激发

The Channel-Wise Attention | Squeeze and Excitation

使用pytorch在频道的关注下,将挤压和激发模块应用在resnext上|首先,挤压和激发出现在数据科学方面。

MCP安全生存指南:最佳实践,陷阱和现实世界课程

The MCP Security Survival Guide: Best Practices, Pitfalls, and Real-World Lessons

除非您是一个生活和呼吸网络安全的人,否则您可能对身份验证,网络曝光或其他人找到您的服务器会发生什么考虑。本指南不是在这里杀死兴奋 - 它是为了帮助您使用MCP而不打开麻烦的大门。《 MCP安全生存指南:最佳实践,陷阱,陷阱和现实世界的课程》首先出现在数据科学上。

我如何赢得“大部分AI”综合数据挑战

How I Won the “Mostly AI” Synthetic Data Challenge

深入研究后处理如何增强合成数据生成如何赢得“主要是AI”合成数据挑战的帖子首先出现在数据科学方面。

机器,专家和普通人

The Machine, the Expert, and the Common Folks

看噪声,一致性和腿部骨折的机器,专家和普通人首先出现在数据科学上。

infiniband vs rocev2:为大规模AI选择正确的网络

InfiniBand vs RoCEv2: Choosing the Right Network for Large-Scale AI

了解Infiniband和Rocev2如何启用高速GPU通信Infiniband vs Rocev2:选择合适的大型AI网络首先出现在数据科学方面。

我希望在开始ML

Things I Wish I Had Known Before Starting ML

第2部分:护栏,研究法规,阅读我希望在开始ML之前已经知道的帖子,首先出现在数据科学方面。

如何完全由LLM药物制成的研究实验室开发了可以阻断病毒>的分子

How a Research Lab Made Entirely of LLM Agents Developed Molecules That Can Block a Virus

欢迎借助大型语言模型和推理AI代理的手中,研究实验室如何完全由LLM代理制成的分子开发了可以阻止病毒的分子,该分子首先出现在数据科学上。