神经网络,为初学者解释:如果它们让您感到困惑,请从这里开始

神经网络背后的直觉以及为什么它们需要激活函数。神经网络,为初学者解释:如果他们让你感到困惑,请从这里开始,首先出现在走向数据科学上。

来源:走向数据科学

有关大型语言模型、Agentic AI、多模态系统以及 RAG 等技术等最新技术的信息。

这些技术到底是什么?

它们是如何构建的?

我了解到大型语言模型 (LLM) 是建立在经过严格训练的神经网络之上的先进人工智能系统。

我也想了解这些技术。

由于神经网络构成了这些最新技术的基础,我想首先了解神经网络到底是什么。

但当我遇到隐藏层、激活函数、图像数据和文本数据等术语时,我感到不知所措。

继续学习神经网络变得很困难。

我了解到,我们主要在处理图像和文本等复杂数据时使用深度学习和神经网络。

然而,我觉得使用如此复杂的数据可能会让理解神经网络的基础知识变得困难。

我想知道如何才能让它变得更简单。因此,我决定首先使用简单的数据来详细了解神经网络内部实际发生的情况,而不是从复杂的数据开始。

因此,本文的主要目的是了解神经网络实际上是什么以及它们如何使用简单的数据集从数据中学习。

在本文中,我们将从头开始构建一个简单的神经网络并了解其工作原理。

我们将了解神经元内部发生的情况、不同层如何协同工作、为什么添加更多线性神经元仍然不够,以及激活函数如何帮助神经网络对数据中的复杂模式进行建模。

当直线不够时

您可能遇到过类似的图表,如下所示,显示了神经网络的基本结构。

我们来一层层理解一下。

但在我们了解它是如何工作之前,我们需要一些数据。让我们考虑这个简单的数据集,显示学生的考试成绩和他们的学习时间。

数据:

现在,让我们绘制这些数据。

代码:

情节:

现在我们能做什么?

为什么简单很重要

神经网络时代