重新审视一下所谓的逻辑反应,它的实质并不复杂,可以通过这张图来详细解释。在之前的讲述中,我们已经提到过,它其实就是今天要介绍的网络中的元。那么它具体做了什么呢?左边展示的是一个数值,在这里,这个数值被视作一条项链,它是一条带有i的特征的项链。
通过一种简单的方法,那就是运用线性模型。这个线性模型在我们讲解线性回归时已经介绍过。它将x项量转化为像z这样的实数值。这种转换方式非常直观,每一个特征都会被赋予一个权重,然后将这些权重加总起来,再加上一个偏置项,最终得到实数z。
在预测任务中,我们可以使用z作为预测值来训练模型,寻找一组最优的参数。而在二分类任务的分类过程中,我们需要将z转换成一个概率值,即介于零和一之间的概率值。这里所使用的函数就是所谓的非线性变换,它被称为Sigmal函数,有时也称作逻辑函数。
这个函数的形状呈现出一种特殊的形式,即一分之一加上z的负方。当z等于零时,函数的值是二分之一,即零点五。而当z值逐渐增大时,e的负z方会趋近于零,函数值则趋近于一。当z趋向于负无穷大时,其负方分之一将趋近于正无穷大,但因分母的存在,其整体输出仍保持在零到一之间,因此它被用作输出所谓的概率值。
在网络中,最基本的概念就是包含大量的元。这些元是对之前反应的优化。稍后我们将详细讨论这一概念。通过构建更多的元,网络能够实现更为复杂的能力和功能,使它能够解决更为复杂的任务。