神经网络基本概念___2024-04-28

数学处理
正则化数据
误差计算
- 二元分类问题(binary classification problem)
- 多分类问题(multi-class classification problem)
模型评估
常见激活函数

数学处理

正则化数据

正则化(Scaling)数据, 即将数据缩放到一个合理的范围
对于$n$个数字$x_1, x_2, \dots, x_n$
求其 均值(mean) : $\mu = \frac{1}{n} \sum_{i=1}^n x_i$
求其 标准差(standard deviation) : $\sigma = \sqrt{\frac{1}{n} \sum_{i=1}^n (x_i – \mu)^2}$
则正则化后的数据为: $x_i’ = \frac{x_i – \mu}{\sigma}$

误差计算

二元分类问题(binary classification problem)

假设有$n$个样本, $y_i$是真实值, $\hat{y_i}$是预测值,
则 交叉熵误差(cross-entropy error) 为:

$$E = -\frac{1}{n} \sum_{i=1}^n [y_i \log(\hat{y_i}) + (1-y_i) \log(1-\hat{y_i})]$$

多分类问题(multi-class classification problem)

假设有$n$个样本, 有k个标签(label), $y_{ij}$是第$i$个样本的第$j$个标签的真实值, $\hat{y_{ij}}$是第$i$个样本的第$j$个标签的预测值,
则 多分类交叉熵误差(cross-entropy error) 为:

$$E = -\frac{1}{n} \sum_{i=1}^n \sum_{j=1}^k [y_{ij} \log(\hat{y_{ij}})]$$

模型评估

记真实值是$y$, 预测值是$\hat{y}$
$y=1且\hat{y}=1$表示真正例(True Positive, TP)
$y=1且\hat{y}=0$表示假正例(False Positive, FP)
$y=0且\hat{y}=1$表示假反例(False Negative, FN)
$y=0且\hat{y}=0$表示真反例(True Negative, TN)

混淆矩阵(Confusion Matrix)
对角线的值 表示预测正确的样本数, 其他值表示预测错误的样本数
准确率(Accuracy)
$Accuracy = \frac{TP+TN}{TP+TN+FP+FN}$
正确的比所有
精确率(Precision)
$Precision = \frac{TP}{TP+FP}$
预测为正例的样本中, 真正例的比例
召回率(Recall)
$Recall = \frac{TP}{TP+FN}$
真正例中, 被预测为正例的比例
F1值(F1-score)
$F_1 = \frac{2 \times TP}{2 \times TP + FP + FN}$

常见激活函数

Sigmoid函数: $f(x) = \frac{1}{1+e^{-x}}$
Tanh函数: $f(x) = \frac{e^x – e^{-x}}{e^x + e^{-x}}$
ReLU函数: $f(x) = \max(0, x)$

我是 zhyDaDa

我的全部文章

前端/UI/交互/独立游戏/JPOP/电吉他/游戏配乐/网球/纸牌魔术

发表回复取消回复

要发表评论，您必须先登录。

数学处理

正则化数据

误差计算

二元分类问题(binary classification problem)

多分类问题(multi-class classification problem)

模型评估

常见激活函数

我是 zhyDaDa

发表回复取消回复

近期文章

近期评论

数学处理

正则化数据

误差计算

二元分类问题(binary classification problem)

多分类问题(multi-class classification problem)

模型评估

常见激活函数

我是 zhyDaDa

Related Posts

并查集___2023-08-26

前缀数和贪心算法___2023-08-05

Linux小连招___2024-09-18

发表回复 取消回复

近期文章

近期评论

发表回复取消回复