レム・咲く夜

LemuSakuya的个人博客网站堂堂登场

这一天终于来到了！！经过长期的策划以及愚蠢的大创项目策划书的拖延，我终于部署好了我的个人博客，真的很感谢Mizuki，用这么好的模版让我舒爽一整天！！！

標籤

レム・咲く夜

LemuSakuya的个人博客网站堂堂登场

这一天终于来到了！！经过长期的策划以及愚蠢的大创项目策划书的拖延，我终于部署好了我的个人博客，真的很感谢Mizuki，用这么好的模版让我舒爽一整天！！！

標籤

レム・咲く夜

LemuSakuya的个人博客网站堂堂登场

这一天终于来到了！！经过长期的策划以及愚蠢的大创项目策划书的拖延，我终于部署好了我的个人博客，真的很感谢Mizuki，用这么好的模版让我舒爽一整天！！！

標籤

🌸 咲夜の秘密メロディ

分類

站點統計

文章

79

分類

16

標籤

24

總字數

394,959

運行天數

0 天

最後活動

0 天前

2308 字

6 分鐘

人工神经网络完全学习手册

2026-06-03

Neural Networks

Study Notes

/

Neural Networks

人工神经网络完全学习手册#

面向机器学习入门、深度学习工程、科研训练与面试准备的系统化学习资料。参考网络安全资料的写法：总览 README + 分章长文 + 项目实战目录，强调“先修知识 → 核心理论 → 训练技巧 → 项目落地”。目标不是只会调包，而是能够从零理解一个神经网络是如何定义、训练、评估、部署与迭代的。

目录结构#

1
人工神经网络/
2
├── README.md                                # 本文件：课程总览与学习路线
3
├── chapters/                                # 理论知识（8 章）
4
│   ├── 01_神经网络学习总览与路线.md
5
│   ├── 02_前置知识_线性代数_微积分_概率统计.md
6
│   ├── 03_感知机_线性模型_多层感知机.md
7
│   ├── 04_反向传播_损失函数_优化算法.md
8
│   ├── 05_训练技巧_正则化_泛化与评估.md
9
│   ├── 06_卷积神经网络与视觉建模.md
10
│   ├── 07_序列模型_RNN_LSTM_GRU_注意力入门.md
11
│   └── 08_模型解释_部署压缩_工程实战.md
12
├── projects/                                # 实战项目（4 个）
13
│   ├── README.md                            # 项目总览
14
│   ├── 01_xor_from_scratch/                 # 从零实现 XOR 神经网络
15
│   ├── 02_mnist_mlp/                        # MNIST 多层感知机分类
16
│   ├── 03_cifar10_cnn/                      # CIFAR-10 卷积网络训练
17
│   └── 04_sequence_text_classification/    # 序列分类与注意力实验
18
└── assets/                                  # 图表、实验结果、训练日志、截图

学习路线图#

1
阶段 0：数学与编程先修
2
Python · Numpy · 线性代数 · 微积分 · 概率统计 · 优化思想
3

4
阶段 1：神经网络基础
5
感知机 · 线性模型 · 激活函数 · MLP · 损失函数
6

7
阶段 2：训练与泛化
8
反向传播 · 梯度下降 · 初始化 · 正则化 · 过拟合 · 评估
9

10
阶段 3：典型结构
11
CNN · RNN · LSTM · GRU · Attention · Transformer 入门
12

13
阶段 4：工程化与落地
14
可解释性 · 模型压缩 · 导出部署 · 训练监控 · 实验管理
15

16
阶段 5：项目实战
17
XOR → MNIST → CIFAR-10 → 序列分类

顺序	章节	目标
1	01 神经网络学习总览与路线	搭建全景认知，明确学习目标
2	02 前置知识	补齐数学与编程先修
3	03 感知机与多层感知机	理解神经元、激活函数与 MLP
4	04 反向传播与优化算法	搞懂梯度如何传递与更新
5	05 训练技巧与泛化	解决训练不稳定、过拟合与评估
6	06 卷积神经网络	从全连接过渡到视觉任务
7	07 序列模型与注意力	进入文本、语音、时间序列建模
8	08 模型解释与部署	面向工程、实验与落地
9	项目总览	进入实战项目

先修知识#

1. 编程基础#

Python 语法、函数、类、列表推导式
Numpy 数组、广播、向量化思维
Matplotlib / Seaborn 基础绘图
Pandas 数据读取、清洗与统计

2. 数学基础#

向量、矩阵、张量、范数、特征值
导数、偏导数、链式法则
概率、期望、方差、交叉熵
极大似然、凸优化、拉格朗日乘子

3. 机器学习基础#

监督学习 / 无监督学习 / 强化学习的区别
训练集、验证集、测试集划分
欠拟合、过拟合、偏差、方差
分类、回归、聚类、降维

4. 工程基础#

Git 基础操作
虚拟环境管理：venv / conda
GPU / CPU 训练的基本概念
训练日志、随机种子、实验复现

场景	推荐工具
数值计算	Python、Numpy、Scipy
数据分析	Pandas、Matplotlib、Seaborn
经典深度学习	PyTorch、Torchvision
轻量实验	Jupyter Notebook
可视化	TensorBoard、Weights & Biases
模型导出	ONNX、TorchScript

核心能力矩阵#

能力域	入门	进阶	熟练
理论理解	能说出神经元与激活函数	理解前向传播与反向传播	能推导梯度并解释训练现象
编程实现	能用框架搭建模型	能从零实现 MLP	能写训练循环与调参脚本
数据处理	会做标准化	会处理类别不平衡	会构造数据增强与特征工程
训练调参	会改学习率	会调正则化与优化器	能定位损失震荡、梯度爆炸
评估部署	会看准确率	会看 F1、AUC、混淆矩阵	能做压缩、导出与推理加速

学习方法建议#

先看理论章节，再做项目，不要反过来只会抄代码。
每个公式都要推一遍，尤其是前向传播、交叉熵和反向传播。
每个模型都至少做一次“从零实现”，即使最终用框架训练。
每次实验都记录：数据、参数、曲线、错误、结论。
每个项目至少完成一次“基线版本”和一次“改进版本”。

项目实战路线#

项目	核心收获	建议顺序
XOR 从零实现	理解非线性与隐藏层	第 1 个项目
MNIST MLP	理解完整训练流程	第 2 个项目
CIFAR-10 CNN	理解卷积与图像任务	第 3 个项目
序列分类与注意力	理解时序建模与注意力	第 4 个项目

参考资料#

Ian Goodfellow, Yoshua Bengio, Aaron Courville. 《Deep Learning》
Christopher Bishop. 《Pattern Recognition and Machine Learning》
Aurélien Géron. 《Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow》
邱锡鹏：《神经网络与深度学习》
李沐《动手学深度学习》