Zing 论坛

正文

CSE375机器学习课程实验仓库:从基础算法到深度学习的完整学习路径

东威大学CSE375机器学习课程的完整实验记录,涵盖11个实验模块,从数据预处理到CNN变体研究,构建了传统机器学习与深度学习的系统化实践体系。

机器学习深度学习课程实验PythonTensorFlowScikit-learnCNN神经网络监督学习无监督学习
发布时间 2026/06/09 02:45最近活动 2026/06/09 02:47预计阅读 3 分钟
CSE375机器学习课程实验仓库:从基础算法到深度学习的完整学习路径
1

章节 01

CSE375机器学习课程实验仓库导读

本仓库是东威大学CSE375机器学习课程的完整实验记录,由Yeamin Rahman Mahid维护。它包含11个循序渐进的实验模块,覆盖从传统机器学习到现代深度学习的完整技术栈。每个实验均提供代码实现、可视化结果和性能评估,形成结构化、可复现的学习路径,对系统掌握机器学习实践具有重要参考价值。

2

章节 02

项目背景与来源

3

章节 03

技术栈与工具链

项目采用Python生态主流工具组合:

  • 数据处理: NumPy、Pandas(数据清洗、特征工程)
  • 机器学习框架: Scikit-learn(传统算法实现)
  • 深度学习: TensorFlow/Keras(神经网络构建)
  • 可视化: Matplotlib、Seaborn(分析图表生成)
  • 开发环境: Jupyter Notebook、Google Colab(交互式开发)
4

章节 04

实验模块深度解析

11个实验模块分为五个阶段:

  • 基础监督学习(1-2): 数据预处理(缺失值/异常值处理、编码、缩放),k-NN、加权k-NN、决策树算法实现与超参数调优,评估指标(准确率、精确率、召回率、F1分数)分析。
  • 集成方法与模型评估(3-4): Bagging、随机森林、AdaBoost、XGBoost等集成策略,K折/分层K折交叉验证对比。
  • 无监督学习与异常检测(5-7): K-Means、层次聚类、DBSCAN聚类(WCSS/轮廓系数评估),Apriori关联规则、PCA/t-SNE降维,Z-score、孤立森林异常检测。
  • 深度学习基础(8-9): 损失函数(均方误差、交叉熵等)、激活函数(Sigmoid、ReLU等)特性分析,梯度下降、Adam等优化器收敛行为对比。
  • 神经网络架构实践(10-11): ANN/CNN完整实现(池化、Dropout、正则化),CNN变体(深度可分离卷积、空洞卷积、分组卷积)性能与效率权衡研究。
5

章节 05

学习目标与成果

完成课程后可具备:

  1. 端到端机器学习流程构建能力
  2. 多种算法独立实现与对比能力
  3. 严格的模型评估与验证能力
  4. 高维数据聚类与降维应用能力
  5. 优化算法与训练动态理解能力
  6. CNN架构设计与分析能力
6

章节 06

未来扩展与使用建议

未来扩展: 计划加入Kaggle竞赛解决方案、研究型实验、深度学习项目、真实世界部署模型及论文复现。 许可: MIT许可证,允许自由使用与修改。 使用建议: 按实验顺序实践,尝试修改参数/替换数据集加深理解;将传统ML评估方法应用到深度学习实验中,实现方法论融会贯通。