深度学习与计算机视觉实战-教学大纲.docx
- 文档编号:30799010
- 上传时间:2023-10-12
- 格式:DOCX
- 页数:7
- 大小:27.72KB
深度学习与计算机视觉实战-教学大纲.docx
《深度学习与计算机视觉实战-教学大纲.docx》由会员分享,可在线阅读,更多相关《深度学习与计算机视觉实战-教学大纲.docx(7页珍藏版)》请在冰豆网上搜索。
《深度学习与计算机视觉实战》教学
大纲
课程名称:
深度学习与计算机视觉实战
课程类别:
必修
适用专业:
大数据技术类相关专业
总学时:
64学时(其中理论40学时,实验24学时)
总学分:
4.0学分
一、课程的性质
随着人工智能的发展,计算机视觉作为人工智能的一个重要分支,已经被成功应用到人脸识别、目标检测、道路场景分割、图像超分辨率等领域,被大多数人熟知和应用。
深度学习在计算机视觉的应用效果一骑绝尘,频频刷新传统图像处理方法在计算机视觉领域创造的记录。
能够熟练应用深度学习技术且具有实践经验的计算机视觉人才已经成为了各企业争夺的热门。
为了推动我国大数据,云计算,人工智能行业的发展,满足日益增长的计算机视觉人才需求,特开设深度学习与计算机视觉实战课程。
二、课程的任务
通过本课程的学习,使学生学会使用Python进行图像处理基本操作和处理深度学习视觉基础任务,并详细拆解学习人脸识别、目标检测、道路场景分割、图像超分辨率等案例,将理论与实践相结合,为将来从事计算机视觉研究、工作奠定基础。
三、课程学时分配
序号
教学内容
理论学时
实验学时
其它
1
第1章概述
2
1
2
第2章图像处理基本操作
6
2
3
第3章深度学习视觉基础任务
8
4
4
第4章基于CNN人脸识别实战
6
4
5
第5章基于FasterR-CNN的目标
检测实战
6
4
6
第6章基于U-Net的城市道路场景
分割实战
6
4
7
第7章基于SRGAN的图像超分辨
率技术实战
6
4
总计
40
24
四、教学内容及学时安排
1.理论教学
序号
章节名称
主要内容
教学目标
学时
1
概述
1.计算机视觉的发展历程
2.深度学习的发展历程
3.计算机视觉常见的应用领域
4.常见的深度学习框架
5.常用的图像处理库
1.了解计算机视觉的发展历程
2.了解深度学习的发展历程
3.了解计算机视觉常见的应用领域
4.了解常见的深度学习框架
5.了解常用的图像处理库
2
2
图像处理基本操作
1.常见图像类型
2.读取图像
3.显示图像
4.保存图像
5.常用颜色空间
6.颜色空间转换
7.图像几何变换
8.图像增强
L了解数字图像数据表示形式和常见的图像类型
2.掌握图像的读写操作
3.掌握常用的不同颜色空间互相转换的方法
4.掌握常用的图像几何变换方法
5.掌握常用的图像增强方法
6
3
深度学习视觉基础任务
1.深度神经网络的基本结构
2.卷积神经网络的基本结构
3.卷积神经网络的训练过程
4.图像分类的经典深度神经网络算法
5.训练图像分类网络的方法
6.目标检测的经典深度神经网络算法
7.训练目标检测网络的方法
8.图像分割的经典深度神经网络算法
9.训练图像分割网络的方法
10.图像生成的经典深度神经网络算法
11.训练图像生成网络的方法
1.了解深度神经网络和卷积神经网络的基本结构和原理2.掌握经典的基于深度学习的图像分类的实现方法
3.掌握经典的基于深度学习的目标检测的实现方法
4.掌握经典的基于深度学习的图像分割的实现方法
5.掌握经典的基于深度学习的图像生成的实现方法
8
4
基于CNN人脸识别实战
1.人脸识别技术的发展历程和实现方案
2.实现人脸识别的流程
3.MTCNN人脸检测算法的原理和实现方法
4.人脸姿态矫正对齐的方法
5.提取人脸特征的方法
6.匹配人脸特征的方法
7.评价人脸识别效果的方法
1.了解人脸识别技术的发展历程和实现方案
2.熟悉实现人脸识别的流程
3.掌握MTCNN人脸检测算法的原理和实现方法
4.掌握人脸姿态矫正对齐的方法
5.掌握三元组损失
(TripletLoss)的基本原理并训练卷积网络
6.掌握人脸特征距离的计算方法
7.掌握人脸识别技术的评价指标
6
5
基于FasterR-CNN的目标检测实战
1.目标检测的背景和目标
2.实现目标检测的流程
3.VOC2012数据集的结构
4.定义FasterR-CNN配置信息类的方法
5.生成先验锚框的方法
6.FasterR-CNN损失函数的作用和原理
7.目标检测算法的性能评估指标
1.了解目标检测的背景和目标
2.掌握PASCALVOC数据集的标注样本格式,并批量处理PASCALVOC数据集标注样本
3.掌握定义FasterR-CNN配置信息函数的方法
4.掌握生成先验锚框的方法,并根据不同的检测对象特性调整先验锚框的生成策略
5.T解FasterR-CNN损失函数的作用和原理
6.掌握目标检测算法的性能评估指标的构建方法
6
6
基于U-Net的城市道路场景分割实战
1.语义分割的基本概念和应用
2.实现图像分割的流程
3.CamVid数据集的读取方法
4.搭建U-Net的方法
5.语义分割网络损失函数的设计方法
6.评价语义分割算法的方法
1.了解语义分割的基本概念和应用
2.掌握CamVid数据集的读取方法
3.掌握U-Net的设计方法
4.掌握语义分割网络损失函数的设计方法
5.掌握评价语义分割算法的方法
6
7
基于SRGAN的图像超分辨率技术实战
1.常用的图像超分辨方法
2.不同图像超分辨方法的区别和特性
3.图像超分辨率的流程
4.DIV2K数据集的读取方法
5.生成器和判别器的搭建方法
6.生成器损失和判别器损失函数
7.评价图像超分辨率模型的方法
1.了解常用的图像超分辨方法,以及不同图像超分辨方法的区别和特性
2.熟悉基于SRGAN实现图像超分辨率的流程和步骤
3.掌握DIV2K数据集的读取方法
4.掌握搭建生成器和判别器的方法
5.了解生成器损失和判别器损失的设计
6.掌握评价图像超分辨率模型的方法
6
学时合计
40
2.实验教学
序号
实验项目名称
实验要求
学时
1
Python深度学习环境搭建
1.创建环境
2.激活创建好的环境
3.安装TensorFlow
1
2
图像处理基本操作
1.读取图像
2.显示图像
3.保存图像
4.转换颜色空间
5.图像平移
6.图像缩放
7.图像旋转
2
8.图像仿射
9.灰度级修正
10.图像平滑
11.图像锐化
3
深度学习视觉基础任务
1.搭建和训练ResNet50网络
2.搭建和训练YOLOv3网络
3.搭建和训练MaskR-CNN网络
4.搭建和训练WGAN网络
4
4
基于CNN人脸识别实战
1.人脸检测
2.人脸对齐
3.搭建网络并训练,提取人脸特征
4.定义人脸特征匹配函数实现人脸特征匹配
5.分析结果
4
5
基于FasterR-CNN的目标检测实战
1.生成数据集索引文件
2.定义配置信息类
3.生成先验锚框
4.定义损失函数
5.训练网络
6.分析结果
4
6
基于U-Net的城市道路场景分割实战
1.加载数据集
2.搭建网络
3.定义损失函数
4.训练网络
5.分析结果
4
7
基于SRGAN的图像超分辨率技术实战
1.加载数据
2.搭建网络
3.定义损失函数
4.训练网络
5.分析结果
4
学时合计
24
五、考核方式
突出学生解决实际问题的能力,加强过程性考核。
课程考核的成绩构成=平时作业(10%)+课堂参与(20%)+期末考核(70%),期末考试建议采用开卷形式,试题应包括基本概念、图像处理基本操作、深度学习视觉基础任务、人脸识别、目标检测、图像分割、图像超分辨率等部分,题型可采用判断题、选择、简答、应用题等方式。
六、教材与参考资料
1.教材
彭小红,张良均.深度学习与计算机视觉实战[M].北京:
人民邮电出版社.2022.
2.参考资料
[1]JanErikSolem,索利姆,朱文涛,等.Python计算机视觉编程[M].人民邮电出版社,2014.
[2]弗朗索瓦•肖莱,张亮等.Python深度学习[M].人民邮电出版社,2018.
[3]RafaelCGonzalez,阮秋琦等.数字图像处理[M].电子工业出版社,2011.
[4]IanGoodfellow.赵申剑等.深度学习[M].人民邮电出版社,2017.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 深度 学习 计算机 视觉 实战 教学大纲