《数据标注工程——概念、方法、工具与案例》教学课件—12数据标注的发展趋势.pptx
- 文档编号:30779242
- 上传时间:2023-08-26
- 格式:PPTX
- 页数:28
- 大小:2.21MB
《数据标注工程——概念、方法、工具与案例》教学课件—12数据标注的发展趋势.pptx
《《数据标注工程——概念、方法、工具与案例》教学课件—12数据标注的发展趋势.pptx》由会员分享,可在线阅读,更多相关《《数据标注工程——概念、方法、工具与案例》教学课件—12数据标注的发展趋势.pptx(28页珍藏版)》请在冰豆网上搜索。
人工智能技术应用核心课程系列教材,数据标注工程概念、方法、工具与案例,12.2人工智能数据发展趋势,人工智能技术应用核心课程系列教材,12.1人工智能总体发展趋势,12.4本章小结,12.5作业与练习,12.3数据标注发展趋势,12.1人工智能总体发展趋势,第12章数据标注的发展趋势,美国早在2013年设立了“推进创新神经技术脑研究计划”,计划未来12年投入45亿美元支持研发;欧盟提出人脑计划,共有15个国家参与;我国也出台了国务院关于印发新一代人工智能发展规划的通知(国发201735号)、促进新一代人工智能产业发展三年行动计划(2018-2020年)(工信部科2017315号)等系列政策。
12.1.1主要国家和地区高度重视AI发展,12.1人工智能总体发展趋势,第12章数据标注的发展趋势,人工智能技术的生态链,可以划分为基础层、数据层、技术层和应用层。
在数据层面,我国采集场景丰富,加上人工成本相对较低,能够低成本获得海量标准化训练数据,较其他国家具有绝对优势。
12.1.1主要国家和地区高度重视AI发展,12.1人工智能总体发展趋势,第12章数据标注的发展趋势,数据、算法、算力是人工智能的三要素。
目前人工智能商业化在算力、算法方面基本达到阶段性成熟,想要更加落地,解决行业具体痛点,需要大量经过标注处理的相关数据做算法训练支撑,可以说数据决定了人工智能的落地程度。
机器学习特别是深度学习是现阶段实现人工智能的主要手段。
深度学习算法多采用有监督学习模式,即需要标注数据对学习结果进行反馈,在大量数据训练下,算法错误率能大大降低。
12.1.2有监督学习仍是人工智能的主流,12.1人工智能总体发展趋势,第12章数据标注的发展趋势,数据越多,效果越好。
业界的共识是“大量数据+普通模型”往往会比“普通数据+高级模型”的效果要好。
12.1.2有监督学习仍是人工智能的主流,12.2人工智能数据发展趋势,人工智能技术应用核心课程系列教材,12.1人工智能总体发展趋势,12.4本章小结,12.5作业与练习,12.3数据标注发展趋势,12.2人工智能数据发展趋势,第12章数据标注的发展趋势,自动驾驶应用中的数据需求,12.2.1人工智能数据需求,12.2人工智能数据发展趋势,第12章数据标注的发展趋势,语音识别应用中的数据需求语音识别设备的开发,需要在覆盖全国各大方言区域,采集各地主要语种语料,需要从多种生活化语音录制场景中筛选出高标准语音数据。
包括重口音、普通话,方言、少数民族语言、主流外文等语种,采集设备需涵盖主流设备(安卓、IOS、高麦)。
语音识别数据可用于同步翻译、机器人语言训练、手机助手、车载智能交互、智能客服等应用场景。
12.2.1人工智能数据需求,12.2人工智能数据发展趋势,第12章数据标注的发展趋势,人脸识别应用中的数据需求人脸识别技术的发展需要提供多种类型的人脸图像数据:
一人多照图像数据、各类表情姿态图像数据、覆盖全年龄段人脸图像及视频数据和监控视频类人脸图像数据等。
此外还需要定制专属人脸图像数据。
人种分布于黄种人、白种人、黑种人,具有多角度、多光照、多姿态、跨年龄等多采集方式,采集设备涵盖高倍相机、相机阵列、3D照相机等多种设备,标注内容包括关键点、脸廓、发髻、情绪等。
人脸识别数据可应用于银行身份认证、高铁进站核验、智能安防等场景。
12.2.1人工智能数据需求,12.2人工智能数据发展趋势,第12章数据标注的发展趋势,智能家居应用中的数据需求智能家居系列数据包含儿童语音识别、多语种混合识别、老人语音识别、远场语音识别和方言语音识别等系列数据。
主要应用于智能音箱、智能家电、儿童故事机、陪伴机器人等产品研究领域。
12.2.1人工智能数据需求,12.2人工智能数据发展趋势,第12章数据标注的发展趋势,智能安防应用中的数据需求,12.2.1人工智能数据需求,12.2人工智能数据发展趋势,第12章数据标注的发展趋势,智能制造应用中的数据需求,12.2.1人工智能数据需求,12.2人工智能数据发展趋势,第12章数据标注的发展趋势,智能交通应用中的数据需求随着交通卡口的大规模联网,汇集了海量车辆通行记录信息,利用人工智能技术,可实时分析城市交通流量,调整红绿灯间隔,缩短车辆等待时间等举措,提升城市道路的通行效率。
12.2.1人工智能数据需求,12.2人工智能数据发展趋势,第12章数据标注的发展趋势,人工智能对数据资源服务的需求趋势,12.2.1人工智能数据需求,12.2人工智能数据发展趋势,第12章数据标注的发展趋势,12.2.2人工智能数据市场规模,12.2人工智能数据发展趋势,第12章数据标注的发展趋势,在新一代人工智能发展的角度上看,人工智能数据呈现以下特点:
(1)数据量大:
为了建模的准确性,需要一定规模的数据量。
当数据量越大,覆盖的问题范围增大,依据数据创立的模型也就越准确。
在可能的情况下,数据量尽可能地增大,因此产生大量的数据需要进行标注。
(2)数据类型繁杂:
随着传感器的精度和类型的变化,采集的数据类型也是增加的。
例如在自动驾驶中使用的激光雷达数据,就是近期出现的新的数据类型。
12.2.3人工智能数据需求特点,12.2人工智能数据发展趋势,第12章数据标注的发展趋势,在新一代人工智能发展的角度上看,人工智能数据呈现以下特点:
(3)多模数据组合标注:
在同一个时空限定范围内,不只有一种类型的数据,而是需要对多种类型的数据同时进行标注。
例如,相同时空条件下,语音、视频、文字同时进行标注。
(4)数据安全性不断提升:
人们对数据安全的意识不断增强,在进行数据产品生产和标注的同时,数据涉及个人隐私或存在个人隐私泄露的可能时,都需要谨慎处理,规避未知风险和社会问题。
12.2.3人工智能数据需求特点,12.2人工智能数据发展趋势,人工智能技术应用核心课程系列教材,12.1人工智能总体发展趋势,12.4本章小结,12.5作业与练习,12.3数据标注发展趋势,12.3数据标注发展趋势,第12章数据标注的发展趋势,当前人工智能发展出现了细分化、多模态以及专业化特征。
自动驾驶:
需要雷达+摄像头才能跑的更稳安防行业:
需要摄像头+雷达红外射频才能感知得更精准、更真实智能医疗:
需要专业的医师才能标注医疗影像智能制造:
需要业内有经验的工人师傅才能标注工业缺陷,12.3.1定制化精细化发展,12.3数据标注发展趋势,第12章数据标注的发展趋势,随着人工智能技术的发展,数据标注工具需要从只支持人工标注逐渐转化为人工标注+智能辅助标注的方法。
通过使用计算机视觉和语音识别技术对数据进行初步识别,可以在短时间内达到90%以上的校验正确率,实现几倍于人力的工作效率。
12.3.2高度自动化发展,12.3数据标注发展趋势,第12章数据标注的发展趋势,2019年,华为云发布ModelArts2.0,只需人工标注一小部分数据,它就可以帮你标注剩下数据。
人工智能软件公司Neurala在视频数据标注自动化上,当标注员标了视频第一帧图像中的目标(人或车)后,可以自动标注后续帧里的目标。
标注成本从每小时13500美元降到6750美元。
12.3.2高度自动化发展,12.3数据标注发展趋势,第12章数据标注的发展趋势,人工智能对数据的依赖已经从小规模、低质量逐渐过渡到大批量、高效率、低成本的阶段,个体化、小作坊式的数据产品生产方式已经不能满足现有数据需求,迫切需要通过工业化、流程化、规模化数据产品生产提升数据标注的效率。
需要拥有一套自主研发贯通数据库设计、数据采集、数据处理、质量检测、质量控制和数据安全管理等各环节于一体,并且能对图像、文本、语音、视频以及点云数据做到一站式加工处理的管理和执行一体化平台。
12.3.3智能化流程化发展,12.3数据标注发展趋势,第12章数据标注的发展趋势,国家出台了各种政策,加强个人隐私保护。
未经用户授权不得泄露。
一些金融机构和政府部门格外关注外包标注数据的安全性。
为了保证数据标注平台中数据的安全性和隐私不被泄露,可以考虑采取数据治理、数据分割、数据安全传输和区块链等技术。
12.3.3重视安全与隐私保护,12.2人工智能数据发展趋势,人工智能技术应用核心课程系列教材,12.1人工智能总体发展趋势,12.4本章小结,12.5作业与练习,12.3数据标注发展趋势,12.3数据标注发展趋势,第12章数据标注的发展趋势,目前人工智能发展依旧火热,并且仍以有监督学习的模型训练方式为主。
随着AI商业化进程的演进,数据规模和市场越来越庞大,更具有前瞻性的数据集产品和高定制化服务成为AI基础数据服务行业的主要服务形式。
数据标注的发展趋势:
数据标注越来越朝着高质量、精细化、定制化的方向发展;数据标注受人工智能的影响,自动化程度越来越高;数据标注中越来越重视安全性与隐私保护。
12.2人工智能数据发展趋势,人工智能技术应用核心课程系列教材,12.1人工智能总体发展趋势,12.4本章小结,12.5作业与练习,12.3数据标注发展趋势,1人工智能的发展趋势?
2随着人工智能的发展,人工智能数据逐渐具有哪些特点?
3人工智能数据的发展趋势?
4数据标注的发展趋势?
5我国的人工智能数据有哪些优势?
6新基建的发展对人工智能及数据有什么影响及推动?
7数据量级与智能程度之间的存在怎样的联系?
8数据自动化标注流程都有哪些?
9数据智能化标注工具都有哪些?
10请简述数据安全法的出台对人工智能及数据有哪些影响?
习题:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据标注工程概念、方法、工具与案例 数据 标注 工程 概念 方法 工具 案例 教学 课件 12 发展趋势