数据集医学图像数据集与竞赛大全文档格式.docx
- 文档编号:20064194
- 上传时间:2023-01-16
- 格式:DOCX
- 页数:6
- 大小:20.56KB
数据集医学图像数据集与竞赛大全文档格式.docx
《数据集医学图像数据集与竞赛大全文档格式.docx》由会员分享,可在线阅读,更多相关《数据集医学图像数据集与竞赛大全文档格式.docx(6页珍藏版)》请在冰豆网上搜索。
//preprocessed-connectomes-project.org/abide/
发布于2021年度这是一个对自闭症内在大脑构造的大规模评估数据集包括539名患有ASD以及573名正常个体的功能MRI图像。
1.1.2OASIS
//oasis-brains.org/
OASIS全称为OpenAccessSeriesofImagingStudies已经发布了第3代版本第一次发布于2007年度是一项旨在使科学界免费提供大脑核磁共振数据集的工程。
它有两个数据集可用下面是第1版的主要内容。
(1)横截面数据集年度轻中老年度非痴呆以及痴呆老年度人的横断面MRI数据。
该组由416名年度龄在18岁至96岁的受试者组成的横截面数据库组成。
对于每位受试者单独获得3或者4个单独的T1加权MRI扫描包括扫描会话。
受试者都是右撇子包括男性以及女性。
100名60岁以上的受试者已经临床诊断为轻度至中度阿尔茨海默病。
(2)纵向集数据集非痴呆以及痴呆老年度人的纵向磁共振成像数据。
该集合包括150名年度龄在60至96岁的受试者的纵向集合。
每位受试者在两次或者屡次访视中进展扫描间隔至少一年度总共进展373次成像。
对于每个受试者包括在单次扫描期间获得的3或者4次单独的T1加权MRI扫描。
在整个研究中72名受试者被描绘为未被证实。
包括的受试者中有64人在初次就诊时表现为痴呆症并在随后的扫描中仍然如此其中包括51名轻度至中度阿尔茨海默病患者。
另外14名受试者在初次就诊时表现为未衰退随后在随后的访视中表现为痴呆症。
1.1.3DDSM
//marathon.csee.usf.edu/Mammography/Database.html
发布于2000年度这是一个用于挑选乳腺摄影的数字数据库是乳腺摄影图像分析研究社区使用的资源。
该工程的主要支持来自美国陆军医学研究以及装备司令部的乳腺癌研究方案。
DDSM工程是由马萨诸塞州综合医院D.KopansR.Moore南佛罗里达大学K.Bowyer以及桑迪亚国家实验室P.Kegelmeyer共同介入的合作工程。
数据库的主要目的是促进计算机算法开发方面的良好研究以帮助挑选。
数据库的次要目的可能包括开发算法以帮助诊断以及开发教学或者培训辅助工具。
该数据库包含约2,500项研究。
每项研究包括每个乳房的两幅图像和一些相关的患者信息研究时间ACR乳房密度评分异常微妙评级异常ACR关键字描绘以及图像信息扫描仪空间分辨率等。
包含可疑区域的图像具有关于可疑区域的位置以及类型的像素级“地面真实〞信息。
1.1.4MIAS
//peipa.essex.ac.uk/pix/mias/all-mias.tar.gzs:
//repository.cam.ac.uk/handle/1810/250394?
showfull
MIAS全称为MiniMammographicDatabase是乳腺图像数据库。
乳腺MG数据BreastMammography有个专门的database可以查看很多数据集链接地址为
:
//mammoimage.org/databases/
1.1.5MURA
数据集地址s:
//stanfordmlgroup.github.io/competitions/mura/
发布于2018年度2月吴恩达团队开源了MURA数据库MURA是目前最大的X光片数据库之一。
该数据库中包含了源自14982项病例的40895张肌肉骨骼X光片。
1万多项病例里有9067例正常的上级肌肉骨骼以及5915例上肢异常肌肉骨骼的X光片部位包括肩部、肱骨、手肘、前臂、手腕、手掌以及手指。
每个病例包含一个或者多个图像均由放射科医师手动标记。
全球有超过17亿人都有肌肉骨骼性的疾病因此训练这个数据集并基于深度学习检测骨骼疾病进展自动异常定位通过组织器官的X光片来确定机体的安康状况进而对患者的病情进展诊断可以帮助缓解放射科医生的疲劳。
公开可用的医学射线照相图像数据集概述
参考2018年度论文MURA:
LargeDatasetforAbnormalityDetectioninMusculoskeletalRadiographs.
1.1.6ChestX-ray14
//kaggle/nih-chest-xrays/datas:
//nihcc.app.box/v/ChestXray-NIHCC
参考论文
CheXNet:
Radiologist-LevelPneumoniaDetectiononChestX-RayswithDeepLearning
ChestX-ray14是由NIH研究院提供的其中包含了30,805名患者的112,120个单独标注的14种不同肺部疾病肺不张、变实、浸润、气胸、水肿、肺气肿、纤维变性、积液、肺炎、胸膜增厚、心脏肥大、结节、肿块以及疝气的正面胸部X光片。
研究人员对数据采用NLP方法对图像进展标注。
利用深度学习的技术早期发现并识别胸透照片中肺炎等疾病对增加患者恢复以及生存的最正确时机至关重要。
1.1.7LIDC-IDRI
//
LIDC-IDRI数据集是由美国国家癌症研究所(NationalCancerInstitute)提议采集的目的是为了研究高危人群早期肺结节检测。
该数据集中共收录了1018个研究实例。
对于每个实例中的图像都由4位经历丰富的胸部放射科医师进展两阶段的诊断标注。
该数据集由胸部医学图像文件(如CT、X光片)以及对应的诊断结果病变标注组成。
1.1.8LUNA16
//luna16.grand-challenge.org/Home/
发布于2016年度是肺部肿瘤检测最常用的数据集之一它包含888个CT图像1084个肿瘤图像质量以及肿瘤大小的范围比拟理想。
数据分为10个subsetssubset包含89/88个CTscan。
LUNA16的CT图像取自LIDC/IDRI数据集选取了三个以上放射科医师意见一致的annotation并且去掉了小于3mm的肿瘤所以数据集里不含有小于3mm的肿瘤便于训练。
1.1.9NSCLC
//Radiogenomics
发布于2018年度来自斯坦福大学。
数据集来自211名受试者的非小细胞肺癌NSCLC队列的独特放射基因组数据集。
该数据集包括计算机断层扫描CT正电子发射断层扫描PET/CT图像。
创立该数据集是为了便于发现基因组以及医学图像特征之间的根底关系和预测医学图像生物标记的开发以及评估。
1.1.10DeepLesion
//nihcc.app.box/v/DeepLesion
DeepLesion由美国国立卫生研究院临床中心NIHCC的团队开发是迄今规模最大的多类别、病灶级别标注临床医疗CT图像开放数据集。
在该数据库中图像包括多种病变类型目前包括4427个患者的32,735张CT图像及病变信息同时也包括肾脏病变骨病变肺结节以及淋巴结肿大。
DeepLesion多类别病变数据集可以用来开发自动化放射诊断的CADx系统。
1.1.11ADNI
//adni.loni.usc.edu/data-samples/access-data/
ANDI涉及到的数据集包括如下几局部ClinicalData临床数据、MRImageData磁共振成像、StandardizedMRIDataSets、PETImageData正电子发射计算机断层扫描、GenneticData遗传数据、BiospecimenData生物样本数据。
1.2医学降噪数据集
1.2.1BrainWeb数据集
//brainweb.bic.mni.mcgill.ca/brainweb/
发布于1997年度这是一个仿真数据集用于医学图像降噪。
研究者可以截取不同断层的正常脑部仿真图像包括T1T2PD3种断层设置断层的厚度叠加高斯噪声或医学图像中常见的莱斯噪声最终会得到181×
217大小的噪声图像。
1.3医学分割数据集
1.3.1DRIVE数据集
//isi.uu.nl/Research/Databases/DRIVE/download.php
发布于2003年度这是一个用于血管分割的数字视网膜图像数据集它由40张照片组成其中7张显示出轻度早期糖尿病视网膜病变迹象。
1.3.2SCR数据集
//isi.uu.nl/Research/Databases/SCR/
发布于2000年度胸部X光片的分割胸部X光片中解剖构造的自动分割对于这些图像中的计算机辅助诊断非常重要。
SCR数据库的建立是为了便于比拟研究肺野心脏以及锁骨在标准的后胸前X线片上的分割。
本着合作科学进步的精神我们可以自由分享SCR数据库并致力于在这些分割任务上维护各种算法结果的公共存储库。
在这些页面上可以在下载数据库以及上载结果时找到讲明并且可以检查各种方法的基准结果。
1.3.3医学图像分析benchmark
在网址s:
//grand-challenge.org/challenges/提供了时间跨度超过10年度的医学图像资料。
1.3.4ArdiacMRI
//cse.yorku.ca/~mridataset/
ardiacMRI是心脏病患者心房医疗影像数据和其左心室的心内膜以及外膜的图像标注。
包括33位患者案例每个受试者的序列由沿着长的20帧以及8-15个切片组成共7980张图像。
1.3.5NIH
//kaggle/nih-chest-xrays
发布于2017年度这是一个胸部X射线数据集包含30,805个患者14个疾病图像标签其中每个图像可以具有多个标签112,820个正面X射线图像标签是使用自然语言处理从相关的放射学报告中自动提取。
十四种常见的胸部病变包括肺不张稳固浸润气胸水肿肺气肿纤维化积液肺炎胸膜增厚心脏扩大结节肿块以及疝。
由于许多原因原始放射学报告与这些胸部X射线研究相关并不是公开共享的。
所以文本挖掘的疾病标签预计准确度90这个数据集合适做半监视的学习。
1.4ListofOpenAccess
在ListofOpenAccessMedicalImagingDatasets网站上可以看到更多的相关方向的数据集。
//radrounds/profiles/blogs/list-of-open-access-medical-imaging-datasets
02医学竞赛
2.1VISCERAL
地址链接//visceral.eu/
VISCERAL是VisualConceptExtractionChallengeinRadiology的缩写是放射学中的视觉概念提取挑战赛。
他们提供几种不同成像形式例如CT以及MR的几种解剖构造例如肾肺膀胱等的放射学数据和一个云计算实例。
2.2GrandChallenges
地址链接s:
//grand-challenge.org/challenges/
提供了医学图像分析领域内所有挑战的概述下面举的例子是2019年度的医学图像方面将要举办的竞赛。
2.3DreamChallenges
地址链接:
//dreamchallenges.org/
这个挑战赛中包括有数字乳腺摄影梦想挑战ICGC-TCGADREAM体细胞突变称为RNA挑战SMC-RNA等等。
03总结
最后提供应对医学影像处理感兴趣的童鞋一个超级赞的github链接如下
s:
//github/beamandrew/medical-data
这是Github上哈佛beamandrew机器学习以及医学影像研究者奉献的数据集包括了医学影像数据、竞赛数据、来自电子安康记录的数据、医疗数据、UCI数据集、生物医学文献等。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 医学 图像 竞赛 大全