HiSeq 数据上传流程.docx
- 文档编号:5500660
- 上传时间:2022-12-17
- 格式:DOCX
- 页数:12
- 大小:1.69MB
HiSeq 数据上传流程.docx
《HiSeq 数据上传流程.docx》由会员分享,可在线阅读,更多相关《HiSeq 数据上传流程.docx(12页珍藏版)》请在冰豆网上搜索。
HiSeq数据上传流程
NCBI-SRA数据提交流程
2015.7.27
提交数据数据基本流程:
1,注册NCBI账号;2,登陆提交界面后,我们需要获取BioSampleID;3,然后在获得BioProjectID;4,BioProject和BioSample创建完成后,再到SRA的网页,点击“CreatenewSubmission”,并完成信息填写;5,完成4步骤后,网页上NCBI会给出一个登陆FTP的账号和网址链接;6,登陆后用账号可直接上传(复制粘贴),或用软件FileZilla上传;7,上传后会生成相应的编号,供发文章使用。
(上传数据请理清思路)
附:
上传的数据格式是根据测序平台不同而不同,文件格式(Illumina_native、bam、fastq、srf)都可以的。
创建好后,NCBI会提供数据上传的FTP的账号,压缩后上传到FTP。
至于文章中的sra格式,是我们将数据上传后,NCBI数据库压缩的的格式。
整理数据、生成MD5校验
(a)交付的结果中,rawreads或cleanreads序列文件(*.fq.gz)是可以直接提交SRA的数据。
在交付结果中找到对应文件,无需解压,即可直接上传。
(b)如果数据交付时您有保留有对应文件的MD5校验和的话可以直接使用。
如果没有保存MD5码可上网下载任意的MD5校验工具,重新生成一下MD5值。
(c)一定要明白该数据的测序策略,不同的测序方法,数据的格式和填写的类容是不一样的,这需要先了解好,生物信息学知识XX提前补。
1、注册NCBI账号
登入NCBI主页右上角Signintoncbi注册(http:
//www.ncbi.nlm.nih.gov/)
NCBI主页
2、开始注册:
1,BioSample的注册
登陆后:
进入提交界面,点击提交Submit(https:
//submit.ncbi.nlm.nih.gov/)
点击Newsubmission后按照提示填写完相应的信息,成功后会生成BioSample号。
2,BioProjiect的注册
点击Newsubmission后按照提示填写完相应的信息,成功后会生成BioSample号。
按照提示填写
2,SRA的注册,关联BioSample,BioProjiect(https:
//submit.ncbi.nlm.nih.gov/)
在返回到NCBI主页中点击submit后界面如下
点击红色框全出来的地方即可进入,下面界面
点击Home即可进入下面界面
点击SRA,界面如下
完成信息填写:
点击SRA即进入下面页面,创建一个新的submission
点击CreateNewsubmission,填写信息
填写好后,点击保存,进入下面界面,点击NewExperiment用已将上面创建好的BioProject、BioSample关联进来
点击NewExperiment的界面,填写信息后保存,进入下一个界面
3、数据上传
到这里,我们网页上的填写信息就完成了。
利用NCBI中给的网址链接,账号和密码,我们就可以直接登录NCBI。
方法一:
(该方法简单,但传输较慢)
打开我的电脑复制FTP网址进入,如图:
回车后界面(下面这真的是NCBI服务器的界面,如果你用过你们学校的服务器资源,FTP应该知道)
然后右键选择登录:
在里面输入NCBI给的账号和密码就可以进入NCBI服务器,即可打开远程FTP站点,将需要上传的文件复制粘贴或者拖入其中即可开始上传。
为了与其他提交者的文件进行区分,建议您在上传前,在该远程FTP站点上首先新建一个文件夹,并以区别于其他提交者的方式命名(建议使用BioProject编号命名),然后打开该文件夹,将数据上传到其中(Ctrl+C和Ctrl+V)。
方法二:
(软件:
FileZilla)
安装后打开的界面:
本地站点为你的电脑,远程找点为服务器可视化界面
主机:
NCBI给你的FTP链接,账号:
sra密码:
NCBI给端口:
FTP数据传输默认为21
登录:
登录后只需要在右边右键创建一个文件并命名,然后在左边你的电脑上找到你要上传的的文件,从左边拖到右边文件夹里就OK了,接下来就等吧。
4、上传完成、检查状态。
登陆SRA提交页面,打开本次的Submission,可查看每一条SRA记录的状态。
请您仔细检查上传的每一条记录是否Completed,是否所有的Sample、Experiment、Run信息对应无误。
另外还可以看到记录对应的Accession编号,编号主要有SRP、SRS、SRX、SRR分别对应Study、Sample、Experiment、Run。
文章中可以根据上下需要引用这些编号。
如果您在在提交过程中遇到技术问题,您可以随时向SRA的工作人员寻求帮助。
上传完成后,在登录到SRA
进入sra结果:
XX帮助文档链接:
http:
//www.plob.org/2012/08/25/3195.html
整理时间:
5个小时。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- HiSeq 数据上传流程 数据 上传 流程