数据导入文档.docx
- 文档编号:24893529
- 上传时间:2023-06-02
- 格式:DOCX
- 页数:18
- 大小:431.92KB
数据导入文档.docx
《数据导入文档.docx》由会员分享,可在线阅读,更多相关《数据导入文档.docx(18页珍藏版)》请在冰豆网上搜索。
数据导入文档
档案数据入库操作
一、文书数据入库
1.删除原有表格内容
选中表T_WS_DOCINDEX内所有内容进行删除
2.导入mdb索引
也可能是excle文件
(1)打开PLSQL,工具—ODBC导入器:
(2)ODBC导入器具体设置:
“来自ODBC的数据”:
选择“MSAccessDatabase”;
输入数据库登陆信息;
点击connect,选择需要导入的mdb文件;
选择具体的表。
如下图所示填写选择并导入正确的索引表
“到Oracle的数据”:
输入用户与导入的数据库表名;
指定字段对应关系以及字段类型;
点击import导入。
如下图所示填写选择。
3.字段填充
(1)填充前:
判断是否存在相同的档案:
selectcount(*)FROMTA_ARCHIVEwherearchivetype=3andarchivenoin(SELECTdistinctbatchidFROMT_WS_DOCINDEX);
查询不同的batchid共43条,因此导入后将增加文书档案43条;
SELECTcount(distinctbatchid)FROMT_WS_DOCINDEX
因pdf命名与mdb表中的docname存在出入,执行以下语句使其保持一致
select*fromT_WS_DOCINDEXwswherelength(docname)<3;
updatet_ws_docindexsetdocname=lpad(docname,3,'0')wherelength(docname)<3
临时表处理
selectws.*fromt_ws_docindexwsorderbyws.batchid,ws.docname
(2)字段填充:
---更新分类号为“A”
updatet_ws_docindexwssetws.flh='A';
updatet_ws_docindexwssetws.bmh=substr(ws.batchid,0,2);
---更新到目录号
updatet_ws_docindexwssetws.mlh=substr(ws.batchid,instr(ws.batchid,'.',1,1)+1,instr(ws.batchid,'-',1,2)-instr(ws.batchid,'.',1,1)-1)
selectws.*fromt_ws_docindexwswherews.mlhisnull
---updatearchivetype
updatet_ws_docindexwssetws.archivetype=3;
---updateclassid
updatet_ws_docindexwssetws.classid=(selectcls.classidfromta_classdefclswherecls.classcode=ws.bmh);
---updatecatalogno
updatet_ws_docindexwssetws.catalogno=ws.mlh;
---updateajh
updatet_ws_docindexwssetws.ajh=substr(ws.batchid,instr(ws.batchid,'-',1,2)+1);
select*fromt_ws_docindexwswherews.ajhisnull
---updatend
selectsubstr(ws.mlh,instr(ws.mlh,'-',1,1)+1)fromt_ws_docindexws;
updatet_ws_docindexwssetws.nd=substr(ws.mlh,instr(ws.mlh,'-',1,1)+1);
---查找不重复的编目号、目录号
selectdistinctws.bmh,ws.mlhfromt_ws_docindexwsorderbyws.bmh
---导入到ta_catalogno
selectdistinctcdf.classid,ws.mlh,1,1,1fromt_ws_docindexwsjointa_classdefcdfoncdf.classcode=ws.bmhorderbycdf.classid
insertintota_catalognocno(cno.catalogno,cno.classid,cno.curboxno,cno.recordesign,cno.status)
(selectdistinctws.mlh,cdf.classid,1,1,1fromt_ws_docindexwsjointa_classdefcdfoncdf.classcode=ws.bmh);
4.档案入库
(1)
工具应用:
PDF源文件路径选择
目标文件夹和日志文件夹自行建立
Oracle数据库相关数据填写
选择相应的索引数据表名
点击导入按钮进行数据导入,具体参数如下图所示:
(3)将目标文件夹中生成的文件复制到F:
\SouthArchiveFTP\ArchiveFTP\me_official文件夹中。
二、其他数据入库
其他数据入库的方式流程与文书数据一致,不过在删除的表格也要选择与之相匹配的表格内容,使用ODBC导入器时应注意将要导入的索引文件的格式并选择相应的“用户/系统”。
下面是各数据字段填充的脚本文件。
1.监察
检查batchid与目录名是否对应
判断是否已经有相同batchid的档案
SELECTcount(*)FROMTA_ARCHIVEwherearchivenoin(selectbatchidfromt_jc_docindex)
如为0时继续往下操作;
处理t_jc_docindex
执行脚本“索引数据处理_t_jc_docindex.sql”
selectcount(*)fromt_jc_docindexjcorderbyjc.ajhdesc
selectjc.*fromt_jc_docindexjcorderbyjc.ajhdesc
selectjc.*fromt_jc_docindexjcorderbyjc.batchid,jc.docname
---更新到分类号FLH字段,为“F”
updatet_jc_docindexjcsetjc.flh='F';
---更新到编目号BMH字段
updatet_jc_docindexjcsetjc.bmh='F';
---更新到目录号MLH字段BATCHID的年度
updatet_jc_docindexjcsetjc.mlh=substr(jc.batchid,instr(jc.batchid,'-',1,1)+1,instr(jc.batchid,'-',1,2)-instr(jc.batchid,'-',1,1)-1)
---设置索引表的ARCHIVETYPECLASSIDCATALOGNO三个的值
updatet_jc_docindexjcsetjc.archivetype=7;
updatet_jc_docindexjcsetjc.classid=31;
updatet_jc_docindexjcsetjc.catalogno=jc.mlh;
---更新案卷号,取batchid第二个'-'后的部分
updatet_jc_docindexjcsetjc.ajh=substr(jc.batchid,instr(jc.batchid,'-',1,2)+1)
---是否存在空的案卷号
select*fromt_jc_docindexjcwherejc.ajhisnull
---更新档案件数,同一个文档包中的件数
selectjc.batchid,count(*)fromt_jc_docindexjcgroupbyjc.batchid
--t_batchinfo作业单位提供的,如果没有提供就没有,页数就不能计算了
updatet_jc_docindexjcsetjc.jianshu=(selectb.docnumfromt_batchinfobwhereb.batchid=jc.batchid);
updatet_jc_docindexjcsetjc.zys=(selectb.papernumfromt_batchinfobwhereb.batchid=jc.batchid)
select*fromt_jc_docindexjcwherejc.jianshuisnull
---查找不重复的目录号
selectdistinctjc.mlhfromt_jc_docindexjcorderbyjc.mlh;
---导入到ta_catalogno
insertintota_catalognocno(cno.catalogno,cno.classid,cno.curboxno,cno.recordesign,cno.status)
(selectdistinctjc.mlh,cdf.classid,1,1,1fromt_jc_docindexjcjointa_classdefcdfoncdf.classcode=jc.bmh);
2.交易出让、划拨
--出让划拨数据
selectcount(*)fromt_jyclht_docindexjcorderbyjc.ajhdesc;
selectjc.*fromt_jyclht_docindexjcorderbyjc.batchid,jc.docname;
---更新到分类号FLH字段,为“JE”
updatet_jyclht_docindexjcsetjc.flh='JE';
---更新到编目号BMH字段(出让JE1,划拨JE2)
updatet_jyclht_docindexjcsetjc.bmh='JE1'wheresubstr(jc.batchid,instr(jc.batchid,'.',1,2)+1,1)='1';
updatet_jyclht_docindexjcsetjc.bmh='JE2'wheresubstr(jc.batchid,instr(jc.batchid,'.',1,2)+1,1)='2';
---更新到目录号MLH字段BATCHID的年度
updatet_jyclht_docindexjcsetjc.mlh=substr(jc.batchid,instr(jc.batchid,'-',1,1)+1,instr(jc.batchid,'-',1,2)-instr(jc.batchid,'-',1,1)-1)
---设置索引表的ARCHIVETYPECLASSIDCATALOGNO三个的值
updatet_jyclht_docindexjcsetjc.archivetype=5;
updatet_jyclht_docindexjcsetjc.classid=19WHEREsubstr(jc.batchid,instr(jc.batchid,'.',1,2)+1,1)='1';
updatet_jyclht_docindexjcsetjc.classid=20WHEREsubstr(jc.batchid,instr(jc.batchid,'.',1,2)+1,1)='2';
updatet_jyclht_docindexjcsetjc.catalogno=jc.mlh;
---更新案卷号,取batchid第二个'-'后的部分
updatet_jyclht_docindexjcsetjc.ajh=substr(jc.batchid,instr(jc.batchid,'-',1,2)+1)
---是否存在空的案卷号
select*fromt_jyclht_docindexjcwherejc.ajhisnull
---更新档案件数,同一个文档包中的件数
selectjc.batchid,count(*)fromt_jyclht_docindexjcgroupbyjc.batchid
--t_batchinfo作业单位提供的,如果没有提供就没有,页数就不能计算了
updatet_jyclht_docindexjcsetjc.jianshu=(selectb.docnumfromt_batchinfobwhereb.batchid=jc.batchid);
updatet_jyclht_docindexjcsetjc.zys=(selectb.papernumfromt_batchinfobwhereb.batchid=jc.batchid)
select*fromt_jyclht_docindexjcwherejc.jianshuisnull
---查找不重复的目录号
selectdistinctjc.mlhfromt_jyclht_docindexjcorderbyjc.mlh;
---导入到ta_catalogno
insertintota_catalognocno(cno.catalogno,cno.classid,cno.curboxno,cno.recordesign,cno.status)
(selectdistinctjc.mlh,cdf.classid,1,1,1fromt_jyclht_docindexjcjointa_classdefcdfoncdf.classcode=jc.bmh);
检查档案号是否重复
SELECTcount(*)FROMTA_ARCHIVEwherearchivenoin
(select'JE'||substr(jc.batchid,instr(jc.batchid,'.',1,2)+1,2)||jc.mlh||'-'||jc.ajh
fromt_jyclht_docindexjc)
3.交易(转让、转拍、挂牌、转挂、矿出、其他、转让旧、转挂旧)
类型
分类标识
编目标识
编目
原数据量
转让
5
21
JE3
2450
转拍
5
22
JE4
10
挂牌
5
23
JE5
198
转挂
5
24
JE6
249
矿出
5
25
JE7
11
其他
5
26
JE8
0
转让旧
5
27
JE9
18
转挂旧
5
30
JE10
8
临时表数据处理
selectcount(*)fromT_JYZRHT_DOCINDEXjcorderbyjc.ajhdesc
selectjc.*fromT_JYZRHT_DOCINDEXjcorderbyjc.ajhdesc
selectjc.*fromT_JYZRHT_DOCINDEXjcorderbyjc.batchid,jc.docname
---更新到分类号FLH字段,为“JE”
updateT_JYZRHT_DOCINDEXjcsetjc.flh='JE';
---更新到编目号BMH字段(转让JE3,转拍JE4,挂牌JE5,转挂JE5,矿出JE7,其他JE8,转让旧JE9,转挂旧JE10)
updateT_JYZRHT_DOCINDEXjcsetjc.bmh='JE'||substr(jc.batchid,instr(jc.batchid,'.',1,2)+1,instr(jc.batchid,'-',1,1)-instr(jc.batchid,'.',1,2)-1);
---更新到目录号MLH字段BATCHID的年度
updateT_JYZRHT_DOCINDEXjcsetjc.mlh=substr(jc.batchid,instr(jc.batchid,'-',1,1)+1,instr(jc.batchid,'-',1,2)-instr(jc.batchid,'-',1,1)-1)
---设置索引表的ARCHIVETYPECLASSIDCATALOGNO三个的值
updateT_JYZRHT_DOCINDEXjcsetjc.archivetype=5;
updateT_JYZRHT_DOCINDEXjcsetjc.classid=21WHEREsubstr(jc.batchid,instr(jc.batchid,'.',1,2)+1,instr(jc.batchid,'-',1,1)-instr(jc.batchid,'.',1,2)-1)='3';
updateT_JYZRHT_DOCINDEXjcsetjc.classid=22WHEREsubstr(jc.batchid,instr(jc.batchid,'.',1,2)+1,instr(jc.batchid,'-',1,1)-instr(jc.batchid,'.',1,2)-1)='4';
updateT_JYZRHT_DOCINDEXjcsetjc.classid=23WHEREsubstr(jc.batchid,instr(jc.batchid,'.',1,2)+1,instr(jc.batchid,'-',1,1)-instr(jc.batchid,'.',1,2)-1)='5';
updateT_JYZRHT_DOCINDEXjcsetjc.classid=24WHEREsubstr(jc.batchid,instr(jc.batchid,'.',1,2)+1,instr(jc.batchid,'-',1,1)-instr(jc.batchid,'.',1,2)-1)='6';
updateT_JYZRHT_DOCINDEXjcsetjc.classid=25WHEREsubstr(jc.batchid,instr(jc.batchid,'.',1,2)+1,instr(jc.batchid,'-',1,1)-instr(jc.batchid,'.',1,2)-1)='7';
updateT_JYZRHT_DOCINDEXjcsetjc.classid=26WHEREsubstr(jc.batchid,instr(jc.batchid,'.',1,2)+1,instr(jc.batchid,'-',1,1)-instr(jc.batchid,'.',1,2)-1)='8';
updateT_JYZRHT_DOCINDEXjcsetjc.classid=27WHEREsubstr(jc.batchid,instr(jc.batchid,'.',1,2)+1,instr(jc.batchid,'-',1,1)-instr(jc.batchid,'.',1,2)-1)='9';
updateT_JYZRHT_DOCINDEXjcsetjc.classid=30WHEREsubstr(jc.batchid,instr(jc.batchid,'.',1,2)+1,instr(jc.batchid,'-',1,1)-instr(jc.batchid,'.',1,2)-1)='10';
updateT_JYZRHT_DOCINDEXjcsetjc.catalogno=jc.mlh;
---更新案卷号,取batchid第二个'-'后的部分
updateT_JYZRHT_DOCINDEXjcsetjc.ajh=substr(jc.batchid,instr(jc.batchid,'-',1,2)+1)
---是否存在空的案卷号
select*fromT_JYZRHT_DOCINDEXjcwherejc.ajhisnull
---更新档案件数,同一个文档包中的件数
selectjc.batchid,count(*)fromT_JYZRHT_DOCINDEXjcgroupbyjc.batchid
--t_batchinfo作业单位提供的,如果没有提供就没有,页数就不能计算了
updateT_JYZRHT_DOCINDEXjcsetjc.jianshu=(selectb.docnumfromt_batchinfobwhereb.batchid=jc.batchid);
updateT_JYZRHT_DOCINDEXjcsetjc.zys=(selectb.papernumfromt_batchinfobwhereb.batchid=jc.batchid)
select*fromT_JYZRHT_DOCINDEXjcwherejc.jianshuisnull
---查找不重复的目录号
selectdistinctjc.mlhfromT_JYZRHT_DOCINDEXjcorderbyjc.mlh;
---导入到ta_catalogno
insertintota_catalognocno(cno.catalogno,cno.classid,cno.curboxno,cno.recordesign,cno.status)
(selectdistinctjc.mlh,cdf.classid,1,1,1fromT_JYZRHT_DOCINDEXjcjointa_classdefcdfoncdf.classcode=jc.bmh);
●转让需添加“ZRBH“扩展索引字段;
●检查档案号是否重复
SELECTcount(*)FROMTA_ARCHIVEwherearchivenoin
(select'JE'||substr(jc.batchid,instr(jc.batchid,'.',1,2)+1,instr(jc.batchid,'-',1,1)-instr(jc.batchid,'.',1,2)-1)||'-'||jc.mlh||'-'||jc.ajh
fromT_JYZRHT_DOCINDEXjc)
如果没有重复,则可执行工具。
4.用地
导入时由于数据问题需注意:
将T_YD_DOCINDEX表中YH字段长度设置为100;否则有些数据导入不进数据库
导入后将部分数据修改下如下:
selectbatchid,yh,length(yh)fromT
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 导入 文档