CA查询.docx
- 文档编号:9470744
- 上传时间:2023-02-04
- 格式:DOCX
- 页数:14
- 大小:114.58KB
CA查询.docx
《CA查询.docx》由会员分享,可在线阅读,更多相关《CA查询.docx(14页珍藏版)》请在冰豆网上搜索。
CA查询
如何利用化学命名/分子式/结构式来检索化学文献
(SearchingChemicalLiterature:
byChemicalName/MolecularFormula/ChemicalStructure)
Abstracts
STNInternationalistheonlinescientificandtechnicalinformationnetworkdedicatedtomeetingtheinformationneedsofscientistsandinformationprofessionalsthroughouttheworld.TheREGISTRYfileoftheSTNdatabaseisachemicaldictionaryandstructuredatabasethatcontainsuniquesubstancerecordsidentifiedbyCAS.RecordscontainCASRegistryNumbers,chemicalname,molecularformulasandstructurediagrams,allofwhicharesearchable.STNExpressisanadvancedfront-endsoftwarepackagethatworkswithyourpersonalcomputertoprovidestreamlinedsearchingofdatabasesonSTN.Itwillguideyouthroughefficientonlinesearchesandenableyouneedmorequicklyandeasilythaneverbefore.
1、前言
享有『世界化学文献之钥』美名的化学摘要,它是由美国化学摘要服务社(ChemicalAbstractsService,CAS)所出版的,其在化学化工文献上的贡献地位是不容忽视的。
同时CAS也因应潮流所需,另外研发了一套STN线上检索系统,这套检索系统包括了200多种型型色色的数据库,在众多的数据库中,其最大的卖点在于它有一个独门的数据库─REGISTRYFILE,这个数据库的特色就在于它是一个强大的化学字典数据库,它可以利用化学命名、化学分子式和化学结构式来检索化学领域相关的资料,若再配合STN线上其它的数据库,则不论寻找参考文献、专利、化学物质物化性、化学物质注册或商情资料都能无往不利。
2、关于REGISTRYFILE
由CAS所研发出的STN线上检索系统中,REGISTRYFILE为其最独特的数据库,而其特色在于它具有化学字典功能的特性,为一含以化学物质来辨识进而收集资料的数据库。
REGISTRYFILE收录了1,600万的化学物质,其中包含了2,000万以上的化学品名称,同时它可以以化学名称、化学分子式或结构式来检索资料,它更提供了一强有力的化学物质登录号(CASRegistrynumber,CASRNs),以做为查询复杂化学物质的独特且具权威的入门。
先来介绍什么是CASRNs,它对化学物质而言,好象是化学物质的身份证字号一样,为唯一且特定的一种编号,每一种化合物都可能有很多种不同的命名,以一般IUPAC命名的4,4’-sulfonyldianiline为例、它的商品名为Avlosulfon、而它的实验名为NSC6091、进而CA索引命名为Benzenamine,4,4’-sulfonylbis-、至于其它的命名又如:
1,1’-sulfonylbis﹝4-aminobenzene﹞等,在如此繁多的命名中,若以单一的命名来查询资料,势必会造成资料收集不全的困扰,但以这个例子来看,其化学物质登录号为【80-08-0】,以这唯一的信息来检索资料,可节省许多精力与时间,同时资料也会收集较齐全。
而CASRNs不仅只出现在由CAS出版的书籍或数据库中,至于其它的出版品或数据库,也都采用CASRNs来标明化学物质,如MerckIndex、AldrichCatalog、ChemSources、DictionaryofOrganic/InorganicCompounds和期刊AngewandteChemie等。
同时目前进出口海关化学物品时,也会要求要具备化学物质登录号的资料,由此可明显看出其重要性了。
R
R
让我们先来了解什么叫做CASRNs─化学物质登录号,它是以最多九个数字并分三群来作编排,外面以【】表示,其数字的型式为【aaaabb-bb-b】,数字b的部份是固定存在的,也就是说最前面部份最少必须有二码、最多可高达六码。
这里的数字大小可以看出一个化学物质被收录的新旧,原则上,RNs的数字愈大,表示这化学物质为新的化合物。
这里也有一个方法可以用来检查CASRNs的正确性:
10
Integer+
=
10
iNi+…….+4N4+3N3+2N2+1N1
其中:
N:
CASRNs除了检查号码之外,其它数字由右至左输入。
與檢查號碼符合,可用來確定CASRNs的正確性
R:
为检查号码
例如:
【7732-18-5】
10
105
=
6*7+5*7+4*3+3*2+2*1+1*8
10
下面为REGISTRYFILE所提供资料之格式:
告知其在CAFILE中之筆數
列出結構式
列出所需之資料的
所有相關資料庫
Hgr
列出分子式
列出所有的化學命名
以化學物質登錄號來檢索
3、利用化学命名来检索资料
若有一完整的化合物名称,我们可以利用命名来检索资料,下面有个例子为寻找有关合成5-CHLOROBENZOTRIAZOLE化合物的专利文献:
進入REGISTRY資料庫,利用化學命名來檢索資料
⇨
利用EXPAND指令來查詢所需之命名
FILEREGISTRY
⇨E5-CHLOROBENZOTRIAZOLE/CN
E115-CHLOROBENZOTHIOPHENE-2-CARBOXALDEHYDE/CN
E215-CHLOROBENZOTHIOPHENE-2-METHANOL/CN
E31-->5-CHLOROBENZOTRIAZOLE/CN
E415-CHLOROBENZOXAZOLE/CN
E515-CHLOROBENZOXAZOLE-2-CARBOXALDEHYDE/CN
E615-CHLOROBENZOXAZOLIDONE/CN
E715-CHLOROBENZOXAZOLONE/CN
E815-CHLOROBICYCLO(2.2.1)HEPT-2-ENE/CN
E915-CHLOROBICYCLO(2.2.1)HEPT-2-ENEPOLYMER/CN
E1015-CHLOROBICYCLO(3.2.0)HEPT-2-ENE/CN
E1115-CHLOROBIS(1,5-CYCLOOCTADIENE)DIIRIDIUM/CN
E1215-CHLOROCALICENE/CN
選擇正確命名,同時利用/CN指令來進行完整的化學命名檢索
=>SE3
L115-CHLOROBENZOTRIAZOLE/CN
進入CAPLUS資料庫進行資料檢索
⇨FILECAPLUS
⇨
利用/P指令來檢索化合物之製備法
SL1/P
L211L1/P
利用/DT指令來檢索專利文獻
=>SL2ANDP/DT
2394686P/DT
L35L2ANDP/DT
共找出五篇相關資料,以下為其中一篇
=>DL3BIBABS1
L3ANSWER1OF5CAPLUSCOPYRIGHT1998ACS
AN1989:
457739CAPLUS
文獻之標題
DN111:
57739
TIPreparationofbenzotriazolesbycatalyticdehydroxylationof
專利發明人
1-hydroxybenzotriazoles
INHayashi,Hiroyasu;Maekawa,Tsukasa
專利所有權人
PAOtsukaChemicalCo.,Ltd.,Japan
SOJpn.KokaiTokkyoKoho,6pp.
CODEN:
JKXXAF
專利號,利用此號碼可調閱所需之專利文獻
PIJP01019073A219890123Heisei
AIJP87-17540619870714
專利申請號
DTPatent
LAJapanese
ABBenzotriazolesI(R=H;R1-R4=H,halo,stablegroupinreaction
專利文獻摘要
solvents)(II)freeofbyproductaminesascoloredmatters,useful
asanticorrosivesandstabilizersforpolymers(nodata)areprepd.
inhighyieldsbytreatmentof1-hydroxybenzotriazolesI(R=OH)
(III)ortheirsaltswithPb(compds.)inacidicmediumoptionally
inthepresenceofmetals,whoseionizationtendencyarelargerthan
Pb.Amixt.of1-hydroxybenzotriazole,Pb,Al,andH2Owasstirred
at100.degree.underdropwiseaddn.ofanaq.HClsoln.over2h,
thereactionmixt.wasfurtherstirredfor5htogive99%
benzotriazole,vs.64%foracontrolwithoutaddn.ofPb.
4、利用化学分子式来检索资料
可以利用分子式来检索化合物资料的数据库并不多,但REGISRTYFILE可以以很简单的步骤来完成资料的收集。
其中所检索的分子式排列需符合HillSystemOrder的要求,这里先来介绍HillSystemOrder的规则:
I.针对单一化合物:
1.若化合物不含C元素:
各元素依其英文字母顺序来排列检索,如:
H2SO4→以H2O4S排列来检索。
2.若化合物含C元素:
先排C元素、再排H元素、其它元素则再依其英文字母顺序来排列检索,如:
C9H8CL4N8O。
II.针对多重组成化合物:
1.组成物中一组成含C元素、另一组成不含C元素:
将含C元素的组成先排列,再排列不含C元素的组成。
而每组各元素的排列则同前I-1和I-2之规则来排列,如:
C4H8N2O4.H2O。
2.组成物中各组成均含C元素:
先依各组中C元素的数目来决定,先排C元素多的组成,次之再排C元素少的组成;若各组成C元素的数目皆相同时,则依各组成的H元素来决定排列优先级;若各组的C、H元素也都相同时,再依各组的其它元素中第一个元素的字母顺序来决定排列优先级。
而每组各元素的排列原则可依前I-1和I-2规则来排列,如:
C2H4CL2.C2H4F2.C2CLF5.CHCLF2。
3.多重组成物为高分子时:
若为homopolymers时,元素排列先依I-1和I-2的规则来排列,再在其括符外加上X符号即可,如(C8H8)X;若为copolymers时,各组成的排列先依II-2的规则来排列,再在其括符外加上X符号即可,如(C4H6O2.C2H3CL.C2H3F)X。
4.若为盐类时:
为酸性盐类则其分子式中以H取代金属,再以分号把金属元素标示出,如:
sodiumacetate以C2H4O2.NA表示之;为胺盐类则其分子式中把胺盐中的H元素转移到阴离子上,使化合物以中性表示出,如:
trimethylammoniumchloride以C3H9N.CLH表示之。
在众多的化合物中,由于同分异构物的关系,会造成不同的化合物也会有相同分子式,所以以分子式来检索资料会得到非唯一的结果,这时必须配合化合物的命名来一同检索,以缩小检索结果。
下面的例子是利用分子式来检索资料,得到三种不同的同分异构化合物,这时只有配合命名来缩小检索结果,这时的命名必须取所要的化合物中与众不同的独特片段名称才可以检索出唯一的化合物。
若是利用一个分子式检索出的化合物结果太多时,就不适合再利用分子式检索资料,这时以化合物的结构式来做检索方法才合适。
下面例子为利用分子式来查询有关2,5-DINITRO-3,4-DIBROMOTHIOPHENE化合物的资料:
進入REGISTRY資料庫
利用分子式來檢索資料
=>FILEREGISTRY
=>EC4BR2N2O4S/MF
E11C4BR2N2/MF
E21C4BR2N2O2/MF
對分子式不確定時,可利用免費的EXPAND指令來查詢所需之分子式
E33-->C4BR2N2O4S/MF
E42C4BR2N2S/MF
E52C4BR2N4NBO4/MF
E62C4BR2N4NBS4/MF
E72C4BR2N4PT/MF
E81C4BR2N4PT.2CH5N3.XH2O.2H/MF
E92C4BR2N4PT.2H/MF
E101C4BR2N4PT.2H2O.2K/MF
E111C4BR2N4PT.2H2O.2NA/MF
E122C4BR2N4PT.2K/MF
得到三種不同的化合物
=>SE3
L13C4BR2N2O4S/MF
利用免費SCAN指令來檢示檢索結果
=>DSCAN
L13ANSWERSREGISTRYCOPYRIGHT1998ACS
INThiophene,2,5-dibromo-3,4-dinitro-(6CI,7CI,9CI)
MF***C4Br2N2O4S***
CICOM
為所需之化合物
HOWMANYMOREANSWERSDOYOUWISHTOSCAN?
(1):
1
L13ANSWERSREGISTRYCOPYRIGHT1998ACS
INThiophene,2,4-dibromo-3,5-dinitro-(7CI)
MF***C4Br2N2O4S***
不是所要查詢的化合物
HOWMANYMOREANSWERSDOYOUWISHTOSCAN?
(1):
1
L13ANSWERSREGISTRYCOPYRIGHT1998ACS
INThiophene,3,4-dibromo-2,5-dinitro-(6CI,9CI)
MF***C4Br2N2O4S***
ALLANSWERSHAVEBEENSCANNED
利用所需的化合物命名中與眾不同的獨特片段名稱來合併檢索,以縮小檢索結果範圍
=>SL1AND2,5-DIBROMO
3578032,5
109536DIBROMO
27242,5-DIBROMO
(2,5(W)DIBROMO)
L21L1AND2,5-DIBROMO
=>DL2IDE
L2ANSWER1OF1REGISTRYCOPYRIGHT1998ACS
RN52431-30-8REGISTRY
CN***Thiophene,2,5-dibromo-3,4-dinitro-(6CI,7CI,9CI)***(CA
INDEXNAME)
檢索出所需之化合物
OTHERNAMES:
CN***2,5-Dibromo-3,4-dinitrothiophene***
FS3DCONCORD
MF***C4Br2N2O4S***
CICOM
LCSTNFiles:
BEILSTEIN*,CA,CAOLD,CAPLUS,CHEMCATS,CHEMINFORMRX,
CSCHEM,IFICDB,IFIPAT,IFIUDB,SPECINFO,TOXLIT,USPATFULL
(*Filecontainsnumericallysearchablepropertydata)
12REFERENCESINFILECA(1967TODATE)
12REFERENCESINFILECAPLUS(1967TODATE)
3REFERENCESINFILECAOLD(PRIORTO1967)
5、利用化学结构式来检索资料
STN线上检索系统的软件─STNExpress有强大的化学结构绘图功能,它可以在离线的状况下,先画化学结构式进而再上线来检索资料,其中的结构式可以有多样的变化来选择,下面将有讨论。
它可以快速同时很准确的找出所要查询的化合物资料,这最适合用在查询新化合物的合成资料,若再配合Markush结构式的检索,则对新化合物合成的专利资料会有非常完整的收集,这是STN线上检索系统非常强大的功能,但所需的检索费用也比较昂贵,这也是检索资料所要考虑的因素。
下图为STNExpress软件的界面:
選取所要畫的原子或鍵的工具
修改/全選/拖曳的工具
畫原子或環或分子鍵的工具
以結構式來畫化學反應的工具
STNExpress画化学结构式的软件有四种不同型式的检索选择,同时其费用如下表所示:
检索指令型态
检索出的结果范围
检索费用(美元)
EXACT
与所绘的结构完全符合,同时还包括其同位素、立体异构物、单体聚合物、自由基和带电化合物。
39.00
FAMILY
含EXACT以外,另包含了其盐类、混合物和其共聚物的化合物
44.50
SSS
除了含EXACT和FAMILY以外,还包含了所有其它不同官能基之取代及延伸相关的结构式。
113.50
由上表可得知,以化合物的结构式来检索资料的费用是比较昂贵,但它也有它独特的地方,除了特定的(EXACT)结构式的检索外,它还可以配合下面其它比较特殊的功能做进一步的检索:
1.可变异的官能基(Variables):
选用此
功能键,可以以唯一的符号检索包含同类或同族的取代基;其中X表示所有卤素原子、A表示除了氢以外的所有原子、Q表示除了氢和碳以外的所有原子、M表示所有金属原子等、Cb表示碳环状化合物、Hy表示异碳环状化合物、Ak表示直键碳化合物等。
2.不定官能基(G-group):
可以在同一位置上定义多种不同的取代基的检索,所以只要画一次结构即可检索同一主体上有不同的取代基。
3.不定位的取代(VariablePointofAttachment):
对于环状化合物而言,若化合物可能同时有邻-、间-或对-位的取代时,则STNExpress软件可在同一结构上找出不同位置的取代的化合物。
4.重复取代基的定义(DefiningaRepeatingGroup):
STNExpress软件可定义有相同结构的某一原子或一群原子同时排列在一齐时,可利用其定义功能来检索,其中重复的取代基的数目可从0─20单位皆可。
下面的例子为套用以上四点的定义所画出的结构式:
可變異的官能基
重覆取代基,其中CH2取代基的數目可在0-10之間
不定位的取代
不定官能基
当然STNExpress画化学结构式的软件,除了以上介绍的功能外,还有许多其它强大的画图功能,在此不易一一列举出来。
同时它不但可做单一化合物的结构检索外,它还可以做高分子化合物的检索,另外也可以以结构式做化学反应的检索,若以后有机会将再为大家来介绍。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CA 查询
![提示](https://static.bdocx.com/images/bang_tan.gif)