集图宝典.docx
- 文档编号:5982362
- 上传时间:2023-01-02
- 格式:DOCX
- 页数:10
- 大小:28.57KB
集图宝典.docx
《集图宝典.docx》由会员分享,可在线阅读,更多相关《集图宝典.docx(10页珍藏版)》请在冰豆网上搜索。
集图宝典
集图宝典
一、CSV简介:
在集图的过程中,你肯定会常常听到CSV文件这个词。
那么所谓CSV文件到底是个什么东西呢?
它有什么用处呢?
又要如何使用呢?
认真读完下面的文字,相信你对CSV会有一个初步的了解。
所谓“CSV”,是CommaSeparatedValue(逗号分隔值)的英文缩写,通常都是纯文本文件。
下面是一个实际CSV文件中的部分内容,让大家对他有一个感性的认识。
我们选的是Sjojo_Rescan的CSV文件(Sjojo是ASW-亚洲扫图风的成员之一)。
sj_mino1001.jpg,715282,4FB55FE8,
sj_mino1002.jpg,471289,93203C5C,
sj_mino1003.jpg,451929,C4E80467,
通常CSV文件开头是不留空的,以行为单位,每行中记录一张图片的了多项数据,每项数据用逗号来分隔(标准英文逗号)。
一般说来集图用的.CSV文件的格式是这样的:
文件名,文件大小(以字节为单位),CRC校验值,注释(可省略)
sj_mino1001.jpg,715282,4FB55FE8,
||||
文件名文件大小CRC值注释(已省略)
如果你的机器上装了MicrosoftExcel的话,.csv文件默认是被Excel打开的。
需要注意的是,当你双击一个.CSV文件,Excel打开它以后即使不做任何的修改,在关闭的时候Excel往往会提示是否要改成正确的文件格式,这个时候千万记得要选择“否”。
因为Excel认为.CSV文件中的数字是要用科学记数法来表示的,而我们要的.CSV文件中的数字是普通的。
如果你选择了“是”的话,Excel会把CSV文件中所有的数字用科学计数来表示(2.54932E+5这种形式),这个文件就没法用了。
所以如果你的CSV文件绝大部分都是用在集图上的话,建议把.CSV的默认打开方式改成任意一个文本编辑器,系统自带的记事本就是个不错的选择。
好,让我们回到CSV文件的格式中来。
见上面,从左到右sj_mino1001.jpg是文件名,715282是以字节表示的文件大小。
当文件名中包含逗号的时候,由于逗号在CSV文件中特殊的作用,为了不至于产生歧义,需要用引号把文件名括起来。
比如"TheArt,Fantasy.jpg",384211,...,....接着是一个8位的16进制数字4FB55FE8,这是文件的CRC32校验值。
整个CSV文件的精髓都在这里。
让我们举个小例子来说明它的意义:
Sjojo发布了一张图sj_mino1001.jpg,假设你是从朋友手中拿到这张图的,那么你肯定常常会有这样的疑问,这张图在传播的过程中是否被改动过呢?
是否无意中遭到了损坏呢?
CRC就是为解决这个问题而存在的。
一般情况下,扫图家每发布了一套图,就同时放出一个CSV文件(这种CSV通常叫做OfficialCSV,也就是官方发布的CSV的意思),这个CSV中的CRC值是用专门的软件通过CRC32算法(常用的CRC算法还有CRC16)对文件运算后生成的一个值,这个值可用作文件真身的标志。
在绝大多数情况下,如果这个文件在传播过程中无论是大小还是内容被改动过。
那么,用同样的CRC32算法再对文件进行运算后产生的CRC校验值就完全不一样了。
如果得出的CRC值是一样的,则完全有理由认为这个文件是真身,没有被改动过。
还有些时候,收来的图片文件名被改动过了,那么你怎么知道谁是谁呢?
这个时候CRC值又起作用了:
用专用的软件对图片处理后,可以得到文件的大小和CRC值,然后根据大小和CRC值在CSV中寻找是否有适合的图片。
如果有,就会把图片的名字改成CSV里的。
举个例子,你收到了一张图片,名字是pic0001.jpg,同时你知道这张图片是Sjojo_Rescan这个集子里面的,但是不知道具体是哪一张。
用软件得到它的大小和CRC分别是715282和4FB55FE8,那么软件在CSV文件里找到一行sj_mino1001.jpg,715282,4FB55FE8,大小和CRC都符合,软件就认为这张图片的原名是sj_mino1001.jpg,接着自动把文件的名字改成sj_mino1001.jpg。
改动的不是CSV文件而是图片的文件名。
接下来的是注释和说明,可以省略掉。
需要注意的是注释的后面是没有逗号的,如果要省略注释的话,一定要在CRC值的后面保留一个逗号,否则软件会把CRC值认为是注释的。
相信看完上面的一大堆东西后,你不但对CSV文件有了个大概地了解,对它的用途应该也有些模糊的概念了吧。
我们收集图片往往是通过各种各样不同的渠道,比如从网站上,IRC上,抑或干脆是朋友送的光盘。
在整个的传播过程中,图片有可能遭受到各种各样的非人待遇。
尤其是从网站上收来的图片。
有些时候仅仅是简单的改了一下名字,更多的时候由于很多PLMM站空间有限,常把图片的尺寸缩小,或者把图片文件缩小。
一张1356x588的图被改成了678x294,或者一个四五百K的文件被缩成了几十K都是常有的事。
比较可恶的是,许多网站把原来扫图家的Logo去掉,打上自己网站的Logo。
还有些许搞笑派的玩家,把各种各样的图片移花接木,改头换面。
这些对于一般的看
图娱乐无伤大雅,但是对于集图来说,收到这样的图片是无法容忍的。
如何验明图片的正身,这是扫图家和集图者共同面对的问题。
CSV文件就是为了解决这样的问题而出现的。
CSV文件最早用在简单的数据库里,由于其格式简单,并具备很强的开放性,所以起初被扫图家用作自己图集的标记。
如上面所说的,CSV文件是个纯文本文件,每一行表示一张图片的许多属性。
你在收一套图集时,只要能找到它的CSV文件,用专用的软件校验后,你对该图集的状况就可以了如指掌。
比如这套图一共有多少张,你收到了多少张,哪些是原图,那些是可能被改动过或者损坏了的图片......我们可以把.CSV文件看作一份索引,你不但可以“按图索骥”,还可以检查自己收来的“马子”血统是否纯正。
CSV文件的来源通常有两种:
一种是扫图家自己发布的CSV,一般称作OfficialCSV。
也就是官方发布的CSV,通常说来是有相当的权威性的。
比较特殊的是亚洲的许多扫图家,除了公开发布的图以外,还有一些私下发布的Special图,或者一些专门送给朋友的图。
加上扫图家不愿意或者不会做CSV,所以他们图集的CSV往往由集图界中一些资深前辈出头来做。
在这种情况下,往往会出现一个图集有好几个版本的CSV文件,并且每个版本之间都有不小的差别。
此时的CSV不仅是验明真身的依据,同时也给了集图者一个希望:
即使缺的再多,即使用这个版本csv收全的人再少,一定会有一个人是全的,就是此CSV的作者!
集图界前辈LiQing有一句名言:
“有CSV就表示一定有图!
”自然而然的,民间现了一些权威的做CSV的玩家。
比如早期的EDZONE,现在依然活跃的OSun,shum,vsam,TE,Paul...还有偶们COC图盟的WQC
好了,说了那么多,大家可能会问,CSV文件那么好用,到底要怎么用呢?
不会要自己手工来检测吧?
呵呵,还记得上文中一再出现的“软件”这个字眼吗?
有专用的软件可以帮助我们完成这项工作。
常用的软件有The!
Checker和TheHunter。
目前这两个软件都有汉化的简体中文版。
(1)、档案描述
CSV其实就是COMMASEPARATEDVALUE的缩写,出现在档案总管中的档案类型是「逗号分格」,依计算机原来的设定,如果直接点选该档案,计算机将以EXCEL的模式开启该档案。
但建议您千万不要这么做,因为CSV檔如果以EXCEL开启,由于计算机档案数据转换的原因,会将其CRC之数值改做科学记号方式储存,而造成档案中的CRC值发生错误。
这也是笔者初出茅庐时所得到的惨痛经验,但如果想一窥CSV档的真实面貌,笔者建议您使用WORDPAD或是记事本(NOTE)来开启,再则先另存新档后用EXCEL开启,也是方法之一。
开启后的CSV档包含了四或五个字段(部分),由左至右分别记载着:
文件名称(XXXX.JPG)、档案大小(以BYTE为单位)、CRC32值(八个英文字母或数字组成)、档案路径(档案储存的子目录名称)和档案内容描述(一般来说都是明星的英文姓名甚或是专辑名称,也可能空白)。
而其中第四栏「档案路径」因为每个人储存整理图档的方式不同,所以本栏通常不存在,而一般有含有「档案路径」这栏的CSV档,又称为ECSV档案,他的使用方式和效用将在以后为各位介绍。
(2)效用说明
各位小时候大概都有集邮的经验吧,邮政总局每年都会出一本邮票年鉴,提供集邮者作为收集的依据。
而扫图家呢,每隔一段时间就会由自己或他人更新一次CSVFILE,作为集图家收集的依据,而有了CSVFILE之后,便可利用THE!
CHECKER这个程序来检核你现有的收藏,并依照检核的报告来整理图片,更可依此向其它的收藏家索图或换图。
一般来说最具公信力的当然是扫图家自行制作的CSVFILE,通常称之为OFFICIALCSVFILE,但因种种原因,CSVFILE也会出现一些民间版本。
以ASIANSCAN为例:
日本扫图家ENYA宣称自己的英文程度不好,而委托EDZONE代为制作CSVFILE;又如KUNISCAN这类超过一万张的大型收藏,如果要以OFFICIALCSVFILE为依据来检核收藏,则需将所有的档案都存在硬盘之中,如此将耗费相当大的硬盘空间和需要很多的时间来检核。
于是EDZONE(或其它人)就依图片发表的时间顺序,并考量烧制成光盘的容量,而将OFFICIALCSVFILE作适当的分割(如KUNI_CD1、KUNI_CD2...等),如此一来便可依据分割过后的CSVFILE来烧制光盘,以腾出更多的硬盘空间来收其它的图。
以ASIANSCAN来说,以往最为普遍使用的民间版CSVFILE莫过于EDZONE所公布的版本,收藏家多半以此为依据,但自从2000年8月EDZONE宣布退休后,目前市场上尚未出现如同EDZONE般广为采用的民间版CSVFILE。
(3)、CRC的迷思
CRC32是32BITCYCLICREDUNDANCYCHECK的缩写,它是CSVFILE中的一部份,也是一种纪录图片档案传输的计算数值,而每一张图片都有其独立的CRC值。
打个比方来说,把一个人比作一张图,图片的文件名就如同是人的姓名,而图片的CRC值就如同是人的身分证字号了,也就是说:
全国可能有好几个「王大明」,但他们的身分证字号是绝对不同的。
CRC最大的功用是在于当图片文件名遭人更改时,只要CRC值正确,THE!
CHECKER会自动辨识并将档名修正回来,就如同「王大明」如果用匿名「王小明」行走江湖,但只要知道他的身分证字号,便可查到他的真实姓名。
在使用THE!
CHECKER认证图片时可能会出现如下的状况:
当文件名称和档案大小都正确时,有时候会出现CRC值错误的讯息,此时笔者建议您先检视该张图片,如果与同系列前后图片为相同的主角或相同的扫图家,而且图片本身并无任何瑕疵,则此CRC值的错误应该是在网络上传输时产生的错误。
至于是否将之认定为真迹而保存,那就见仁见智了,就如同你收到一份履历表,所有的数据都是正确的,但身分证字号可能填错,但你还是可以认定出现在你面前的人是本尊的。
但以一般集图家来说,多数人还是会为求完美而选择舍弃重收的。
二、基本认识:
1、图片来源:
一般流传在网络上可供收集的人像图片(非指风景或CG图),其来源大致可分为下列数种
(1).由明星写真集、杂志经扫描仪所扫出来的图
(2).由照片经扫描仪所扫出来的图
(3).由数字相机所拍摄的图
(4).由VCD上所撷取的画面
这些JPG图文件经过扫图家的扫描及处理过后,传到网站、NEWSGROUP或IRCCHANNEL上供大家评鉴与收集,只要图片处理的技术好、品质佳,当然所取材的女主角要漂亮,并且达到一定的数量,就会受到集图家们的青睐和珍藏。
2、派系分别
扫(集)图界如果以最简单的分类法分为ASIANSCAN和WESTERNSCAN,也就是东方人和西方人。
ASIANSCAN大致上可以分成:
(1).PHOTOBOOKSCAN
这是最多人收集也是数量最多的图,就是取材自一般唯美的明星写真或杂志,经由扫图家扫描后做成的JPG档案,PUREJAPANSCAN和ENYASCAN可说是此道的佼佼者。
当然说到这里,一定得提到来自台湾的早期世界级扫图家SPINNING、GODZILLA和NAGUAL,在日本扫图家的环伺之下,也算闯出了一片天,而且品质相当好,值得珍藏。
到了2001年5月ASIANSCANWIND的成立,更加确立了台湾扫图家在扫(集)图界的重要地位。
(2).BONDAGE&FETISHSCAN
也就是取材于一些绑绳子啦、滴蜡烛油的啦.....等等的图,这类图片口味独特,因为限于尺度,只能在台面下收集,是不能摆上台面的,部分的BLUEBIRDSCAN和DOGGIESOUPSCAN算是此道的爱好者。
(3).WILLY'SWORKSHOP
这算是业界中的怪胎,专门把扫图家扫出的美美相片,运用的合成技术,让女星们的第四点无所遁形,这当然气坏了所有女星和扫图家啰,唉......此风不可长。
WESTERNSCAN大致可以分成:
(1).以PLAYBOY为素材的SCAN
这在业界来说算是三多,第一是以此为素材的扫图家最多,第二是乐于此道的集图家最多,第三是被PEI(PLAYBOYENTERPRISESINC.的缩写)所扫荡的网站最多。
没办法,花花公子的兔女郎们实在是炙手可热,而且花花公子的相关杂志本身品质好,不但让扫图家们前仆后继,也让集图家们大呼过瘾。
SCANMASTERSCAN和SKUNKMASTERSCAN,算是此类别中早期的佼佼者,虽然这两位大师早已退休,但他们所扫的图一直被视为此类别的经典代表,是初学者所应最先拥有的珍藏品。
(2).以影视明星或名模特儿为素材的SCAN
称为CELEBSCAN,这类图的题材多,又没有受到PEI这样的团体压迫,所以不但以此为主题的扫图家或图的数量,已渐渐有超越以PLAYBOY为素材的SCAN,唯一的缺点就是,早期部分的扫图家所取材的杂志画质较差,水准参差不齐。
但近年来在一些扫图家的大力改革之下,CELEBSCAN已有长足进步,可以说是达到一个新的境界,无怪乎此类的扫图家和收藏家都有大量的增长,MAELSTROM'SEYE可谓是此类别中的经典。
(3).PHOTOSHOOTSSCAN
这算是WESTERNSCAN中口味较重的了,要如何来介绍这系列呢,有混过贴图区的人应该都听说过日本的PGF套图吧。
对啦!
PHOTOSHOOTSSCAN其实就是一套套二十张到四十张不等的系列图,就像是在看没有声音的分格脱衣舞秀或是成人电影,而且部分的PHOTOSHOOTSSCAN还是由知名的摄影师来掌镜,加上俊男与美女,不但画质高,而且同样具有收藏的价值。
此类别的辛辣度够,所以大部分都是出现在付费的成人网站中,而最具名气的莫过于摄影大师SUZURANDALL的系列了,不但灯光好、气氛佳,还有不同的故事哩,嘿嘿.....不过限于我国的裸露尺度,无法于本站和大家分享。
3、图库整理
图片分类
以目视分类作品
以下将就各扫图家的图片外观和文件名称的编排做简单的介绍
ASIANSCAN-KUNISCAN
扫图家为KUNI,以量来说,他绝对可以大声的说:
「叫我第一名」,而最令人佩服的是,以他网站惊人的人气,却坚持不收任何费用,甚至没有任何的广告连结;简简单单的首页设计,不用任何花俏的网页效果来吸引人,他只不断的扫新图,更开放爱好者REQUEST旧图,所以虽然他所扫的图数量惊人,但只要有恒心,是很适合集图初学者入门的系列。
女星姓名和扫图家的LOGO会放在图片彩色边框中,以本图为例,女星的英文姓名MADOKAOZAWA出现在图片右下方,而其LOGO「KUNI」则在右上方。
文件名称为KS_MAOZ1004.JPG,「KS」即为KUNISCAN的缩写,「MAOZ」为女星之英文姓及名的前两个字母,「1004」是这个系列的流水号。
ASIANSCAN-BLUEBIRDSCAN
谈到ASIANSCAN就一定得认识开山祖师爷BLUEBIRD,虽然他早期的作品,以现在的眼光看来,实在有点令人不敢领教,但BLUEBIRD对ASIANSCAN的发展是相当具有影响力的,甚至一些对ASIANSCAN较不熟悉的国外扫图家或是网站来说,他们所认得的几乎只有BLUEBIRD。
女星姓名和扫图家的LOGO会分别放在图片边框中的对角,以本图为例,女星的英文姓名HARUMIINOUE出现在图片左上方,而其LOGO「BLUEBIRD」则在右下方。
文件名称为HAIN409.JPG,「HAIN」为女星之英文姓及名的前两个字母,「409」是这个系列的流水号。
ASIANSCAN-PUREJAPANSCAN
扫图家为BAZZ,亮丽饱和的色彩是他所扫图片的特色,纯熟的扫图技术和软件使用技巧,加上对光影及色彩的敏感度,让PUREJAPANSCAN成为目前ASIANSCAN中最抢手也最热门的收藏系列。
女星姓名和扫图家的LOGO会分别放在图片的斜对角,以本图为例,女星的英文姓名MADOKAOZAWA出现在图片左上方,而其LOGO「有个红太阳的PUREJAPAN」则在右下方。
文件名称为PJ_MADOKA_O010.JPG,「PJ」即为PUREJAPAN的缩写,而「MADOKA」为女星之英文FIRSTNAME,「O」则为LASTNAME的第一个字母,「010」是这个系列的流水号。
ASIANSCAN-ENYASCAN
扫图家为ENYA,素净的色彩加上严谨的取材,在在显出ENYASCAN高贵的气质,边框中会列出所取材的写真集名称及摄影师的姓名,是别的扫图家所没有的,也显示出ENYA对原创者的尊敬。
女星姓名和扫图家的LOGO会放在图片的边框中,以本图为例,边框中依序为女星的英文姓名AKIKOIKUINA、专辑名称SHADE、摄影家姓名TATSUOWATANOBE,而其LOGO「ENYA」则在最下方。
文件名称为ES_AKIK007.JPG,「ES」即为ENYASCAN的缩写,「AKIK」为女星之英文姓及名的前两个字母,「007」则是这个系列的流水号。
WESTERNSCAN-SKUNKMASTERSCAN
扫图家为SKUNKMASTER,他算是扫图界中教父级的人物了,精湛的技术扫出清晰高画质的图片,使他成为当代的教父,现在的经典,加上它全部的系列才426张,是相当适合初学者开始收集的第一人选。
女星姓名和扫图家的LOGO会放在图片斜对角或同侧的角落,以本图为例,女星的英文姓名ELISABRIDGES出现在图片左上方,而其LOGO「SKUNKMASTER」则在右下方。
文件名称为BREPRW01.JPG,「BR」是女星姓氏的前两个字母,「E」是女星名字的第一个字母,「PRW」是图片来源的杂志英文缩写(本范例为PLAYMATEREVIEW),「01」则是SKUNKMASTER所扫的这个女星的系列流水号。
WESTERNSCAN-DEATH_SCPSCAN
扫图家为DEATH,目前所属之扫图集团是SCP(SCANCOLLECTIONPOINT的缩写),他可以说是目前扫图界中数一数二的大师级扫图家。
女星姓名和扫图家的LOGO会放在图片斜对角或同侧的角落,以本图为例,女星的英文姓名LUCIEKOTALOVA出现在图片左上方,而其LOGO是在左下方一个小图,小图上方写着DEATH,下方则是SCP。
文件名称为128_DEATHSCP_LUCIE_KOTALOVA_02.JPG,「128」为扫图家所扫的所有图的序号,「DEATH」即为扫图家,「SCP」为扫图家所属集团,「LUCIEKOTALOVA」为女星之姓名,「02」则是DEATH所扫的这个女星的系列流水号。
以程序鉴定真迹
所谓的以程序分类作品,其实就是利用一个叫做THE!
CHECKER的程序,配合CSV档案的使用,经过一些适当的设定后,便可以检查你的图库中是否有重复或破损的图,并分辨你所收集的图是否相同于扫图家的源文件;经过进阶的设定后,更可以将你的图库自动分类整理,并将文件名称自动修正为原始正确档名。
对照集邮而言,邮友必须检视自己所有的收集是否有破损,并且要对照年鉴才能知道自己的收集是否完整,然而这样耗时又费神的工作,套用在图片的收集上,却因为THE!
CHECKER程序的发明,而变得轻松无比,只要把一些设定做好,接下来的动作就是按下按钮并等待结果。
THE!
CHECKER程序和CSV档案这两样东西加起来,就如同式集图家的照妖镜,让所有经过修改的档案现出原形,并可选择性的将重复档案自动删除,是成为一个优秀集图家不可或缺的利器。
建议图库分类模式
对一般尚未开始计划性收图的人来说,大多是以明星的姓名作为分类的主目录,但就如同先前所提到的,这样的收图方式,往往会收到重复的图或遗漏了一些图而不知如何是好,甚或是根本不知道自己缺了哪些图,因此建议您,从现在开始,重新建立您的图库目录。
首先在您的主目录(C:
/或D:
/...等)下建立SCAN_COLLECTION的目录,在其中分成ASIAN_SCAN和WESTERN_SCAN两个次目录,以区分东方人和西方人,接下来则是依照扫图家姓名来建立目录,如在ASIAN_SCAN下建立KUNI_SCAN、PUREJAPAN_SCAN....等,或是在WESTERN_SCAN下建立SKUNKMASTER_SCAN、BUTTERFLY_SCAN....等,最后则是以明星姓名为区分的子目录,如此便大功告成了。
以此为分类的好处,是易于掌握收藏的完整性,并方便于THE!
CHECKER的相关设定,然而,以这样的方式收图,最好具备光盘烧录机或是超大型硬盘容量,否则你的硬盘将很快被图片所占满。
对于刚开始计划性收图的新手,笔者建议您先选定一、两个您较喜爱扫图家,集中精神来收藏,千万别贪多,因为扫图家实在太多了,同一个明星的同一本写真集,可能被五、六个甚至更多的扫图家所扫,等到您收出兴趣、集图成痴时,再慢慢扩大您的收集吧。
4、图片取得
踏破铁鞋寻真迹(网站大搜密)
随着扫图数量和收藏家的日益增加,网络扫图家也越来越多,如果想要收集特定扫图家的图片,当然是去扫图家自己的网站(也就是所谓的OFFICIALSITE)去抓图最能保障所抓到的图是真迹。
但如果您想抓一些没有自己网页的扫图家图片,或是一些已经从网站上删除的旧图,就必须仰赖一些图库型网站来补充自己的缺图。
但不要以为看到一个网站有一堆扫图家的图就高兴的把他们全部抓下来,嘿嘿....您可能花了一堆时间下载,结果用THE!
CHECKER检查后发觉全都是WRONGSIZE甚至是UNKNOWN的图。
在几年前,笔者也是在网络的贴图区中随性的收图,某日注意到了有个红太阳写着PUREJAPAN的LOGO的高画质图片之后便开始注意贴图区里的PUREJAPAN图,慢慢的了解到图片有编号的顺序性,也让笔者兴起寻根的念头。
于是在国外的搜寻引擎中,找到了PUREJAPAN的主网页;主网页上的图抓完了,发觉自己的收集有跳号,所以又另外在搜寻引擎中也找到一些有放PUREJAPAN图的网站大肆搜括,经过长时间努力,才将其完整收藏,在此期间笔者找到两个非常具有特别意义的网站,一个是DYNAMIX.NET;另一个是THEHOU
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 宝典