级别: 博士生
UID: 15518
精华: 0
发帖: 279
威望: 42 点
积分转换
愚愚币: 303 YYB
在线充值
贡献值: 0 点
在线时间: 188(小时)
注册时间: 2006-11-25
最后登录: 2009-07-16
楼主  发表于: 2006-12-16 20:56

 flashget下载与合并欧洲专利全文

flashget下载与合并欧洲专利全文
欧洲专利局在浏览器中每篇专利只显示一页,其余是空白页,一页一页保存后,
合并这样的多个文件,先要在Acrobat中将空白页删去才能合并,并且不能打印,
需要专业的软件(如PDF Password Remover)先解除密*****限制后才能打印与合并
。因此下载所需专利成了令人头疼的问题。尽管有不少专利下载工具,但大部分
需要注册,而且下载中可能出错。下面介绍用Flashget下载欧洲专利的方法,这
种方法下载文件不会出错,可以同时输入多个下载任务,是最大的优点。
下面以专利US5008267为例介绍:
1、找到这个专利并进入Original document页面
此页面的地址是:
http://v3.espacenet.com/origdoc?DB=EPODOC&IDX=US5008267&F=0&QPN=US5008
267
F=0表示刻页加了密*****,不能打印,可以看到总页数是113页。
2、地址变换
将地址改为
http://v3.espacenet.com/pdfdoc?DB=EPODOC&IDX=US5008267&F=64&QPN=US5008
267&PGN=1
F=64:去除打印限制 PGN=1:打开专利第1页
3、flashget下载专利全文
此处使用flashget的成批任务下载功能,添加成批任务,输入URL:http://v3.es
pacenet.com/pdfdoc?DB=EPODOC&IDX=US5008267&F=64&QPN=US5008267&PGN= (*)

通配符长度通常有1(1—9)、2(10-99)、3(100-npages)位数三种,请分
几批下载,以免出错。为了防止下载文件命名混乱,请将flashget下载任务数设
定为”1“,修改Flashget属性的文件管理,如果目标文件已存在,选择自动更名
项,下载后的文件名为pdfdoc,pdfdoc(1),pdfdoc(2)…….。
这样,我们就可以很快在几分钟内完成了整篇专利全文的下载了,如果大家忘了
地址中的=号,那有可能下载的文件都是专利的第一页。
4、文件合并
下载下来的文件(单页面,没有其它空白页),没有后辍名,要打开此文件,需
要选择打开程序,如果文件数不多,可以手动给每个文件加上后辍.pdf,并用Ac
robat来合并,如果文件数很多,象我这个专利,有113页,需要用专业软件,如
国华批量改名器来改名成PDF后,用PDF split & Merge 来合并。
此法尚存在一个问题,就是每打开一个下载的文件,都首先弹出打印对话框,解
决方法是,
在打开的文件从“高级”-“Javascript”-“设置文档动作”-“编辑全部”
对话框中,删除“this.print(true)‘一句,确定并保存,就可以了。以后再打
开这个文档时就不弹出打印对话框了。
欧洲专利局有可能更改数据库的地址,我们在浏览器中Original documen点下一
页时,浏览器下面的状态栏会显示文件的真实地址,细心的朋友一定会发现,我
们只须将这个地址的相关数字改动再填入Flashget就OK了,试试吧!
分享:

愚愚学园属于纯学术、非经营性专业网站,无任何商业性质,大家出于学习和科研目的进行交流讨论。

如有涉侵犯著作权人的版权等信息,请及时来信告知,我们将立刻从网站上删除,并向所有持版权者致最深歉意,谢谢。