对于英语学习者来说,《经济学人》是一本必备的杂志,通过阅读《经济学人》高质量文章,我们不仅可以了解时事,更可以拿来作为我们的英语学习资料。从学习英语的角度来说,我个人觉得,《经济学人》的文章有几个显著的特点值得我们学习。一是结构清晰、二是句型富于变化、三是词汇鲜活,有很多用词还非常幽默,让人读来津津有味。具体怎么学习,每个人都有自己的看法,但这并不是本篇博客的重点。夏天今天要讲的是如何用Calibre抓取最新的《经济学人》杂志,而不用等到每周更新的时候浪费时间,到处求人找资源了。求人不如求己,夏天觉得,获取资源(尤其是外文资源)的能力是每个英语专业的学生必备技能。多学点计算机技术,大有裨益!于是,夏天的博客,夏天乐园(www.itengli.com),域名寓意为(IT + English)由此诞生了。在这里,我会分享一些实用技术,非常有利于大家的学习。好了,不啰嗦啦,开始我们的教程吧!
首先,当然是要下载安装Calibre啦!
- Windows(64位) 链接: https://pan.baidu.com/s/1gfONgl1 密码: 274u
- Windows(32位) 链接: https://pan.baidu.com/s/1mieBJra 密码: ke8i
- OS X dmg 链接: https://pan.baidu.com/s/1sk9tvE9 密码: tti2
大家根据自己的操作系统选择下载,我这里以Windows 10为例演示。
首先勾选”I accept”,然后点击”Install”,
接下来可以选择书库所在位置(下载、转换的书所在位置):
默认就行,我在E盘下创建了一个“calibre书库”文件夹,所以我选择了变更:
接着,会让你选择你的电子阅读器,这里默认就行,直接下一步:
安装成功后,就先不用管calibre了。
接下来需要通过计算机系统环境变量来为Calibre设置一下代理,这个过程非常重要!由于某些未知原因,必须要使用代理(科学上网)才能下载《经济学人》。代理软件可以使用lantern,如果你有ss,也非常棒!
在进行下面步骤前,请务必打开lantern或者ss。
首先右击电脑桌面的“我的电脑”或者“计算机”或者“此电脑”图标,选择属性。然后点击高级系统设置
接下来,点击环境变量:
然后,在系统变量(S)的一栏,点击新建:
变量名为http_proxy 变量值需要根据你的代理软件确定
如果你用的ss,则变量值为:http://127.0.0.1:1080
如果你用的lantern,你需要找到lantern在你电脑上的代理端口号。当你启动lantern之后,默认自动会打开浏览器的lantern页面。依次该页面左上角的三道杠→设置→高级设置
如图所示,34506就是我们要找的端口号。
该变量值填写为:http://127.0.0.1:34506
我自己用的ss,所以我的变量值填写为:http://127.0.0.1:1080
然后都点击确定保存就好了。现在已经距离成功不远啦!
再次回到Calibre配置,重启Calibre。
重新打开Calibre之后,可以依次点击软件上边的菜单栏中的 首选项→(高级选项)杂项:
如果出现了你上边设置的代理服务器内容,那么就说明你代理已经设置好了。
然后,依次点击菜单栏 抓取新闻→英语→The Economist (这个过程不需要贴图了吧?)
选好之后,点击立即下载
接着,找到软件界面右下角,会出现:任务1,点进去,你就会发现,Calibre正在为我们抓取文章
这会需要一段时间,喝杯茶等待就好了。下载完成后,可以点击打开路径,找到文件。也可以双击书名,直接用Calibre打开阅读:
默认是epub格式的,你可以利用Calibre转换成mobi等其他格式。利用Calibre我们可以下载很多杂志、报纸等,大家可以自己研究一下哈!大家遇到什么问题可以在下面留言。
对于偷懒者,我的服务器每周在定时自动下载,需要的自取(版权原因,会随时删除,需要的请及时下载) 下载地址:http://cloudgo.info
谢谢!
你好,请问为什么我设置代理后calibre 只能抓取经济学人,其他的都抓取不了?
请问一下 这个软件 我们主流的哪些杂志 比如Times 、USA TODAY、the wall street journal都可以下载嘛?
基本都可以
还想请问下 能不能转换成pdf的格式呢?谢谢了
可以的,软件界面有转换PDF的功能,但效果好像不太完美
确实,我之前将mobi转换过pdf文件,结果大量单词被空格隔开,导致在搜索关键词的时候,总是找不到实际存在的内容。
PDF和其他格式之间的转换问题就是比较多!
楼主的各个资源都非常有帮助,感谢楼主
不客气!
很赞!
站长好,我在抓取《Harvard business review》和《Time magazine》的时候都出现了无法抓取的情况。我看了一下他们和能抓取的新闻的区别,发现抓取页面上《h》和《t》都有一个账号要输入,而且要求必需。我想问一下,这是不是无法抓取的原因,如果是的话,那个账号是什么?谢谢站长
这个应该是只有登录才能浏览。你可以尝试在杂志官网注册一个账号试试,具体我也没测试哦
自由X怎么样,现在还可以用吗
太旧了吧,很少人用了。最好用ss或者lantern
ss可免费使用吗?
有人搞收费的,也有人提供免费的。
免费的 速度怎样?
这个就很难说了。免费的不要指望太多
楼主有免费的吗?
有,但是现在时间不多,暂不开放。等暑期再开放(QQ群内)。
关于 lantern 它是不是 把限额的 几百兆流量 用完了 就会降速?
应该是吧,我不用lantern的。
是它的 哪方面 不好吗?
因为自己会搭建呀,不需要lantern啊
自己搭建是高级术活吧
差不多吧

在群里看见站长说有3.0出来了,哪里可以更新到3.0啊
已上传至群文件!
好的,谢谢站长
你好!你每天提供的美国新闻视频非常好,其中 PBS newshour 有时有srt 文件,有时没有,是否方便告知如何下载PBS newshour字幕文件的方法?谢谢。
你可以看我的那篇youtube-dl教程,应该可以下
你好,在下载经济学人时出现无法下载,显示转换错误,
请问如何操作呀?先谢谢了~
你好,在抓取《经济学人》时出现抓取失败,显示转换错误
请问如何解决呀?先谢谢了~
完全按照您的方法来的为什么抓取经济学人总是不成功呢?
可能是科学上网不成功
我为什么没有设置也能抓取……(挂着ssr,但是没有设置变量值之类的)
因为《经济学人》可以直接访问了!
我抓下来只有目录和链接 没有文章内容 请问是不是要设置什么 还是我打开的方式不对
可能是网络不稳定,需要fan墙
试了一下,抓取经济学人。卡在了进度是34%,一直不动了。 还有纽约时报直接报错,请问楼主有什么解决办法?谢谢!
纽约时报需要科学上网~ 经济学人有的时候也需要~ 这种情况通常就是你的代理网络不行了
回复了没有提交?不知道看得到我的回复不~~~~
看到了~
请问大佬如何通过技术手段获取经济学人得PDF版本噢就是和实体杂志一模一样得那种。我有官网账号。但好像官网账号不提供PDF下载,但是很多我看大家转载的经济学人PDF就是完美高清和试题杂志排版一样估计不是通过软件转换的格式,
官网不提供PDF下载的。PDF可能是印刷公司那边泄露吧,具体我也不是很了解!
博主你好。我自己搭的ssr,然后电脑上挂着,打开calibre,但是没有检测到系统代理,然后下载经济学人,卡在1%然后过会就报错了。不知道是什么原因呢?添加系统变量和不添加系统变量都试过了。
没有检测到系统代理,说明代理设置有问题的~
您好,我用的ssr,然后按照您的方法直接显示抓取失败,请问有什么方法能解决呢
应该是代理设置有问题~
那请问应该如何设置呢
科学上网工具,你可以自己搜搜。
站长,我按照你的教程弄了,还是下载不了经济学人。我可以科学上网,caliber上也出现了代理服务器地址,然而就是抓取不了是咋回事
我也是,按照站长的办法一毛一样的设置,就是没办法抓去。
我也是,能科学上网,也怀疑经济学人修改了rss,也许屏蔽了calibre
问下大佬,经济学人可以抓去,但是科学美国人到1%就报错了说无法抓取,如何解决
它并不是万能的。科学美国人我有自己制作,欢迎加群:667495173 获取
设置好代理服务器了,ssr也开着,就是下载不来
请问,mac版的calibre怎么配置代理跟环境变量呢。谢谢
请问为什么我现在下载the economist的文章总是失败?
楼主,为什么我还是无法下载啊
而且楼主你最后的那个链接打不开 
站长还有经济学二怎么获取的方式吗?上面这个好像不能使用了
这个可以用的。如果不想麻烦,可以通过QQ加群直接获取。
问一下,如果用shadowsocks的话,怎么加入规则