刚刚得到的消息,MSN space也随着twitter一起,被万恶的GFW封了,space也是国内使用频率较多的BSP(博客服务提供商),每一轮的被墙之后,BlogHost都会推出一个博客搬家教程,或是自己编写或是转载,目的只有一个,就是让大伙继续自己的博客之旅,不让GFW的恶行恶心到自己。
从目前的形式来看,使用WordPress等独立博客程序架设独立博客,最好再配合使用国外注册的国际域名和国外博客主机空间,这样才是反抗GFW最有力的武器。
继之前的从 Blogspot/Google Blogger 搬家到 WordPress全攻略 BlogHost再次推出从Windows Live Space搬家到Wordpress图文教程,这是我从网上找到最详实有效的从MSN space搬家到Wordpress的教程,原文可以点此查看。
1.1. 设置Windows Live Space和Wordpress的日期格式
重要的是让WindowsLiveSpace和Wordpress的日期格式一致,这里我两个设置的是2009/03/30。在WindowsLiveSpace中,我的时间格式是10:24:05,设置的路径是"选项"->"常规"->"日期和时间格式":
另外,在"选项"->"日志"->"显示日志日期"选项中,勾选"在页首出显示日志发布日期"。在Wordpress中,相应的路径是"设置"->"常规"->"日期格式"。
1.2.下载安装Python 2.5.2
Broom测 试了两种组合,Python 2.5.2+Beautiful Soup 3.0.6和Python 2.5.1+Beautiful Soup 3.0.4。但后面的低版本组合需要打些补丁,我们就不必麻烦了,我是直接用的高版本。Python 2.5.2的官方下载地址在:
http://www.python.org/download/releases/2.5.2/
我用的是Windows平台,选择的是X86 processors python-2.5.2.msi。下载完毕,一路安装过去就是,不妨依着它默认的安装路径c:Python25。接下来看看Python好不好使:
开始->运行->在冒出来的框里输入 cmd 回车->在冒出来的命令行输入 python 再回车
顺利的话,你将看到类似的回应:
如果提示说python不可识别,就需要为Python设置环境变量,如果不明白什么是"环境变量",依着下面的操作就是。
"我的电脑"->右键"属性"->"高级"->"环境变量"->"系统变量"->点中一个叫Path的系统变量->"编辑"->在Path的变量值框的末尾,加上一个分号;(英文状态下),然后跟着是填上Python的安装目录,比如c:Python25。一路确定后,再回刚才的命令行试试python这个命令。
1.3.下载Beautiful Soup 3.0.6
Beautiful Soup 3.0.6是一个解析HTML页面的类库,接下来那个下载博客文章的脚本需要用它。下载地址:
http://www.crummy.com/software/BeautifulSoup/download/3.x/BeautifulSoup-3.0.6.tar.gz
解压到一个文件夹,比如D:downloadBeautifulSoup-3.0.6。你将看到BeautifulSoup.py等几个脚本。
1.4.下载脚本Live-space-mover
Live-space-mover这个脚本,能够把WindowsLiveSpace中的所有文章和评论等,生成一个Wordpress能够识别的XML文件,以实现博客搬家的目的。下载地址:
http://code.google.com/p/live-space-mover/downloads/list
现在的最新版本是live-space-mover.1.7.5.zip。解压到D:downloadBeautifulSoup-3.0.6。在 D:downloadBeautifulSoup-3.0.6目录下,你应该看到脚本live-space-mover.py。
2.运行脚本,下载博客,生成XML文件
在刚才提到过的cmd命令行,转到D:downloadBeautifulSoup-3.0.6文件夹(先敲入d: 回车,然后敲入 cd D:downloadBeautifulSoup-3.0.6 回车),敲入下面的一行语句并回车:
python live-space-mover.py -s http://yourSpaceName.spaces.live.com/ -t "%m/%d/%Y %I:%M:%S %p"
其中,yourSpaceName是你Windows Live Space的名字。
这个运行时间视你博客文章的多少而定,如果在屏幕上看到博客标题显示为乱码,不必在意。成功之后,在 D:downloadBeautifulSoup-3.0.6文件夹,将生成一个类似export_03292009-2238.xml的文件,这就是你 整个Space的文章、评论以及类别之类的了。
又,如果在准备工作1.1中,你Windows Live Space的时间格式是10:24而不是10:24:05,那么,以上命令就将更简洁些:
python live-space-mover.py -s http://yourSpaceName.spaces.live.com/
3.把XML文件导入到Wordpress
这个就相对简单了。Wordpress后台->"工具"->"导入"->选择WordPress,上传那个export_03292009-2238.xml文件,再指定一个作者就行。这个速度就快多了。
一个问题是,系统只允许导入最大为2MB的文件,对超过2MB的文件(像我这次导入的近六百篇博文),只好手动分割文件或想其他办法了。如果一次导入不漂亮,可以把所有的文章及评论先删除了再试试,两个简单的SQL语句可以参考:
DELETE from wp_posts WHERE post_author=1;
DELETE from wp_comments WHERE comment_ID>1;
作者ID(post_author)和评论ID(comment_ID)你可以在phpMyAdmin中找到。
待看到"导入完毕。好好享受吧!",心情当真是无比舒畅,按着赖哥哥宁的说法,是比大热天吃了冰水还舒服。
4.一些优化工作
对全盘导入的博文,难免泥沙俱下,以前大量垃圾评论也跟着过来了。垃圾评论的一个特点是姓名为空("没有名称"或者No name),下面的SQL语句就可以把它们清除:
DELETE FROM wp_comments WHERE CONVERT(`wp_comments`.`comment_author` USING utf8) = '(没有名称)nwrote:' ;DELETE FROM `wp_comments` WHERE CONVERT(`wp_comments`.`comment_author` USING utf8) = 'No name' ;
―-by Jiang<at>li-and-jiang.com――
--
Posted By GFW Blog to GFW Blog at 6/02/2009 06:45:00 P
--~--~---------~--~----~------------~-------~--~----~
GFW Blog又被封了,您可以通过以下网址翻墙访问:
https://meme2028.appspot.com/chinagfw.org/
https://soproxy.appspot.com/chinagfw.org/
https://proxytea.appspot.com/chinagfw.org/
https://quick-proxy.appspot.com/chinagfw.org/
https://free4internet.appspot.com/chinagfw.org/ 。 您也可以使用Google Reader订阅我们,订阅地址:http://chinagfw.org/feeds/posts/default。
To unsubscribe from this group, send email to
gfw-blog+unsubscribe@googlegroups.com
For more options, visit this group at
http://groups.google.com/group/gfw-blog?hl=zh-CN
-~----------~----~----~----~------~----~------~--~---
没有评论:
发表评论