wangsisi 发表于 2011-5-10 16:18:06

MediaWiki导入XML数据中需要转义的字符

需要注意的几个地方:
xml文件字符集应该是utf-8,文件为unix格式,不要用asc-ii或者gb2312等字符集,也不要用dos格式文件;
尽量避免出现wiki中的链接和模板字符,可以更换成全角符号:
[ (可以出现在正文,不能出现在标题) 替换为 [
] (可以出现在正文,不能出现在标题) 替换为 ]
{ (可以出现在正文,不能出现在标题) 替换为 {
} (可以出现在正文,不能出现在标题) 替换为 }
| (可以出现在正文,不能出现在标题) 替换为 |
需要做转义的字符,有5个XML中定义的标准:
和符号 & (可以出现在正文,也可出现在标题) 转义为 &
小于号 < (可以出现在正文,不能出现在标题) 转义为 &lt;
大于号 > (可以出现在正文,不能出现在标题) 转义为 &gt;
双引号 " (可以出现在正文,也可出现在标题) 转义为 &quot;(MeidaWiki中这一个导出进行了转义,导入可不用先转义)
单引号 ' (可以出现在正文,也可出现在标题) 转义为 &apos;(MeidaWiki中这一个导出没有转义,导入也不用先转义)
从access或者execl等数据导出文本文件时,分隔符用制表符,以避免与其它字符混淆,便于后期处理。

页: [1]
查看完整版本: MediaWiki导入XML数据中需要转义的字符

美国HostEase虚拟主机一年198元