Posted by admin on 三月 20th, 2010 |
0 comments
不得不招认,将动态网页链接rewriting成静态链接是最保险和安稳的面向检索引擎优化要领。
除此之外随着互联网络上的内容以惊人速度的增长也越来越突出了检索引擎的首要性,假如网站想更加好地被检索引擎编录,网站设计除了面向用户友好(User
Friendly)外,检索引擎友好(Search Engine
Friendly)的设计也长短常首要的。投入检索引擎的页面内容越多,则被用户用差异的重点词找到的几率越大。在Google的算法探问一文中提到一个站点被Google索引页面的数量其实对PageRank也是有肯定熏陶的。由于Google
突出的是整个网络中相对静态的部分(动态网页索引量对比小),链接地址相对固定的静态网页对比适合被Google索引(怪不得许多大网站的邮件列表归档和BLOG按日期归档的文档很容被搜的到),所以许多关于面向检索引擎
URL设计优化(URI Pretty)的文章中提到了许多利用肯定机制将动态网页参数形成像静态网页的格式。比如可以将:
http://phpunixman.sourceforge.net/index.php?mode=man¶meter=ls
形成:
http://phpunixman.sourceforge.net/index.php/man/ls
实现要领紧要有2种:
基于url rewrite
IIS的ISAPI REWRITE下载(免费)
基于path_info
把URI地址用作参数传递:URL REWRITE
最容易的是基于各种WEB服务器中的URL重写转向(Rewrite)模块的URL转化:这样几乎可以不修改程序的实现将 news.asp?id=234
这样的链接映射成 news/234.html,从外面看上去和静态链接一样。Apache服务器上有一个模块(非缺省):mod_rewrite:URL
REWRITE功能之强大足够写上一本书。
当我需要将将news.asp?id=234的映射成news/234.html时,只需设置:
RewriteRule /news/(d ).html /news.asp?id=$1
这样就把 /news/234.html 这样的请求映射成了 /news.asp?id=234
当有对/news/234.html的请求时:web服务器会把实际请求转发给/news.asp?id=234
而在IIS也有相应的REWRITE模块:比如ISAPI REWRITE和IIS
REWRITE,语法都是基于正则表达式,所以配置几乎和apache的mod_rewrite是相同的:
比对于某一个容易运用可以是:
RewriteRule /news/(d ).html /news/news.php?id=$1
这样就把 http://www.chedong.com/news/234.html 映射到了
http://www.chedong.com/news/news.php?id=234
一个更通用的能够将全面的动态页面进行参数映射的表达式是:
把 http://www.myhost.com/foo.php?a=A&b=B&c=C
浮现成 http://www.myhost.com/foo.php/a/A/b/B/c/C。
RewriteRule (.*?.php)(?*)?/(*)/(*)(. ?)? $1(?2$2&:?)$3=$4?5$5:
一下是真对phpBB的一个Apache mod_rewrite配置样例:
mod_rewrite和isapirewrite基本兼容,可是还是有些差异,比如:isapirewrite中”?”需要转义成”?”,mod_rewrite不用,isapirewrite支撑
“d ” (一共数字),mod_rewrite不支撑
RewriteEngine On
RewriteRule /forum/topic_(. ).html$ /forum/viewtopic.php?t=$1
RewriteRule /forum/forum_(. ).html$ /forum/viewforum.php?f=$1
RewriteRule /forum/user_(. ).html$ /forum/profile.php?mode=viewprofile&u=$1
这样设置后就可以经过topic_1234.html forum_2.html user_34.html这样的链接访问原先的动态页面了。
经过URL REWRITE还有一些甜头:
荫蔽靠山实现:这在靠山运用平台的迁移时十分有用:当从asp迁移到java平台时,对于前台用户来说,基本感想不到靠山运用的变动;
简化数据校验:因为像(d )这样的参数,可以有效的有效监管数字的格式甚至位数;
比如我们需要将运用从news.asp?id=234迁移成news.php?query=234时,前台的浮现可以一直维持为
news/234.html。从实现运用和前台浮现的分袂:维持了URL的安稳性,而利用mod_rewrite甚至可以把请求转发到其他靠山服务器上。
基于PATH_INFO的URL美化
Url美化的别的一个要领即是基于PATH_INFO:
PATH_INFO是一个CGI 1.1的轨范,经常发现许多跟在CGI后头的”/value_1/value_2″即是PATH_INFO参数:
比如http://phpunixman.sourceforge.net/index.php/man/ls,中:$PATH_INFO =
“/man/ls”
PATH_INFO是CGI轨范,所以P惠普Servlet等都有的支撑。比如Servlet中就有request.getPathInfo()办法。
注意:/myapp/servlet/Hello/foo的
getPathInfo()返回的是/foo,而/myapp/dir/hello.jsp/foo的getPathInfo()将返回的
/hello.jsp,从这里你也可以知道jsp其实即是一个Servlet的PATH_INFO参数。ASP不支撑PATH_INFO,
PHP中基于PATH_INFO的参数理解的例子如下:
//注意:参数按”/”分割,首先个参数是空的:从/param1/param2中理解出$param1 $param2这2个参数
if ( isset($_SERVER) ) {
list($nothing, $param1, $param2) = explode(’/ , $_SERVER);
}
怎样隐秘运用:比如 .php,的增补名:
在APACHE中这样配置:ForceType application/x-httpd-php
怎样更像静态页面:app_name/my/app.html
理解的PATH_INFO参数的时刻,把最后一个参数的最后5个字符“.html”截断即可。
注意:APACHE2中缺省是不允许PATH_INFO的,需要设置AcceptPathInfo on
特别是针对利用虚拟主机用户,无权安设和配置mod_rewrite的时刻,PATH_INFO频频就成了独一的选择。
OK,这样往后瞥见类似于http://www.example.com/article/234这样的网页你就知道可能是
article/show.php?id=234这个php程序生成的动态网页,许多站点表面看上去可能有许多静态目录,其实很有可能都是利用1,2个程序实现的内容公布。比如许多WIKIWIKI体系都利用了这个机制:整个体系就一个容易的wiki程序,而看上去的目录其实都是这个运用拿后头的地址作为参数的盘问结果。
利用基于MOD_REWRITE/PATH_INFO +
CACHE服务器的解决方案对原有的动态公布体系进行改革,也可以大大降低旧有体系晋级到新的内容管理体系的成本。而且便利了检索引擎编录入索引。
附:如安在IIS上利用PHP支撑PATH_INFO,PHP的ISAPI模式安设备忘:只试成 php-4.2.3-Win32
解包目录
========
php-4.2.3-Win32.zip c:php
PHP.INI初始化文件
=================
复制:c:phpphp.ini-dist 到 c:winntphp.ini
配置文件关连
============
遵照install.txt中的阐明配置文件关连
运行库文件
==========
复制 c:phpphp4ts.dll 到 c:winntsystem32php4ts.dll
这样运行后:会发现php把PATH_INFO映射到了物理路径上
Warning: Unknown(C:CheDongDownloadsariadnewwwtest.phppath): failed to create
stream: No such file or directory in Unknown on line 0
Warning: Unknown(): Failed opening
‘C:CheDongDownloadsariadnewwwtest.phppath’ for inclusion
(include_path=’.;c:php4pear’) in Unknown on line 0
安设ariadne的PATCH
==================
中止IIS服务
net stop iisadmin
ftp://ftp.muze.nl/pub/ariadne/win/iis/php-4.2.3/php4isapi.dll
笼罩原有的c:phpsapiphp4isapi.dll
注:
ariadne是一个基于PATH_INFO的内容公布体系,
P惠普4.3.2 RC2中CGI模式的PATH_INFO已经修正,照常安设即可。
参考信息:
URL Rewrite文档:
ISAPI REWRITE文档
IIS的ISAPI REWRITE下载(免费)
http://httpd.apache.org/docs/mod/mod_rewrite.html
http://httpd.apache.org/docs-2.0/mod/mod_rewrite.html
检索引擎友好的URL设计,http://www.sitepoint.com/article/485说不定这个URL原先即是articel.php?id=485
一个基于PATH_INFO的开源内容管理体系,http://typo3.com/
Google的PageRank算法阐明:http://pr.efactory.de/