标签: 搜索引擎优化

  • 纯静态与伪静态的实现

        一,先看一下伪静态实现方法:
        有两种,第一种也是推荐的一种,就是在服务器端配置URL Rewrite,如果你用的apache请确认你的已经加载了rewrite模块,在http.conf中将#LoadModule rewrite_module modules/mod_rewrite前面的#去掉即可(国内部分空间商已提供支持,国外基本上都支持),之后你只需在站点根目录加入自定义好的.htaccess即可,要想拥有个性化的URL,你还需要掌握正则表达式的运用。还有,提醒一下用张宴学长APMServ的用户,之前在本地调试一直不成功,原因是在http.conf文件中,当前的虚拟主机的AllowOverride默认为none导致的,将其修改为all即可,同时allow from也最好设为all.
    形如:

    <Directory “X:/www/htdocs”>     
     Options FollowSymLinks IncludesNOEXEC Indexes
     DirectoryIndex index.html index.htm default.htm index.php default.php index.cgi default.cgi index.shtml
     AllowOverride None
     Order Deny,Allow
     Allow from all
    </Directory>

         第二种实现伪静态的方法就是在PHP文件内部用$_SERVER函数获取处理QUERY_STRING,关于$_SERVER函数的应用,这里有比较详细的介绍。获得QUERY_STRING后,应用PHP自带的串操作函数解析即可,过程比较简单不再赘述,有兴趣的朋友可以查阅一下相关资料

         二,生成纯静态HTML文件:
         纯静态的HTML有效的提高的站点的安全性,同时也大大减轻了服务器的负荷,速度上也有一定的飞跃,唯一的缺陷是就是占用服务器的硬盘空间,就目前来说,时间比空间更宝贵,国内大型站点基本上都采用的这种方法。
       实现原理:提取缓冲区的数据写入指定文件中,当然这是个HTML的文件。主要利用ob函数,过程比较简单。ob_start()函数,打开输出缓冲区,利用ob_get_contents 获取内部缓冲区内容,将内容写入文件,关闭缓冲区。

    以下是一段简单示例(只做示例,不适合实际应用):

    <?php
       /**
         * 生成HTML静态页面
         * @param    $pram:传入id;$type:读取的php页面类型
         * @return     结果
       */
    ob_start();
    include “File.class.php”;   //自定义文件类
    $pram=intval($_GET[‘id’]);
    if(!isset($pram))
    $pram=1;
    include(‘read.php’);//假设读取数据流来自read.php
    $content=ob_get_contents();
    ob_end_clean();
    $filename=”YOURPATH/NAME.htm”;
    if($name=toHtml($filename,$content)){
        echo ‘The HTML file <b>’.$name.'</b> create success!<br />’;
        echo ‘Take a look! <a href=’.$name.’ target=”_blank”> Click Here</a><br />’;
    }
    else {
        echo ‘HTML file create failed!’;
    }
    /**
     * 生成静态HTML的函数
     * @param    $filename:路径+文件名,$content:写入内容
     * @since     2009.08.03
     * @access   public
     */
    function toHtml($filename,$content)
    {
       $f=new fileClass();
       if (!file_exists($filename)) {
            $f->createFile($filename);
         }
     if($f->writeinFile($filename,$content)) { 
         return $filename;
     }
         return false;
    } // end func

    ?>

    基本原理就是这样了,大家可以根据需求自行修改。
    两种方法有个共同点,都是为了讨好搜索引擎,毋庸置疑良好的搜索引擎优化会给你的站点带来意想不到的收获。
    方法介绍到此,希望它们能对你有所帮助。

  • HTML5新特性

    HTML超文本标记语言至上个世纪末的HTML4.0以来一直没有进行后续开发,新近HTML5是其下一个重要版本,旨在提高HTML的交互性,同时支持当前多样的复杂的Web内容,解决HTML4在WEB应用上的一些缺陷。下面介绍HTML5的一些新特性:
    1,网页结构描述上的改进,HTML4如下:

    HTML5的新标签:

    2,表单处理的改进,假设有一个表单如下:

    在HTML4中验证表单需要结合JavaScript或者其他脚本语言:

    在HTML5则直接进行验证:

    3.为WEB开发者提供多类API接口,如播放音频或视频等可不借用第三方的播放器直接执行:
    <div>
    <video src ="media.ogg" autoplay="true" id="myVideo">Playing….</video>
    </div>

    4.用户可直接对网页内容进行编辑并实现同网页的交互,达到类似AJAX的效果。
    ……

    新版本的普及无论是对用户还是开发者带来了极大便利,既加快了程序员的开发效率也提升了用户体验,同时也有利于搜索引擎准确的抓取网页信息,HTML5仍处在开发中,目前还只有部分浏览器支持。

    PS: HTML=HyperText Mark-up Language,了解更多关于HTML…

  • 谷歌内部的搜索优化基础知识

    注:本文摘自中国站长站.
    一、使用独特的、准确的标题

    不管对于浏览者还是搜索引擎来说,标题对于一个网站是非常重要的。而标题在SEO里占有极其重要的地位。

    你应该尝试的:

    1、正确地描述网页内容

    2、为每一个网页指派不同的标题

    3、使用清晰的标题

    你应该避免的:

    1、标题与页面内容无关

    2、使用“未命名(untitled)”、“页1”等词语来命名网页。

    3、所有网页都用一个标题

    4、标题过长

    5、标题有与内容毫不相关的关键词

    二、更好地利用元标记

    元标记包括meta keywords,meta description等,是供给搜索引擎查看的标记内容。这里说的是description,也就是描述元标记。元标记描述是对当前网页的一个摘要描述。

    你可以在网页代码里看到meta description,有时搜索引擎会直接使用元标记描述作为搜索结果的描述,对于Wordpress而言,可以安装“Wordpress常用SEO插件”里的All in One SEO来方便使用和管理描述元标记。

    你应该尝试:

    1、正确地描述页面内容

    2、不同网页使用不同的描述

    你应该避免:

    1、描述内容与网页内容毫不相关

    2、过于简单的描述,比如:“这是一个网页”,“这是一个关于SEO的网页”,等等。

    3、只填充关键词

    4、描述过长

    5、整个网站都用同一个描述

    三、改进网站的URL结构

    一个友好的URL不但便于搜索引擎索引,对浏览者来说也是一个良好的体验,试对比下面2个URL,哪个看起来更舒服:

    1、www.chinaz.com/post/shanghai-kappa-girl.html

    2、www.chinaz.com/cat2/dur/folder1/1088413/x1/sxh/0025447.html

    显然第一个简单明了。

    你应该尝试:

    1、使用有意义的URL层次结构

    2、尽量简化URL

    3、一个页面只用一个URL(可以使用301转向)

    你应该避免:

    1、使用过长的URL

    2、使用无意义的网页名称,比如page1.html,123.asp……,你可能留意到,可能吧的文章网页名称就是无意义的数字,这是由于当初使用zblog的时候没有选择好URL结构,导致后来不能不继续“错”下去。

    3、使用太多的关键词,

    4、URL层次过多,比如www.chinaz.com/dir1/dir2/dir3/dir4/dir5/kenengba.html

    5、目录名与内容毫无相关性

    6、在一个网页里使用含www和不含www的同一网页

    7、使用大写字母URL

    四、让网站易于导航

    同样的,良好的导航对搜索引擎和浏览者来说都是友好的。

    你应该尝试的:

    1、使用垂直等级导航,比如:首页/搜索引擎/Google

    2、使用文本

    3、使用导航提示

    4、制作一个html网站地图(供浏览者查看)和xml网站地图(供搜索引擎查看)

    5、为每一层目录建立友好的页面(有内容或返回404错误),比如当你点击kenengba.com/post/,你会得到404错误提示。

    6、制作一个有用的404页面

    你应该避免:

    1、过于复杂的导航结构

    2、不相关的导航,比如将“firefox优秀扩展”放到搜索引擎目录下

    3、尽量少用下拉菜单导航

    4、网站地图上有死链

    5、404页面可以被搜索引擎抓取

    6、404页面只提供“你找的内容不存在”这样的信息,而没有网站相关内容的链接。

    五、提供高质量的内容和服务

    所谓内容为王,高质量的内容永远是一个网站一直生存下来的基石。抄袭永远不是长久之策。

    你应该尝试的:

    1、使用简单明了的文字

    2、围绕网站的主题生产内容

    3、同一对象使用多种不同的描述(因为搜索者可能使用不同的关键词)

    4、制造原创内容,而非一味抄袭!

    5、提供独家报道或独特的服务(说到底还是原创)

    6、为浏览者而写,而不是搜索引擎

    你应该避免:

    1、拼写错误。在此感谢所有在可能吧提醒我文章含有错别字的人。

    2、将文字制作成图片。当然,有时因为一些和谐原因还是有必要这样做的。

    3、网站内容繁多,没有固定的(一个或几个)主题。

    4、制造信息重复

    5、加入过多的非必要关键词

    6、使用错别字来进行恶意SEO

    7、恶意地提供不同的内容版本给用户和搜索引擎

    六、使用更好的锚文本

    锚文本就是链接里的文本,也就是代码里的锚文本。

    链接是互联网的关系链,锚文本则是这个关系链的关系描述。锚文本的重要性是不言而喻的。

    你应该尝试的:

    1、使用描述性的文字

    2、使用简明的文字

    3、让链接与其它文本区分起来

    4、不要忘记使用内部链接

    你应该避免:

    1、使用“这个网页”,“点击这里”等锚文本。

    2、使用与链接内容毫不相关的文字

    3、直接使用URL作为锚文本

    4、锚文本过长

    5、链接与周围的文本样式一致

    6、添加不相关的内部链接

    七、适当地使用标题标记

    标题标记(heading tags)就是

    ,这样的标记。

    根据协定,

    包围的是最重要的内容, 数字越大, 相对重要性越小

    网页上的内容显然是有不同等级的,因此使用不同的标题标记能方便搜索引擎索引以及用户扫描式浏览。

    正如可能吧之前在“用户阅读趋势”里说的,读者是以F型来阅读文章的,标题标记在这里就起着重要的作用。

    你应该尝试的:

    1、想象自己正在写文章的要点

    2、别使用太多

    你应该避免:

    1、错误地将无用的文字放在标题标记里面

    2、在应该用(粗体)或其它标记的时候却用标题标记

    3、不规则地使用标题大小

    4、使用太多标题标记

    5、整个网页内容嵌在标题标记里面

    6、只在样式里使用标题标记,而不是用在内容方面

    关于更好地写一篇吸引人的文章,你还可以参考“博客写作的艺术”。

    八、优化图片

    我们知道,Google图片搜索也能为网站带来有价值的流量,而不是像某些搜索引擎那样,只盗链图片。

    因此,图片优化也是有用的。

    你应该尝试:

    1、使用有意义的、简明的图片名称和alt描述,

    2、如果图片作为链接,给它加上alt描述

    3、将图片统一存放到一个目录

    4、使用常见的图片格式

    你应该避免:

    1、使用image1.jpg这样的命名方式

    2、文件名过长

    3、alt描述过长,这样可能会被认为是spam

    4、使用图片作为网站导航(在前面已经提到这一点)

    九、好好利用robots.txt

    robots.txt是一个搜索引擎协议,这个txt文件告诉搜索引擎什么内容不可以抓取。这也是淘宝和百度口水战的导火线。

    值得注意的是,robots.txt并非强制执行的,这只是一个协议,没有搜索引擎必须遵守这个协议,有传闻说百度可能不遵守robots.txt协议。

    你应该尝试:

    1、使用多种途径来保护敏感信息。正如前面所说, 有些搜索引擎不遵守robots协议。

    你应该避免:

    1、搜索结果页面被搜索引擎抓取

    2、相类似的页面被抓取

    3、代理URL被抓取(对于代理服务器网站)

    十、了解nofollow

    nofollow标记是一个重要的标记,存在于链接标记内部,比如:

    中国站长站

    这意味着,母页面的Page Rank不会被传递到这链接。

    对于博客来说,给留言区域加上nofollow是有必要的,能在一定程度上防止垃圾留言。

    对于一般网站而言,nofollow对于内部链接的PR传递也有作用,给那些“联系本公司”、“意见反馈”加上nofollow吧。

    十一、使用正确渠道来推广你的网站

    酒香有时会怕巷子深的,因此网站推广是有必要的。

    当然,前提是你提供高质量的内容或服务。

    一些推广途径包括:

    1、博客传播

    2、联署计划

    3、社会媒体

    4、广告

    5、内容相关网站

    但是,你最好不好做下面的事:

    1、发垃圾链接

    2、购买付费链接

    十二、总结

    终于大概翻译完,实际上大多数内容不是原文照翻的,只能算做理解后再解释。实际上这篇文章没有涉及太多的SEO措施,但对于一般的blogger,这些已经足够了,我们写博客不是为了赚钱。当然,如果你对SEO有兴趣,你可以在Google搜索更多的关于SEO的高级技巧,学习黑帽SEO的巧妙。