長沙網站優化公司

什麽是搜索引擎?一只蜘蛛的獨白

浏覽:/ 2019-07-02

 大家好我叫蜘蛛,我來自百度搜索引擎。我的英文名字是baiduspider,我是一個叫搜索引擎的帶到這個世界的。你知道什麽是搜索引擎嗎?你可以把它比作一個超級數據庫,這個數據庫內是很複雜的,我就不深入的給你解釋了,數據庫裏面的數據主要來源于互聯網上的各種網站,因爲網站数量太多了,多的连我也不知道是多少,这么多網站数据靠人工添加是不行的,工作量太大了。于是我就来到了这个世界,代替人工。u=2608772883,584885969&fm=26&gp=0.jpg

搜索引擎的工作原理是抓取—过滤—收录—排序。所以我会先抓取,没有规矩不成方圆,真人平台蜘蛛的世界也是有规则的,当我发现某一个網站时我会通过網站链接尝试进入这个網站<如果你是新網站,我临时发现不了你你可以直接提交给我哦》进入这个網站时会首先检查该網站的根域下是否有一个叫robots.txt的纯文本文件,哪些需要我看的  哪些是你的隐私不想我看的你一点在这里写好啊。其实我跟你们人类是一样的,同样掌握人喜欢和不喜欢的。如果網站打开的很慢或者直接打不开我是不喜欢的。进去后我会找我喜欢的东西,文字,图片和视频之类的。因为我不是人类所以我不能直接识别图片视频,iframe框架等。所以我希望你们能给这些东西添加一下说明。说实话我也很懒, 如果網站链接层次结构太长太深我也不喜欢太累了。我来过網站之后都是可以查询到的,你可以查看網站日志,还可以到百度搜索资源查询哦。
我抓取完了之后就要开始下个工作过滤了,你知道我会把哪些东西过滤扔掉吗?告诉你吧,内容差的  空白内容的  下拉才能看到的  有权限的整个網站都是锚点没有几个页面等等全部都会直接pass,剩下的我就会拿回去放到数据库中,<索引库.>   之后会在这个库中进行分类  归档  评分   排名了。timg - 2019-06-17T160229.445.jpg

閱讀"什麽是搜索引擎?一只蜘蛛的獨白"的人還閱讀

上一篇:SEO大神教你如何寫高質量軟文,看了你也懂的怎麽寫

下一篇:[百度優化技巧]百度SEO優化怎麽做?