亚洲一级a大片一级_一级无码性爱影片_最新国内熟女少妇视频_国产特级毛片A级视频

如何屏蔽搜索引擎蜘蛛對網(wǎng)站的抓取?

2022-03-29 19:14:46

要知道在seo優(yōu)化的過程當中,有時候是需要對搜索引擎蜘蛛進行屏蔽的,就是禁止對網(wǎng)站的某個地方進行抓取,那么我們應該如何屏蔽搜索引擎蜘蛛呢?下面我們一起來看一看具體的操作方法。網(wǎng)站建設網(wǎng)站設計網(wǎng)站制作★網(wǎng)頁設計-599元全包;企業(yè)網(wǎng)絡推廣☆網(wǎng)站優(yōu)化seo☆關(guān)鍵詞排名☆百度快照-2200元全年展示;做網(wǎng)站優(yōu)化排名-網(wǎng)站建設公司

  百度蜘蛛抓取我們的網(wǎng)站,希望我們的網(wǎng)頁能被包含在它的搜索引擎中。將來,當用戶搜索時,它會給我們帶來一定量的搜索引擎優(yōu)化流量。當然,我們不想讓搜索引擎抓取所有東西。

  因此,此時我們只希望能夠抓取搜索引擎搜索到的內(nèi)容。例如,用戶的隱私和背景信息不希望搜索引擎被捕獲和包含。解決這些問題有兩種最佳方法,如下所示:

  robots協(xié)議文件屏蔽百度蜘蛛抓取

  robots協(xié)議是放在網(wǎng)站根目錄下的協(xié)議文件,可以通過網(wǎng)址訪問,當百度蜘蛛抓取我們的網(wǎng)站時,它會先訪問這個文件。因為它告訴蜘蛛哪些能抓,哪些不能。

  robots協(xié)議文件的設置比較簡單,可以通過User-Agent、Disallow、Allow這三個參數(shù)進行設置。

  User-Agent:對不同搜索引擎的聲明;

  Disallow:不允許抓取的目錄或頁面;

  Allow:被允許抓取的目錄或頁面通??梢允÷曰虿粚?,因為如果你不寫任何不能抓取的東西,它就可以被抓取。

  下面我們來看一個示例,場景是我不希望百度抓取我網(wǎng)站所有的css文件,data目錄、seo-tag.html頁面

  User-Agent:BaidusppiderDisallow:/*.cssDisallow:/data/Disallow:/seo/seo-tag.html

  如上所述,user-agent聲明了蜘蛛的名稱,這意味著它針對的是百度蜘蛛。以下內(nèi)容無法獲?。uot;/*。css",首先/指的是根目錄,這是您的域名。*是代表任何內(nèi)容的通配符。這意味著無法抓取以.css結(jié)尾的所有文件。這是你自己的兩個經(jīng)歷。邏輯是一樣的。

  通過403狀態(tài)碼,限制內(nèi)容輸出,屏蔽蜘蛛抓取。

  403狀態(tài)代碼是http協(xié)議中的網(wǎng)頁返回狀態(tài)代碼。當搜索引擎遇到403狀態(tài)代碼時,它知道這些頁面受權(quán)限限制。我無法訪問它。例如,如果您需要登錄才能查看內(nèi)容,搜索引擎本身將無法登錄。如果您返回403,他也知道這是權(quán)限設置頁面,無法讀取內(nèi)容。當然,它不會被包括在內(nèi)。

  返回403狀態(tài)代碼時,應該有一個類似于404頁面的頁面。提示用戶或蜘蛛執(zhí)行他們想要訪問的內(nèi)容。兩者都是不可或缺的。您只有提示頁面,狀態(tài)代碼返回200,這是百度蜘蛛的大量重復頁面。有403個狀態(tài)代碼但返回不同的內(nèi)容。這也不是很友好。

  最后,對于機器人協(xié)議,我想補充一點:“現(xiàn)在,搜索引擎將通過網(wǎng)頁的布局和布局來識別網(wǎng)頁的用戶友好性。如果阻止css文件和js文件相關(guān)到布局,然后搜索引擎我不知道你的網(wǎng)頁布局是好是壞。因此不建議阻止這些內(nèi)容來自蜘蛛。

本站文章均為睿博網(wǎng)站建設摘自權(quán)威資料,書籍,或網(wǎng)絡原創(chuàng)文章,如有版權(quán)糾紛或者違規(guī)問題,請即刻聯(lián)系我們刪除,我們歡迎您分享,引用和轉(zhuǎn)載,我們謝絕直接復制和抄襲!感謝...
我們猜你喜歡