通常是通過(guò)簡(jiǎn)單地填寫在線表格就能把你的網(wǎng)站信息提交給(搜索引擎)。例如,在Yahoo網(wǎng)站上,你可以在 www.yahoo.com/docs/info/include.htm1上找到提交信息。由于人工干預(yù)對(duì)處理、驗(yàn)證和評(píng)價(jià)提交請(qǐng)求是必要的,所以在網(wǎng)站在基于目錄的搜索服務(wù)中捕捉到一處之前,可 望有些延遲。
另一方面,搜索引擎完全實(shí)現(xiàn)了編撰過(guò)程的自動(dòng)化,徹底消除了人工干預(yù)。
一個(gè)叫做蜘蛛或爬蟲的軟件機(jī)器人自動(dòng)地在整個(gè)Web上取出站點(diǎn),閱讀頁(yè)面和跟隨相關(guān)的鏈接。通過(guò)設(shè)計(jì),蜘蛛可以周期性地返回到站點(diǎn),檢查新的頁(yè)面和修改已有頁(yè)面。
蜘蛛爬行得到的結(jié)果記錄在搜索引擎的索引或目錄中。已知了因特網(wǎng)上可資利用的信息的價(jià)值,對(duì)索引擴(kuò)張到非常大的規(guī)模是不會(huì)感到驚訝的。例如,AltaVista的索引最近已增至3.5億頁(yè)而名列前茅。這個(gè)數(shù)字看來(lái)好像非常大,但總體估計(jì)它僅代表了Web上不足35%的頁(yè)面。
由于已編索引的信息的深度與廣度(非常大),所以通常在“蜘蛛爬行過(guò)”站點(diǎn)的時(shí)間與出現(xiàn)在搜索索引中的時(shí)間之間有一個(gè)延遲,有時(shí)多達(dá)幾周。只有這兩步的過(guò)程完成之后,站點(diǎn)才能供搜索查詢使用。
最后,每個(gè)搜索引擎的心臟是一種算法,它將關(guān)鍵字查詢與索引中的信息匹配起來(lái),并按算法認(rèn)為最有關(guān)聯(lián)的順序把結(jié)果列出。
由于每種搜索引擎的蜘蛛、產(chǎn)生的索引和搜索算法都是不一樣的,所以在不同搜索引擎上的搜索結(jié)果和排列次序是不同的。這就解釋了為什么當(dāng)相同的關(guān)鍵字搜索準(zhǔn)則輸入進(jìn)去時(shí),HotBot中排在最前面的10個(gè)站點(diǎn)不會(huì)出現(xiàn)在 AltaVista中最前面的站點(diǎn)中。
此外,很多(但不是所有的)搜索實(shí)用程序也引用元標(biāo)記(文檔中用來(lái)描述其內(nèi)容的、看不見的HTML標(biāo)記),作為控制內(nèi)容如何編索引的方法。因此,在整個(gè)站點(diǎn)中正確使用元標(biāo)記也能提高(此站點(diǎn))在搜索引擎中的排列名次。
另一方面,搜索引擎完全實(shí)現(xiàn)了編撰過(guò)程的自動(dòng)化,徹底消除了人工干預(yù)。
一個(gè)叫做蜘蛛或爬蟲的軟件機(jī)器人自動(dòng)地在整個(gè)Web上取出站點(diǎn),閱讀頁(yè)面和跟隨相關(guān)的鏈接。通過(guò)設(shè)計(jì),蜘蛛可以周期性地返回到站點(diǎn),檢查新的頁(yè)面和修改已有頁(yè)面。
蜘蛛爬行得到的結(jié)果記錄在搜索引擎的索引或目錄中。已知了因特網(wǎng)上可資利用的信息的價(jià)值,對(duì)索引擴(kuò)張到非常大的規(guī)模是不會(huì)感到驚訝的。例如,AltaVista的索引最近已增至3.5億頁(yè)而名列前茅。這個(gè)數(shù)字看來(lái)好像非常大,但總體估計(jì)它僅代表了Web上不足35%的頁(yè)面。
由于已編索引的信息的深度與廣度(非常大),所以通常在“蜘蛛爬行過(guò)”站點(diǎn)的時(shí)間與出現(xiàn)在搜索索引中的時(shí)間之間有一個(gè)延遲,有時(shí)多達(dá)幾周。只有這兩步的過(guò)程完成之后,站點(diǎn)才能供搜索查詢使用。
最后,每個(gè)搜索引擎的心臟是一種算法,它將關(guān)鍵字查詢與索引中的信息匹配起來(lái),并按算法認(rèn)為最有關(guān)聯(lián)的順序把結(jié)果列出。
由于每種搜索引擎的蜘蛛、產(chǎn)生的索引和搜索算法都是不一樣的,所以在不同搜索引擎上的搜索結(jié)果和排列次序是不同的。這就解釋了為什么當(dāng)相同的關(guān)鍵字搜索準(zhǔn)則輸入進(jìn)去時(shí),HotBot中排在最前面的10個(gè)站點(diǎn)不會(huì)出現(xiàn)在 AltaVista中最前面的站點(diǎn)中。
此外,很多(但不是所有的)搜索實(shí)用程序也引用元標(biāo)記(文檔中用來(lái)描述其內(nèi)容的、看不見的HTML標(biāo)記),作為控制內(nèi)容如何編索引的方法。因此,在整個(gè)站點(diǎn)中正確使用元標(biāo)記也能提高(此站點(diǎn))在搜索引擎中的排列名次。