目錄
Toggle搜尋引擎透過爬蟲機器人(spiders)爬取網頁來工作,這些網路爬蟲會隨著頁面間的連結去找尋新內容而增加到搜尋索引裡,所以當你使用搜尋引擎時,相關的結果則會從索引中被索取出來,並使用演算法進行排名,呈現在你的畫面。
1-1 搜尋引擎基礎概念
在我們探討技術方面問題之前,首先,讓我們先確保我們了解搜尋引擎究竟是什麼,他們為什麼存在,以及為什麼這些很重要。
什麼是搜尋引擎?
搜尋引擎是找到與用戶搜尋匹配的網站內容並對其進行排名的工具。
每個搜尋引擎由兩個主要部分組成:
- 搜尋索引:一個存有網頁資訊的數字圖書館
- 搜尋演算法:對來自搜尋索引的匹配結果進行排名的電腦程式
現今受歡迎的搜尋引擎有Google、Bing 和 DuckDuckGo。
搜尋引擎的在做什麼?
每個搜尋引擎的目標為為用戶提供最佳、最相關的結果。理論上,這是他們獲得或保持市場佔有率的方式。
搜尋引擎靠什麼賺錢?
搜尋引擎有兩種類型的搜尋結果:
- 自然結果/有機結果(Organic results):來自搜尋索引,你不能付錢得到此搜尋結果。
- 付費結果(Paid results):來自廣告商,你可以付費得到此搜尋結果。
每次有人點擊一個付費搜尋結果時,廣告商就需要向搜尋引擎付一次費用,這就是我們常聽到的付費點擊廣告(PPC)。
這就是為什麼市佔率很重要,更多的用戶意味著為搜尋引擎帶來更多的廣告點擊、更多的收入。
1-2 搜尋引擎如何建立索引
大多數著名的搜尋引擎,如Google 和 Bing的搜尋索引有上兆的頁面。因此,在我們討論排名演算法之前,讓我們先深入研究用於建立和維護網路索引的機制。
以下為由 Google 提供的基礎作業程序:
讓我們一步步地拆開理解:
- 網址 URLs
- 爬取 Crawling
- 處理和轉譯 Processing & rendering
- 索引 Indexing
備註:以下的過程專門適用於 Google,但它可能與 Bing 等其他搜尋引擎非常相似。但是其他類型的搜尋引擎,例如 Amazon、YouTube 和 Wikipedia,它們僅顯示來自其自己網站的結果。
Step 1. 網址 URLs
一切都從一個已知的網址(URLs)列表開始,Google透過各種路徑去發現網址,但三個最常見的路徑是:
反向連結 Backlinks
Google已經有一個包含上兆個網頁的索引,如果有人從這些網頁之一添加到您的某個網頁的鏈接,他們可以從那裡找到它。
網站地圖 Sitemap
Sitemap會列出了您網站上的所有重要頁面,如果您將Sitemap提交給 Google,會幫助Google更快地發現您的網站。
網址提交 URL submissions
在Google Search Console裡,也允許提交獨立網址。
Step 2. 檢索 Crawling
檢索(又稱爬取)是一種稱蜘蛛/爬蟲的網路機器人(例如Googlebot)去你的網站爬取並下載發現的頁面資料的地方。
需要注意的是,Google並不為了發現更多頁面而去檢索頁面。
Google會根據以下幾個因素,對網址排列優先順序去檢索:
- URL 的 網頁排名PageRank
- URL 多久更改一次
- 是不是新的
這很重要,因為這意味著,比起別人的網頁,搜尋引擎可能會爬取您的某些頁面並將其編入索引。但如果您的網站很大,搜尋引擎可能需要更多時間才能完全地爬取到。
Step 3. 頁面處理 Processing
頁面處理是Google從抓取的頁面中理解和提取關鍵字詞。除了Google之外,沒有人知道這個頁面處理過程的細節,但我們理解到很重要部分是他會提取連結且儲存索引內容。
Google必須先轉譯頁面後才能完全地處理,意思是Google跑頁面程式碼(code)以了解對使用者而言,頁面看起來如何。
Step 4. 索引 Indexing
索引是將從爬取過頁面中已處理資訊添加到搜尋索引這個大型數據庫中-存放上兆個網頁,呈現在Google的搜尋結果裡。
這是很重要的一點。當您在搜尋引擎中輸入任何關鍵字查詢,您並不是直接在網路上搜索匹配結果,而是您在搜索搜尋引擎索引中的網頁。任何不在不在搜尋索引中的網頁,使用者在那個搜尋引擎中就完全找不到。這就是讓您的網站被Google或Bing 等大型搜尋引擎中編入索引的重要原因。
1-3 搜尋引擎如何對頁面進行排名
發現、爬取和索引內容僅僅是第一步,搜尋引擎還需要一種機制去對匹配結果進行排名——搜尋引擎演算法。
每個搜尋引擎都有自己獨特的網頁排名演算法,但由於 Google 是迄今為止最廣泛被使用的搜尋引擎(至少在西方世界是這樣),因此我們將在本指南接下來的重點關注在Google搜尋引擎。
眾所周知,Google擁有 200 多個排名因素,沒有人知道完整的所有這些排名因素是什麼,但我們知道幾項關鍵因素。讓我們討論一下其中六項:
- 反向連結 Backlinks
- 相關性 Relevance
- 新鮮度 Freshness
- 主題權威 Topical authority
- 頁面速度 Page speed
- 手機友善度 Mobile-friendliness
01)反向連結 Backlinks
反向連結是Google最重要的排名因素之一。
Google搜索質量高級策略師 Andrey Lipattsev 在 2016 年一場現場網路研討會上證實了這一點。當被問及兩個最重要的排名因素時,他的回答很簡單:內容和連結。
我可以絕對地告訴你前兩個網頁排名因素是什麼——它是內容和指向您網站的連結。
自 1997 年 Google 推出 PageRank 以來,連結一直是 Google 的重要排名因素之一,判斷網頁價值的公式是網頁的質量和指向它的反向連結數量。
當我們分析超過 10 億個頁面時,我們發現連結到一個頁面的網站數量與其從 Google 獲得的自然流量之間存在明顯的相關性。
然而,這並不完全只跟數量有關,因為並非所有的反向連結都是同等的價值。具有少量高質量反向連結的頁面排名完全有可能超過具有大量低質量反向連結的頁面。
一個好的反向連結有六個關鍵屬性:
讓我們更仔細地分析看可以說是最重要的兩個關鍵屬性:權重和相關性。
連結權重 Link authority
來自權重頁面和網站的反向連結通常對排名影響最大。
你如何定義權重?在 SEO 的背景下,權重頁面和網站是那些具有許多反向連結或“票數”的頁面。
連結相關性 Link relevance
來自相關網站和網頁的連結通常是最有價值的。
在Google搜尋的運作方式的頁面上,談論到網頁排名跟其內文相關性高低有關。
如果其他相關主題的著名網站連結到該頁面,則表明該頁面的資訊是高質量的。
如果您想知道為什麼相關性很重要,可以想一下現實世界中的事物是如何運作的?在尋找最好的意大利餐廳時,您可能會相信廚師朋友的建議,而不是獸醫朋友的建議。但是,如果您正在尋找貓糧推薦,那就相反了。
02)相關性 Relevance
Google 有多種決定頁面相關性的方法。
在最基本的層面上,Google 尋找有著和搜尋字詞相同的關鍵字的頁面。
但相關性遠比不上關鍵字比對。
Google 還使用交互式數據來評估搜尋結果是否與查詢的字詞相關。換句話說,搜索者認為該頁面有幫助嗎?
這就是為什麼“apple”的所有前幾搜尋結果都與科技公司有關,而不是水果的部分原因。Google從交互式數據中得知,大多數搜尋者正在尋找有關前者的資訊,而不是後者。
不過,交互數據並非是Google做的唯一方式。
Google投資了許多技術來幫助理解人、地點和事物等實體之間的關係。Google知識圖譜(Knowledge Graph)就是這些技術中的一種,它本質上是一個龐大的實體知識庫以及它們之間的關係。
例如:apple(水果)和Apple(科技公司)都是知識圖譜中的實體。
Google 利用實體之間的關係來更好地了解頁面相關性。若是匹配結果是談論橙子和香蕉的,顯然是關於水果apple;但談論 iPhone、iPad 和 iOS 的,顯然是關於科技公司Apple。
Google搜尋結果可以超越只是單純的關鍵字比對,這樣的成效部分可歸功於知識圖譜。
有時,您甚至可能會看到搜尋結果里並似乎沒有提及查詢中重要的關鍵字,例如,看“apple paper app”的第二個搜尋結果,它的頁面上的任何地方都沒有提到“apple”這個詞。
Google一定程度地可以判對這是一個相關的結果,因為提到了知識圖譜中的iPhone 和 iPad 等實體,這些實體無疑與 Apple 密切相關。
備註:交互數據和知識圖譜並不是Google用來了解頁面與查詢字詞相關性的唯一技術。大部分作業是使用了解查詢本身背後的含義和意圖技術來完成,例如 BERT 和 RankBrain。Google有時甚至會在後台重寫查詢字詞以提供更相關的搜尋結果。
03)新鮮度 Freshness
新鮮度是一個依賴於查詢字詞的排名因素,這意味著它對某些結果比其他結果更重要。
對於“amazon prime 上有什麼新鮮事”這樣的查詢,新鮮度很重要,因為搜尋者想知道最近添加的電影和電視節目。這就是為什麼 Google 可能將新發布或近期更新的搜索結果,排在更高的位置。
對於像“最好的耳機”這樣的查詢,新鮮度很重要,但不是最重要。耳機技術發展很快,因此若為搜尋結果是2015年的文章不會有太大用處,但 2-3 個月前發布的推薦文章就仍然有用。
Google知道這一點,並呈現過去幾個月更新或發布的搜尋結果給搜尋者。
有些查詢結果的新鮮度就沒那麼重要,例如“如何打平結”。幾十年來,這種打平結的方式沒有任何改變,所以無論搜尋結果是昨天還是 1998 年都沒有關係。Google知道這一點,所以並不會對多年前發布的文章排名有所疑慮。
04)主題權威 Topical authority
Google希望對具有該主題權威的網站的內容進行排名。這意味著 Google 可能會將某個網站視為有關某個主題而非別的不相關主題的良好查詢結果來源。
Google在他們的一項專利中談到了這一點:
搜尋系統是否認為某網站具有權威性通常取決於查詢字詞。[…]搜尋系統可以將疾病控制中心的網站“cdc.gov”視為查詢“CDC 蚊子停止叮咬”的權威網站,但可能不會將同一網站視查詢“餐廳推薦”的權威網站。
儘管這只是 Google 申請的眾多專利之一,但我們看到證據表明“主題權威”在許多查詢的搜索結果中很重要。
我們來看一下“真空低溫真空封口機”的結果。
在這裡,我們看到了兩個關於真空低溫烹調法的小利基網站(niche sites),其排名超過了《紐約時報》。
儘管這裡無疑還有其他因素在起作用,但“主題權威”似乎是造成這些網站排名高的原因之一。
這可能就是為什麼Google 的搜尋引擎最佳化 (SEO) 入門指南告訴網站所有者:
在特定領域培養專業知識和值得信賴的聲譽。
05)頁面速度 Page speed
沒有人喜歡花時間等待頁面加載,Google知道這一點。這就是為什麼他們將頁面速度作為 2010 年桌面裝置搜尋和 2018 年行動裝置搜尋的排名因素。
許多人對頁面速度感到憂心,因此值得注意的是,您的頁面不需要閃電般快速已得到排名。Google表示,頁面速度只是“為用戶提供最慢體驗”的頁面問題。
換句話說,將一個已經很快的網站縮短幾毫秒不太可能再提高排名。它只需要足夠快,不會對用戶產生負面影響就好。
您可以在 PageSpeed Insights 中檢查任何網頁的速度,它還會給如何使頁面更快的建議。
PageSpeed Insights 還會顯示您的頁面關於網站體驗核心指標(Core Web Vitals)的表現。
「網站體驗核心指標」是由三個衡量網頁加載性能、交互性和視覺穩定性的指標組成。Google已確認,自 2021 年 6 月,「網站體驗核心指標」將成為排名指標。
您可以在 Google Search Console 中的網站體驗核心指標報告查看您網站上所有頁面的表現。
如果許多網址表現不佳或需要改進,請與開發人員聯繫。
06)行動裝置友善Mobile-friendliness
65% 的 Google 搜尋動作是在行動裝置上。這就是為什麼行動裝置友善是,自 2015 年以來影響行動裝置的一個因素。
從2019年起,由於Google的行動裝置索引優先,行動裝置友善也是桌面裝置搜尋的排名因素之一。這意味著Google優先索引和排名行動裝置版本的內容,並應用到所有裝置上。
換句話說,缺乏行動裝置友善會影響排名——所有裝置上的排名。
您可以使用 Google 的行動裝置相容性測試工作或在 Google Search Console 的「行動裝置可用性報告」中檢查任何你網頁的行動裝置友善度。
1-4 搜尋引擎如何呈現不同的個人搜尋結果
搜尋引擎明白不同的結果會吸引不同的人。這就是他們為每個用戶客製化搜尋結果的原因。
如果您曾經在多個裝置或瀏覽器上搜尋過相同的內容,那麼您可能已經看過這種客製化的效果,搜尋結果通常會根據各種因素顯示在不同的位置。
搜尋引擎如何客製化搜尋結果?
Google表示:「諸如您的位置、過去的搜尋歷史和搜尋設定等資訊都有助於(我們)根據當時對您最有用和最相關的內容來客製化您的搜尋結果。」
讓我們仔細看看這三件事:
1)地點 Location
如果您搜尋 “意大利餐廳”之類的內容,則地圖包中的所有結果將都會是當地義大利餐廳。
Google這樣做是因為你不太可能為了吃個午飯,飛了半個地球。
除了Google map的客製化搜尋結果,但 Google 也會利用您的位置來給你其他客製化的搜尋結果。如果我們往下滑搜尋“意大利餐廳”,甚至 TripAdvisor 的結果也是我們要找的當地義大利餐廳,我們會看到許多排名靠前的結果都是來自當地餐廳的網站。
對於“買房子”這樣的查詢,情況也類似。 Google 會給你當地的房子清單而不是其他國家的房子清單頁面,因為您可能不想搬遷到其他國家居住。
您的位置對本地查詢結果的影響如此之大,以至於在從兩個不同位置搜尋相同東西,而出現幾乎沒有重疊的內容。
2)語言 Language
Google 知道向西班牙用戶顯示英文搜尋結果毫無意義。
然而,Google在某種程度上依賴網站擁有者來做到這一點。如果您有多種語言的頁面,除非您告訴Google,否則他們可能不會意識到這種情況。
您可以使用名為 hreflang 的 HTML 屬性執行此操作。
Hreflang 有點複雜,遠遠超出了本指南的範圍,但基本上它是一小段程式碼,表示同一頁面的不同語言版本之間的關係。
3)搜尋歷史 Search history
Google有時使用搜尋歷史紀錄來客製化結果的最明顯例子是,當您下次執行相同的搜尋時,Google將先前點擊過的結果“排名”在更高的位置。
這件事並不會總是發生,但它似乎很常見——特別是如果你在短時間內多次點擊或造訪那一頁。
讓我們總結一下
了解搜尋引擎的運作原理是在 Google 中排名更高並獲得更多流量的第一步,如果搜尋引擎無法找到、爬取和索引您的頁面,那麼在您開始想做網頁關鍵字排名之前,您就已經先被淘汰了。
作者:Joshua Hardwick
文章來源:Ahrefs