2個基本構架 搜索引擎的基本架構是什么?

作為一名優秀的SEOer , 應該了解搜索引擎的工作原理 , 比如基本的架構 。
今天 , 小小課堂SEO自學網帶來的是《搜索引擎的基本架構》 。 希望本次的SEO技術培訓對大家有所幫助 。
一、什么是搜索引擎的架構?搜索引擎架構可以當作軟件架構來理解 。
① 軟件架構
百度百科對于軟件架構的描述如下:

軟件架構 , 是指一系列相關的抽象模式 , 用于指導大型軟件系統各個方面的設計 。
② 搜索引擎架構
那么搜索引擎的架構 , 就是用于指導搜索引擎系統中重要的組件以及組件之間關系而設計的抽象模式 。
二、設計搜索引擎架構的目標是什么?SEOer應該知道為什么要設計搜索引擎架構 , 主要有以下兩點:
① 搜索效果
搜索引擎致力于優化用戶搜索體驗 , 當用戶搜索某個詞之后 , 可以給予用戶更多更精準的結果 。 這就是在質量層面上的目標 。
② 搜索效率
【2個基本構架 搜索引擎的基本架構是什么?】搜索引擎追求更快地展現出用戶查詢詞的搜索結果 , 也是為了提升用戶搜索體驗 , 試想如果我們搜索一個詞 , 搜索引擎一分鐘后才顯示出結果 , 這樣的搜索引擎在這個時代是要被淘汰的 。 這就是在速度層面上的目標 。
小結:因為用戶需要一個高效的搜索引擎系統 , 對搜索引擎有效果和效率的要求 , 所以 , 結構的目標也就是這兩點了 。
三、搜索引擎的基本架構是什么?對于SEOer而言 , 只需要在抽象模式上了解搜索引擎架構即可 , 也無需關注過多的數學公式與算法 。
搜索引擎基本架構主要有索引處理和查詢處理 。
① 索引處理
索引過程主要由以下幾個組件來完成:
1)文本采集組件
文本采集組件 , 主要用于發現、存儲和傳遞文檔 。
2)文本轉換組件
文本轉換組件 , 主要用于提取文檔中所有內容和元數據 , 同時將文本轉換為索引項 。
元數據可以理解為頁面的基本參數 , 如類型、結構、多少字等等 。
索引項 , 又可以稱之為特征 , 是對文檔內容的一部分 , 符合要求的文檔的索引會被存放在索引表中用于搜索 。
3)索引創建組件
索引創建組件 , 利用文本轉換組件輸出的文檔和索引項 , 創建索引表 , 從而實現快速搜索 。
索引的創建非常重要 , 尤其是針對互聯網的信息爆炸時代 , 對于新的文檔加入時 , 應高效完成索引創建 。 為了實現高效 , 一般都采用的倒排索引 。
② 查詢處理
查詢處理主要由以下幾個組件來完成:
1)用戶交互組件
用戶交互組件 , 提供了用戶查詢和搜索引擎展現搜索結果之間的接口 。
搜索引擎接收到用戶的查詢詞后 , 在索引庫中找到相關文檔 , 按照程序認為的最合理的索引排序結果展現給用戶 。
2)排序組件
排序組件 , 從用戶交互組件中獲得查詢詞 , 并且根據一定的模型給出一個得分從高到低排序的文檔 。
排序的高效依賴于搜索引擎檢索技術的高低 , 排序的質量取決于搜索引擎的檢索模式 。
3)評價組件
評價組件 , 主要用于評測和評價搜索引擎系統的效果和效率的目標 。
一來可以統計大量搜索日志來記錄和分析用戶行為 , 二來評價的結果用來調整和改善排序組件的性能 , 從而提升用戶的搜索體驗度 。

    推薦閱讀