第170頁
其實,三大板塊之外,還有一些無法界定範圍的基礎產品,譬如春秋安全管家、foxmail等。甚至,前面提過的種子神器,也可視為基礎產品。春秋安全管家為三大板塊提供基礎服務,並不限定於某業務,foxmail的定位類似google旗下的gmail,卻又負責把散亂的網路遊戲用戶群體凝聚成團。
話題回到搜尋引擎。
春秋安全瀏覽器、導航網站等產品,都是為了輔助春秋瞧一瞧搜尋引擎發展。
三大板塊之中,網路遊戲板塊提供資金,智慧宇宙板塊控制利用計算機智能生命金手指,搜尋引擎板塊則是魏東生渴盼發展的主事業。可惜,越是渴望勝利,前進途中越是充滿坎坷。
搜尋引擎,說簡單,非常簡單;說複雜,也非常複雜。
搜尋引擎的簡單,簡單到只要肯投資,哪家公司都能推出搜索業務;搜尋引擎的複雜,複雜到行業領袖google也無法做好。
簡單科普搜尋引擎,技術實現上,分為抓取、索引、排序等三步驟。
比喻形容的話,搜尋引擎就是一座超級龐大的圖書館。抓取網絡資源這一步驟,就是買書填充圖書館,買對的書,買好的書,買新的書,買應該買的書,藏書越多,這座圖書館越有價值。索引網絡這一步驟,就是圖書館內部如何管理,圖書該如何存放、編號、分類,以便最快速度找到想要的書籍。最後的步驟,排序,是關鍵的,也是最難的。
排序可視為圖書館管理員服務顧客。
某甲去圖書館借書,說出書籍的名字等特徵,管理員在圖書館裡找到該書,窗口遞給某甲。走完流程,即是搜尋引擎完成一次搜索行為。網民對搜尋引擎的印象,在搜索框鍵入關鍵詞,篩選列表想要的找到答案,性質類似於去圖書館借一本書。
所以說,百度掌門人李彥宏大學期間的圖書情報學專業,與搜尋引擎事業其實非常對口。
搜尋引擎的問題,在於借書者對想要的書籍的描述通常比較模糊,而搜尋引擎又非真正的人類。搜尋引擎不是活生生的圖書館管理員,無法理解人類的自然語言,無法準確識別關鍵詞的性質,導致服務難度瞬間上升到不可控地步。
譬如,某乙想借一本書,卻遺憾忘記了全名,只記得書名里有“未來”兩字,作者名字里有“春”字。搜尋引擎卻不懂某乙的想法,不明白“未來”限定在書名的一部分,也不明白“春”字限定在作者名字的一部分,傻笨解析關鍵詞“未來”和關鍵詞“春”。搜尋引擎通過複雜的工程解析,找到“未來”和“春”的可能關係,返回答案:春原未來。
這就比較荒唐了。
我想要的是小說,搜尋引擎給出的優選答案卻是人名。
摔!
我這次是來找小說的,不要老給我推薦日本愛情動作片啊。
搜尋引擎技術難點就在這裡。
完美的搜尋引擎,它應該像圖書館管理員一樣理解某乙的自然語言、理解某乙的真正需求。
也是因此,搜尋引擎被譽為距離人工智慧最近的領域。
換句話說,唯有理解人類自然語言的人工智慧,才能完美履行搜尋引擎功能。
當然,這裡的人工智慧,是地球普遍定義的人工智慧。陰影敵國定義的計算機智能生命,和地球人類常說的人工智慧,完全是風馬牛不相及的是兩件事。前面以比喻手法把相對安全的相對和平的計算機智能生命演化史分為五個階段,依次是藻類、裸蕨植物、蕨類植物、裸子植物、被子植物。植物型計算機智能生命最少演化到裸蕨階段中後期,才能滿足地球人類定義的人工智慧概念。
第106章 大公關部
一款搜尋引擎好不好,第一是該圖書館有沒有自己想要的圖書,第二是圖書館管理員能否自億萬本圖書快速中找到自己想要的圖書。前者技術難度較低,只要有意願,只要捨得投資,各家的搜尋引擎都能抓取網際網路資源;真正考究技術底蘊的是後者,google就是比借竅重生的3721強。
然而,就像高考成績分數,一本和三本之間的差距一目了然,可710分和720分呢?於絕大多數學生來說,滿分750分的試卷,能考710分的和能考720分的全都是學霸,一次考試的分數高分數低並不能證明誰強誰弱。
網民的感覺,通常比較遲鈍。
某家搜尋引擎偏重某領域,另一家搜尋引擎忽視某領域,這樣的專業搜索才能感覺到明顯的不同。主流網民搜索常用關鍵詞,譬如搜索框裡鍵入“重走未來路”關鍵詞,百度、360、bing、搜狗等都能在首頁找到連結,很難感覺到技術層面的落差。
明白了搜尋引擎技術層面的局限,就該明白除非魏東生祭出跨越時代的“人工智慧”黑科技,否則很難從技術層面擊敗搜尋引擎領域的競爭者。而祭出人工智慧的風險與所得收益根本不成比例,絕不是魏東生該採用的商業模式。
回顧2004年初的華國搜尋引擎行業除了春秋瞧一瞧,還有四名重量級選手:已改名為中搜的慧聰搜索、3721借竅重生的雅虎系搜索、國際大鱷google、華國未來王者百度。
中搜的技術底蘊非常薄弱,更看不清搜尋引擎方向,此刻卻自鳴得意宣稱自己是華國第一搜索,對雅虎、百度、春秋三家指手畫腳。魏東生眼裡,中搜是無根之萍,待其自敗即可;政治因素是google的死穴,無論google搶占多少市場,未來都得乖乖吐出來,亦可不予理會。