知識鯨豚出沒 搜尋引擎為何發動

記者/張凱耀


我們這一代的確見證了Google的崛起,Google所使用的革命性創新技術其實意味了另一個現象-人類世界裡普遍且持續的搜尋行為模式確立了。網路世界裡各類訊息浩瀚如海,搜尋引擎的發明像是功能不斷進化的漁船。從早期的Lycos到目前主宰網路搜尋功能的Google,在在強化了我們捕殺資訊的可能。當我們宣稱這個時代是一個資訊爆炸的時代時,資訊的氾濫也意味著資訊的廉價。於是電腦科學界並不再以捕捉到大量的資訊作為滿足,他們開始將漁網撒向「知識」。


於是我們必須從「資料-資訊-知識」談起。一般的知識管理書籍裡認為,零散的資料經過整理成為資訊,整理的過程即會對使用者產生特殊的價值。資訊再經過思考的驅動而成為知識。Google便是將資料轉化成資訊的箇中好手。只是近來搜尋引擎使用的邏輯丕變,無論是Yahoo!奇摩知識+百度知道或是Wikipedia,都強調知識的產生。在這個忽忽變動的當代,無論是歐陸哲學或是英美哲學,都開始將目光焦點移轉到「語言」。人類希求一個實質的答案,於是網路知識的發展必然得回過頭來重新處理語言。只是,當人類自己都不敢宣稱自己了解語言時,人類該如何讓電腦理解我們的自然語言呢?


無論如何Wolfram Alpha還是硬生生地出現了。它以「知識運算引擎」自居,顯然是要與Google做出區別。它有類於Wikipedia,都是在搜尋完成後給出固定答案,但不同的是Wolfram的輸出來自於內部的知識庫。經過之前的討論應該可以理解,當一個搜尋引擎要做到「資訊-知識」的進程,除了要有豐富的資料庫外,更重要的是它分析語言的邏輯方法。Wolfram最吸引我的地方便是在此,當我鍵入「washington」時,Wolfram先做出限定與區別:washington是個城市或是個人名。然後再進行分析。這讓我想到哲學家羅素提出「摩狀詞理論」的理由:語言具有含糊性。在處理語言時,Wolfram與羅素相仿,都先將語言指涉物清楚定向,再進行分析,獲得較為穩定的知識。


當我們清楚Wolfram的搜尋邏輯後,我們便可以開始探問其知識的來源。Gordon Graham在<網路的哲學省思>中提到,在網際網路上「找到」東西,和在百科全書中找到不一樣。因為百科全書是基於某種目的編寫而成,有確定的資料來源。然而像Wikipedia或Yahoo!奇摩知識+這樣的知識聚合網站卻不然。資訊來源的可信度將是搜尋引擎在「資訊-知識」路程上重要的議題。Wolfram利用愚公移山的方法,利用自己的專家團隊,自己的知識資料庫,一一確定資料來源的適切性。但也由於這樣的謹慎,Wolfram只能回答相對客觀的問題。


我們幾乎可以確定Wolfram與語言分析的關係,雖然它尚無法分析較為複雜、主觀意志的語句,但是以科技作為服務人性的工具似乎是不可逆的趨勢潮流。教人沮喪的是,Wolfram運用的語意判斷系統是為英語系國家的使用者設計的。中文有中文的結構及語法,在設計出中文語意搜尋引擎之前,讓我們期待先出現一個中文的語言分析哲學家再說吧。

分享此新聞: