知識鯨豚出沒　搜尋引擎為何發動

記者／張凱耀

我們這一代的確見證了Google的崛起，Google所使用的革命性創新技術其實意味了另一個現象－人類世界裡普遍且持續的搜尋行為模式確立了。網路世界裡各類訊息浩瀚如海，搜尋引擎的發明像是功能不斷進化的漁船。從早期的Lycos到目前主宰網路搜尋功能的Google，在在強化了我們捕殺資訊的可能。當我們宣稱這個時代是一個資訊爆炸的時代時，資訊的氾濫也意味著資訊的廉價。於是電腦科學界並不再以捕捉到大量的資訊作為滿足，他們開始將漁網撒向「知識」。

於是我們必須從「資料－資訊－知識」談起。一般的知識管理書籍裡認為，零散的資料經過整理成為資訊，整理的過程即會對使用者產生特殊的價值。資訊再經過思考的驅動而成為知識。Google便是將資料轉化成資訊的箇中好手。只是近來搜尋引擎使用的邏輯丕變，無論是Yahoo！奇摩知識＋、百度知道或是Wikipedia，都強調知識的產生。在這個忽忽變動的當代，無論是歐陸哲學或是英美哲學，都開始將目光焦點移轉到「語言」。人類希求一個實質的答案，於是網路知識的發展必然得回過頭來重新處理語言。只是，當人類自己都不敢宣稱自己了解語言時，人類該如何讓電腦理解我們的自然語言呢？

無論如何Wolfram Alpha還是硬生生地出現了。它以「知識運算引擎」自居，顯然是要與Google做出區別。它有類於Wikipedia，都是在搜尋完成後給出固定答案，但不同的是Wolfram的輸出來自於內部的知識庫。經過之前的討論應該可以理解，當一個搜尋引擎要做到「資訊－知識」的進程，除了要有豐富的資料庫外，更重要的是它分析語言的邏輯方法。Wolfram最吸引我的地方便是在此，當我鍵入「washington」時，Wolfram先做出限定與區別：washington是個城市或是個人名。然後再進行分析。這讓我想到哲學家羅素提出「摩狀詞理論」的理由：語言具有含糊性。在處理語言時，Wolfram與羅素相仿，都先將語言指涉物清楚定向，再進行分析，獲得較為穩定的知識。

當我們清楚Wolfram的搜尋邏輯後，我們便可以開始探問其知識的來源。Gordon Graham在＜網路的哲學省思＞中提到，在網際網路上「找到」東西，和在百科全書中找到不一樣。因為百科全書是基於某種目的編寫而成，有確定的資料來源。然而像Wikipedia或Yahoo！奇摩知識＋這樣的知識聚合網站卻不然。資訊來源的可信度將是搜尋引擎在「資訊－知識」路程上重要的議題。Wolfram利用愚公移山的方法，利用自己的專家團隊，自己的知識資料庫，一一確定資料來源的適切性。但也由於這樣的謹慎，Wolfram只能回答相對客觀的問題。

我們幾乎可以確定Wolfram與語言分析的關係，雖然它尚無法分析較為複雜、主觀意志的語句，但是以科技作為服務人性的工具似乎是不可逆的趨勢潮流。教人沮喪的是，Wolfram運用的語意判斷系統是為英語系國家的使用者設計的。中文有中文的結構及語法，在設計出中文語意搜尋引擎之前，讓我們期待先出現一個中文的語言分析哲學家再說吧。

分享此新聞：