艾倫人工智能研究所首席執行官Oren Etzioni 圖片來源:Brett Hartman
使用谷歌學術搜索引擎、PubMed醫學文獻搜索引擎時,科學家可能已經覺察到,日益增長的科學文獻資源讓文獻檢索變得越來越煩瑣。11月2日,位於美國華盛頓州西雅圖市的非營利機構艾倫人工智能研究所(AI2)揭開了一個新搜索引擎的面紗,它可以向用戶提供別具一格的服務:理解論文的內容。
“我們在嘗試更深入地瀏覽文件,同時使瀏覽速度更快、內容更簡潔、有用。”AI2首席執行官Oren Etzioni說。
這項免費產品的名字是Semantic Scholar(意為語義學者),目前僅限於搜索計算機科學領域的300萬條開放獲取文獻。但AI2團隊計劃一年內把搜索內容擴展到多個學科領域,Etzioni說。他的團隊得到了充沛的資金支持,AI2由微軟共同創始人保羅·艾倫成立並予以資助,從2013年起至今,艾倫已經向該所提供了超過2000萬美元的資助。
目前,全球免費學術搜索引擎寥寥無幾。而谷歌學術是其中最大的搜索引擎,據推測它包含了1億條甚至更多的學術文獻資料,但是該系統仍存在問題。“從任何人的衡量標准來看,大量文獻並非都是學術文獻。”夏威夷大學信息學家Pter Jacs說。
而語義學者則提供了一些創新性特征,包括從文本中挑選出最重要的關鍵詞和短語,而且不需要依賴作者或出版商鍵入這些關鍵詞。“對於智能系統來說,做到這一點非常困難。”Etzioni說。該引擎利用類似的“機器閱讀”技術決定哪些文章概述了哪個話題。
該系統還可以辨別一篇文章引用的哪個參考資料確實具有重要參考價值,而不僅僅只是作為背景或進行對比來引用。“這是一個非常棒的特征。”西班牙馬德裡一家名叫“專家系統”的軟件公司的搜索引擎專家Jose Manuel Gomez-Perez說。此外,語義學者還可以從文章中提取數據並呈現在搜索結果中。(魯捷)