分享

你所不知道(與沒想過)的酷比Scupio (Mr. 6)

 黑传说 2007-03-19

by Mr. 6 on March 15th, 2007,

大家對酷比(Scupio)的印象大約都是「它和Google做同樣東西──搜尋引擎」。知道的比較深一點的,就會說他們是做「以文找文」,是「全球唯一沒有字數限制的中文搜尋網站」,以此來區隔與Google的差異,而每當與這樣的人聊到酷比,他們往往還要加一句話:「唉,技術強的,不見得可以賺很多錢。」

這句話充滿了尊敬,也充滿了遺憾,而同樣的遺憾同時發生在各大專院校中,教授們常寫出登在國際期刊的重要研究成果,工研院資策會等半官方機構不斷的想辦法把各大學資訊或資工系教授的發展成果給商業化,但無論是技術移轉或什麼名堂的都少有成功的大型國際級軟體公司因而被創出來。除了「技術強的,不見得可以賺錢」這句話以外,我還聽過「點子好的,不見得可以賺錢」、「有被投資的,不見得可以賺錢」,我就想,這些稱讚語難道永遠都要用一個「不見得可以賺錢」來結尾嗎?我們難道想不出一句話,「絕對可以賺錢」嗎?

有的,那就是「強大技術,加上創新點子」。強大技術 + 創新點子若相加得當,真的會是蠻有機會賺錢的一個方式。為什麼?

昨晚演講時,學員提出一個好問題:「目前在台灣作軟體的,有任何機會在只靠一張BP、沒有產品的情況下,就拿到創投資金嗎?」

我原本很快的就想說「No」,但突然想到,一位傑出矽谷朋友在台灣創立的阿瑪科技(Armorize Technologies)是以一張榮獲WWW大獎的傑出論文,在還沒有產品的情況下就取得了資金。台灣有許多資訊系教授的論文有得獎、有上國際期刊,如果能把他們的「強大技術」,加上你的「創意點子」,使用得當便容易取得資金,而且事實上也因為技術的深度,而讓這點子和其他純創意點子瞬間有了不同的高度,容易成功!

事實上,酷比的技術還真不是普通的強路透社Reuter提供一個叫做21578 Text Categorization Test Collection的測試資料,專門給全球做字義分類(text categorization)的研究團隊來計算他們設計的引擎的準確度,據酷比官方表示,目前全世界最高的就只有92%準確度,酷比背後的引擎卻能達到94.46%。此外,攤開2001年到2005年參加的各種比賽所獲佳績,酷比真的可以「叫我全球第一名」!

攤開酷比的技術看看,可發現它的重點確實與其他搜尋引擎不同,如果你很急的要搜一件事情,那全世界沒人打得過閃電般的Google,但如果你是搜第二次、搜第三次,天天都要搜同一件事情呢?酷比抓準了一個關鍵點──一般人搜尋往往只用到不到五個字的keyword,但往往的情況是,每個人使用同樣的五個字時,他們心理想的東西其實不太一樣。比如我搜尋「姚明、NBA」或許是想找姚明的生平,我加上「NBA」只是因為我怕找到其他同名同姓的人;但另一人搜尋同樣的「姚明、NBA」或許是想找姚明在NBA的相關商品。我們兩人都懂得在關鍵字選擇上面儘量不設限,以免不小心篩掉一些同義字,等Google結果一出再再用自己的眼睛去篩選這篇符合、那篇不符,但我們常常都忽略的一點是,Google對同樣的「姚明、NBA」二字,都是給了同樣的10萬筆結果,有些最精闢的姚明生平的文章,或許藏在第100頁以後,因為其他原因而Page Rank不高?我們永遠都不知道。

因此,酷比所謂「以文找文」並不是給這些急著找東西的使用者,而是給那些可能會用同樣的字串一搜再搜、或是給那些一定要找遍全天下最棒資料的「重度搜尋使用者」。酷比做到Google所不能做的,就是它可以讓使用者訓練它去搜尋得更正確。使用者把第一次搜出的所有文章,找出他們覺得最正確的,告訴酷比「這些你對了」,也找出他覺得不太符合的,告訴酷比「這些我不要」,然後酷比就會自動分析這些文章,製成一個「專題」(topic),存下來,下次找的時候,就用這個預設的專題去找,就會很準確的找到一堆我真正想找的東西。

酷比背後的技術已研發了十年之久,無法簡短述之,他們基本上用所謂「Vector」概念來形容所有的搜尋需求,把每個關鍵字都賦與一個權重(weight),而且這個權重是可以因人而異、因情況而異。每次餵給酷比「好文、壞文」,酷比就會改變這個權重,這時候,這個Vector就好像一張正確答案表,他們可以拿著這個表去比對接下來每一篇新文章,為它們算出一個新分數,高分的才錄取,低分的就不要。

你一定會問,有誰想要這麼麻煩的搜尋東西?這的確就是酷比一直在努力開拓的部份。它用這套,加上其他一些技術如可以自動找出其他關聯字的「星狀圖」功能、自動從一些文章整理出群落(clustering)的分類功能、關鍵字分析的功能等等,對於企業來說,就是一套強大的知識管理工具,而對於有需求的研究機構來說也是一套非常好用的資料收集工具。但對於一般消費者呢?誰會想用這樣的工具?酷比試著做出類似Google AdSense的酷比精準廣告聯播服務,在AdSense繁中版出來之前有很多人搶先試用,不過目前廣告量似不如Google,在這樣的情況下,就算酷比的vector可以根據內文內容算得多準,總不能說「對不起,你要的牛肉麵廣告從缺」,因此還是得乖乖播出一個和內文內容無關緊要的廣告。

酷比背後的公司為Bridgewell宇匯知識科技,由前精英電腦業務處長周培林先生創立於1997年3月,當年找來史丹佛的學長與Princeton的博士一同創業,耕耘十年至今,目前員工近40人,R&D就佔了24位,學歷都很嚇人,其中還有5位博士,大多是數學或理工博士,還包括從牛津Johns Hopkins來的。直到大約2年多前才正式發表「酷比」產品,而「酷比」的「Scupio」這個字中,「Cupio」是拉丁文的「concept」(觀念)之意,頭上加一個「S」是「Search」,酷比從一開始就打算循由「搜尋觀念」來殺出一條康莊大道。

有趣的是,酷比已開始和博客來等大型網站開始談合作,未來就用「vector」這招讓網站能快速的計算每一個來訪使用者所想要看的東西,製造出使用者與網站雙贏的使用情境。目前所謂的「個人化首頁」往往只以勾選的方式作一些比較粗略的分隔,一般b2c網站的「upsell」機制又只限於賣產品,但酷比卻給每個使用者都賦與一個「vector」,就算是和我臭氣相投穿一條褲子長大的好朋友,我們的vector仍會不太一樣,所以我們去看同一個網站時,也會看到不太一樣的東西。這樣的「超級自動客製化」的網站引擎,可望在未來成為酷比的代表作。

更棒的是,酷比還計畫將「製造專題」(topic)的動作給外包給全球的網友,透過類似酷比AI神奇貼的產品,讓網友自己也可以訓練酷比引擎,製造出自己的專題,然後放在自己的部落格。受過你訓練的酷比引擎會自動去全世界抓新聞、文章來放在這邊,譬如攝影達人Alan可以訓練酷比去準確找到每天全世界最新上傳的「山岳攝影」的新照片。當然,tagging也有同樣的效果,但相比之下,酷比這種「以文訓練」的方式既容易許多也更加精準。

再回到方才關於「技術強的,不見得可以賺錢」的延伸討論,假如真的如此,那麼天天都有創意點子的創業家,不妨考慮想辦法為自己點子加上「技術深度」。無論你想的點子是「幫人交易物品」、「幫你配衣服」、「幫你找房子」、「幫你找女朋友」,假如在你的點子後面,有一個像酷比一樣獨步世界的技術在支持,以這個「強大技術 + 創新點子」的黃金組合,這一場創業活動的高度,一開始將馬上與眾不同。

有趣的是,台灣早就有很多創意十足的「網路創業家」,也有很多海外回來的教授領導學生埋頭做出「技術」,有沒有什麼介於中間的機制,可以把分散在各大專院校的強大技術,用比較淺顯的語言,作個分類,擺出來,讓創業家可以「選購」,找到適合自己點子的技術,去跟該教授談談授權、談談合作?這樣一來,一方面可以避掉技術高手難尋的問題,一方面,說實在話,有技術在後面,也讓年輕創業家籌資會順利許多。這個介於創業家與技術的中間機制,本身也是很好的創業機會。

或,我們乾脆來做一個酷比topic,訓練酷比去尋找這些分散在各處的技術資源,然後送過來給二人創業活動作個配對;技術高手難尋,所以點子主人不要配技術高手,而是配上教授、配上論文、配上研究生,直接包成一個故事到全球找錢,或許是個蠻值得研究的藍海創業路

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多