伊芙·卡莉現(xiàn)年25歲,,是美國麻省理工學院計算機專業(yè)的一名博士。
事實上,,一般的計算機專業(yè)學生很少有讀到博士的,,基本上多數(shù)人讀完碩士就各奔前程了。
但伊芙·卡莉在學術的道路上有著屬于她自己的追求,。
盡管這份追求幾乎注定一路獨行,。
但她始終樂在其中,前行一路上最大的動力是興趣,。
除了興趣之外最大的原因,,則是因為工作帶來的自豪感。
作為麻省理工學院自然語言處理研究項目文本摘要小組中的一名成員,,她也有理由自豪,。
畢竟世界上效率最高的抽取式文本摘要算法就是他們小組搞定的。
伊芙·卡莉一向以此為榮,。
然而這份榮光在半小時前卻蕩然無存,。
比他們團隊開發(fā)的抽取式文本摘要算法還要強的新的文本摘要算法問世了。
而且還是以成熟應用的形式直接出現(xiàn)在了蘋果的應用商店中,。
伊芙·卡莉也是接收到尼克的求助郵件才獲悉了這件事,。
事實上剛收到來自尼克那措辭夸張的求助郵件她還有點懷疑。
她甚至一度以為是尼克那個自大而又愚蠢的幸運白/癡記錯了愚人節(jié)的日期,。
尼克用的那個軟件里的算法表面上是伊瑟劣的團隊負責的
但實際上麻省理工學院的自然語言處理項目文本摘要小組才是該算法真正的出處,,
尼克軟件里所采用算法可以說是伊芙·卡莉他們課題組每個人心血的結晶。
對于其親自參與搞定的算法伊芙·卡莉還是很自信的,。
怎么可能有軟件的算法對新聞摘要處理效率比他們開發(fā)的算法處理效率更高呢,?
并不是她本人夜郎自大盲目自信,。
之前很多出現(xiàn)在應用商店里很多打著新聞摘要旗號的軟件的核心算法實際效率都十分低下,。
甚至很多號稱算法獨步的新聞摘要程序最終也只是被證明是徒有虛名而已。
對于這次所謂的南風APP宣稱的什么地表效率最強準確度全球最高
開始時伊芙·卡莉也只是把這些slogan當作噱頭而已,,并沒有放在眼里,。
然而事實卻很打臉,這個南風APP非但不是紙老虎,反而堪稱絕世兇獸,。
至少在處理新聞摘要這方面南風APP所采用的算法在效率方面是強到離譜,。
經(jīng)過量化測試,伊芙·卡莉更是發(fā)現(xiàn)南風APP 100輪測試里英文新聞摘要的平均速度要比尼克開發(fā)的那個軟件軟件快241%,。
這還不算什么,,將南風APP在計算力更高的虛擬機上運行時。
100輪測試里英文新聞摘要的平均速度更是比同條件下他們的那種算法的摘要平均速度要快350%,。
可以說是全方位吊打了,。
伊芙·卡莉很不理解,怎么可能有一種算法在抽取式文本摘要算法在效率上比他們開發(fā)的算法效率強出三倍之多,。
根據(jù)他們的研究,,現(xiàn)在的抽取式文本摘要算法潛能幾乎已經(jīng)發(fā)掘殆盡了。
莫非是南風APP的算法團隊找到了壓榨抽取式文本摘要算法潛能的新方式了,?
不可能,,絕對不可能。
再怎么著他們的研究小組也是匯聚了全球首屈一指技術大牛的自然語言處理算法團隊啊,。
沒道理他們這些精英會被人在同一方向后來居上,。
如果南風APP算法團隊不是后來居上的話,那應該就是彎道超車了,?
也就是說南風APP的算法采用的絕對不是傳統(tǒng)的抽取式文本摘要算法,,而應該是采用了一種全新的摘要算法。
外行看熱鬧,,內(nèi)行看門道,。
伊芙卡莉從之前南風APP進行的幾組新聞摘要測試的輸入輸出結果中很快驗證了她的猜測。
南風APP果然采用了全新的文本摘要算法,。
至于判斷的依據(jù)么,,很簡單。
抽取式的文本摘要直接從原文中摘取單詞或完整的短語作為文章的摘要,。
這個過程并不會產(chǎn)生新聞原文中沒有的單詞和短語,。
而南風APP這款軟件在新聞摘要中卻會產(chǎn)生很多新聞原文中沒有的單詞和短語。
也就是說南風APP中所采用的算法絕對不是抽取式算法,,至少不單單是抽取式算法,。
而這種新的算法在進行新聞摘要的一大特征是會產(chǎn)生新聞原文中沒有的單詞和短語。
比起傳統(tǒng)的抽取式文本摘要,,伊芙·卡莉覺得南風APP里這種全新的摘要方式更像是生成式的摘要方式,。