論文相似度是指該論文與其他論文的重復(fù)程度。目前有兩項(xiàng)指標(biāo),一個(gè)是全文庫相似度,另一個(gè)是自建庫相似度。
全文庫是指全部已公開發(fā)表的論文,那么,全文庫相似度就是該論文與全部已發(fā)表論文的重復(fù)程度。
自建庫是指競賽后由全部參賽學(xué)生論文構(gòu)建起來的庫,那么,自建庫相似度就是該論文與其他參賽學(xué)生論文的重復(fù)程度。
在通常情況下,全文庫相似度一般不會太高,只要學(xué)生不大段大段地拷貝現(xiàn)有的參考文獻(xiàn);而自建庫相似度會高一些,這是由于大家共同完成一個(gè)題目,有很多內(nèi)容可能會重復(fù),另外,很多同學(xué)會原封不動地拷貝競賽題目,這也是自建庫相似度高的原因之一。
但自建庫相似度過高則說明該論文有問題,例如,自建庫相似度在50%以上,說明該論文有一半以上的內(nèi)容與其他同學(xué)的論文重復(fù)。