新聞中心

科(kē)研動态丨我院2篇論文入選數據庫頂級會議(yì)ICDE 2022

發布時間:2022-05-19

日(rì)前,國(guó)際數據庫頂級會議(yì)38th IEEE International Conference on Data Engineering(ICDE 2022)在馬來(lái)西亞吉隆坡召開。四川省計算機研究院科(kē)研團隊及其合作(zuò)者的2篇論文成果入選ICDE 2022。


1.《Linking Entities across Relations and Graphs》

1652948667346

摘要:如(rú)何将關系數據和圖數據進行數據關聯,是數據管理(lǐ)領域的一項長期挑戰。針對此難點,我院科(kē)研團隊與合作(zuò)者開發了名爲HER(Heterogeneous Entity Resolution)的并行系統,可(kě)在關系型數據庫和圖數據中進行基于語義連接的實體(tǐ)匹配。經真實數據和合成數據實驗驗證,HER平均F-度量爲0.94,并在大(dà)數據庫D和大(dà)圖G具有可(kě)擴展性。


2.《Deep and Collective Entity Resolution in Parallel》

1652948686357

摘要:實體(tǐ)識别(Entity Resolution,ER)也稱爲重複數據删除、實體(tǐ)消解或記錄鏈接,一直以來(lái)都(dōu)是數據治理(lǐ)領域的研究熱(rè)點。我院科(kē)研團隊與合作(zuò)者爲Deep and Collective ER設計(jì)了基于不動點計(jì)算的模型,該模型能在多個關系上遞歸地推導規則和追逐匹配項,并允許在規則中嵌入ML謂詞。爲适應海量數據應用場景,科(kē)研團隊還(hái)在該模型基礎上開發了數據分(fēn)區策略和并行算法,保證了使用更多處理(lǐ)器時可(kě)減少運行時間。經真實數據集實驗驗證,該方法可(kě)有效提高ER的準确率并具備并行可(kě)擴展性。


數讀(dú)科(kē)研成果

截至2022年(nián)5月,研究院共發表/錄用高水平論文70篇,其中CCF A類59篇;申請(qǐng)專利/PCT共29項,授權發明專利5項。