網(wǎng)站后臺(tái)被百度蜘蛛抓取百度沒有排名的點(diǎn)擊軟件
ICLR 2025? 6666
近年來,圖機(jī)器學(xué)習(xí)(Graph Machine Learning, GML)取得了顯著進(jìn)展,并廣泛應(yīng)用于多個(gè)領(lǐng)域。然而,GML 社區(qū)的研究重點(diǎn)大多集中于構(gòu)建更強(qiáng)大的圖模型,而常常忽視了一個(gè)關(guān)鍵的前置步驟:如何從常見的數(shù)據(jù)格式(如表格數(shù)據(jù))中構(gòu)建合適的圖結(jié)構(gòu)。圖的構(gòu)建是應(yīng)用圖模型的基礎(chǔ),但這一過程在現(xiàn)有研究中仍缺乏系統(tǒng)性探索和正式定義。
為填補(bǔ)這一空白,我們的研究旨在形式化圖構(gòu)建問題,并提出有效的解決方案。在實(shí)現(xiàn)這一目標(biāo)的過程中,我們識(shí)別出兩個(gè)核心挑戰(zhàn):
-
缺乏專門的數(shù)據(jù)集來支持圖構(gòu)建方法的形式化與評(píng)估;
-
現(xiàn)有自動(dòng)化構(gòu)建方法適用范圍有限,在許多場(chǎng)景下仍需依賴繁瑣的人工工程才能生成高質(zhì)量的圖結(jié)構(gòu)。
針對(duì)上述挑戰(zhàn),本文提出了兩項(xiàng)主要貢獻(xiàn):
-
第一,我們引入了一套專門的數(shù)據(jù)集,用于形式化圖構(gòu)建問題并系統(tǒng)評(píng)估不同方法;
-
第二,我們提出了基于大語言模型的解決方案 AutoG,可在無需人工干預(yù)的情況下自動(dòng)生成高質(zhì)量圖結(jié)構(gòu)。
實(shí)驗(yàn)結(jié)果表明,圖結(jié)構(gòu)的質(zhì)量對(duì)下游任務(wù)性能具有顯著影響,而 AutoG 所生成的圖結(jié)構(gòu)在性能上可媲美人工構(gòu)建的高質(zhì)量圖,驗(yàn)證了其有效性與實(shí)用性。
項(xiàng)目代碼已開源,地址為:https://github.com/amazon-science/Automatic-Table-to-Graph-Generation。