報(bào)告題目:草圖驅(qū)動(dòng)的精準(zhǔn)可控AIGC
主 講 人:李珂 特聘副研究員
主 持 人:齊勇剛 副教授
報(bào)告時(shí)間:2025年4月23日16:00-17:00
騰訊會(huì)議:748-2980-2742
報(bào)告摘要:
隨著生成式AI技術(shù)的突破,基于多條件控制的圖像生成方法正逐漸超越單一文本驅(qū)動(dòng)的范式。盡管文本條件能提供豐富的語義信息,但其對(duì)圖像空間結(jié)構(gòu)與細(xì)節(jié)的約束能力存在顯著局限。在此背景下,草圖作為兼具結(jié)構(gòu)化表意能力與低門檻交互特性的跨模態(tài)輸入形式,已成為實(shí)現(xiàn)精準(zhǔn)可控圖像生成的關(guān)鍵媒介。然而,現(xiàn)有方法在條件一致性、控制協(xié)同性等方面仍面臨嚴(yán)峻挑戰(zhàn),本講座從草圖在可控AIGC中的技術(shù)演進(jìn)路徑出發(fā),探討在可控圖像生成中需要解決的關(guān)鍵研究問題。
專家簡(jiǎn)介:
李珂,2019年至2021年工作于阿里巴巴達(dá)摩院,2021年至今工作于北京郵電大學(xué)人工智能學(xué)院,擔(dān)任特聘副研究員、博士生導(dǎo)師,是英國(guó)薩里大學(xué)CVSSP-SketchX的附屬學(xué)者,研究方向?yàn)楦涌煽氐腁IGC、大模型在垂直領(lǐng)域的應(yīng)用和優(yōu)化。近年來發(fā)表了包括國(guó)際頂級(jí)學(xué)術(shù)會(huì)議CVPR、ICCV、ECCV、ICLR、AAAI及期刊TIP在內(nèi)的20余篇學(xué)術(shù)論文,其中一作和通訊作者論文9篇,同時(shí)擔(dān)任CVPR、ECCV、ICCV、NIPS、ICLR、AAAI、TIP、IJCV等國(guó)際頂級(jí)會(huì)議和期刊的審稿人。指導(dǎo)學(xué)生獲得全球校園人工智能算法精英大賽全國(guó)總決賽一等獎(jiǎng)。