報(bào)告題目:大模型時(shí)代下的開放場(chǎng)景視覺感知與理解
報(bào) 告 人:尹軍輝 北京郵電大學(xué)人工智能學(xué)院博士后
主 持 人:李蕾 教授
報(bào)告時(shí)間:2024年12月11日16:00-17:00
騰訊會(huì)議:744-3448-1313
報(bào)告摘要:
在當(dāng)前人工智能領(lǐng)域,大語(yǔ)言模型因其高度通用化和智能化的表現(xiàn)受到社會(huì)廣泛關(guān)注,并逐漸發(fā)展成為機(jī)器學(xué)習(xí)領(lǐng)域重要的研究方向。相比于語(yǔ)言模型的快速發(fā)展,視覺大模型的研究相對(duì)滯后。盡管預(yù)訓(xùn)練的視覺大模型借助語(yǔ)言模型的知識(shí)表征能力取得了良好的零樣本泛化,但在實(shí)際模型推理過(guò)程中,并不會(huì)提供確切的對(duì)象類別名稱。因此,如何將預(yù)訓(xùn)練知識(shí)高效快速的遷移到下游各種開放式場(chǎng)景至關(guān)重要。本報(bào)告聚焦開放場(chǎng)景下視覺大模型提示生成技術(shù)的發(fā)展現(xiàn)狀與趨勢(shì),探討如何構(gòu)建高效、可解釋、泛化能力強(qiáng)的視覺大模型實(shí)際應(yīng)用技術(shù)。
專家簡(jiǎn)介:
尹軍輝,北京郵電大學(xué)人工智能學(xué)院博士后、新加坡管理大學(xué)訪問(wèn)博士后。長(zhǎng)期從事多模態(tài)學(xué)習(xí)、視覺感知識(shí)別等方向的研究,研究成果在IEEE TIP、PR等國(guó)際期刊和會(huì)議上發(fā)表,主持國(guó)家自然科學(xué)基金青年項(xiàng)目,曾參與國(guó)家杰出青年科學(xué)基金、國(guó)家優(yōu)秀青年科學(xué)基金、國(guó)家重點(diǎn)研發(fā)計(jì)劃等項(xiàng)目。獲國(guó)家資助博士后研究人員計(jì)劃,被評(píng)為北京郵電大學(xué)優(yōu)秀博士畢業(yè)生。