作者:禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù)
在機(jī)器學(xué)習(xí)領(lǐng)域中,生成模型(Generative Model)通常被用來做圖像、文本、聲音等數(shù)據(jù)的表示學(xué)習(xí)(representation learning),而很多時候這些數(shù)據(jù)本身有較強(qiáng)的特征,比如幾何形狀、顏色、結(jié)構(gòu)、表情、材料等。因此,生成模型可以作為一種有別于傳統(tǒng)監(jiān)督學(xué)習(xí)的方法,幫助計(jì)算機(jī)從原始數(shù)據(jù)中發(fā)現(xiàn)更多有效的信息,并且可以產(chǎn)生新的樣本或是對已有樣本進(jìn)行修改,從而達(dá)到更高質(zhì)量的學(xué)習(xí)效果。
然而,生成模型的發(fā)展離不開計(jì)算機(jī)視覺(Computer Vision)、自然語言處理(NLP)和模式識別(Pattern Recognition)等領(lǐng)域的積累,尤其是在前兩個領(lǐng)域取得了重大突破之后。隨著這三個領(lǐng)域的發(fā)展,深度學(xué)習(xí)(Deep Learning)也逐漸成為圖像、文本、聲音等多種數(shù)據(jù)的最佳表示學(xué)習(xí)方法。因此,如果能夠結(jié)合上述多個領(lǐng)域的最新進(jìn)展,將生成模型應(yīng)用到計(jì)算機(jī)視覺的學(xué)習(xí)任務(wù)上,則可以帶來很大的突破。文章來源:http://www.zghlxwxcb.cn/news/detail-737377.html
目前,比較著名的生成模型用于圖像的任務(wù)有VAE、GAN、Pix2pix、CycleGAN等,其中VAE是一種變分推斷型神經(jīng)網(wǎng)絡(luò),可用于圖像編碼和重構(gòu);GAN是一種生成對抗網(wǎng)絡(luò),可用于圖像的生成和轉(zhuǎn)化;Pix2pix是一種無監(jiān)督地將一張圖片轉(zhuǎn)化成另一張圖片的模型,適用于兩張不同風(fēng)格的圖片之間的轉(zhuǎn)換;CycleGAN是一種跨域的生成模型,可用于跨域的數(shù)據(jù)集的轉(zhuǎn)換。這些模型已經(jīng)證明其能力,但仍然存在一些限制。例如,它們只能夠轉(zhuǎn)換有限的風(fēng)格或者采用低質(zhì)量的圖像來進(jìn)行轉(zhuǎn)換。因此,如何結(jié)合多個領(lǐng)域的最新進(jìn)展來設(shè)計(jì)新的生成模型,并將其應(yīng)用到圖像相關(guān)的學(xué)習(xí)任務(wù)上,則是實(shí)現(xiàn)更智能的識別任務(wù)的關(guān)鍵。文章來源地址http://www.zghlxwxcb.cn/news/detail-737377.html
2.基本概念術(shù)語說明
到了這里,關(guān)于生成模型在計(jì)算機(jī)視覺中的應(yīng)用:實(shí)現(xiàn)更智能的識別任務(wù)的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!