接上文:? 【NLP】多頭注意力概念(01)?
五、計(jì)算注意力
????????將?Q、K 和?V?拆分為它們的頭部后,現(xiàn)在可以計(jì)算?Q?和?K?的縮放點(diǎn)積。上面的等式表明,第一步是執(zhí)行張量乘法。但是,必須先轉(zhuǎn)置 K。文章來源:http://www.zghlxwxcb.cn/news/detail-577943.html
????????展望未來,每個(gè)張量的seq_length形狀將通過其各自的張量來識(shí)別,以確保清晰度、Q_length、K_length或V_length:文章來源地址http://www.zghlxwxcb.cn/news/detail-577943.html
- Q?的形狀為?(batch_size、n_heads、Q_length、d_key)
到了這里,關(guān)于【NLP】多頭注意力概念(02)的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!