Transformer

Swin-UNet：基於純 Transformer 結構的語義分割網路

2022-03-03 TAG: SWIN Transformer UNet patch block

Swin-UNet解碼器主要由patch expanding來實現上取樣，作為一個完全對稱的網路結構，解碼器也是每次擴大2倍進行上取樣，核心模組由Swin Transformer block和patch expanding組成... [ 檢視更多... ]

2022-02-26 TAG: token BERT embedding Transformer segment

▌3. xlnet3.1 xlnet的背景目前語言預訓練模型的模式主要有2種，第一種是像gpt這種的auto-regressive模型，每個時刻都依據之前所有時刻的token來預測下一個token，auto-regressive的loss的... [ 檢視更多... ]

2021-12-05 TAG: CoBERL LSTM Transformer MPO 研究者

選自arXiv作者：Andrea Banino等機器之心編譯編輯：陳萍、杜偉來自 DeepMind 的研究者提出了用於強化學習的 CoBERL 智慧體，它結合了新的對比損失以及混合 LSTM-transformer 架構，可以提高處理資料效... [ 檢視更多... ]

2021-10-28 TAG: BERT 模型 Transformer token

（句子對關係判斷，單文字主題分類，問答任務（QA），單句貼標籤（命名實體識別））微調的若干經驗：batch size：16，32epochs：3，4learning rate：2e-5，5e-5全連線層新增：layers：1-3，hidde... [ 檢視更多... ]

2021-09-04 TAG: CNN patch Transformer embedding ReID

com/heshuting555/TransReID在這篇論文中，阿里達摩院的研究團隊首次成功將pure transformer架構應用於目標重識別（ReID）任務，提出了TransReID框架，在6個數據集上都取得了超過SOTA CNN方... [ 檢視更多... ]

2021-08-25 TAG: Conformer Transformer 特徵 CNN block

com/pengzhiliang/Conformer此外，Conformer中含有並行的CNN分支和Transformer分支，透過特徵耦合模組融合區域性與全域性特徵，目的在於不損失影象細節的同時捕捉影象全域性資訊... [ 檢視更多... ]

2021-08-24 TAG: 卷積 Transformer 訓練模型研究者

RQ2：卷積模型（不管是否使用預訓練）能否與 Transformer 模型媲美... [ 檢視更多... ]

2021-07-26 TAG: CNN 卷積 ViT https Transformer

11929ViT比CNN更像人類：https：//arxiv... [ 檢視更多... ]

2021-07-13 TAG: GaN ViT ViTGAN Transformer CNN

pdf論文研究的問題是：ViT是否可以在不使用卷積或池化的情況下完成影象生成任務，即ViT是否能用具有競爭質量的GAN訓練出基於CNN的GAN... [ 檢視更多... ]

2021-06-29 TAG: 模型 ViT Transformer 谷歌 14

近日，谷歌大腦團隊公佈了Vision Transformer（ViT）進階版ViT-G/14，引數高達20億的CV模型，經過30億張圖片的訓練，重新整理了ImageNet上最高準確率記錄——90... [ 檢視更多... ]