https://arxiv.org/abs/2010.11929
An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale
While the Transformer architecture has become the de-facto standard for natural language processing tasks, its applications to computer vision remain limited. In vision, attention is either applied in conjunction with convolutional networks, or used to rep
arxiv.org
(Inductive Bias란 학습 시에는 만나보지 않았던 상황에 대하여 정확한 예측을 하기 위해 사용하는 추가적인 가정을 의미합니다.)
'AI 공부 한 것' 카테고리의 다른 글
[논문 리뷰] Video Swin Transformer (0) | 2023.02.27 |
---|---|
[논문 리뷰] Swin Transformer (Swin Transformer: Hierarchical Vision Transformer using Shifted Windows) (1) | 2023.02.25 |
[후기] KT AI석사과정 계약학과, 한양대 AI응용학과 합격 후기 (52) | 2022.12.26 |
[백준 23291] 어항 정리 (Python) (0) | 2022.07.02 |
[백준 23290] 마법사 상어와 복제 (Python) (0) | 2022.06.30 |