[논문 리뷰] ViT (AN IMAGE IS WORTH 16X16 WORDS:TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE)

아무것도모르는사람 2023. 2. 7. 13:51

2023. 2. 7. 13:51

https://arxiv.org/abs/2010.11929

An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

While the Transformer architecture has become the de-facto standard for natural language processing tasks, its applications to computer vision remain limited. In vision, attention is either applied in conjunction with convolutional networks, or used to rep

arxiv.org

(Inductive Bias란 학습 시에는 만나보지 않았던 상황에 대하여 정확한 예측을 하기 위해 사용하는 추가적인 가정을 의미합니다.)

ViT_발표자료.pdf

1.81MB

'AI 공부 한 것' 카테고리의 다른 글

[논문 리뷰] Video Swin Transformer (0)	2023.02.27
[논문 리뷰] Swin Transformer (Swin Transformer: Hierarchical Vision Transformer using Shifted Windows) (1)	2023.02.25
[후기] KT AI석사과정 계약학과, 한양대 AI응용학과 합격 후기 (52)	2022.12.26
[백준 23291] 어항 정리 (Python) (0)	2022.07.02
[백준 23290] 마법사 상어와 복제 (Python) (0)	2022.06.30

코딩일기

[논문 리뷰] ViT (AN IMAGE IS WORTH 16X16 WORDS:TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE)

(Inductive Bias란 학습 시에는 만나보지 않았던 상황에 대하여 정확한 예측을 하기 위해 사용하는 추가적인 가정을 의미합니다.)

'AI 공부 한 것' 카테고리의 다른 글

+ Recent posts

티스토리툴바