Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
README.md		README.md
ViT.ipynb		ViT.ipynb

Repository files navigation

ViT AN IMAGE IS WORTH 16X16 WORDS BY ALEXY DOSOVITSKIY ET AL. 2021 IMPLEMENTATION

Link to original paper: https://arxiv.org/abs/2010.11929

About

A 2021 paper: 'An Image is worth 16x16 Words' talked about feeding images into Vision Transformers in patches of 16x16. This is an implementation of that paper.

arxiv.org/abs/2010.11929

machine-learning deep-neural-networks deep-learning transformer research-paper vision-transformer

Report repository

Releases

No releases published

Packages

Contributors

Languages

Jupyter Notebook 100.0%