Encoder: Bao gồm nhiều lớp encoder, mỗi lớp gồm hai thành phần chính: cơ chế multi-head self-attention và mạ
Màu đỏ: đại di