Os modos semióticos têm se mostrado importantes na leitura de um texto. Desde os tempos antigos, com as imagens em paredes de caverna e atualmente na TV, streamings e outros. O texto multimodal está presente em diversos espaços, desde outdoors a materiais didáticos. Com a globalização e o surgimento de tecnologias digitais, a utilização de diferentes modos como a imagem, sons e cores se tornaram ainda mais constante, e hoje o vídeo legendado é uma ferramenta que pode englobar esses modos. A popularidade dessa ferramenta vem crescendo a maneira em que eles são utilizados desde o lazer até o ensino (GOMES, 2017; LERTOLA, 2017; SILVA E GOMES 2017). O atual cenário é explicado por teorias como letramento (STREET, 1984), multiletramentos (NEW LONDON GROUP, 1996) e multimodalidade (KRESS, 2011). Com isso, essa pesquisa teve como objetivo observar o papel do nível do letramento escolar e da familiaridade com a ferramenta na leitura de vídeos legendados, e estabelecer uma relação entre esses fatores na leitura multimodal. Para isso, um estudo qualitativo de natureza de estudo de casos múltiplos (YIN, 2005) foi realizado com 6 participantes, de diferentes níveis de letramento escolar, com e sem familiaridade com a ferramenta. Os níveis de letramento escolar foram estabelecidos com base na pesquisa de Ferraro (2002), onde o autor estabeleceu níveis de acordo com os anos escolares concluídos. Com isso, os sujeitos dessa pesquisa foram categorizados em sujeitos com o nível de letramento escolar baixo, médio e alto e em cada nível havia um participante com e sem familiaridade com a ferramenta. Os resultados dessa pesquisa sugerem que o nível de letramento escolar teve um papel mais relevante na compreensão da leitura de vídeos legendados do que a familiaridade com a ferramenta.