A Leishmaniose Visceral (LV) é uma doença negligenciada que possui entre 50.000 a 90.000 novos casos anuais em todo o mundo. Se não tratada, essa doença pode levar a óbito mais de 95% dos casos. O diagnóstico é realizado em laboratórios especializados e o padrão-ouro para a detecção da LV é feito pela microscopia do material aspirado da medula óssea (exame parasitológico), tendo como objetivo a busca por formas amastigotas por todos os campos da lâmina. Esse processo de análise é realizado manualmente, tornando-se cansativo e laborioso para os profissionais de saúde. Dessa forma, a proposta desse trabalho é auxiliar no diagnóstico da LV utilizando técnicas de Visão Computacional e Aprendizado Profundo em imagens de lâminas provenientes do exame parasitológico da medula óssea. Essa metodologia é composta por duas etapas: na primeira, há a classificação das imagens em positivo ou negativo para LV, utilizando técnicas de transferência de aprendizado e ajuste fino em cinco diferentes arquiteturas de CNN pré-treinadas; na segunda, realiza-se a segmentação das amastigotas nas imagens positivas para LV, dividindo as imagens em recortes e aplicando a arquitetura U-Net para indicar precisamente a região do parasita na imagem. Para isso, utiliza-se um conjunto de dados contendo 150 imagens, onde 78 imagens pertencem à classe positiva e 72 à classe negativa. No melhor modelo de classificação, atinge-se uma acurácia de 99,1%, f1-Score de 99,2% e kappa de 98,3%. Na segmentação das amastigotas, obtém-se um Dice de 80,4%, IoU de 75,2% e AUC de 86,5%. Os resultados são promissores e demonstram que modelos de aprendizado profundo treinados com imagens de lâminas da microscopia de material biológico podem auxiliar o especialista na detecção da LV em humanos.