O câncer de pulmão é o de maior incidência no mundo. A detecção e o diagnóstico precoce permitem mais opções de tratamento e maior probabilidade de sobrevivência do paciente. Os exames padrão para o diagnóstico do câncer pulmonar são exames de imagem médicas, citologia de escarro e biópsia pulmonar. O exame de Tomografia Computadorizada (TC) de tórax tem papel importante no diagnóstico precoce de nódulos, o que pode aumentar a probabilidade de sobrevivência dos pacientes. Neste tipo de exame, os nódulos 3D são representados por diversas fatias 2D. Dessa forma, este trabalho aborda a classificação de nódulos pulmonares em benignos ou malignos em imagens de TC. Para isso, investigamos as redes pré-treinadas VGG16, VGG19, Inception, Resnet50 e Xception, para extração de características de cada fatia 2D do nódulo 3D. Em seguida, foi utilizado o Principal Component Analysis (PCA) para redução de dimensionalidade das características extraídas a partir das redes pré-treinadas.
Visto que a quantidade de fatias por nódulo são diferentes, foi aplicada a técnica de Bag of Features (BoF) para gerar vetores de características de mesma dimensionalidade, e na etapa de classificação, foi utilizada a Random Forest. Ainda, foi realizada a classificação utilizando Redes Neurais Convolucionais 2D e 3D, treinadas na própria base de imagens. Avaliamos o método proposto com 1.405 imagens segmentadas da base LIDC-IDRI e obtivemos acurácia de 95,41%, kappa de 0,8850, sensibilidade de 88,95%, especificidade de 97,99% e AUC de 0,9858. A principal conclusão obtida foi que a combinação pelo BoF de características extraídas de fatias 2D usando arquiteturas pré-treinadas produziu melhores resultados do que o treinamento de CNNs 2D e 3D nos nódulos. Além disso, o uso de BoF também torna a criação da assinatura do nódulo independente do número de fatias.