O controle de doenças transmitidas por mosquitos é desafiado pela globalização, urbanização e aquecimento global. Inseticidas sintéticos administrados em nebulizações de áreas abertas e pulverizações em ambientes fechados são abordagens comuns de erradicação, mas ao custo da toxicidade e resistência desenvolvida pelo mosquito. Uma vez que faltam técnicas de vigilância escaláveis e de baixo custo, há uma carência de dados a respeito da distribuição dos mosquitos. Diante disso, um método automatizado acessível para detectar mosquitos poderia gerar dados de alta qualidade em escalas espaciais e temporais para apoiar iniciativas de prevenção. Este artigo propõe um descritor compacto e eficaz para detectar automaticamente o Aedes aegypti e diferenciar as espécies de mosquitos, combinando características cepstrais, de tempo e frequência extraídas dos sons produzidos pelo batimento das asas dos mosquitos. Para isso, aplicamos uma etapa de pré-processamento que inclui aumento de dados para contornar conjuntos de dados pequenos e desbalanceados. Em sequência, extraímos características dos sinais de áudio. Além disso, também realizamos a extração de características através das arquiteturas profundas ResNet, VGG16, VGG19 pré-treinadas. Os resultados revelam que o descritor proposto combinado ao classificador LGBM atinge 0,99 para acurácia, kappa, precisão, recall e F1-score para detectar a presença do Aedes aegypti e diferenciar espécies de mosquitos, superando grande parte das soluções presentes da literatura. No cenário multiespécies, a proposta supera os 93% para todas as métricas. Consequentemente, acreditamos que nossas descobertas podem apoiar a implantação da solução proposta em dispositivos de baixa computação para detecção de focos do mosquito de maneira acessível, escalável e em tempo real, sendo essencial para estimular a participação da população e criar um mapa da distribuição de focos.