Estudo sobre detecção de desvios: aplicação em Banco de Dados do Programa de Melhoria do Acesso e da Qualidade da Atenção Básica – PMAQ- Brasil
Descoberta de Conhecimentoem Banco de Dados; Mineração em Banco de Dados; Banco deDados; Informação; PMAQ; Avaliação;
Este trabalho descreveu todas as etapas desenvolvidas para a realização do estudo sobre detecção de desvios em dados da Avaliação externa do Programa de Avaliação da Qualidade da Atenção Básica.
No início das atividades, foi realizado um estudo sobre a área de descoberta de conhecimento, que permitiu a verificação da existência de diversas técnicas disponíveis para o processo, como associação, agrupamento, classificação, detecção de desvios.
O foco principal deste trabalho foi voltado para a detecção de desvios em bases de dados, que é uma técnica muito importante do processo de mineração. A pesquisa realizada para identificar e validar o material literário sobre este assunto não foi uma tarefa fácil.
A grande parte da bibliografia encontrada descrevia o processo de descoberta de conhecimento como um todo, mas pouco material foi encontrado que apresentasse de forma aprofundada a técnica de detecção de desvios.
A maior parte do material encontrado, sobre detecção de desvios, está disponível em artigos isolados ou em anais de congressos das áreas afins. Logo, grande parte deste material apresenta o assunto de forma sucinta.
A partir desta situação, houve a necessidade de um estudo mais completo sobre o assunto. Baseado no fato que grande parte das técnicas de detecção de desvios utilizam a estatística como base de trabalho, esta pesquisa voltou-se ao estudo das avaliações estatísticas.
Nesta fase foram estudadas algumas técnicas estatísticas, sendo que muitas podem ser aplicadas sobre os dados estudados. A seleção das técnicas avaliadas foi baseada na relação entre o tipo de dado armazenado e de que forma está expressa a informação dentro da base de dados. Estes parâmetros podem determinar o sucesso da avaliação.
O software SPSS v.20 permitiu a seleção e avaliação dos dados trabalhados, de forma simplificada, o que facilitou a compreensão de como são calculados os valores e avaliados os resultados obtidos. As técnicas utilizadas no software para identificar os desvios foram as determinações estatísticas de frequência, mediana, média, percentis, gráficos boxplot e histograma para a variáveis quantitativas. Avaliação das frequências e classificação das respostas nas variáveis qualitativas.
Mesmo obtendo resultados satisfatórios, foi identificada a necessidade de ampliar as avaliações estatísticas. Pois, nem sempre os dados permitiam uma verificação válida ou ainda não resultavam valores satisfatórios para a pesquisa. Nesta fase foram definidas técnicas estatísticas mais específicas para os desvios encontrados na primeira etapa com o SPSS, esses cálculos foram: o cálculo do qui-quadrado para a avaliação bivariada dos registros qualitativos, e o cálculo do teste de razão de verossimilhança para a avaliação bivariada dos registros quantitativos. Foi necessário conhecer e identificar como as técnicas estatísticas efetuavam as avaliações, através de aprofundamento da teoria das técnicas acima citadas.
Os experimentos realizados a partir da metodologia utilizada no trabalho, apresentaram resultados interessantes para a pesquisa. As avaliações de determinadas informações agregaram conhecimento ao trabalho realizado.
Depois da aplicação de todo o roteiro de trabalho citado anteriormente, conclui-se:
A metodologia aplicada foi satisfatória para a detecção de desvios, pois permitiu a identificação, avaliação e a sistematização do processo desenvolvido. Em alguns momentos da pesquisa foi necessário o retorno às etapas anteriores, pois, baseado nos resultados obtidos era necessário reorganizar os dados e avaliá-los novamente. Os resultados obtidos mostraram que a estrutura do arquivo, a definição do tipo de dado e a forma como está expressa a informação dentro do arquivo, podem dificultar ou auxiliar no processo de detecção de desvios.
Durante um processo de detecção de desvios é primordial que sejam traçados objetivos para nortear as avaliações que serão efetuadas. E ainda para capacitar a boa avaliação dos resultados obtidos. Bons objetivos são o resultado de um bom estudo do domínio e estudo da aplicação.
As técnicas estatísticas utilizadas foram definidas de acordo com um estudo prévio das necessidades encontradas. Os resultados obtidos mostraram uma eficiência das técnicas aplicadas, mas ao mesmo tempo uma limitação das mesmas, pois a detecção de desvio engloba uma série de itens que devem ser avaliados em conjunto. E as técnicas estatísticas utilizadas permitem a avaliação simultânea de apenas duas variáveis por vez.
. A forma como os dados estão armazenados e principalmente a informação que eles expressam são os fatores que podem determinar o tipo de avaliação que deve ser efetuada. Ou melhor, o tipo de técnica estatística que deve ser aplicada. A estatística oferece uma gama muito grande de técnicas de avaliação. Cada uma delas é definida para um tipo de aplicação, ou, definida para um tipo de resultado esperado.
. A utilização do SPSS foi um recurso indispensável para a avaliação dos dados, pois permitiu um direcionamento da pesquisa, sem a preocupação de implementar o cálculo estatístico, tornando o trabalho mais fácil de ser realizado.
A sistemática de análise dos resultados obedeceu aos resultados obtidos em cada uma das técnicas aplicadas. Dependendo do resultado, de acordo com a base era definida a próxima avaliação a ser executada. Este tipo de sistemática de trabalho é altamente dependente do usuário, da mesma forma o usuário deve ter um bom conhecimento de estatística.
Um trabalho futuro seria identificar e estudar outras técnicas estatísticas para aplicar na detecção de desvios. Existem diversas técnicas e cada uma pode se adequar melhor aos objetivos definidos para a pesquisa realizada.
Também poderia ser feito um estudo mais aprofundado sobre a detecção de desvios como um dos objetivos a serem alcançados na aplicação de outra técnica de mineração como associação, classificação entre outras.
Com relação ao banco de dados, a técnica permitiu encontrar os desvios, algumas variáveis precisam de avaliações mais aprofundadas para se corrigir a base de dados, outras podem ser mantidas.