Algoritmo para Processamento de Logs CLF e Geração de Estatísticas de Acesso a Sites por País: Visualização dos Dados Baseada no Serviço Google Chart
Palavras-chave:
processamento de logs CLF, Google Chart, Python, ApacheResumo
Este artigo apresenta o desenvolvimento de um algoritmo computacional para o processamento de Logs [1] no formato CLF [2], utilizado pelo servidor de páginas de internet Apache [3]. O algoritmo permite a identificação dos países de origem de todos os usuários de sítios da internet e gera dados estatísticos sobre estes acessos, de modo que seja possível quantificar e comparar a representatividade de cada um sobre os sítios analisados. Este tipo de informação pode ser utilizada, por exemplo, para customizar o conteúdo dos sítios da internet de acordo com o idioma de origem dos países que mais o acessam, permitindo a criação de estratégias mercadológicas de acordo com cada região que apresenta maiores índices de acesso. Para o desenvolvimento foi utilizada a linguagem de Programação Python [4]. Além de o sistema apresentar estatísticas em percentual de acessos por país, também foi implementada funcionalidade de geração de mapa do mundo de forma dinâmica através da API do Google Chart [5] para apresentar, visualmente, os dados gerados pelo algoritmo. O sistema foi testado utilizando-se Logs de servidores reais da internet, bem como arquivos com endereços ip gerados de forma aleatória para testes adicionais.