[gem_icon_with_text icon_pack=”fontawesome” flow=”1″ icon_fontawesome=”f085″ icon_color=”#3c3950″ icon_top_side_padding=”5″ icon_right_side_padding=”10″ icon_bottom_side_padding=”10″ icon_left_side_padding=”10″]
Imagina conseguir navegar de forma fácil pela principal fonte de informações de interesse público das cidades, dos estados e da União? Quem já precisou encarar um Diário Oficial sabe que essa não é uma tarefa simples. Sem um padrão definido, cada lugar tem liberdade para decidir qual formato e estrutura usará – e na maioria das vezes não usam um formato aberto.
Foi pensando em mudar isso que nasceu o Querido Diário, um projeto de código aberto (open source) da Open Knowledge Brasil que tem como objetivo tornar os Diários Oficiais do país mais acessíveis e democráticos. Neste workshop, você vai aprender a raspar os dados publicados nos diários com a Ana Paula Gomes, engenheira de software, mestra em Ciências de Dados e fundadora do projeto Dados Abertos de Feira.
Ana Paula ensinará o passo a passo para contribuir com o projeto Querido Diário, traçando um panorama que inclui a escolha do diário a ser analisado até a raspagem de dados com spiders – programa de coleta que transforma dados não estruturados em formatos acessíveis. Com conhecimentos básicos em HTML e Python, você conseguirá extrair boas pautas através das informações publicadas nos diários.
Neste workshop, com enfoque na parte prática, você descobrirá como configurar o seu repositório a partir do Querido Diário, entendendo a estrutura da página em que irá trabalhar. A partir disso, a engenheira instruirá na criação do seu próprio spider, destacando os atributos obrigatórios e os métodos e classes importantes para o processo. Ao final desses passos, você aprenderá a abrir um Pull Request, onde mais pessoas poderão se beneficiar desses dados.
Ana Paula também vai dar dicas que facilitarão a sua vida na hora de escolher por qual cidade começar e como usar as ferramentas para desenvolvedores ao seu favor. Além disso, você aprenderá o que é o Scrapy e como ele pode ajudar na criação de spiders. Ao final do workshop, você estará pronto para aplicar o que aprendeu e contribuir com esse projeto essencial para a transparência do país.
[gem_divider margin_top=”20″ margin_bottom=”20″][gem_icon_with_text icon_pack=”fontawesome” flow=”1″ icon_fontawesome=”f0ae” icon_color=”#3c3950″ icon_top_side_padding=”5″ icon_right_side_padding=”10″ icon_bottom_side_padding=”10″ icon_left_side_padding=”10″]
[gem_divider margin_top=”20″ margin_bottom=”20″][gem_icon_with_text icon_pack=”fontawesome” flow=”1″ icon_fontawesome=”f251″ icon_color=”#3c3950″ icon_top_side_padding=”5″ icon_right_side_padding=”10″ icon_bottom_side_padding=”10″ icon_left_side_padding=”10″]
[gem_divider margin_top=”20″ margin_bottom=”20″][gem_icon_with_text icon_pack=”fontawesome” flow=”1″ icon_fontawesome=”f0ad” icon_color=”#3c3950″ icon_top_side_padding=”5″ icon_right_side_padding=”10″ icon_bottom_side_padding=”10″ icon_left_side_padding=”10″]