Automação de coleta e estruturação de dados da CVM para análise fundamentalista

Orientado(es)
Doutor Marcos Roberto Ribeiro

Título da Revista

ISSN da Revista

Título de Volume

Editor

Abstract

This work presents the development of an automated software for the collection, structuring, and integration of public financial data provided by the Brazilian Securities and Exchange Commission (CVM), focusing on the application of fundamental analysis. The proposed solution aims to overcome the limitations of access, standardization, and organization of financial data disclosed by publicly traded companies, which are traditionally presented in technical and fragmented formats. The software was developed in Python and uses an architecture based on extraction, transformation, and loading stages, supported by a relational model implemented in SQLite, a lightweight, embedded, and easily integrable relational database management system for Python applications. The tool allows the integration of various CVM data categories, such as standardized financial statements, quarterly information, registration forms, and relevant announcements. After processing, these structured data were used to calculate fundamental indicators, demonstrating the practical applicability of the proposed solution. The project contributes to the democratization of financial information, promoting greater transparency, accessibility, and reproducibility of analyses in the financial market. In addition, it supports academic research, the development of quantitative tools, and educational applications in the field of finance.


Resumo

Este trabalho apresenta o desenvolvimento de um software automatizado para coleta, estruturação e integração de dados financeiros públicos disponibilizados pela Comissão de Valores Mobiliários (CVM), com foco na aplicação da análise fundamentalista. A solução proposta visa superar as limitações de acesso, padronização e organização dos dados financeiros divulgados por companhias abertas, que tradicionalmente são apresentados em formatos técnicos e fragmentados. O software foi desenvolvido em Python e utiliza uma arquitetura baseada em etapas de extração, transformação e carga, apoiada por um modelo relacional implementado em SQLite, um sistema de gerenciamento de banco de dados relacional leve, embutido e de fácil integração com aplicações Python. A ferramenta permite integrar diversas categorias de dados da CVM, como demonstrações financeiras padronizadas, informações trimestrais, formulários cadastrais e comunicados relevantes. Após o processamento, esses dados estruturados foram utilizados para cálculo de indicadores fundamentalistas, demonstrando a aplicabilidade prática da solução proposta. O projeto contribui com a democratização da informação financeira, promovendo maior transparência, acessibilidade e reprodutibilidade de análises no mercado financeiro. Além disso, oferece suporte à pesquisa acadêmica, desenvolvimento de ferramentas quantitativas e aplicações educacionais na área de finanças

Palavras-chave

Citação

Avaliação

Revisão

Suplementado Por

Referenciado Por