O DataViva é uma plataforma de visualização dados focada em Big Data. Sua missão é fundamentar processos de decisão e investigação científica através da utilização de grandes conjuntos de dados, fortalecendo uma cultura data-driven nas esferas pública e privada. A plataforma é desenvolvida sob tecnologias open source, possibilitando a replicação, validação e contribuição da comunidade científica.
A construção do DataViva foi uma resposta do Governo de Minas ao desafio de promover a sofisticação da economia mineira, principalmente no que se refere às indústrias de fronteira tecnológica. Esse desafio é fundamentado em um velho, porém ainda atual diagnóstico da economia do estado: Minas Gerais possui um perfil primário-exportador, aonde o grosso da sua produção exportada é composta por produtos primários, ou seja, aqueles advindos das atividades extrativas – como a mineração – ou agrícolas. Um dos principais problemas que podem advir do alto grau de dependência desses produtos na pauta exportadora do estado é o fato de que, por serem commodities, seus preços são negociados no mercado internacional, que por sua vez depende dos rumos da economia global, levando à superexposição da economia do estado às oscilações econômicas externas. Além disso, é desejável que a economia do estado produza bens de elevado cunho tecnológico e valor agregado, pois as atividades econômicas ligadas à tal produção têm maior capacidade de geração de renda, tanto porque são intensivas em conhecimento, demandando profissionais mais qualificados – e que recebem maiores salários – quanto porque a presença dessas atividades em determinada região estimula a produção de produtos semelhantes, aumentando a diversificação e dinamicidade da economia.
A promoção do desenvolvimento da economia de Minas Gerais, contudo, esbarrava na falta de informações constantemente atualizadas sobre o estado de sua economia. O DataViva surgiu como uma solução a este problema ao agregar em uma mesma plataforma, diversas fontes de dados sobre a economia mineira, proporcionando visualizações interativas e bases de dados padronizadas. Adicionalmente, o DataViva incorporou a metodologia do product space como forma de compreender as relações entre as diferentes atividades econômicas no estado. A metodologia, originalmente proposta por pesquisadores de Havard, permite identificar aqueles setores mais sofisticados tecnologicamente, baseado em indicadores de complexidade econômica. Esses setores poderiam ser alvos prioritários na estratégia de desenvolvimento do estado na medida em que, através do estímulo à estes setores, diversos outros setores e atividades econômicas à eles ligados seriam beneficiados. O projeto, financiado pela FAPEMIG, foi executado pelo Governo de Minasem colaboração com pesquisadores de Harvard e MIT, contando com a participação ativa de diversas outras instituições públicas e privadas em seu desenvolvimento. Ao longo de sua construção, observou-se que o DataViva poderia ser utilizado para compreender a dinâmica econômica dos outros estados da federação e a plataforma adotou uma perspectiva nacional. Além disso, percebeu-se que, não apenas gestores públicos poderiam se beneficiar do acesso aos dados, como também empreendedores e demais profissionais. A plataforma abria-se, desse modo, à um público mais amplo, chegando a bater a marca de mais de 5.000 usuários ativos por dia. A escalabilidade da solução trouxe novos desafios ao projeto. Conforme crescia o volume de dados por um lado e o número de usuários por outro, o DataViva precisou se ajustar de forma a atender as necessidades crescentes de armazenamento e processamento, o que por sua vez implicou em maiores custos de infraestrutura cloud, desenvolvimento e manutenção. Foi necessário o emprego de técnicas de otimização de dados de maneira a propiciar uma plataforma responsiva, rápida e poderosa o suficiente para gerar mais de 1 bilhão de possibilidades de visualizações interativas. Ao longo de sua trajetória, o DataViva buscou, mais do que disponibilizar o acesso à informação, agregar valor aos dados por meio de seu corpo técnico. Isso se deu através da elaboração de publicações científicas, artigos em revistas e blogs de maneira a sistematizar os conhecimentos gerados a partir da análise de um volume massivo de dados. Concomitantemente, procurou-se disseminar tais achados por meio de participações no noticiário, congressos, seminários e demais eventos de maneira a interagir esse conhecimento produzido com os demais agentes da sociedade, validando-o, ajustando-o e refinando-o de maneira a promover uma estratégia renovada de desenvolvimento econômico. Atualmente, o repositório de dados do DataViva compreende mais de 1000 GB armazenados em nuvem. O projeto é financiado pela FAPEMIG e executado pelo CEDEPLAR.