Unsplash
Início Blog Release Notes

Ferramentas Xplore Dados – Atualização Out/2025 2

Atualização da ferramenta Mesclar Bases

Introdução

A Xplore Dados continua aprimorando suas ferramentas de análise bibliométrica com foco em precisão e compatibilidade. Esta atualização resolve problemas críticos na exportação de dados mesclados para o VOSviewer, garantindo que autores e referências sejam preservados integralmente e que o arquivo CSV reflita fielmente o Excel deduplicado gerado pela plataforma.

Visão Geral da Atualização

Esta release concentra-se em corrigir o pipeline de exportação do módulo Mesclar Bases, eliminando transformações indevidas que comprometiam a qualidade dos dados enviados ao VOSviewer. As intervenções abrangem desde a leitura dos arquivos Scopus e Web of Science até a geração final do CSV, com atenção especial à preservação de metadados complexos.

  • Exportação sem transformações – o serviço de geração de CSV foi completamente reescrito para converter o Excel deduplicado em CSV mantendo estrutura, ordem de colunas e conteúdo originais, sem aplicar normalizações ou padronizações adicionais.
  • Integridade de autores e referências bibliográficas – ajustes nos utilitários de padronização impedem que nomes de autores já formatados sejam invertidos incorretamente e que citações completas sejam truncadas em apenas títulos de periódicos.

Mesclar Bases (Scopus + WoS)

Funcionalidades Principais

  • Geração direta de CSV deduplicado – a função generate_vosviewer_csv(file_id, folder) agora lê exclusivamente o arquivo Excel sem duplicados e o converte em dados_vosviewer_format.csv utilizando pandas.read_excel com dtype=str e keep_default_na=False, seguido de to_csv com encoding="utf-8-sig", quoting=csv.QUOTE_ALL e lineterminator="\n" para preservar quebras de linha internas e caracteres especiais.
  • Correção do identificador de arquivo no template – o botão de download "VOSviewer" em mesclar_resultado.html foi corrigido para sempre utilizar o file_id do arquivo deduplicado, eliminando a inconsistência que fazia o sistema entregar o arquivo original com duplicados.
  • Preservação de nomes de autores – o utilitário standardize_author_names em biblio_utils.py foi aprimorado com detecção de formato existente via regex, identificando automaticamente padrões "Sobrenome, Iniciais" ou "Sobrenome, Nome" e mantendo-os intactos, evitando inversões indevidas que geravam entradas como "W., Lessa, P." no VOSviewer.
  • Referências bibliográficas completas – removida a normalização de separadores (standardize_separators) da coluna References em todos os pontos do pipeline: mesclar_service.py (leitura Scopus), wos_parser.py (leitura Web of Science) e mesclar.py (mesclagem e deduplicação), garantindo que citações mantenham o formato original com autores, título, volume, páginas e demais metadados necessários para análises de co-citação.

Benefícios Imediatos

Pesquisadores podem agora importar os dados mesclados diretamente no VOSviewer sem necessidade de pré-processamento ou correções manuais. Autores são exibidos corretamente nas redes de coautoria, referências completas habilitam mapas de co-citação precisos, e células vazias permanecem vazias ao invés de serem convertidas em valores NaN. A integridade dos dados deduplicados é mantida em todas as etapas, reduzindo retrabalho e aumentando a confiabilidade das análises bibliométricas.

Integração VOSviewer

Funcionalidades Principais

  • Compatibilidade total com formato esperado – o CSV gerado respeita as especificações do VOSviewer, incluindo UTF-8 com BOM para correta leitura de caracteres acentuados, aspas em todos os campos para preservar vírgulas e quebras de linha internas, e separador de linha padrão Unix para máxima compatibilidade multiplataforma.
  • Nomenclatura padronizada – o arquivo baixado mantém o nome dados_vosviewer_format.csv para facilitar o reconhecimento e organização pelos usuários, independentemente do identificador interno do arquivo mesclado.

Benefícios Imediatos

A integração com o VOSviewer torna-se transparente e confiável. Usuários podem construir redes de colaboração, mapas de palavras-chave e análises de co-citação com dados de alta qualidade, sem enfrentar problemas de codificação, truncamento de campos ou perda de informações estruturadas durante a importação.

Roadmap e Disponibilidade

A atualização está disponível imediatamente no ambiente de produção da Xplore Dados. Para utilizar as melhorias, basta acessar o módulo Mesclar Bases, realizar uma nova mesclagem de arquivos Scopus e Web of Science e clicar no botão "VOSviewer (formato CSV)" na tela de resultado. O arquivo dados_vosviewer_format.csv será baixado automaticamente com todas as correções aplicadas. Não é necessária nenhuma ação adicional ou configuração especial por parte dos usuários.

Conclusão

Esta atualização reafirma o compromisso da Xplore Dados em oferecer ferramentas de análise bibliométrica robustas e compatíveis com os principais softwares do mercado. Ao garantir a integridade dos dados em todas as etapas do pipeline, facilitamos o trabalho de pesquisadores e equipes acadêmicas na produção de análises de alta qualidade. Seguimos investindo em melhorias contínuas e transparência sobre nossos processos de desenvolvimento.

Observação: texto desenvolvido com auxílio da IA.

Compartilhe este artigo

Voltar para o Blog
Feedback