Introdução
A Xplore Dados continua aprimorando suas ferramentas de análise bibliométrica com foco em precisão e compatibilidade. Esta atualização resolve problemas críticos na exportação de dados mesclados para o VOSviewer, garantindo que autores e referências sejam preservados integralmente e que o arquivo CSV reflita fielmente o Excel deduplicado gerado pela plataforma.
Visão Geral da Atualização
Esta release concentra-se em corrigir o pipeline de exportação do módulo Mesclar Bases, eliminando transformações indevidas que comprometiam a qualidade dos dados enviados ao VOSviewer. As intervenções abrangem desde a leitura dos arquivos Scopus e Web of Science até a geração final do CSV, com atenção especial à preservação de metadados complexos.
- Exportação sem transformações – o serviço de geração de CSV foi completamente reescrito para converter o Excel deduplicado em CSV mantendo estrutura, ordem de colunas e conteúdo originais, sem aplicar normalizações ou padronizações adicionais.
- Integridade de autores e referências bibliográficas – ajustes nos utilitários de padronização impedem que nomes de autores já formatados sejam invertidos incorretamente e que citações completas sejam truncadas em apenas títulos de periódicos.
Mesclar Bases (Scopus + WoS)
Funcionalidades Principais
- Geração direta de CSV deduplicado – a função
generate_vosviewer_csv(file_id, folder)agora lê exclusivamente o arquivo Excel sem duplicados e o converte em dados_vosviewer_format.csv utilizandopandas.read_excelcomdtype=strekeep_default_na=False, seguido deto_csvcomencoding="utf-8-sig",quoting=csv.QUOTE_ALLelineterminator="\n"para preservar quebras de linha internas e caracteres especiais. - Correção do identificador de arquivo no template – o botão de download "VOSviewer" em
mesclar_resultado.htmlfoi corrigido para sempre utilizar ofile_iddo arquivo deduplicado, eliminando a inconsistência que fazia o sistema entregar o arquivo original com duplicados. - Preservação de nomes de autores – o utilitário
standardize_author_namesembiblio_utils.pyfoi aprimorado com detecção de formato existente via regex, identificando automaticamente padrões "Sobrenome, Iniciais" ou "Sobrenome, Nome" e mantendo-os intactos, evitando inversões indevidas que geravam entradas como "W., Lessa, P." no VOSviewer. - Referências bibliográficas completas – removida a normalização de separadores (
standardize_separators) da colunaReferencesem todos os pontos do pipeline:mesclar_service.py(leitura Scopus),wos_parser.py(leitura Web of Science) emesclar.py(mesclagem e deduplicação), garantindo que citações mantenham o formato original com autores, título, volume, páginas e demais metadados necessários para análises de co-citação.
Benefícios Imediatos
Pesquisadores podem agora importar os dados mesclados diretamente no VOSviewer sem necessidade de pré-processamento ou correções manuais. Autores são exibidos corretamente nas redes de coautoria, referências completas habilitam mapas de co-citação precisos, e células vazias permanecem vazias ao invés de serem convertidas em valores NaN. A integridade dos dados deduplicados é mantida em todas as etapas, reduzindo retrabalho e aumentando a confiabilidade das análises bibliométricas.
Integração VOSviewer
Funcionalidades Principais
- Compatibilidade total com formato esperado – o CSV gerado respeita as especificações do VOSviewer, incluindo UTF-8 com BOM para correta leitura de caracteres acentuados, aspas em todos os campos para preservar vírgulas e quebras de linha internas, e separador de linha padrão Unix para máxima compatibilidade multiplataforma.
- Nomenclatura padronizada – o arquivo baixado mantém o nome
dados_vosviewer_format.csvpara facilitar o reconhecimento e organização pelos usuários, independentemente do identificador interno do arquivo mesclado.
Benefícios Imediatos
A integração com o VOSviewer torna-se transparente e confiável. Usuários podem construir redes de colaboração, mapas de palavras-chave e análises de co-citação com dados de alta qualidade, sem enfrentar problemas de codificação, truncamento de campos ou perda de informações estruturadas durante a importação.
Roadmap e Disponibilidade
A atualização está disponível imediatamente no ambiente de produção da Xplore Dados. Para utilizar as melhorias, basta acessar o módulo Mesclar Bases, realizar uma nova mesclagem de arquivos Scopus e Web of Science e clicar no botão "VOSviewer (formato CSV)" na tela de resultado. O arquivo dados_vosviewer_format.csv será baixado automaticamente com todas as correções aplicadas. Não é necessária nenhuma ação adicional ou configuração especial por parte dos usuários.
Conclusão
Esta atualização reafirma o compromisso da Xplore Dados em oferecer ferramentas de análise bibliométrica robustas e compatíveis com os principais softwares do mercado. Ao garantir a integridade dos dados em todas as etapas do pipeline, facilitamos o trabalho de pesquisadores e equipes acadêmicas na produção de análises de alta qualidade. Seguimos investindo em melhorias contínuas e transparência sobre nossos processos de desenvolvimento.
Observação: texto desenvolvido com auxílio da IA.