GERAL


CAÇADOR DE PLÁGIOS


Programa de computador identifica casos de duplicidade em artigos científicos publicados. Uma análise de 7 milhões de textos da base de dados Medline resultou em quase 70 mil artigos considerados altamente semelhantes


Plagiar artigos científicos é uma prática que pode estar com os dias contados. Pelo menos se depender da novidade que vem do Centro Médico da Universidade do Sudoeste do Texas, nos Estados Unidos.

O grupo liderado pelo professor Harold Gardner desenvolveu um programa de computador que compara múltiplos documentos em bases de dados em busca de semelhanças no conteúdo. O software Etblast identifica a duplicação de palavras-chave e compara a proximidade e o encadeamento de palavras, entre outras variáveis.

A novidade oferece um método eficiente e rápido para conduzir buscas na literatura científica e permite aos editores de revistas identificar a ocorrência de práticas questionáveis de publicação.

A ferramenta também é útil para pesquisadores que desejam verificar se e quando o tema do projeto em que estão trabalhando foi objeto de publicações anteriores, não apenas para ampliar o conhecimento, mas também para identificar possíveis colaboradores.

No desenvolvimento do Etblast, o grupo de Garner inicialmente usou o sistema para analisar mais de 62 mil textos publicados nos últimos 12 anos e disponíveis na base Medline, uma das principais na área médica. O software identificou que 0,04% dos textos com autores diferentes eram altamente semelhantes, em casos potenciais de plágio.

O número pode parecer significante, mas em uma base com 17 milhões de artigos representa cerca de 7 mil textos. O programa também identificou que 1,35% dos artigos com um ou mais autores iguais eram suficientemente semelhantes para serem considerados como publicações duplicadas dos mesmos dados, outra prática questionável. Os resultados foram descritos na edição de 15 de janeiro da revista Bioinformatics.

Na segunda fase do desenvolvimento, cujos resultados estão em comentário na edição de 24 de janeiro da Nature, o software foi aperfeiçoado e ganhou mais velocidade, tornando-se milhares de vezes mais rápido. Uma análise de 7 milhões de textos na Medline resultou em quase 70 mil artigos semelhantes.

“O plágio é a mais extrema e nefasta forma de publicação, mas submeter simultaneamente os mesmos resultados de pesquisas a diversos veículos ou repetir a publicação dos mesmos dados também podem ser considerados inaceitáveis em muitas circunstâncias”, disse Garner.

Mas o pesquisador lembra que, em relação a publicações repetidas, há algumas formas que podem ter valor para a comunidade científica. Um exemplo são atualizações dos progressos de estudos de longo prazo ou de análises longitudinais, que freqüentemente contêm reproduções literais de partes do texto original.

“Com nossa ferramenta, conseguimos identificar publicações semelhantes, mas nem o computador nem nós mesmos somos capazes de julgar se um artigo é um plágio. Essa tarefa cabe aos revisores, como os editores de publicações ou comitês de éticas das universidades, que são os grupos responsáveis para a determinação da legitimidade”, destacou Garner.

O pesquisador espera que o software possa ajudar a diminuir as práticas questionáveis na publicação científica. “À medida que ferramentas como o Etblast se tornarem mais conhecidas e usadas pelos editores e revisores durante o processo de submissão dos artigos, esperamos que o número de duplicações potenciais diminua consideravelmente”, disse.

O comentário A tale of two citations, de Mounir Errami e Harold Garner, pode ser lido por assinantes da Nature em http://www.nature.com.
(Agência Fapesp, 30/01)


Fonte: JC e-mail 3441, Notícia 24 – Segunda feira, 30 de janeiro de 2008
Divulgado por Rosalvio Sartortt – Enviado para “bibliotecarios” em 30/01/2008

   254 Leituras


Próximo Ítem

author image
USO DE COMPUTADORES POR ESTUDANTES ESTÁ RELACIONADO A PIOR DESEMPENHO
Fevereiro/2008

Ítem Anterior

author image
ESCOLA JOGA LIVROS NO LIXO
Março/2008



author image
OSWALDO FRANCISCO DE ALMEIDA JÚNIOR

Professor associado do Departamento de Ciência da Informação da Universidade Estadual de Londrina. Professor do Programa de Pós-Graduação em Ciência da Informação da UNESP/Marília. Doutor e Mestre em Ciência da Comunicação pela ECA/USP. Professor colaborador do Programa de Pós-Graduação da UFCA- Cariri - Mantenedor do Site.