BIBLIOTECONOMIA DIGITAL


SOBRE METABUSCADORES E SERVIÇOS DE DESCOBERTA

Os catálogos são as ferramentas utilizadas para exposição das coleções existentes nas bibliotecas. Tradicionalmente, desde seu período analógico, este instrumento permite o conhecimento, identificação e acesso aos registros, num primeiro momento limitando-se à descrição dos recursos prioritariamente impressos, como livros, revistas, folhetos e monografias. Os catálogos com as coleções audiovisuais ou iconográficas eram tratados de forma separada, em locais distintos, desvinculados do acervo textual, obrigando o usuário a realizar suas estratégias de busca diversas vezes, em instrumentos diferentes. Não era raro encontrar instituições cujo catálogo de impressos estava disponível para consulta e os demais recursos restritos a consultas presenciais. Com a inclusão de recursos informacionais em suportes não textuais ao catálogo geral – gravações de som, vídeo, iconografia, tridimensional etc. – torna-se premente a reunião em um único local de todas as ofertas de dados. A partir deste momento o catálogo – já disponível para consulta na web –, passa a contar com recursos diversos, facilitando a pesquisa do usuário ao permitir a consulta de todo o acervo em um único local, de forma integrada. Pesa também o fato que, no início das ofertas de conteúdo digitais, muitas bibliotecas optaram por descrever sua biblioteca digital separadamente do acervo analógico. Esta decisão obrigava o usuário a repetir suas estratégias de busca, sem contar que a biblioteca precisava realizar a gestão de dois acervos – o analógico e o digital – redundando suas atividades de controle bibliográfico e catálogo de autoridades.

 

Atualmente as bibliotecas não contam mais apenas com seus acervos físicos ou digitais, mas passaram a utilizar-se de serviços de informação que ofertam farto conteúdo digital, normalmente assinados/licenciados, de forma permanente ou temporária, onde oferecem a seus usuários acesso a informações de fontes diversas como bases de dados, repositórios, periódicos eletrônicos, e-books etc. Considerando que cada ferramenta assinada/acessada conta com sua plataforma proprietária, a problemática de acessar e repetir a estratégia de busca em diversos instrumentos volta a ser recorrente. A resposta para este problema foi atendida com dois instrumentos: os metabuscadores e os serviços de descoberta. Ao reunir em um único local a possibilidade de realizar uma busca em diversas fontes, de forma integrada, poupa o tempo do usuário e permite que ele tenha dimensão da amplitude das obras oferecidas nos acervos e concentre a localização destes recursos através de uma única interface.

 

Apesar de muitas vezes os usuários recorrerem ao Google para realizar suas pesquisas em detrimento aos catálogos, é preciso ressaltar que a pesquisas realizadas em buscadores da internet não apresentam a mesma eficiência dos catálogos das bibliotecas por diversos fatores como:

 

a)    As bibliotecas reúnem conteúdo pré-selecionado, de acordo com sua política de desenvolvimento de coleção e alinhado às necessidades de seu público alvo;

b)    A descrição dos registros é direcionada de acordo com o público, com os níveis descritivos visando atender à necessidade informacional dos usuários;

c)     Padronização da linguagem utilizada, com utilização de ferramentas como vocabulários controlados, catálogo de autoridades e demais instrumentos que atuam em oposição aos métodos dos buscadores que utilizam-se de linguagem não controlada.

 

Ao reunir em um único local registros de fontes diversas com um controle de terminologia e padronização, a qualidade da recuperação da busca é sensivelmente ampliada, permitindo aos usuários maiores possibilidades de localização das informações que necessitam, sem mencionar aqui questões como pertinência, relevância e autenticidade das fontes utilizadas.

 

A metabusca, ou busca federada, permite a integração de diversas fontes de dados em um único local. As informações estão dispersas, em fontes e ferramentas distintas e os dados são agrupados e apresentados em um único resultado (JACSO, 2004). As fontes de informação são, desta forma, pesquisadas simultaneamente (catálogos das bibliotecas, bases comerciais, web etc.), recolhendo a informação a partir de várias fontes, expondo o resultado de busca de forma integrada ao usuário (WADHAM, 2004).

 

De acordo com Maranhão (2011), os metabuscadores permitem que os usuários identifiquem recursos diversos mesmo que desconheçam as bases assinadas pela biblioteca, assim como as peculiaridades das ferramentas de busca de cada uma das fontes disponíveis, realizando a pesquisa em uma única caixa de texto, reproduzindo a experiência encontrada no Google. Isto remete à sensação de familiaridade com a interface de busca, tornando a experiência da pesquisa mais confortável ao usuário, sem obriga-lo a conhecer e dominar as possibilidades de pesquisas oferecidas por cada serviço de informação.

 

Os metabuscadores, após a coleta dos registros em cada fonte integrada, classificam os grupos de resultados, estabelecendo relevâncias a partir dos metadados coletados. Também é possível realizar o refinamento dos resultados obtidos, ordenando e filtrando os registros por data, tipo de material etc. Para cada base de dados integrada é necessário utilizar-se de um conector que permitirá a comunicação do metabuscador com as fontes consultadas (MARANHÃO, 2011). Com a utilização deste recurso, o usuário não necessita utilizar a plataforma de cada fonte pesquisada (ou visitar diversos sites), uma vez que as bases estão interligadas e os resultados podem ser obtidos através de pesquisa realizada através de uma única interface.

 

Ao expor os dados coletados algumas questões precisam ser observadas:

 

a)    Os metabuscadores são adequados para poucas bases de dados, que normalmente apresentam grandes coleções. Normalmente muitos servidores Z39.50 são pesquisados simultaneamente por estas ferramentas;

b)    A escalabilidade do serviço de informação impacta a pesquisa. Quanto mais bases de dados estão integradas, maior será o tempo de resposta;

c)     O tempo de resposta é impactado de acordo com a velocidade de resposta das fontes consultadas, podendo apresentar falhas (tempo expirado, base indisponível). A velocidade de pesquisa dependerá da velocidade de conexão de cada fonte;

d)    Cada fonte tem seus critérios de relevância para ordenação dos resultados;

e)    Duplicação de registros: um mesmo registro pode estar presente em mais de uma das fontes. Como a pesquisa é realizada de forma integrada, porém com a exposição dos registros por fonte, observa-se a existente de duplicidade de registros.

 

Os serviços de descoberta, ou discovery services, são sistemas de coleta de dados realizados por harvesting (colheita). Cada base de dados é pesquisada previamente, os metadados são coletados e reunidos em uma única base, formando um único repositório, que se utiliza de uma interface de busca que apresenta os resultados reunidos (MARANHÃO, 2011). De acordo com Vaughan (2001) apud Maranhão (2011), os serviços de descoberta proporcionam resultados apurados ao reunir os dados coletados em uma única lista, de forma mais rápida, independente da velocidade de resposta de cada base consultada. Como os dados foram recolhidos previamente, é possível organizar as informações por critérios de relevância (do serviço de descoberta e não de cada ferramenta), podendo, inclusive, incluir mais detalhes e recursos aos registros ao unificar metadados que descrevem a mesma obra, porém com critérios descritivos diferentes. Desta forma os metadados presentes em um registro podem ser agregados a outro quando são identificados que se tratam da mesma informação, porém que sofreu descrição distinta de acordo com a fonte de onde provem. Frequentemente os serviços de descoberta realizam a pré-indexação de texto completo, aumentando as possibilidades de identificação de novas referências aos usuários. A coleta dos dados das fontes pesquisadas é realizada com regularidade, norteada por robôs de pesquisa, que acessam as bases frequentemente identificando adições ou edições nos metadados, incluindo ou alterando estas informações no repositório. Os tempos de atualização são definidos entre os serviços de descoberta e a biblioteca, de acordo com a estrutura projetada e contratada.

 

Os serviços de descoberta apresentam as seguintes características:

 

a)    Rapidez na recuperação, ao pesquisar em um repositório que reuniu as fontes integradas, sem sofrer impacto do tempo de resposta de cada base;

b)    Aplicação de critério de relevância único dos dados coletados, sem interferência das diretivas utilizadas pelas bases integradas;

c)     Indexação dos metadados coletados e texto completo (quando disponíveis) o que confere melhor recuperação;

d)    Eliminar ou diminuir a repetição de registros iguais;

e)    Atualizações automatizadas por rotinas de coleta;

f)     Interface familiar ao usuário, muitas vezes com recursos de sugestão de grafia, inclusão de tags ou criação de feeds.

 

As empresas responsáveis pelos serviços de descoberta vêm trabalhando para desenvolver parcerias e acordos comerciais com a maior gama de fontes possíveis, desenvolvendo conectores que permitam integração, ampliando a oferta de conteúdo indexado. Estes esforços também têm sido observados junto aos sistemas de bibliotecas, permitindo a integração com o OPAC (Online Public Access Catalog), tornando o catálogo da biblioteca uma das alternativas de pesquisa reunidas pelos serviços de descoberta (VAUGHAN, 2011). De acordo com Maranhão (2011), é frequente que serviços de descoberta ofereçam conteúdos não adquiridos / assinados pela biblioteca, facultando, desta forma, que a biblioteca tome conhecimento de outros recursos disponíveis – bases de dados referenciais –, mesmo que não tenha acesso ao conteúdo completo. Este modelo de negócios é denominado pesquisa além da biblioteca (beyound your library’s collection) e proporciona a expansão da busca a demais conteúdos externos, inclusive OPACs de outras instituições e sites da internet como Google Books e Wikipedia.

 

A caixa para pesquisa dos serviços de descoberta vem conquistando espaços de destaque, muitas vezes na página inicial da biblioteca já apresentando o recurso, dispensando até mesmo que o usuário entre no OPAC para realizar buscas. Outras instituições reúnem em sua página inicial links diversos como: busca integrada, catálogo e demais serviços/bases contratados ou parceiros, com o acesso ao serviço de descoberta aparecendo em primeiro lugar ou em destaque. Isto pode ser observado em bibliotecas de instituições como Unicamp (http://www.sbu.unicamp.br/portal/), USP (http://www.usp.br/sibi/) e Unesp (http://www.parthenon.biblioteca.unesp.br). Dentre as ferramentas de serviço de descoberta com maior atuação no Brasil temos: Primo (Ex Libris), Summon (Serial Solutions, ProQuest) e EDS (Ebsco Discovery Search). Existem outras ferramentas, inclusive em software livre (open source), porém as três citadas apresentam postura comercial com estratégia no Brasil.

 

No momento atual, com a crescente oferta de conteúdos digitais e a diversidade de fontes e fornecedores, é prioritário que as bibliotecas ofereçam estes recursos a seus usuários. Ao contratar ferramentas de busca integrada – metabuscadores ou serviços de descoberta – proporciona aos usuários que a pesquisa a diversas fontes, incluindo o catálogo da biblioteca, seja unificada, contribuindo para que o usuário identifique de forma simples e rápida toda a variedade de registros e recursos disponibilizados pela biblioteca. Tanto os metabuscadores quanto os serviços de descoberta permitem a integração com fontes externas diversas, ficando a critério da biblioteca decidir qual ferramenta atende suas demandas e está alinhado com o orçamento existente. Infelizmente estes recursos avançados representam investimentos significativos, com aplicação voltada prioritariamente às bibliotecas universitárias, devido à necessidade de pesquisa e consequente produção acadêmica e necessidade de consumo de informação dos usuários. Observa-se um movimento cada vez mais premente para que as bibliotecas trabalhem com seus registros, mas que também se utilizem de conteúdos e fontes externas – gratuitas ou licenciadas. Ao prover este tipo de serviço de informação é necessário alinhar os interesses do acervo com a facilidade de acesso aos usuários, assim como permitir ampla descoberta dos esforços centrados em trazer de volta à biblioteca o usuário que se refugiou no Google.

 

Referências bibliográficas

 

JACSÓ, Péter. Thoughts about federated searching. Information Today, v.21, n.9, p.17-20, oct. 2004. Disponível em: <http://www.infotoday.com/IT/oct04/index.shtml>. Acesso em: 01 ago. 2013.

 

MARANHÃO, Ana Maria Neves. Dos catálogos aos metabuscadores e serviços de descoberta na Internet: uma visão geral. In: CONGRESSO BRASILEIRO DE BIBLIOTECONOMIA, DOCUMENTAÇÃO E CIÊNCIA DA INFORMAÇÃO, 24., 2011, Maceió. Anais... . São Paulo: Febab, 2011. Disponível em: <http://www.febab.org.br/congressos/index.php/cbbd/xxiv/paper/view/312>. Acesso em: 01 ago. 2013.

 

VAUGHAN, Jason. Differentiators and a final note. Library Technology

Reports, v. 47, n. 1, p. 48-53, jan. 2011. Disponível em: Academic Search Premier, EBSCOhost. Acesso em: 01 ago. 2013.

 

WADHAM, R. L. Federated Searching. Library Mosaics, v. 15, n. 1, p. 20, Jan./Feb. 2004.


   842 Leituras


Saiba Mais





Próximo Ítem

author image
DIREITOS AUTORAIS E BIBLIOTECAS DIGITAIS
Setembro/2013

Ítem Anterior

author image
NOVIDADES QUE SOPRAM DE CHICAGO
Agosto/2013



author image
LILIANA GIUSTI SERRA

Doutoranda em Ciência da Informação pela Universidade Estadual Paulista Julio de Mesquita Filho (UNESP). Mestre em Ciência da Informação pela Escola de Comunicações e Artes da Universidade de São Paulo (ECA/USP). Bibliotecária com especialização em Gerência de Sistemas e Serviços de Informação pela Fundação Escola de Sociologia e Política de São Paulo (FESP). Profissional de Informação dos softwares SophiA Biblioteca, SophiA Acervo e Philos.