DO MARC 21 AO MODERNO MARC: NOVAS DIRETRIZES PARA CODIFICAÇÃO CATALOGRÁFICA

Por FERNANDO MODESTO
Abril/2026

Apesar de ter comentado, nesta coluna, sobre a descontinuidade do formato MARC, o formato segue resistindo, oxigenado por novas intervenções de sua preceptora – a Library of Congress (LC).

Atualmente, ela concentra esforços catalográfico na criação de registros bibliográficos MARC mais "modernos". A LC sinaliza mudança do MARC 21 para nova denominação “Modern” MARC (ou Moderno MARC). Bibliotecários de catalogação devem atentar para procedimentos que visam adequar a tradicional codificação MARC 21 para o contexto do RDA baseado no MARC/BIBFRAME.

Documento recente de 24 de março de 2026, apresenta diretrizes de mudanças seguidos pela LC e que irão afetar a sua política de catalogação e influenciar outras existentes em instituições bibliográficas.

Neste aspecto, elabora-se uma descrição compilada destas mudanças, refletidas na alteração de registros que incluirão menos dados codificados em campos fixos, em favor de dados textuais informados em campos variáveis (para alinhamento com o RDA (Resource Description & Access), adotado pela LC.

Destaca-se que, durante a transição, não haverá conversão retrospectiva em larga escala dos registros. As mudanças serão introduzidas organicamente, à medida que os catalogadores da LC, no desempenho de suas tarefas, ajustarem suas práticas para reduzir a redundância de dados.

A intenção da LC é que os registros bibliográficos criados com o editor de dados vinculados BIBFRAME — Marva — passem, a partir de março, a incluir etiquetas de idioma BCP47 quando convertidos para MARC. A maioria dessas etiquetas está associada ao campo 880 e aos seus pares de campos regulares.

Os registros de fornecedores, que a LC importa e distribui antes e depois de passarem por modificação interna, rotineiramente incluem diversos identificadores e agora incorporam as mudanças de modelagem discutidas no documento de ajustes ao RDA. Os registros importados para o sistema da LC, via catalogação por cópia (copy cataloging), seguem o mesmo padrão: são repletos de identificadores e incorporam alterações de modelagem para acomodar dados do RDA.

A diretriz atual da LC é realizar apenas as alterações necessárias nos registros importados para apoiar suas coleções. Como as variações de modelagem e os identificadores presentes nesses registros são inteiramente válidos — e sua remoção resultaria em descrições de qualidade inferior, além de demandar esforço desnecessário dos catalogadores — tais divergências e acréscimos foram mantidos.

Ademais, os membros do Programa de Catalogação Cooperativa (PCC) têm aprimorado registros bibliográficos com URIs como parte do projeto “PCC URIs in MARC Pilot”, iniciado em 2019. Eles estão autorizados a adicionar URIs tanto em registros bibliográficos, quanto em registros de autoridade MARC.

Embora o documento da LC aqui descrito trate especificamente de registros bibliográficos MARC, os registros de autoridade, distribuídos pela instituição há mais de uma década, também suportam os recursos abordados.

Reforça-se que o documento comentado funciona como um comunicado oficial das práticas da LC, que passará a criar e distribuir registros contendo identificadores adicionais, bem como escolhas de modelagem específicas direcionadas ao RDA e aos dados vinculados (linked data).

O MARC ao longo do tempo

O formato MARC possui uma longa tradição e um histórico consistente de suporte às práticas catalográficas em transformação. Seu uso efetivo como formato de intercâmbio de dados teve início em 1968, com o MARC II, inicialmente voltado para recursos monográficos textuais (livros). Nos 15 anos seguintes, expandiu-se para outros grupos de recursos: seriados, mapas, música e gravações sonoras, filmes e materiais visuais, arquivos de computador e manuscritos. Posteriormente, cada mídia foi ampliada para contemplar subgrupos específicos, como videodiscos, globos, textos eletrônicos, entre outros.

Ao longo desse período evolutivo, novas regras de catalogação exigiram ajustes no formato. Diversos capítulos especiais do Anglo-American Cataloguing Rules (AACR) foram publicados na década de 1960, seguidos pelo AACR2 no início da década de 1970.

Até a década de 1990, cada grupo de recursos bibliográficos possuía seu próprio formato, em uma tentativa de tratar de forma consistente os elementos de dados sobrepostos entre diferentes mídias. Nesse contexto, o projeto denominado format integration reuniu as diversas especificações MARC baseadas em mídia, introduzindo alterações no MARC para consolidar, em uma única especificação — o USMARC — os vários elementos incorporados ao longo do tempo, promovendo maior consistência.

Entretanto, com a introdução do RDA em 2010 — as regras de catalogação atualmente vigentes — surgiram novas redundâncias e diferenças no MARC. Essas mudanças refletiram novas abordagens de modelagem dos dados bibliográficos e uma terminologia renovada para descrevê-los.

A Codificação de Dados no MARC com o RDA

Uma das principais mudanças introduzidas pelo RDA foi a substituição de códigos por expressões textuais. Antes, muitas informações sobre o suporte físico de um recurso bibliográfico eram codificadas em campos “fixos” do formato MARC (como os campos 007 e 006), nos quais o bibliotecário de catalogação precisava inserir letras ou números compreendidos apenas pelo sistema ou por especialistas.

Esse cenário pode ser ilustrado pelos próprios campos 007 e 006. Subcampos textuais na faixa dos campos MARC 3XX foram estabelecidos para registrar, de forma redundante e textual, grande parte dos dados anteriormente codificados nos campos fixos. Grande parte — senão toda — a informação codificada nesses campos pode agora ser registrada em novos campos variáveis. Exemplo do 007:

007 kd#bc|

são duplicado com o 340:

340 ## $a cardboard $d collotype $g black and white

Bibliotecários de catalogação passam a ser treinados para o uso dos novos campos 3XX. Mas a prática catalográfica anterior, de registrar esta mesma informação em campos fixos continua.

Isso não só produz dados duplicados e redundantes nos registros bibliográficos MARC, mas exige um esforço adicional e redundante, por parte dos catalogadores.

Além da descrição textual (em vez de codificada), o RDA incentiva o uso de identificadores nos dados. Eles são essenciais para dados ligados. Muitos desses identificadores assumem a forma de Identificadores Uniformes de Recursos, ou URIs, que normalmente se parecem com (e são) um endereço da web, ou URL. Exemplo: http://id.loc.gov/vocabulary/mmaterial/crd

O uso de URIs, ou identificadores em geral, não apenas introduz dados adicionais aos registros, mas exige alteração na forma como os dados são modelados no MARC. Antes (ver acima o exemplo do campo 340), um único campo podia ser usado para múltiplos valores; para associar claramente identificadores com etiquetas, o campo deve ser repetido:

340	##	$a cardboard $0 http://id.loc.gov/vocabulary/mmaterial/crd
340	##	$d collotype $0 http://id.loc.gov/vocabulary/mproduction/collo
340	##	$g black and white $0 http://id.loc.gov/vocabulary/mcolor/blw

Embora a repetição de campos às vezes seja feita para relacionar URIs e valores, ela será usada de forma mais consistente nos registros da LC para evitar ambiguidade.

Duplicação de dados

Conforme indicado acima, a maior parte dos dados transportados em forma codificada na etiqueta 007 será transportada aos campos 3XX estabelecidos para esses dados, quando o RDA foi adotado.

No entanto, por um período de transição, as duas primeiras posições de caracteres do campo 007 (007/0, 007/1) continuarão a ser transportadas nos registros, mesmo que dupliquem informações nos novos campos 337 e 338 estabelecidos para o RDA.

Pontuação ISBD mínima

Em linha com as políticas do PCC sobre a redução da quantidade de pontuação ISBD em registros bibliográficos e a permissão de flexibilidade na aplicação da pontuação ISBD, os registros continuarão a reter a pontuação ISBD completa apenas nos campos 245 e 264. Pontuação ISBD parcial nos campos 250 e 490, mas terão pontuação ISBD mínima em outras partes do registro bibliográfico. A forma de catalogação descritiva MARC (Ldr/18) será codificada como "i" (pontuação ISBD incluída).

Escritas não latinas

Os registros bibliográficos MARC da LC devem expandir as escritas não latinas utilizadas. Eles terão as seguintes características:

Pontos de acesso – ex.: 130, 240, 700, 710, 711, 730 – continuarão a conter transliteração de dados não latinos, com o campo 880 pareado contendo os dados não latinos. A transliteração será, em geral, fornecida nos campos 245, 250, 264 e 490, com o campo 880 pareado contendo quaisquer dados não latinos.
A transliteração de dados não latinos estará em campos regulares (campos não-880), como agora. A transliteração seguirá, como agora, as tabelas de transliteração ALA-LC. Os campos 880 serão vinculados aos campos transliterados da maneira usual, usando a técnica do subcampo $6. Dados em escrita não latina que não estejam pareados com um campo latino podem estar em campos regulares, em vez de campos 880. Isso ocorrerá principalmente na faixa dos campos de nota 5XX. Alguns "não latinos" não pareados continuarão indicados no campo 880 com um indicador esclarecendo que os dados não se pareiam com um campo latino.
Códigos de idioma e escrita BCP47 serão incluídos nos registros MARC conforme descrito a seguir.

Códigos BCP47 em subcampos de proveniência dos dados (em geral $7)

BCP47 é uma referência abreviada para a especificação que codifica idiomas humanos e escritas em estruturas de dados contemporâneas, especialmente aquelas projetadas para a web. A especificação é publicada pela Internet Engineering Task Force (IETF).

Os componentes BCP47 são separados por hífens e identificáveis pelo comprimento e posição no código geral. Os dois ou três primeiros caracteres são o idioma: "ko" ou "en" ou "sgn". Se o segundo componente (após um hífen) tem quatro caracteres, é uma referência de escrita: "ko-hang" ou "en-latn".

Normalmente, se a escrita pode ser inferida a partir do idioma, ela não é incluída, pois é considerada informação desnecessária. Por exemplo, o "latn" em "en-latn" ou o "hebr" em "yi-hebr" é desnecessário porque, se o texto está em inglês, presume-se a escrita latina e, se o texto está em iídiche, presume-se a escrita hebraica.

O idioma e a escrita podem ser derivados de registros MARC existentes na maioria dos casos. Adicionar a codificação BCP47 e capturar essas informações nos ambientes BIBFRAME e MARC permite maior precisão e prepara o sistema catalográfico para descrições mais específicas de idioma em dados bibliográficos.

Nos registros do Moderno MARC, os códigos de idioma/escrita BCP47 serão incluídos em subcampos de Proveniência dos Dados do campo 880 e, geralmente, de seus pares romanizados.
Códigos de idioma/escrita BCP47 podem ser incluídos em outros campos se considerado apropriado pelo bibliotecário de catalogação, desde que a captura do idioma e/ou escrita seja considerada relevante.
Embora a indicação do subcampo de Proveniência dos Dados permita a identificação específica do subcampo, os códigos BCP47 adicionados no Moderno MARC farão referência a todo o campo MARC. Com o tempo, a LC buscará maneiras de tornar isso mais preciso. Alguns podem considerar este um design imperfeito, pois invariavelmente identificará uma escrita com texto "não latino" e latino como sendo inteiramente não latina. Por exemplo:

880

$6100-01/$1 $a $c (Cartographer) $e cartographer

$7 (bcp47)ko

O componente de escrita do código BCP47 não será incluído quando a escrita puder ser inferida a partir do componente de idioma. Os códigos BCP47 serão todos em minúsculas.

Esta funcionalidade ainda está em fase inicial e, portanto, está sujeita a alterações.

Indicação de provisão

Para suportar o RDA, um novo campo de indicação de provisão, 264, foi estabelecido no MARC para separar e rotular as declarações de produção, publicação, distribuição e fabricação.

Essas declarações eram reunidas em uma única indicação, por muitos anos, no campo 260, já que o campo não era repetível até 2011. A LC irá aproveitar essa indicação de provisão.

Registros MARC que, anteriormente continham várias indicações de provisão em um único campo 260, irão usar um campo 264 para separar cada declaração de provisão em um 264.

Prática anterior:

260

$a London, England : $b Penguin Books ; $a New York, N.Y. :

$b Penguin Putnam, $c 1999

Descrição convertida para:

264	#1	$a London, England : $b Penguin Books.
264	#1	$a New York, N.Y. : $b Penguin Putnam, $c 1999.

Transcrição de série

O campo MARC 490 é usado para registrar uma declaração de série transcrita. No campo 490, o subcampo $a é repetível para uma série principal que tem uma subsérie ou quando uma série tem um título paralelo. Para desambiguar a indicação de série transcrita combinada, registros MARC que anteriormente continham várias indicações de série em um único campo 490 separarão as indicações de série em um campo 490 para cada declaração: título da série principal e título da subsérie, ou título da série e título paralelo da série.

Prática anterior:

490

$a Department of State publication ; $7 846.

$a Department and Foreign Service series ; $v 128

Descrição convertida para:

490	1#	$a Department of State publication ; $v 7846.
490	1#	$a Department and Foreign Service series ; $v 128

Tornando o LCSH mais compatível com dados ligados

As políticas de subdivisões de gênero/forma do Library of Congress Subject Headings (LCSH) não são compatíveis com dados ligados, pois para muitas escritas de cabeçalho LCSH + subdivisão de gênero/forma não há um URI abrangente correspondente.

O BIBFRAME é uma oportunidade para tornar o LCSH mais compatível com dados ligados. Os registros do Moderno MARC nem sempre incluirão subdivisões de forma do LCSH. Em vez de subdivisões de forma do LCSH, um termo facetado de Library of Congress Genre/Form terms (LCGFT) será atribuído no campo 655 para identificar o gênero/forma do recurso.

Deste documento, que apresenta as diretrizes catalográficas a serem seguidas pela LC, destacam-se os seguintes pontos principais:

A modernização dos registros MARC: A LC passa a adotar registros MARC com menos dados codificados em campos fixos e mais dados textuais em campos variáveis, além de mais identificadores (como URIs), alinhando-se ao RDA e a práticas de dados ligados.
As mudanças em curso: Muitas dessas práticas já são observadas em registros de fornecedores e no PCC. A LC não adotará conversão retroativa em larga escala; as mudanças ocorrerão organicamente.
O histórico do MARC: O MARC evoluiu desde 1968, passou pela integração dos formatos nos anos 1990. Com o RDA (2010), surgiram redundâncias e necessidade de novas modelagens.
A preferência pelo texto em vez da codificação: Dados antes registrados em campos fixos (ex.: 007) passam a ser registrados também em campos textuais 3XX (ex.: 340), mas a prática catalográfica antiga persiste, gerando redundância. A LC passa a usar repetição de campos para associar URIs a valores de forma inequívoca.
A duplicação transitória: Durante essa transição, os primeiros dois caracteres do 007 continuarão, mesmo com os novos campos 337 e 338.
A pontuação ISBD mínima: Apenas os campos 245 e 264 terão pontuação ISBD completa; 250 e 490 terão pontuação parcial; os demais terão pontuação mínima. Ldr/18 será "i".
As escritas não latinas: Uso expandido de escritas não latinas. Transliteração em campos regulares; dados não latinos em campos 880 pareados. Códigos BCP47 (idioma/escrita) serão incluídos em subcampos de proveniência ($7).
A declaração de provisão (campo 264): Substitui o antigo campo 260, não repetível; cada declaração (produção, publicação, distribuição, fabricação) terá seu próprio campo 264.
A transcrição de série (campo 490): Séries e subséries ou títulos paralelos serão separados em campos 490 distintos.
A LCSH e dados ligados: Subdivisões de forma do LCSH serão evitadas por não serem compatíveis com dados ligados; em seu lugar, usar-se-ão termos de gênero/forma do LCGFT no campo 655.

Saliente-se que a documentação do "Moderno" MARC reflete a nova prática e fornecer informações sobre os códigos BCP47 e o seu uso.

Indicação de leitura:

Library of Congress. “Modern” MARC. MARC Format, 03/24/2026.

843 Leituras

Saiba Mais

Próximo Ítem

APLICAÇÃO DO BCP 47 NA CATALOGAÇÃO BIBLIOGRÁFICA PARA CODIFICAÇÃO DE IDIOMA E ESCRITA
Maio/2026

Ítem Anterior

ATUALIZAÇÕES RECENTES DO FORMATO MARC 21 PARA DADOS BIBLIOGRÁFICOS
Março/2026

FERNANDO MODESTO

Bibliotecário e Mestre pela PUC Campinas (SP), Doutor em Comunicação pela USP e Professor no curso de Biblioteconomia e Ciência da Informação da ECA/USP.