Utilitzar el Dublin Core

Títol

Utilitzar el Dublin Core

Contribuïdor  (traducció):

Biblioteca de Catalunya

Creador:

Diane Hillmann

Data d'edició:

2002-04-25

Identificador:

http://www.bnc.cat/sprof/normalitzacio/dc/dc_guide0.php

última versió anglesa:

http://dublincore.org/documents/usageguide/

Traduccions:

http://dublincore.org/resources/translations/

Estatus del document:

Traducció catalana d'una Recomanació de la  DCMI

Descripció del  document:

Aquest document està pensat com a punt d'entrada dels usuaris del Dublin  Core. Ajudarà els no especialistes a crear registres descriptius simples de  recursos d'informació (per exemple, documents electrònics). Els especialistes  poden trobar en el document un punt de referència útil per a la documentació del  Dublin Core, a mesura que aquesta canvia i creix.

 

Sumari

1. Introducció

1.1 Què són les metadades?
1.2 Què és el  Dublin Core?
1.3 Objectiu i abast d'aquesta  guia

2. Sintaxi i qüestions relacionades

2.1 HTML
2.2 RDF/XML
2.3 Metadades incloses en un recurs
2.4 Metadades independents

3. Principis bàsics dels elements  descriptius

3.1 Contingut dels elements i vocabularis  controlats

4. Elements bàsics

5. Qualificadors

5.1 Classes de qualificadors
5.2 El  principi "Dumb-Down"

6. Exemples

6.1 Exemples genèrics[Enllaç al document original en anglès]
6.2 Exemples en HTML simples [Enllaç al document original en  anglès]
6.3 Exemples en HTML qualificats [Enllaç al document original en  anglès]
6.4 Exemples en RDF simples (de pròxima aparició)
6.5 Exemples  en RDF qualificats (de pròxima aparició)
6.6 Exemples d'altres  fonts:

  • AGLS [Enllaç al document original en anglès]
  • EdNA [Enllaç al document original en anglès]

7. Glossari[Enllaç al document original en anglès]

8. Lectures i referències[Enllaç al document original en  anglès]

 

1. Introducció

1.1 Què són les metadades?

Es pot dir que hi ha metadades d'ençà que el primer bibliotecari va fer una  llista dels documents d'un prestatge amb rotlles manuscrits. El terme "meta" ve  d'una paraula grega que vol dir "juntament, amb, després, a continuació". Però,  de fet, el llatí o el català empren el prefix "meta" per designar alguna cosa  transcendent o que va més enllà de la naturalesa. Les metadades, doncs, es poden  considerar dades sobre altres dades. és el terme de l'era Internet per a la  informació que els bibliotecaris han donat tradicionalment en els catàlegs i que  fa referència més comunament a la informació descriptiva sobre recursos web.

Un registre de metadades consta d'un conjunt d'atributs o elements necessaris  per a descriure el recurs en qüestió. Per exemple, un sistema de metadades comú  en biblioteques -el catàleg de biblioteques- consta d'un conjunt de registres de  metadades amb elements que descriuen un llibre o qualsevol altre document d'una  biblioteca: autor, títol, data de creació o edició, matèries i signatura  topogràfica que especifica la localització del document al prestatge.

L'enllaç entre un registre de metadades i el recurs que descriu pot prendre  una d'aquestes dues formes:

1. els elements es poden incloure en un registre separat del document, com en  el cas d'un registre del catàleg d'una biblioteca; o

2. les metadades poden estar inserides en el recurs mateix.

Com a exemples de metadades inserides que es troben incorporades en el recurs mateix, hi ha les dades CIP (Cataloging In Publication) impreses al verso de la portada del llibre, o la capçalera TEI en un text electrònic. Moltes de les normatives de metadades que s'utilitzen avui en dia, incloent-hi la normativa  del Dublin Core, no prescriuen cap tipus d'enllaç i permeten decidir en cada  implementació particular.

Tot i que el concepte de metadades és anterior a Internet i al Web, l'interès  per les normatives i les pràctiques de metadades ha esclatat amb l'augment de l'edició electrònica i les biblioteques digitals i amb la "sobrecàrrega  d'informació" resultant de les grans quantitats de dades digitals indiferenciades disponibles en línia. Tothom qui hagi provat de trobar  informació en línia utilitzant un dels populars serveis de cerca al Web haurà experimentat la frustració de recuperar centenars, i fins i tot milers  d'"encerts", amb una limitada capacitat per a afinar o per a fer més precisa la cerca. L'adopció a gran escala de normatives i pràctiques descriptives de  metadades per als recursos electrònics millorarà la recuperació de recursos  pertinents a Internet. Com fan notar Weibel i Lagoze, dos dels capdavanters en  el camp del desenvolupament de metadades:

"L'associació de metadades descriptives normalitzades amb els objectes de la xarxa té com a potencial la millora substancial de les capacitats de descoberta de recursos per mitjà de cerques basades en camps (per exemple, autor, títol),  que permeten la indexació d'objectes no textuals i el seu accés al contingut  substitutiu, que és diferent d'aquell accés al contingut del recurs mateix" (Weibel i Lagoze, 1997).

és, precisament, a aquesta necessitat de "metadades descriptives  normalitzades" on s'adreça el Dublin Core.

1.2 Què és el Dublin Core?

La normativa de metadades del Dublin Core és un conjunt d'elements simple però efectiu per a descriure una àmplia gamma de recursos en la xarxa. La normativa del Dublin Core comprèn quinze elements, la semàntica dels quals ha  estat establerta per consens per un grup internacional de professionals de disciplines diverses, com ara la biblioteconomia, la informàtica, la codificació de textos, la comunitat museística i altres camps relacionats del coneixement.

El Dublin Core també es pot considerar com un "llenguatge reduït per a fer  una classe particular d'enunciats sobre recursos" (Baker, 2000).  En aquest llenguatge hi ha dues classes de termes –els elements (substantius) i els qualificadors (adjectius)– que es poden ordenar en un model simple  d'enunciats. Els recursos mateixos són els subjectes implícits d'aquest llenguatge. En el món divers d'Internet, el Dublin Core pot ser considerat com  una "llengua franca de metadades per a turistes digitals": aferrada fàcilment, però no necessàriament, fins a la comesa d'expressar relacions o conceptes complexos.

El conjunt d'elements del Dublin Core es perfila a la Secció  4. Tots els elements són opcionals i es poden repetir. Tots els elements tenen també un conjunt limitat de qualificadors, és a dir, d'atributs que poden ser utilitzats per afinar més (no per ampliar) el significat de l'element. La Dublin Core Metadata Initiative (DCMI) ha definit vies normalitzades per a  "qualificar" els elements amb diferents tipus de qualificadors.  Hi ha disponible un conjunt de qualificadors recomanats d'acord amb la "bona pràctica" de la DCMI, juntament amb una llista formal en elaboració.

Tot i que el Dublin Core afavoreix els objectes en forma de document (ja que els recursos textuals tradicionals són bastant ben entesos), també es pot aplicar a altres recursos. La seva idoneïtat d'utilització amb recursos no documents individuals dependrà fins a cert punt de la similitud de les seves metadades amb les metadades d'un document típic i també de quin objectiu s'hagi  pensat que han d'acomplir les metadades. (S'invita als implementadors interessats a utilitzar el Dublin Core per a diferents recursos que fullegin les pàgines del Dublin Core Projects per tal de veure-hi idees sobre com utilitzar les metadades del Dublin Core per als seus recursos).

El Dublin Core té com a objectius assolir les següents característiques:

- Simplicitat de creació i manteniment

El conjunt d'elements del Dublin Core s'ha mantingut tan reduït i simple com ha estat possible per tal de permetre als no especialistes crear de manera fàcil i econòmica registres descriptius simples per als recursos d'informació, alhora que es proporcionen els mitjans adequats per a una recerca efectiva en l'entorn de la xarxa.

- Semàntica entesa comunament

La descoberta d'informació a través del vast camp d'Internet es veu dificultada per les diferències en la terminologia i en les pràctiques descriptives que hi ha d'un camp del coneixement a un altre. El Dublin Core pot ajudar el "turista digital" –un cercador no especialista– a trobar el seu camí,  ja que ofereix un conjunt d'elements comuns, la semàntica dels quals és compresa i suportada universalment. Per exemple, els científics interessats en localitzar  articles d'un autor determinat i els estudiants interessats en les obres d'un  artista determinat poden estar d'acord en la importància de l'element "creador".  Una tal convergència en un conjunt d'elements comuns, encara que lleugerament més genèrics, incrementa la visibilitat i l'accessibilitat de tots els recursos dins d'una disciplina concreta i més enllà.

- Abast internacional

El conjunt d'elements del Dublin Core es va desenvolupar originàriament en anglès, però s'han fet versions en moltes altres llengües, incloent el finès, el noruec, el tailandès, el japonès, el  francès, el portuguès, l'alemany, el grec, l'indonesi i l'espanyol. L'Special  Interest Group on Dublin Core on Multiple Languages coordina les tasques d'enllaçar aquestes versions en una llista distribuïda que utilitza la tecnologia del Resource Description  Framework desenvolupada pel World Wide Web Consortium (W3C).

Tot i que els reptes tecnològics de la internacionalització de la World Wide  Web no han estat dirigits per la comunitat de desenvolupament del Dublin Core, la implicació de representants de quasi tots els continents ha assegurat que el desenvolupament de la normativa tingui en consideració la naturalesa multilingüe i multicultural del món de la informació electrònica.

- Extensibilitat

En equilibrar les necessitats de simplicitat en la descripció de recursos  digitals amb la necessitat d'una recuperació precisa, els desenvolupadors del  Dublin Core han reconegut la importància de proporcionar un mecanisme per a ampliar el conjunt d'elements DC a les necessitats afegides de la descoberta de recursos. S'espera que altres comunitats d'experts en metadades crearan i administraran conjunts de metadades addicionals. Les metadades d'aquests conjunts es podran enllaçar amb les metadades del Dublin Core per a cobrir les necessitats d'extensibilitat. Aquest model permet que diferents comunitats  utilitzin els elements del DC per a la descripció d'informació bàsica, la qual  serà utilitzable a Internet en permetre l'addició de dominis específics que  prenen sentit dins d'un camp més limitat. Actualment s'estan desenvolupant instruccions específiques per a implementar un model d'aquest tipus.

1.3 Objectiu i abast d'aquesta guia

Aquest document està pensat com a punt d'entrada per als usuaris del Dublin  Core. Ajudarà els no especialistes a crear registres descriptius simples de recursos d'informació (per exemple, documents electrònics, imatges JPEG,  videoclips). Els especialistes poden trobar en el document un punt de referència  útil per a la documentació del Dublin Core, a mesura que aquesta canvia i  creix.

La guia mostra d'una manera no tècnica com qualsevol pot utilitzar les metadades del Dublin Core per fer més accessible el seu material. Aquesta guia tracta de la presentació i el contingut dels elements de les metadades del Dublin Core, de com utilitzar-les per compondre un registre complet de metadades Dublin Core i de com qualificar els elements per tal de donar suport a una àmplia varietat de comunitats.

Un altre dels objectius importants d'aquest document és promoure les "bones  pràctiques" de descripció de recursos en utilitzar el conjunt d'elements del Dublin Core. La comunitat del Dublin Core reconeix que la coherència en la creació de metadades és una clau important per a aconseguir una recuperació  completa i una visualització intel·ligible enmig de fonts dispars de registres descriptius. Les metadades incoherents amaguen efectivament els registres volguts i produeixen uns resultats en la cerca que són incomplets, imprevisibles o desiguals.

2. Sintaxi i qüestions relacionades

En aquesta guia, hem optat per representar els exemples de Dublin Core en diferents sintaxis, incloent-t'hi: HTML (el format Hypertext Markup Language del Web), RDF/XML (el Resource Description Framework que utilitza Extensible Markup Language) i d'una forma genèrica (Element="valor"). L'HTML proporciona un format de fàcil comprensió per a manifestar els conceptes subjacents del Dublin Core, però per a aplicacions més complexes que utilitzen la qualificació té més sentit l'ús de l'RDF/XML. Quan es considera apropiada una sintaxi, és important tenir en compte que els conceptes del Dublin Core són aplicables a pràcticament qualsevol format de fitxer, sempre que les metadades es presentin de forma adequada per tal de ser interpretades tant per un motor de cerca com per un ésser humà.

2.1 HTML

"Encoding Dublin Core Metadata in HTML" (Kunze, 1999) proporciona una guia per a utilitzar HTML amb Dublin Core no qualificat, tant si les metadades estan inserides en el recurs com si  van en un fitxer a part.

També es pot utilitzar HTML per a expressar el Dublin Core qualificat, però  fer-ho comporta unes limitacions intrínseques. La idea actual de com  aconseguir-ho de la millor manera es troba en el document de treball: Recording qualified Dublin Core metadata in HTML meta elements.

2.2 RDF/XML

L'RDF (Resource Description Framework) permet que diversos esquemes de  metadades puguin ser llegits tant pels éssers humans com analitzats per les màquines. L'RDF utilitza l'XML (Extensible Markup Language) per a expressar l'estructura que permet a les comunitats de metadades definir la semàntica actual. Aquest mètode descentralitzat reconeix que un sol esquema no és apropiat per a totes les situacions i que aquests esquemes necessiten un mecanisme d'enllaç independent d'una autoritat central per a facilitar la descripció, la identificació, la comprensió, la utilització i/o l'intercanvi.

L'RDF permet la descripció de diferents objectes sense especificar el detall requerit. L'aglutinant subjacent, l'XML, simplement requereix que es defineixin tots els espais de nom [namespaces] i que un cop definits puguin ser utilitzats en la mesura necessària del proveïdor de metadades.

Per exemple:

<rdf:RDF  xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

 

xmlns:dc="http://purl.org/dc/elements/1.1/">

 

<rdf:Description rdf:about="http://media.example.com/audio/guide.ra">

   

<dc:creator>Rose Bush</dc:creator>

   

<dc:title>A Guide to Growing  Roses</dc:title>

   

<dc:description>Describes process for planting and nurturing different kinds of rose bushes.</dc:description>

   

<dc:date>2001-01-20</dc:date>

 

</rdf:Description>

</rdf:RDF>

Aquest exemple simple utilitza Dublin Core per si mateix per a descriure un enregistrament sonor d'una guia per a cultivar rosers. Amb XML i RDF, Dublin Core es pot combinar amb altres vocabularis de metadades. Per exemple, la descripció anterior en Dublin Core simple es pot utilitzar juntament amb altres vocabularis com ara vCard, el qual pot descriure l'afiliació de l'autor i la informació de contacte o amb un vocabulari més especialitzat de "descripció de roses" que descrigui els rosers amb més detall.

2.3 Metadades incloses en un recurs

Algunes aplicacions que utilitzen el Dublin Core han triat d'inserir les  seves metadades dins del recurs mateix. Aquest mètode es presenta més sovint en documents codificats en HTML, però de vegades també és possible en altres  classes de documents. S'han desenvolupats eines simples per tal de proporcionar fàcilment metadades Dublin Core en pàgines codificades en HTML. Una eina  d'aquest tipus, la DC.dot, extreu informació de metadades d'un document en HTML i la formata de manera que  es pugui editar i després tallar i tornar a enganxar dins de la capçalera d'HTML del document original.

2.4 Metadades independents

Hi pot haver metadades independents en qualsevol tipus de bases de dades i generalment proporcionen un enllaç amb el recurs descrit. Aquest mètode és probable que sigui el més pràctic per a molts recursos no textuals i també s'està incrementant el seu ús en text, principalment per a suportar de manera  més fàcil el manteniment i el compartiment de metadades.

3. Principis bàsics dels elements descriptius

Tots els elements són opcionals i repetibles. Els elements de metadades poden aparèixer en qualsevol ordre. L'ordenació de les diverses ocurrències d'un mateix element (per exemple, Creator) pot tenir una significació volguda pel proveïdor, però no es garanteix que l'ordenació sigui conservada en l'entorn de cada usuari. Per exemple, RDF/XML suporta l'ordenació, però en canvi HTML no ho fa.

3.1 Contingut dels elements i vocabularis controlats

Les dades del contingut d'alguns elements es poden seleccionar en un "vocabulari controlat", és a dir, en un conjunt limitat de termes utilitzats coherentment i definits acuradament. Això pot millorar espectacularment els resultats de la cerca perquè els ordinadors són prou bons per a casar paraules però febles pel que fa a la comprensió de la forma amb la qual la gent es refereix a un sol concepte utilitzant paraules diferents, això és els sinònims. Sense un control bàsic de la terminologia, les metadades incoherents o incorrectes poden degradar profundament la qualitat dels resultats de cerca. Per exemple, sense un vocabulari controlat, "caramels" i "llaminadures" poden ser  utilitzats per referir-se al mateix concepte. Els vocabularis controlats, en canvi, poden reduir la probabilitat d'errors de picat quan s'anoten metadades.

Un dels costos d'un vocabulari controlat és la necessitat d'un cos administratiu que revisi, actualitzi i difongui el vocabulari. Per exemple, el Library of Congress Subject Headings (LCSH) i el National Library of Medicine Medical Subject Headings (MeSH) són vocabularis formals, indispensables per a cercar els reculls catalogats amb rigor. Tots dos, però, requereixen  organitzacions de suport significatives. Un altre dels costos es troba en la necessitat de formació de cercadors i creadors de metadades de manera que  sàpiguen quan han d'utilitzar el MeSH per entrar, per exemple, "infart de miocardi" en lloc del terme més col·loquial "atac de cor".

La utilització de vocabularis controlats es pot fer més efectiva per mitjà dels qualificadors.

4. Elements bàsics

Aquesta secció llista tots els elements bàsics amb el seu nom complet i etiqueta. Per a cada element hi ha una descripció de referència (DCMES 1.1 i traducció catalana) i hi ha unes pautes que ajuden en la creació del contingut de metadades, tant si es fa "des de zero" com si es fa a  partir de la conversió de registres existents en un altre format. També es proporcionen els enllaços amb els exemples i els Qualificadors del Dublin Core recomanats per a cada element.

Els elements estan llistats en l'ordre en què van ser desenvolupats, però hi ha altres maneres útils d'agrupar-los. En la taula següent, es pot veure que alguns elements fan referència al contingut del document, d'altres a la  propietat intel·lectual del document i altres a la instanciació, o versió, particular del document.

Contingut

Propietat intel·lectual

Instanciació

Cobertura

Contribuïdor

Data

Descripció

Creador

Format

Tipus

Editor

Identificador

Relació

Drets

Llengua

Font

   

Matèries

   

Títol

   

 

5. Qualificadors

5.1 Classes de qualificadors

El juliol de 2000 el Dublin Core Metadata Initiative va publicar la seva  llista de Qualificadors del Dublin Core recomanats. En el moment de la ratificació d'aquests qualificadors, la DCMI reconegué dues grans classes de qualificadors:

- Afinament dels elements. Aquests qualificadors fan que el significat d'un element sigui més reduït o més específic. Un element afinat participa del significat d'un element no qualificat, però amb un abast més restringit. Un client que no entén un element específic, hauria de poder ignorar el qualificador i tractar el valor de la metadada com si fos un element no qualificat (més ampli). Les definicions dels termes d'afinament dels elements per als qualificadors haurien de ser disponibles públicament.

- Esquema de codificació. Aquests qualificadors identifiquen esquemes que ajuden a la interpretació del valor d'un element. Aquests esquemes inclouen vocabularis controlats i notacions formals o normes d'anàlisi. Un valor expressat utilitzant un esquema de codificació serà, per tant, una mostra  seleccionada en un vocabulari controlat (això és, un terme d'un sistema de classificació o d'un conjunt d'encapçalaments de matèries) o d'una seqüència formada d'acord amb una notació formal (per exemple, "2000-01-01" com a  expressió estàndard d'una data). Si un esquema de codificació no és entès per un client o un representant, el valor pot ser encara útil a un ésser humà. La descripció definitiva d'un sistema de codificació per als qualificadors ha de ser clarament identificada i estar disponible per a l'ús públic.

5.2 El principi "Dumb-Down"

La utilització de qualificadors com a nivell addicional de detall introdueix una situació en la qual el client pot trobar reculls de recursos descrits utilitzant Dublin Core amb qualificadors que són desconeguts per l'aplicació d'aquest client. Això pot succeir o bé perquè el client no suporta els qualificadors i el recull sí, o bé perquè el recull suporta qualificadors especialitzats desenvolupats pels implementadors per a les necessitats locals específiques o necessitats dels dominis.

La interpretació útil d'aquestes descripcions dependrà de la capacitat de l'aplicació d'ignorar els qualificadors desconeguts i tornar enrere fins al significat més ampli de l'element en la seva forma no qualificada. El principi que guia la qualificació del significat dels elements del Dublin Core, col·loquialment conegut com a "Dumb-Down Principle", és que el client ha d'ignorar qualsevol qualificador i utilitzar la descripció com si no fos qualificada. Tot i que això pot donar com a resultat una pèrdua d'especificitat, el valor de l'element restant (menys el qualificador) ha de continuar essent, generalment, correcte.