Utilitzar el Dublin Core
|
|
| Títol |
Utilitzar el Dublin Core |
| Contribuïdor (traducció): |
Biblioteca de Catalunya |
Creador: |
Diane Hillmann |
Data d'edició: |
2002-04-25 |
Identificador: |
http://www.bnc.es/sprof/normalitzacio/dc/dc_guide0.php |
última versió anglesa: |
http://dublincore.org/documents/usageguide/ |
Traduccions: |
http://dublincore.org/resources/translations/ |
Estatus del document: |
Traducció catalana d'una Recomanació de la DCMI |
| Descripció del document: |
Aquest document està pensat com a punt d'entrada dels usuaris
del Dublin Core. Ajudarà els no especialistes a crear registres descriptius simples de
recursos d'informació (per exemple, documents electrònics). Els especialistes poden
trobar en el document un punt de referència útil per a la documentació del Dublin Core,
a mesura que aquesta canvia i creix. |
Sumari
1. Introducció
1.1 Què són les metadades?
1.2 Què és el Dublin Core?
1.3 Objectiu i abast d'aquesta guia
2. Sintaxi i qüestions
relacionades
2.1 HTML
2.2 RDF/XML
2.3 Metadades incloses en un recurs
2.4 Metadades independents
3. Principis bàsics dels elements descriptius
3.1 Contingut dels
elements i vocabularis controlats
4. Elements bàsics
5. Qualificadors
5.1 Classes de qualificadors
5.2 El principi "Dumb-Down"
6.
Exemples
6.1
Exemples genèrics[Enllaç al document original en anglès]
6.2
Exemples en HTML simples [Enllaç al document original en anglès]
6.3
Exemples en HTML qualificats [Enllaç al document original en anglès]
6.4 Exemples en RDF simples (de pròxima aparició)
6.5 Exemples en RDF qualificats (de pròxima aparició)
6.6 Exemples d'altres fonts:
- AGLS
[Enllaç al document original en anglès]
- EdNA
[Enllaç al document original en anglès]
7. Glossari
[Enllaç al document original en anglès]
8. Lectures
i referències [Enllaç al document original en anglès]
1. Introducció
1.1. Què són les metadades?
Es pot dir que hi ha metadades d'ençà que el primer bibliotecari va fer una llista dels
documents d'un prestatge amb rotlles manuscrits. El terme "meta" ve d'una
paraula grega que vol dir "juntament, amb, després, a continuació". Però, de
fet, el llatí o el català empren el prefix "meta" per designar alguna cosa
transcendent o que va més enllà de la naturalesa. Les metadades, doncs, es poden
considerar dades sobre altres dades. és el terme de l'era Internet per a la informació
que els bibliotecaris han donat tradicionalment en els catàlegs i que fa referència més
comunament a la informació descriptiva sobre recursos web.
Un
registre de metadades consta d'un conjunt d'atributs o elements necessaris per a descriure
el recurs en qüestió. Per exemple, un sistema de metadades comú en biblioteques -el
catàleg de biblioteques- consta d'un conjunt de registres de metadades amb elements que
descriuen un llibre o qualsevol altre document d'una biblioteca: autor, títol, data de
creació o edició, matèries i signatura topogràfica que especifica la localització del
document al prestatge.
L'enllaç entre un registre de metadades i el recurs que descriu pot prendre una d'aquestes dues
formes:
1. els
elements es poden incloure en un registre separat del document, com en el cas d'un
registre del catàleg d'una biblioteca; o
2. les metadades poden estar inserides en el recurs mateix.
Com a exemples de metadades inserides que es troben incorporades en el recurs
mateix, hi ha les dades CIP (Cataloging In Publication) impreses al verso de la portada
del llibre, o la capçalera TEI en un text electrònic. Moltes de les normatives de
metadades que s'utilitzen avui en dia, incloent-hi la normativa del Dublin Core, no
prescriuen cap tipus d'enllaç i permeten decidir en cada implementació particular.
Tot i que el concepte de metadades és anterior a Internet i al Web, l'interès
per les normatives i les pràctiques de metadades ha esclatat amb l'augment de l'edició
electrònica i les biblioteques digitals i amb la "sobrecàrrega d'informació"
resultant de les grans quantitats de dades digitals indiferenciades disponibles en línia.
Tothom qui hagi provat de trobar informació en línia utilitzant un dels populars serveis
de cerca al Web haurà experimentat la frustració de recuperar centenars, i fins i tot
milers d'"encerts", amb una limitada capacitat per a afinar o per a fer més
precisa la cerca. L'adopció a gran escala de normatives i pràctiques descriptives de
metadades per als recursos electrònics millorarà la recuperació de recursos pertinents
a Internet. Com fan notar Weibel i Lagoze, dos dels capdavanters en el camp del
desenvolupament de metadades:
"L'associació de metadades descriptives normalitzades amb els objectes de
la xarxa té com a potencial la millora substancial de les capacitats de descoberta de
recursos per mitjà de cerques basades en camps (per exemple, autor, títol), que permeten
la indexació d'objectes no textuals i el seu accés al contingut substitutiu, que és
diferent d'aquell accés al contingut del recurs mateix" (Weibel i Lagoze, 1997).
és, precisament, a aquesta necessitat de "metadades descriptives
normalitzades" on s'adreça el Dublin Core.
La normativa de metadades del Dublin Core és un conjunt d'elements simple però
efectiu per a descriure una àmplia gamma de recursos en la xarxa. La normativa del Dublin
Core comprèn quinze elements, la semàntica dels quals ha estat establerta per consens
per un grup internacional de professionals de disciplines diverses, com ara la
biblioteconomia, la informàtica, la codificació de textos, la comunitat museística i
altres camps relacionats del coneixement.
El Dublin Core també es pot considerar com un "llenguatge reduït per a
fer una classe particular d'enunciats sobre recursos" (Baker, 2000). En aquest
llenguatge hi ha dues classes de termes els elements (substantius) i els
qualificadors (adjectius) que es poden ordenar en un model simple d'enunciats. Els
recursos mateixos són els subjectes implícits d'aquest llenguatge. En el món divers
d'Internet, el Dublin Core pot ser considerat com una "llengua franca de metadades
per a turistes digitals": aferrada fàcilment, però no necessàriament, fins a la
comesa d'expressar relacions o conceptes complexos.
El conjunt d'elements del Dublin Core es perfila a la Secció 4.
Tots els elements són opcionals i es poden repetir. Tots els elements tenen també un
conjunt limitat de qualificadors, és a dir, d'atributs que poden ser utilitzats per
afinar més (no per ampliar) el significat de l'element. La Dublin Core Metadata
Initiative (DCMI) ha definit vies normalitzades per a "qualificar" els elements
amb diferents tipus de qualificadors. Hi ha disponible un conjunt de qualificadors recomanats d'acord amb la
"bona pràctica" de la DCMI, juntament amb una llista formal en elaboració.
Tot i que el Dublin Core afavoreix els objectes en forma de
document (ja que els recursos textuals tradicionals són bastant ben entesos), també es
pot aplicar a altres recursos. La seva idoneïtat d'utilització amb recursos no documents
individuals dependrà fins a cert punt de la similitud de les seves metadades amb les
metadades d'un document típic i també de quin objectiu s'hagi pensat que han d'acomplir
les metadades. (S'invita als implementadors interessats a utilitzar el Dublin Core per a
diferents recursos que fullegin les pàgines del Dublin
Core Projects per tal de veure-hi idees sobre com utilitzar les metadades del
Dublin Core per als seus recursos).
El Dublin Core té com a objectius assolir les següents característiques:
Simplicitat de creació i manteniment
El conjunt d'elements del Dublin Core s'ha mantingut tan reduït
i simple com ha estat possible per tal de permetre als no especialistes crear de manera
fàcil i econòmica registres descriptius simples per als recursos d'informació, alhora
que es proporcionen els mitjans adequats per a una recerca efectiva en l'entorn de la
xarxa.
Semàntica entesa comunament
La descoberta d'informació a través del vast
camp d'Internet es veu dificultada per les diferències en la terminologia i en les
pràctiques descriptives que hi ha d'un camp del coneixement a un altre. El Dublin Core
pot ajudar el "turista digital" un cercador no especialista a trobar
el seu camí, ja que ofereix un conjunt d'elements comuns, la semàntica dels quals és
compresa i suportada universalment. Per exemple, els científics interessats en localitzar
articles d'un autor determinat i els estudiants interessats en les obres d'un artista
determinat poden estar d'acord en la importància de l'element "creador". Una
tal convergència en un conjunt d'elements comuns, encara que lleugerament més genèrics,
incrementa la visibilitat i l'accessibilitat de tots els recursos dins d'una disciplina
concreta i més enllà.
Abast internacional
El conjunt d'elements del Dublin Core es va
desenvolupar originàriament en anglès, però s'han fet versions en moltes altres llengües,
incloent el finès, el noruec, el tailandès, el japonès, el francès, el portuguès,
l'alemany, el grec, l'indonesi i l'espanyol. L'Special Interest Group on Dublin Core on
Multiple Languages coordina les tasques d'enllaçar aquestes versions en una llista
distribuïda que utilitza la tecnologia del Resource
Description Framework desenvolupada pel World Wide Web Consortium (W3C).
Tot i que els reptes tecnològics de la
internacionalització de la World Wide Web no han estat dirigits per la comunitat de
desenvolupament del Dublin Core, la implicació de representants de quasi tots els
continents ha assegurat que el desenvolupament de la normativa tingui en consideració la
naturalesa multilingüe i multicultural del món de la informació electrònica.
Extensibilitat
En equilibrar les necessitats de simplicitat en
la descripció de recursos digitals amb la necessitat d'una recuperació precisa, els
desenvolupadors del Dublin Core han reconegut la importància de proporcionar un mecanisme
per a ampliar el conjunt d'elements DC a les necessitats afegides de la descoberta de
recursos. S'espera que altres comunitats d'experts en metadades crearan i administraran
conjunts de metadades addicionals. Les metadades d'aquests conjunts es podran enllaçar
amb les metadades del Dublin Core per a cobrir les necessitats d'extensibilitat. Aquest
model permet que diferents comunitats utilitzin els elements del DC per a la descripció
d'informació bàsica, la qual serà utilitzable a Internet en permetre l'addició de
dominis específics que prenen sentit dins d'un camp més limitat. Actualment s'estan
desenvolupant instruccions específiques per a implementar un model d'aquest tipus.
Aquest document està pensat com a punt d'entrada per als usuaris del Dublin
Core. Ajudarà els no especialistes a crear registres descriptius simples de recursos
d'informació (per exemple, documents electrònics, imatges JPEG, videoclips). Els
especialistes poden trobar en el document un punt de referència útil per a la
documentació del Dublin Core, a mesura que aquesta canvia i creix.
La guia mostra d'una manera no tècnica com qualsevol pot utilitzar les
metadades del Dublin Core per fer més accessible el seu material. Aquesta guia tracta de
la presentació i el contingut dels elements de les metadades del Dublin Core, de com
utilitzar-les per compondre un registre complet de metadades Dublin Core i de com
qualificar els elements per tal de donar suport a una àmplia varietat de comunitats.
Un altre dels objectius importants d'aquest document és promoure les
"bones pràctiques" de descripció de recursos en utilitzar el conjunt
d'elements del Dublin Core. La comunitat del Dublin Core reconeix que la coherència en la
creació de metadades és una clau important per a aconseguir una recuperació completa i
una visualització intel·ligible enmig de fonts dispars de registres descriptius. Les
metadades incoherents amaguen efectivament els registres volguts i produeixen uns
resultats en la cerca que són incomplets, imprevisibles o desiguals.
En aquesta guia, hem optat per representar els exemples de Dublin Core en
diferents sintaxis, incloent-t'hi: HTML (el format Hypertext Markup Language del Web),
RDF/XML (el Resource Description Framework que utilitza Extensible Markup Language) i
d'una forma genèrica (Element="valor"). L'HTML proporciona un format de fàcil
comprensió per a manifestar els conceptes subjacents del Dublin Core, però per a
aplicacions més complexes que utilitzen la qualificació té més sentit l'ús de
l'RDF/XML. Quan es considera apropiada una sintaxi, és important tenir en compte que els
conceptes del Dublin Core són aplicables a pràcticament qualsevol format de fitxer,
sempre que les metadades es presentin de forma adequada per tal de ser interpretades tant
per un motor de cerca com per un ésser humà.
"Encoding Dublin Core
Metadata in HTML" (Kunze, 1999) proporciona una guia per a utilitzar HTML amb
Dublin Core no qualificat, tant si les metadades estan inserides en el recurs com si van
en un fitxer a part.
També es pot utilitzar HTML per a expressar el Dublin Core qualificat, però
fer-ho comporta unes limitacions intrínseques. La idea actual de com aconseguir-ho de la
millor manera es troba en el document de treball: Recording qualified Dublin Core metadata
in HTML meta elements.
L'RDF (Resource Description Framework) permet que diversos esquemes de metadades
puguin ser llegits tant pels éssers humans com analitzats per les màquines. L'RDF
utilitza l'XML (Extensible Markup Language) per a expressar l'estructura que permet a les
comunitats de metadades definir la semàntica actual. Aquest mètode descentralitzat
reconeix que un sol esquema no és apropiat per a totes les situacions i que aquests
esquemes necessiten un mecanisme d'enllaç independent d'una autoritat central per a
facilitar la descripció, la identificació, la comprensió, la utilització i/o
l'intercanvi.
L'RDF permet la descripció de diferents objectes sense especificar el detall
requerit. L'aglutinant subjacent, l'XML, simplement requereix que es defineixin tots els
espais de nom [namespaces] i que un cop definits puguin ser utilitzats en la mesura
necessària del proveïdor de metadades.
Per exemple:
|
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" |
|
xmlns:dc="http://purl.org/dc/elements/1.1/">
|
|
<rdf:Description
rdf:about="http://media.example.com/audio/guide.ra"> |
|
|
<dc:creator>Rose Bush</dc:creator> |
|
|
<dc:title>A Guide to Growing
Roses</dc:title> |
|
|
<dc:description>Describes process for
planting and nurturing different kinds of rose bushes.</dc:description> |
|
|
<dc:date>2001-01-20</dc:date> |
|
</rdf:Description> |
|
</rdf:RDF> |
Aquest exemple simple utilitza Dublin Core per si mateix per a descriure un
enregistrament sonor d'una guia per a cultivar rosers. Amb XML i RDF, Dublin Core es pot
combinar amb altres vocabularis de metadades. Per exemple, la descripció anterior en
Dublin Core simple es pot utilitzar juntament amb altres vocabularis com ara vCard, el
qual pot descriure l'afiliació de l'autor i la informació de contacte o amb un
vocabulari més especialitzat de "descripció de roses" que descrigui els rosers
amb més detall.
Algunes aplicacions que utilitzen el Dublin Core han triat d'inserir les seves
metadades dins del recurs mateix. Aquest mètode es presenta més sovint en documents
codificats en HTML, però de vegades també és possible en altres classes de documents.
S'han desenvolupats eines simples per tal de proporcionar fàcilment metadades Dublin Core
en pàgines codificades en HTML. Una eina d'aquest tipus, la DC.dot, extreu informació de metadades
d'un document en HTML i la formata de manera que es pugui editar i després tallar i
tornar a enganxar dins de la capçalera d'HTML del document original.
Hi pot haver metadades independents en qualsevol tipus de bases de dades i
generalment proporcionen un enllaç amb el recurs descrit. Aquest mètode és probable que
sigui el més pràctic per a molts recursos no textuals i també s'està incrementant el
seu ús en text, principalment per a suportar de manera més fàcil el manteniment i el
compartiment de metadades.
3. Principis bàsics dels elements descriptius
Tots els elements són opcionals i repetibles. Els elements de metadades poden
aparèixer en qualsevol ordre. L'ordenació de les diverses ocurrències d'un mateix
element (per exemple, Creator) pot tenir una significació volguda pel proveïdor, però
no es garanteix que l'ordenació sigui conservada en l'entorn de cada usuari. Per exemple,
RDF/XML suporta l'ordenació, però en canvi HTML no ho fa.
Les dades del contingut d'alguns elements es poden seleccionar en un
"vocabulari controlat", és a dir, en un conjunt limitat de termes utilitzats
coherentment i definits acuradament. Això pot millorar espectacularment els resultats de
la cerca perquè els ordinadors són prou bons per a casar paraules però febles pel que
fa a la comprensió de la forma amb la qual la gent es refereix a un sol concepte
utilitzant paraules diferents, això és els sinònims. Sense un control bàsic de la
terminologia, les metadades incoherents o incorrectes poden degradar profundament la
qualitat dels resultats de cerca. Per exemple, sense un vocabulari controlat,
"caramels" i "llaminadures" poden ser utilitzats per referir-se al
mateix concepte. Els vocabularis controlats, en canvi, poden reduir la probabilitat
d'errors de picat quan s'anoten metadades.
Un dels costos d'un vocabulari controlat és la necessitat d'un cos
administratiu que revisi, actualitzi i difongui el vocabulari. Per exemple, el Library of
Congress Subject Headings (LCSH) i el National Library of Medicine Medical Subject
Headings (MeSH) són vocabularis formals, indispensables per a cercar els reculls
catalogats amb rigor. Tots dos, però, requereixen organitzacions de suport
significatives. Un altre dels costos es troba en la necessitat de formació de cercadors i
creadors de metadades de manera que sàpiguen quan han d'utilitzar el MeSH per entrar, per
exemple, "infart de miocardi" en lloc del terme més col·loquial "atac de
cor".
La utilització de vocabularis controlats es pot fer més efectiva per mitjà
dels qualificadors.
4. Elements bàsics
Aquesta secció llista tots els elements bàsics amb el seu nom complet i
etiqueta. Per a cada element hi ha una descripció de referència (DCMES 1.1 i traducció catalana) i hi ha unes pautes que
ajuden en la creació del contingut de metadades, tant si es fa "des de zero"
com si es fa a partir de la conversió de registres existents en un altre format. També
es proporcionen els enllaços amb els exemples i els Qualificadors del Dublin Core recomanats per
a cada element.
Els elements estan llistats en l'ordre en què van ser desenvolupats, però hi
ha altres maneres útils d'agrupar-los. En la taula següent, es pot veure que alguns
elements fan referència al contingut del document, d'altres a la propietat intel·lectual
del document i altres a la instanciació, o versió, particular del document.
El juliol de 2000 el Dublin Core Metadata Initiative va publicar la seva llista
de Qualificadors del Dublin Core
recomanats. En el moment de la ratificació d'aquests qualificadors, la DCMI reconegué
dues grans classes de qualificadors:
·
Afinament dels elements. Aquests qualificadors fan
que el significat d'un element sigui més reduït o més específic. Un element afinat
participa del significat d'un element no qualificat, però amb un abast més restringit.
Un client que no entén un element específic, hauria de poder ignorar el qualificador i
tractar el valor de la metadada com si fos un element no qualificat (més ampli). Les
definicions dels termes d'afinament dels elements per als qualificadors haurien de ser
disponibles públicament.
· Esquema de codificació. Aquests qualificadors
identifiquen esquemes que ajuden a la interpretació del valor d'un element. Aquests
esquemes inclouen vocabularis controlats i notacions formals o normes d'anàlisi. Un valor
expressat utilitzant un esquema de codificació serà, per tant, una mostra seleccionada
en un vocabulari controlat (això és, un terme d'un sistema de classificació o d'un
conjunt d'encapçalaments de matèries) o d'una seqüència formada d'acord amb una
notació formal (per exemple, "2000-01-01" com a expressió estàndard d'una
data). Si un esquema de codificació no és entès per un client o un representant, el
valor pot ser encara útil a un ésser humà. La descripció definitiva d'un sistema de
codificació per als qualificadors ha de ser clarament identificada i estar disponible per
a l'ús públic.
La utilització de qualificadors com a nivell addicional de detall introdueix
una situació en la qual el client pot trobar reculls de recursos descrits utilitzant
Dublin Core amb qualificadors que són desconeguts per l'aplicació d'aquest client. Això
pot succeir o bé perquè el client no suporta els qualificadors i el recull sí, o bé
perquè el recull suporta qualificadors especialitzats desenvolupats pels implementadors
per a les necessitats locals específiques o necessitats dels dominis.
La interpretació útil d'aquestes descripcions
dependrà de la capacitat de l'aplicació d'ignorar els qualificadors desconeguts i tornar
enrere fins al significat més ampli de l'element en la seva forma no qualificada. El
principi que guia la qualificació del significat dels elements del Dublin Core,
col·loquialment conegut com a "Dumb-Down Principle", és que el client ha
d'ignorar qualsevol qualificador i utilitzar la descripció com si no fos qualificada. Tot
i que això pot donar com a resultat una pèrdua d'especificitat, el valor de l'element
restant (menys el qualificador) ha de continuar essent, generalment, correcte.
|