Aquest article forma part d’una sèrie de publicacions al blog del CRAI Biblioteca de Ciències de la Terra (UB-CSIC) que tenen com a objectiu fer èmfasi en aquells aspectes de la utilització de bases de dades que són importants per dur a terme un bon disseny de cerques temàtiques especialitzades, així com per recuperar el màxim nombre de documents pertinents dins els resultats obtinguts. Es tracta d’oferir consells senzills per poder millorar l’experiència a l’hora de recuperar documentació científica d’interès.

Selecció de les bases de dades
Quan ja s’ha definit el tema de cerca cal pensar quina o quines bases de dades s’han d’interrogar per obtenir resultats adequats. Hem de tenir en compte algunes característiques per seleccionar-les:
- Àmbit temàtic: Les bases de dades solen recollir documents d’una àrea temàtica força concreta. El fet que n’escollim una de molt específica no significa que haguem de prescindir necessàriament d’altres que són més genèriques, ja que sempre hi podrem trobar documents addicionals.
Consell:
# Una única base de dades no conté tot allò que necessitem. Hem d’interrogar-ne més d’una de les que contenen documents del nostre àmbit temàtic.

SCIENCE CITATION INDEX (Ciència); GEOREF (Geologia general); BIGPI (Geologia de la península Ibèrica)
- Tipus de documents inclosos: La majoria de bases de dades acostumen a recollir molts tipus de documents (articles, tesis, llibres i capítols de llibre, ponències de congressos, etc.) tot i que hi solen tenir més presència els articles de revista. Tot i així, algunes s’especialitzen a recollir només alguns tipus de documents, ja siguin només d’una àrea temàtica concreta o de qualsevol.
Per exemple:
CONFERENCE PROCEEDINGS CITATION INDEX. Base de dades de ciència que només recull ponències de congressos.
TDX: Base de dades multidisciplinar que només recull tesis doctorals.
Consell:
# No comenceu a cercar en aquests tipus de bases de dades a no ser que només us interessin els tipus de documents que inclou.
- Qualitat dels documents: Totes les bases de dades estableixen els criteris a partir dels quals accepten incloure les fonts que proveiran tots els documents (revistes, publicacions de societats científiques, editorials científiques, etc.). Moltes d’elles acostumen a ser força exhaustives i es dediquen a incloure tot allò que, dins el seu àmbit temàtic, gaudeix d’un mínim de qualitat. Però hi ha una base de dades molt important que és selectiva i només inclou els articles de les millors revistes: Es tracta del SCIENCE CITATION INDEX EXPANDED, que buida només 8.500 títols de revista de les desenes de milers que n’hi ha al món.
Consell:
# Es recomana cercar aquesta base de dades quan se sap que hi ha molta literatura publicada sobre el tema d’interès. D’aquesta manera es recuperen, en teoria, els articles publicats a revistes amb més impacte.
- Eines de cerca: Aquesta característica és força important de cara a la construcció de cerques, ja que determina amb quina precisió i complexitat podrem interrogar la base de dades. Quan es fan cerques per recuperar documents que tracten d’un tema específic, hem de tenir en compte que hi ha dues formes de fer-ho: utilitzant llenguatge natural o llenguatge controlat.
- Llenguatge natural: paraules que apareixen als camps de TÍTOL, ABSTRACT o RESUM i PARAULES CLAU D’AUTOR. Aquests camps ens donen una idea del contingut temàtic del document, però són fets a partir del llenguatge natural dels autors, on s’utilitzen sinònims, sigles i acrònims, variacions d’una mateixa arrel (plurals, paraules derivades, etc.)
- Llenguatge controlat: termes o conceptes que apareixen als camps de THESAURUS i CODIS DE MATÈRIES. Aquests camps els elaboren els productors de la base de dades i utilitzen un conjunt de matèries preestablertes per assignar-les a cada document, sense possibilitat de fer servir sinònims ni cap tipus de variació natural de les paraules.
Consells:
# Una cerca es dissenya més ràpidament utilitzant camps de llenguatge controlat, però la seva precisió depèn molt del criteri de les persones que adjudiquen les matèries a cada document.
# No totes les bases de dades fan servir camps de llenguatge controlat i, si n’hi ha, no tenen perquè coincidir els valors d’aquests camps. Per tant, si utilitzem aquest mètode, a cada base de dades haurem de redissenyar la cerca.
# Una cerca feta a partir de camps de llenguatge natural és més difícil de dissenyar pel fet d’haver de predir totes les variacions possibles per referir-se a un mateix concepte, però les paraules les han decidit els autors i se suposa que coincideix a la perfecció amb el contingut temàtic del document.
# Totes les bases de dades utilitzen camps de llenguatge natural, ja que formen part del document original. Per tant, podrem executar la mateixa cerca a moltes bases de dades sense necessitat de redissenyar-la.
# Una cerca pot fer-se fent servir simultàniament camps de llenguatge natural i de llenguatge controlat. Aquestes dues estratègies de cerca no són excloents.
Accés a les bases de dades:
Des d’aquest enllaç podreu trobar totes les bases de dades disponibles per als usuaris del CRAI.
Altres articles sobre les cerques en bases de dades
Com fer cerques en bases de dades. 1) Definició de l’àmbit temàtic
Com fer cerques en bases de dades. 2) Selecció de les bases de dades
Com fer cerques en bases de dades. 3) Definició dels conjunts de cerca
Com fer cerques en bases de dades. 4) Operadors booleans
Com fer cerques en bases de dades. 5) Limitar la cerca
Com fer cerques en bases de dades. 6) Execució de la cerca amb llenguatge natural
Com fer cerques en bases de dades. 7) Execució de la cerca amb llenguatge controlat
Com fer cerques en bases de dades. 8) Pertinença dels resultats
Com fer cerques en bases de dades. 9) Modificació de la cerca
Deixa un comentari