Aquest article forma part d’una sèrie de publicacions al blog del CRAI Biblioteca de Ciències de la Terra (UB-CSIC) que tenen com a objectiu fer èmfasi en aquells aspectes de la utilització de bases de dades que són importants per dur a terme un bon disseny de cerques temàtiques especialitzades, així com per recuperar el màxim nombre de documents pertinents dins els resultats obtinguts. Es tracta d’oferir consells senzills per poder millorar l’experiència a l’hora de recuperar documentació científica d’interès.

Execució de la cerca amb llenguatge natural
En primer lloc cal recordar que totes les bases de dades permeten la cerca temàtica feta amb paraules del llenguatge natural. És a dir, totes elles tenen informació de cada document que s’extreu del títol, abstract o resum i, en determinats casos, de paraules clau d’autor i que aquesta informació es pot fer servir per executar una cerca per recuperar documents que tracten d’un tema en concret.
Per construir una cerca amb llenguatge natural s’ha de tenir en consideració:
- Algunes bases de dades respecten l’idioma original del títol, abstract i paraules clau d’autor del document, per tant, tot i que l’anglès predomina de forma molt majoritària, caldrà valorar la possibilitat d’introduir paraules en altres idiomes.
- Altres bases de dades respecten l’idioma original, però també el tradueixen a l’anglès (sempre i quan aquesta versió estigui proveïda per la publicació) com a llengua franca que és de comunicació científica.
- Finalment, n’hi ha d’altres que tradueixen sistemàticament tota la informació a l’anglès (sempre i quan aquesta versió estigui proveïda per la publicació), encara que en el document original tot estigui en un altre idioma.
- Caldrà veure com es poden truncar les paraules per incloure plurals i formes derivades d’una arrel.
- Caldrà recollir el màxim de sinònims i seleccionar termes genèrics que englobin els conceptes desitjats per fer la cerca.
Consells:
# No sempre és possible truncar una paraula per abastar els seus derivats, així com el plural. Pot ser que l’arrel sigui massa curta i coincideixi amb paraules que no hi tenen res a veure. En aquest cas s’han d’incloure totes les formes sense truncament.
# A vegades els títols dels documents contenen paraules genèriques i no fan esment de tots els conceptes més específics que poden ser del nostre interès. Cal valorar si seria adequat incloure també a la cerca aquests termes genèrics.
Exemple en l’àmbit de la Geologia:
Objectiu de la cerca: Vull recuperar articles de revista que no estiguin escrits en alemany sobre “Moviments de vessant al Pirineu català en relació a períodes de pluges intenses“.
- Determinació del conjunt OBJECTE. Quin és l’objecte principal de l’estudi?: Moviments de vessant
- Determinació del conjunt ASPECTE. Què pot influir, modificar o condicionar l’objecte principal d’estudi?: Pluges intenses
- Determinació del llistat de paraules del llenguatge natural associades a cada conjunt
- OBJECTE: Despreniments, bolcades, lliscaments, expansions, fluxos
- ASPECTE: Pluja, calamarsa, xàfec, precipitació
- Aplicació dels operadors booleans dins cada conjunt i entre ells.
- Determinació dels límits de la cerca, ja siguin de caràcter temàtic o no:
- Límits temàtics: Pirineus, Catalunya
- Límits no temàtics: Articles de revista, no escrits en alemany
- Base de dades seleccionada: SCIENCE CITATION INDEX EXPANDED. Disposa d’un camp TOPIC que inclou paraules dels títols dels documents, dels resums o abstracts i de paraules clau d’autor. També disposa de dos camps temàtics que permeten limitar la cerca (Web of Science Categories i Research Areas). Només buida revistes i tot està en anglès, encara que el document original estigui en altres idiomes.
- La base de dades escollida no disposa de camps limitadors que continguin valors referits a formacions geològiques (Pirineus) o divisions territorials (Catalunya), per tant escollirem el concepte “Pirineus” com a tercer conjunt temàtic.
- Podem explorar els dos camps que limiten per matèria els resultats, Web of Science Categories i Research Areas, i veure si ens cal aplicar alguns valors per reduir el nombre de documents. Donat que el resultat inicial és de 33 documents, no es recomana aplicar cap altre límit, ja que el nombre és suficientment petit com per poder fer una tria manual.

Web of Science Categories en les que es troben repartits els documents recuperats a la cerca. Cliqueu per ampliar

Research Areas en les que es troben repartits els documents recuperats a la cerca. Cliqueu per ampliar
- Hi ha dues limitacions més que s’haurien d’aplicar al conjunt dels 33 documents recuperats. Una és la que fa referència al tipus de documents desitjats, articles de revista, però la base de dades escollida ja recull exclusivament articles i, per tant no cal fer res més. L’altra és la de l’idioma dels documents i veiem que cap d’ells està en alemany.
Altres articles sobre les cerques en bases de dades
Com fer cerques en bases de dades. 1) Definició de l’àmbit temàtic
Com fer cerques en bases de dades. 2) Selecció de les bases de dades
Com fer cerques en bases de dades. 3) Definició dels conjunts de cerca
Com fer cerques en bases de dades. 4) Operadors booleans
Com fer cerques en bases de dades. 5) Limitar la cerca
Com fer cerques en bases de dades. 6) Execució de la cerca amb llenguatge natural
Com fer cerques en bases de dades. 7) Execució de la cerca amb llenguatge controlat
Com fer cerques en bases de dades. 8) Pertinença dels resultats
Com fer cerques en bases de dades. 9) Modificació de la cerca
Deixa un comentari