Abstract
Il database MEDLINE della National Library of Medicine (MEDLARS Online) è stato il primo database a essere cercato a livello nazionale tramite reti di telecomunicazione a valore aggiunto. Ora disponibile sul World Wide Web gratuitamente dalla National Library of Medicine e da molte altre fonti, è il database medico più utilizzato al mondo., MEDLINE è unico in quanto ogni riferimento alla letteratura medica è indicizzato sotto un vocabolario controllato chiamato Intestazioni di soggetti medici (MeSH). Queste intestazioni sono le chiavi che sbloccano la letteratura medica. MeSH moltiplica l’utilità del database MEDLINE e consente di cercare la letteratura medica come facciamo oggi. Questo documento commemora il 40 ° anniversario dell’introduzione di MeSH e saluta alcune delle persone lungimiranti che hanno concepito e sviluppato il database MEDLINE.,
L’impatto delle nespole sul mondo della biblioteca medica non è quello della metafora familiare: il ciottolo è caduto nello stagno, gettando cerchi concentrici che raggiungono molti punti sulla riva. L’impatto non è un ciottolo di sicuro. È una roccia possente. Le onde che causerà saranno sovratensioni e spruzzi per molto tempo a venire. nespole è la grande svolta bibliografica della nostra generazione.- Ralph T. Esterquest
Parlato da Ralph T. Esterquest in un simposio nel 1963,1 queste parole si dimostrarono preveggenti e struggenti., Il database medline (medlars Online) della National Library of Medicine è stato il primo database a essere cercato a livello nazionale tramite reti di telecomunicazione a valore aggiunto. Ora disponibile sul World Wide Web gratuitamente dalla National Library of Medicine e da molte altre fonti, è il database medico più utilizzato al mondo.
Medline è unico in quanto ogni riferimento alla letteratura medica è indicizzato sotto un vocabolario controllato chiamato Medical Subject Headings (MeSH). Queste intestazioni sono le chiavi che sbloccano la letteratura medica., MeSH moltiplica l’utilità del database medline e consente di cercare la letteratura medica come facciamo oggi. Questo documento commemora il 40 ° anniversario dell’introduzione di MeSH e saluta alcuni degli individui lungimiranti che hanno concepito e sviluppato il database medline.
John Shaw Billings e l’origine dell’Index Medicus
All’alba della guerra civile, uno studente del Medical College of Ohio aveva bisogno di informazioni sull’epilessia per la sua tesi di laurea., Lo studente, John Shaw Billings, trascorse sei mesi nelle biblioteche di Cincinnati, New York e Philadelphia raccogliendo la letteratura necessaria. La letteratura medica è stata poi frammentata in migliaia di liste, bibliografie e indici; per cercare la letteratura medica era fatica che Billings non avrebbe dimenticato.2
Dopo la laurea, Billings si distinse come chirurgo sul campo nell’esercito dell’Unione., Quando la guerra finì, ottenne un lavoro come assistente nell’ufficio del Surgeon General, dove si occupò di una collezione di libri che proveniva da uno scaffale dietro la scrivania di Joseph Lovell, un ex chirurgo generale. Lovell era morto nel 1836, ma la sua collezione continuò a crescere, e quando Billings arrivò contava circa 2.000 volumi. Nel 1866, l’ufficio del Chirurgo Generale e la collezione si trasferirono nello spazio nel Ford Theatre, 3 a Washington, il luogo dell’assassinio del presidente Lincoln.
Billings costruì la collezione, e nel 1876 aveva 52.000 libri e opuscoli., Col tempo, sarebbe diventata la più grande biblioteca medica del paese.4 Ricordando la sua precedente esperienza nella sua biblioteca universitaria, Billings decise di indicizzare la collezione per autore e soggetto. Nel 1874, iniziò il lavoro di indicizzazione per argomento degli articoli della rivista, libri, tesi, relazioni e opuscoli, per produrre l’Indice-Catalogo completo della Biblioteca del Chirurgo Generale. L’Indice-Catalogo sarebbe stato pubblicato in diverse serie di volumi alfabetici rotanti; le nuove voci di anatomia ricevute subito dopo l’uscita di “A” hanno avuto un lungo ritardo di pubblicazione.,
Di conseguenza, a partire dal 1879, Billings pubblicò i nuovi articoli delle riviste mediche come un servizio di sensibilizzazione mensile separato chiamato Index Medicus. In quei giorni, tutti i numeri di Index Medicus per un anno intero, compresi gli elenchi di autori e soggetti, si inseriscono facilmente in un unico volume rilegato; richiedono 16 volumi rilegati oggi. L’idea che ogni articolo della letteratura medica debba essere indicizzato sotto i soggetti discussi nell’articolo porterebbe allo sviluppo della MeSH che usiamo oggi.,
Dopo che Billings si ritirò dall’Esercito degli Stati Uniti nel 1895, divenne direttore della New York Public Library, dove prestò servizio con distinzione per diversi anni. La direzione della Biblioteca dell’Ufficio del Chirurgo generale e la responsabilità per Index Medicus sono stati passati da un alto ufficiale medico ad un altro in una successione di quattro anni di posti dell’esercito. Nel 1927, Index Medicus fu fusa con la bibliografia concorrente dell’American Medical Association e rinominata Quarterly Cumulative Index Medicus.,
La seconda guerra mondiale portò urgenza per le informazioni mediche attuali, e un nuovo direttore, Harold Wellington Jones, iniziò a pubblicare un indice settimanale chiamato Current List of Medical Literature. Jones ha anche organizzato per un sondaggio 1943 della Biblioteca da bibliotecari professionisti. Il rapporto altamente critico di questa rilevazione5 servirebbe da modello per importanti miglioramenti alla collezione, al personale, alle operazioni e alle strutture della Biblioteca nei prossimi due decenni., In risposta a una delle sue raccomandazioni, Jones ha sviluppato ” Principi da utilizzare nella selezione delle rubriche tematiche”, sulla base di linee guida originariamente formulate da Billings.6
Frank Bradway Rogers and Medical Subject Headings
Nel 1949, il colonnello Frank Bradway “Brad” Rogers divenne il direttore della Biblioteca medica dell’Esercito—quindi il nome di quella che era stata la Biblioteca dell’Ufficio del Chirurgo generale dell’Esercito. Come ognuno dei suoi predecessori, Rogers era un medico. A differenza di loro, è stato inviato dall’esercito per ottenere un master in scienze bibliotecarie come preparazione per il lavoro.,
Il primo direttore ad essere formalmente addestrato in biblioteconomia, Rogers ha usato i principi sviluppati da Jones e il lavoro svolto sotto contratto presso la Welch Medical Library della Johns Hopkins University per produrre, nel 1951, un elenco standardizzato di intestazioni tematiche per l’attuale elenco di letteratura medica.7 Nel 1956, il Congresso degli Stati Uniti ha conferito alla Biblioteca medica delle Forze Armate (come era stata ribattezzata nel 1952) l’autorità statutaria come Biblioteca nazionale di Medicina, e ne ha fatto un’istituzione separata all’interno del Servizio sanitario pubblico degli Stati Uniti., Più tardi, la Biblioteca Nazionale di Medicina sarebbe diventata parte del National Institutes of Health.
Nel 1960, Rogers guidò la pubblicazione del nuovo mensile Index Medicus, insieme ad un elenco appena rivisto e ampliato di rubriche tematiche standardizzate. L’elenco-chiamato Intestazioni soggetto medico, o MeSH-è costituito da termini single-e multi-parola che vengono utilizzati per indicizzare e catalogare la letteratura medica. Questo documento commemora il 40 ° anniversario di MeSH-il vocabolario controllato, o thesaurus, che permette di cercare la letteratura biomedica nel modo in cui facciamo oggi.,
Dedicato alla diffusione capillare e tempestiva di informazioni mediche, Rogers ha studiato i modi meccanici per facilitare la produzione dell’Indice mensile Medicus. Nel 1958, lui e Seymour Taine, allora capo dell’operazione di indicizzazione della National Library of Medicine, avviarono il progetto di meccanizzazione dell’indice, che utilizzava nastro di carta punzonato e schede perforate, macchine per la selezione delle carte e una telecamera ad alta velocità. Questo progetto ha accelerato la produzione dell’indice stampato Medicus, ma non ha supportato il recupero automatico.,
Questa prima esperienza con tecniche automatizzate e l’interesse di Rogers per il concetto di indicizzazione delle coordinate sviluppato da Mortimer Taube, 8 hanno influenzato la struttura e la filosofia della prima edizione di MeSH.
La catalogazione dei soggetti e l’indicizzazione periodica sono, nelle loro dimensioni principali, processi identici e per entrambi dovrebbe essere utilizzata un’unica autorità. Le intestazioni dovrebbero essere considerate come puntatori, non etichette descrittive., Le sottovoci topiche, come sostituti delle intestazioni di frasi, possono essere standardizzate e dovrebbero esserlo, in contrasto con le rubriche principali specifiche che generalmente rappresentano concetti ampi.9
Le rubriche principali divennero più specifiche nelle edizioni successive, ma le MESH continuano ad essere utilizzate sia nella catalogazione e nell’indicizzazione dei soggetti (una nuova nozione nel 1960), e le sottovoci topiche standardizzate rimangono una caratteristica chiave del vocabolario MeSH.
Ogni anno, Index Medicus diventa più grande. Nel 1960, il cumulo annuale occupava tre volumi., Nel 1999, le voci dell’autore riempivano sei volumi e le voci del soggetto altri dieci. Per cercare articoli indicizzati sotto un particolare argomento in un arco di anni richiede la consultazione di molti volumi pesanti.,
Index Medicus fornisce un modo, anche se un modo imbarazzante, per cercare articoli scritti da un particolare autore o articoli che riguardano un particolare argomento, ma i volumi rilegati non forniscono alcun modo pratico per trovare articoli che discutono due (o più) argomenti insieme; si possono trovare articoli su timololo o articoli su infarto miocardico, ma non c’è un modo semplice per focalizzare una ricerca su articoli che discutono entrambi., Inoltre, sotto ogni termine MeSH, i volumi pubblicati di Index Medicus elencano solo gli articoli per i quali quel termine è stato designato un focus principale—uno dei (di solito da due a quattro) argomenti principali discussi nell’articolo; elencare gli articoli rimanenti renderebbe i volumi stampati troppo spessi e troppo costosi.
NESPOLE
Nel 1960, con l’esperienza del progetto di meccanizzazione dell’indice e con i fondi del National Heart Institute, la National Library of Medicine iniziò lo sviluppo del sistema di analisi e recupero della letteratura medica (nespole)., Come parte di questo sforzo, è stato sviluppato un database MeSH e una MESH rivista e ristrutturata è stata prodotta nel 1963 sotto la direzione di Winifred Sewell.10 MeSH è stato rivisto e aggiornato ogni anno da allora. L’edizione del 1963 conteneva la prima versione delle gerarchie MeSH, o “Strutture ad albero”—presto per diventare un potente aiuto per il recupero automatico. Fin dall’inizio, le strutture ad albero MeSH sono state polierarchiche, il che significa che un’intestazione principale può apparire in più di una sottocategoria., Ad esempio, la tubercolosi, epatica appare nell’albero delle malattie infettive sotto la tubercolosi e nell’albero delle malattie dell’apparato digerente sotto le malattie del fegato.
Nel 1964, la Biblioteca introdusse medlars, che memorizzava i riferimenti bibliografici in un database computerizzato e ricercabile ed eseguiva la fototipizzazione computerizzata per Index Medicus e altre bibliografie più specializzate. A partire dal 1965, le ricerche potevano essere presentate alla National Library of Medicine o ad uno dei centri di elaborazione decentralizzati stabiliti negli Stati Uniti e all’estero., Bibliotecari appositamente addestrati, che avevano frequentato corsi che duravano fino a 3 mesi, poi formulato ogni ricerca e presentato ad un centro di ricerca nespole, dove schede perforate sono stati alimentati in un computer, e la stampa risultante è stato spedito indietro per posta. Negli Stati Uniti, i tempi di consegna erano in media da 4 a 6 settimane.9
La ricerca offline in modalità batch ha ritardato la gratificazione; non di rado, i risultati di una ricerca sono tornati dopo che la domanda clinica non era più rilevante. Inoltre, era difficile prevedere quanti colpi avrebbe prodotto una particolare ricerca., Per aggirare questo problema, nespole ha permesso tre istruzioni di ricerca, con ogni istruzione elaborata rispetto a quelle precedenti. Pertanto, il ricercatore esperto potrebbe mirare al richiamo con la prima affermazione, alla specificità con la terza e ad un equilibrio accettabile con la seconda. Ancora, per espandere una ricerca che ha prodotto troppo pochi colpi o di mettere a fuoco uno che ha prodotto troppi richiesto la ricandidatura e ulteriore ritardo; la ricerca doveva essere fatto on-line.,
Nel dicembre 1968, finanziato dalla National Library of Medicine, il primo sistema di recupero bibliografico online in tempo reale fu inaugurato presso la SUNY Biomedical Communication Network, con sede presso la SUNY Upstate Medical Center Library di Syracuse, New York.9 Nove biblioteche mediche hanno utilizzato terminali teletypewriter per cercare 90.000 riferimenti presi dal database nespole. Le ricerche potevano essere fatte per i nomi degli autori o le intestazioni di soggetti medici e potevano essere limitate per data o lingua; non era prevista la ricerca di parole di testo nel titolo o nell’abstract., Le ricerche sono state presentate online, ma fino a quando i risultati sono stati stampati offline e spediti indietro, il ricercatore non sapeva quanti colpi la ricerca avrebbe prodotto, o se erano sul bersaglio. Tuttavia, le nove biblioteche hanno fatto più ricerche tramite SUNY rispetto al resto del paese tramite nespole.10
Nel 1970, la National Library of Medicine, che riceveva richieste di prestito interbibliotecario tramite Teletypewriter Exchange, o TWX, sperimentò l’accesso online a livello nazionale a circa 100 riviste indicizzate per l’Indice abbreviato Medicus, o AIM.,11 Di breve durata ma popolare, il progetto, chiamato AIM-TWX, ha fornito ulteriori prove che la gente voleva cercare online.
MEDLINE
Nel 1971, la National Library of Medicine introdusse medlars Online, o medline, su software di recupero più avanzato, e lo rese disponibile tramite reti di telecomunicazione a valore aggiunto. Chiamato Elhill, questo software ha permesso ricercatori addestrati-in primo luogo bibliotecari – per cercare per parole nel titolo così come da campi fissi, come ad esempio titolo soggetto medico, titolo del giornale, anno di pubblicazione, e simili., Elhill è stato chiamato per (Joseph) Lister Hill, il senatore da Alabama e forte sostenitore di assistenza sanitaria per il quale il Lister Hill National Center for Biomedical Communications, che ha contribuito a creare, è stato anche nominato.
Prima di poter utilizzare il software Elhill per cercare nel database medline, i ricercatori erano tenuti a seguire un corso di due settimane nella ricerca online e nell’uso del MeSH., I ricercatori e i medici hanno discusso la loro necessità di informazioni con uno di questi ricercatori appositamente addestrati, che ha tradotto la richiesta nella strategia di ricerca appropriata e ha condotto la ricerca. Questo era noto come” ricerca mediata”; con rare eccezioni,” ricerca dell’utente finale ” non esisteva.
Nei primi giorni di medline, i bibliotecari in genere impiegavano del tempo per preparare ogni ricerca prima di andare online. Il tempo di connessione era troppo costoso da sprecare e il sistema iniziale richiedeva al ricercatore di digitare ogni termine in un formato esattamente corretto., I volumi stampati, come la MESH permutata, sono stati utilizzati per guidare il ricercatore a termini MeSH non familiari. I ricercatori dovevano sapere (o cercare) quali termini MeSH erano singolari (Occhio, Mano e Piede) e quali erano plurali (Dita delle mani e dei piedi). Dovevano sapere quando il sostantivo precedeva l’aggettivo (Dieta, Riduzione) e quando l’aggettivo precedeva il sostantivo (Dieta per diabetici), così come quando applicare una sottovoce a una voce principale (Ipertensione/Dietoterapia) e quando usare il booleano E con una voce di soggetto medico separata (Ipertensione E Dieta per diabetici)., Dovevano usare abbreviazioni specifiche per i nomi delle riviste (New Engl J Med per il New England Journal of Medicine, ma JAMA per il Journal of American Medical Association), e dovevano sapere che i nomi degli autori erano memorizzati nella forma Smith JA.
Man mano che la ricerca di parole di testo e più crossreferences di mesh diventavano disponibili online e il tempo di connessione diventava meno costoso, i ricercatori iniziarono a utilizzare il feedback immediato dal sistema per preparare e perfezionare le loro ricerche., Il ricercatore che non era sicuro di un termine MeSH potrebbe, invece di cercarlo in un libro pesante, cercare per titolo o parole astratte, trovare alcuni riferimenti su target e vedere come sono stati indicizzati. Invece di spendere tempo del ricercatore per preparare la ricerca in una forma che sarebbe accettabile per il computer—invece di lavoro del ricercatore per il computer—il computer ha cominciato a lavorare per il ricercatore.,
Produzione del database medline
Le riviste selezionate dalla National Library of Medicine per l’indicizzazione vengono inviate a un team di indicizzatori appositamente addestrati che analizzano ogni articolo e assegnano titoli di argomento medico ad esso. Assegnano in media da otto a dieci intestazioni a ciascun articolo. Come accennato in precedenza, una media di due a quattro di questi sono designati il “focus principale” dell’articolo. Queste rubriche sono i principali argomenti discussi nell’articolo e sono le rubriche sotto le quali l’articolo appare nell’indice stampato Medicus., Le altre rubriche si riferiscono ad argomenti che sono discussi ma non sono i punti principali.
La maggior parte delle voci possono anche essere assegnati sottovoci; in questo modo, un articolo che discute gli effetti collaterali di Aldomet può essere indicizzato sotto la voce principale Metildopa con gli effetti avversi sottovoce. L’indicizzatore esamina inoltre ogni articolo per altri tipi di descrittori, come i tipi di pubblicazione (Articolo storico, Recensione, Lettera all’editore, Linee guida, ecc.) e controllare i tag (umano, animale, maschio, femmina, ecc.).,
L’indicizzatore utilizza il termine più specifico disponibile nella struttura ad albero della MESH gerarchica. Pertanto, un articolo che discute l’anoressia e la bulimia, ma nessun altro tipo di disturbo alimentare, sarà indicizzato sotto Anoressia e sotto bulimia, ma non sotto Disturbi alimentari, disturbi mentali o Psichiatria., Poiché la MESH è organizzata gerarchicamente, il software consente ricerche limitate agli articoli indicizzati sotto il termine generale Disturbi mentali e ricerche che “esplodono” Disturbi mentali per includere tutti gli articoli indicizzati con uno qualsiasi dei termini MeSH più specifici che appaiono sotto di esso nella gerarchia MeSH. Sotto i disturbi mentali troviamo disturbi d’ansia, disturbi di personalità, disturbi alimentari e simili, e sotto i disturbi alimentari troviamo Bulimia, anoressia, iperfagia e simili., Un’esplosione di disturbi mentali recupererebbe riferimenti indicizzati sotto uno di questi argomenti e altro ancora. In alcune sezioni della MeSH ogni termine figlio è un sottoinsieme del suo genitore, mentre in altre sezioni i raggruppamenti sono più pragmatici che logici, cioè utili per il recupero quando un termine genitore è “esploso.”
In origine, la pratica dell’indicizzazione con il termine più specifico possibile serviva a limitare il numero di voci elencate sotto un termine qualsiasi nei volumi stampati di Index Medicus.11 Più recentemente, ha permesso di limitare una ricerca a un’area specifica della pratica medica o della ricerca., Ad esempio, nel 1988, il termine HIV è stato aggiunto al vocabolario MeSH. Un anno dopo, per accogliere la ricerca sulle sottospecie del virus HIV, sono stati aggiunti i termini HIV1 e HIV2. L’aggiunta di questi termini più specifici consente al clinico o al ricercatore di focalizzare ulteriormente una ricerca.
Negli ultimi 40 anni, il numero di voci principali delle maglie è cresciuto da 4.400 a quasi 20.000. Anche la struttura di riferimento incrociato è stata notevolmente ampliata. Oggi, ci sono più di 120.000 riferimenti incrociati o “termini di inserimento”, comprese le variazioni dell’ordine delle parole (ad es.,, Disturbi mentali, organico vedi disturbi mentali organici), che aiutano gli utenti punto dalle proprie parole a maglia termini.
Un problema con la ricerca per termini MeSH è sempre stato che gli articoli indicizzati prima dell’introduzione di un termine non sono indicizzati sotto quel termine. In effetti, la descrizione originale—la carta seminale-su qualsiasi nuovo argomento non è quasi mai indicizzata sotto quell’argomento., Così, quando Gruntzig, Senning e Siegenthaler descrissero l’angioplastica coronarica transluminale percutanea nel New England Journal of Medicine nel luglio 1979,12, gli indicizzatori della National Library of Medicine non avevano modo di sapere che questa nuova tecnica sarebbe diventata sufficientemente importante da giustificare una nuova rubrica di argomento medico. Questo articolo (così come alcune descrizioni più brevi e precedenti) è stato indicizzato in termini come angiografia, cateterizzazione, cateterizzazione cardiaca e vasi coronarici., Come più articoli sono stati pubblicati, l’importanza della tecnica è diventata più chiara, e nel 1981, il soggetto medico voce Angioplastica, Palloncino è stato introdotto, seguito, nel 1989, dal termine Angioplastica, transluminale, percutanea coronarica.
Per evitare di perdere riferimenti indicizzati prima dell’introduzione di un termine MeSH, i ricercatori possono utilizzare parole di testo in titoli e abstract per cercare citazioni indicizzate negli anni precedenti. Un program13 utilizzato per cercare nel database medline utilizza algoritmi che tentano di analizzare il significato del titolo e astratto., Altre interfacce medline ricerca ogni termine soggetto sia come termine MeSH e come parole di testo.
Accuratezza del database MEDLINE
Nel database medline, le parole di testo e i nomi degli autori sono occasionalmente errati. Alcuni degli errori ortografici provengono dal manoscritto stampato. Gli utenti finali, anche, errori di ortografia voci. Se un utente finale e il database medline sbagliano l’ortografia di una parola titolo nello stesso modo, e se il software di ricerca esegue automaticamente il mapping dalle parole del titolo (errate) alla MESH, l’utente che scrive male una voce può ancora trovare il termine MeSH pertinente e ottenere un buon risultato.,13
Poiché la ricerca per MeSH è così importante, sorge la domanda su come vengono applicati con precisione i termini della MeSH. Funk e Reid hanno studiato il database medline per la coerenza dell’indicizzazione, 14 ma a nostra conoscenza non ci sono studi pubblicati di accuratezza. D’altra parte, uno di noi ha fatto ricerche per cercare di “catturare” gli indicizzatori. Molte di queste ricerche hanno scoperto omissioni apparenti, ma l’esame dell’articolo originale ha rivelato, con rare eccezioni, perché è stato indicizzato così com’era., Soprattutto nell’area che è più importante per la ricerca—l’assegnazione di termini MeSH—il database medline sembra essere straordinariamente accurato.
MeSH, medline, il World Wide Web e il motore di ricerca Full-text
Negli ultimi anni, ispirati in parte dalla necessità di trovare documenti sul Web, i motori di ricerca full-text sono diventati popolari. Quando si utilizza un motore di ricerca full-text, l’utente digita una query in un’area designata e fa clic su VAI o INVIA per recuperare il risultato., I motori di ricerca full-text variano nel modo in cui selezionano e presentano gli “hit”, ma la maggior parte cerca di presentare prima quei documenti che contengono il maggior numero di parole di query il più spesso possibile. Pertanto, un “hit” che contiene tutte le parole della query molte volte e ravvicinate verrà presentato prima di un “hit” che contiene solo una delle parole della query una volta. Spesso gli algoritmi ignorano le preposizioni e altre “parole di arresto” e danno più peso ai termini rari, ai termini che appaiono vicino all’inizio del documento e ai termini che appaiono nel testo nello stesso ordine in cui appaiono nella query.,
I motori di ricerca full-text trattano abitualmente varianti lessicali, come anestesia e anestesia o colore e colore, e con forme plurali. In una certa misura si occupano di sinonimi. Inoltre, spesso forniscono funzioni avanzate che danno all’utente un certo controllo sulla strategia di ricerca, come la possibilità di limitare il recupero agli elementi in cui appaiono tutte le parole della query o di richiedere che determinate parole siano adiacenti o vicine l’una all’altra., Inoltre, sofisticati sistemi di ricerca full-text sfruttano informazioni strutturate sui concetti e le loro relazioni all’interno di vocabolari controllati. L’Unified Medical Language System (UMLS) Metathesaurus,15 che fornisce l’accesso a molti vocabolari controllati, tra cui MeSH, viene utilizzato nell’elaborazione del linguaggio naturale e nelle applicazioni di ricerca full-text, tra cui un certo numero di motori di ricerca Web.
Le tecniche di ricerca full-text consentono il recupero di raccolte di informazioni disparate, di cui il Web è l’esempio più grande e migliore., Un recupero ancora migliore risulterebbe se il materiale sul Web fosse strutturato e etichettato in modo più uniforme e se i motori di ricerca sfruttassero meglio la struttura e il tagging. Il desiderio di un migliore recupero delle informazioni sul Web spiega parte dell’attuale interesse per gli standard “metadati” e i linguaggi di mark-up, come SGML e XML.
Il Web è grande, i browser Web sono comuni e i motori di ricerca full-text sono popolari; di conseguenza, gli utenti hanno familiarità con la digitazione in un’area designata, premendo GO e recuperando il risultato., La possibilità di cercare medline con lo stesso look and feel come il resto del Web ha un sacco di fascino. Gli autori, tuttavia, desiderano iniettare una nota di cautela. A differenza della maggior parte degli altri elementi sul Web, i documenti nel database medline sono indicizzati in modo uniforme, gerarchico e accurato. La ricerca con termini MeSH è spesso il principale contributo alla completezza e alla precisione di una ricerca medline. Il modo in cui un motore di ricerca full-text associa la query di un utente a MeSH ha una limitazione fondamentale; vale a dire, che non dialoga con l’utente per risolvere l’ambiguità o per offrire alternative., Pertanto, l’utente che scrive erroneamente un termine MeSH, che non sa che esiste un termine MeSH più preciso, che esprime un concetto in parole che mappano a diversi termini MeSH diversi, o che usa parole che il motore di ricerca full-text non può mappare a MeSH, è probabile che ottenga un recupero inferiore.
Non solo i motori di ricerca full-text di oggi sono limitati nella loro capacità di mappare le query degli utenti su MeSH, ma nel caso di medline non presentano hit in ordine di utilità decrescente., Quando una ricerca produce un gran numero di colpi che non possono essere ridotti, pensiamo che sia importante che il software presenti articoli nelle migliori riviste mediche prima. Un articolo pubblicato sul New England Journal of Medicine è molto più probabile che sia utile di un articolo che soddisfa gli stessi criteri di ricerca ma è pubblicato in una lingua diversa dall’inglese, in una rivista priority 3 e che manca di un abstract online.
Conclusione
Questo articolo si è concentrato sulla MeSH nel contesto dello sviluppo di Index Medicus e medline, con cui la MeSH è inestricabilmente connessa., Certamente MeSH ha avuto la sua influenza primaria nel recupero bibliografico medico. Eppure, come il primo grande thesaurus progettato per l’uso in un sistema automatizzato, MeSH è anche un punto di riferimento nella rappresentazione del vocabolario medico e dei dati concettuali in forma leggibile dalla macchina. Negli 1980, quando iniziò il progetto UMLS, 15 molti ricercatori di informatica medica iniziarono a esaminare attentamente le caratteristiche dei vocabolari e delle classificazioni mediche leggibili dalla macchina., A quel tempo, MeSH era essenzialmente solo come esempio di un vocabolario con un formato di database etichettato esplicitamente, identificatori senza contesto, polierarchia, un’ampia struttura di riferimento incrociato, definizioni di testo e un ciclo di aggiornamento affidabile. Oggi molte di queste caratteristiche sono viste come requisiti critici per i vocabolari controllati che verranno utilizzati nei sistemi clinici.16
Nell’arena bibliografica, pensiamo che una seria ricerca medline richieda la capacità di creare elenchi di riferimenti per termine MeSH, parola titolo, parola astratta, autore, anno, istituzione, fonte e simili., Richiede la capacità di combinare questi elenchi con booleano AND, OR, e occasionalmente E NON, e di essere guidato dal numero di hit lungo la strada. Gli utenti finali spesso hanno bisogno di aiuto per trovare intestazioni e sottotitoli di argomenti medici che non conoscono o non possono scrivere, aiutare a navigare nella gerarchia delle mesh e aiutare con i nomi di autori e riviste.
MeSH ha avuto una storia gloriosa, di cui la National Library of Medicine può essere giustamente orgogliosa. MeSH è così potente che, con poche eccezioni, qualsiasi ricerca che può essere fatto con MeSH dovrebbe essere fatto con esso., Poiché i motori di ricerca full-text sono attualmente limitati nella loro capacità di mappare la query di un utente alle intestazioni di soggetti medici, c’è il rischio che la MESH venga de-enfatizzata. Speriamo che ciò non accada. Che i primi 40 anni siano solo l’inizio.
Gli autori ringraziano la signora Betsy Humphreys, la signora Lucretia McClure e altri per i loro numerosi suggerimenti premurosi.
.
. In:
(ed).,
.
:
,
:
–
.
.
.
;
:
–
.
.,
.
;
:
–
.
.
.
;
:
–
.
.,
.
:
,
.
.
.
:
,
:
.
.,
.
;
(
):
–
.
.
.
;
:
–
.,
.
.
;
(
):
–
.
.
.
;
:
–
.,
.
.
;
(
):
–
.
.,
.
;
:
–
.
.
.
;
(
):
–
.,
.
.
;
:
–
.
.
.,
;
(
):
–
.
.
.
;
(
):
–
.
Leave a Reply