Abstract
The National Library of Medicine ‘ s MEDLINE (MEDLARS Online) database was de eerste database die landelijk werd doorzocht via telecommunicatienetwerken met toegevoegde waarde. Nu beschikbaar op het World Wide Web gratis van de National Library of Medicine en uit vele andere bronnen, het is ‘ s werelds meest gebruikte medische database., MEDLINE is uniek omdat elke verwijzing naar de medische literatuur wordt geïndexeerd onder een gecontroleerde woordenschat genaamd Medical Subject Headsets (MeSH). Deze rubrieken zijn de sleutels die de medische literatuur ontsluiten. MeSH vermenigvuldigt het nut van de MEDLINE database en maakt het mogelijk om te zoeken in de medische literatuur zoals we vandaag doen. Deze paper herdenkt de 40ste verjaardag van de introductie van MeSH en groet een aantal van de vooruitziende personen die de MEDLINE database ontworpen en ontwikkeld.,
de impact van mispels op de medische bibliotheekwereld is niet die van de bekende metafoor—het steentje dat in de vijver is gevallen en concentrische cirkels werpt die vele punten op de kust bereiken. De impact is zeker geen kiezelsteen. Het is een machtige rots. De golven die het zal veroorzaken zullen nog lang opspringen en spatten. mispels is de grote bibliografische doorbraak van onze generatie.- Ralph T. Esterquest
gesproken door Ralph T. Esterquest op een symposium in 1963 (‘)., De medline database van de Nationale Bibliotheek van de geneeskunde (medlars Online) was de eerste database die landelijk werd doorzocht via telecommunicatienetwerken met toegevoegde waarde. Nu beschikbaar op het World Wide Web gratis van de National Library of Medicine en uit vele andere bronnen, het is ‘ s werelds meest gebruikte medische database.
Medline is uniek omdat elke verwijzing naar de medische literatuur wordt geïndexeerd onder een gecontroleerde woordenschat genaamd Medical Subject Headings (MeSH). Deze rubrieken zijn de sleutels die de medische literatuur ontsluiten., MeSH vermenigvuldigt het nut van de medline database en maakt het mogelijk om te zoeken in de medische literatuur zoals we vandaag doen. Dit document herdenkt de 40ste verjaardag van de introductie van MeSH, en het groet enkele van de vooruitziende personen die de medline database ontworpen en ontwikkeld.John Shaw Billings and the Origin of Index Medicus aan het begin van de burgeroorlog had een student aan het Medical College Of Ohio informatie nodig over epilepsie voor zijn afstudeerscriptie., De student, John Shaw Billings, bracht zes maanden door in bibliotheken in Cincinnati, New York en Philadelphia om de nodige literatuur te verzamelen. De medische literatuur werd vervolgens gefragmenteerd in duizenden lijsten, bibliografieën en indexen; het doorzoeken van de medische literatuur was werk dat Billings niet zou vergeten.Na zijn afstuderen onderscheidde Billings zich als veldchirurg in het leger van de Unie., Toen de oorlog voorbij was, kreeg hij een baan als assistent in het kantoor van de Surgeon General, waar hij de leiding nam over een verzameling boeken die op een plank achter het Bureau van Joseph Lovell, een voormalig Surgeon General ‘ s. Lovell was overleden in 1836, maar zijn collectie bleef groeien en toen Billings arriveerde, telde het ongeveer 2000 volumes. In 1866 verhuisden The Surgeon General ’s Office en de collectie naar de ruimte in Ford’ s Theatre,3 in Washington, de plaats waar President Lincoln werd vermoord.Billings bouwde de collectie op en in 1876 had het 52.000 boeken en pamfletten., Na verloop van tijd zou het de grootste medische bibliotheek in het land worden.4 onder verwijzing naar zijn eerdere ervaring in zijn Universiteitsbibliotheek besloot Billings de collectie te indexeren op auteur en onderwerp. In 1874 begon hij met het indexeren per onderwerp van de tijdschriftartikelen, boeken, scripties, rapporten en pamfletten, om de uitgebreide Indexcatalogus van de bibliotheek van de algemeen chirurg te produceren. De Index-catalogus zou uiteindelijk worden gepubliceerd in verschillende series van draaiende alfabetische volumes; nieuwe inzendingen voor anatomie ontvangen net na de release van “A” had een lange publicatie vertraging.,met ingang van 1879 publiceerde Billings de nieuwe artikelen uit medische tijdschriften als een aparte, maandelijkse, huidige bewustmakingsdienst genaamd Index Medicus. In die tijd passen alle nummers van Index Medicus voor een heel jaar, inclusief zowel auteur als onderwerp lijsten, gemakkelijk in één gebonden volume; ze vereisen 16 gebonden volumes vandaag. Het idee dat elk artikel in de medische literatuur moet worden geïndexeerd onder de onderwerpen besproken in het artikel zou leiden tot de ontwikkeling van het gaas dat we vandaag gebruiken.,nadat Billings in 1895 met pensioen ging uit het United States Army, werd hij directeur van de New York Public Library, waar hij enkele jaren met onderscheiding diende. De directeurschap van de bibliotheek van het kantoor van de algemene chirurg en de verantwoordelijkheid voor de Index Medicus werden overgedragen van de ene hogere medische officier naar de andere in een opeenvolging van vierjarige legerposten. In 1927 werd Index Medicus samengevoegd met de concurrerende bibliografie van de American Medical Association en omgedoopt tot driemaandelijkse cumulatieve Index Medicus.,de Tweede Wereldoorlog bracht urgentie voor actuele medische informatie, en een nieuwe directeur, Harold Wellington Jones, begon met het publiceren van een wekelijkse index genaamd Current List of Medical Literature. Jones regelde ook een overzicht van de bibliotheek in 1943 door professionele bibliothecarissen. Het zeer kritische rapport van deze enquête5 zou dienen als een blauwdruk voor belangrijke verbeteringen aan de collectie, het personeel, de activiteiten en de faciliteiten van de bibliotheek in de komende twee decennia., In reactie op een van zijn aanbevelingen ontwikkelde Jones “Principles to be Used in the Selection of Onderwerprubrieken”, gebaseerd op richtlijnen die oorspronkelijk door Billings waren geformuleerd.Frank Bradway Rogers and Medical Subject heads in 1949 werd kolonel Frank Bradway “Brad” Rogers directeur van de Army Medical Library-toen de naam van wat de bibliotheek was geweest van het Office of the Surgeon General of the Army. Net als zijn voorgangers was Rogers arts. In tegenstelling tot hen werd hij door het leger gestuurd om een master in bibliotheekwetenschappen te behalen als voorbereiding op de baan.,de eerste directeur die formeel werd opgeleid in bibliotheekkunde, Rogers gebruikte de principes ontwikkeld door Jones en werk onder contract aan de Welch Medical Library van de Johns Hopkins University om, in 1951, een gestandaardiseerde lijst van onderwerpen voor de huidige lijst van medische literatuur te produceren.7 In 1956 verleende het Amerikaanse Congres aan de Armed Forces Medical Library (zoals het in 1952 was hernoemd) statutory authority als de National Library of Medicine, en maakte het een aparte instelling binnen de United States Public Health Service., Later werd de National Library of Medicine onderdeel van de National Institutes of Health.in 1960 begeleidde Rogers de publicatie van de nieuw vernieuwde monthly Index Medicus, samen met een nieuw herziene en uitgebreide lijst van gestandaardiseerde onderwerprubrieken. De lijst-genaamd medische Onderwerptitels, of MeSH-bestaat uit enkele-en multi-woord termen die worden gebruikt om de medische literatuur te indexeren en te catalogiseren. Dit artikel herdenkt de 40ste verjaardag van MeSH—de gecontroleerde woordenschat, of thesaurus, die het mogelijk maakt om de biomedische literatuur te zoeken op de manier waarop we vandaag doen.,met het oog op een brede, tijdige verspreiding van medische informatie onderzocht Rogers mechanische manieren om de productie van de maandelijkse Index Medicus te vergemakkelijken. In 1958 startte hij samen met Seymour Taine, toenmalig hoofd van de National Library of Medicine ‘ s indexing operation, het Index Mechanization Project, dat gebruik maakte van geponste papiertape en ponskaarten, kaartsorteermachines en een hogesnelheidscamera. Dit project versnelde de productie van de gedrukte Index Medicus, maar het ondersteunde niet automatisch ophalen.,deze vroege ervaring met geautomatiseerde technieken en Rogers’ interesse in het concept van coördinatenindexering, ontwikkeld door Mortimer Taube 8,beïnvloedden de structuur en de filosofie van de eerste editie van MeSH.
Onderwerpscatalogus en periodieke indexering zijn in hun belangrijkste dimensies identieke processen, en voor beide moet één autoriteit worden gebruikt. Koppen moeten worden beschouwd als aanwijzers, niet als beschrijvende etiketten., De subrubrieken kunnen als substituut voor uitdrukkingen worden gestandaardiseerd en zouden dat moeten zijn, in tegenstelling tot specifieke hoofdrubrieken die over het algemeen brede begrippen vertegenwoordigen.9
hoofdrubrieken werden specifieker in latere edities, maar MeSH wordt nog steeds gebruikt in zowel de onderwerpcatalogus als de indexering (een nieuw begrip in 1960), en gestandaardiseerde actuele subrubrieken blijven een belangrijk kenmerk van de MeSH-woordenschat.
elk jaar wordt de Index Medicus groter. In 1960 besloeg de jaarlijkse cumulatie drie delen., In 1999 vulde de auteur inzendingen zes delen en het onderwerp inzendingen nog eens tien. Voor het opzoeken van artikelen geïndexeerd onder een bepaald onderwerp over een tijdspanne van jaren vereist het raadplegen van vele forse volumes.,
Index Medicus biedt een manier, zij het een lastige manier, om te zoeken naar artikelen geschreven door een bepaalde auteur of artikelen die betrekking hebben op een bepaald onderwerp, maar de gebonden volumes bieden geen praktische manier om artikelen te vinden die twee (of meer) onderwerpen samen bespreken; men kan artikelen over timolol of artikelen over myocardinfarct vinden, maar er is geen gemakkelijke manier om een zoekopdracht te richten op artikelen die beide bespreken., Ook, onder elke MeSH term, de gepubliceerde volumes van Index Medicus lijst alleen die artikelen waarvoor die term is aangewezen een belangrijke Focus-een van de (meestal twee tot vier) belangrijkste onderwerpen besproken in het artikel; om de resterende artikelen zou maken van de gedrukte volumes te dik en te duur.in 1960 begon de National Library of Medicine met de ontwikkeling van het Medical Literature Analysis and Retrieval System (mislars), met de ervaring van het Index Mechanization Project en met middelen van het National Heart Institute., Als onderdeel van deze inspanning werd een MeSH database ontwikkeld, en een herziene en geherstructureerde MeSH werd geproduceerd in 1963 onder leiding van Winifred Sewell.10 MeSH is sindsdien jaarlijks herzien en bijgewerkt. De 1963 editie bevatte de eerste versie van de MeSH hiërarchieën, of “boomstructuren”—al snel een krachtig hulpmiddel voor het automatisch ophalen geworden. Vanaf het begin zijn Mazenboomstructuren polyhierarchisch geweest, wat betekent dat een hoofdrubriek in meer dan één subcategorie kan voorkomen., Bijvoorbeeld, tuberculose, hepatische verschijnt in de infectieziekten boom onder tuberculose evenals in het spijsverteringsstelsel ziekten boom onder leverziekten.
in 1964 introduceerde de bibliotheek medlars-die bibliografische referenties in een gecomputeriseerde, doorzoekbare database opsloot en geautomatiseerde fototypesetting uitvoerde voor Index Medicus en andere, meer gespecialiseerde bibliografieën. Vanaf 1965 konden zoekopdrachten worden ingediend bij de National Library of Medicine of bij een van de gedecentraliseerde verwerkingscentra die werden opgericht in de Verenigde Staten en in het buitenland., Speciaal opgeleide bibliothecarissen, die cursussen hadden bijgewoond die zo lang als 3 maanden, vervolgens geformuleerd elke zoekopdracht en ingediend bij een mislars Search Center, waar ponskaarten werden ingevoerd in een computer, en de resulterende afdruk werd teruggestuurd per pakketpost. In de Verenigde Staten bedroeg de doorlooptijd gemiddeld 4 tot 6 weken.9
offline zoeken in batchmodus vertraagde bevrediging; niet zelden kwamen de resultaten van een zoekopdracht terug nadat de klinische vraag niet langer relevant was. Bovendien was het moeilijk te voorspellen hoeveel hits een bepaalde zoektocht zou opleveren., Om dit probleem te helpen omzeilen, stonden mispels drie zoekopdrachten toe, waarbij elke verklaring werd verwerkt tegen de vorige. Zo kon de ervaren zoeker zich richten op terugroepen met de eerste verklaring, op specificiteit met de derde, en op een aanvaardbaar evenwicht met de tweede. Toch, om een zoekopdracht uit te breiden die te weinig hits opleverde of om een zoekopdracht uit te breiden die te veel opleverde, moest opnieuw worden ingediend en verdere vertraging; zoeken moest online worden gedaan.,in december 1968, gefinancierd door de National Library of Medicine, werd het eerste realtime online bibliografisch opzoeksysteem in gebruik genomen bij het SUNY Biomedical Communication Network, met het hoofdkantoor in de SUNY Upstate Medical Center Library in Syracuse, New York.9 negen medische bibliotheken gebruikten teletypewriter terminals om 90.000 referenties uit de medlars database te doorzoeken. Zoekopdrachten kunnen worden uitgevoerd naar namen van auteurs of medische onderwerprubrieken, en ze kunnen worden beperkt door datum of taal; Er was geen bepaling voor het zoeken naar tekstwoorden in de titel of abstract., Zoekopdrachten werden online ingediend, maar totdat de resultaten offline werden afgedrukt en teruggestuurd, wist de zoeker niet hoeveel hits de zoekopdracht zou produceren, of dat ze op doel waren. Toch deden de negen bibliotheken meer zoekopdrachten via SUNY dan de rest van het land via mispels.In 1970 experimenteerde de National Library of Medicine, die via Teletypewriter Exchange (TWX) aanvragen voor interbibliotheek kreeg, met landelijke online toegang tot ongeveer 100 tijdschriften die waren geïndexeerd voor de verkorte Index Medicus (AIM).,11 van korte duur, maar populair, het project, genaamd AIM-TWX, leverde verder bewijs dat mensen wilden zoeken online.
MEDLINE
in 1971 introduceerde de National Library of Medicine medlars Online, of medline, op meer geavanceerde retrievalsoftware, en stelde deze beschikbaar via telecommunicatienetwerken met toegevoegde waarde. Met deze software, genaamd Elhill, konden getrainde zoekers—in de eerste plaats bibliothecarissen-zoeken op woorden in de titel en op vaste velden, zoals medische onderwerptitel, tijdschrifttitel, jaar van publicatie, en dergelijke., Elhill is vernoemd naar (Joseph) Lister Hill, de senator van Alabama en een sterke pleitbezorger van de gezondheidszorg naar wie het Lister Hill National Center for Biomedical Communications, die hij hielp creëren, ook werd genoemd.
voordat zij de Elhill-software mochten gebruiken om de medline-database te doorzoeken, moesten zoekers een cursus van twee weken volgen in online zoeken en in het gebruik van MeSH., Onderzoekers en clinici bespraken hun behoefte aan informatie met een van deze speciaal opgeleide zoekers, die het verzoek vertaalde in de juiste zoekstrategie en het onderzoek uitvoerde. Dit stond bekend als” gemedieerd zoeken”; met zeldzame uitzonderingen,” End-user searching ” bestond niet.
in de begindagen van medline namen bibliothecarissen doorgaans de tijd om elke zoekopdracht voor te bereiden voordat ze online gingen. Connect tijd was te duur om te verspillen, en het initiële systeem vereiste de zoeker om elke term in een precies correct formaat te typen., Gedrukte volumes, zoals het gepermuteerde MeSH, werden gebruikt om de zoeker te leiden naar onbekende MeSH termen. Zoekers moesten weten (of omhoog kijken) welke MeSH termen enkelvoud waren (oog, Hand en voet), en welke meervoud waren (vingers en tenen). Ze moesten weten wanneer het zelfstandig naamwoord vooraf ging aan het bijvoeglijk naamwoord (dieet, vermindering) en wanneer het bijvoeglijk naamwoord vooraf ging aan het zelfstandig naamwoord (diabetisch dieet), evenals wanneer een subrubriek moest worden toegepast op een hoofdrubriek (hypertensie/dieet therapie) en wanneer de Booleaanse en met een aparte medische onderwerprubriek (hypertensie en diabetisch dieet)., Ze moesten specifieke afkortingen gebruiken voor tijdschriftnamen (New Engl J Med voor de New England Journal of Medicine, maar JAMA voor de Journal of the American Medical Association), en ze moesten weten dat namen van auteurs werden opgeslagen in de vorm Smith JA.
naarmate het zoeken naar tekstwoorden en meer MeSH crossreferences online beschikbaar kwamen en de verbindingstijd minder duur werd, begonnen zoekers onmiddellijk feedback van het systeem te gebruiken om hun zoekopdrachten voor te bereiden en te verfijnen., De zoeker die niet zeker was van een MeSH term kon, in plaats van het op te zoeken in een flinke Boek, Zoeken op titel of abstracte woorden, vinden een paar On-target referenties, en zien hoe ze werden geïndexeerd. In plaats van dat de zoeker tijd spendeerde om de zoekopdracht voor te bereiden in een vorm die aanvaardbaar zou zijn voor de computer—in plaats van dat de zoeker voor de computer werkt—begon de computer voor de zoeker te werken.,
productie van de medline Database
tijdschriften die door de National Library of Medicine voor indexering zijn geselecteerd, worden naar een team van speciaal opgeleide indexers gestuurd die elk artikel analyseren en er medische rubrieken aan toewijzen. Zij kennen elk artikel gemiddeld acht tot tien rubrieken toe. Zoals eerder vermeld, een gemiddelde van twee tot vier van deze worden aangeduid als de “belangrijkste focus” van het artikel. Deze rubrieken zijn de belangrijkste onderwerpen die in het artikel worden besproken en zijn de rubrieken waaronder het artikel in de gedrukte Index Medicus voorkomt., De overige rubrieken hebben betrekking op onderwerpen die wel worden besproken, maar die niet de belangrijkste punten zijn.
De meeste rubrieken kunnen ook subrubrieken worden toegewezen; op deze manier kan een artikel over de bijwerkingen van Aldomet worden geïndexeerd onder de hoofdrubriek Methyldopa met de subrubriek bijwerkingen. De indexer onderzoekt ook elk artikel voor andere typen descriptoren, zoals publicatietypes (Historisch artikel, recensie, brief aan de redacteur, richtsnoer, enz.) en controleer tags (mens, dier, Man, Vrouw, enz.).,
De indexer gebruikt de meest specifieke term die beschikbaar is in de hiërarchische Mazenboomstructuur. Dus, een artikel dat anorexia en boulimia bespreekt, maar geen ander type eetstoornis, zal worden geïndexeerd onder Anorexia en onder boulimia, maar niet onder eetstoornissen, psychische stoornissen, of Psychiatrie., Omdat MeSH is hiërarchisch georganiseerd, software maakt zoekopdrachten die beperkt zijn tot artikelen geïndexeerd onder de algemene term psychische stoornissen evenals zoekopdrachten die “exploderen” psychische stoornissen om alle artikelen geïndexeerd met een van de meer specifieke MeSH termen die onder het in de MeSH hiërarchie verschijnen omvatten. Onder psychische stoornissen vinden we angststoornissen, persoonlijkheidsstoornissen, eetstoornissen, en dergelijke, en onder eetstoornissen vinden we boulimie, Anorexia, hyperfagie, en dergelijke., Een explosie van psychische stoornissen zou verwijzingen geïndexeerd onder een van deze onderwerpen en meer op te halen. In sommige secties van MeSH is elke kind term een subset van zijn ouder, terwijl in andere secties groeperingen meer pragmatisch dan logisch zijn—dat wil zeggen, nuttig voor het ophalen wanneer een ouder term is “geëxplodeerd.”
oorspronkelijk diende de praktijk van het indexeren onder de meest specifieke term die mogelijk was om het aantal vermeldingen onder een term in de gedrukte volumes van Index Medicus te beperken.11 meer recentelijk heeft het mogelijk gemaakt om een zoekopdracht te beperken tot een specifiek gebied van de medische praktijk of onderzoek., In 1988 werd bijvoorbeeld de term HIV toegevoegd aan het MeSH-vocabulaire. Een jaar later werden de termen HIV1 en HIV2 toegevoegd om onderzoek naar ondersoorten van het HIV-virus mogelijk te maken. De toevoeging van deze meer specifieke termen kan de clinicus of onderzoeker om verder te richten een zoekopdracht.
in de afgelopen 40 jaar is het aantal hoofdrubrieken van mazen gestegen van 4.400 tot bijna 20.000. Ook de kruisreferentiestructuur is sterk uitgebreid. Tegenwoordig zijn er meer dan 120.000 kruisverwijzingen of “invoertermen”, inclusief woordvolgorde variaties (bijv.,, Psychische stoornissen, organische zie organische psychische stoornissen), die helpen wijzen gebruikers van hun eigen woorden om MeSH termen.
een probleem met het zoeken op MeSH termen is altijd geweest dat artikelen geïndexeerd voordat een term wordt geïntroduceerd niet worden geïndexeerd onder die term. Inderdaad, de oorspronkelijke beschrijving—de baanbrekende paper—over een nieuw onderwerp is bijna nooit geïndexeerd onder dat onderwerp., Dus toen Gruntzig, Senning en Siegenthaler percutane transluminale coronaire angioplastiek beschreven in de New England Journal of Medicine in Juli 197912, hadden de indexers van de National Library of Medicine geen manier om te weten dat deze nieuwe techniek voldoende belangrijk zou worden om een nieuwe medische titel te rechtvaardigen. Dit artikel (evenals een paar korte, eerdere beschrijvingen) werd geïndexeerd onder termen zoals angiografie, katheterisatie, hartkatheterisatie, en coronaire vaten., Naarmate meer artikelen werden gepubliceerd, werd het belang van de techniek duidelijker en in 1981 werd de medische rubriek angioplastie, ballon geïntroduceerd, in 1989 gevolgd door de term angioplastie, Transluminaal, percutaan coronair.
om ontbrekende referenties te voorkomen die zijn geïndexeerd vóór de introductie van een MeSH-term, kunnen zoekers tekstwoorden gebruiken in titels en abstracts om citaten te zoeken die zijn geïndexeerd tijdens voorgaande jaren. Een programma13 gebruikt om te zoeken in de medline database maakt gebruik van algoritmen die proberen om de Betekenis van de titel en abstract te analyseren., Andere medline interfaces zoeken elk onderwerp term zowel als een MeSH term en als tekst woorden.
nauwkeurigheid van de MEDLINE-Database
in de medline-database worden tekstwoorden en namen van auteurs soms verkeerd gespeld. Sommige spelfouten komen uit het gedrukte manuscript. Eindgebruikers, ook, verkeerd spellen inzendingen. Als een eindgebruiker en de medline database een titelwoord op dezelfde manier verkeerd spelt, en als de zoeksoftware automatisch van (verkeerd gespelde) titelwoorden naar MeSH in kaart brengt, kan de gebruiker die een item verkeerd spelt nog steeds de relevante MeSH term vinden en een goed resultaat krijgen.,13
omdat zoeken op MeSH zo belangrijk is, rijst de vraag hoe nauwkeurig MeSH termen worden toegepast. Funk en Reid bestudeerden de medline database voor consistentie van indexering,14 maar voor zover wij weten zijn er geen gepubliceerde studies van nauwkeurigheid. Aan de andere kant, een van ons heeft zoekopdrachten gedaan om te proberen “te vangen” de indexers. Veel van deze zoekopdrachten onthulde schijnbare omissies, maar onderzoek van het oorspronkelijke artikel onthulde, met uitzondering van zeldzame uitzondering, waarom het werd geïndexeerd zoals het was., Vooral op het gebied dat het meest belangrijk is om te zoeken—het toewijzen van MeSH termen—de medline database lijkt opmerkelijk nauwkeurig te zijn.
MeSH, medline, The World Wide Web en de Full-text Search Engine
de laatste jaren zijn full-text zoekmachines populair geworden, deels geïnspireerd door de noodzaak om documenten op het Web te vinden. Bij het gebruik van een full-text zoekmachine, typt de gebruiker een query in een aangewezen gebied en klikt u op GO of SUBMIT om het resultaat op te halen., Full-text zoekmachines variëren in hoe ze de “hits” selecteren en presenteren, maar de meeste proberen eerst die documenten te presenteren die zoveel mogelijk van de query woorden bevatten zo vaak mogelijk. Dus, een ” hit “die alle query woorden bevat vele malen en dicht bij elkaar zal worden gepresenteerd voordat een” hit ” die slechts één van de query woorden bevat een keer. Vaak negeren de algoritmen voorzetsels en andere “stopwoorden” en geven ze meer gewicht aan zeldzame termen, aan termen die dicht bij het begin van het document verschijnen, en aan termen die in de tekst in dezelfde volgorde verschijnen als in de query.,
Full-text zoekmachines behandelen routinematig lexicale varianten, zoals anesthesie en anesthesie of kleur en kleur, en meervoudsvormen. Tot op zekere hoogte behandelen ze Synoniemen. Daarnaast bieden ze vaak geavanceerde functies die de gebruiker enige controle geven over de zoekstrategie, zoals de mogelijkheid om het ophalen te beperken tot items waarin alle zoekwoorden verschijnen of om te eisen dat bepaalde woorden naast of dicht bij elkaar staan., Daarnaast maken geavanceerde full-text zoeksystemen gebruik van gestructureerde informatie over concepten en hun relaties binnen gecontroleerde woordenlijsten. De Unified Medical Language System (UMLS) metathesaurus,15 die toegang biedt tot veel gecontroleerde woordenlijsten, waaronder MeSH, wordt gebruikt in natuurlijke taalverwerking en full-text zoekapplicaties, waaronder een aantal web zoekmachines.
Full-text zoektechnieken maken het mogelijk om informatie op te zoeken in verschillende collecties, waarvan het Web het grootste en beste voorbeeld is., Nog betere retrieval zou resulteren als materiaal op het Web uniformer gestructureerd en gelabeld zou zijn en als zoekmachines beter gebruik zouden maken van de structuur en de tagging. De wens om informatie op het Web beter te vinden verklaart de huidige belangstelling voor “metadata” -standaarden en markeertalen, zoals SGML en XML.
het Web is groot, webbrowsers zijn algemeen, en full-text zoekmachines zijn populair; als gevolg daarvan zijn gebruikers vertrouwd met het typen in een aangewezen gebied, het drukken op GO, en het ophalen van het resultaat., De mogelijkheid om medline zoeken met dezelfde look en feel als de rest van het Web heeft veel aantrekkingskracht. De auteurs willen echter voorzichtig zijn. In tegenstelling tot de meeste andere items op het Web worden documenten in de medline-database uniform, hiërarchisch en nauwkeurig geïndexeerd. Zoeken met MeSH termen is vaak de belangrijkste bijdrage aan de volledigheid en precisie van een medline zoekopdracht. De manier waarop een full-text zoekmachine de query van een gebruiker koppelt aan MeSH heeft een fundamentele beperking; namelijk dat het geen dialoog met de gebruiker aangaat om dubbelzinnigheid op te lossen of alternatieven aan te bieden., Dus, de gebruiker die een MeSH term verkeerd spelt, die niet weet dat er een meer precieze MeSH term bestaat, die een concept uitdrukt in woorden die in kaart brengen naar verschillende MeSH termen, of die woorden gebruikt die de full-text zoekmachine niet in kaart kan brengen naar MeSH, is waarschijnlijk een inferieure retrieval te krijgen.
niet alleen zijn de huidige full-text zoekmachines beperkt in hun vermogen om gebruikers query’ s te koppelen aan MeSH, maar in het geval van medline presenteren ze geen hits in volgorde van aflopend nut., Wanneer een zoekopdracht een groot aantal hits oplevert die niet kunnen worden gekort, vinden we het belangrijk dat de software eerst items in de beste medische tijdschriften presenteert. Een artikel gepubliceerd in de New England Journal of Medicine is veel meer kans om te helpen dan een artikel dat voldoet aan dezelfde zoekcriteria, maar is gepubliceerd in een andere taal dan het Engels, in een priority 3 journal, en dat ontbreekt een abstract online.
conclusie
Dit artikel is gericht op MeSH in de context van de ontwikkeling van Index Medicus en medline, waarmee MeSH onlosmakelijk verbonden is., MeSH heeft zeker zijn primaire invloed gehad in de medische bibliografische opvraging. Toch, als de eerste grote thesaurus ontworpen voor gebruik in een geautomatiseerd systeem, MeSH is ook een mijlpaal in de weergave van medische woordenschat en concept gegevens in machine-leesbare vorm. In de jaren 1980, toen het UMLS-project begon, begonnen 15 veel medische informatica-onderzoekers de kenmerken van machineleesbare medische woordenlijsten en classificaties nauwkeurig te onderzoeken., Op dat moment, MeSH stond in wezen alleen als een voorbeeld van een woordenschat met een expliciet tagged database-formaat, context-vrije identifiers, polyhierarchie, een uitgebreide cross-reference structuur, tekstdefinities, en een betrouwbare update cyclus. Tegenwoordig worden veel van deze kenmerken gezien als kritische vereisten voor gecontroleerde woordenlijsten die gebruikt zullen worden in klinische systemen.16
in de bibliografische arena, denken we dat serieus medline zoeken de mogelijkheid vereist om lijsten met referenties te maken op MeSH term, titelwoord, abstract woord, auteur, jaar, instelling, bron en dergelijke., Het vereist de mogelijkheid om deze lijsten te combineren met Boolean en, of, en af en toe en niet, en om geleid te worden door het aantal hits langs de weg. Eindgebruikers hebben vaak hulp nodig bij het vinden van medische onderwerprubrieken en subrubrieken die ze niet kennen of niet kunnen spellen, bij het navigeren in de MeSH-hiërarchie en bij de namen van auteurs en tijdschriften.
MeSH heeft een glorieuze geschiedenis gehad, waarop de National Library of Medicine terecht trots kan zijn. MeSH is zo krachtig dat, met enkele uitzonderingen, elke zoektocht die kan worden gedaan met MeSH moet worden gedaan met het., Omdat full-text zoekmachines zijn momenteel beperkt in hun vermogen om de vraag van een gebruiker in kaart te brengen om medische onderwerprubrieken, is er een risico dat MeSH zal worden de-benadrukt. We hopen dat dit niet zal gebeuren. Moge de eerste 40 jaar nog maar het begin zijn.de auteurs danken mevrouw Betsy Humphreys, mevrouw Lucretia McClure en anderen voor hun vele doordachte suggesties.
. In:
(ed)., (‘) Proceedings of the 1963 Clinic on Library Applications of Data Processing, 28 April–1 mei 1963 (2).
:
,
:
–
.
.
.
;
:
–
.
.,
.
;
:
–
.
.
.
;
:
–
.
.,
. Chicago, Ill
:
,
.
.
.
:
,
:
.
.,
.
;
(
):
–
.
.
.
;
:
–
.,
.
.
;
(
):
–
.
.
.
;
:
–
.,
.
.
;
(
):
–
.
.,
.
;
:
–
.
.
.
;
(
):
–
.,
.
.
;
:
–
.
.
.,
;
(
):
–
.
.
.
;
(
):
–
.
Leave a Reply