beskriver ord
ideen til de beskriver ord motor kom, da jeg var ved at bygge motoren for relaterede ord (det er ligesom en synonymordbog, men giver dig en meget bredere sæt af relaterede ord, snarere end blot synonymer). Mens du spiller rundt med ord vektorer og” HasProperty ” API af conceptnet, jeg havde lidt sjov forsøger at få de adjektiver, der almindeligvis beskriver et ord. Til sidst indså jeg, at der er en meget bedre måde at gøre dette på: parse bøger!,
Projekt Gutenberg var det oprindelige korpus, men parseren blev grådig og grådig, og jeg endte med at fodre det et sted omkring 100 gigabyte tekstfiler – for det meste fiktion, inklusive mange moderne værker. Parseren kigger simpelthen gennem hver bog og trækker de forskellige beskrivelser af navneord ud.,
det er Forhåbentlig mere end bare en nyhed, og nogle folk rent faktisk vil finde det nyttigt for deres skrive-og brainstorming, men en pæn lille ting at prøve, er at sammenligne to substantiver, der er ens, men forskellige i nogle væsentlige måde – for eksempel køn er interessant: “kvinde” og “mand” og “dreng” og “pige”. På en inital hurtig analyse ser det ud til, at forfattere af fiktion er mindst 4 gange mere tilbøjelige til at beskrive kvinder (i modsætning til mænd) med skønhedsrelaterede udtryk (hvad angår deres vægt, funktioner og generelle tiltrækningskraft)., Faktisk er” smuk ” muligvis det mest anvendte adjektiv for kvinder i hele verdens litteratur, hvilket er helt i tråd med den generelle endimensionelle repræsentation af kvinder i mange andre medieformer. Hvis nogen vil undersøge dette yderligere, så lad mig det vide, og jeg kan give dig meget mere data (for eksempel er der omkring 25000 forskellige poster for “kvinde” – for mange til at vise her).
blueness af resultaterne repræsenterer deres relative frekvens. Du kan holde musepekeren over et emne i et sekund, og frekvensresultatet skal dukke op., Sorteringen “unikhed” er standard, og takket være min komplicerede algoritme™ bestiller den dem ved adjektivernes unikhed til det særlige substantiv i forhold til andre substantiver (det er faktisk ret simpelt). Som du ville forvente, kan du klikke på knappen “Sorter efter brugsfrekvens” til adjektiver efter deres brugsfrekvens for det navneord.
Leave a Reply