descrevendo palavras
a ideia para o motor de palavras descrevendo veio quando eu estava construindo o motor para palavras relacionadas (é como um thesaurus, mas lhe dá um conjunto muito mais amplo de palavras relacionadas, em vez de apenas sinônimos). Enquanto brincava com vetores de palavras e a API” HasProperty ” da conceptnet, eu me diverti um pouco tentando obter os adjetivos que comumente descrevem uma palavra. Finalmente percebi que há uma maneira muito melhor de fazer isso: livros de análise!,
Projeto Gutenberg foi o corpus inicial, mas o analisador ficou mais ganancioso e mais ganancioso e eu acabei alimentando – o em algum lugar em torno de 100 gigabytes de arquivos de texto-na maioria ficção, incluindo muitas obras contemporâneas. O analisador simplesmente olha através de cada livro e tira as várias descrições de substantivos.,
esperançosamente é mais do que apenas uma novidade e algumas pessoas realmente vão achar útil para a sua escrita e brainstorming, mas uma pequena coisa para tentar é comparar dois substantivos que são semelhantes, mas diferentes de alguma forma significativa – por exemplo, o gênero é interessante: “mulher” versus “homem” e “menino” versus “menina”. Em uma análise rápida inital, parece que os autores de ficção são pelo menos 4x mais propensos a descrever mulheres (em oposição aos homens) com termos relacionados à beleza (em relação ao seu peso, características e atratividade geral)., Na verdade,” bela ” é possivelmente o adjetivo mais amplamente utilizado para as mulheres em toda a literatura do mundo, o que está em consonância com a representação geral unidimensional das mulheres em muitas outras formas de mídia. Se alguém quer fazer mais pesquisa sobre isso, deixe-me saber e eu posso dar-lhe muito mais dados (por exemplo, há cerca de 25000 entradas diferentes para “mulher” – muitos para mostrar aqui).
A azuleza dos resultados representa a sua frequência relativa. Você pode pairar sobre um item por um segundo e a pontuação de frequência deve aparecer., A ordenação de “singularidade” é padrão, e graças ao meu algoritmo complicado™, Ele ordena-os pela singularidade dos adjetivos para esse substantivo em particular em relação a outros substantivos (na verdade, é bastante simples). Como seria de esperar, você pode clicar no botão “Ordenar por frequência de Uso” para adjetivos por sua frequência de uso para esse substantivo.
Leave a Reply