descripción de palabras
La idea del motor de palabras descriptivas surgió cuando estaba construyendo el motor para palabras relacionadas (ES como un tesauro, pero te da un conjunto mucho más amplio de palabras relacionadas, en lugar de solo sinónimos). Mientras jugaba con vectores de palabras y la API» HasProperty » de conceptnet, me divertí un poco tratando de obtener los adjetivos que comúnmente describen una palabra. Finalmente me di cuenta de que hay una manera mucho mejor de hacer esto: ¡analizar libros!,
el Proyecto Gutenberg fue el corpus inicial, pero el analizador consiguió codiciosas y codiciosas y terminé de alimentación alrededor de 100 gigabytes de archivos de texto – en su mayoría de ficción, incluyendo muchas obras contemporáneas. El analizador simplemente mira a través de cada libro y saca las diversas descripciones de los sustantivos.,
esperemos que sea más que solo una novedad y algunas personas realmente lo encontrarán útil para su escritura y lluvia de ideas, pero una pequeña cosa interesante es comparar dos sustantivos que son similares, pero diferentes de alguna manera significativa – por ejemplo, el género es interesante: «mujer» versus «hombre» y «niño» versus «niña». En un análisis rápido inicial, parece que los autores de ficción tienen al menos 4 veces más probabilidades de describir a las mujeres (en comparación con los hombres) con términos relacionados con la belleza (con respecto a su peso, Características y atractivo general)., De hecho, «hermosa» es posiblemente el adjetivo más utilizado para las mujeres en toda la literatura mundial, lo que está bastante en línea con la representación unidimensional general de las mujeres en muchas otras formas de medios. Si alguien quiere investigar más sobre esto, hágamelo saber y puedo darle muchos más datos (por ejemplo, hay alrededor de 25000 entradas diferentes para «mujer», demasiadas para mostrar aquí).
el azul de los resultados representa su frecuencia relativa. Puede pasar el cursor sobre un elemento durante un segundo y la puntuación de frecuencia debería aparecer., La clasificación de «unicidad» es predeterminada, y gracias a My Complicated Algorithm™, los ordena por la unicidad de los adjetivos para ese sustantivo en particular en relación con otros sustantivos (en realidad es bastante simple). Como es de esperar, puede hacer clic en el botón «Ordenar por frecuencia de uso» para adjetivos por su frecuencia de uso para ese sustantivo.
Leave a Reply