Popisující Slova
myšlenka pro Slova Popisující motoru přišel, když jsem stavěl motor pro Související Slova (je to jako slovíčkaření, ale dává vám mnohem širší soubor související slova, spíše než jen synonyma). Při hraní s word vektory a“ HasProperty “ API conceptnet, měl jsem trochu legrace se snaží dostat přídavná jména, která běžně popisují slovo. Nakonec jsem si uvědomil, že existuje mnohem lepší způsob, jak to udělat: analyzovat knihy!,
Projekt Gutenberg byl původním korpusem, ale parser dostal greedier a greedier a nakonec jsem ho krmil někde kolem 100 gigabajtů textových souborů-většinou fikce, včetně mnoha současných děl. Analyzátor jednoduše prohlédne každou knihu a vytáhne různé popisy podstatných jmen.,
Doufejme, že to je více než jen novinkou, a někteří lidé budou skutečně užitečné pro jejich psaní a brainstorming, ale jeden šikovný malý věc je pokusit se porovnat dvě podstatná jména, která jsou podobná, ale liší se v některých významných způsobem – například pohlaví je zajímavé: „žena“ a „muž“ a „chlapec“ a „dívka“. Na inital rychlé analýzy se zdá, že autoři fikcí, jsou alespoň 4x více pravděpodobné, že k popisu ženy (oproti mužům) s krásou-souvisejících podmínek (pokud jde o jejich hmotnost, funkce a obecné atraktivity)., Ve skutečnosti, „krásný“ je možná nejvíce široce používané adjektivum pro ženy v celé světové literatuře, což je zcela v souladu s obecným zjednodušený zastoupení žen v mnoha jiných mediálních forem. Pokud někdo chce udělat další výzkum na to, dejte mi vědět a já vám může dát mnohem více dat (například, tam jsou asi 25000 různé položky pro „žena“ – příliš mnoho na show zde).
modrost výsledků představuje jejich relativní frekvenci. Můžete umístit kurzor myši na položku na vteřinu a mělo by se objevit frekvenční skóre., „Jedinečnost“ třídění je výchozí, a to díky mé Komplikované Algoritmus™, nařizuje jim přídavná jména‘ jedinečnost, že konkrétní podstatné jméno ve vztahu k ostatním podstatná jména (ve skutečnosti je to docela jednoduché). Jak byste očekávali, můžete kliknout na tlačítko „Třídit podle frekvence použití“ na přídavná jména podle jejich frekvence použití pro toto podstatné jméno.
Leave a Reply