asteartea, iraila 30, 2025

Dodds, Clark, Desu eta Danforth (2015): "The same average happiness distributions shown in Fig. 1 (herenegungoa) re-ordered by increasing variance."

Atzokoan amaitzen genuen esanez ze...

... artikuluaren autoreek kalkulatu deuskué banaketa ezberdinen variantzak (zein dén dispersio-neurri bat), lortuz beste rankin linguistiko bat, zein ikusiko dugún bihar.

eta hortxe doakizue bigarren rankin hori, non hizkuntza ezberdinetako corpusak ordenatzen diren aráuz euren banaketen variantza: lehenengoa variantza handienekoa (Portugese: Twitter) eta azkena variantza txikienekoa (Russian Google Books):

The same average happiness distributions shown in Fig. 1 (herenegungoa) re-ordered by increasing variance. Yellow indicates above neutral (havg = 5) , blue below neutral, red vertical lines mark each distribution's median, and the gray background lines connect the deciles of adjacent distributions. [Dodds, Clark, Desu eta Danforth, 2015]

Kontua da ze, adibidez  bi corpus horiek (aipatutako lehena eta azkena: Twitter portuguss eta Google liburu rusiarrak) ez jaku iruditzen corpus bereziki konparagarriak, halan ze nahiago izan dugu egin azpi-rankin bat soilik kin Twitter guztiak (hantxe non bádaudén Twitter corpusak), zein diren honako 8 hauek, ordenaturik aráuz euren banaketaren variantza:

Portuguese > Spanish > English French > Indonesian > Russian > German  > Korean

non berriro agertzen jakun hizkuntza korearra an azken posizioa (alegia, sintaxi SOV buruazken bakarra) eta sintaxi oso progresiboak an lehenengo posizioak. Bihar mintzatuko gara gain autoreen interpretazioa on emaitza horiek. [2862] [>>>]