larunbata, urria 11, 2025

Nolabait esan, banaketa bat izanen litzaké 1.: erlatiboki positiboagoa eta 2.: expresiboki askoz nabarmenagoa nola espero genuen

Bueltatuz ki bi hizkuntzetako Twiter-en hitz-multzoak eta euren hitz-banaketak, gogora daigun zér adierazten duten banaketa (histograms) horiek (ikus #2860):

The histograms represent the 5,000 most commonly used words in each corpora (...), and native speakers scored words on a 1-9 double-Likert scale, with 1 being extremely negative, 5 being neutral, and 9 being extremely positive. Yellow indicates positivity (havg > 5), and blue indicates negativity (havg < 5). Distributions are ordered by increasing median (red vertical linne). [Dodds, Clark, Desu eta Danforth, 2015]

Hortaz, hasieratik adierazitako preventzio guztiekin bada ere (izan ere, halako datu konplexuen interpretazioa ez baita zuzeneko kontua), gogora daigun autoreek emandako ondoko grafikoak, non konparatuko lirakén hizkuntza bakoitzeko...

... the 5,000 most commonly used words in each corpora (...), [Dodds, Clark, Desu eta Danforth, 2015]

non adierazten dirén soilik Twiter-corpusak on koreera (Korean) eta gaztelania (Mexican Spanish):


Diogunez, preventzio guztiekin bada ere, bi banaketa horien arteko diferentziak oso nabarmenak dira...

1.: ... an mediana (zein dén erdiko posizioko hitzaren valorazioa, esan nahi baita, 3 balira, 2.aren valorazioa izanen litzaké banaketa horren mediana, zein goian dén marra gorria),...

2.: ... eta an variantza (bata askoz ere zabalagoa zein bestea, ikus #2861, #2862,...), islatuz oso eragin emozional ezberdinak (positiboak eta negatiboak, nahiz, bistan denez, diferentzia askoz nabarmenagoa da an alde positiboa: gogora daigu ze "Yellow indicates positivity (havg > 5), and blue indicates negativity (havg < 5).").

Nolabait esan, banaketa bat izanen litzaké 1.: erlatiboki positiboagoa eta 2.: expresiboki askoz nabarmenagoa nola espero genuen, alegia izanen luké espektro emozional askoz zabalagoa (ikus #2865).  [2873] [>>>]