larunbata, ekaina 21, 2025

Hammarström (2015) buruzki WALS (2013): "It is not clear how the data points/languages were selected, but it may be guessed that it is some kind of convenience sample"

Atzokoan amaitzen genuen gure sarrera esánez:

Bestalde, irakurtzen dugunez, atlas horren helburua [WALS, 2013] ez da izan sortzea lagin representatibo bat on munduko hizkuntzak, baizik sortzea datu-base erraldoi bat kin hizkuntza nahiko-intensiboki aztertuak. Hori, dudagabe, oso helburu interesagarria da, baina datu horiek ezin dira zuzenean erabili kizun atera konklusio orokor representatiboak burúz portzentaje zehatzak, nahiz haren emaitzak ez diren ibiliko oso urruti.

eta lehenxeago zehazten genuen ze:

Kontua da ze datu-base horretan konsideratzen dirá ezaugarri linguistiko anitz, eta horrek eskatzen ditú gramatika luze eta zehatzak, hau da referentzia ondo landuak, zeinen existentzia ez den zergatik izan behar orekatua artén munduko area eta familia linguistiko guztiak, halan-ze eskakizun horrek tipikoki ekarriko ditú honako sesgo primarioak (ikus [2758]):

  • library bias (sources available)
  • research bias (which languages have actually been researched)
  • language of publication bias
zeren iturri bibliografiko guztiak ez dira berdin eskuragarriak; munduko hizkuntza guztiak ez dira aztertu berdin intensiboki, eta egindako azterketa batzuk egon ahal dira publikatuak an hizkuntzak zein ez diren hain irisgarriak, halan-ze, ondorioz eta finean, horrek guztiak sortuko ditú sesgo geografikoak eta genetikoak.

Horren inguruan, Hammarström-ek (2015) egiten dú ondoko valorazioa eta konparazioa artén bere datu-multzo praktikoki exhaustiboa (5230 hizkuntza) eta WALS-en datu-basea (1302 hizkuntza), non...

... It is not clear how the data points/languages were selected, but it may be guessed that it is some kind of convenience sample [Hammarström, "The Basic Word Order Tipology: An Exhaustive Study", slides, 2015]

Komenientzia-lagin horren iturriak liraké biblioteka-sesgoa (library bias), ikerketa-sesgoa (research bias) eta sesgoa on publikazio-hizkuntza (language of publication bias), nondik segituko lirakén sesgo geografikoa eta genetikoa. [2761] [>>>]