astelehena, ekaina 30, 2025

Nabarmengarria da Nichols-en ondoko puntua zatio bere sakontasun zientifikoa (!): "This is based on reading just the abstract. I'll now read the paper."

Atzoko artikuluak (Gell-Mann eta Ruhlen, 2011) sortu zituén komentario batzuk an Lingtyp posta-zerrenda, zeinen objezioak ez diren gain artikuluaren eduki zehatza, baizik gehiago gain publikazioa bera (?), edo gain autoreen oinarrizko ezagutza gain topikoa (gabén espezifikatu deskalifikazio horren arrazoi zehatza), apuntatuz ad hominen (the authors don't even know...), eta hortaz ondo adieraziz kritikatzailearen maila zientifiko penagarria (zehazki, Johanna Nichols):

This is grossly irresponsible on PNAS's part. The authors don't even know the basic literature on word order, genealogical classification of languages, stability of word order, or mathematics and statistics of type changes in populations. (This is based on reading just the abstract. I'll now read the paper.). [Johanna Nichols, 2011]

Nabarmengarria da Nichols-en azken puntua zatio bere sakontasun zientifikoa (!): 

This is based on reading just the abstract. I'll now read the paper. [Johanna Nichols, 2011]
Aitzitik, horri erantzunez, Giorgio Francesco Acordia-k (2011) idatzi zuén ondoko hau, oso ezberdina:

... I realised that one of the authors is Merrit Ruhlen, which I assume knows very well the literature on word order and, anyway, many works on the topic are actually quoted in the paper (see the references section). I will read the paper now. [Acordia. 2011]

Oso interesgarria, hau guztia. [2770] [>>>]

igandea, ekaina 29, 2025

Gell-Mann eta Ruhlen (2011): "The word order in the ancestral language was SOV"

Atzokoan Givon-ek aipatzen zuén Gell-Mann eta Ruhlen, eta gaur autore horien lana gogoratuko dugu (ikus #1151), nabarmenduz euren konklusioa burúz ustezko hitz-ordena on hizkuntza primigenioa, antzinekoa, lehenengoa zein hasi zen mintzatzen artén gizakiok, eta nondik derivatuko liraké beste hizkuntza guztiak:  

The word order in the ancestral language was SOV. [Gell-Mann eta Ruhlen, 2011]

Ikus ondoko aipu luzea (ikus ere #1151):

zeinen konklusioak dirén hauek (Gell-Mann eta Ruhlen, 2011):

Berriro ere SOV kokatzen da an jatorria on evoluzioa on hitz-ordenak. [2769] [>>>]

larunbata, ekaina 28, 2025

Thomas Givon (2005): "In general, SOV is the oldest attested word-order in human language."

Gure oraingo helburua dá...

... aztertzea nóla banatzen zirén (banatu zitezkén) hitz-ordenak an hizkuntza-familia guztien versio zaharrenak (kasu honetan, familia biziak eta hilak ere bai).  [ikus atzoko sarrera]
zeinen inguruan atzokoan iristen genuén ondorengo konklusioa ganik Yamamoto (2005):

Laburbilduz, ikerketa horren arabera, SOV izan zitekén munduko hizkuntza (ia) guztien ordena oso zahar bat (esan dugunez, argudiagarria da ze orohar OVS izan zitekén are zaharragoa, baina izanki hain hitz-ordena ez-egonkorra, joanen zén bihurtzen SOV).
Eta jarraiki ber haria, gogora daigun ondoko hitzak ganik Thomas Givón (2005, ikus gure #73): 

Tom Givon da autoritate bat an hizkuntzalaritza funtzionala:

Functional linguistics also began to develop as a field in the 1970s, in the work of linguists such as Joan Bybee, Bernard Comrie, John Haiman, Paul Hopper, Sandra Thompson, and Tom Givon. The principal focus of functional linguistics is on explanatory principles that derive from language as a communicative system,...
Eta Tom Givon-ek (2005) dio (erantzunez ki galdera oso interesgarri bat on Bittor Hidalgo hizkuntzalari eta EHUko irakaslea):
Dear Bittor,

One could make a few methodological suggestions about how to approach the problem(s) you raised:

1. Synchronic morphology is most often the best guide for reconstructing older syntax. There is not a single shred of evidence in Japanese morphology indicating anything but SOV syntax (see Givon 1971, 1979, 1983 ed., 2001, inter alia).

2. In general, SOV is the oldest attested word-order in human language. Most natural (non-contact induced) drift is, as far as I know, always away from SOV, not toward it (Givon 1979; Ruhlen & Gell-Man, forthcoming).

3. All natural languages with 'rigid' word-order have much freer word-order in actual natural (oral) communication, with much pragmatically-determined variation. Put another way, rigid WO is relative, never absolute.

These are all old hats, by the way, so much so that I feel somewhat embarrassed to re-state them (again...).

Best regards, TG

Beraz, hor ikusten dugu noláko inportantea den bereiztea zéin baldintzatan gertatu diren hizkuntza-aldaketak (jakina, ahal den neurrian).

Argi denez, Givon-en konklusioa doa an ber direkzioa zein Yamamoto-rena, alegia-ze garai zaharretan SOV hitz-ordena zén oso-oso nagusia. [#2768] [>>>]

ostirala, ekaina 27, 2025

Yamamoto (2005): "The present work does demonstrate and argue that SOV order is most likely to have covered most of the world as far as we go back to the past based on the studies of areal and genetic distribution of word order of the world's languages, but it does not necessarily argue that SOV was the earliest word order of human languages."

Esaten genuén an #2759:

..., badirudi ze Tomlin-ek konsideratu nahiko zituzkén hizkuntz familia hilak ere. Gure ikuspuntutik, ordea, askoz produktiboagoa da burutzea ondoko hiru azterketa hauek, nondik atera ahal dirén askoz konklusio esanguratsuagoak:

1.: Aztertzea nóla banatzen dirén hitz-ordenak an gaur egungo hizkuntza bizi guztiak.

2.: Aztertzea nóla banatzen zirén (banatu zitezkén) hitz-ordenak an hizkuntza-familia guztien versio zaharrenak (kasu honetan, familia biziak eta hilak ere bai). 

3.: Aztertzea nóla banatzen dirén (banatu zitezkén) hitz-ordenen aldaketa naturalak hala nola ere horiek induzituak ganik kontaktu linguistikoa (zéin baldintzatan gertatu diren, noiz gertatu diren, eta zéin norabidetan gertatu diren).

Hiru azterketa ezberdin, nahiz estuki lotuak (labur esanda, aztertuz oraingoa, lehengoa eta bitartekoa), eta kontua da ze Tomlin-ek (1986) burutu dú lehen azterketa (ikus ere [2749]). Gaur egun, bá al dugu informazio gehigarririk burúz goragoko beste bi azterketak?

Aztertua dugú goragoko lehen puntua, konkluituz honako hau (ikus #2763):

Eta behin azterketa sinkronikoa burututa, konkluitzen dugu ze (ikus #2762) :

..., Tomlin-en lagina da datu-multzo sinpleena zein hartu ahal dén kin helburu representatiboa respektu gaur egungo hitz-ordenen banaketa:

  • OV → 185/402 = %46
  • VO → 217/402 = %54
non, gaur egun, VO kopurua > OV kopurua.

eta, ez hainbeste, kontrakoa, nola Laka-k (2025) dioen.

Pasa gaitezen orain ki goragoko bigarren azterketa, alegia:

2.: Aztertzea nóla banatzen zirén (banatu zitezkén) hitz-ordenak an hizkuntza-familia guztien versio zaharrenak (kasu honetan, familia biziak eta hilak ere bai).  
Horretaz, gogoratuko dugú ondorengo artikulua ganik Hideki Yamamoto (2005), non autorea saiatzen den aurkitzen familia linguistiko askotako ordena zaharrenak, helduz ki honako konklusioa:

[#1337] Yamamoto (2005): "... it seems most likely that human languages originally started with SOV basic word order..."

Txopi-k atzo:

Badakigu beraz, nola izan ahal zen sintaxia on hizkuntzak an Neolitiko garaia.  [Txopi]

Horretaz ikus daigun ondorengo artikulua ganik Hideki Yamamoto (2005) titúlatzen "A historical view on areal distribution of word order around the world", non dioskún:

When the distribution is considered from a historical point of view, however, it is very likely that most of the areas had been covered with (S)OV-type languages and that the areas of a VO type had been very restricted before many large language families expanded after the Neolithic age. [Yamamoto, 2005]

edo, aurrerago:

The present work does demonstrate and argue that SOV order is most likely to have covered most of the world as far as we go back to the past based on the studies of areal and genetic distribution of word order of the world's languages, but it does not necessarily argue that SOV was the earliest word order of human languages. If SOV order was predominant in most areas on the globe when we trace back to the past, however, there should be some reason for this and it seems most likely that human languages originally started with SOV basic word order unless there are good grounds for judging that languages developed SOV order from another order. The reason for this, however, should be found in studies of pidgin or creole languages and language typology rather than in the speculation made by Givón based on tbe observation of animal comunication or language acquisition.

Beraz, eta labúrbilduz:

... it seems most likely that human languages originally started with SOV basic word order unless there are good grounds for judging that languages developed SOV order from another order. [Yamamoto, 2005]
Gure ikuspuntutik, OVS ere aurki zitekén are lehenago zein SVO (hori ere OV), nahizta OVS ez da batere egonkorra azpi baldintza komunikatibo minimoki exigenteak.

Laburbilduz, ikerketa horren arabera, SOV izan zitekén munduko hizkuntza (ia) guztien ordena oso zahar bat (esan dugunez, argudiagarria da ze orohar OVS izan zitekén are zaharragoa, baina izanki hain hitz-ordena ez-egonkorra, joanen zén bihurtzen SOV). [#2767] [>>>]

osteguna, ekaina 26, 2025

Zenbakiek dúte markatzen muga argi bat artén pentsamendu zenbatzaile numeriko potentea eta pentsamendu zenbatzaile ez-numeriko ondo ahulagoa

Gaurkoan (ikus atzoko #2765 ) soilik azpimarratu nahi genuen atzoko aipuko zati hau:

Eta ondo ezberdindu behar da alde batetik pertsonen gaitasun kognitivo matematiko-numerikoa, eta bestetik teknologia linguistikoa zeinekin dan gauzatzen gaitasun kognitivo hori. Gauzabide horretan, teknologia numerikoak du markatzen muga argia arten pentsamendu zenbatzaile numeriko potentea eta pentsamendu zenbatzaile anumeriko ondo ahulagoa. [2014:112-113]

Bai, hemen ere, ez daigun nahastu gaitasuna kognitiboa bera eta erreminta teknologiko-kulturala zeinekin hobeki gauzatzen dugún gure gaitasun kognitiboa. [#2766] [>>>]

asteazkena, ekaina 25, 2025

Horrá atzo aipatutako pasartea

Atzokoan amaitu genuen esánez:

Han ["Hizkuntzen berdintasun komunikatiboa: mitoa ala errealitatea?" (2014:107-140)] erabili genuén hitz hori, emanez bere definizioa. Bihar aipatuko dugú pasartea.

Horrá beraz liburu horretako pasarte konkretua non agertzen dén "subitizatu" aditza, hala nola ere bere inglesezko definizioa eta baita aipu bat non agertzen dirén inglesezko hiru erabilera (2014:112-113):

Ondo da. [#2765] [>>>]

asteartea, ekaina 24, 2025

Buruzki "subitizatu"

Hitz-ordenen diakroniara baino lehen (ikus atzoko #2763), eta gaiaz pixkat aldatzeko, aipatu nahi genuke hitz bat zeintaz mintzatu dén orain dela gutxi (ekainaren 5-ean) an ITZUL posta-zerrenda:

  • subitizatu

Zerrenda horretan, Josu Garate itzultzaileak egiten zuén honako galdera (ekainak 5):

zeini Aitor Salaberria-k erantzuten zión honako hau:

eta Xabier Aristegieta-k ondorengo hau:

gero Lierni Garmendia-k zioén hau:

 geroago, Josu-k eskertzen zituén erantzun horiek:

eta, azkenik, Alfontso Mujika-k gaineratzen zuén honako hau:

Honen inguruan, soilik esan nahi genuke ze guk hitz hori erabil genuén an gure artikulua barné liburua ganik Mikel Mendizabal titulatuá "Hizkuntzen berdintasun komunikatiboa: mitoa ala errealitatea?" (2014:107-140), argitaratua an Utriusque Vasconiae:

Eta erabili genuén hitz hori emánez bere inglesezko definizioa (aipatuz Hurford, 2007, nahiz hitza datorkigún ti 1949, han irakurtzen dugunez). Bihar aipatuko dugú pasartea. [#2764] [>>>]

astelehena, ekaina 23, 2025

Behin azterketa sinkronikoa burututa, konkluitzen dugu ze gaur egun, VO kopurua > OV kopurua, eta ez kontrakoa (nola Laka-k dioen)

Esaten genuén an #2743:

Laka-k [2025] dio:

Munduko hizkuntzak ikusten badituzue, gitxi gorabehera erdiak euskararen hautua egiten du, izan ere erdia baino pixka bat gehiago dira, eta beste erdiak gaztelaniaren hautua egiten du, orduan munduko hizkuntzak gitxi gorabehera erdi t'erdi zatituta daude mon-ja eta ja-mon artean. Hau esaten dizuet ze askotan euskaldunok pentsatzen dugu: oso hizkuntza gutxi dira gurea bezalako bat hitz-ordenean,... asko, erdia baino gehiago, izan ere. [Itziar Laka, "Buruan daramazun ezkutuko hizkuntza", 2025]

Hurrengo sarreretan saiatuko gara aztertzen datu horiek. Zehazkiago, saiatuko gara aztertzen munduko banaketa on hitz-ordenak sinkronikoki eta diakronikoki.

Eta behin azterketa sinkronikoa burututa, konkluitzen dugu ze (ikus #2762) :

..., Tomlin-en lagina da datu-multzo sinpleena zein hartu ahal dén kin helburu representatiboa respektu gaur egungo hitz-ordenen banaketa:

  • OV → 185/402 = %46
  • VO → 217/402 = %54
non, gaur egun, VO kopurua > OV kopurua.

eta, ez hainbeste, kontrakoa, nola Laka-k (2025) dioen. [#2763] [>>>]

igandea, ekaina 22, 2025

Tomlin-en lagina (1986) da datu-multzo sinpleena zein hartu ahal dén kin helburu representatiboa respektu gaur egungo hitz-ordenen banaketa

Esaten genuen herenegun ze:

..., [WALS] atlas horren helburua ez da izan sortzea lagin representatibo bat on munduko hizkuntzak, baizik sortzea datu-base erraldoi bat kin hizkuntza nahiko-intensiboki aztertuak. Hori, dudagabe, oso helburu interesagarria da, baina datu horiek ezin dira zuzenean erabili kizun atera konklusio orokor representatiboak burúz portzentaje zehatzak, nahiz haren emaitzak ez diren ibiliko oso urruti.

Hortaz, horiek datuak ganik Dryer-Haspelmath (2013) dirá oso datu aberatsak noiz nahi dugún aztertu hizkuntza baten ezaugarri orokorrak, edo konparatu bi hizkuntza edo gehiago, baina ez dira hain baliagarriak noiz nahi dugún lortu ikuspegi orokor eta orekatu bat gain ezaugarri baten munduko banaketa, gorago ere esan dugunez. Hori esanda, hauexek dirá WALS-en maiztasunak:

Hots, erabiliz 1376 hizkuntza, zeintatik 1187-k báduten ordena nagusirik:

  • OV579/1187 = %48,78
  • VO607/1187 = %51,39

eta orain ikus daigun zér ateratzen dén erábiliaz 1518 hizkuntza, zeintatik 1417-k bádute ordena nagusirik:

non agertzen dén diferentzia portzentual oso-oso txikia aldezki OV:

  • OV → 712/1417 = %50,25
  • VO → 705/1417 = %49,75

Kontua da ze, esaten genuenez, hor soilik konsideratzen ari dirá 1417 hizkuntza, zein diren nagusiki hizkuntza horiek non existitzen dén gramatika landu bat (helburua nagusiki deskriptiboa da), hola sórtuz era ezberdinetako sesgoak. Guztiarekin, eta espero geinkenez, emaitza horiek ez daude hain urruti ti Hammarström-en emaitza exhaustiboak, zeinekin validatzen dirén Tomlin-en emaitzak (azken horiek landu ziren kin intentzio representatiboa).

Hortaz, Tomlin-en lagina da datu-multzo sinpleena zein hartu ahal dén kin helburu representatiboa respektu gaur egungo hitz-ordenen banaketa (ikus [2748]):

  • OV → 185/402 = %46
  • VO → 217/402 = %54

non, gaur egun, VO > OV. [2762] [>>>]

larunbata, ekaina 21, 2025

Hammarström (2015) buruzki WALS (2013): "It is not clear how the data points/languages were selected, but it may be guessed that it is some kind of convenience sample"

Atzokoan amaitzen genuen gure sarrera esánez:

Bestalde, irakurtzen dugunez, atlas horren helburua [WALS, 2013] ez da izan sortzea lagin representatibo bat on munduko hizkuntzak, baizik sortzea datu-base erraldoi bat kin hizkuntza nahiko-intensiboki aztertuak. Hori, dudagabe, oso helburu interesagarria da, baina datu horiek ezin dira zuzenean erabili kizun atera konklusio orokor representatiboak burúz portzentaje zehatzak, nahiz haren emaitzak ez diren ibiliko oso urruti.

eta lehenxeago zehazten genuen ze:

Kontua da ze datu-base horretan konsideratzen dirá ezaugarri linguistiko anitz, eta horrek eskatzen ditú gramatika luze eta zehatzak, hau da referentzia ondo landuak, zeinen existentzia ez den zergatik izan behar orekatua artén munduko area eta familia linguistiko guztiak, halan-ze eskakizun horrek tipikoki ekarriko ditú honako sesgo primarioak (ikus [2758]):

  • library bias (sources available)
  • research bias (which languages have actually been researched)
  • language of publication bias
zeren iturri bibliografiko guztiak ez dira berdin eskuragarriak; munduko hizkuntza guztiak ez dira aztertu berdin intensiboki, eta egindako azterketa batzuk egon ahal dira publikatuak an hizkuntzak zein ez diren hain irisgarriak, halan-ze, ondorioz eta finean, horrek guztiak sortuko ditú sesgo geografikoak eta genetikoak.

Horren inguruan, Hammarström-ek (2015) egiten dú ondoko valorazioa eta konparazioa artén bere datu-multzo praktikoki exhaustiboa (5230 hizkuntza) eta WALS-en datu-basea (1302 hizkuntza), non...

... It is not clear how the data points/languages were selected, but it may be guessed that it is some kind of convenience sample [Hammarström, "The Basic Word Order Tipology: An Exhaustive Study", slides, 2015]

Komenientzia-lagin horren iturriak liraké biblioteka-sesgoa (library bias), ikerketa-sesgoa (research bias) eta sesgoa on publikazio-hizkuntza (language of publication bias), nondik segituko lirakén sesgo geografikoa eta genetikoa. [2761] [>>>]

ostirala, ekaina 20, 2025

WALS Online, 2013 (Haspelmath eta Dryer): bere helburua ez da izan sortzea lagin representatibo bat on munduko hizkuntza guztiak, baizik sortzea datu-base erraldoi bat kin hizkuntza nahiko-intensiboki aztertuak

Atzoko bukaeran, planteatzen genituén hiru azterketa eta galdera bat:

..., badirudi ze Tomlin-ek konsideratu nahiko zituzkén hizkuntz familia hilak ere. Gure ikuspuntutik, ordea, askoz produktiboagoa da burutzea ondoko hiru azterketa hauek, nondik atera ahal dirén askoz konklusio esanguratsuagoak:

1.: Aztertzea nóla banatzen dirén hitz-ordenak an gaur egungo hizkuntza bizi guztiak.

2.: Aztertzea nóla banatzen zirén (banatu zitezkén) hitz-ordenak an hizkuntza-familia guztien versio zaharrenak (kasu honetan, familia biziak eta hilak ere bai). 

3.: Aztertzea nóla banatzen dirén (banatu zitezkén) hitz-ordenen aldaketa naturalak hala nola ere horiek induzituak ganik kontaktu linguistikoa (zéin baldintzatan gertatu diren, noiz gertatu diren, eta zéin norabidetan gertatu diren).

Hiru azterketa ezberdin, nahiz estuki lotuak (labur esanda, aztertuz oraingoa, lehengoa eta bitartekoa), eta kontua da ze Tomlin-ek (1986) burutu dú lehen azterketa (ikus ere [2749]). Gaur egun, bá al dugu informazio gehigarririk burúz goragoko beste bi azterketak?

Saiatuko gara erantzuten ki aurreko galdera hori, baina lehenago, gogora daigun ze existitzen da beste datu-multzo inportante eta zabal bat zein aurkeztu zen tartén Tomlin (1986) eta Hammarström (2016): hain zuzen WALS (World Atlas of Language Structures, 2013), zein aurkitu ahal dén online (WALS Online, Haspelmath eta Dryer, 2013), eta zeinen ongietorrian irakurri ahal dugún ondokoa:

Welcome to WALS Online The World Atlas of Language Structures (WALS) is a large database of structural (phonological, grammatical, lexical) properties of languages gathered from descriptive materials (such as reference grammars) by a team of 55 authors. [WALS Online, 2025]

Ikusten dugunez, datu-multzo handia da (a large database: ingúrun 1500 hizkuntza), baina, dakigunez, horrek ez du ziurtatzen bere representatibitate orokorra (ikus [2753]). Kontua da ze datu-base horretan konsideratzen dirá ezaugarri linguistiko anitz, eta horrek eskatzen ditú gramatika luze eta zehatzak, hau da referentzia ondo landuak, zeinen existentzia ez den zergatik izan behar orekatua artén munduko area eta familia linguistiko guztiak, halan-ze eskakizun horrek tipikoki ekarriko ditú honako sesgo primarioak (ikus [2758]):

  • library bias (sources available)
  • research bias (which languages have actually been researched)
  • language of publication bias

zeren iturri bibliografiko guztiak ez dira berdin eskuragarriak; munduko hizkuntza guztiak ez dira aztertu berdin intensiboki, eta egindako azterketa batzuk egon ahal dira publikatuak an hizkuntzak zein ez diren hain irisgarriak, halan-ze, ondorioz eta finean, horrek guztiak sortuko ditú sesgo geográfico eta genetikoak.

Bestalde, irakurtzen dugunez, atlas horren helburua ez da izan sortzea lagin representatibo bat on munduko hizkuntzak, baizik sortzea datu-base erraldoi bat kin hizkuntza nahiko-intensiboki aztertuak. Hori, dudagabe, oso helburu interesagarria da, baina datu horiek ezin dira zuzenean erabili kizun atera konklusio orokor representatiboak burúz portzentaje zehatzak, nahiz haren emaitzak ez diren ibiliko oso urruti. [2760] [>>>]

osteguna, ekaina 19, 2025

Hiru azterketa ezberdin, nahiz estuki lotuak (labur esanda, aztertuz oraingoa, lehengoa eta bitartekoa)

Amaitzen genuen atzo esánez ze:

Dirudienez, Tomlin-ek nahiago zukén estimatzea hitz-ordenen banaketa gain denbora guztietako hizkuntzak (eta ez soilik gaur egungo banaketa on munduko hitz-ordenak), baina kontuan hartuz ze horretarako beharko zén ikerketa askoz gehiago (much more research)... aproximatu zuén gaur egungo banaketa on munduko hitz-ordenak erábiliz soilik hizkuntza biziak (zein bai den gure helburua). Horrek, bere hitzetan, sortu ahalko luké sesgo historikoa, nahiz izanen litzakén a remotely plausible candidate for having any significant effect on the sample. [Tomlin, 1986:23]
Tomlin-ek adibidetzen dú sesgo historiko hori bidéz bi kasu hauek:

Thus, for example, there may have been at some point in the past many more VSO languages than are included in the sample results because peoples who spoke VSO languages may have been more numerous . Or, perhaps at some earlier stage in history there were more SOV languages than there are currently, since only at this point in time has sufficient time passed to permit much SOV to SVO change . This source of bias can be dealt with only after much more research has been done on historical change.

Atzo esaten genuenez, badirudi ze Tomlin-ek konsideratu nahiko zituzkén hizkuntz familia hilak ere. Gure ikuspuntutik, ordea, askoz produktiboagoa da burutzea ondoko hiru azterketa hauek, nondik atera ahal dirén askoz konklusio esanguratsuagoak:

1.: Aztertzea nóla banatzen dirén hitz-ordenak an gaur egungo hizkuntza bizi guztiak.

2.: Aztertzea nóla banatzen zirén (banatu zitezkén) hitz-ordenak an hizkuntza-familia guztien versio zaharrenak (kasu honetan, familia biziak eta hilak ere bai). 

3.: Aztertzea nóla banatzen dirén (banatu zitezkén) hitz-ordenen aldaketa naturalak hala nola ere horiek induzituak ganik kontaktu linguistikoa (zéin baldintzatan gertatu diren, noiz gertatu diren, eta zéin norabidetan gertatu diren).

Hiru azterketa ezberdin, nahiz estuki lotuak (labur esanda, aztertuz oraingoa, lehengoa eta bitartekoa), eta kontua da ze Tomlin-ek (1986) burutu dú lehen azterketa (ikus ere [2749]). Gaur egun, bá al dugu informazio gehigarririk burúz goragoko beste bi azterketak? [2759] [>>>]

asteazkena, ekaina 18, 2025

Tomlin (1986): "Historical bias would occur if one failed to count languages or language families which are extinct.".

Respektu atzoko emaitzak (Tomlin, 1979-1986), oso interesgarria iruditzen zaigu nabarmentzea ze autorea, noiz ari den azáltzen bere laginaren muga interpretatiboak (1986:22-23), dú zehazten ze nahizta bere lanean kontrolatu dituén bi sesgo-iturri nagusienak (zein dirén sesgo geografikoa eta sesgo genetikoa), existitu litezke beste sesgo posible hauek:

  • library bias
  • research bias
  • language of publication bias
  • historical bias

Tomlin-ek dioenez, sesgo horien artean akaso aipagarriena izan ahal dá sesgo historikoa, zeintaz, interesgarriki, dioén honako hau:

Of these only historical bias seems even a remotely plausible candidate for having any significant effect on the sample. Historical bias would occur if one failed to count languages or language families which are extinct. [Tomlin, 1986:23]

Dirudienez, Tomlin-ek nahiago zukén estimatzea hitz-ordenen banaketa gain denbora guztietako hizkuntzak (eta ez soilik gaur egungo banaketa on munduko hitz-ordenak), baina kontuan hartuz ze horretarako beharko zén ikerketa askoz gehiago (much more research)... aproximatu zuén gaur egungo banaketa on munduko hitz-ordenak erábiliz soilik hizkuntza biziak (zein bai den gure helburua). Horrek, bere hitzetan, sortu ahalko luké sesgo historikoa, nahiz izanen litzakén a remotely plausible candidate for having any significant effect on the sample. [2758] [>>>]

asteartea, ekaina 17, 2025

Tomlin (1986) versus Tomlin (1979): praktikoki berdinak

Atzo ikusten genuén Tomlin-ek lortutako emaitzak an 1979:

Lan hori oinarri, autoreak egin zituén zenbait zuzenketa eta handitu zuén laginaren tamaina (%45 hizkuntza gehiago)

While the final sample used to produce these figures still appears to be a good one, there are still two major weaknesses in that attempt. First, though that sample overall remains a valid one, several errors were made in the use and interpretation of the chi-square statistic. Second, there are a large number of clerical errors apparent in the database. The present study corrects those errors and increases substantially the size of the database (45%) from which the final sample is drawn. [Tomlin, 1986:21]

hola derivatuz honako azken emaitza ("Basic Word Order. Functional Principles", 1986:22):

zein den praktikoki ber banaketa zein goragoko 1979koa (kin %45 hizkuntza gehiago). [2757] [>>>]

astelehena, ekaina 16, 2025

Tomlin-ek berak burutu zuén lehen azterketa bat an 1979, zein "overall remain a valid one" (Tomlin, 1986)

Tituluan bertan diogunez, Tomlin-ek berak burutu zuén lehen azterketa bat an 1979, berdin ere bilátuz munduko banaketa on hitz-ordenak, zein, bere esanetan:

..., that sample overall remain a valid one,... [Tomlin, 1986:20]

Ikus pasarte osoago bat:

While the final sample used to produce these figures still appears to be a good one, there are still two major weaknesses in that attempt. First, though that sample overall remains a valid one, several errors were made in the use and interpretation of the chi-square statistic. Second, there are a large number of clerical errors apparent in the database. The present study corrects those errors and increases substantially the size of the database (45%) from which the final sample is drawn. [Tomlin, 1986:21]

Gorago irakurtzen dugunez, Tomlin-en azterketa finalak (1986) zuzenduko ditú lan previo horren akatsak, emanez are emaitza fidagarriagoak (ikus [2749]). [2756] [>>>]

igandea, ekaina 15, 2025

Tomlin (1986) buruzki Millinson eta Balke (1981): "... a 100 language convenience sample..."

Tomlin (1986) dú jarraitzen bere revisioa aipátuz lana on Millinson eta Balke (1981), nortzuk aurkeztu zutén 100 hizkuntzako lagin bat, zeintan berriro naguzitzen dirén komenientzia irizpideak gain irizpideak on representazio orokorra, edo bestela esanda:

... a 100 language convenience sample..." [Tomlin, 1986:20]

Tomlin-ek adibidetzen ditú gabeziak zein aurkitzen dituén an lagina ganik Millinson eta Balke (1981):

The sample is biased genetically. For instance, Indo-European represents 10% of the Mallinson and Blake sample, but only 3% of the estimated total population. Nilo-Saharan represents 9% of the Mallinson and Blake sample, but only 2.5% of the world total. Large groups like Niger-Kordofanian or Austronesian are systematically undersampled, Niger-Kordofanian representing 9% rather than 20% of the estimated total, Austronesian 8% rather than 16%. In fact, only a few groups, Sino-Tibetan for example, approximate their estimated proportions in the languages of the world . The sample shows similar biases with respect to areal distributions. [Tomlin, 1986:20]

Esan nahi baita ze ezin atera daitezke konklusio ondo fundamentatuak respektu banaketa orokorra on munduko hitz-ordenak. [2755] [>>>]

larunbata, ekaina 14, 2025

Tomlin (1986) buruzki Perkin (1980): "... while Perkin's sample, like Greenberg's, is useful for exploring correlations among variables of interest, it is not useful for estimating the frequency of basic constituent orders..."

Atzokoan amaitzen genuen azpimarrátuz ondoko reflexioa ganik Tomlin (1986):

... that size alone cannot guarantee sample representativeness . [Tomlin, 1986:19-20]
Gaurkoan, ordea, itzuliko gara ki beste lagin txiki bat (50 hizkuntza) zein,  Tomlin-ek dioenez, izan litekén representatiboa on diversitate linguistikoa (hartzen baititú hizkuntza diferenteak tikan munduko lokalizazio diferenteak), baina ez da representagarria respektu proportzioak on hizkuntzak an lokalizazio diferenteak. Horrela, hartzen ditú proportzionalki oso hizkuntza gutxi artén Niger-Congo hizkuntzak, bitárten hartzen dituén erlatiboki gehiegi an Iparramerika. Ikus an hitzak ganik Tomlin (1986):

Although Perkin's sample may be representative of the diversity of languages ​​(and cultures), it is not representative of the universe of natural languages . For instance, Perkin's sample includes a single language for all of Niger-Congo , 2% of his final sample , even though there are more than 1000 Niger-Congo languages , or approximately 20% of the Voegelin and Voegelin total. Similarly, the sample contains 17 languages ​​from the North American continent (including Central America), 34% of the final sample , yet languages ​​from that area represent at most some 8% of the estimated world total . Thus, while Perkin's sample, like Greenberg's , is useful for exploring correlations among variables of interest , it is not useful for estimating the frequency of basic constituent orders in the universe of natural languages. [Tomlin, 1986:20]

Hortaz, datuak izan ahal dira produktiboak noiz egin zenbait analisi, baina ez noiz helburua dén lortzea irudi razonable bat on munduko hitz-ordenen banaketa reala. [2754]

ostirala, ekaina 13, 2025

Tomlin (1986) buruzki Ruhlen (1975): "..., the information is presented simply as descriptive data. Perhaps it can serve as an example that size alone cannot guarantee sample representativeness."

Tomlin-ek (1986) jarraitzen dú aipatuz beste datu-base bat, kasu honetan egina ganik Ruhlen (1975), zeinen helburua zén basikoki deskriptiboa respektu 427 hizkuntzaren hitz-ordena, zein izanik kopuru handia, ez da zertan izan representagarria respektu munduko hizkuntza guztiak. Honela dio Tomlin-ek berak:

If Ruhlen's data were in some sense taken to be as a representative sample of the world's languages, it, too, would suffer from genetic and areal distortions. However, the information is presented simply as descriptive data. Perhaps it can serve as an example that size alone cannot guarantee sample representativeness. [Tomlin, 1986:20]

Hor, hizkuntza-kopurua (1975: 427 hizkuntza) dá are handiagoa zein geroko Tomlin-ena bera (1986: 402 hizkuntza), nahiz eta...

... that size alone cannot guarantee sample representativeness. [Tomlin, 1986:19-20]

Ruhlen-ek egin nahi zuén deskripzio estatistikoa on hizkuntza-multzo erlatiboki handi bat, ordurako handiena (the information is presented simply as descriptive data.), baina ez zuen pretenditu mundu osoko representatibitatea. [2753] [>>>]

osteguna, ekaina 12, 2025

Tomlin (1986): "Ultan's figures are derived from a 75 language convenience sample."

Atzokoan irakurri genituén Tomlin-en komentarioak burúz Greenberg-en datu-multzoa on 1963. Horren ostean, Tomlin-ek berak komentatzen dú beste datu-multzo bat, zein zor zaion ki Russel Ultan (1969, "Some General Characteristics of Interrogative Systems "), zeinen azken helburua ez zen aztertzea munduko hizkuntzen hitz-ordenak, baizik-eta, tituluak doenez, zenbait ezaugarri orokór on sistema interrogatiboak. 

Tomlin referitzen da ki datu-multzo hori nola convenience sample, hau da lagin edo datu-multzo bat zeinen bilketan era ezberdinetako komeninetzia-irizpideak nagusitu diren gain irizpide representatibo orokorrak (askotan datu-bilketa izaten da arazo problematikoena an lan estatistiko bat):

Ultan's figures are derived from a 75 language convenience sample. But this sample, like the Greenberg sample, is not representative of the world's languages either genetically or areally . [Tomlin, 1986:19]

Ez da esan beharrik ze halako datu-multzoek (convenience sample) eurekin ekartzen dituzté era guztietako sesgoak (geografikoak, genetikoak,...), eta ondorioz, euren emaitzak ez direla izanen bereziki sinesgarriak noiz saiatu lortzen munduko banaketá on hitz-ordenak. [2752] [>>>]

asteazkena, ekaina 11, 2025

Tomlin (1986): "..., the purpose of the sample [referitzen da ki Greenberg, 1963] was to investigate correlations between basic constituent order and the order of other elements."

Aurreko sarreretan esan dugunez, Tomlin-en (1986) helburua zén eraikitzea lagin razonableki representagarri bat gain munduko hitz-ordenak (a reasonable representative sample of the world's languages), eta Hammarström (2016)-en datu exahustiboek (gain 5252 hizkuntza) validatu dute Tomlin-en lan estatistikoa. Baina, bá al da beste datu-multzorik? Zéin helburu duté datu-multzo horiek? 

Eta erantzuna baiezkoa, izan ere helburu ezberdinekin sortu dira (beste) datu-base oso interesgarriak. Adibidez, bereziki aipagarria iruditzen zaigú Greenberg-en (1963) datu-basea, zeinekin fundatu zirén lan tipologiko hauek, nahiz-eta Greenberg-en helburua ez zén Tomlin-ena, baizik-eta:

..., the purpose of the sample was to investigate correlations between basic constituent order and the order of other elements. [Tomlin, 1986:19]
Ikusten denez, Tomlin-ek berak (1986) komentatu zuén Greenberg-en datu-basea:

Beraz, sesgo genetikoa:

... the sample is not representative of the genetic distribution...

 eta sesgo geografikoa:

... the sample is not representative of the areal distribution...

nahiz eta, berriro ere, azpimarratu behar den ze Greenberg-en helburua ez zen...

... to determine the frequency of basic constituent order types.

Eta justu horixe da gure helburua. Bihar-etzi aipatuko ditugu beste datu-base interesgarri batzuk eta saiatuko gara ulertzen euren helburuak. [2751] [>>>]