ostirala, urtarrila 31, 2025

Gaurkoan soilik eskértu komentarioa on Javier

Konprobatzearren ze gaurkoan, 2620 honetan, betetzen dira 20 urte tik gure lehenengo posta an blog hau, zuzendu naiz ki hastapeneko sarrera hura (alegia, [1]) eta hantxe gogoratu naiz kin ondoko komentarioa ganik Javier zeini erantzun behar nion (2024ko urtarrilekoa da), eta iruditu zait ze gaur da egun polita eginkizun horri heltzeko. Horrá komentarioa:

Nire proposamena (ezjakin batena):
III. HEZKUNTZA-MINTEGIA ETORKINEKIN
"Euskara orain" liburua irakurtzen ari naiz. Hizkuntzak, gero ta errezenak, hainbat hobe; baina zure euskara berri/zahar hori aldrebesa iruditzen zait. Ki, ti, i, e... Nik uste soberan dakizula ezinezkoa dela jendeak horrela hitz egin dezala; eta, baita, inork, zu zeu salbu, idatz dezala (Krutwig datorkit burura). Zure jakinduriak (guztiz txundigarria) fruitu hoberik eman dezake, nire uste apalean.
Miresmenetik diotsut eta barkatu atrebentzia.

an [1] sarrera:

Zinez eskertzen diot ki Javier bere komentarioa, zeren behar dirá komentarioak, zeren behar dirá komentarioak zeinekin ikus, iker eta ikas daigun nóndik egin ahal dugún hobeto. Ondorengo egunetan komentatuko ditugu Javier-en hitzak eta proposamena. Gaurkoan soilik eskértu bere komentarioa. [2620]

osteguna, urtarrila 30, 2025

Eta zértan datza gure aurrikuspena ezen italierak ematen ditú silaba gehiago zein gaztelaniak: sapore di mare, sapore si sale

Atzokoan esaten genuen ze:

Alde horretatik, ez da gutxio deigarria ikustea nóla Oh-ren datuetan italiera-k duén ID bat (ID dá Informazio-Densitatea, agertzen baita inversoki lotua kin silaba-kopurua) zein dén ondo altuagoa (0,72) zeinda gaztelaniarena (0,63), noiz printzipioz espero genuke italierak izatea silaba gehiago zein gaztelaniak.

Eta gauza da: zértan oinarritzen da gure aurrikuspena ezen italierak ditú silaba gehiago zein gaztelaniak? Ba, nola dioén Silvio Maggi-k an "El italiano contemporáneo por hispanohablantes: astectos fonológicos" (2007):

... por la tendencia del italiano a terminar las palabres en vocal. [Maggi, 2007:74]
Horrela, hainbat hitzetan (eta aditzetan) agertzen dá silaba bat gehiago:

  • sapore di mare, sapore di sale
  • sabor de mar, sabor de sal

edo, beste kanta bat:

  • cantare, sognare
  • cantar, soñar

Hortik aparte, silaba-kopuruetan oso antzekoak izanen liraké italiera eta gaztelania (an gure aurrikuspena), halan-ze espero behar genuke silaba-kopuru handixeagoak an italiera

Ez dugu, beraz, ikusten nóndik atera ahal den goragoko diferentzia handi hori an ID-a (ITA 0,72 vs SPA 0,63 non ID handiagoa, silaba-kopuru erlatiboki txikiagoa), areago noiz lagin-textuan (zein ez den konparagarria baina, hala ere) argiki ateratzen dén kontrako norabidea an silaba-kopuruak. Bihar saiatuko gara komentatzen lana on Pellegrino eta al. (2011) respektu puntu hau, eta aurrerago gauza bera eginen dugu kin lana on Pellegrino eta al (2019). [2619] [>>>]

asteazkena, urtarrila 29, 2025

Lagin-textuan: ITA 105 silaba vs SPA 85 silaba, bitárten, deigarriki, informazio-densitatea (ID) dén ITA 0,72 vs SPA 0.63. Horrek, berriro ere, sortzen dizkigu duda handiak

Ikusi dugú an aurreko sarrerak (ikus atzokoa) nóla, Oh-ren tesiko lanean (2015), ezin konsidera daitezkén konparagarriak  gaztelaniazko lagin-textua eta euskarazkoa, halan-ze noiz erábili gaztelaniazko itzulpen konparagarri bat, silaba-kopuruak izanen zirén oso ezberdinak.

Alde horretatik, ez da gutxio deigarria ikustea nóla Oh-ren datuetan italiera-k duén ID bat (ID dá Informazio-Densitatea, agertzen baita inversoki lotua kin silaba-kopurua) zein dén ondo altuagoa (0,72) zeinda gaztelaniarena (0,63), noiz printzipioz espero genuke italierak izatea silaba gehiago zein gaztelaniak. Hortaz, azter daigun italieraren lagin-itzulpena:

eta konpara daigun kin bere gaztelaniazko kidea (Oh-k erabilitakoa an bere datuak): 

Atzo genioenez, azken horrek, gaztelaniazkoak, ditú 85 silaba, bitárten italierakoak ditú 105 (edo), zein dén, espero bezala, handiagoa (hemen ere itzulpena ez da konparagarria, baina azter daigun Oh-ren emaitzak):

  • Silaba-kopurua an lagin-textua: ITA 105 vs SPA 85

Beraz, suposatuz ze, beste 14 textuetan, mantentzen dirá gutxi gorabehera antzeko neurriak (lagina izan beharko litzaké representagarria), espero genuke ID handiagoa an gaztelania (informazio bera an silaba gutxiago) zeinda an italiera (informazio bera an silaba gehiago). Baina, harrigarriro, Oh-ren emaitza argiki kontrakoa da:

  • ID (Informazio-Densitatea): ITA 0,72 vs 0.63 SPA
Esan nahi baita ze, aráuz emaitza horiek, italierak izanen luké informazio-densitate argiki handiagoa kin silaba-kopuru argiki handiagoa ere (aráuz lagina). Horrek, berriro ere (ikus [2616]), sortzen dizkigu duda handiak. Bihar jarraitukó. [2618] [>>>]

asteartea, urtarrila 28, 2025

Beraz, egonen lirake bi faktore nagusi arrén justifikatu diferentzia hori artén Oh (2015) eta Amuriza (2012): 1.: Oh-ren itzulpen ez-konparagarriak, eta 2.: textu-mota

Amaitzen genuen atzo esánez:

Guztira, konparatuz bi versio ondo parekagarri horiek, ateratzen zaizkigú:

  • euskara 82 silaba vs gaztelania 72 silaba

Eta hori an textu bat oso sinplea gabén adizki pluralik, gabén adizki datiborik, gabén kondizionalik, gabén konposiziorik, nondik etorriko zirén diferentzia nagusiak aráuz Amuriza-ren analisia. 

Bestalde, konsideratuz Oh-k erabilitako gaztelaniazko itzulpena, izanen genituzke 85 silaba, hau dá silaba gehiago zein euskarazkoan (82 silaba), nondik derivatzen dirén gero euren ID ratioak. Hortaz, hortxe dugú goragoko diferentzien gakoa: gaztelaniazko itzulpena ez da konparagarria kin euskarazkoa, halan-ze emaitza horiek ez dira baliagarriak.

Beraz, baldin erabiltzen badugu atzoko itzulpen konparagarria artén gaztelania eta euskara, gaztelaniak izanen lituzké 72 silaba ordéz Oh-ren 85 silaba, zein den %15 silaba gutxiago. Eta euskarazko versioak 82 silaba dituelarik, gaztelaniarenak izanen lituzké %12 gutxiago. Eta hor egonen litzaké lehenengo arrazoi nagusia zergátik Oh-ren silaba-erlazioa eta Amuriza-rena ez diren batere antzekoak: itzulpen ez-konparagarriak.

Eta bigarren arrazoi nagusi bat izan liteké, gure ikupegitik, textu mota. Amuriza-k hartu zituén bere datuak tik elkarrizketa bat, non agertuko zirén adizki pluralak, datiboak, potentzialak... eta Oh-k erabilitako textua dá narrazio oso sinple bat non ez den agertzen ia batere aditz-zailtasunik. [2617] [>>>]

astelehena, urtarrila 27, 2025

Oh-ren laginezko textuan (2015), gaztelaniazko eta euskarazko itzulpenak ez dira inondik inora konparagarriak, halan-ze, textu konparagarriak alderatuz, euren silaba-kopuruen erlazioa argiki alderantziz ateratzen da: euskara 82 vs gaztelania 72 (eta ez 85) an textu oso sinple bat

Gehiago komentatu nahi dugu Bittor-ek ekarritako referentzia (kus [2614]), baina orain jarraitu behar dugu kin gure aurreko haria (ikus [2613]), zeintan nahi genuen aztertu nóndik etor zitekén hori diferentzia artén gaztelaniaren eta euskararen silaba-kopuruak an Yoon Mi Oh-ren datuak (2015) respektu Amuriza-ren datuak (2012), zeren Oh-ren datuetan euskarak erabiliko lituzké silaba gutxiago zein gaztelaniak, bitárten Amuriza-k aurkitzen duén oso erlazio ezberdina artén silaba-kopuru horiek: euskara 100 vs gaztelania 75. Horretarako, ikus daigún Oh-k ematen duen textu-lagina (ikus [2613]), zein izan beharko litzakén representagarria respektu beste 14 textuak:

eta hauxe gaztelaniazkoa: 

Orohar dá oso textu erraza, kin esaldi sinpleak non ez dagoen adizki pluralik, non ez dagoen adizki datiborik, non ez dagoen potentzialik edo subjuntiborik,... Ikus daigun euskarazko lehenengo esaldia:

  • Bada bidezidor bat muino hartatik etxeraino. (17 silaba)

non aurkitzen dugún aditz trinko bat ("da") kokatua an hasiera ("Bada..."), bitárten gaztelaniazkoan itzultzaileak jarri duén: "... se puede ir..." (zein dén beste zerbait), zeinen aurretik itzuli den norántza se puede ir ("A mi casa se puede ir..."), halan-ze soilik esaldi horri begiratuta, batek esanen luke ze euskara da oso aditz-lehena eta gaztelania buruazkenagoa. Esan nahi baita ze, gure helburuetarako, gaztelaniazko esaldi hori ez da konparagarria kin euskarazkoa; bai ordea ondoko hau:

  • Hay un atajo a mi casa por esa colina. (15 silaba)

Horrá bigarren esaldia:

  • Herriko batzuek diote muinoa sorginduta dagoela. (20 silaba

Honetan ere aditz nagusia trinkoa da ("diote", kokatua an SVO ordena) nola ere dén trinkoa aditz subordinatua ("dago"). Gaztelaniazko versio konparagarria litzaké:

  • Algunos del pueblo dicen que la colina está embrujada. (19 silaba

Hirugarrena, negatiboa, non laguntzailea kokatzen dén atzén sujetua:

  • Inork ez du hortik igaro nahi gauez. (12 silaba)

zeinen versio konparagarria litzakén hauxe:

  • Nadie quiere pasar por ahí de noche. (12 silaba)

Laugarrena:

  • Jakina nik ez dut horrelako zentzugabekeriarik sinesten. (21 silaba)

zeinen versio konparagarria litzakén hauxe:

  • Por supuesto yo no creo en esos sinsentidos.  (15 silaba)

Bosgarrena:

  • Gogoko dut hango bide bitxi hura. (12 silaba)

zeinen versio konparagarria litzakén hauxe:

  • Me gusta ese curioso camino. (11 silaba)

Guztira, konparatuz bi versio ondo parekagarri horiek, ateratzen zaizkigú:

  • euskara 82 silaba vs gaztelania 72 silaba

Eta hori an textu bat oso sinplea gabén adizki pluralik, gabén adizki datiborik, gabén kondizionalik, gabén konposiziorik, zeintatik etorriko zirén diferentzia nagusiak aráuz Amuriza-ren analisia. 

Bestalde, konsideratuz Oh-k erabilitako gaztelaniazko itzulpena, izanen genituzke 85 silaba, hau dá silaba gehiago zein euskarazkoan (82 silaba), nondik derivatzen dirén gero euren ID ratioak, eta baita an euren IR-ak ere. Hortaz, hortxe dugú goragoko diferentzien gakoa: gaztelaniazko itzulpena ez da konparagarria kin euskarazkoa, halan-ze emaitza horiek ez dira baliagarriak. [2616] [>>>]

igandea, urtarrila 26, 2025

Lortu dute estandar bat sintaktikoki oso buruazkena, lexikoki oso nahasia, eta fonetikoki oso rigidoa, zein ez den egokia basikoki ezein esparrutan ere

Herengungo komentario batek zioén:

Kontuz, perifrastikoak motzak izan ahal dira, esaterako, negar egiten duzu vs. near itentzu; negar egiten zenuen vs. near iten zenun; negar egingo zenuke vs. near ingo zenun".
Edo zuzenean jarri Orainaldian aditzak, nola batzutan egiten duten an hainbat dialekto.
Alegia, bezala gehienetan, hizkuntza idatzia geyo astun, geyo korapilotsu, geyo mantso. Eta alderantziz, eguneroko hizkuntza -batez ere, baldin bada libre, gabe prejuizio-, geyo efiziente, geyo indartsu, geyo eder. Harrigarria nola goraipatu den eredu bat eta nola mezprezatu bestea.
"Nee ustez in biharko zen aldau ordena on preferentzik. Jarioa on euskara ingo zen hobetu".

Gure ikuspegitik tresna linguistikoak (sintaktikoak, lexikoak, fonetikoak) osatzen duté continuum expresibo bat zeinen elementuak konbinatu ahal diren an mila manera, emanez era guztietako emaitzak: emaitza bereziki landuak, emaitza bereziki kolokialak, eta beste mila tarteko konbinazio zein hiztunak aukeratu ahal dituén aráuz bere interes komunikatiboa, hala mintzoz nola idatziz (zeren aukera landuagoa edo kolokialagoa egin ahal da mintzoz eta idatziz).

Horrela, hala esparru sintaktikoan nola esparru lexikoan, nola ere esparru fonetikoan aztertu eta landu behar dirá euskararen tradizio guztiak, idatziak zein mintzatuak, zaharragoak zein modernoagoak, baliabideak eta mekanismoak, arrén eskaini aukera sintaktiko, lexiko eta fonetiko potenteak gána euskararen erabiltzaileak (nork aukeratu ahalko duté zér nóiz erabili). 

Zoritxarrez, alde sintaktiko eta lexikoan mespretxatu dira hainbat estruktura potente eta hainbat hitz argi eta are labur, bitartean-eta, aldi berean, ez diren landu hainbat baliabide fonetiko koipeztatzaile, halan-ze lortu dute estandar bat sintaktikoki oso buruazkena, lexikoki oso nahasia, eta fonetikoki oso rigidoa, zein ez den egokia basikoki ezein esparrutan ere. Horretaz mintzo ginen an:

Hizkuntza baten erabilera normalizatua mugitzen da an continuum bat artén aukera landuagoak eta aukera kolokialagoak, non hiztunak hautatzen dituén momentu bakoitzean halako baliabide sintaktiko, lexiko eta fonetikoak zein iruditzen zaizkión egokien afinda lórtu bere helburu komunikatiboak. Continuum pragmatiko horretan, aukera sintaktiko, lexiko eta fonetiko zabal eta funtzional batek asebete beharko lituzké hiztunaren behar komunikatiboak, zein izanen dirén bereziki exigenteak an textuinguru linguistiko orokorrak non existitzen dirén alternatiba linguistiko (hizkuntza, sintaxi) ondo potenteak, flexibleak eta eraginkorrak, edozein esparrutan ere. 

Edozein kasutan, baina oso bereziki aipatutako egokiera horretan, bide bakarra izanen da aberástea, edo gutxienez saiatu abérasten jarduera komunikatiboa (landua eta kolokiala) kin aportazio esanguratsuki funtzional guztiak zein diren edo egon ahal diren eskura, gradualki baina irmoki. Baina, zer gertatu da? Ba, gertatu da ze...

  1. euskara batu estandarrean, euskaratik borratu dirá mendeak on flexibilizazio sintaktiko buru-lehena, literarioa eta mintzatua ere, zeintan sortu eta erabili ziren hainbat baliabide eta mekanismo sintaktiko zein jarraitu beharko lirakén lantzen, ohi moduan, barnén prozesu evolutiboa on euskararen sintaxia aldén estruktura irekiago, potenteago, flexibleago eta eraginkorrago bat (erlatiboki abantailatsuagoa an esparru komunikatibo guztiak), zein ez soilik ez dén potentziatu, baizik-ze, kontrara, oztopatu egin da, hainbateraino non gelditu baitá estandar sintaktiko bat erlatiboki pobrea, erlatiboki rigidoa, erlatiboki ahula, erlatiboki monotonoa, erlatiboki astuna eta erlatiboki gutxi eraginkorra.
  2. euskara batu estandarrean, euskaratik borratu dirá hainbat hitz eta hitz-forma, hala landuagoak nola kolokialagoak, zein ziren eta diren ondo baliagarriak, funtzionalak, argiak eta kasu askotan internazionalak ere, eta zein nahi izan diren ordezkatu kin aukerak zein, ez gutxitan, zirén luzeagoak, lausoagoak, anbiguagoak eta gutxio erabilgarriak, apárte gutxio eraginkorrak.
  3. euskara batu estandarrean ez dira landu kontrakzioak eta bestelako errazpideak (zein erabiliko dirén aráuz momentuko egoera pragmatikoa), zein diren beste aukera ondo erabilgarri bat afinda koipéztatu engranajeak on sistema estandarra: kontuan hartu ze, zénbat-eta motor sintaktiko gutxiago potentea izan (zénbat-eta sintaxi buru-azkenagoa izan), hainbatenago eskertzen dira kontrakzioak eta errazpideak arrén goxatu jarduera eta, zertxobait bada ere, gutxiagotu silaba kopuruak.
Horrekin guztiarekin, eta gure kontextu linguistikoan, ateratzen zaigu estandar bat eze ez ditu asebetetzen, ezta urrutitik ere, ez behar landuxeagoak, ezta behar kolokialxeagoak ere.
Bai, lortu dute estandar bat sintaktikoki oso buruazkena, lexikoki oso nahasia, eta fonetikoki oso rigidoa, zein ez den egokia basikoki ezein esparrutan ere. [2615] [>>>]

larunbata, urtarrila 25, 2025

Hori da gutxi gorabehera hain posible nola ibiltzea berdin efiziente eta efektiboki aurrerantza eta atzerantza, nahizta atzerantza erábili ispilu retrovisore bat

Eskerrik asko Bittor zatio zure atzoko komentarioa, zein dén honako hau: 

Egunon (nahiz oharra ez doan gaurko atalarekin, bai egun huetakoarekin)!

Eta nola iritziak eta ikerketak denerako egon ohi diren, hara hemen delako 'hizkuntza 'buru lehen' (≈ VO) eta ''hizkuntza buru azken' (≈ OV)-en arteko prozesamendu desberdintasunak / alde kaltegarriak berdintzen dituzten hainbat defentsa oraingotxeko (Federica Amici, Alejandro Sanchez-Amaro, and Trix Cacchione 2022, Branching and Working Memory - A Cross-Linguistic Approach, 14.3 Working Memory and Processing Demands: The Case of Branching, in Schwieter-Wen (eds.) The Cambridge Handbook of Working Memory and Language). Hala diote esateko: 

"In natural conversation, all native speakers process their language quickly and effectively, regardless of their branching direction (e.g., Hawkins, 2004; Stivers et al., 2009). Indeed, both R[ight] B[ranching] and L[eft] B[ranching] structures are frequent across languages, and both VO and OV are highly productive."

Eta ondoren saiatzen dira erantzuten atalean bere/gure kezkari: 

"How is it possible that LB speakers can effectively process a final-head language that should impose high risks of unassignments and misassignments during processing?".

Hemen atal osoa: (N.B. Ez dit uzten eransten luzeegia delako... Nahi izanez gero bidaliko nizueke beste moduren batean.)

Jakina nahi dudala! Atzo eskátu eta bádaukat: eskerrik asko berriro, Bittor.

Eta gauza da ze autoreek (ikus gorago) galdetzen dute:

How is it possible that L[eft] B[ranching] speakers can effectively process a final-head language that should impose high risks of unassignments and misassignments during processing?

Bai, hori da galdera, nóla da posible ordena buruazken estuak eta itxiak (vs ordena burulehen potentea eta irekia) ez izatea efekturik gain diskursoaren askatasuna, aberastasuna, koherentzia, expresibitatea, efizientzia eta, finean, efektibitatea? Nóla da posible?

Ba, esan behar dugu ze hori da gutxi gorabehera hain posible nola ibiltzea berdin efiziente eta efektiboki aurrerantza eta atzerantza, nahizta atzerantza erábili ispilu retrovisore bat (retrovisoreak lagun daike baina inoiz ez du ordezkatuko aurrerako martxa potentea). Atzera bazoaz, orohar inefizientea eta inefektiboa izaten ari zara, zein akaso ez den gehiegi nabarituko noiz ematen duzún pausu bakar bat (atzera vs aurrera), edo inkluso bi, baina oso distantzia txikitan ondo nabarmena bihurtuko da (an edozein kontextu). [2614] [>>>]

ostirala, urtarrila 24, 2025

"negar egiten duzu" versus "lloras"

 Atzokoan komentatzen genuén honako hau burúz Yoon Mi Oh-ren emaitzak (2015):

... emaitza horietan euskarak izanen luké ID altutxuagoa zein gaztelaniak, adieraziz ze experimentuko textuetan euskarak erabiliko lituzké silaba gutxiago zein gaztelaniak, izanki emaitza hori ondo deigarria zeren ez dator bat kin beste konputo batzuk non, diferentzia handiz, euskarak izanen lituzkén silaba gehiago zein gaztelaniak (horretaz, ikus [666] eta [669]): Hauxe da oraingo kontrako ratioa:

  • IDeuskara = 0,65  > 0,63 = IDgaztelania

Zehazki, gogora daigun ondorengo sarrera:

Xabier Amuriza-k dio an bere "Euskara batuaren bigarren jaiotza" (2010):

Euskarazko testuan 880 silaba zenbatu ditut. Erdarazkoan, 656. Bietan egin beharreko sinalefa guztiak eginda atera ditut kopuruak. Zenbakiak ehunekora ekarrita, 100-75 proportzioa irteten da. Horrek esan nahi du erdarazko testua esaten hiru ordu laurden behar duguna euskarazkoan ordubete beharko genukeela, abiadura berdinean.

Badakit hizkuntza bataren eta bestearen esakuntzak ezin direla mekanikoki konparatu, baina, gutxi gorabehera, proportzio horretatik eskapatzerik ez dago. Konparazioa hizkuntza bakoitzaren abioaren eta kadentzien arabera zorroztuko bagenu, seguruenik, aldea erdararen alde handituko litzateke. [Xabier Amuriza, 2010:106]

Konsideratuz proportzio hori: 100-75 (nahiz kalkulatua izan den an elkarrizketa luze bat, eta akaso beste kontextu komunikatibo batean ezberdina izanen zen), eta kontuan hartuz ze gaztelaniaren silaba-densitatea zén 0,63 (eta horrek esan nahi zuela ze noiz gaztelaniak izán 100 silaba, vietnamerak erabilikó 63), euskararen proportzioa litzaké 63 respektu 133, esan nahi baita (63/133=) 0,47, zein dén baxutxoagoa zein densitatea on japoniera (0,49).

Amuriza-k, gainera, aztertzen dú nóndik sortuko litzakén nagusiki diferentzia handi hori:

Xabier Amuriza-k, behinda detéktatu diferentzia silabiko nabarmenak artén euskara eta gaztelania (elkarrizketa luze honetan diferentzia horiek ibiliko zirén an proportzioá 100-75), diosku ze:

Alde horren erantzule nagusia aditz perifrastikoa dugu. Eta, zer esanik ere ez euskaraz hain ugari diren bi elementuko aditzak direnean: Lloras-1lorabas-llorarías, respiras-respirabas-respirarías, huyes-huías-huirías. Euskaraz: negar egiten duzu-negar egiten zenuen-negar egingo zenuke, arnasa hartzen duzu-arnasa hartzen zenuen-arnasa hartuko zenuke, ihes egiten duzu-ihes egiten zenuen-ihes egingo zenuke... [Amuriza, 2010:106]
Eta bai, akaso hor agertzen zaizkigu bi erantzule nagusiak on diferentzia silabikoa artén euskara eta gaztelania (aparte utzita ze biek ere erabiltzen dituzté erlatiboki silaba gehiago zein adibidez inglesak, nahiz bestaldetik silaba horiek izán sinpleagoak eta arinagoak):
  • Adizkien luzera: arnasa hartzen duzu - arnasa hartzen zenuen - arnasa hartuko zenuke.
  • Erábiltzea konposizioa noiz sortzen hitzak (eta aditzak): arnasa hartu, eskularruak...
Eta gauza da ze euskararen proportzio silabiko erlatiboki handiago hori respektu gaztelania (silaben konplexutasuna litzaké antzekoa bietan, hala nola ere silabako abiadura) bihurtzen dá benetako arazo noiz metátu gain arazo konparatibo guztiz larriena, zein ez den baizik hitz-ordena buruazkena, non silaba kopuruak dirén ondo relevanteak.

Hortaz, kontu nagusia litzaké aditz perifrastikoa:

  • negar egiten duzu versus lloras
Horren harira, ikusi nahi genuke noláko textuetatik datozen Oh-ren datuak arrén aztertu zergátik ez den betetzen ber proportzioa an datu horiek. Horretarako, Oh-k (2015) erabilitatko 15 textuetatik  ematen zaigú textu bat, lagin moduko bat, suposatzen dugu ze representatiboa, arrén ikus daigun nolákoak zirén textu eta itzulpen horiek. Datozen sarreretan komentatuko dugú Oh-k eskainitako laginezko textu hori an versio diferenteak (nagusiki gaztelania vs euskara), helburuzta aztertu nolákoak dirén, zénbat aditz perifrastiko agertzen dirén, nón kokatzen dirén aditz horiek (estruktura buruazkenagoa edo gutxio buruazkena), zé nolako izenak ematen dirén, zé nolako adjetiboak... [2613]

osteguna, urtarrila 23, 2025

Horrá IR emaitzak ganik Yoon Mi Oh (2015) kin textu-familiarizazio explizitua lehénda grabátu irakurketak

Hortxe doaz atzo aipatutako emaitzak ganik Yoon Mi Oh (2015) kin textu-familiarizazio explizitua, non:

  • SR: Speech Rate, neurtua an silabak / segunduko, aráuz ondoko formula:

  • ID: Information Densitybatezbesteko ratio bat artén vietnameraren silaba-kopuruak eta hizkuntza bakoitzaren silaba-kopuruak an textu ezberdinak; hau da, ematen digú silaba-kopuruen ratioa (proportzio bat da, non soilik konsideratzen dirén textuak). Kalkulatzen da aráuz formula hau: 
  • IR Information Rate, zein den beste batezbesteko ratio bat artén vietnameraren irakur-denborak eta hizkuntza bakoitzaren irakur-denborak; hau da, ematen digú irakur denboren ratioa (beste proportzio bat). Kalkulatzen da aráuz atzoko formula: 
Kontu ezberdinek deitzen digute atentzioa an emaitza horiek (kin textu-familiarizazio explizitua lehénda grabatu irakurketak), eta oso bereziki txineraren oraingo emaitza (ikus [2606]), baina gaurkoan nabarmendu nahi genuke ze emaitza horietan gaztelaniak eta euskarak erakusten duté IR berdina:

  • SPA = EUS = 0,95  

Hori azaltzeko, emaitza horietan euskarak izanen luké ID altutxuagoa zein gaztelaniak, adieraziz ze experimentuko textuetan euskarak erabiliko lituzké silaba gutxiago zein gaztelaniak, izanki emaitza hori ondo deigarria zeren ez dator bat kin beste konputo batzuk non, diferentzia handiz, euskarak izanen lituzkén silaba gehiago zein gaztelaniak (horretaz, ikus [666] eta [669]): Hauxe da oraingo kontrako ratioa:

  • IDeuskara = 0,65  > 0,63 = IDgaztelania

Ondorengo sarreretan saiatuko gara gehiago aztertzen diferentzia handi hori.

Bestalde, goragoko experimentuan, gaztelaniaren irakurketa-abiadura izanen litzaké pittin bat arinagoa zein euskararena arrén konpensatu silaba gehiago horiek

  • SRgaztelania = 7,71  > 7,54 = Deuskara
halan-ze, gorago esan legez, bi kontrako efektu horietatik aterako litzaké IR berdina an gaztelania eta euskara noiz irakurleak familiarizatu dirén kin edukia on textuak. [2612] [>>>]

asteazkena, urtarrila 22, 2025

Euskara konsideratu da an bi lan (2015, 2019) nahiz bietan explizituki zehazten den nóla irakurleak familiarizatu egin diren kin textuen edukia lehenago zein egín euren grabazioak

Duela gutxi aipatzen genituén beste bi lan (Yoon Mi Oh, 2015; eta Coupé, Mi Oh, Dediu eta Pellegrino, 2019) non aztertu dirén hizkuntza ezberdinetako IR-ak (Information Rate), eta non, gainera, hizkuntza horietako bat zén euskara. Baina bi azterketa horietan explizituki zehazten da nóla irakurleak familiarizatu egin diren kin textuen edukia lehenago zein egín euren grabazioak. Honela mintzo ginen an [2604] burúz goragoko lehenengo lana:

Lehenik aipátu ze Yoon Mi Oh-k bere tesian ("Linguistic Complexity and Information: Quantitative Approaches", 2015) kalkulatu zuén euskararen IR-a (information rate) respektu vietnamiera erábiliz ber metodologia zein Pellegrino-k eta bestek (ikus [2601]) baina azpi baldintza explizitu hau:

In a first phase of recording, speakers were asked to read the 15 texts silently which... In a second stage, speakers read each text aloud twice before the actual recording. Each text was thus separately recorded one at a time in a random order after being read three times by the speaker, including the silent reading.This process of repeatedly reading the same text before each recording allowed speakers to familiarize themselves with the script... [Oh, 205:29]

nondik:

This process of repeatedly reading the same text before each recording allowed speakers to familiarize themselves with the script...  [Oh, 205:29]

esan nahi baita ze, nola genioén an [2600]:

..., textuekiko aurre-familiarizazio horrek (aurreko ulermen horrek) neutralizatuko lituzké prozesamendu-diferentziak, halan-ze, gure helburutarako, experimentuak ez luke interes berezirik, harago tikan diferentziak an gorputz fonikoa (soinuen luzera, konplexitatea, ahobetegarritasuna,...) zein ez diren gure interes nagusia.

Hortaz, gure helburuetarako, bi experimentu horiek ez lukete interes berezirik, nahiz interesatzen zaigun zéin den euskararen lekua respektu adibidez gaztelania an aspektu nagusiki foniko hori

Familiarizazio explizitu horretaz aparte, Yoon Mi Oh (2015) zúen erabili ber metodologia zein Pellegrinok eta bestek an euren lana on 2011, zein gauzatzen dén an ondorengo formula (Oh, 2015:36):

Hori dá prozedimendu berbera zein ikusten genuen an [2601] an artikulua ganik Pellegrino, Coupé eta Marsico (2011). Bihar, lan horretako emaitzak. [2611] [>>>]

asteartea, urtarrila 21, 2025

Eta gauza da ze japoniera dá 8 horietatik hizkuntza bakarra zein dén buruazken zurruna

Atzokoan ikusten genuen nóla, Pellegrino eta al.-en experimentuan (2011), irakurleek... (suposatzen dugu hala eskatzen zietela)

... recorded the texts at 'normal' speech rates, without being asked to produce fast or careful speech. [Pellegrino et al., 2013:542]

halan-ze har geinke emaitzetako ratioak eta denborak nola erakusleak on abiadura "normala" noiz irakurtzen an hizkuntza horiek respektu vietnamiera (suposatu behar dugu ze ulermena berdina da an hizkuntza guzti horiek, nahiz ulermena ez den kontrolatu):

Hortaz, atzo egiten genuén galdera hau:

Eta zéin hizkuntzak erakusten dú informazio-ratio baxuena?, edo bestela esanda, zéin hizkuntzak erakusten dú irakurketa-denbora handiena?

Eta gauza da, ze goragoko zerrenda horretan, azpimarratu nahi ditugú bi muturretako diferentziak an irakurketa-abiadura "normala", bata aldé inglesa, positiboa (%8 denbora gutxiago respektu vietnamera), ez handiegia hala ere; eta bestea aúrka japoniera, negatiboa (%35 denbora gehiago respektu vietnamera), zein, hau bai, dén oso-oso handia, definitiboki handiegia.

Azken diferentzia hori ezin da azaldu zatio arrazoi foniko hutsak, nola izan ahal dirén hizkuntzaren tonalitatea (tonala izan ala ez), soinuen argitasuna edo sonoritatea, hitz edo adizki luzeagoak (kasu horretan erraztu edota eskaini beharko lirake aukera "normal" laburragoak), edota akaso ritmo regularrago eta sendoago bat, baizik-ze, hor, gure ikuspegitik, beharrezkoa da bestelako azalpen bat, harago ti aspektu fonikoak.

Alde horretatik, azpimarratu nahi genuke ze japoniera dá goragoko 8 horietatik hizkuntza bakarra zeinen ordena dén buru-azken zurruna (preseski, kokatuz aditza rigidoki an bukaera salbu an erabilera kolokial-kasual txalogarriak) eta postpositiboa. Izan ere, ordena buru-azken zurrunak bádu eragin handia gain komunikazioaren kalitatea eta kantitatea (hala noiz produzitzen nola noiz jasotzen), eta espero genuenez (ikus atzoko sarrera), eragin handi hori baita islatzen dá an irakurketa-denbora "normal" izugarri handiagoak. [2610] [>>>]

astelehena, urtarrila 20, 2025

Emaitzen arabera, ezin liteke onartu ze hizkuntza guztiek erakusten duté ber informazio-ratioa (alegia, ber irakurketa-denbora)

Amaitzen genuén atzo:

Esan nahi baita ze inefizientzia komunikatibo horren efektu nagusia ez da denbora pixkat gehiago edo gutxiago (nahiz denboran ere islatuko den), baizik bere efektu direktoak gain komunikazioaren kalitatea, zein ez den izanen sintaktikoki-informatiboki-expresiboki potentea, zein ez den izanen irekia, esan nahi baitá funtzionalki irekia, funtzionalki rekursiboa.
Inefizientzia hori baita nabaritu beharko litzaké an zailtasun handiagoa noiz irakurtzen (ceteris paribus eraginez ulermen eskasagoa), eta tipikoki baita an irakurketa-denbora ere noiz egín lehenengo irakurraldia, zeren, adibidez, atzerakarga eta velcro-efektuak ez dira batere lagungarriak noiz irakurtzen. 

Darabilgun experimentuan ez dakigu ziur lehenengo irakurraldia ote den, hauxe esaten baitiguté autoreek:

Several adult speakers (from six to ten, depending on the language) recorded the twenty texts at 'normal' speech rates, without being asked to produce fast or careful speech. [Pellegrino et al., 2013:542]

Gu suposatzen ari gara ze irakurleek egin dituzté irakurketa horiek an lehenengo irakurraldia (edo hala konsideratu ahal dela), baina, edozein kasutan, emaitzen arabera, ezin diteke onartu ze hizkuntza guztiek erakusten duté ber informazio-ratioa (alegia, ber irakurketa-denbora):

However, JRL exhibits a greater than 30% degree of variation between Japanese (0.74) and English (1.08), invalidating the first hypothesis of a strict cross-language equality of rates of information. [Pellegrino et al., 2013:551

Eta zéin hizkuntzak erakusten dú informazio-ratio baxuena?, edo bestela esanda, zéin hizkuntzak erakusten dú irakurketa-denbora handiena? [2609] [>>>]

igandea, urtarrila 19, 2025

Esan nahi baita ze inefizientzia komunikatibo horren efektu nagusia ez da denbora pixkat gehiago edo gutxiago (nahiz denboran ere islatuko den), baizik bere efektu direktoak gain komunikazioaren kalitatea

Genioen atzo:

Baina beste batzuetan, eta hauxe da gure intereseko kasua, denbora gehigarri hori ez da "invertitzen" an argitasuna edo expresibitatea, baizik almazenatuz informazioa inefizienteki, zeren informazio hori agertzen zaigún lehenago zein bere gako estrategiko informatibo-expresiboak (buru sintaktiko-diskursiboak), eráginez alde batetik prozesamendu-kostu handiagoa, eta bestetik interpretazio inefektiboak hala informatiboki nola expresiboki, finean eráginez expresio-modu bat ondo mugatua, etendua, itxia, inefizientea eta inefektiboa hala an kantitatea nola an kalitatea.
Esan nahi baita ze inefizientzia komunikatibo horren efektu nagusia ez da denbora pixkat gehiago edo gutxiago (nahiz denboran ere islatuko den), baizik bere efektu direktoak gain komunikazioaren kalitatea, zein ez den izanen sintaktikoki-informatiboki-expresiboki potentea, zein ez den izanen irekia, esan nahi baitá funtzionalki irekia, funtzionalki rekursiboa. [2608] [>>>]

larunbata, urtarrila 18, 2025

Dudagabe, denbora ez da faktore bakarra, ezta ere inportanteena. Inportanteena dá ulermen informatibo-expresiboa

Irakurtzen genuén atzo honako komentarioa:

Oso interesgarria. Itxuraz bederen, denbora murriztea da abantaila noiz hitz egitean. Demagun, dut nahi leitu egunkaria an 5 minutu, bada kasu horretan duzu aukera ki irakurri geyo informazio; edo an denbora gutxiago. Hala eta guztiz, an garaia ki ulertu, agian hizkuntza ba (bat) geyo mantso, izan ahal da abantaila, zeren da ulertuko hobe, zeren duzu geyo denbora ki prozesatu informazioa

Dudagabe denbora ez da faktore bakarra, ezta ere inportanteena noiz aztertzen informazioaren prozesamendua (ikus [2586] edo [224]. Inportanteena dá ulermen informatibo-expresiboa zeren ezbada ondo ulertzen entzun-irakurritakoa hala informatiboki nola expresiboki, orduan komunikazioak egin dú porrot, zein den komunikazioaren arazo maximoa.

Hizkuntza batean, material fonikoa eta komunikazio-denbora izan ahal dirá erlatiboki luzetxoagoak, baina horrek aporta daiké aukera expresiboak (demagun adibidez morfologia diminutibo-aumentatibo aberatsa zein den existitzen an zenbait hizkuntza), edo erraztasuna an produkzio fisikoa on soinuak (silaba gehiago baina errazagoak) hala nola an ulermen argiagoa (zeren soinuak euren artean ezberdintzen dirén argiago). Horretaz mintzo ginen an:

Genioen hemen ze:

Bestalde, hitzak argiki ezberdindu beharko lirake euren artean, halatan-ze, kontuan izanda ze soilik egoten dira vokal eta konsonante gutxi batzuk, hitz guztiak ezingo dira izan monosilabikoak salbú noiz erábili elementu tonalak zeinen konplexutasuna ezin dugun valoratu. Hortik segitzen da ze, zenbat eta vokal eta konsonante gehiago izan hizkuntza batek, hainbat laburrago izan ahalko dira bere hitzak (aparte utzita, esan bezala, hizkuntza tonalak), nahizta bestalde, zenbat eta vokal eta konsonante gehiago izan, egonen da tendentzia aldén ager daitezen vokal, konsonante eta hitz antzekoagoak (gutxiago diferentziagarriak) edota esateko konplexuagoak, zeinen argitasuna eta zailtasuna ezin dugun valoratu.
Hortaz, ikus daigun, Pellegrino et al.-ek aztertutako hizkuntza horietan, zénbat silaba ezberdin egin litezken (2011):

Konprobatzen dugu ze, bitárten inglesez egin litezkén 7.931 silaba diferente, japonieraz sor litezké 416, zeinekin, bistan denez, soilik eratu ahalko dirá 416 hitz monosilabiko, gehienez ere (txineran, ez da konsideratu silaben aspektu tonala). Autoreek, gainera, egiten dute valorazio bat gain konplexitate silabikoa, oinarritua an zénbat konsonante agertzen diren an silabak (#const/syl).

Hor ez dira valoratzen, adibidez, soinuak eurak, euren diferentziagarritasuna, euren hurbiltasuna, edota euren zailtasuna edota gogortasuna (adibidez, r bikotza dá gogorragoa zein r samurra). Japonieraz, adibidez, existitzen dirá 5 vokal, zein diren justuki berberak zein diren an gaztelania edo euskara, oso argiki diferentziagarriak eta, esango genuke, ondo ahobetegarriak, ondo sonoroak (silabak dirá tipikoki CV edo V). Ikus hemen:
The Japanese language has only 5 vowels: a, i, u, e, o. They are terse vowels, pronounced clearly and sharply. [Namiko Abe, 2017]
Eta hor egon daitezké faktore foniko-expresiboak zeinen efektua (adibidez noiz esán biraoak) ezin dugun baloratu.

Hortaz, batzuetan denbora gehigarria ondo erabilita egon ahal da adibidez an argitasuna edo expresibitatea. Eta faktore hori isla daiteke an konparazioa artén bi hizkuntza.

Baina beste batzuetan, eta hauxe da gure intereseko kasua, denbora gehigarri hori ez da "invertitzen" an argitasuna edo expresibitatea, baizik almazenatuz informazioa inefizienteki, zeren informazio hori agertzen zaigún lehenago zein bere gako estrategiko informatibo-expresiboak (buru sintaktiko-diskursiboak), eráginez alde batetik prozesamendu-kostu handiagoa, eta bestetik interpretazio inefektiboak hala informatiboki nola expresiboki, finean eráginez expresio-modu bat ondo mugatua, etendua, itxia, inefizientea eta inefektiboa hala an kantitatea nola an kalitatea. [2607] [>>>]

ostirala, urtarrila 17, 2025

Horrá emaitzak on 2011ko experimentua ganik Pellegrino et alter

Tituluko emaitza horiek ematen genituén adibidez an [660]:

Aurreko sarreretan ikusi dugu nóla hizkuntza ezberdinek erakusten dituztén silaba-densitate eta silaba-abiadura ezberdinak, eta bádela tendentzia orokor bat aldén konpensazioa, nahiz orobat exístitu kasu interlinguistiko interesgarriak non ez den gertatzen halako konpensaziorik: zehazki, aipatutako experimentuan, alemanak izanen lituzké bai silaba gehiago eta baita silaba-abiadura txikiagoa zein inglesak.

Harago, Pellegrinok eta bestek aztertu nahi izan dituzté bi efektu horiek (densitatea eta abiadura) an neurri bakar osoago bat, zeini deitukó Information Rate (IR):

Consequently, it is worth examining the overall quantity of information conveyed by each language per unit of time (and not per syllable). This so-called INFORMATION RATE (IR) encompasses both the strategy of linguistic encoding and the speech settings for each language L. [Pellegrino et al., Language, 2011:547]
Neurri bateratu horretan, finean, autoreek neurtuko dituzté denborak zein irakurleek erábilí an textu bakoitza; kalkúlatuz, ondoren, denbora horien proportzioak respektu batezbesteko irakur-denbora on ber textua an vietnamera (hartua nola referentzia an proportzioaren zenbakitzailea); gero konputatuko duté irakurle bakoitzaren batezbesteko proportzioa an bere textu guztiak; eta azkenik, hizkuntza bakoitzaren irakurle guztien batezbesteko proportzioa, zein baita euren neurria: Information Rate (IR):

Ideia argiago bat izan daigun buruzki zértara datorren informazio-tasa hori (goragoko koadro gorrian), har daigun inglesa, zeinen 0,91 densitate horrek adierazten digu ze, noiz vietnamerak egin dituén 91 silaba, inglesak egin ditú 100 afinda eman ber informazioa, eta hortaz inglesa izanen litzaké (100/91 = 170,98 = 1,0989) %9,89 gutxiago densoa zein vietnamera, erabilíz %9,89 silaba gehiago zein vietnamera. Baina, bestalde, inglesak ematen ditú bere silabak arinago, hain zuzen %18,58 arinago zein vietnamerak (6,19/5,22 = 1,1858), halatan-ze bi efektu horiek doáz an kontrako norabidea.

Aipatutako bi efektu horien emaitza neurtzeko, Pellegrinok eta bestek kalkulatuko diguté euren IR (Information Rate), zeinen interpretazio sinplifikatu bat eginen dugún hemen, justuki suposatuz ze hizkuntza bakoitzeko irakurle guztiek irakurri dituzté euren textuak an ber denbora (hizkuntza ezberdinetakoak an denbora diferenteak, noski), halan ze baldin referentziazko vietnameran irakurle guztiek eman badituzté 100 segundu an euren irakurketa guztiak, japonieraren irakurle guztiek eman beharko zituztén 135 an euren irakurketa guztiak afinda emaitza izan zedin ondoko IR an japoniera:

  • 100 segundu / 135 segundu = 0,74 = IRjaponiera

Esan nahi baita ze, eginez aipatutako interpretazio sinplifikatua, japonieraren irakurketa-denbora hori izanen litzaké %35 luzeagoa zein vietnameraren irakurketa-denbora. Eta horrela eginez an goragoko beste hizkuntzak, hauxe genuke (erábiliz aipatutako interpretazio sinplifikatua):

INTERPRETAZIO SINPLIFIKATUA (suposatuz ez dagoela aldakortasun intralinguistikorik) 

  • Japoniera: 100 / 135 (= 0,74) → %35 denbora gehiago zein v.
  • Alemaniera: 100 / 111 (= 0,90) → %11 debora gehiago zein v.
  • Txinera: 100 / 106 (= 0,94) → %6 debora gehiago zein v.
  • Italiera: 100 / 104 (= 0,96) → %4 debora gehiago zein v
  • Gaztelania: 100 / 102 (= 0,98) → %2 debora gehiago zein v.
  • Frantsesa: 100 / 101 (= 0,99) → %1 debora gehiago zein v.
  • Vietnamera: 100 / 100 (= 1) → Referentzia
  • Inglesa: 100 / 92 (= 1,08) → %8 debora gutxiago zein v.

Ikusiz IR horiek, Pellegrinok eta bestek (2011) ondorioztatuko duté ze:

IRL [L hizkuntzaren Information Rate] exhibits a greater than 30% degree of variation between Japanese (0.74) and English (1.08), invalidating the first hypothesis of a strict cross-language equality of rates of information. [Pellegrino et al., Language, 2011:551]

Emaitza horien argitara, ezin esan ze informazio-densitateak eta silaba-abiadurak eragiten duté efektu bateratu interlinguistikoki berdina.

Baita gogoratu behar dugu ze suposatzen ari gara ze denborak hartu zirén an lehenengo irakurraldia, noiz irakurleak ez diren familiarizatu kin textuak, zeren bestela, eta gure helburuetarako (prozesamendu-kontuak), emaitza horiek ez lukete interes berezirik (haratago tikan indizio indirektoak). [2606] [>>>]