osteguna, urria 17, 2019

Zéin erraza izan ahal den zientzia egitea

Pasa den astelehenean idatzi nion ki François Pellegrino (zein den autoreetako bat an bi lan horiek zein gatozen aipatzen an azken sarrerak: Pellegrino et al., eta Coupé et al.) eskátuz informazio gehiago buruz nóla aplikatu euren neurri bat (entropia baldintzatua) ki egoera linguistiko teoriko sinple-sinple bat zein interesatzen zitzaidan afin aztertu eta valoratu neurri horren funtzionamendua (hala nola ere haren egokitasuna ki konpáratu interlinguistikoki informazio-abiadura [IR]).

Eta justuki atzo arratsaldez jaso nuen Pellegrino-ren erantzuna non estekatzen zidán a doktore-tesia ganik Yoon Mi OH (zein den bigarren artikuluaren autoreetako bat), non aurkituko nuén informazio hori, hala nola ere askoz datu interesgarri gehiago, zein ez ziren agertzen an euren bigarren artikulua (askoz laburragoa baita).

Komentatuko ditugu datu horiek, baina orain, soilik nahi genuen nabarmendu zéin erraza izan ahal den zientzia egitea, edozer hobeto ezagutzea, eta baita ezagupen hori hobeto aplikatzea, noiz inplikatuek laguntzen duten. [685] [>>>]

Etiketak: , ,

asteazkena, urria 16, 2019

Tonalitatea dá faktore inportantea noiz ulertzen abiadura silabikoa

Aurreko sarreran genioen ze vietnamera, izanki hizkuntza silabikoki motela, ez dela motelena artén 8 hizkuntzak on Pellegrino et al., non mandarina zén silabikoki motelena, ezta ere an experimentua on Coupé et al. (17 hizkuntza), non thai hizkuntza nagúsitu an moteltasun silabikoa bitárten mandarina pasatzen dén ki laugarren postua (ez dago zehaztasun osoz jakiterik zeren autoreek ez dute ematen abiadura numerikoa [silabak/segundu]) eta yue txinera dén hirugarren an moteltasun silabikoa. 

Eta gauza ze justuki lau hizkuntza horiek (vietnamiera, mandarina, thai eta yue) dirá tonalak (justuki 8tik 2 an Pellegrino et al. eta 17tik 4 an Coupé et al.), hala erakutsiz zé inportantea den tonalitatea artén faktoreak explikatzén abiadura silabikoa, nola esperoko genuen. [684] [>>>]

Etiketak: ,

asteartea, urria 15, 2019

Vietnamera: 12 manera ki esan "can"

Genioen hemen ze:
Hizkuntza tonaletan, tonuek izan ahal duté efektu biderkatzaile handia, halatan ze tonu ezberdinetako silabak konsideratu litezké nola balira vokal ezberdinekoak, nondik, vokalen kopurua multiplikatu beharko litzaké bider tonu-kopurua afin konpútatu "vokalen" kopurua (tonuak barne).
Batzutan, duda ere egin liteké ahoskera bat noráino den tonu edo vokal. Ikus horretaz ondoko komentarioa on Bui Hoang Linh burúz tonuak an vietnamera:
It is often mistaken that Vietnamese has only 6 tones, namely,
Huyền Falling
Sắc Rising
Hỏi Curling fall
Ngã Curling rise
Nặng Lowly fall
Bằng Flat
This misconception is due to the limited detonation signs the Portuguese has used to denote the spoken Vietnamese language. This lead to a belief that only “tonal signs” that are counted (e é ẻ ẹ ẽ è). In reality, the extra letters that are being used in the Vietnamese alphabet serve no purpose other than to denote the subtones that can be coupled with the maintones (namely, ă â ê ô ơ ư) to produce totally different tones. Among these special letters, there is one letter ă that is undoubtedly tonal (pronounced as á but it give an abrupt ending sound to the syllable-similar to Cantonese ending the word with -p -k -t). The other letters can be considered as different vowel for simplification purpose. So total we have,
a (can) Flat
á (cán) Rising
ả (cản) Curling fall
ạ (cạn) Lowly fall
ã (cãn) Curling rise
à (càn) Falling
ă (căn) Flat with abrupt end
ắ (cắn) Rising with abrupt end
ẳ (cẳn) Curling fall with abrupt end
ặ (cặn) Lowly fall with abrupt end
ẵ (cẵn) Curling rise with abrupt end
ằ (cằn) Falling with abrupt end
Total of minimum 12 tones in the Vietnamese language.
Tonu, subtonu edo vokal konsideratuta ere, vietnamerak izango luké tonu-sistema konplexua, kin aukera vokal-tonal zabala, zek ahalbídetu, adibidez, 12 manera ki esán "can".

Eta gauza da ze, Pellegrino et al. lanean (8 hizkuntza), vietnamerak dauká informazio-densitate altuena (silaba gutxien) eta bigarren abiadura silabiko baxuena, 5,22 silaba segunduko (mandarinak du baxuena kin 5,18), eta Coupé et al. lanean (17 hizkuntza), vietnamerak izanen luké berriro informazio densitate silabiko altuena, eta berriro ere izanen litzaké bigarren silabikoki motelena (nahiz orain motelena izán thai hizkuntza, zein aurreko ikerketan ez zen agertzen).

Edonola ere, vietnamerak izanen luké abiadura silabiko motelenetakoa, nola esperoko genuen. [683] [>>>]

Etiketak: , ,

astelehena, urria 14, 2019

Baina vokal-kopurua ez litzake faktore bakarra eragitén gain aukera eta abidura silabikoa

Aurreko sarreretan genioen ze fonema vokalikoen kopuruak akaso iragar lezaké hala aukera silabikoa nola abiadura silabikoa. Hala ere, vokal-kopurua ez litzake faktore bakarra erágiten gain aukera eta abidura silabikoa: bádute euren pisua konsonanteek, eta eurena ere diptongoek, hala nola ere bestelako faktoreek, nahiz euren boterea ki finean irágarri abiadura silabikoa ez litzaken hain handia.

Adibide baterako, har ditzagun grekera eta rusoa, justuki bi hizkuntza zein aipatu berri ditugu zatio euren 5 fonema vokalikoak, eta zeinen silaba-abiadura ez den aztertu an Pellegrino et al. edo Coupé et al. (5 fonema vokaliko dá kopuru minimoa artén hizkuntzak zein agértzen hemen, nahiz munduan zehar aurki litezkén hizkuntzak kin inventario vokaliko murritzagoak) .

Hortaz, grekera eta rusoa espero genituzké silabikoki arinak afinda konpénsatu, neurri batean bederen, eurentzat esperotako karga silabiko erlatiboki handiagoa (zatio izán vokal erlatiboki gutxi). Hala ere, konsonanteei erreparatuta, nabari dugu diferentzia handia artén 18 konsonanteak ti grekera aúrka 34 konsonanteak (ia doblea) ti rusoa (konsonante-multzoak ere, gehiago esperokó an rusoa, eta printzipioz, silaba konplexuagoak ere). Eta, diptongoei begiratuta, hiru aldiz gehiago daude aldé rusoa (15 kóntra 5), areago berretuz a posibilitate konbinatorioak on rusoa respektu grekoa an silabak.

Gauza da ze grekeran bateratuko liraké inventario vokaliko murritza, inventario konsonantiko murritza, eta diptongo-kopurua ere erlatiboki txikiagoa respektu rusoa, halan ze grekeran esperoko genuké silaba-aukera ez hain zabala, hitz silabikoki luzeagoak, eta abiadura silabiko erlatiboki altuagoa (respektu rusoa), bitárten rusoan, konsonante eta diptongo-kopuru handiagoek eragingo bide luketé silaba-aukera zabalagoa eta, finean, abiadura erlatiboki baxuagoa respektu grekera, nahiz jarráitu izaten silabikoki arina (5 fonema vokaliko). Hala esperoko genuke. [682] [>>>]

Etiketak: ,

igandea, urria 13, 2019

Vokal eta konsonante-kopuruak

Mintzo ginen atzo burúz kantitate erlatiboa on vokalak respektu konsonanteak gehi konsonante-multzoak barné hizkuntzak. Eta kopuru horien ideia orokor bat hartu ahal dezagun (nahiz ideia hori akaso ez izán osoro zehatza, zeren datuen iturria izanen dá Eupedia, zein baita portal japoniar bat zeinen helburu nagusia ez den zientifikoa, eta non ez den aipatzen nóndik atera dituzten datu horiek), topatu ditugú ondorengo bi taulak, zeintan zenbatzen dirén fonema vokalikoak, konsonantikoak eta diptongoak zenbait hizkuntzatan:

Datu horietako minimo vokalikoa dá 5, non agertzen zaizkigún Basque, Greek, Russian, Serbo-Croatian, Spanish-Castilian eta Japanese. Horietarik lau, justuki Basque (EUS), Serbian (SRP), Spanish-Castilian (SPA) eta Japanese (JPN), agertzen dirá baitare an azterketa on Coupé et al., eta Spanish-Castilian and Japanese an ikerketá on Pellegrinok et al., eta gauza da ze bost hizkuntza horiek izanen lituzketé silaba-abiadura erlatiboki altua (eta informazio-densitate erlatiboki baxua), nola esperoko genuen. [681] [>>>]

Etiketak: , ,

larunbata, urria 12, 2019

Hizkuntza baten vokal-kopuruak akaso iragar lezaké hizkuntza horren abiadura silabikoa

Mintzo ginen atzo burúz inventario fonemikoak, eta nóla, hizkuntza ezberdinetan, aukera fonemiko horiek izan litezkén zabalagoak edo murritzagoak, ahalbidetuz konbinazio fonemiko gehiago edo gutxiago barné silaba ezberdin gehiago edo gutxiago, eraginéz inventario silabiko zabalagoak edo murritzagoak ere (konprobatzen genuen nóla hizkuntza batean aukera silabikoa izan litekén harik 20 aldiz handiagoa zein beste hizkuntza batean).

Eta konbinazio fonemiko horietan akaso azpimarratu beharko genuke paperá on fonema vokalikoak (vokalak eta euren kopurua) zatio euren konbinazio-gaitasun handiagoa noiz sortzen silaba diferenteak: ideia da ze, vokalek sor ditzaketé silabak bai soilduta, bai diptongoak eginda, bai eta konbinatuak kin edozein konsonante edo konsonante-multzo, zein izan ahal dirén askoz gehiago zein vokalak, halatan ze, nolabait esan, vokal baten eragin (silabiko-) sortzailea multiplikatzen da bidér kopurua on konsonanteak eta konsonante-multzoak zein exístitu an hizkuntza.

Hizkuntza tonaletan, tonuek izan ahal duté efektu biderkatzaile handia, halatan ze tonu ezberdinetako silabak konsideratu litezké nola balira vokal ezberdinekoak, nondik, vokalen kopurua multiplikatu beharko litzaké bider tonu-kopurua afin konpútatu "vokalen" kopurua (tonuak barne).

Horrela, hizkuntza ezberdinetan espero beharko genuke erlazio bat artén vokal-kopuruak, silaba ezberdinen kopuruak eta silaba-abiadurak; halan ze hizkuntzak kin vokal gutxiago izanen zirén, oro har, arinagoak (an silabak segunduko), bitárten vokal gehiago lotuko zirén kin abiadura silabiko baxuagoa.

Edo, bestela esanda, hizkuntza baten vokal-kopuruak akaso iragar lezaké, hein interesgarri batean, hizkuntza horren abiadura silabikoa. [680] [>>>]

Etiketak: , ,

ostirala, urria 11, 2019

Inventario fonemikoa vs inventario silabikoa

Mintzo ginen hemen burúz silabak, silaba-kopuruak, soinuak... eta konprobatzen genuen nóla japonierak zituén 416 silaba diferente, bitárten inglesak izán 7931, alegia ia 20 aldiz aukera silabiko handiagoa aldé inglesa. Diferentzia horrek ahalbidetuko dú, neurri batean bederen, inglesak izatea informazio-densitate ia bikoitza (0,91) respektu japoniera (0,49) (ikus nóla kalkulatu den informazio-densitate hori).

Jarraituz harago, aniztasun silabikoa ahalbidetuta datór, neurri batean bederen ere, ga aniztasun fonemikoa (fonemak dirá soinu kontrastibo semantikoki esanguratsu), zeinda, printzipioz, esperoko genuken handiagoa an hizkuntzak kin aukera silabiko handiagoa. Horretaz irakurtzen dugú ondorengo datua an artikulua ganik Coupé et al.:
Focusing on their phonetics and phonology, these languages vary in their number of phonemes (from 25 in Japanese and Spanish to more than 40 in English and Thai), the number of distinct syllables (from a few hundred in Japanese to almost 7000 in English), tonal complexity (from none to six contrastive tones), and various other phonological phenomena (e.g., vowel harmony is present in Finnish, Hungarian, Korean, and Turkish). [Coupé, Mi Oh, Dediu eta Pellegrino, 2019]
Esan nahi baita ze, autoreek landutako 17 hizkuntzetatik, justuki japoniera egongo litzake artén hizkuntzak (gaztelania ere) kin aukera fonemiko laburrena (25 fonema) eta justuki inglesa egongo litzake artén hizkuntzak (thai hizkuntza ere) kin fonema diferente gehiago (>40 fonema).

Konplexitate tonala aparte utzita (esan nahi baita, aparte utzíz hizkuntza tonalak nola, adibidez, mandarina, vietnamera edo thai hizkuntza), goragoko datuok aldeztuko luketé ideia ezen, nahiz hizkuntzen fonema-kopurua ez izán faktore bakarra zek erágin gain tamaina on inventario silabikoa (izan ere bi hizkuntzek, nola japoniera eta gaztelania, izan ahal duté, alde batetik, ber aukera fonemikoa, 25, eta bestetik, aski aukera silabiko ezberdina: 416 vs 1593, hots, lau aldiz handiagoa), báda faktore inportante bat (adibidez, gaztelaniaren 1593 silaba ezberdinen kopuru horrek jarraitzen dú izaten baxua respektu beste hizkuntza batzuk kin aukera fonemiko handiagoa, hala nola inglesa, frantsesa, alemana edo italiera bera), nola espero genuen. [679] [>>>]

Etiketak: , ,

osteguna, urria 10, 2019

Eta zénbat da 150 ms?

Genioen atzokoan ze, Coupé eta besteren experimentuan, irakurraldien iraupenak neurtzean, kendu dituzté pausa guztiak zein izán handiago ze 150 ms luze. Baina, zénbat da 150 ms? Zér egin daiteke an 150 milisegundu? Zér egin daiteke an 1'5 segundu-hamarren? Zér egin daiteke an segundu-zortziren bat

Ba, segundu-zortziren batean eman ahal dá silaba bat. Izan ere, ikusten genuén hemen edo ondorengo taulan:

nóla hizkuntzen silaba-abiadurak (Syllabic Rate) ibiltzen zirén tarten 5 eta 8 silaba segunduko, non, adibidez euskara, japoniera, edo gaztelania bera, aski hurbiltzen zirén ki 8 silaba segunduko, zein, beste era batera esanda, dá silaba bat segundu-zortzireneko, edo silaba bat 150 milisegunduko, zein den gure tituluko neurria.

Eta interesgarri iruditzen zaigu nóla, hizkuntza batzuetan bederen, pausa tipikoek irauten dutén aski antzera nola silaba tipikoek, halatan ze, bide horretatik, aztertu liteke ea pausa tipikoek hizkuntza ezberdientan antzera irauten ote duten, edo, hala ez balitz, ea hizkuntzen silaba-iraupenak eta euren pausa-iraupenak lotuta agertzen diren. Zeren, akaso, silaben martxak eragin bailezaké gain pausen luzera. [678] [>>>]

Etiketak: , , , , ,

asteazkena, urria 09, 2019

Coupé et al. (2019): "..., excluding pauses longer than 150 ms,..."

Itzul gaitezen orain ki experimentua on Coupé, Mi Oh, Dediu eta Pellegrino (2019), non, genioenez, parte-hartzaileek burutu behar zituztén irakurrali batzuk (behinda textuak egón jada ulertuak eta landuak). Eta gaurko kontua da ze, autoreek, noiz konputatú irakurraldi horien iraupenak, kendu dituzté pausa erlatiboki luzeak (esan nahi baita, luzeagoak zein pausa tipikoa), baina ez dituzte kendu pausa tipikoak edo erlatiboki laburrak:
For each recording, we extracted the duration [in seconds, excluding pauses longer than 150 ms, i.e., longer than typical phonemic silences... [Coupé, Mi Oh, Dediu eta Pellegrino, 2019]
Hortaz, baldin grabazio batean topátu pausa bat luzeagoa zein 150 ms (milisegundu), eta hortaz erlatiboki luzea, deskontatuko zutén denbora hori ti iraupena on irakurraldia, baina baldin topatú pausa bát on 149 ms, orduan ez zuten kenduko, hola guztira geldítuz erlatiboki laburrago horixe zein hasieran zén ondo luzeago (esan nahi baita ze pausa luzeago horiek, behin kenduta, konputatuko luketé zero, bitárten laburragoak, bertan utzita, konputatuko luketé 149).

Gauza da ze, pausa luzeago horiek (>150) izan lezaketé arrazoi linguistikoren bat, antzera nola pausa laburragoek ere izan lezaketén eurena, eta ez dirudi egokiá soilik konputatzea pausa ertain eta laburrak, pasatuz pausa luzeenak ki konputatu nola balirán laburrenak (behin kendutakoan).

Kentzen hasita, akaso autoreek kendu beharko zituztén pausa guztiak, edo denei emán iraupen bera (adibidez 150 ms). Gure ustez, ordea, egokiagoa izanen zen iraupenak ez ukitzea, eta gero aztertu nóla banatzen dirén pausa horiek guztiak artén hizkuntzak, zeren banaketa horretan ere egon liteké informazio interesgarria. [677] [>>>]

Etiketak: , , ,

osteguna, urria 03, 2019

Experimentua dá foniko hutsa: "Speakers became familiar with the texts, by reading them several times before being recorded,..."

Atzoko sarreran aipatzen genuén a artikulu berriki aterea ga Coupé, Mi Oh, Dediu eta Pellegrino (2019) non autoreak saiatzen diren konplementatzen a ikerketá on Pellegrinok et al. (2011) non konparatzen zirén zenbait aspektu foniko (finean: silaba-kopuruak, silaba-abiadurak, eta euren erlazioa) an 8 hizkuntza, oraingoan zabálduz ikerketa ki 17 hizkuntza zeinen artean dirén katalana eta euskara.

Hartara, erabiliko dituzté textu irakurriak, nola azpimarratzen genuén hemen:
Jakina, ez ahaztu ze Pellegrino et al. dá ikerketa bat eginá azpi baldintza ondo konkretuak (adibidez eta oso nabarmenki, textuak irakurriak izatea), halan ze emaitza horiek konplementatu beharko liraké kin ikerketa estatistiko gehiago, baina, hala ere, ilustratzen digu nóla faktore fonikoak ez diren derrigor konpensatu behar.
Era berean, hemen, azpimarratzen genuen ze, nolabait esan, ulermena ez zela beharrezkoa, zeren ez baitzen kontrolatzen:
Irakurria izanki, hiztunek ez dute ezer sortu behar, baizik soilik irakurri zerbait zein norbaitek aurreprestatu duen afin eman ber informazioa an textu guztiak. Bestalde, azpimarratu behar da ze experimentu horretan ez da egiten ulermen-kontrolik xedéz saiatu konprobatzen noráino trasladatu dé informazioa, edo bestela esanda, noráino ulertu diren textuak (ulermen-kontrolak izaten dirá galdera sinpleak non diren konputatzen erantzun zuzenak eta reakzio-denborak). 
Azken artikulu honetan ikusten dugu ze:
Speakers became familiar with the texts, by reading them several times before being recorded, so that they understand the described situation and minimize reading errors (...). [Coupé, Mi Oh, Dediu eta Pellegrino (2019)]
Hortaz, parte hartzaileek ez dute ezer sortu behar (ez dute diskursorik sortu behar) ezta ere ezer ulertu behar, jada ulertua baitute: gauza da zéinek tardatu gehiago edo gutxiago noiz irákurtzen textu jada landu bat. Zentzu horretan, esan ahal da ze experimentua dá foniko hutsa (horrek ez du esan nahi ze faktore sintaktikoek ezin dute izán efektu indirektorik gain emaitza foniko horiek: ikus sarrera hau). [671] [>>>]

Etiketak: ,

asteazkena, urria 02, 2019

Euskararen silaba-abiadura: antzekoa zein japonierarena

Atera berri da (2019) artikulu bat, titulatuá "Different languages, similar encoding efficiency: Comparable information rates across the human communicative niche" eta idatzia ga Coupé, Mi Oh, Dediu eta Pellegrino (zein baitira ber Pellegrino eta ber Coupé zein zeuden an Pellegrinok et al., 2011), non, besteak beste, autoreek estimatu dute zéin den abiadura silabikoa on 17 hizkuntza, zeinen artean, orain bai, aurkitzen dirá katalana eta euskara.

Euren artikuluan, baina, autoreek ez dituzte numerikoki zehazten batezbesteko abiadura silabikoak, nahizta bai eskáiní ondoko grafikoa, nondik har litekén aski ideia argia gain abiadura horiek (SR, edo syllabic rate, zein agértu an ordenatu-ardatza):

Grafiko horretan ikusi ahal dá euskara, ezkerrenera kokatua, laranja kolorez, izanki puntu laranja horiek abiadura silabiko puntualak zein irakurle ezberdinek erákutsi an textu-mota ezberdinak (jaso dira datuak on anitz irakurraldi, ikusten denez), eta hor antzeman ahal dugu nóla puntu laranja horien guztien batezbestekoa izanen litzaké aski antzekoa zeinda japonierarena, zein den verde kolorekoa, bigarren ezkerrenera dagoena (justuki nola, bide batez, guk supósatu hemen).

Izan ere, 2011ko artikuluan, japonieraren batezbesteko silaba-abiadura zén justuki 7,84 silaba segunduko, eta, 2019koan, hortxe inguruan agertzen dirá hala japoniera nola euskara. [670] [>>>]

Etiketak: , ,

astelehena, iraila 30, 2019

Euskara estandarra ere, aski buruazkena eta irakur-denbora erlatiboki altukoa

Sarrera honetan genioen ze:
...pentsatzekoa da ze akaso egon liteke osagai sintaktiko bat arten faktoreak zein ari diren afektatzen irakur-denbora.
zeren, Pellegrinok eta bestek aztertutako 8 hizkuntza horietan, justuki horiek hizkuntzak zek dituzte IR altuenak (edo irakur-denbora baxuenak) zirén burulehenak, eta, bestaldean, hizkuntza buruazkenek ez zituzten izaten IR altuak.

Gero, azken bi sarreretan (ikus hemen eta hemen) antzeman dugu nóla euskararen IRa ez litzaken altua, baizik gehiago, erlatiboki baxua, eta, izanki euskara estandarra aski buruazkena, horrek indartuko luke a hipotesia ezen báda osagai sintaktiko bat artén faktoreak zein ari diren afektatzen irakur-denbora. [668] []

Etiketak: , ,

igandea, iraila 29, 2019

Amuriza: "Gaztelaniarekiko erlazioa frantsesean handitu egingo litzateke, eta ingelesean zer esanik ere ez"

Amuriza-k, an bere "Zazpi ebidentzia birjaiotzarako" (2012), gogoratzen dú 100-75 proportzioa zein atera zitzaion (an "Euskara batuaren bigarren jaiotza", 2010:103) noiz konpáratu silaba-kopuruak an euskarazko elkarrizketa luze bat kin-eta silabak an bere gaztelaniazko itzulpena (autoreak aipatzen zuén silaba-abiadura ere). Eta gauza da ze, segituan, Amuriza-k komentatuko du nolákoa litzaken euskararen proportzio hori respektu inguruko hizkuntzak:
Gaztelaniarekiko erlazioa frantsesean handitu egingo litzateke, eta ingelesean zer esanik ere ez. Susmoa daukat katalana ere gaztelania baino laburrago dela. Hala ere, oro har, gure inguruko hizkuntza garatuen artean ez da aterako gorabehera handiegirik,...[Amuriza, 2012:198-199]
Gaurkoan nahi genuen azpimarratu zé ondo uztartzen diren Amuriza-ren hitz horiek eta  Pellegrinok eta bestek lortutako emaitzak, non justuki inglesak erákutsí informazio-abiadura ondo handiena, eta non, oso gutxigatik izanda ere, frantsesak erakusten duén informazio-abiadura handiagoa zein gaztelaniak (ez dira agertzen datuak respektu katalana edo euskara an artikulua on Pellegrino et al.):

Baldin konsíderatu soilik silaba-kopuruak (edo, gauza bera dena, informazio-densitatea), mantendu eginen dá ber ordenazioa artén inglesa, frantsesa eta gaztelania. [667] [>>>]

Etiketak: , ,

ostirala, iraila 27, 2019

Egon liteké osagai sintaktikoa ere arten faktoreak ze eragitén ki irakur-denborak

Aurretik esan dugunez, Pellegrino et al. (2011) lanean, IR baxuago batek finean adieraziko luké irakur-denbor handiagoa (hizkuntza horretako irakurleek erlatiboki gehiago tardatu dute irakurtzen ber informazioa), eta printzipioz, horrek izanen luké zerikusirik kin silaba-kopurua, silaben konplexutasuna eta silaba-abiadura, zein dirén, hirurak ere, ezaugarri fonikoak eta ez sintaktikoak.

Hala ere, noiz aztértu IR baxuenak, atentzioa deitzen digu nóla:
  • Japonierak dú, distantzia handiz, IR txikiena, gertatzen delarik ze japoniera dá hizkuntza buruazken zurruna (esan nahi baita SOV zurruna eta zurrunki postpositiboa).
  • Alemanakbigarren IR txikiena, eta gertatzen da ze alemana, izanki SVO an perpaus printzipalak, dá nagusiki  SOV an perpaus subordinatuak, halatan ze litzaké partzialki SOV.
  • Txinera litzaké hirugarren IR baxuena, oso gutxigatik bada ere, eta, SVO delarik ere, kokatzen ditú pepaus erlatiboak aurrén euren izen referentziala (RN), hala nola ere genitiboak (GN).
  • Hizkuntza burulehenek (SVO eta prepositiboak), zein baitira beste lauak, dituzté IR altuenak.
Eta ikusita nóla bat datozén irakur-denbora altuenak eta hitz-ordena buruazkenenak (an hizkuntzak zeintan oso diferenteak dirén silaba-kopuru, silaba-konplexitate eta silaba-abiadura), pensatzekoa da ze akaso egon liteke osagai sintaktiko bat artén faktoreak zein ari diren afektatzen irakur-denbora. [665] [>>>

Etiketak: , , , , ,

osteguna, iraila 26, 2019

Burúz silabak, silaba-kopuruak, soinuak...

Genioen hemen ze:
Bestalde, hitzak argiki ezberdindu beharko lirake euren artean, halatan ze, kontuan izanda ze soilik egoten dira vokal eta konsonante gutxi batzuk, hitz guztiak ezingo dira izan monosilabikoak salbú noiz erabili elementu tonalak zeinen konplexutasuna ezin dugun baloratu. Hortik segitzen da ze, zenbat eta vokal eta konsonante gehiago izan hizkuntza batek, hainbat laburrago izan ahalko dira bere hitzak (aparte utzita, esan bezala, hizkuntza tonalak), nahizta bestalde, zenbat eta vokal eta konsonante gehiago izan, egonen da tendentzia ki ager daitezen vokal, konsonante eta hitz antzekoagoak (gutxiago diferentziagarriak) edota esateko konplexuagoak, zeinen argitasuna eta zailtasuna ezin dugun baloratu.
Hortaz, ikus daigun, Pellegrino et al.-ek aztertutako hizkuntza horietan, zénbat silaba ezberdin egin litezken (2011):

Konprobatzen dugu ze, bitárten inglesez egin litezkén 7.931 silaba diferente, japonieraz sor litezké 416, zeinekin, bistan denez, soilik eratu ahalko dirá 416 hitz monosilabiko, gehienez ere (txineran, ez da konsideratu silaben aspektu tonala). Autoreek, gainera, egiten dute balorazio bát on konplexitate silabikoa, oinarritua an zénbat konsonante agertzen dirén an silabak (#const/syl).

Hor ez dira baloratzen, adibidez, soinuak eurak, euren diferentziagarritasuna, euren hurbiltasuna, edota euren zailtasuna edota gogortasuna (adibidez, r bikotza dá gogorragoa zein r samurra). Japonieraz, adibidez, existitzen dirá 5 vokal, zein diren justuki berberak zein dirén an gaztelania edo euskara, oso argiki diferentziagarriak eta, esango genuke, ondo ahobetegarriak (silabak dirá tipikoki CV edo V). Ikus hemen:
The Japanese language has only 5 vowels: a, i, u, e, o. They are terse vowels, pronounced clearly and sharply. [Namiko Abe, 2017]
Eta hor egon daitezké faktore foniko-expresiboak zeinen efektua (adibidez noiz esán biraoak) ezin dugun baloratu. [664] [>>>]

Etiketak: , , , ,

asteartea, iraila 24, 2019

Baina..., hipotesi (loose) hori ez da hipotesi bat zeren hasieratik ere bádakigu ze bete beharko da

Behin baztertua (ikus azken sarrera) a hipotesia ezen hizkuntza guztiek duté ber IR, zein den neurri bát oinarritua an erlazioa artén irakur-denbora interlinguistikoak:
Our hypothesis of equal IR among languages is thus invalidated, ... [Pellegrino et al., Language, 2011:547]
eta behin, hortaz, konprobaturik ze bádira hizkuntzen artean diferentzia ondo nabarmenak an irakur-denborak:
IRL [L hizkuntzaren Information Rate] exhibits a greater than 30% degree of variation between Japanese (0.74) and English (1.08), invalidating the first hypothesis of a strict cross-language equality of rates of information. [Pellegrino et al., Language, 2011:551]
autoreek konsideratuko beharko duté (one has to consider), bigarren hipotesi bat, ahulagoa (loose), zein dén hau:
Consequently, one has to consider the alternative loose hypothesis that IRL varies within a range of values that guarantee efficient communication, fast enough to convey useful information and slow enough to limit the communication cost (in its articulatory, perceptual, and cognitive dimensions). [Pellegrino et al., Language, 2011:547]
Baina, gure begietara, baldintza horiek ez dute bermatzen komunikazio efizientea, baizik soilik ahalbídetzen ze hikuntza existitu daitezen, esan nahi baita da ze, derrigor, munduko hizkuntza guztiek funtzionatu beharko duté aski arin ki emán informazio lagungarri-interesgarriak, eta aski astiro ki ahalbidetu kodifikazio eta deskodifikazio informatiboa. Gauza da ze, bi muga horien artean, báda mundu bat posibilitate, non ez den zértan egon efizientzia berdina (adibidez, sintaktikoa).

Izan ere, muga horiek soilik dirá existentzia-baldintza minimoak ki hizkuntzak, an zentzua ze ez balira beteko, hizkuntza batek ez luke zentzurik: ez badoa aski arin ki eraman informazio erabilgarria (convey useful information), edo ez badoa aski astiro ki izan kodifikagarria eta deskodifikagarria (limit the communication cost [in its articulatory, perceptual, and cognitive dimensions]), ez dirudi hizkuntzarik izango genukenik, ez bailitzaké minimoki funtzionala.

Beraz, gure aburuz, ustezko hipotesi hori ez da hipotesi bat, zeren hasieratik ere bádakigu ze, hizkuntza existitzen bada, bete beharko da. [662] [>>>]

Etiketak: , , , ,

astelehena, iraila 23, 2019

Pellegrino et al. (2011): "Our hypothesis of equal IR [finean, irakur-denbora] among languages is thus invalidated..."

Jarraituz kin artikulua on Pellegrino et al zein gatozen komentatzen: han, autoreek nahi izan dúte aztertu (kontrastatu) ea berdintzat jo litekén hizkuntzan ezberdinen abiadura ki trasládatú informazioa, edo, aitzitik, ea diferentzia interlinguistiko nabarmenik egon ahal den.

Xede horrekin, definitu duté neurri bat, deitzén Information Rate [IR], zein dén oinarritzen an irakur-denbora diferentzialak, eta zein kalkulatu dutén an zazpi hizkuntza (respektu zortzigarren bat: vietnamera). Eta emaitzak ikusita, hauxe da autore horien ondorioa buruzki berdintasun interlinguistikoa an informazio-abiadura hori (IR):  
More precisely, Japanese contrasts with the six other languages (pMCMC < 0.001 for all pairs), and English significantly contrasts with Japanese, German, Mandarin, and Spanish (pMCMC < 0.01) and with Italian and French (pMCMC < 0.05). Our hypothesis of equal IR among languages is thus invalidated, even if five of the seven languages cluster together (GE, MA, IT, SP, and FR). [Pellegrino et al., Language, 2011:547]
Esan nahi baita ze, ikerketa horren arabera, inglesean erabiliko litzaké esanguratsuki irakur-denbora gutxiago zein beste sei hizkuntzetan, japonieran erabiliko litzaké esanguratsuki irakur-denbora gutxiago zein beste sei hizkuntzetan, eta beste bost hizkuntzek (GE, MA, IT, SP, and FR) ez luketé erakutsiko diferentzia nabarmenik an euren irakur-denborak.  
Beraz, bádirudi ze, Pellegrinok eta bestek esaten digutenez, invalidatua geldituko litzake hori hipotesia ezen hizkuntza guztiek duté ber informazio-tasa (IR), edo, akaso zehazkiago, ber irakur-denbora. [661] [>>>]

Etiketak: , ,

igandea, iraila 22, 2019

Ezin liteke esan ze silaba-kopuruak eta silaba-abiadurak eragiten duté efektu bateratu interlinguistikoki berdina

Aurreko sarreretan ikusi dugu nóla hizkuntza ezberdinek erakusten dituztén silaba-densitate eta silaba-abiadura ezberdinak, eta bádela tendentzia orokor bat aldé konpensazioa, nahiz orobat existitú kasu interlinguistiko interesgarriak non ez dén gertatzen halako konpensaziorik: zehazki, alemanak izanen luké bai silaba gehiago eta baita silaba-abiadura txikiagoa zein inglesa.

Harago, Pellegrinok eta bestek bilduko dituzté bi efektu horiek (densitatea eta abiadura) an neurri bakar osoago bat, zeini deitukó Information Rate (IR):
Consequently, it is worth examining the overall quantity of information conveyed by each language per unit of time (and not per syllable). This so-called INFORMATION RATE (IR) encompasses both the strategy of linguistic encoding and the speech settings for each language L. [Pellegrino et al., Language, 2011:547]
Neurri bateratu horretan, finean, autoreek neurtuko dituzté denborak zein irakurleek erábilí an textu bakoitza; kalkúlatuz, ondoren, denbora horien proportzioak respektu batezbesteko irakur-denbora on ber textua an vietnamera (hartua nola referentzia); gero konputatukó irakurle bakoitzaren batezbesteko proportzioa an bere textu guztiak; eta azkenik, hizkuntza bakoitzaren irakurle guztien batezbesteko proportzioa, zein baita euren neurria: Information Rate (IR):

Ideia argiago bat izan dezagun buruz nóndik doan informazio-tasa hori (koadro gorrian), har dezagun inglesa, zeinen 0,91 densitate horrek adierazten digu ze, noiz vietnamerak egín 91 silaba, inglesak egin dituén 100 afin eman ber informazioa, eta hortaz inglesa izanen litzaké (100/91 = 170,98 = 1,0989) %9,89 gutxiago densoa zein vietnamera, erabilíz %9,89 silaba gehiago zein vietnamiera. Baina, bestalde, inglesak ematen ditú bere silabak arinago, hain zuzen %18,58 arinago zein vietnamerak (6,19/5,22 = 1,1858), halatan ze bi efektu horiek doáz an kontrako norabidea.

Justuki efektu bateratu hori neurtzeko kalkultuko diguté Pellegrinok eta bestek euren IR (Information Rate), zein inglesean ateratzen zaién 1'08, eta zeinen interpretazioa litzaké ze, finean, inglesak dú trasladatzen informazioa %8 arinago zein vietnamerak. Inglesaren %8 arinago horri gehitu beharko litzaioke ze frantsesa izanen litzaké %1 gutxiago arina zein vietnamera, gaztelania %2 gutxiago arina, italiera %4 gutxiago arina, txinera, %6 gutxiago arina, alemana %10 gutxiago arina, eta japoniera %26 gutxiago arina, beti ere respektu vietnamera.

Nola dioten Pellegrinok eta bestek:
IRL [L hizkuntzaren Information Rate] exhibits a greater than 30% degree of variation between Japanese (0.74) and English (1.08), invalidating the first hypothesis of a strict cross-language equality of rates of information. [Pellegrino et al., Language, 2011:551]
Emaitza horien argitara, ezin esan ze informazio-densitateak eta silaba-abiadurak eragiten duté efektu bateratu interlinguistikoki berdina. [660] [>>>]

Etiketak: ,

larunbata, iraila 21, 2019

Faktore fonikoak ez dira derrigor konpensatu behar

Atzokoan genioen ze, nahiz hizkuntzen abiadura silabiko diferentzialek oro har joko dute aldé konpensatu euren informazio-densitate diferenteak (gogora ze informazio-densitatea egonen litzaké inversoki erlazionatua kin silaba-kopuru handiago edo txikiagoak zein behar diren interlinguistikoki afin eman ber mezua), bádira kasu partikularrak non, dirudienez, tendentzia konpensatzaile foniko hori ez den betetzen.

Eta ematen genuén adibide bat zein iruditzen zaigun ondo interesgarria zatio erlazioa artén bi hizkuntza inplikatuak: inglesa eta alemana; non ez dirudien ze alemanaren silaba-abiadurak jotzen duenik ki konpensatu bere informazio-densitate baxuagoa. Izan ere, eta beti jarráiki ikerketa ga Pellegrino et al., alemanaren batezbesteko abiadura silabikoa izanen litzaké bigarren txikiena (aparte utzitá vietnamera), nahiz, grafikoan ikusi ahal dugunez, abiadura hori ez litzakén esanguratsuki txikiagoa respektu inglesa:


Jakina, ez ahaztu ze Pellegrino et al. dá ikerketa bat eginá azpi baldintza ondo konkretuak (adibidez eta oso nabarmenki, textuak irakurriak izatea), halan ze emaitza horiek konplementatu beharko liraké kin ikerketa estatistiko gehiago, baina, hala ere, ilustratzen digu nóla faktore fonikoak ez diren derrigor konpensatu behar. [659] [>>>]

Etiketak: ,

ostirala, iraila 20, 2019

Tendentzia sendoa aldé konpensazio fonikoa, baina ez artén alemana eta inglesa

Galdetzen genuen an azken sarrera ea, interlinguistikoki eta orohar, konpensatzen ote zirén silaba-kopuruak afin eman ber mezua (inversoki erlazionatua kin information density) eta silaba-abiadura diferenteak (syllabic rate neurtua an #syl/s). Zeren jarraituz kin ikerketa hen Pellegrino et al., publikatua an Language (2011), non autoreak saiatzen dirén erantzuten ki galdera hori arartéz ariketa irakurri bat, gauza da ze, nola genioén atzokoan, báda joera sendo bat aldé konpensazio foniko hori, zein ondo islatzen dén an korrelazio negatibo altu bat artén informazio-densitatea eta silaba-abiadura:
Information rate is shown to result from a density/rate trade-off illustrated by a very strong negative correlation between IDL [L hizkuntzaren informazio-densitatea] and SRL [L hizkuntzaren silaba-abiadura]. (Pellegrino et al., 2011:551)
Baina galdera dá ea tendentzia orokor eta sendo hori noráino ailegatzen den. Izan ere,
  • alde batetik, tendentzia orokor horrek ez du inplikatzen ze ez diren existitzen konparazio interlinguistiko partikular interesgarriak non tendentzia foniko konpentsatzaile hori ez den betetzen
  • eta bestetik, abiaduraren konpensazio fonikoa izan ahal dá, terminu erlatiboetan, osoa, partziala, edo gainezkakoa (izan ere, silaba-abiadura handiagoa gainezkatu ahal du a efektua on silaba-kopuru handiagoa respektu beste hizkuntza bat).
Har dezagun kasua on alemana respektu inglesa, eta konpara ditzagun euren informazio-densitateak (ID) eta euren silaba-abiadurak (#syl/sec):

Zér dugu hor? ba ze, nahiz tendentzia orokorra sendoki bilátu konpensazioa, konpensazio hori ez litzake gertatukó arten alemana eta inglesa, zeren alemanak erakutsiko luké informazio-densitate baxuagoa zein inglesa, esan nahi baita silaba gehiago ki emán informazio bera (0.79 vs 0.91), eta baita silaba-abiadura txikiagoa ere (5.97 vs 6.19), halako moduan ze bi aldagai horiek joango liraké an ber direkzioa, biak ere eráginez informazioa astiroago transmitut dadin. [658] [>>>]

Etiketak: ,