• Aucun résultat trouvé

In de literatuurstudie hebben we aannemelijk gemaakt dat de verschillende verklaringen voor het verschil tussen vertaalde en niet-vertaalde teksten op het vlak van toegenomen explicietheid bestudeerd kunnen worden aan de hand van een multifactoriële analyse.

We zullen hierbij voornamelijk focussen op het effect van vertaalstatus (vertaald vs. niet-vertaald) als een van de mogelijk bepalende factoren voor de keuze voor de expliciete of de impliciete constructie. Door niet alleen rekening te houden met vertaalstatus als hoofdeffect, maar ook met verschillende interacties met vertaalstatus, kan onderzocht worden in welke types contexten de keuze van de vertaler precies verschilt van die van de niet-vertaler. Voordat we een gedetailleerde beschrijving geven van de resultaten van de mixed-effects logistische regressie op de volledige dataset met daarin zowel vertaalde als niet-vertaalde data, gaan we na of de distributie van expliciete en impliciete constructies significant verschilt naargelang de vertaalstatus (Tabel 45).

Expliciet Impliciet Totaal

Niet-vertaald 323 (43,41%) 421 (56,59%) 744

Vertaald 517 (52,23%) 471 (47,78%) 986

Tabel 45 Distributie van de expliciete en impliciete constructies in de volledige dataset voor de factor vertaalstatus (om-alternantie)

Zoals al beschreven in §3.3.1 bestaat de volledige dataset uit 1.730 relevante BIZ’s met facultatief om waarvan 744 BIZ’s uit niet-vertaalde teksten en 986 BIZ’s uit teksten die vertaald zijn vanuit het Engels of het Frans naar het Nederlands. In Figuur 40 hieronder wordt de distributie van de volledige dataset gevisualiseerd.

Figuur 40 Distributie van expliciete en impliciete constructies in de volledige dataset (vertaalde en niet-vertaalde data) (om-alternantie)

Een chikwadraattoets toont aan dat het verschil in distributie van de impliciete en de expliciete constructies tussen de twee variëteiten significant is (χ²= 12.984, df=1, p<.001).

Vertalers gebruiken relatief gezien significant vaker de expliciete constructie dan niet-vertalers. In niet-vertaald Nederlands wordt in 56,59% van de gevallen de complementeerder weggelaten en in vertaald Nederlands gaat het om 47,78%. We kunnen dus stellen dat er in de om-alternantie effectief sprake is van toegenomen explicietheid in vertalingen in vergelijking met niet-vertaalde teksten. De grotere voorkeur voor de expliciete constructie in vertaalde teksten is een eerste indicatie voor de eerste versie van de vertaalinherente complexiteitshypothese (vertalers reduceren processing effort door gebruik te maken van een expliciete grensmarkeerder) en/of voor de communicatieve risicohypothese (vertalers gebruiken de expliciete variant met als doel het risico op miscommunicatie te verminderen). We laten de mogelijke invloed van de brontaal hier nog even onbesproken: die komt aan bod in §4.2.3. Het is dus duidelijk dat vertalers er in vergelijking met niet-vertalers – in het geval van de om-alternantie tenminste – vaker

voor kiezen om de syntactische structuur van de zin te markeren. Aan de hand van de relatieve frequenties alleen kunnen we echter niet onderzoeken welke factoren aanleiding geven tot de grotere voorkeur van vertalers voor de expliciete constructie. We bekijken daarom meer in detail de resultaten van de mixed-effects logistische regressie toegepast op de volledige dataset.

Voor de modelselectie wordt op dezelfde manier te werk gegaan als in de voorgaande analyse met alleen niet-vertaald Nederlands. Factoren worden een voor een toegevoegd aan het model en aan de hand van de AIC-score wordt geoordeeld over het behoud ervan.

Aan het finale model worden uiteindelijk interacties toegevoegd voor alle overblijvende – en dus significante – factoren met vertaalstatus. We behouden enkel de significante interacties. Ter controle werden ook interacties toegevoegd met vertaalstatus en de potentieel relevante factoren die in het model geen significant hoofdeffect hebben. Geen enkele zulke interactie bleek significant te zijn.

Het uiteindelijke regressiemodel, met een AIC-score van 1824,8, bevat slechts zes hoofdeffecten, twee interacties met vertaalstatus en twee random factoren:

Explicietheid ~ HoofdBIZ + Register * Vertaalstatus + Adjacentie * Vertaalstatus + Nevenschikking + Expletiefhet + SmatAgens + (1| Lemma) + (1| File)

Het sample is meer dan voldoende groot voor het aantal regressoren dat in het model is opgenomen (n = 13). Volgens de vuistregel mogen er namelijk tot 41 regressoren worden opgenomen. In Tabel 46 hieronder wordt een schematisch overzicht gegeven van het

HoofdBIZVz -0.32802 0.40382 -0.812 0.41663 Register (ref-waarde: Journalistiek)

RegisterFictie -4.47235 0.85561 -5.227 1.72E-07 ***

RegisterInstructief 0.19356 0.53147 0.364 0.71571 RegisterJuridisch -1.75355 0.51297 -3.418 0.00063 ***

RegisterPolitiek -1.07036 0.43410 -2.466 0.01367 * RegisterToerist -1.13196 0.57529 -1.968 0.04911 * Expletiefhet (ref.-waarde: ja)

Expletiefhetnee -0.66503 0.28867 -2.304 0.02123 * Nevenschikking (ref.-waarde: ja)

Nevenschikkingnee 1.44495 0.23675 6.103 1.04E-09 ***

SmatAgens (ref.-waarde: ja)

SmatAgensnee 0.57896 0.26573 2.179 0.02935 * Adjacentie (ref.-waarde: ja)

Adjacentienee 1.08287 0.35424 3.057 0.00224 **

Vertaalstatus (ref.-waarde: niet-vertaald)

VertaalstatusVertaald -0.04357 0.40892 -0.106 0.91520 Interacties

Fictie (*vertaald) Toerist (*vertaald)

AdjacentieNee(*vertaald)

3.19063 1.99060 -1.10322

1.04304 0.73437 0.45817

3.059 2.711 -2.408

0.00222 0.00672 0.01604

**

**

* Tabel 46 Modelparameters van de significante factoren van de regressieanalyse van de volledige

dataset (om-alternantie)

Opnieuw is de C-waarde heel goed (0.93): in ca. 93% van de gevallen kan het model een correcte voorspelling maken over de keuze van de taalgebruiker. Er is geen sprake van overfitting na de bootstrapvalidatie (met 500 bootstrapherhalingen). De C-index is na deze bootstrapvalidatie nog steeds 0.93. Uit de vif-test blijkt dat er geen multicollineariteit is.

In alle gevallen, behalve bij de factoren die in interactie voorkomen, zijn de waarden niet hoger dan 2. We berekenen ter controle en in navolging van Speelman (2014) de vif-waarden van een model met dezelfde factoren maar zonder de interactie-effecten. In dat model zijn alle vif-waarden kleiner dan 1,4, waardoor we kunnen besluiten dat er in het uiteindelijke model geen problematische variabelen aanwezig zijn. We bespreken de verschillende effecten van de significante fixed factoren en interacties aan de hand van de verschillende effectplots in Figuur 41 hieronder. Daarbij wordt steeds de geschatte kans op de expliciete constructie op de y-as weergegeven (waarde tussen 0 en 1, waarbij 0,5 duidt op een even grote geschatte kans op de expliciete en de impliciete constructie), voor elk onderzocht level van de onafhankelijke variabele in kwestie op de x-as.

Figuur 41 Effectplots voor de verschillende significante factoren van de regressieanalyse van de volledige dataset (om-alternantie)

Op basis van een vergelijking met de bevindingen over het niet-vertaalde deel van de dataset kunnen we de significante factoren uit de bovenstaande analyse in drie categorieën opdelen. De eerste categorie is die van de factoren die géén significant effect hebben in de analyse waarin enkel de niet-vertaalde data werden opgenomen. Ten tweede is er de categorie van factoren die een gelijkaardig effect hebben als in de regressieanalyse van alleen de niet-vertaalde dataset. Die factoren spelen dus een vergelijkbaar grote rol in de keuze van vertalers en niet-vertalers. Als derde categorie onderscheiden we de factoren die interageren met de factor vertaalstatus en die dus wijzen op een verschillend effect in de vertaalde vs. de niet-vertaalde teksten in bepaalde contexten.

Tot de eerste categorie behoort alleen de variabele aanwezigheid van expletief het.

Hoewel niet significant in de regressieanalyse met alleen niet-vertaalde data, blijkt uit de analyse over de volledige dataset dat de aanwezigheid van expletief het in de matrixzin een belangrijke rol speelt in de keuze voor de BIZ met of zonder om. Aan de hand van de effectplot stellen we vast dat de kans op de expliciete constructie groter is wanneer de BIZ wordt aangekondigd door expletief het. Zoals al vermeld, werd de factor ook bestudeerd door Bouma (2016), die als hypothese formuleerde dat de kans op een expliciete constructie stijgt wanneer expletief het aanwezig is. Zowel in zijn studie als in de huidige studie wordt die hypothese bevestigd.38 We kunnen ons afvragen waarom de factor als een van de significante factoren naar voren komt in de volledige dataset en niet in de voorgaande analyse waarin alleen niet-vertaalde data opgenomen werden.

Aangezien de factor niet optreedt in een significante interactie met vertaalstatus, kan eigenlijk worden aangenomen dat er weinig verschil in distributie is naargelang de vertaalstatus. We bekijken hiervoor de distributie van de factor voor zowel de niet-vertaalde als de niet-vertaalde teksten. Het aantal voorkomens van expletief het is in beide variëteiten ongeveer even groot en ook de distributie van de verschillende factorlevels is in grote mate dezelfde, zoals Tabel 47 en Tabel 48 laten zien.

Niet-vertaald Expliciet Impliciet

Expletief het 77 (60,63%) 50 (39,37%)

Geen expletief het 264 (41,57%) 371 (58,43%)

Tabel 47 Distributie van expliciete en impliciete constructies volgens de aanwezigheid van expletief het in de niet-vertaalde dataset (om-alternantie)

Vertaald Expliciet Impliciet

Expletief het 89 (60,14%) 59 (39,86%)

Geen expletief het 426 (50,84%) 412 (49,16%)

Tabel 48 Distributie van expliciete en impliciete constructies volgens de aanwezigheid van expletief het in de vertaalde dataset (om-alternantie)

38 In dit proefschrift gaan we niet dieper in op de vraag of die verhoogde kans effectief te maken heeft met complexiteit waarbij de aanwezigheid van expletief het de complexiteit van de zin verhoogt.

Uit de vergelijking van Tabel 47 en Tabel 48 blijkt dat het grootste verschil tussen de vertaalde en de niet-vertaalde dataset waar te nemen is als er geen expletief het aanwezig is. In de niet-vertaalde dataset wordt in slechts 41,57% van die gevallen een expliciete constructie gebruikt, in de vertaalde dataset gaat het om ca. 51% van de gevallen. Dat verschil is hoogst significant (χ² = 12.073, df = 1, p-waarde = 0.0005). De factor is vermoedelijk niet significant in de niet-vertaalde dataset door het verschil in grootte van beide datasets. Belangrijk voor de huidige studie is dat de vertaler en de niet-vertaler volgens de resultaten van de regressieanalyse ongeveer op dezelfde manier beïnvloed worden door de factor, aangezien er geen significante interactie optreedt tussen expletief het en vertaalstatus.

De tweede categorie zijn de factoren die een gelijkaardige rol spelen in de vertaalde dataset en de niet-vertaalde dataset. Het gaat hier om de volgende drie factoren: formele type van het hoofd van de BIZ, nevenschikking en agentiviteit van het geïmpliceerde subject in de matrixzin. Zoals beschreven in §4.2.1 hierboven, hebben alle drie die factoren een significant effect op de keuze van de niet-vertaler. In de regressieanalyse waarin zowel vertaalde als niet-vertaalde data werden opgenomen blijven de drie factoren overeind. Voor alle significante factoren in de regressieanalyse van de volledige dataset werd in het model ook een interactie toegevoegd met vertaalstatus. Op die manier kan getest worden of er andere voorkeuren zijn voor de expliciete en/of de impliciete constructie naargelang de vertaalstatus van de tekst. Bij de drie factoren in kwestie bleek de interactie met vertaalstatus niet significant te zijn. Hieruit leiden we af dat de drie factoren niet alleen een belangrijk effect hebben op de keuze van zowel de vertaler als de niet-vertaler maar ook dat de effectrichting en -grootte zeer gelijkaardig zijn in de vertaalde en de niet-vertaalde dataset. We gaan hier niet verder meer in op die drie factoren, maar verwijzen terug naar §4.2.1 voor een gedetailleerde bespreking van de effecten ervan.

In het verdere verloop van de paragraaf focussen we op de twee factoren die wel een significant interactie-effect vertonen met de factor vertaalstatus. De eerste significante interactie is die tussen vertaalstatus en adjacentie. Om dit verschil meer in detail te bekijken voegen we hieronder de distributietabellen van de factor toe voor de niet-vertaalde dataset (Tabel 49) en de niet-vertaalde dataset (Tabel 50).

Niet-vertaald Expliciet Impliciet

Adjacent 271 (41,00%) 390 (59,00%)

Niet-adjacent 52 (62,65%) 31 (37,35%)

Tabel 49 Distributie van expliciete en impliciete constructies volgens adjacentie in de niet-vertaalde dataset (om-alternantie)

Vertaald Expliciet Impliciet

Adjacent 459 (52,22%) 420 (47,78%)

Niet-adjacent 56 (52,34%) 51 (47,66%)

Tabel 50 Distributie van expliciete en impliciete constructies volgens adjacentie in de vertaalde dataset (om-alternantie)