Para analisar o corpus, foram criadas categorias com base em dois totais distintos: o total de palavras e o total de pseudofrases.
Já referimos, no ponto anterior, o que se considerava como “palavra” (sequência de caracteres entre espaços em branco ou entre um espaço e final de intervenção).
No que se refere a pseudofrase, esta foi considerada como cada sequência de palavras ou smileys ou números que fosse iniciada por qualquer interveniente e terminada com um sinal de pontuação de final de frase, excluindo as reticências (ponto final, de exclamação ou de interrogação) ou sem sinal de pontuação desde que fosse seguido de uma outra intervenção. As reticências foram excluídas dado que indicavam, geralmente, suspensão no meio de uma frase. Pode ser iniciada por maiúscula ou não.
Uma pseudofrase distingue-se de uma intervenção (tomada de vez por um utilizador), na medida em que esta poderá conter uma ou mais pseudofrases, desde que separadas por ponto final, de interrogação ou de exclamação. Cada pseudofrase poderá ser constituída apenas por um número, por um smiley ou por um endereço de correio electrónico. No caso de ser constituída exclusivamente por um smiley, não se considera que haja falta de ponto final.
Quando uma pseudofrase veiculava duas ideias, não sendo, contudo, separada por nenhum sinal de pontuação final, considerou-se que apenas existia uma única pseudofrase.
Eis, então, alguns exemplos de pseudofrase: i) “tens msn”;
ii) “:)”; iii) “tu”; iv) “15”; v) “id???”;
O número total de palavras foi analisado em 34 categorias e foram criadas 7 categorias com vista à análise das pseudofrases.56 Apenas foram excluídos deste estudo os números, os nicknames e endereços de correio electrónico que surgiram (visto que eram em número relativamente reduzido e não pareceu que pudessem ser relevantes para o nosso estudo), embora tivessem sido contabilizados no número total de palavras e de pseudofrases.
Como existem várias palavras que podem ser classificadas em mais do que uma categoria, o número de ocorrências não é equivalente ao número total de palavras fornecido. Por outro lado, sempre que, numa mesma palavra, ocorreram dois exemplos de um mesmo fenómeno, este só foi contabilizado uma vez, na medida em que se considerou importante verificar se um dado utilizador usava um determinado fenómeno numa palavra, não sendo profícuo contar todas as sílabas em que esse processo se verificava.
3.1 Categorias
Foram criadas determinadas categorias para organizar/ classificar os desvios encontrados nos programas de chat, as quais se inspiraram na tipologia de erros de Girolami-Boulinier (capítulo II), nas características da ETS (descritas no capítulo III), assim como noutras características encontradas no corpus que nos pareceram relevantes para o nosso estudo (por poderem evidenciar conhecimentos intuitivos). Surgem também categorias em que se respeita a norma (nomeadamente “palavras sem alteração” e “presença de letra maiúscula em início de pseudofrase”) com o intuito de comparar o cumprimento da norma com o seu incumprimento.
56 Repetiu-se uma das categorias (uso de letra maiúscula no início de pseudofrase) no total de palavras do corpus e de
pseudofrases, uma vez que se considerou que estas palavras indicavam, por um lado, um desvio a uma norma ortográfica e, por outro, a uma convenção da escrita.
As categorias vão ser apresentadas a seguir:
Ausência de letra maiúscula – nesta categoria, estão contidos todos os nomes próprios que não possuem letra maiúscula. Nela se incluem nomes de pessoas e lugares. Quando um nome próprio inicia uma frase, este é colocado nesta categoria e também na categoria “ausência de letra maiúscula em início de pseudofrase”.
Ex.: “coimbra” (Coimbra); “lx” (Lisboa); “daniela” (Daniela); “funchal” (Funchal); “sintra” (Sintra); “madeira” (Madeira).
Maiúsculas – inclui o emprego de letra maiúscula não convencionada em posição inicial (não sendo nome próprio nem em início de pseudofrase), medial ou final de palavra. Pode incidir, inclusivamente, em toda a palavra ou até expressão.
Ex.: “HÁS-de” (hás-de); “lÁ” (lá); “MULHERES” (mulheres); “Noite” (noite).
Queda de Ataque – considera-se queda de Ataque a ausência total de Ataque em qualquer sílaba. A designação “Ataque” inclui Ataques simples (constituídos por uma só consoante) e ramificados (constituídos por duas consoantes). O Ataque vazio não foi alvo de análise. Os casos em que existe uma semivogal que faz parte do Ataque (segundo Andrade e Viana57, 1994: 37) não foram incluídos nesta categoria.
Ex.: “kes” (queres); “kidu” (querido); “kida” (querida)
57 “quando temos GV, a V [vogal] ocupa uma posição do esqueleto associada ao Núcleo e o G [glide] está associado a uma
Queda de parte de Ataque ramificado – consideraram-se, nesta categoria, os Ataques constituídos por duas consoantes. Estão incluídas aqui todas as palavras que apresentam uma queda da primeira ou da segunda consoante, mas não das duas simultaneamente.
Ex.: “tc” (teclas); “ddtc” (donde teclas); “dxtit” (distrito); “bgd” (obrigado)
Queda de Rima completa – incluem-se nesta categoria as palavras em que há uma queda completa da Rima (ramificada ou não ramificada) de uma ou mais sílabas. As palavras em que se verificava a queda de Rima completa em mais de uma sílaba contaram apenas como uma ocorrência.
Ex.: “n” (não); “td” (tudo); “ctg” (contigo); “idd” (idade); “dd” (donde); “td” (tudo); “d” (de); “k” (que).
Queda de Núcleo apenas – nesta categoria, estão inseridas as palavras em que há uma queda completa do Núcleo de uma sílaba (ramificado ou simples), apesar de se manter a Coda da mesma (ainda que seja a propriedade “nasalidade” numa vogal ou ditongo nasal58).
Ex.: “bm” (bem); “tclr” (teclar); “tcls” (teclas); “pds” (podes); “dsclp” (desculpa); “dxtit” (distrito).
Queda de parte do Núcleo – inserem-se aqui as palavras em que, numa dada sílaba, cai parte de um núcleo ramificado, geralmente a glide.
Ex.: “o” (ou); “na” (não); “to” (estou)
Queda de Coda apenas – nesta categoria, estão incluídas as palavras que apresentam uma supressão, não de toda a Rima, mas apenas de um dos seus constituintes – a Coda (ainda que esta seja constituída pela propriedade “nasalidade”).
Ex.: “be” (bem); “memo” (mesmo); “poke” (porque); “xi” (sim); “goto” (gosto).
Queda de sílaba – inclui as palavras em que se verifica uma queda total de uma das sílabas. Ex.: “tá” (está); “nina” (menina); “bgd” (obrigada); “dxc” (desculpa).
Falta de diacrítico – inserem-se nesta categoria todas as palavras em que ocorre uma ausência de um acento (grave, agudo ou circunflexo), de uma marca de nasalidade (til) ou de uma cedilha. Estão aqui incluídas quer as palavras que necessitam do acento para se diferenciarem de outras (palavras homógrafas), quer aquelas em que tal não acontece. De acordo com Girolami-Boulinier (1984: 173), os acentos que permitem esta diferenciação são os diacríticos, sendo os erros de leitura, no que se refere à acentuação, os que acontecem quando a supressão do acento gráfico faz alterar a pronúncia (Girolami-Boulinier: 1984: 174)59.
Ex.: “ola” (olá); “nao” (não); “esta” (está); “tambem” (também); “acores” (Açores)
Acrescento de diacrítico – nesta categoria, estão presentes as palavras em que é acrescentado um acento sem ser pressuposto ou violando as regras de acentuação, ou em que uma cedilha é acrescentada, sem que haja necessidade disso. Também se incluíram os casos em que um grafema podia ter a função de um diacrítico (o caso do “m” usado como marca de nasalidade). Ex.: “ói” (oi); “porquê” (porque); “voçê” (você); “taum” (então)
59 Não foi nosso objectivo fazer corresponder a categoria “falta de diacrítico” exactamente aos erros de leitura da tipologia de
Girolami-Boulinier, nomeadamente por termos incluído palavras que, na tipologia desta autora, seriam erros de identificação lexical, como “esta” para “está” (cf. Girolami-Boulinier, 1984: 129 e Pinto, 1998: 169 em 2.4, capítulo II)
Troca de acento – fazem parte desta categoria as palavras em que se verifica uma troca de acento.60
Ex. á (à)
Escrita fonética – foram incluídas nesta categoria as palavras que apresentavam uma grafia distinta da convencional pela alteração de grafemas, numa tentativa de imitação dos sons produzidos na palavra. Desta categoria se excluem palavras em que, apesar de ocorrer uma troca de grafema, a letra que se altera não corresponde ao som da leitura da palavra naquele contexto linguístico (ex.: xantarem – Santarém). Equivalem aos erros de uso da classificação de Girolami- -Boulinier (1984: 129-130), que são os que afectam a forma gráfica da palavra sem afectar a sua forma auditiva.
Ex.: “vocêx” (vocês); “todox” (todos); “xuva” (chuva); “i” (e); “focem” (fossem); “cunhecer” (conhecer); “kem” (quem); “aki” (aqui); “coizas” (coisas); “sertas” (certas).
Escrita fonética com intervenção da forma visual – incluem-se nesta categoria as palavras em que se verifica uma troca de grafema que se considera ser por motivos fonéticos, uma vez que aquele grafema poderia representar aquele som, caso o contexto linguístico não interferisse. Estamos aqui perante o caso de alofones contextuais, em que, para o locutor, a forma visual prevalece sobre o som efectivamente produzido.
Ex.: “lx” (Lisboa); “mxm” (mesmo)
60 O exemplo dado insere-se na categoria “incertezas” da tipologia apresentada no ponto 2.4 do capítulo II (Girolami-Boulinier,
Escrita fonética 2 – nesta categoria, estão inseridas as palavras cuja grafia (distinta da convencional) altera a sua realização fonética. No entanto, considera-se que, para o sujeito que as produziu, essa distinção possa não ser bem clara.61
Ex. “esquese” (esquece); “iso” (isso)
Acrescento de vogais ou de consoantes – considera-se “acrescento de vogais ou de consoantes” os casos em que há uma repetição de letras, com o intuito de as enfatizar. Nesta categoria se incluem onomatopeias e outras palavras inseridas na categoria “compensação dos elementos paralinguísticos”.
Ex.: “olaa”; “oiii”; “zzzzzzz”; “ahhh”; “LOOOOOOOOOOOOOL”; “oixxxxxx”; “ohhh”; “bahhhh”; “simm”; “grrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr”; “buuuuuuuuu”.
Troca de grafema – considera-se troca de grafema a escrita de uma palavra com uma letra não convencionada quer essa letra corresponda à realização fonética da palavra, quer não.
Ex.: “k” (que); “oix” (ois); “xamas” (chamas); “ixo” (isso); “xi” (sim); “i” (e).
Passagem de diacrítico para consoante – nesta categoria, inserem-se as palavras em que, ao ocorrer uma queda de um ditongo nasal, o til (marca de nasalidade) é transferido para a consoante anterior.
Ex.: “ñ” (não)
61
Poderão ser comparáveis a alguns erros relativos à deficiente aquisição de mecanismos de leitura (vd. 2.4, capítulo II - Girolami-Boulinier, 1984: 131-132 e Pinto, 1998: 164)
Estrangeirismos – inserem-se em “estrangeirismos” todas as palavras que pertencem a outras línguas, tendo, geralmente, um correspondente em português. Foram também incluídas palavras que constam do dicionário de língua portuguesa62, embora surjam em itálico (nomeadamente “tsunami”). As palavras que revelassem fenómenos de supressão (como “ppl, msn” para “people” e “Messenger”) ou de escrita fonética (como “saite” para “site”) foram apenas incluídas nesta categoria, já que isso remetia para questões de estrutura de sílaba na língua inglesa, não cabendo no âmbito do nosso estudo. No caso de estarem incluídas nos termos específicos ou serem siglas, fizeram parte da contagem.
Ex.: “msn” (Messenger); “mail” (correio electrónico); “ya” (sim); “ppl” (people – pessoal); “ok” (está bem).
Novos termos da Internet – nesta categoria, incluem-se todas as palavras que fazem parte da nova realidade da Internet, estando algumas delas na língua inglesa.
Ex.: “tc” (teclar); “msn” (Messenger); “lol” (risada); “nick” (pseudónimo, nickname).
Compensação de elementos paralinguísticos – incluem-se nesta categoria todas as palavras que pretendem dar informações relativamente a atitudes ou reacções de quem interage nos chats, perante a situação que estão a viver. Estas palavras complementam a situação, caracterizada pela distância entre os interlocutores, sendo uma espécie de “indicações cénicas” (Ellsworth, 1994: 384) ou “apartes” (Benedito, 2002: 39), conforme mencionado no ponto 7, capítulo III.
Ex.: “zzzzz” (dormir); “lol” (risada); “hum” (som de hesitação), “ahhh” (admiração), “xiu” (silêncio).
Siglas e abrevituras institucionalizadas – cabem nesta categoria todas as palavras constituídas pelas primeiras letras de duas ou mais palavras63, tendo-se considerado irrelevante o facto de estarem ou não com letra maiúscula. Estas estão mais ou menos convencionalizadas na sociedade ou estão relacionadas com os novos termos da linguagem da Internet. Inseriram-se nesta categoria também algumas palavras cuja abreviatura é comummente usada na sociedade. Ex.: slb (Sport Lisboa e Benfica); p.f. (por favor); lol (“laughing out loud”); “lx” (Lisboa); “sr” (senhor).
Ausência de hífen – sempre que, num conjunto de palavras ligadas por um hífen (geralmente forma verbal ligada a pronome), este não surge, ou porque as duas palavras são escritas como uma só, ou porque é deixado somente um espaço em branco entre elas, estamos perante a ocorrência de ausência de hífen.
Ex.: “dame” (dá-me); “pergunteit” (perguntei-te); “defines mo” (defines-mo).
Falta de “h/u” – considera-se ausência de “h/u” todas as ocorrências em que há uma queda de uma destas duas letras quando estas não têm valor fonético, ou seja, quando não se lêem em português.
Ex.: “aki” (aqui); “ker” (quer); “keira” (queira); “sotake” (sotaque); “á” (há); “abituamos” (habituamos).
63 Optou-se por incluir estas palavras em sigla, embora autores como Pedras (2002, 141) afirmem que palavras como “lol” são
Erro de digitação – surgem palavras que apresentam uma escrita distinta da convencional ou da pretendida devido ao facto de, pela velocidade da escrita, se pressionarem teclas diferentes (e frequentemente próximas) das que se deveriam pressionar. O que acontece por vezes é haver um reconhecimento, por parte de quem escreve, da ocorrência de um erro de digitação e, por conseguinte, uma reformulação da palavra numa tomada de vez posterior, por vezes até com um pedido de desculpa, pelo uso de um recurso do teclado (ex.: *)
Ex.: “ol” (oi); ‘ (?), “plá” (olá); “bno” (no); “normqal” (normal); “reclamaçai«o” (reclamação).
Falta de palavra – inserem-se nesta categoria todas as ocorrências em que há a ausência de uma palavra, geralmente pequena e que contribui para a estruturação da frase (determinantes ou preposições).
Ex.: “gostei [de] te”; [o] meu; embarcações [de] pesca
Linguagem informal – incluem-se aqui as palavras que não pertencem a um registo de língua padrão, mas antes familiar ou até calão, ocorrendo mais frequentemente na oralidade. Algumas destas estão também incluídas nas palavras sem alteração.
Ex.: “fixe”; “fode te” (fode-te); “cuscar”; “bazar” (vazar)
Uso de “h” para acento ou prolongamento – nesta categoria, inserem-se todas as palavras em que é usado um “h”, geralmente na posição de final de palavra, ou com o intuito de desempenhar o papel de acento, ou para prolongar a vogal final.
Ex.: “olah” (olá); “kah” (cá); “estouh” (estou); “euh” (eu); “penah” (pena)
Erros linguísticos – resultam de uma incorrecta divisão do contínuo sonoro em unidades discretas, sendo uma palavra dividida em duas.
Junção de palavras – nesta categoria, estão incluídas todas as ocorrências em que se fundem duas palavras. Geralmente, este conjunto de palavras é composto por uma palavra pequena que contribui para a estruturação da frase. Alguns destes conjuntos já são específicos dos novos termos usados na linguagem da Internet, sendo bem reconhecidos pelos seus utilizadores. Outros remetem para as junções próprias da linguagem falada.
Ex.: “pergunteit” (perguntei-te); “tass” (está-se); “cas” (com as); “né” (não é); “ddtc” (donde teclas); “tdb” (tudo bem).
“X” para [s] ou [z] – incluem-se nesta categoria os casos em que o grafema “x” é usado com valor fonético de [s] e [z].
Ex.: “xim” para “sim”; “baxar” para “vazar”; “xer” para “ser”; “Adixionem” para “Adicionem”.
Outros – nesta categoria incluem-se as palavras que não se encaixam em nenhuma das outras (nomeadamente o acrescento de vários acentos, a introdução de sinais ou criação de sequências sem sentido), ou aquelas em que não se torna clara a mensagem que veiculam.
Ex.: 1a (uma); olé´´e´´e; >; ksdfjaskajsflqfpqowfqpwfdq; sebm (?);
Palavras sem alteração – incluem-se nesta categoria as palavras em que não ocorrem alterações, inclusivamente aquelas que estão ligadas à nova linguagem da Internet e que reflectem uma linguagem informal, mas que fazem parte da língua portuguesa. Não estão incluídas nesta categoria as palavras que, apesar de estarem escritas na forma convencional, iniciam pseudofrases mas não possuem letra maiúscula.
Sinais excessivos – nesta categoria, estão incluídas todas as ocorrências em que se repete um sinal de pontuação para dar ênfase. O sinal de pontuação pode repetir-se apenas uma vez ou várias.
Ex.: ??; !!!; ……; ??????????
Falta de pontos finais – nesta categoria, inserem-se os casos em que o final da pseudofrase (declarativa ou imperativa) não é marcado por um ponto final.64
Ex.: “ola” (Olá.); “sais da sala” (Sais da sala.); “tenho” (Tenho.); “addicoona me” (Adiciona- me.).
Falta de pontos de interrogação – ocorre quando o final de uma pseudofrase interrogativa não é marcado pelo emprego de um ponto de interrogação.
Ex.: “idd” (Idade?); “16 e tu” (16 e tu?); “dd tc” (Donde teclas?)
Smileys – nesta categoria, inserem-se todos os símbolos, realizados com os recursos do teclado,
que pretendem transmitir emoções ou sentimentos (como alegria, tristeza ou curiosidade), actos físicos (como beijos) ou ainda pedidos de desculpa com consequente reformulação do que foi dito.
Ex.: :-) :( ö.ö:)) o-o :-)))) *** * (pedido de desculpa e reformulação posterior)
64 Quando uma pseudofrase terminava com reticências, não se considerou que havia falta de pontuação. Casos de pseudofrases
constituídas apenas por um smiley não fizeram parte desta categoria. As pseudofrases exclamativas não pontuadas foram incluídas nesta categoria, embora não se considere que possuam muita representatividade, na medida em que a emoção é geralmente veiculada pelo uso excessivo de sinais de pontuação, e não pela sua ausência.
Ausência de letra maiúscula em início de pseudofrase – inserem-se nesta categoria todas as palavras que, embora estejam em início de frase, não são distinguidas pelo uso de letra maiúscula.
Ex.: “tens” (Tens); “ddtc” (Donde teclas); “idd” (Idade); “olá” (Olá); “alguem” (Alguém); “oi” (Oi).
Presença de maiúscula no início de pseudofrase – inclui os casos em que uma pseudofrase é iniciada por letra maiúscula.
Ex.: “Es m ou h” (És mulher ou homem?); Sala?
Pseudofrases iniciadas por número, sinal de pontuação, smileys ou outros – existem pseudofrases que não são iniciadas nem por letra maiúscula, nem por minúscula. Começam com sinais, números ou smileys, sendo por vezes só compostas por estes. Os endereços de correio electrónico em início de frase foram inseridos também nesta categoria.
Ex.: “15”; “?????”; “:)”; “…” ; “***”; “16 e tu”; “[email protected]”.
3.2 Resultados
Após a divisão das ocorrências em categorias, obtiveram-se os resultados a seguir representados, no que respeita às categorias com base no número total de palavras. Estes são apresentados em ordem decrescente de representatividade, surgindo, para cada categoria, o resultado em bruto por sessão e no total, bem como a percentagem correspondente.
Categorias Ses- são 1 Ses- são 2 Ses- são 3 Ses- são 4 Ses- são 5 Ses- são 6 Ses- são 7 Ses- são 8 Ses- são 9 Totais Percenta- gens Palavras sem alteração 48 286 312 777 965 599 119 395 201 3702 34,65% Ausência maiúsc. início pseudofrase 55 393 350 269 340 279 182 472 192 2532 23,70% Queda de Rima completa 20 143 140 30 55 68 76 146 57 735 6,88% Falta de diacrítico 5 96 109 39 86 58 45 109 59 606 5,67% Troca de grafema 13 88 166 11 38 33 35 62 28 474 4,44% Escrita fonética 11 82 136 10 32 33 28 57 28 417 3,90% Estrangeirismos 7 65 86 30 29 26 21 47 30 341 3,19% Novos termos da Internet 7 25 50 15 23 23 33 35 12 223 2,09% Acrescento vogais/consoantes 3 26 28 15 45 23 17 48 4 209 1,96% Ausência maiúsc. nome próprio 6 44 33 12 27 12 15 45 12 206 1,93% Queda de sílaba 5 22 32 10 23 20 13 42 14 181 1,69% Elementos paralinguísticos 2 11 28 28 40 35 8 7 3 162 1,52% Siglas/abrev. institucionalizadas 1 24 28 20 25 18 8 11 7 142 1,33% Erro de digitação 6 7 19 13 13 21 8 20 5 112 1,05% Falta de “h/u” 1 14 32 6 12 10 8 19 6 108 1,01% Outros 1 19 17 8 23 6 3 5 4 86 0,80% Queda parte de ataque ramificado 0 13 14 6 3 15 9 17 3 80 0,75% Queda de núcleo apenas 3 21 21 3 2 0 6 17 4 77 0,72% Linguagem informal 3 11 13 10 4 0 4 14 2 61 0,57% Junção de palavras 0 14 18 6 1 6 8 1 3 57 0,53% “X” para [s]/[z] 2 7 32 0 0 0 4 3 2 50 0,47% “H” para acento/prolonga- mento 0 6 36 0 1 0 1 1 0 45 0,42%
Uso de maiúsc. não
convencional. 0 2 10 11 10 1 1 1 0 36 0,34%
Falta de hífen 2 6 8 1 4 1 2 5 3 32 0,30%
Escrita fonética 2 0 2 1 6 3 2 2 3 1 20 0,19%
Queda de parte do
núcleo 0 4 8 0 2 0 0 2 2 18 0,17%
Escrita fonética int.
forma visual 0 7 1 1 2 1 3 1 0 16 0,15% Acrescento de diacrítico 1 0 4 3 1 0 3 3 0 15 0,14% Passagem diacrítico para cons. 0 1 0 1 3 2 2 3 0 12 0,11% Queda de coda apenas 0 1 4 0 0 2 0 0 0 7 0,07% Queda de ataque 0 0 1 0 0 0 2 3 0 6 0,06% Falta de palavra 0 2 0 0 1 1 1 0 0 5 0,05% Troca de acento 0 0 0 1 2 1 0 1 0 5 0,05% Erro linguístico 0 0 1 0 1 0 1 1 0 4 0,04% Totais 147 1049 1388 1073 1476 1017 486 1124 490 8250 100,90%65
65 Recorde-se que alguns dos erros foram inseridos em mais do que uma categoria e que nicknames e endereços de correio
Eis o gráfico que ilustra estes resultados:
Resultados das categorias com base no total de palavras
Palavras sem alteração Ausência maiúsc. início pseudofrase Queda de Rima completa Falta de diacrítico Troca de grafema Escrita fonética Estrangeirismos Novos termos da Internet Acrescento vogais/consoantes Ausência maiúsc. nome próprio Queda de sílaba
Compens. elementos paralinguísticos Siglas/abrev. institucionalizadas Erro de digitação
Falta de “h/u” Outros
Queda parte de Ataque ramificado Queda de Núcleo apenas Linguagem informal Junção de palavras “X” para [s]/[z]
“H” para acento/prolongamento Uso de maiúsc. não convencional. Falta de hífen
Escrita fonética 2 Queda de parte do Núcleo Escrita fonética int. forma visual Acrescento de diacrítico Passagem diacrítico para cons. Queda de Coda apenas Queda de Ataque Falta de palavra Troca de acento Erro linguístico
Como se pode observar pelas grelhas dos resultados gerais do total de palavras, o que mais ocorre é a não-alteração de palavras, com 34,65%.
No entanto, como o que interessa sobretudo neste estudo é quantificar a ocorrência de desvios à norma, estes vão ser a seguir representados, em forma de tabela e de gráfico, tendo sido calculados com base no número de palavras em que ocorriam erros.
Categorias Percentagem com base no
total de desvios
Ausência maiúsc. início pseudofrase 36,30%
Queda de Rima completa 10,53%
Falta de diacrítico 8,68%
Troca de grafema 6,79%
Escrita fonética 5,97%
Estrangeirismos 4,88%
Novos termos da Net 3,19%
Acrescento vogais/consoantes 2,99%
Ausência maiúsc nome próprio 2,95%
Queda de sílaba 2,59%
Compensação dos elementos paralinguísticos 2,32%
Siglas/abrev. institucionalizadas 2,03%
Erro de digitação 1,60%
Falta de “h/u” 1,55%
Outros 1,23%
Queda parte de Ataque ramificado 1,15%
Queda de Núcleo apenas 1,10%
Linguagem informal 0,87%
Junção de palavras 0,82%
“X” para [s]/[z] 0,72%
“H” para acento/prolongamento 0,64%
Uso de maiúsc. não convencionada 0,52%
Falta de hífen 0,46%
Escrita fonética 2 0,29%
Queda de parte do Núcleo 0,26%
Escrita fonética int. forma visual 0,23%
Acrescento de diacrítico 0,21%
Passagem diacrítico para cons. 0,17%
Queda de Coda apenas 0,10%
Queda de Ataque 0,09%
Falta de palavra 0,07%
Troca de acento 0,07%
Podemos verificar que, entre as palavras com pelo menos uma alteração, é mais corrente a ausência de maiúscula em início de pseudofrase (36,30%), seguida de queda de Rima completa (10,53%), falta de diacrítico (8,68%), troca de grafema (6,79%) e escrita fonética