Estudio lingüístico-estadístico de la novela "Dafnis y Cloe de Longo"
- Álvarez García, Azucena
- Javier Martínez García Director
Universidad de defensa: Universidad de Oviedo
Fecha de defensa: 02 de febrero de 2016
- Mikel Labiano Ilundain Presidente/a
- Manuel González Suárez Secretario
- David Hernández de la Fuente Vocal
Tipo: Tesis
Resumen
Palabras clave: diccionario de frecuencia, estadística lingüística, extensión de léxico, extensión de vocabulario, hápax legomena, lenguas clásicas, media, mediana, moda, test de Pearson. La novela Las Pastorales o Dafnis y Cloe, obra escrita por Longo de Lesbos en el s. II d. C, se ha sometido a una investigación de estadística y lingüística cuantitativa, según la cual el texto griego se ha convertido en una población sujeto de estudio, donde la lengua se ha considerado un corpus numérico y cuantificado los individuos de dicha población (palabras) como unidades de medida y frecuencia (ocurrencias). El estudio se divide en cuatro partes: una breve introducción al método estadístico-lingüístico, el análisis estadístico en sí, la creación de un diccionario de frecuencia y las conclusiones. La novela Dafnis y Cloe se compone de una extensión de léxico N = 19.859 palabras, clasificadas mediante el etiquetado lingüístico o tagging. Tras ese proceso de etiquetado, se han descartado aquellas palabras herramientas (outils) no léxicas ni flexivas (a excepción de los artículos), consideradas entropía o ruido, que no aportan nada a la investigación lingüística. Al final, el estudio se concentra en 3 categorías gramaticales (adjetival, nominal y verbal) que suponen una extensión de léxico N de 11.679 palabras, subdivididas, a su vez, en 19 subclases que establecen los grados de libertad (gdl) con los que operamos. Comparamos los niveles obtenidos de ji-cuadrado (X2 = diferencia entre frecuencia observada y esperada), para comprobar la validez de una de las dos hipótesis: la hipótesis cero (H0) o la hipótesis de variación estilística (H1). En cada subcategoría se ha estudiado y establecido la extensión de léxico N y la de vocabulario V, mediante tablas de datos y gráficos. Las categorías gramaticales no tienen una presencia natural dentro de la novela: el fenómeno más concreto la categoría nominal, cuyos valores de frecuencia observada (o) distan considerablemente de su frecuencia estadística (e) muestran, con un error mínimo del 5%, un uso artificial, validando así la hipótesis de variación estilística (H1). En cuanto al diccionario de frecuencia los resultados resultan abrumadores, con una altísima frecuencia de aparición de los hápax legomena (V1), que sobrepasan los límites de la moda (Mo), media (Me) y mediana (Md), calculados matemáticamente, queda demostrada la intencionalidad en la elección del vocabulario y la riqueza léxica de la novela: características que definen el estilo literario de Longo de Lesbos.