Métodos de lexicometría sociolingüística: análisis del corpus oral contemporáneo PRESEEA-Santander

Palabras clave: lexicometría, variación sociolingüística, corpus oral, léxico del español actual

Resumen

La lexicometría es un método que nos permite identificar unidades temáticas derivadas de la extracción automática de patrones de conocimiento en datos de naturaleza textual (Romero, Alarcón y García, 2018). De su aplicación emergen las tendencias léxicas de un corpus a través de la cuantificación de la ocurrencia de las palabras. Los distintos estilos léxicos sociolingüísticos se han estudiado en amplias variedades de las lenguas del mundo, incluida la lengua española. Sin embargo, no existen, en los estudios llegados a nuestro alcance hasta el momento, suficientes análisis cuantitativos del léxico de un corpus sociolingüístico oral contemporáneo.

            El objetivo general de este artículo es detectar las preferencias de uso del vocabulario de la lengua española hablada en el marco de la lexicometría sociolingüística. Para ello, se analizó una muestra representativa de un corpus estratificado en torno a tres variables (sexo, edad, nivel educativo). Dicha muestra pertenece al corpus PRESEEA-Santander, enmarcado en el Proyecto para el Estudio Sociolingüístico del Español de España y América (Moreno Fernández, 2021). En el análisis se empleó el sistema LYNEAL (Letras y Números en Análisis Lingüístico) (Autor, 2021), así como el software estadístico en código abierto R.

La lexicometría es un método que nos permite identificar unidades temáticas derivadas de la extracción automática de patrones de conocimiento en datos de naturaleza textual (Romero, Alarcón y García, 2018). De su aplicación emergen las tendencias léxicas de un corpus a través de la cuantificación de la ocurrencia de las palabras. Los distintos estilos léxicos sociolingüísticos se han estudiado en amplias variedades de las lenguas del mundo, incluida la lengua española. Sin embargo, no existen, en los estudios llegados a nuestro alcance hasta el momento, suficientes análisis cuantitativos del léxico de un corpus sociolingüístico oral contemporáneo.El objetivo general de este artículo es detectar las preferencias de uso del vocabulario de la lengua española hablada en el marco de la lexicometría sociolingüística. Para ello, se analizó una muestra representativa de un corpus estratificado en torno a tres variables (sexo, edad, nivel educativo). Dicha muestra pertenece al corpus PRESEEA-Santander, enmarcado en el Proyecto para el Estudio Sociolingüístico del Español de España y América (Moreno Fernández, 2021). En el análisis se empleó el sistema LYNEAL (Letras y Números en Análisis Lingüístico) (Ueda, 2021), así como el software estadístico en código abierto R. Los resultados apuntan a que el sexo se revela como una variable importante en el proceso de variación léxica al detectarse, entre otros hallazgos, el uso del estilo nominal sobre el verbal y el empleo preferente de adverbios en -mente por parte del hombre; con respecto a la edad, se advierte la tendencia al empleo del truncamiento léxico en la generación de jóvenes y en el género mujer; por último, se aprecia la concentración de uso de muchísimo en mujer, joven, de nivel primario de instrucción.

Descargas

Los datos de descargas todavía no están disponibles.

Biografía del autor/a

Hiroto Ueda, Universidad de Tokio (Japón)

Hiroto Ueda es profesor no numerario en la Universidad Sofia, Tokio, Japón. Sus áreas de interés son filología española, dialectomería española, historia del español y estadística lingüística.

En su trayectoria profesional se ha desempeñado como instructor en la Universidad Nacional de Estudios Extranjeros de Tokio, 1977-1982; lector en la Universidad de Estudios Extranjeros de Tokio, 1982-1988; profesor adjunto en la Universidad de Tokio, 1988-1996; profesor invitado en la Universidad Complutense de Madrid, 1996; profesor titular en la Universidad de Tokio, 1996-2017; profesor invitado en la Universidad de Educación a Distancia de Japón, 2003-2006; profesor invitado en la Universidad de Alcalá, 2017-actual; y profesor no numerario en la Universidad de Sofia, 2017 hasta la fecha.

En materia de actividades profesionales se destacan: miembro de comité organizador del III Congreso de la Asociación Asiática de Hispanistas, 1991-1993; coordinador en el Proyecto Internacional VARILEX. El Espanol del Mundo, Universidad de Tokio, 1993-actual; investigador en el Instituto Nacional de la Lengua Japonesa, 1993-1999; miembro del Consejo Científico de la Revista de Estudios de Adquisicion de la Lengua Espanola, Universidad de Alcalá, 1994-actual; miembro del Consejo Científico de Lingüística Española Actual. 1995-actual; consejero de la Sociedad Japonesa de Hispanistas, 1996-1998, 2008-2010; consejero de la Sociedad Japonesa de Estudios Románicos, 1997-2007; miembro Correspondiente de la Academia Norteamericana de la Lengua Española, 1998-actual; delegado en Japón de Asociación de Lingüística y Filología de América Latina, desde 2004-actual; presidente oficial de la Asociación Asiática de Hispanistas, 2016-actual; académico correspondiente extranjero de la Real Academia Española, 2016-actual; miembro de Consejo Asesor de Nueva Revista de Filología Hispánica, El Colegio de México, 2017-actual; y profesor emérito en la Universidad de Tokio, 2017-actual.

Entre sus publicaciones se destacan selectivamente:

  • LÉXICO. Nuevo diccionario estándar español-japonés. Tokio. Kenkyusha. 2019a. “Cohesion and Particularity in the Spanish Dialect Continuum”, in Open Linguistics, with Francisco Moreno Fernandez.
  • “Las grafías bilabiales sonoras <u>, <v> y <b> del español - En relación con el fonema /f/ y el paradigma sibilante”, Mónica Castillo Lluch / Elena Diez del Corral Areta (eds.) Reescribiendo la historia de la lengua española a partir de la edición de documentos. Bern. Peter Lang, pp. 141-174.
  • “Lematización de los datos de CODEA y su utilización en análisis cuantitativos sobre la eñe y la hache muda”, Philologia Hispalensis, Universidad de Sevilla, vol. 33, pp. 161-178.
  • “Tratamiento lingüístico y matemático de textos digitales españoles. Presentación del Programa LEXIS-web”, Actas del IX Congreso de la Asociación Asiática de Hispanistas (Bangkok, 2016), pp. 617-630.
  • Economía sintagmática y paradigmática de la teoría de Martinet. Denominaciones deonomásticas de objetos de la vida moderna”, Jorge Braga Riera / Consuelo García Gallarín (eds.) Deonomástica multilingüe: del nombre propio al nombre de clase. Kassel. Edition Reichenberger.
  • “Tendencias actuales en la investigación del léxico dialectal”, (con Ruiz Tinoco, Antonio) en Álvarez de la Granja / González Seoane (eds.) Léxico dialectal y léxicografía en la Iberorromania, Madrid, Iberoamericana Vervuert, pp. 53-76.
  • “Letras españolas y letras japonesas. Distribución de frecuencias e intenciones semánticas”, en Toshihiro Takagaki (ed.) Exploraciones de la lingüística contrastiva español-japonés, UAM Ediciones, pp. 169-190.
  • “Tendencias cuantitativas de la abreviatura en el español medieval y moderno”, María Luisa Arnal Purroy, Rosa María Castañer Martín, José M.ª Enguita Utrilla, Vicente Lagüéns Gracia, María Antonia Martín Zorraquino (eds.) Actas del X Congreso Internacional de Historia de la Lengua Española, pp. 463-480.
Ver citas

Descarga artículo

Crossmark

Métricas

Publicado
2023-05-03
Cómo citar
Martínez Martínez I. . y Ueda H. (2023). Métodos de lexicometría sociolingüística: análisis del corpus oral contemporáneo PRESEEA-Santander. Círculo de Lingüística Aplicada a la Comunicación, 94, 227-245. https://doi.org/10.5209/clac.81206