Methods of sociolinguistic lexicometry: analysis of the contemporary oral corpus PRESEEA-Santander

Keywords: lexicometry, sociolinguistic variation, oral corpus, current Spanish lexicon

Abstract

Lexicometry is a method that allows us to identify thematic units derived from the automatic extraction of knowledge patterns in data of a textual nature (Romero, Alarcón and García, 2018). From its application, the lexical tendencies of a corpus emerge through the quantification of the occurrence of words. The different sociolinguistic lexical styles have been studied in wide varieties of the world's languages, including the Spanish language. However, in the studies available to us to date, there are not enough quantitative analyzes of the lexicon of a contemporary oral sociolinguistic corpus. The general objective of this article is to detect the preferences for the use of the vocabulary of the spoken Spanish language within the framework of sociolinguistic lexicometry. To do this, a representative sample of a corpus with stratification in three variables (sex, age, educational level) was analyzed. This sample belongs to the PRESEEA-Santander corpus, framed in the Project for the Sociolinguistic Study of Spanish in Spain and America (Moreno Fernández, 2021). The LYNEAL system (Letters and Numbers in Linguistic Analysis) (Ueda, 2021) was used in the analysis, as well as the open-source statistical software R. The results indicate that gender is revealed as an important variable in the process of lexical variation, detecting, among other findings, the use of nominal over verbal style and the preferential use of adverbs in -mente by men; with respect to age, the tendency to use lexical truncation in the younger generation and in the female gender is noted; finally, the concentration of use of muchísimo in women, young people, with a primary education level, is appreciated.

Downloads

Download data is not yet available.

Author Biography

Hiroto Ueda, Universidad de Tokio (Japón)

Hiroto Ueda es profesor no numerario en la Universidad Sofia, Tokio, Japón. Sus áreas de interés son filología española, dialectomería española, historia del español y estadística lingüística.

En su trayectoria profesional se ha desempeñado como instructor en la Universidad Nacional de Estudios Extranjeros de Tokio, 1977-1982; lector en la Universidad de Estudios Extranjeros de Tokio, 1982-1988; profesor adjunto en la Universidad de Tokio, 1988-1996; profesor invitado en la Universidad Complutense de Madrid, 1996; profesor titular en la Universidad de Tokio, 1996-2017; profesor invitado en la Universidad de Educación a Distancia de Japón, 2003-2006; profesor invitado en la Universidad de Alcalá, 2017-actual; y profesor no numerario en la Universidad de Sofia, 2017 hasta la fecha.

En materia de actividades profesionales se destacan: miembro de comité organizador del III Congreso de la Asociación Asiática de Hispanistas, 1991-1993; coordinador en el Proyecto Internacional VARILEX. El Espanol del Mundo, Universidad de Tokio, 1993-actual; investigador en el Instituto Nacional de la Lengua Japonesa, 1993-1999; miembro del Consejo Científico de la Revista de Estudios de Adquisicion de la Lengua Espanola, Universidad de Alcalá, 1994-actual; miembro del Consejo Científico de Lingüística Española Actual. 1995-actual; consejero de la Sociedad Japonesa de Hispanistas, 1996-1998, 2008-2010; consejero de la Sociedad Japonesa de Estudios Románicos, 1997-2007; miembro Correspondiente de la Academia Norteamericana de la Lengua Española, 1998-actual; delegado en Japón de Asociación de Lingüística y Filología de América Latina, desde 2004-actual; presidente oficial de la Asociación Asiática de Hispanistas, 2016-actual; académico correspondiente extranjero de la Real Academia Española, 2016-actual; miembro de Consejo Asesor de Nueva Revista de Filología Hispánica, El Colegio de México, 2017-actual; y profesor emérito en la Universidad de Tokio, 2017-actual.

Entre sus publicaciones se destacan selectivamente:

  • LÉXICO. Nuevo diccionario estándar español-japonés. Tokio. Kenkyusha. 2019a. “Cohesion and Particularity in the Spanish Dialect Continuum”, in Open Linguistics, with Francisco Moreno Fernandez.
  • “Las grafías bilabiales sonoras <u>, <v> y <b> del español - En relación con el fonema /f/ y el paradigma sibilante”, Mónica Castillo Lluch / Elena Diez del Corral Areta (eds.) Reescribiendo la historia de la lengua española a partir de la edición de documentos. Bern. Peter Lang, pp. 141-174.
  • “Lematización de los datos de CODEA y su utilización en análisis cuantitativos sobre la eñe y la hache muda”, Philologia Hispalensis, Universidad de Sevilla, vol. 33, pp. 161-178.
  • “Tratamiento lingüístico y matemático de textos digitales españoles. Presentación del Programa LEXIS-web”, Actas del IX Congreso de la Asociación Asiática de Hispanistas (Bangkok, 2016), pp. 617-630.
  • Economía sintagmática y paradigmática de la teoría de Martinet. Denominaciones deonomásticas de objetos de la vida moderna”, Jorge Braga Riera / Consuelo García Gallarín (eds.) Deonomástica multilingüe: del nombre propio al nombre de clase. Kassel. Edition Reichenberger.
  • “Tendencias actuales en la investigación del léxico dialectal”, (con Ruiz Tinoco, Antonio) en Álvarez de la Granja / González Seoane (eds.) Léxico dialectal y léxicografía en la Iberorromania, Madrid, Iberoamericana Vervuert, pp. 53-76.
  • “Letras españolas y letras japonesas. Distribución de frecuencias e intenciones semánticas”, en Toshihiro Takagaki (ed.) Exploraciones de la lingüística contrastiva español-japonés, UAM Ediciones, pp. 169-190.
  • “Tendencias cuantitativas de la abreviatura en el español medieval y moderno”, María Luisa Arnal Purroy, Rosa María Castañer Martín, José M.ª Enguita Utrilla, Vicente Lagüéns Gracia, María Antonia Martín Zorraquino (eds.) Actas del X Congreso Internacional de Historia de la Lengua Española, pp. 463-480.
View citations

Crossmark

Metrics

Published
2023-05-03
How to Cite
Martínez Martínez I. . y Ueda H. (2023). Methods of sociolinguistic lexicometry: analysis of the contemporary oral corpus PRESEEA-Santander. Círculo de Lingüística Aplicada a la Comunicación, 94, 227-245. https://doi.org/10.5209/clac.81206