Ediciones Complutense Creative Commons

Revista Complutense de Educación

ISSN: 1130-2496 • e-ISSN: 1988-2793

ARTÍCULOS

Deshonestidad Académica: modelo pronóstico empleando Teoría de la Acción Planeada, autoconcepto académico y neutralización

José Hernando Ávila-Toscano
Universidad del Atlántico, Colombia ORCID iD
José John Fredy González Veloza
Fundación Universitaria Los Libertadores, Colombia ORCID iD
Recibido: Septiembre 2024 • Evaluado: Noviembre 2024 • Aceptado: Noviembre 2024

Resumen: INTRODUCCIÓN. La deshonestidad académica representa una crisis ética para la educación superior que afecta la calidad formativa. La literatura ha empleado la Teoría de la Acción Planificada para explicar la deshonestidad por el efecto de creencias sobre la trampa, norma subjetiva y control conductual sobre la intencionalidad volitiva. Pero aún falta considerar elementos afectivos como el autoconcepto académico y la neutralización de la responsabilidad ética. Este estudio propone un modelo integrador que evalúa si las relaciones funcionales entre estas variables pronostican la conducta deshonesta. MÉTODO. Mediante diseño predictivo se evaluó a 561 universitarios con una batería psicotécnica. Los datos se analizaron con modelos Machine Learning de regresión logística y Random Forest Classifier. RESULTADOS. El modelo de árboles mostró mejor ajuste, resaltando el papel de intención conductual, neutralización y actitud hacia la trampa como los predictores más relevantes. DISCUSIÓN. La integración de variables afectivas y el uso de Random Forest permite descubrir interacciones significativas y efectos de los predictores que resultan útiles para formular políticas educativas que superen lo punitivo y se enfoquen en la prevención, más que en la corrección.

Palabras clave: Deshonestidad, Fraude, Autoconcepto, Actitud del alumno, Predicción.

ENG Academic dishonesty: prognostic model using Theory of Planned Action, academic self-concept and neutralization

Abstract: INTRODUCTION. Academic dishonesty represents an ethical crisis for higher education that affects educational quality. The literature has employed the Theory of Planned Action to explain dishonesty by the effect of beliefs about cheating, subjective norm and behavioral control over volitional intentionality. But affective elements such as academic self-concept and neutralizing ethical responsibility have yet to be considered. This study proposes an integrative model that evaluates whether the functional relationships between these variables predict dishonest behavior. METHOD. By means of a predictive design, 561 university students were evaluated with a psycho-technical battery. The data were analyzed with Machine Learning models of logistic regression and Random Forest Classifier. RESULTS. The tree model showed better fit, highlighting the role of behavioral intention, neutralization and attitude towards cheating as the most relevant predictors. DISCUSSION. The integration of affective variables and the use of Random Forest allows us to discover significant interactions and predictor effects that are useful for formulating educational policies that go beyond the punitive and focus on prevention rather than correction.

Keywords: Dishonesty, Cheating, Self-concept, Pupil attitude, Forecasting.

Index: 1. Introducción 1.1. Deshonestidad académica y Teoría de la Acción Planificada 1.2. Autoconcepto y neutralización 2. Método 2.1. Diseño 2.2. Participantes 2.3. Instrumentos 2.4. Procedimiento 2.4.1. Análisis de datos 3. Resultados 3.1. Adecuación de las medidas 3.2. Evaluación de conductas de DA 3.3. Relaciones entre autoconcepto académico, neutralización y TAP 3.4. Modelo de regresión logística 3.5. Modelo de árbol de clasificación 4. Discusión y conclusiones 4.1. Limitaciones 4.2. Implicaciones prácticas 5. Referencias

Cómo citar: Ávila-Toscano J.H. y González Veloza J.J.F. (2025). Deshonestidad Académica: modelo pronóstico empleando Teoría de la Acción Planeada, autoconcepto académico y neutralización. Revista Complutense de Educación, 36(4), 457-469. https://doi.org/10.5209/rced.96613

1. Introducción

La deshonestidad académica (DA) implica toda conducta que busca ganancias académicas violando principios éticos (Diez-Martínez, 2015), lo cual impacta negativamente en el aprendizaje, el funcionamiento educativo institucional y en el desarrollo profesional futuro. Desafortunadamente, es muy común en educación superior, lo cual revela la necesidad de adelantar estudios que examinen las razones que soportan estas prácticas (Ríos-Avendaño et al., 2024), proponiendo modelos que integren cognición y conducta (Abou y Nachouki, 2019).

Un enfoque útil ha sido la Teoría de la Acción Planificada (TAP), que considera la interacción de actitudes, normas subjetivas y control conductual percibido como procesos que influyen sobre las intenciones prediciendo el comportamiento (Curtis et al., 2022). En la década reciente también ha crecido el interés por considerar variables como autoconcepto académico y neutralización. El primero implica la forma como un estudiante percibe sus capacidades académicas (Rosman et al., 2018), además, se ha descrito una relación inversa con la DA (Rinn et al., 2014). La actitud neutralizadora implica justificaciones de la conducta deshonesta, de manera que el estudiante neutraliza su práctica antiética para violar la norma sin sentir culpa (Ling et al., 2014).

1.1. Deshonestidad académica y Teoría de la Acción Planificada

Los estudios internacionales reportan cifras alarmantes de DA en estudiantes estadounidenses (Rinn et al., 2014), rusos (Maloshonok y Shmeleva, 2019), mexicanos (Ayala-Gaytan y Quintanilla-Domínguez, 2014) y colombianos. Entre estos últimos los datos superan el 90% incluso en las universidades más prestigiosas (Mejía y Ordoñez, 2004). En el Caribe colombiano se reporta que el nivel de DA alcanza 94% de los universitarios (Martínez y Ramírez, 2017; Martínez et al., 2015). Las conductas comunes incluyen plagio, fraude electrónico y permitir copias (Ternes et al., 2019), y algunos estudios metaanalíticos han mostrado que la DA es más común en estudiantes desmotivados o con motivadores extrínsecos (Krou et al., 2020), además, estas conductas son comunes en medios virtuales, donde quienes las ejecutan no reconocen su comportamiento como deshonesto (Chiang et al., 2022).

Otros trabajos sugieren que la DA se relaciona con la falta de miedo, por lo cual el umbral de riesgo del estudiante es bajo y no teme ser descubierto, o también posee poco autocontrol y déficit en la predicción de consecuencias negativas de su conducta (Baran y Jonason, 2020). Gran parte de la investigación, sin embargo, se ha realizado desde el modelo de la TAP por su utilidad para predecir acciones intencionales (Curtis et al., 2022). Esta teoría explica el comportamiento como una función de tres conjuntos de creencias relacionadas con la conducta, la norma y el control. Las creencias relativas a la conducta se basan en anticipar sus resultados, y las creencias normativas en la concepción de que los grupos aprueban o no determinado comportamiento. Las creencias de control reflejan en qué medida se percibe tener dominio sobre la voluntad de una conducta (Ajzen, 2020). A partir de estas creencias se define o se afecta la disposición por realizar un comportamiento, es decir, la intención conductual (Maloshonok y Shmeleva, 2019).

La TAP se ha usado exitosamente para comprender la conducta deshonesta. Por ejemplo, Chudzicka- Czupała et al. (2016) evaluaron 2021 universitarios de siete países (seis de Europa y EE.UU.), identificando que las actitudes y el control conductual percibido predicen la intención de realizar conductas deshonestas, y demostrando la aplicabilidad transcultural del modelo. También Lonsdale (2016) identificó en estudiantes estadounidenses que la norma subjetiva y el control conductual (facilidad para hacer trampa) predicen las conductas deshonestas. Además, destacó el papel relevante de las actitudes percibidas del grupo de pares, y reportó una menor aceptación de conductas deshonestas entre las mujeres.

La TAP es un modelo flexible, al que se han agregado otras variables como la obligación moral y la conducta pasada (éxito previo al hacer trampa), dando lugar a un modelo extendido que ha mostrado un buen nivel de predicción de conductas como plagio e intercambio de tareas (Cronan et al., 2015). Recientemente se han propuesto variables relacionadas con la alfabetización tecnológica como formas de control conductual percibido, evidenciando su capacidad predictiva frente a la DA (Uzun y Kilis, 2020). Esto demuestra la flexibilidad de la teoría para explicar la DA, como sucede en este estudio, donde se añade al modelo la participación del autoconcepto y la neutralización.

1.2. Autoconcepto y neutralización

El autoconcepto es un constructo multidimensional que define la imagen personal sobre las habilidades y el desempeño académico (Martínez et al., 2014). Rinn et al. (2014) identificaron que un autoconcepto bajo se relaciona con conductas fraudulentas tanto en estudiantes con historial honorífico, como en aquellos sin honores. Asimismo, según Miller et al. (2017), cuando los estudiantes destacados se enfrentan a situaciones amenazantes para su desempeño, pueden recurrir a conductas deshonestas para sostener su rendimiento. Perder una nota puede afectar su autoimagen, por lo cual la trampa actúa como estrategia defensiva. De esta forma, minimizan la mala práctica, en especial si la consideran algo común.

Aquíentra en juego la neutralización, asumida como la justificación de la conducta inmoral presentándola como razonable ante determinadas circunstancias (Lee et al., 2020). La neutralización está relacionada directamente con la DA (Curasi, 2013), y se considera un fuerte predictor de este comportamiento (Lue y Stiles, 2022). Entre las técnicas neutralizadoras, negar la responsabilidad es quizá la más común (Curasi, 2013), a través de la cual los estudiantes se absuelven de culpa mediante racionalizaciones como la dificultad o la irrelevancia de la tarea. También suelen negar el perjuicio, culpar a terceros (p. e.: “compañeros que se dejan copiar”), o desplazar la responsabilidad hacia el profesor, incluso acusándole de inventar incidentes relacionados con la trampa (Brent y Atkinson, 2011; Bertram Gallant et al., 2013; Olafson et al., 2013).

La neutralización les permite a los estudiantes justificar la trampa sin sentirse deshonestos, especialmente cuando se sienten desconectados de su contexto educativo, es decir, consideran las normas académicas como ajenas o irrelevantes, lo cual aumenta la probabilidad de actuar deshonestamente. Si previamente el engaño fue exitoso, la neutralización favorece la recurrencia de la conducta (Hakim et al., 2018; Smith et al., 2012), al punto de que un estudiante deshonesto puede racionalizar su comportamiento y mantener el autoconcepto de una persona honesta (Maoz et al., 2022). Ahora bien, para que la neutralización conduzca a la violación de los valores, se requiere que las personas acepten una técnica neutralizadora y perciban su aplicabilidad en determinada situación (Agnew y Peters, 1986), aspectos que pueden relacionarse con la TAP: aceptar una técnica de neutralización refleja una predisposición cognitiva que podría alinearse con la actitud favorable hacia la trampa, mientras que percibir su aplicabilidad se asemeja con el concepto de control percibido. Sin embargo, la literatura que integra la neutralización y el autoconcepto académico con la TAP es limitada, por lo que su análisis aporta un enfoque novedoso e interesante.

2. Método

2.1. Diseño

El objetivo de este estudio fue pronosticar si las variables relativas a la TAP, autoconcepto académico y neutralización predicen la DA en universitarios. Se realizó un estudio predictivo transversal (Ato et al., 2013), diseñado para explicar cómo las variables independientes (TAP, autoconcepto, neutralización) predicen el comportamiento de una variable dependiente como la DA, representada por prácticas de copia, plagio- falsificación y engaño).

2.2. Participantes

Mediante muestreo no probabilístico accidental (Etikan y Bala, 2017), se seleccionaron estudiantes de dos universidades colombianas sin distinción de género ni desempeño académico. La muestra quedó conformada por 561 estudiantes, 240 (42.7%) hombres y 321 (57.2%) mujeres, con edad promedio de 21.7 años (DE = 4.33). De acuerdo con la disciplina de conocimiento, 194 (34.6%) pertenecían a las Ciencias Humanas y Sociales y 367 (61.4%) a las Ciencias de la Educación.

2.3. Instrumentos

Ficha demográfica. Empleada para registrar género de los encuestados, edad y facultad (Ciencias Sociales y humanas, Ciencias de la educación) a la que pertenecían.

Para medir las variables independientes y la variable objetivo se emplearon instrumentos basados en escalas descritas en la literatura. Para garantizar su ajuste y representar adecuadamente sus propiedades métricas, los instrumentos se sometieron a Análisis Factorial Confirmatorio (AFC) y al cálculo de consistencia interna de las puntuaciones. A continuación, se describen las características de las escalas empleadas, mientras que las métricas de los modelos factoriales se describen en los resultados.

Las variables asociadas con la TAP fueron medidas aplicando el instrumento diseñado por Stone et al. (2010), basado en escalas tipo Likert de cinco puntos. Seguidamente se describe cada instrumento.

Control conductual percibido. Cuestionario de cuatro reactivos que miden la facilidad o dificultad percibida para hacer trampa. Toma valores entre 4 y 20 puntos y mostró buenas propiedades en el modelo factorial con puntuaciones de consistencia interna modestas.

Actitud hacia la trampa. La versión de Stone et al. (2010) se compone de cinco reactivos, pero el AFC en la muestra indicó que el modelo factorial con buen ajuste se compone de cuatro ítems, cuyas puntuaciones altas indican aproximación positiva hacia la trampa. Toma valores entre 4 y 20 puntos.

Intención conductual. La versión original se compone de ocho reactivos, de los cuales se eliminaron tres. Evalúa la probabilidad de que el evaluado realice actos deshonestos en el medio académico. Toma valores entre 5 y 25 puntos.

Norma subjetiva. Originalmente formada por siete reactivos, en este estudio el AFC demostró que el modelo de mejor ajuste responde a una composición de cuatro ítems, los cuales miden en qué medida la persona considera que los actos fraudulentos son frecuentes. Toma valores entre 5 y 20 puntos.

Por su parte, para evaluar las demás variables cognitivas y las conductas de DA se aplicaron los siguientes instrumentos:

Autoconcepto académico. Se empleó la subescala de autoconcepto académico-laboral del cuestionario AF-5 (Musitu et al., 1991), que emplea cinco reactivos tipo Likert (total desacuerdo/total acuerdo) de estructura unidimensional. Toma valores entre 5 y 25 puntos.

Neutralización. Se empleó el Cuestionario de Actitud de Neutralización (Ling et al., 2014), integrado por 11 reactivos tipo Likert de siete puntos (completo desacuerdo/completo acuerdo). Se identificó una solución unidimensional conformada por los cinco primeros reactivos de la prueba con buenas métricas de ajuste y excelente consistencia interna.

Deshonestidad académica. Se emplearon tres subescalas ad hoc basadas en cuestionarios previos (Ling et al., 2014; Mejía y Ordoñez, 2004; Stone et al., 2010). La primera incluye cuatro ítems que miden la tendencia a copiarse o dejarse copiar; la segunda, cinco ítems sobre plagio o falsificación en asignaciones académicas; y la tercera, cinco reactivos sobre engaño, definido como el uso de información ficticia o manipulación de información para obtener beneficios. Los instrumentos están disponibles contactando a los autores.

2.4. Procedimiento

La selección de participantes contó con autorización previa de las autoridades institucionales. Los instrumentos se aplicaron grupalmente en cada universidad, con un tiempo promedio de 20 minutos por grupo. Se obtuvo consentimiento informado escrito de todos los participantes, cumpliendo con la

Declaración de Helsinki y la Ley 1090 del Congreso de la República de Colombia. Posteriormente, el plan de análisis de datos se ajustó a las fases de la metodología SEMMA (SAS Institute, 2012), descritas como se muestra en la Tabla 1:

Tabla 1. Descripción de las fases metodológicas SEMMA seguidas para el plan de análisis de datos.
Fase Descripción Actividades
Sample (muestreo) Captura de los datos. Recolección de 561 observaciones. Organización de la base de datos. Sin registro de datos perdidos.
Explore (exploración) Agrupamiento de datos, visualización, observación exploratoria. Exploración de variables; corrección de métricas mediante AFC para garantizar validez de las mediciones; análisis descriptivo.
Modify (modificación) Ajuste de datos para modelado. Selección o transformación de variables. Modificación de variables antes de definir modelos Machine Learning con Regresión logística y Random Forest (p. e.: convertir variable objetivo a dicotómica).
Model (modelado) Determinar modelos de análisis seleccionando la técnica apropiada, los criterios de entrenamiento y afinación del modelo. Separación de conjuntos de entrenamiento y prueba empleando 75% y 25% de los datos respectivamente. Definición de criterios de preprocesamiento. Creación y entrenamiento de modelos. Realización de predicciones en el conjunto de prueba.
Assess (evaluación) Evaluación del funcionamiento del modelo. Análisis en conjunto de datos de prueba para evaluar el rendimiento de los modelos. Cálculo de importancia de los predictores.

2.4.1. Análisis de datos

Adecuación de la matriz de datos

Se realizó análisis exploratorio de los datos para revisar las propiedades métricas de las escalas y garantizar la validez de medición. Posteriormente se aplicó AFC usando matrices policóricas y método de mínimos cuadrado ponderados, calculando las siguientes métricas: Chi cuadrado, Chi cuadrado grados de libertad (χ2/gl), Error de aproximación cuadrático medio (RMSEA), Índice de bondad de ajuste (GFI), Raíz cuadrada media residual estandarizada (RMSR), Índice de ajuste comparativo (CFI). Las puntuaciones de consistencia interna se calcularon con Alpha de Cronbach y Omega de McDonald.

Análisis descriptivo y relacional

Para explorar el comportamiento de las variables se realizó análisis descriptivo calculando medidas de tendencia central y de dispersión para las variables cuantitativas. Con el fin de tener una descripción puntual de la prevalencia de conductas de DA, estas fueron calculadas de acuerdo con su comisión o no. Adicionalmente, se empleó coeficiente rho de Spearman para calcular las relaciones existentes entre las variables de la TAP, el autoconcepto académico y la neutralización.

Modelo de regresión logística

Se realizó un modelo de regresión logística con el software Phyton, empleando como variables predictoras las relativas a TAP, el autoconcepto académico y la neutralización. La variable objetivo fue DA, para lo cual se empleó la puntuación total obtenida en dicha variable, sin embargo, al tratarse de una variable numérica fue necesario crear una variable dummy que permitiera el procedimiento de regresión logística. Se calculó pseudo R2 para identificar la proporción de la varianza explicada por los predictores, y se calcularon las métricas asociadas con la matriz de confusión para identificar la capacidad predictiva del modelo.

Modelos de árboles de clasificación

Adicional a la regresión, se modelaron árboles de clasificación con la librería sklearn de Phyton, utilizando Random Forest Classifier (RFC), que combina múltiples árboles de decisión mediante aleatorización, integrando sus predicciones en una única salida para clasificación. RFC destaca por identificar interacciones significativas y efectos no lineales de los predictores sin que sean previamente especificados por el investigador (Rigatti, 2017). Además, emplea un enfoque de ensamblaje donde inicialmente se seleccionan las muestras de entrenamiento para ajustar un número grande de árboles de decisión. Para cada árbol se aplica la técnica bagging (muestreo bootstrap), consistente en tomar una muestra aleatoria con reemplazo de los datos de entrenamiento. Posteriormente se construyen los árboles de decisión empleando un subconjunto aleatorio de características, lo cual reduce el riesgo de sobreajuste al aumentar la diversidad. Tras construir todos los árboles, RFC combina las predicciones de cada uno para hallar la predicción final. En los problemas de clasificación este proceso se hace por votación, es decir, cada árbol vota por una clase o promedio de las probabilidades predichas. La predicción final está determinada por la mayoría de los votos o el promedio de las predicciones de los árboles individuales.

En este estudio, los datos se dividieron en un 75% para entrenamiento y 25% para prueba. En el conjunto de entrenamiento, los hiperparámetros óptimos se calcularon y validaron mediante el método Out-of-Bag error (OOB), que emplea las instancias no incluidas en la muestra para construir un determinado árbol. Dichas instancias se emplean como datos de prueba para ese árbol, facilitando calcular la precisión del modelo a partir de las instancias no usadas. En RFC, la métrica de OOB que se obtiene es el accuracy. Posteriormente se evaluó el modelo empleando los datos de prueba para medir su rendimiento en datos no vistos, calculando la matriz de confusión, accuracy, F1-Score y el classification report. Finalmente, se estimó la importancia de los predictores, generando la gráfica respectiva.

3. Resultados

3.1. Adecuación de las medidas

Se comprobó la estructura factorial de las escalas. Los resultados del AFC se presentan en la Tabla 2, describiendo las métricas obtenidas para cada escala, con valores favorables tanto en su estructura factorial como en las puntuaciones de consistencia interna. Únicamente se registran puntuaciones modestas en este último indicador para la escala que mide control conductual percibido (α = .615, ω = .655), en todos los demás casos los constructos están bien representados.

Tabla 2. Ajuste de propiedades psicométricas de los instrumentos.
Análisis factorial confirmatorio
AA N NS AT CP IC DaC DaE DaP
x2 11.83 11.84 4.03 2.30 5.21 8.34 4.86 8.64 10.79
p .037 .036 .133 .031 .073 .138 .087 .124 .055
gl 5 5 2 2 2 5 2 5 5
x2/df 2.3 2.3 2.0 1.15 2.6 1.6 2.4 1.7 2.1
CFI .998 .999 .999 .999 .998 .999 .998 .998 .998
TLI .996 .998 .997 .999 .995 .998 .996 .996 .996
GFI .998 .999 .999 .999 .998 998 .999 .998 .998
NFI .997 .998 .998 .998 .997 998 .997 .995 .996
NNFI .996 .998 .997 .999 .995 998 .996 .996 .996
RMSEA [IC90%]

.049

[.011-.086]

.049 [.011-.086] .042 [.000-.103] .016 [.000-.087] .053 [.000-.112] .034 [.000-.074] .050 [.000-.109] .036 [.000-.075] .045 [.000-.083]
RMSR .024 .021 .018 .015 .027 .023 .020 .027 .027
Análisis de consistencia interna
α .838 .879 .779 .740 .615 .823 .789 .775 .809
Ω .838 .882 .783 .747 .655 .831 .788 .777 .812

Nota. x2/gl = Chi-squared degree of freedom; CFI = Comparative Fit Index; TLI = Tucker-Lewis Index; RMSEA = Root Mean Square Error of Approximation; RMSR = Root Mean Square of Residuals; AA= Autoconcepto académico, N=Neutralización, NS = Norma subjetiva, AT = Actitud hacia la trampa, CP = Control conductual percibido, IC = Intención conductual, DaC = Copiar, DaE = Engañar, DaP = Plagio-falsificación.

3.2. Evaluación de conductas de DA

La puntuación media de las escalas de DA fue 25.78 (DE = 9.34), reflejando una elevada prevalencia de comportamientos deshonestos en el estudiantado. La prevalencia general de DA asciende al 90.5%, siendo más comunes las conductas de Engaño (86.1%), seguidas de Copia (76.6%) y Plagio-falsificación (73.7%), con porcentajes muy similares entre las dos últimas. La Tabla 3 recoge cada una de las prácticas empleadas según las categorías descritas: para la Copia, sobresale ofrecer ayudas prohibidas a compañeros, y le sigue la copia de tareas de otros. Para el Engaño, la conducta más prevalente es proporcionar tareas a otros estudiantes y le sigue agregar a un trabajo a un compañero que no ha participado de él. Entre las prácticas de Plagio-falsificación sobresale usar material original sin citarlo debidamente y anexar a la bibliografía referencias que no han sido leídas.

Tabla 3. Prevalencia general (porcentaje) de conductas deshonestas y diferenciación según género y área del conocimiento.
Prevalencia Género Campo disciplinar
Hombre Mujer Educación Sociales
Copiar
Obtener preguntas del examen ilegalmente 41.7 52.1 33.9 46.3 32.9
Utilizar equipos electrónicos no autorizados durante un examen 40.8 48.7 34.9 49.9 23.7
Copiar tareas de otros 55.1 63.3 48.9 65.1 36.1
Ayuda de forma prohibida a otros 66.7 73.7 61.4 16 48.9
Engañar
Presentar una tarea o trabajo que ya había presentado para otra materia/semestre 39.6 50.8 31.2 51.7 16.5
Pasar un trabajo o tarea a otro estudiante 71.5 81.3 64.2 80.6 54.1
Hacer menos de su parte de trabajo en una actividad o proyecto grupal 43.7 53.3 36.5 49.6 32.4
Ser agregado en un trabajo sin haber participado en él 49.7 64.2 38.9 59.1 31.9
Agregar a un compañero/a en un trabajo sin que haya participado en él 67.6 74.2 62.7 72.2 58.8
Plagio-falsificación
Fabricar una bibliografía que realmente no consultó 38.5 48.3 31.2 46.6 23.2
Copiar algunas frases de una fuente publicada o de Internet, sin dar crédito al autor 54.2 58.8 50.8 62.1 39.2
Referenciar materiales sin leerlos 51.5 60.8 44.5 59.9 35.6
Suplantar o ser suplantado para realizar una evaluación 27.1 35.4 20.9 33.8 14.4
Escribir un trabajo para otro estudiante 50.8 57.1 46.1 60.2 33

3.3. Relaciones entre autoconcepto académico, neutralización y TAP

El análisis descriptivo de las variables independientes reveló medias bajas para las variables de la TAP, lo cual también ocurre con la media de neutralización, en cambio, el autoconcepto presenta media elevada. Sin embargo, es clara la variabilidad de los datos al identificarse coeficientes de variación grandes, señal de que existen estudiantes con puntaciones dispares en cada una de las variables estudiadas. Estos datos se han incluido en el mapa de calor de la Figura 1, que registra las correlaciones calculadas entre las diferentes variables, observándose que todas las relaciones presentan p-valor inferior a .01, con relaciones inversas del autoconcepto académico con todas las variables exceptuando la norma subjetiva, con la cual la relación es directa. La neutralización correlaciona directamente con el control percibido y la intención conductual, e inversamente con la norma subjetiva y el autoconcepto académico.

Estos resultados corresponden con lo dispuesto en el escenario teórico, sugiriendo que los sujetos que ven la trampa como algo antinormativo o que poseen mejor autoconcepto académico, no emplean racionalizaciones para justificar la trampa. Quienes asumen tener facilidad para hacer trampa y la intencionalidad de cometerla, neutralizan para librarse de responsabilidad.

Figura 1. Matriz de correlación con información de los datos descriptivos de las variables independientes numéricas.

Nota. Mean: media, SD: desviación estándar, CV: coeficiente de variación.

3.4. Modelo de regresión logística

Se dicotomizó la DA utilizando los valores de la mediana. Esta elección se basó en la robustez de esta medida ante valores atípicos o extremos, especialmente en presencia de una distribución no normal. Se creó una variable dummy a partir de la mediana (≤ 24 y > 24); en la nueva variable binaria, 0 representa puntuaciones menores o iguales que la mediana y 1 representa puntuaciones mayores. Se prefirió este enfoque a otras opciones, como el cálculo de las desviaciones estándar por encima o por debajo de la media, o el uso de un porcentaje del coeficiente de variación para definir un rango alrededor de la media, puesto que dichos métodos podrían generar pérdida de información al no clasificar los valores contenidos entre los puntos de corte. Al utilizar la mediana se evita esta pérdida de información procurando una clasificación racional de los datos.

Las variables predictoras fueron entrenadas en un primer conjunto de datos. Se diseñó un modelo (Tabla 4) que obtuvo un valor pseudo R2de .3546, el logaritmo de verosimilitud de los datos (Log-Likelihood) obtuvo un valor de -199.86 y el p-valor de la prueba de Razón de similitud (LLR p-value) que compara el modelo de análisis con un modelo nulo, fue notablemente menor a .05 (p = 1.277e-44), sugiriendo que el modelo es mejor a un modelo nulo (que no tiene las variables predictoras y simplemente predice el promedio de la respuesta todo el tiempo).

Tabla 4. Resultados regresión logística múltiple.
Coeficiente EE Z p > |z| IC 95%
Inferior Superior
Constante -1.1134 1.467 -.759 .448 > .05 -3.989 1.762
intención .3287 .047 7.325 .000 < .001 .241 .417
actitud .1269 .047 2.658 .008 < .01 .033 .219
norma -.1090 .045 -2.398 .016 < .05 -.020 .198
control .0132 .050 .263 .792 > .05 .085 .111
neutralización .0720 .025 2.827 .005 < .01 .022 .122
autoconcepto -.1458 .050 -2.923 .003 < .01 -.048 .244

Sin embargo, tras calcular la matriz de confusión empleando un umbral de decisión de 0.5, en el conjunto de prueba se identificó que el modelo clasificó correctamente 48 verdaderos positivos y 40 verdaderos negativos, mientras que los falsos negativos fueron 10 y los falsos positivos 15, lo cual condujo a un Accuracy de 77.87%, con una precisión de .8275 y un recall de .7619, indicativo de una sensibilidad modesta a la hora de identificar los estudiantes que efectivamente cometen DA.

3.5. Modelo de árbol de clasificación

Se entrenaron los datos a partir de las variables asignadas como predictoras y se calcularon los siguientes hiperparámetros: max_depth, min_samples_leaf, min_samples_split, y n_estimators, con profundidad máxima (max_depth) 3. El número mínimo de muestras necesarias para estas en una hoja (min_samples_leaf) fue 2, es decir, las hojas pueden contener dos muestras, mientras cada nodo interno se divide con un mínimo de 5 muestras (min_samples_split). Finalmente, n_estimators igual a 300 árboles en el bosque.

La validación de hiperparámetros con OOB obtuvo un Accuracy de .7809, señalando que el modelo logró una precisión del 78.1%. En la Figura 2 se visualiza la matriz de confusión obtenida en el conjunto de entrenamiento, clasificando correctamente 203 verdaderos positivos (estudiantes con puntuaciones altas) y 143 verdaderos negativos (estudiantes con puntuaciones bajas). El reporte de falsos negativos es de 28 estudiantes, es decir, sujetos clasificados con baja puntuación de DA cuando en realidad es alta.

Figura 2. Matriz de confusión del conjunto de entrenamiento.

Posteriormente se realizó la predicción y evaluación del modelo en el conjunto de prueba, cuyos datos se registran en la Tabla 5 y se comparan con las métricas obtenidas durante el entrenamiento. El modelo parece generalizar adecuadamente los resultados a datos no vistos, en la medida que las métricas obtenidas en la prueba son comparables con las halladas en el entrenamiento. La precisión general es del 84%, identificando en ambos conjuntos de datos una métrica de recall de buen desempeño, que alcanza el 88% en entrenamiento con un aumento al 90% en la prueba. Este dato señala que el modelo clasifica correctamente los estudiantes con puntuaciones sobre la mediana, que sugieren altos valores de DA, mostrando un mayor nivel de precisión que el modelo de regresión logística.

Tabla 5. Métricas de evaluación durante entrenamiento y prueba.
Validación Entrenamiento Prueba
Verdaderos positivos 203 63
Falsos negativos 28 7
Falsos positivos 46 15
Verdaderos negativos 143 56
Accuracy .82 .84
Métricas de la matriz 0 1 0 1
Precision (Precisión) .84 .82 .89 .81
Recall (Sensibilidad) .76 .88 .79 .90
F1 Score .79 .85 .84 .85

Nota: 0 = puntuaciones ≤ Me, 1 = puntuaciones > Me.

Por último, se calculó la importancia de los predictores del modelo entrenado. Los datos muestran a la intención conductual, la neutralización y la actitud hacia la trampa como los predictores más importantes (Figura 3).

Figura 3. Importancia de los predictores a partir de la pureza de los nodos.

4. Discusión y conclusiones

Este estudio buscó pronosticar la DA de universitarios a partir de la TAP, el autoconcepto académico y la neutralización. El análisis partió de identificar las prácticas deshonestas de los participantes, entre las cuales sobresalió el engaño como la forma fraudulenta más común, seguida de la copia y el plagio-falsificación. Las cifras identificadas son exorbitantes, al reportar que 90.5% de los evaluados reconoció haber realizado comportamientos no éticos en su vida académica. Esta prevalencia es notoriamente más alta a la reportada en trabajos internacionales previos (Maloshonok y Shmeleva, 2019; Ternes et al., 2019), pero reiteran la prevalencia hallada en estudiantes colombianos (Mejía y Ordoñez, 2004; Martínez y Ramírez, 2017; Martínez et al., 2015).

Tal evidencia redunda sobre el negativo diagnóstico del problema que representa el fraude en educación superior, comúnmente vinculado con un deterioro de la calidad educativa, siendo un notable contraejemplo del propósito de la formación integral a nivel profesional. La DA no atenta únicamente contra la educación, sino que afecta la capacidad de razonar críticamente, la formación cívica y el orden moral del comportamiento (Diez-Martínez, 2015). El impacto social real de estas conductas es difícil de calcular, pero su penetración es tanta, que la misma Comisión Europea (2014) ha revelado que subyace a prácticas altamente problemáticas para una sociedad como la corrupción, el soborno o la evasión de impuestos.

Los hallazgos sostienen que estas conductas son pronosticadas a partir de la interacción de las variables incluidas en el modelo de análisis, aunque los predictores más relevantes se enfocan en la intención conductual, la actitud hacia la trampa y la neutralización. Esta última cobra relevancia al interactuar con las variables de la TAP predisponiendo a las prácticas deshonestas. Su importancia es notoriamente superior a la del autoconcepto académico, aunque el papel de esta última merece una evaluación más detenida. En

el análisis de correlación se identificó que el autoconcepto de los estudiantes se relacionaba inversamente con las variables de la TAP, excepto la norma subjetiva, cuya relación fue directa, lo cual sugiere que percibir la trampa como norma justificada les permite racionalizar su conducta sin que se afecte su percepción como estudiantes (Mauz et al., 2022). Sin embargo, el autoconcepto ocupa el cuarto lugar entre las variables predictoras más importantes, mientras que la norma subjetiva es la de menor relevancia en el RFC. Esto puede indicar que ambas variables tienen efectos indirectos o que su influencia está mediada por otras variables del modelo, como la neutralización. Trabajos futuros pueden explorar el rol del autoconcepto como un factor modulador en lugar de desencadenante directo de la DA.

El rol de la neutralización es un hallazgo novedoso en relación con la evidencia previa que ha demostrado con solvencia que la TAP es buena predictora de la DA. La perspectiva tradicional ha mostrado un fuerte papel del control conductual puesto que permite evaluar la oportunidad o disponibilidad para cometer trampa (Hendy y Montargot, 2019), por lo que se ha asumido como un buen predictor de la intención conductual (Stone et al., 2010). Sin embargo, en el modelo obtenido en este estudio, junto con la intención, es la neutralización la variable de mayor importancia relativa para pronosticar la deshonestidad, lo cual sugiere que su participación con la TAP conduce a implicaciones prácticas particulares, pues, junto con la descrita modestia predictiva de autoconcepto académico o la norma subjetiva, estos hallazgos sugieren que la DA depende menos de procesos sociales externos y más de racionalizaciones internas que conducen a los estudiantes a justificar su comportamiento sin compromisos de su autoimagen.

La literatura ha mostrado que la neutralización se emplea como un dispositivo para librar al infractor de culpa, incluso, sirve como incentivo para el fraude (Curasi, 2013; Lee et al., 2020). Al neutralizar, los estudiantes se absuelven a sí mismos de toda falta recurriendo a mecanismos de negación de responsabilidad, negación del perjuicio y el desplazamiento de la responsabilidad a terceros (incluidos los mismos docentes) (Brent y Atkinson, 2011; Olafson et al., 2013). Es de entenderse entonces, que tales racionalizaciones coincidan con actitudes que favorecen la realización de trampa, y con ello, que se disponga de la intencionalidad de cometerla, tal y como lo ha mostrado el modelo de análisis hallado en este estudio.

La evidencia obtenida es cercana a la descrita por Pavlin-Bernardić et al. (2016), quienes identificaron a la neutralización como uno de los predictores más poderosos de DA. Para los autores, el fraude se relaciona con motivaciones asociadas con el aprendizaje, es decir, se justifica en la medida que el objetivo es aprobar, además de estar estrechamente asociadas con actitudes favorables hacia la trampa. En resumen, los resultados refuerzan la importancia de la TAP en el pronóstico de la DA, y ponen en discusión el crucial papel de la neutralización como predictor que interactúa funcionalmente con las actitudes hacia la trampa y la intención conductual.

4.1. Limitaciones

Es bien sabido que los modelos de Machine Learning funcionan mejor con grandes conjuntos de datos, por lo cual es necesario adelantar estudios posteriores con muestras más grandes. Además, es notable la discrepancia entre los resultados de los dos modelos calculados, pues en la regresión logística la relevancia relativa a cada predictor es distinta al modelo definitivo con RFC. Sin embargo, son varios los motivos que pueden explicar esta diferencia. Primero, ambos algoritmos de aprendizaje supervisado obedecen a procedimientos de cálculo diferentes. Mientras el primero estima coeficientes para cada predictor basándose en una relación lineal, en RFC no se asume tal linealidad, por el contrario, explora características no lineales, siendo una de sus ventajas.

En segundo lugar, los modelos de regresión lineal afrontan el problema de la multicolinealidad cuando las características están altamente relacionadas, lo cual no es un problema significativo al emplear RFC, precisamente porque los árboles pueden operar sobre relaciones no lineales. Estos elementos llevan a sostener que la solución basada en árboles ha sido la más adecuada para los datos de este estudio.

4.2. Implicaciones prácticas

Hasta ahora, las estrategias enfocadas en prevenir el fraude han respondido a acciones obvias como aumentar la vigilancia durante los exámenes, diseñar varias versiones de un examen, usar programas antiplagio, limitar el acceso a tecnología, cambiar a los estudiantes de sus asientos al momento de evaluar (Hendy y Montargot, 2019; Miller et al., 2017), etc. Sin embargo, como han mostrado los resultados, detrás de la DA hay implicaciones morales, éticas y actitudinales que conducen a que los estudiantes perciban que en la trampa existe un valor intrínseco, lo cual demanda que las intervenciones superen lo punitivo y lo disuasivo (Ríos-Avendaño et al., 2024), para enfocar la cultura educativa en la integridad por encima del rendimiento, conduciendo a percibir el fraude como inaceptable (Miller et al., 2017).

A partir de esa consigna, proponemos incorporar políticas educativas que fomenten la integridad académica, apelando a diversas estrategias. Un esquema de resumen se observa en la Figura 4.

Figura 4. Representación esquemática de la aplicación de los resultados en la propuesta de políticas educativas de intervención.

Referencias