junio 28, 2021

Entender los falsos positivos y por qué son importantes

El plagio es una amenaza constante para la integridad académica y el pensamiento original. Si no cita y hace referencia correctamente, la investigación, los artículos y otro material que se ha escrito no se pueden atribuir correctamente y lo más probable es que la academia se vea envuelta en constantes peleas sobre quién fue el autor original.

Por lo tanto, los sistemas de detección de plagio son complementos útiles y cruciales para todas las instituciones que crean conocimiento. También nos ayudan a ahorrar tiempo al marcar automáticamente los casos sospechosos de plagio en lugar de tener que buscar manualmente similitudes en línea o en otro lugar.

Sin embargo, encontrar plagio potencial en textos, ensayos o incluso tesis doctorales puede ser complicado. Una amenaza común en la lucha contra el plagio es no reconocer los llamados «falsos positivos» y subestimar su importancia. Pero primero, comprendamos qué son los falsos positivos y por qué son tan importantes.

Un falso positivo en un sistema de detección de plagio se refiere al texto que se ha marcado como coincidente o similar al contenido en comparación con la base de datos del sistema, pero que no es estrictamente cierto ya que la coincidencia puede estar fuera de contexto.

Por ejemplo, eche un vistazo a los siguientes ejemplos en los que el texto rojo marca un texto coincidente:

  • “Salt and pepper”<> “Cats and dogs” – 33%
  • “Three men in a boat” <> “Life in a Medieval City” – 40%
  • “The Adventures of Tom Sawyer” <>  “The Adventures of Sherlock Holmes” – 60%

Los textos coincidentes marcados por el verificador de plagio son básicamente frases y palabras comunes, incluidos «and» o «in a» y, por lo tanto, no deben incluirse en el informe de análisis, que determina el porcentaje general de contenido coincidente que se encuentra en una tarea enviada. Contar estos hallazgos significa que, si bien el porcentaje de similitud general del texto aumenta, su relevancia disminuye. Incluir estas palabras comunes como posibles coincidencias de texto es lo que se conoce como falsos positivos.

Muchas veces, los falsos positivos son palabras que son extremadamente comunes en el idioma específico en lugar de complicadas conjunciones y aposiciones. Lo cierto es que una vez que dejamos la marca del 100% de similitud, las líneas se vuelven borrosas -porque ¿cómo se calcula la relevancia de las distintas palabras que componen un texto y se traduce en porcentaje?

Los resultados de similitud pueden ser abrumadores

Mostrar todos los textos y hallazgos coincidentes puede causar desorden y confusión, sin mencionar el riesgo de desviar la atención de casos reales de plagio. Básicamente, es como buscar en Google la frase «No sé», donde simplemente te abrumarán los resultados. Intentalo. (¡Le dará alrededor de 7 mil millones de resultados de búsqueda!)

O piense en la frase «Esta página se dejó intencionalmente en blanco». ¿Tendría sentido ver esta coincidencia en un informe de plagio? Los falsos positivos también hacen que dedique más tiempo del necesario, ya que tendrá que revisar cada hallazgo para determinar si realmente coincide o no. Lo que probablemente sea peor es que socava por completo la utilización y la confianza en los programas de detección de plagio. Si terminas pasando un tiempo interminable examinando falsos positivos, la frustración probablemente hará que renuncies a tus esfuerzos por evaluar el nivel de plagio real en el texto que estás revisando.

¿Cómo podemos abordar el desafío de los falsos positivos?

Los falsos positivos son una gran amenaza para la originalidad y debemos abordarlos adecuadamente. Una forma de minimizar los falsos positivos es mediante el uso de un software de detección de plagio como Ouriginal, que utiliza algoritmos de aprendizaje automático que mejoran con el tiempo. Nuestro software está diseñado de tal manera que aprende constantemente a reconocer qué es una coincidencia de texto relevante y qué no. La tecnología de Ouriginal lo ayuda a tomar decisiones más informadas al limitar los datos desordenados e irrelevantes, mejorando así la precisión de los hallazgos.

Si desea saber más sobre cómo Ouriginal reduce el efecto de los falsos positivos, comuníquese con nosotros.

This website uses cookies to improve the site’s overall user experience and performance. Read more here.