juni 22, 2021

Vikten av att förstå ”false positives” och deras betydelse

Plagiering är ett allmänt hot mot den akademiska integreteten och originella tankar. Om du inte citerar och använder korrekta källhänvisningar, så att ingenting av ditt skrivna arbete – oavsett om undersökningar, avhandlingar eller annat skrivet material – kan tillskrivas dig, så blir du snabbt en tagg i sidan inom den akademiska sfären. Om vi inte vore så noga med att citera och hänvisa till våra källor så skulle den akademiska världen vara i konstant bråk om vem som kan anses vara den rättmätige författaren till en text.

Plagieringskontrollerande system är därför hjälpsamma och viktiga tillägg för alla instutioner som fokuserar på kunskap och lärande. Ett sådant system hjälper oss att spara tid genom att automatiskt markera misstänkta fall av plagiering istället för att vi, manuellt, ska behöva söka efter likheterna online, gå igenom varje sida i miljontals olika böcker, eller någon annanstans.

Att hitta potentiell plagiering i texter, uppsatser eller även i doktorsavhandlingar är dock något som kan vara besvärligt. Ett vanligt förekommande hot i kampen mot plagiering är att inte identifera så kallade ”false positives” och att underskatta deras betydelse. Men låt oss först förstå vad som menas med ”false positives” och varför de är så viktiga.

”False positives” i ett plagieringskontrollerade system syftar på en text som har markerats som överensstämmande, eller åtminstone att vara likt innehållet som jämförts mot systemets databas, men som inte nödigtivs skulle ses som överensstämmande om innehållet inte vore tagna ur sitt sammanhang.

För att förtydliga vad som menas med ovanstående; nedanstående exempel visar på en överenstämmelse och den boldade texten markerar denna överensstämmelse:

  • ”Salt och peppar” <> ”Katter och hundar” – 33%
  • ”Tre män i en båt” <> ”Livet i en medeltida stad” – 40%
  • ”Tom Sawyers äventyr” <> ”Sherlock Holmes äventyr” – 60%


Den text som plagieringssystemet markerar som överensstämmande är vanliga fraser och ord, däribland ”och” samt ”i en” i det svenska språket: dessa ord bör inte inkluderas i analysrapporten – som i sin tur avgör procentandelen av överenstämmande innehåll i en inlämnad uppgift. Att räkna med dessa fynd betyder att, medan procentandelen av textens övergripande likheter stiger, så minskar dess relevans. Inkluderingen av dessa vanligt förekommande ord som potentiella textmatchningar är vad som menas med ”false positives”.

I många fall så är ”false positives” ord som är vanligt förekommande inom ett specifikt språk istället för komplicerade konjunktioner eller appositioner. Sanningen är den, att i den stund som 100% inte längre är 100%, så suddas gränser ut, linjer blir otydliga och vi går in i en gråzon – för hur kan vi kalkulera relevansen av de olika ord som utgör en text och omvandla detta till procent?

Likheterna som upptäcks kan bli överväldigande

Att visa allt och alla de hittade fynden, i den överensstämmande texten, skulle bara orsaka en enda röra och skapa förvirring, för att inte tala om risken att rikta uppmärksamheten ifrån faktiska fall av plagiering. Det är som om du skulle skriva in meningen ”I don’t know” i Google; du skulle bli översköljd med resultat. Prova. (Du skulle få runt 7 miljarder resultat! ”Jag vet inte” på svenska skulle inte ge dig riktigt lika många resultat, 119 miljoner, men tillräckligt många för att vara precis lika överväldigande i slutändan)

Eller tänk dig meningen ”Denna sida lämnas medvetet blank”. Skulle denna träff ens vara begriplig om du fick se den i en plagieringsrapport? ”False positives” kan också få dig att spendera mer tid än vad som egentligen är nödvändigt på att gå igenom varje fynd för att kunna säga vad som är en pålitlig träff och vad som inte är detta. Vad värre är, ett sådant sökande efter ”äkta” och ”falsk” plagering, underminerar användandet och förtroendet för plagieringskontrollerande system helt och hållet. Frustrationen, över att behöva spendera all din tid på att sålla ut ”false positives”, skulle troligen få dig att ge upp i dina ansträgningar att granska den grad av faktisk plagiering som, med all sannolikhet, förekommer i texten som du går igenom.

Hur kan vi ta itu med utmaningen som är ”false positives”?

”False positives” är ett stort hot mot originalitet och vi behöver ta itu med dessa på ett lämpligt sätt. Ett sätt att minimera ”false positives” är användandet av ett plagieringskontrollerande system som Ouriginal, vilket använder sig av ”Machine Learning” för att på egen hand lära sig se mönster och, i takt med ökad förståelse, ge allt mer relevanta svar. Designen är sådan att Ouriginals algoritmer är i konstant utveckling för att upptäcka och uppmärksamma vad som är en relevant textmatchning och vad som inte är relevant. Ouriginals teknologi hjälper dig att göra mer informerade beslut genom att minimera förvirring och begränsa irrelevant data, vilket i sin tur ökar träffsäkerheten av våra fynd och även träffsäkerheten för relevant information.

Om du skulle vilja veta mer om hur Ouriginal reducerar effekten av ”false positives”, vänligen kontakta oss.

This website uses cookies to improve the site’s overall user experience and performance. Read more here.