Plagijavimo ir sukčiavimo aptikimas

Žemės ūkio paraiškų vertinimas / Projektas

Nacionalinei mokėjimo agentūrai (NMA) prie Lietuvos Respublikos žemės ūkio ministerijos pradėjome kurti automatizuotą finansavimo paraiškų analizės sistemą, skirtą sumažinti dvigubo finansavimo ir apgaulingų paraiškų pateikimo riziką.

NMA kasmet gauna daugiau kaip 8 000 paraiškų, todėl rankiniu būdu peržiūrėti ir aptikti sukčiavimo atvejus yra didelis iššūkis. Dabartinis metodas reikalauja daug laiko ir darbo sąnaudų, kyla klaidų rizika, ypač nustatant organizuotas sukčiavimo schemas. Be to, duomenys pateikiami įvairiais nestruktūrizuotais formatais, o tai apsunkina analizę.

Pagrindinės sprendimo savybės

Sistema apdoroja įvairių formatų finansavimo paraiškas, konvertuodama jas į struktūrizuotus duomenis analizei atlikti. Duomenų ištraukimo modulis apdoroja JSON, PDF, „Word“ ir kitus formatus, prireikus naudodamas optinį ženklų atpažinimą (OCR).

Pažangūs algoritmai analizuoja rašto struktūrą, žodyną ir stilių. Variklis naudoja BERT pagrįstus NLP modelius, kad palygintų tekstą ieškodamas panašumų ir šablonų.

Mašininio mokymosi modelis, apmokytas pagal istorinius sukčiavimo duomenis, nustato rizikingas paraiškas. Pagrindiniai sukčiavimo rodikliai yra neįprasti finansiniai modeliai ir projektų neatitikimai. Sistema, remdamasi istoriniais sukčiavimo atvejais ir anomalijų aptikimo metodais, kiekvienai paraiškai priskiria rizikos balą.

Įrankis sukuria standartinį kiekvieno projekto profilį, kuriame paraiškos suskirstomos į kategorijas pagal pagrindinius parametrus, pavyzdžiui, reikalingą finansavimo sumą, projekto tipą ir atitinkamus veiklos rodiklius. 

Išsamiose ataskaitose pateikiama paraiškų panašumų apžvalga, įskaitant rizikos profilį ir galimai nesąžiningų ar dirbtinai sukurtų paraiškų analizę. Šiose ataskaitose rizikos duomenys taip pat vizualizuojami naudojant interaktyvius valdymo skydelius.

Visi duomenys apdorojami ir saugomi kliento vidinėje infrastruktūroje; išorinės paslaugos nenaudojamos. Jautri informacija tiek perdavimo, tiek saugojimo metu šifruojama naudojant AES-256 šifravimo standartus. Prieigos kontrolė užtikrina, kad prieigą prie konfidencialių duomenų turėtų tik įgalioti darbuotojai.

Sistemos architektūra

Sistema sukurta naudojant modulinę ir plečiamą architektūrą, skirtą dideliam našumui ir saugumui užtikrinti. Ji suskirstyta į kelis pagrindinius sluoksnius, kurių kiekvienas atsakingas už skirtingus duomenų apdorojimo darbo eigos aspektus. Įvesties sluoksnis tvarko duomenų failų įkėlimą ir atlieka pradinio pirminio apdorojimo užduotis, įskaitant žymėjimą (tokenization) ir OCR, kad šie dokumentai būtų paversti analizei tinkamais struktūrizuotais formatais. Parengus duomenis, apdorojimo sluoksnis taiko pažangius mašininio mokymosi modelius teksto palyginimui, plagiato aptikimui ir sukčiavimo identifikavimui. Galiausiai išvesties sluoksnis sukuria išsamias ataskaitas, kuriose apibendrinamos sistemos išvados.

Plėtros perspektyvos

Šis sprendimas gali tapti įrankiu, kurį būtų galima taikyti kitose viešojo sektoriaus srityse. Nuolat tobulindama sistemą permokymu mašininio mokymosi būdu ir modelio optimizavimu, sistema gali padidinti savo tikslumą ir aptikimo galimybes. Be to, architektūros masteliškumas atveria tarptautinio ar kelių agentūrų naudojimo galimybes.

Klientas

Nacionalinė mokėjimo agentūra (NMA)

Eiti į interneto puslapį

Previous
Previous

Dokumentų atpažinimas transporte

Next
Next

DI spektroskopinė analizė