Projekti ettepanek
AI Uurija
Teadmussiirde ja operatiivse efektiivsuse parandamine uurimisasutuses
Iren Irbe
MTA
Detsember 2025
Probleem
Uurimised on muutunud kognitiivselt üha koormavamaks.
Andmete üleküllus
Tänapäeva uurimised toodavad väga suuri andmemahtusid (sageli üle 1 TB juhtumi kohta). Praegused töövahendid ei toeta piisavalt infotööd.
Killustatud info
Info on jaotatud mitmete süsteemide ja erinevate vormingute vahel.
Ajasurve
Uurijad peavad seostama fakte rangete tähtaegade tingimustes.
Dokumenteerimata kogemus
Oluline tööalane kogemus ja otsuste põhjendused jäävad sageli ainult inimese enda teada.
Põhijäreldus
Uurijad kulutavad liiga palju aega info haldamisele ja liiga vähe selle analüüsimisele.
Operatiivsed ja õiguslikud riskid
Aeglasemad uurimised
Käsitsi info töötlemine tekitab kitsaskohti ja pikendab juhtumite lahendamise aega.
Oluliste seoste märkamata jäämine
Suurem risk, et tõendite, isikute ja sündmuste vahelised kriitilised seosed jäävad avastamata.
Ebaühtlane arutluskäik
Erinevad lähenemised sarnastele juhtumitele toovad kaasa kvaliteedi kõikumise.
Õiguslik haavatavus
Suurem risk olukordades, kus otsuseid ei ole võimalik hiljem piisavalt selgitada ega põhjendada.
Olemasolevate lahenduste kitsaskohad
Avalikud tehisintellekti tööriistad
Ei sobi tundlike uurimisandmete töötlemiseks. Turva- ja konfidentsiaalsusnõuded ei luba pilvepõhiste AI-lahenduste kasutamist.
Pilvepõhised süsteemid
On vastuolus andmekaitsenõuetega. Tundlikud andmed ei tohi lahkuda kontrollitud keskkonnast.
Olemasolevad uurimistöö tööriistad
Keskenduvad dokumentide hoidmisele, mitte analüüsile. Need talletavad infot, kuid ei toeta arutluskäiku ega seoste loomist.
Ainult inimanalüüs
Ei skaleeru kasvavate andmemahtudega. Inimese kognitiivsed piirid on reaalsed.
Pakutav lahendus – AI Uurija (kontseptsioon)
Turvaline tehisintellekti abiline uurijatele
Lokaalne ja internetist eraldatud tehisintellekti lahendus, mis aitab uurijatel kõne ja tekstina kogutud infot korrastada, võimalikke selgitusi läbi mõelda ja olulist tööalast teadmist talletada nii, et andmed ei lahku uurimisasutusest ja kõik tegevused vastavad seadustele.
Süsteem analüüsib varasemaid juhtumeid, sh helisalvestisi ja märkmeid, tuvastab korduvaid mustreid ning aitab nende põhjal kaaluda võimalikke edasisi arenguid ja ennetavaid tegevusi.
Põhiprintsiibid
Turvaline ja asutusesisene
- Töötab täielikult MTA taristus
- Andmeid ei edastata pilveteenustesse ega väljapoole asutust
- Andmete kasutamine ja jagamine toimub vastavalt kehtivatele õiguslikele piirangutele (GDPR, LED, EL AI määrus)
Kontrollitav ja läbipaistev
- Kõik süsteemi vastused põhinevad konkreetsetel ja kontrollitavatel allikdokumentidel
- Süsteem näitab selgelt, millele järeldused ja seosed tuginevad
- Kõrge riskiga funktsioonid (nt emotsioonide tuvastamine) on teadlikult välistatud
Korrastab ja analüüsib juba toimunut
- Koondab varasemad juhtumid, sündmused ja tõendid
- Aitab tuvastada korduvaid käitumis- ja tegevusmustreid
- Toetab riskide ja võimalike edasiste arengute läbi mõtlemist
Toetab mõtlemist, mitte ennustamist
- Pakub võimalikke selgitusi ja stsenaariume, mitte kindlaid prognoose
- Aitab kaaluda erinevaid käitumismustreid ja nende mõju
- Ei tee järeldusi ega otsuseid inimese eest
Inimene on alati otsustaja
- Kõik süsteemi väljundid vajavad inimese kinnitust
- Uurija otsustab, milliseid mustreid ja stsenaariume arvesse võtta
- Vastutus jääb alati uurijale
Institutsiooniline mälu ja vastavus
- Aitab talletada korduvaid mustreid ja õppetunde, et need ei kaoks koos inimestega
- Toetab EL tehisintellekti määruse nõuete täitmist, sh põhiõiguste mõjuhinnangu (FRIA) koostamist
Mida süsteem aitab saavutada?
1. Suurte juhtumite kokkuvõtmine
Aitab kiiresti esile tuua olulised faktid sadadest lehekülgedest dokumentidest.
2. Seoste esiletõstmine
Aitab märgata seoseid isikute, sündmuste ja tehingute vahel, mis muidu võivad jääda tähelepanuta.
3. Hüpoteesidega töötamine
Toetab uurijat võimalike selgituste süstemaatilisel läbimõtlemisel ja võrdlemisel.
4. Arutluskäigu talletamine
Aitab salvestada uurimise loogika ja põhjendused hilisemaks ülevaatamiseks või kohtus selgitamiseks.
Mida see annab uurimisasutusele
Kiirem arusaamine juhtumitest
Uurijad mõistavad keerukaid juhtumeid kiiremini ja terviklikumalt.
Väiksem vaimne koormus
Vähem aega ja energiat kulub info otsimisele ja haldamisele.
Parem jälgitavus ja põhjendatavus
Uurimise arutluskäik on talletatud ja vajadusel üle vaadatav.
Selge otsustuspunkt edasiseks
Tõenditel põhinev otsus, kas ja kuidas lahendust edasi arendada.
Milleks taotletakse rahastust
Projekti ettevalmistus ja juhtimine
Projekti koordineerimine ja lahenduse ulatuse täpsustamine.
Lahendus ja taristu
Lokaalne serveripark, vajalik riistvara ja turvaline infrastruktuur lahenduse jaoks.
Õiguslik ja eetiline valideerimine
Vastavus GDPR-ile, LED-ile ja EL AI määrusele (sh FRIA).
Kasutamine reaalses töös
Lahenduse kasutamine kontrollitud tingimustes koos uurijatega.
Koolitus ja kasutajatugi
Kasutajate koolitamine ja tugi lahenduse loomise ajal.
Mõõtmine ja hindamine
Projekti tulemuste analüüs ja otsus edasise laiendamise kohta.
Praktilised kasutusrollid
AI Assistent
Välitöötajatele
- Hääljuhtimine: käed-vabad küsimused eesti ja inglise keeles
- Kiired kokkuvõtted: nt „Tee kokkuvõte viimastest raportitest kahtlusaluse X kohta"
- Protseduuriline tugi: kiire ligipääs juhenditele ja protokollidele töö käigus
AI Analüütik
Uurimisosakondadele
- Võimalike selgituste pakkumine: aitab mõelda läbi erinevad stsenaariumid
- Mõjude hindamine: nt mis võib juhtuda teatud meetmete rakendamisel
- Kriitiline vaade: juhib tähelepanu võimalikule kallutatusele või vahelejäänud seostele
Audiosekretär
Uurijatele ja tugipersonalile
- Automaatne protokollimine: koosolekute ja vestluste lokaalne tekstiks muutmine
- Ülesannete koondamine: tõstab häälmärkmetest esile tegevuspunktid
- Intervjuude tugi: aitab märgata vastuolusid ütlustes
AML tugi
Finantskuritegude uurimiseks
- Keerukate rahavoogude analüüs: sh uued digitaalsed varad
- Piiriüleste mustrite tuvastamine: aitab näha seoseid eri riikide vahel
- Tegelike kasusaajate selgitamine: omandisuhete ahelate lihtne visualiseerimine
Kuidas süsteem andmeid käsitleb?
Andmete liikumine samm-sammult
-
1SisestamineSüsteemi lisatakse uurimisega seotud materjalid: dokumendid, helifailid ja struktureeritud andmed.
-
2KorrastamineAndmed tehakse otsitavaks ja seostatakse omavahel, et neid oleks lihtne analüüsida.
-
3AnalüüsSüsteem aitab infot kokku võtta ja seoseid esile tuua, tuginedes ainult olemasolevatele andmetele.
-
4Inimese kinnitusKõik tulemused vaatab üle uurija ja kinnitab või parandab need.
-
5VäljundValmivad ülevaated, kokkuvõtted ja visuaalsed vaated uurimise toetamiseks.
-
6"Tark unustamine"Süsteem hoolitseb selle eest, et andmeid hoitakse ainult nii kaua, kui seadus lubab. Kui säilitamistähtaeg saab läbi, andmed arhiveeritakse või kustutatakse automaatselt – koos selge põhjendusega..
Milliseid andmeid saab kasutada
- Dokumendid: PDF-id, Wordi ja Exceli failid, e-kirjad
- Heli ja video: salvestised ja nende tekstiks tehtud versioonid
- Struktureeritud andmed: pangatehingud, registriandmed
- Koostöökanalid: Europol, Interpol ja muud lubatud teated
Kuidas on tagatud andmekaitse
- Andmed jäävad täielikult organisatsiooni sisse
- Kõik andmed on krüpteeritud
- Süsteem peab täpset arvestust, kust info pärineb ja kuidas seda kasutati
- Andmete kasutus on alati kontrollitav ja auditeeritav
Õiguslik vastavus
Andmetöötlus vastab õiguskaitse nõuetele.
- Andmeid kasutatakse ainult kindlal eesmärgil
- Kogutakse ainult vajalikku infot
- Juurdepääs on rangelt piiratud
Süsteemi kontekst
Kõrgtasemel vaade sellele, kuidas uurijad ja süsteem omavahel suhtlevad.
Privaatsuskaitse
Käsitsi kinnitus: iga privaatsust mõjutav päring välisesse andmeallikasse (nt panga päring) vajab enne täitmist kasutajaliideses selget inimese kinnitust. AI ei saa neid tegevusi iseseisvalt käivitada.
Koostöövalmidus
Lahendus on mõeldud EL koostöö jaoks. Sisseehitatud tugi ISO 20022 ja JIT tööruumide jaoks aitab teha piiriülest koostööd ja kasutada süsteemi paralleelselt olemasolevate tööriistadega (FUNC-160, FUNC-162).
Live demo: AI kokkuvõtte moodul
AI võtab sisse struktureeritud teadmusobjekte (KO), mis esindavad erinevaid tõendikilde, ning koondab need ühtseks ja loetavaks kokkuvõtteks.
"Kell 02:35 käivitus vaikne häire Keskandmekeskuses. Tagauks oli lukustamata. Valvur J. Kask leiti teadvuseta".
"Kaamera 04 salvestas sinise kaubiku (771-BKV) lahkumise kell 02:15. Juhti ei saa tuvastada. Logid 02:00 kuni 02:30 on kustutatud".
"Kahtlusalune A. Tamm (771-BKV omanik) väidab alibit: 'Ööturg 22:00 kuni 03:00'. Staatus: KINNITAMATA".
"USB-mälupulk (Ev-001) leiti riiuli 14 lähedalt. Sisaldab krüpteeritud partitsiooni. Leitud 'DarkSide' lunavara signatuuri jälgi."
"Valvur J. Kaski vereproov on zolpideemi (uinuti) suhtes positiivne. Annus viitab sunnitud manustamisele umbes 01:30."
"Sõiduk 771-BKV tuvastati kaamera #442 (Pärnu mnt) poolt suunaga lõunasse kell 02:45. Kiirus: 110 km/h."
"Ööturu müüja M. Tamm (pole sugulane) väidab, et lett #42 suleti kell 22:00. See on vastuolus kahtlusaluse A alibiga."
"Rahakott 0x7a...f2, mis on seotud A. Tammiga, sai kell 03:15 2,5 BTC. Saatja rahakott on märgitud kui 'DarkSide Affiliate'."
"A. Tamm: varasem süüdimõistmine (2021) kübervahendatud pettuse eest. Teadaolev seos isikuga 'The Broker' (kahtlusalune B)."
"Tulemüüri hoiatus 02:10: väljaminev SSH-ühendus IP-le 185.x.x.x (Moldova). Eksporditi 4,2 GB andmeid."
"Riiuli 14 käepidemelt tõsteti latentne sõrmejälg. Vastavus: A. Tamm (99,9% kindlus)."
"Patrull teatas, et isik, kes vastab 'The Brokeri' kirjeldusele, sisenes sõidukisse 771-BKV kell 01:45."
"Postitus 'BreachForums' kell 03:30: 'Värske riigiandmebaas müügiks. Päritolu: Eesti.' Kasutaja: 'SilentNight'."
"Sõiduk 771-BKV peatati kell 04:00. Sülearvuti (Ev-002) leiti kõrvalistuja istme alt. Juht A. Tamm peeti kinni."
"Ev-002 sisaldab SSH-võtmeid, mis klapivad Keskandmekeskuse serveriga. Brauseri ajalugu näitab ligipääsu 'BreachForums'."
"Kahtlusalune B ('The Broker') peeti kinni varjepaigas. Kinnitab, et A. Tamm palgati füüsilise ligipääsu tagamiseks."
Väljund (Mistral 7B)
Päritolu jälg (PROV-O)
KinnitatudSüsteemi andmed
● TöövalmisMudel: Mistral 7B (Ollama)
Sisend: JSON-LD voog
Kontekst: 8k tokenit
Režiim: õhuga eraldatud (offline)
Miks KO-d kokku võtta?
Kui AI teeb kokkuvõtte struktureeritud KO-dest (mitte suvalisest vabatekstist), väheneb väljamõtlemise risk, sest kokkuvõte peab tuginema teadmusgraafis juba kirjas olevatele „faktidele“.
AI Assistendi töölaud
Uurimistöö tööruumi interaktiivne prototüüp.
Prototüüp näitab mitme vidinaga töölauda. Kasuta vasakut menüüd vaadete vahetamiseks (Avaleht, Töölaud, Dokumendid, Analüüs, Vestlus) ning vali rippmenüüst roll, et näha rollipõhiseid seadistusi.
Vidinapõhine kasutajaliides
Töölaud kohandub kasutaja rollile. Uurija näeb graafi ja ajajoont, analüütik näeb stsenaariume ja hüpoteese.
Rollid
Vali rippmenüüst roll, et näha, kuidas kasutajaliides kohandub: Uurija, Analüütik, Juhendaja, Prokurör, Audiitor, AML roll, Audiosekretär.
Teabetsükkel: loodava süsteemi uudsus
Kuidas AI põhjendused jäävad kontrollitavaks ja selgitatavaks
Vasak paneel näitab kolmeastmelist mikrotsüklit: Hangi (GraphRAG), Järelda (Graph-of-Thought) ja Koonda (PROV-O). Parem paneel näitab makrotsüklit (1→2→3→4→5) koos mõõdikutega: mitu PROV sõlme tekkis, usaldusmäär ja tokenite kulu. Simulatsioon illustreerib, kuidas uurija kogemus ja tähelepanekud muutuvad AI toel struktureeritud, taaskasutatavaks teadmusobjektiks. Vajuta „Käivita“, et alustada. Värvilised sõlmed näitavad KO-de eri elutsükli etappe.
Teoreetiline alus
See raamistik on süsteemi tööpõhimõtte alus. Iga etapp seostub konkreetsete moodulite ja AI abiliste tööülesannetega.
Miks selline tsükkel?
Klassikalised mudelid ütlevad, et varjatud teadmus saab muutuda kirjalikuks, kuid jätavad sageli lahti, kuidas seda päriselt teha. Siin eristame kaks tegevust: esmalt selgitame mõttekäigu (Sõnastamine), seejärel korrastame selle (Struktureerimine). Nii saab AI aidata igas etapis konkreetse mõtlemisülesandega.
Etapid
- 1. Kogemus: (Dewey) teadmine sünnib tegutsemisest, õppimine toimub töö käigus.
- 2. Sõnastamine: (Dennett, Polanyi) selgitus tekib suunatud küsimuste ja dialoogi kaudu.
- 3. Struktureerimine: (Peirce) paneb tähelepanekud loogilisse vormi ja seob need võimalike selgitustega.
- 4. Kinnistamine: (Weick) enne „ametlikuks teadmuseks“ saamist vajab arusaam ühist kontrolli ja kooskõlastust.
- 5. Uuendus: (Whitehead) teadmus peab jääma elavaks: täiendamine, parandamine ja vajadusel eemaldamine.
Dünaamiline, mitte sirgjooneline
Tavaline lähenemine näitab protsessi „sirge spiraalina“. Uurimistöö on tegelikult mitme tagasisideahelaga süsteem: uus teadmine võib viia uue kogemuseni ja kinnistamine võib nõuda tagasi pöördumist sõnastamise juurde.
Miks viis etappi?
Iga etapp teeb teadmusega eri tüüpi töö. Erinevalt neljaetapilistest mudelitest eristame sõnastamist ja struktureerimist, sest need vajavad erinevat tuge: dialoogi ja küsimuste abil esiletoomist vs korrastamist ja seostamist.