Projekti ettepanek

AI Uurija

Teadmussiirde ja operatiivse efektiivsuse parandamine uurimisasutuses

Iren Irbe

MTA

Detsember 2025

Probleem

Uurimised on muutunud kognitiivselt üha koormavamaks.

Andmete üleküllus

Tänapäeva uurimised toodavad väga suuri andmemahtusid (sageli üle 1 TB juhtumi kohta). Praegused töövahendid ei toeta piisavalt infotööd.

Killustatud info

Info on jaotatud mitmete süsteemide ja erinevate vormingute vahel.

Ajasurve

Uurijad peavad seostama fakte rangete tähtaegade tingimustes.

Dokumenteerimata kogemus

Oluline tööalane kogemus ja otsuste põhjendused jäävad sageli ainult inimese enda teada.

Põhijäreldus

Uurijad kulutavad liiga palju aega info haldamisele ja liiga vähe selle analüüsimisele.

Operatiivsed ja õiguslikud riskid

Aeglasemad uurimised

Käsitsi info töötlemine tekitab kitsaskohti ja pikendab juhtumite lahendamise aega.

Oluliste seoste märkamata jäämine

Suurem risk, et tõendite, isikute ja sündmuste vahelised kriitilised seosed jäävad avastamata.

Ebaühtlane arutluskäik

Erinevad lähenemised sarnastele juhtumitele toovad kaasa kvaliteedi kõikumise.

Õiguslik haavatavus

Suurem risk olukordades, kus otsuseid ei ole võimalik hiljem piisavalt selgitada ega põhjendada.

Olemasolevate lahenduste kitsaskohad

Avalikud tehisintellekti tööriistad

Ei sobi tundlike uurimisandmete töötlemiseks. Turva- ja konfidentsiaalsusnõuded ei luba pilvepõhiste AI-lahenduste kasutamist.

Pilvepõhised süsteemid

On vastuolus andmekaitsenõuetega. Tundlikud andmed ei tohi lahkuda kontrollitud keskkonnast.

Olemasolevad uurimistöö tööriistad

Keskenduvad dokumentide hoidmisele, mitte analüüsile. Need talletavad infot, kuid ei toeta arutluskäiku ega seoste loomist.

Ainult inimanalüüs

Ei skaleeru kasvavate andmemahtudega. Inimese kognitiivsed piirid on reaalsed.

Pakutav lahendus – AI Uurija (kontseptsioon)

Turvaline tehisintellekti abiline uurijatele

Lokaalne ja internetist eraldatud tehisintellekti lahendus, mis aitab uurijatel kõne ja tekstina kogutud infot korrastada, võimalikke selgitusi läbi mõelda ja olulist tööalast teadmist talletada nii, et andmed ei lahku uurimisasutusest ja kõik tegevused vastavad seadustele.

Süsteem analüüsib varasemaid juhtumeid, sh helisalvestisi ja märkmeid, tuvastab korduvaid mustreid ning aitab nende põhjal kaaluda võimalikke edasisi arenguid ja ennetavaid tegevusi.

Põhiprintsiibid

Turvaline ja asutusesisene

Töötab täielikult MTA taristus
Andmeid ei edastata pilveteenustesse ega väljapoole asutust
Andmete kasutamine ja jagamine toimub vastavalt kehtivatele õiguslikele piirangutele (GDPR, LED, EL AI määrus)

Kontrollitav ja läbipaistev

Kõik süsteemi vastused põhinevad konkreetsetel ja kontrollitavatel allikdokumentidel
Süsteem näitab selgelt, millele järeldused ja seosed tuginevad
Kõrge riskiga funktsioonid (nt emotsioonide tuvastamine) on teadlikult välistatud

Korrastab ja analüüsib juba toimunut

Koondab varasemad juhtumid, sündmused ja tõendid
Aitab tuvastada korduvaid käitumis- ja tegevusmustreid
Toetab riskide ja võimalike edasiste arengute läbi mõtlemist

Toetab mõtlemist, mitte ennustamist

Pakub võimalikke selgitusi ja stsenaariume, mitte kindlaid prognoose
Aitab kaaluda erinevaid käitumismustreid ja nende mõju
Ei tee järeldusi ega otsuseid inimese eest

Inimene on alati otsustaja

Kõik süsteemi väljundid vajavad inimese kinnitust
Uurija otsustab, milliseid mustreid ja stsenaariume arvesse võtta
Vastutus jääb alati uurijale

Institutsiooniline mälu ja vastavus

Aitab talletada korduvaid mustreid ja õppetunde, et need ei kaoks koos inimestega
Toetab EL tehisintellekti määruse nõuete täitmist, sh põhiõiguste mõjuhinnangu (FRIA) koostamist

Mida süsteem aitab saavutada?

1. Suurte juhtumite kokkuvõtmine

Aitab kiiresti esile tuua olulised faktid sadadest lehekülgedest dokumentidest.

2. Seoste esiletõstmine

Aitab märgata seoseid isikute, sündmuste ja tehingute vahel, mis muidu võivad jääda tähelepanuta.

3. Hüpoteesidega töötamine

Toetab uurijat võimalike selgituste süstemaatilisel läbimõtlemisel ja võrdlemisel.

4. Arutluskäigu talletamine

Aitab salvestada uurimise loogika ja põhjendused hilisemaks ülevaatamiseks või kohtus selgitamiseks.

Mida see annab uurimisasutusele

Kiirem arusaamine juhtumitest

Uurijad mõistavad keerukaid juhtumeid kiiremini ja terviklikumalt.

Väiksem vaimne koormus

Vähem aega ja energiat kulub info otsimisele ja haldamisele.

Parem jälgitavus ja põhjendatavus

Uurimise arutluskäik on talletatud ja vajadusel üle vaadatav.

Selge otsustuspunkt edasiseks

Tõenditel põhinev otsus, kas ja kuidas lahendust edasi arendada.

Milleks taotletakse rahastust

Projekti ettevalmistus ja juhtimine

Projekti koordineerimine ja lahenduse ulatuse täpsustamine.

Lahendus ja taristu

Lokaalne serveripark, vajalik riistvara ja turvaline infrastruktuur lahenduse jaoks.

Õiguslik ja eetiline valideerimine

Vastavus GDPR-ile, LED-ile ja EL AI määrusele (sh FRIA).

Kasutamine reaalses töös

Lahenduse kasutamine kontrollitud tingimustes koos uurijatega.

Koolitus ja kasutajatugi

Kasutajate koolitamine ja tugi lahenduse loomise ajal.

Mõõtmine ja hindamine

Projekti tulemuste analüüs ja otsus edasise laiendamise kohta.

Praktilised kasutusrollid

AI Assistent

Välitöötajatele

Hääljuhtimine: käed-vabad küsimused eesti ja inglise keeles
Kiired kokkuvõtted: nt „Tee kokkuvõte viimastest raportitest kahtlusaluse X kohta"
Protseduuriline tugi: kiire ligipääs juhenditele ja protokollidele töö käigus

AI Analüütik

Uurimisosakondadele

Võimalike selgituste pakkumine: aitab mõelda läbi erinevad stsenaariumid
Mõjude hindamine: nt mis võib juhtuda teatud meetmete rakendamisel
Kriitiline vaade: juhib tähelepanu võimalikule kallutatusele või vahelejäänud seostele

Audiosekretär

Uurijatele ja tugipersonalile

Automaatne protokollimine: koosolekute ja vestluste lokaalne tekstiks muutmine
Ülesannete koondamine: tõstab häälmärkmetest esile tegevuspunktid
Intervjuude tugi: aitab märgata vastuolusid ütlustes

AML tugi

Finantskuritegude uurimiseks

Keerukate rahavoogude analüüs: sh uued digitaalsed varad
Piiriüleste mustrite tuvastamine: aitab näha seoseid eri riikide vahel
Tegelike kasusaajate selgitamine: omandisuhete ahelate lihtne visualiseerimine

Kuidas süsteem andmeid käsitleb?

Andmete liikumine samm-sammult

1

Sisestamine

Süsteemi lisatakse uurimisega seotud materjalid: dokumendid, helifailid ja struktureeritud andmed.
2

Korrastamine

Andmed tehakse otsitavaks ja seostatakse omavahel, et neid oleks lihtne analüüsida.
3

Analüüs

Süsteem aitab infot kokku võtta ja seoseid esile tuua, tuginedes ainult olemasolevatele andmetele.
4

Inimese kinnitus

Kõik tulemused vaatab üle uurija ja kinnitab või parandab need.
5

Väljund

Valmivad ülevaated, kokkuvõtted ja visuaalsed vaated uurimise toetamiseks.
6

"Tark unustamine"

Süsteem hoolitseb selle eest, et andmeid hoitakse ainult nii kaua, kui seadus lubab. Kui säilitamistähtaeg saab läbi, andmed arhiveeritakse või kustutatakse automaatselt – koos selge põhjendusega..

Milliseid andmeid saab kasutada

Dokumendid: PDF-id, Wordi ja Exceli failid, e-kirjad
Heli ja video: salvestised ja nende tekstiks tehtud versioonid
Struktureeritud andmed: pangatehingud, registriandmed
Koostöökanalid: Europol, Interpol ja muud lubatud teated

Kuidas on tagatud andmekaitse

Andmed jäävad täielikult organisatsiooni sisse
Kõik andmed on krüpteeritud
Süsteem peab täpset arvestust, kust info pärineb ja kuidas seda kasutati
Andmete kasutus on alati kontrollitav ja auditeeritav

Õiguslik vastavus

Andmetöötlus vastab õiguskaitse nõuetele.

Andmeid kasutatakse ainult kindlal eesmärgil
Kogutakse ainult vajalikku infot
Juurdepääs on rangelt piiratud

Süsteemi kontekst

Kõrgtasemel vaade sellele, kuidas uurijad ja süsteem omavahel suhtlevad.

C4Context title Süsteemi konteksti diagramm AI Investigatorile Person(investigator, "Uurija", "Analüütik, ametnik, juht") Enterprise_Boundary(b0, "Asutuse piir") { System(ai_system, "AI Investigator", "Allikapõhine analüüs, hüpoteesid, teadmuse talletamine") } System_Ext(data_sources, "Andmeallikad", "Pangad, registrid, logid") System_Ext(integrations, "EL koostöö", "Europol, Interpol, JIT") Rel(investigator, ai_system, "Päringud ja ülevaatus") Rel(ai_system, data_sources, "Võtab andmed sisse") Rel(ai_system, integrations, "Jagab mustreid") UpdateLayoutConfig($c4ShapeInRow="4", $c4BoundaryInRow="1") UpdateRelStyle(investigator, ai_system, $textColor="blue", $lineColor="blue")

Privaatsuskaitse

Käsitsi kinnitus: iga privaatsust mõjutav päring välisesse andmeallikasse (nt panga päring) vajab enne täitmist kasutajaliideses selget inimese kinnitust. AI ei saa neid tegevusi iseseisvalt käivitada.

Koostöövalmidus

Lahendus on mõeldud EL koostöö jaoks. Sisseehitatud tugi ISO 20022 ja JIT tööruumide jaoks aitab teha piiriülest koostööd ja kasutada süsteemi paralleelselt olemasolevate tööriistadega (FUNC-160, FUNC-162).

Live demo: AI kokkuvõtte moodul

AI võtab sisse struktureeritud teadmusobjekte (KO), mis esindavad erinevaid tõendikilde, ning koondab need ühtseks ja loetavaks kokkuvõtteks.

Sisendi vaade (teadmusobjektid) Tokenite kasutus: 842/8192

// SISSE VÕETUD TÕENDIVOOG (JSON-LD)

KO-001 (Juhtumiraport):
"Kell 02:35 käivitus vaikne häire Keskandmekeskuses. Tagauks oli lukustamata. Valvur J. Kask leiti teadvuseta".

KO-002 (Valvekaamera logi):
"Kaamera 04 salvestas sinise kaubiku (771-BKV) lahkumise kell 02:15. Juhti ei saa tuvastada. Logid 02:00 kuni 02:30 on kustutatud".

KO-003 (Kahtlusaluse küsitlus):
"Kahtlusalune A. Tamm (771-BKV omanik) väidab alibit: 'Ööturg 22:00 kuni 03:00'. Staatus: KINNITAMATA".

KO-004 (Esialgne ekspertiis):
"USB-mälupulk (Ev-001) leiti riiuli 14 lähedalt. Sisaldab krüpteeritud partitsiooni. Leitud 'DarkSide' lunavara signatuuri jälgi."

KO-005 (Toksikoloogia raport):
"Valvur J. Kaski vereproov on zolpideemi (uinuti) suhtes positiivne. Annus viitab sunnitud manustamisele umbes 01:30."

KO-006 (ANPR tabamus):
"Sõiduk 771-BKV tuvastati kaamera #442 (Pärnu mnt) poolt suunaga lõunasse kell 02:45. Kiirus: 110 km/h."

KO-007 (Tunnistaja ütlus):
"Ööturu müüja M. Tamm (pole sugulane) väidab, et lett #42 suleti kell 22:00. See on vastuolus kahtlusaluse A alibiga."

KO-008 (Finantsluure):
"Rahakott 0x7a...f2, mis on seotud A. Tammiga, sai kell 03:15 2,5 BTC. Saatja rahakott on märgitud kui 'DarkSide Affiliate'."

KO-009 (Taustakontroll):
"A. Tamm: varasem süüdimõistmine (2021) kübervahendatud pettuse eest. Teadaolev seos isikuga 'The Broker' (kahtlusalune B)."

KO-010 (Võrgulogi):
"Tulemüüri hoiatus 02:10: väljaminev SSH-ühendus IP-le 185.x.x.x (Moldova). Eksporditi 4,2 GB andmeid."

KO-011 (Füüsiline tõend):
"Riiuli 14 käepidemelt tõsteti latentne sõrmejälg. Vastavus: A. Tamm (99,9% kindlus)."

KO-012 (Kahtlusaluse B nägemine):
"Patrull teatas, et isik, kes vastab 'The Brokeri' kirjeldusele, sisenes sõidukisse 771-BKV kell 01:45."

KO-013 (Tumeveebi vestlus):
"Postitus 'BreachForums' kell 03:30: 'Värske riigiandmebaas müügiks. Päritolu: Eesti.' Kasutaja: 'SilentNight'."

KO-014 (Sõiduki läbiotsimine):
"Sõiduk 771-BKV peatati kell 04:00. Sülearvuti (Ev-002) leiti kõrvalistuja istme alt. Juht A. Tamm peeti kinni."

KO-015 (Sülearvuti ekspertiis):
"Ev-002 sisaldab SSH-võtmeid, mis klapivad Keskandmekeskuse serveriga. Brauseri ajalugu näitab ligipääsu 'BreachForums'."

KO-016 (Kinnipidamisprotokoll):
"Kahtlusalune B ('The Broker') peeti kinni varjepaigas. Kinnitab, et A. Tamm palgati füüsilise ligipääsu tagamiseks."

Ülesanne: koonda KO-d juhtkokkuvõtteks.

Joonis 8: mitmest allikast tõendite kokkuvõtete simulatsioon.

Süsteemi andmed

● Töövalmis

Mudel: Mistral 7B (Ollama)

Sisend: JSON-LD voog

Kontekst: 8k tokenit

Režiim: õhuga eraldatud (offline)

Miks KO-d kokku võtta?

Kui AI teeb kokkuvõtte struktureeritud KO-dest (mitte suvalisest vabatekstist), väheneb väljamõtlemise risk, sest kokkuvõte peab tuginema teadmusgraafis juba kirjas olevatele „faktidele“.

AI Assistendi töölaud

Uurimistöö tööruumi interaktiivne prototüüp.

Prototüüp näitab mitme vidinaga töölauda. Kasuta vasakut menüüd vaadete vahetamiseks (Avaleht, Töölaud, Dokumendid, Analüüs, Vestlus) ning vali rippmenüüst roll, et näha rollipõhiseid seadistusi.

Vidinapõhine kasutajaliides

Töölaud kohandub kasutaja rollile. Uurija näeb graafi ja ajajoont, analüütik näeb stsenaariume ja hüpoteese.

Rollid

Vali rippmenüüst roll, et näha, kuidas kasutajaliides kohandub: Uurija, Analüütik, Juhendaja, Prokurör, Audiitor, AML roll, Audiosekretär.

Teabetsükkel: loodava süsteemi uudsus

Kuidas AI põhjendused jäävad kontrollitavaks ja selgitatavaks

Mikrotsükkel (reaalaja järeldamine)

GraphRAG Hangi

GoT Reasoning Järelda

PROV-O Graph Koonda

Hetkefaas

SÜSTEEM VALMIS

Reaalaja mõõdikud

Ootan simulatsiooni käivitamist...

PROV: 0 nodes

CONF: --%

TOKENS: 0

> Süsteem on valmis. Ootan uusi teadmusobjekte...

Joonis 5: teabetsükkel töös.
Vasak paneel näitab kolmeastmelist mikrotsüklit: Hangi (GraphRAG), Järelda (Graph-of-Thought) ja Koonda (PROV-O). Parem paneel näitab makrotsüklit (1→2→3→4→5) koos mõõdikutega: mitu PROV sõlme tekkis, usaldusmäär ja tokenite kulu. Simulatsioon illustreerib, kuidas uurija kogemus ja tähelepanekud muutuvad AI toel struktureeritud, taaskasutatavaks teadmusobjektiks. Vajuta „Käivita“, et alustada. Värvilised sõlmed näitavad KO-de eri elutsükli etappe.

Teoreetiline alus

See raamistik on süsteemi tööpõhimõtte alus. Iga etapp seostub konkreetsete moodulite ja AI abiliste tööülesannetega.

Miks selline tsükkel?

Klassikalised mudelid ütlevad, et varjatud teadmus saab muutuda kirjalikuks, kuid jätavad sageli lahti, kuidas seda päriselt teha. Siin eristame kaks tegevust: esmalt selgitame mõttekäigu (Sõnastamine), seejärel korrastame selle (Struktureerimine). Nii saab AI aidata igas etapis konkreetse mõtlemisülesandega.

Etapid

1. Kogemus: (Dewey) teadmine sünnib tegutsemisest, õppimine toimub töö käigus.
2. Sõnastamine: (Dennett, Polanyi) selgitus tekib suunatud küsimuste ja dialoogi kaudu.
3. Struktureerimine: (Peirce) paneb tähelepanekud loogilisse vormi ja seob need võimalike selgitustega.
4. Kinnistamine: (Weick) enne „ametlikuks teadmuseks“ saamist vajab arusaam ühist kontrolli ja kooskõlastust.
5. Uuendus: (Whitehead) teadmus peab jääma elavaks: täiendamine, parandamine ja vajadusel eemaldamine.

Dünaamiline, mitte sirgjooneline

Tavaline lähenemine näitab protsessi „sirge spiraalina“. Uurimistöö on tegelikult mitme tagasisideahelaga süsteem: uus teadmine võib viia uue kogemuseni ja kinnistamine võib nõuda tagasi pöördumist sõnastamise juurde.

Miks viis etappi?

Iga etapp teeb teadmusega eri tüüpi töö. Erinevalt neljaetapilistest mudelitest eristame sõnastamist ja struktureerimist, sest need vajavad erinevat tuge: dialoogi ja küsimuste abil esiletoomist vs korrastamist ja seostamist.