Kontekst.io je iskalnik sorodnih besed in fraz, samodejno generiran iz več besedilnih korpusov sodobne slovenščine.
Slovenski iskalnik temelji na računskem jezikovnem modelu, ki vsaki besedi ali frazi priredi položaj v latentnem prostoru tako, da so besede, uporabljene v podobnih kontekstih, tudi v latentnem prostoru blizu.
Računski model vsebuje okrog 600.000 besed in fraz.
Spletno mesto mogoče uporabljati kot:
Računski model je naučen na okrog 15 gigabajtov obdelanega besedila. Primeren je kot začetna točka za opravila strojnega učenja. Podrobnosti o dostopu do računskega modela so navedene na strani partnerstvo.
Med najpomembnejšimi viri so:
Avtor se zahvaljuje: