Hírek

2016. augusztus 29. v2.0.4
A korpusz terjedelme 1,04 milliárd szövegszó, írásjelekkel együtt: 1,348 milliárd token. Keresőfelület. Súgó.
A korábbi kutatások reprodukálhatóságának érdekében továbbra is elérhető a v2.0.3-as és v2.0.2-es verzió is.
2016. február 19. v2.0.3
A korpusz terjedelme 785 millió szövegszó, írásjelekkel együtt: 978 millió token.
A teljes korpusz újraelemezve.
Új információ: mboundary mező az ana attribútumban, mely a szóalakban lévő morfémahatárokat tartalmazza, ebben a formában: dolgoz+ó+i.
Új attribútumok: word_syll – a szóalak szótagszáma, lemma_syll – a szótő szótagszáma.
A korábbi kutatások reprodukálhatóságának érdekében továbbra is elérhető a v2.0.2-es verzió is.
2014. szeptember 26. v2.0.2
A korpusz terjedelme 587 millió szövegszó, írásjelekkel együtt: 732 millió token.
2014. szeptember 13. v2.0.1
Megnyílt az MNSZ2 új felületen, új elemzéssel. Az MNSZ1 187 millió szövegszónyi anyagát tartalmazza.