Статистик мәгълүмат

Татар теленең язма корпусы күләме - 116 млн. сүздән артык.
Базадагы җөмләләрнең саны - 10 миллионнан артык.

Леммалар:
Татар теле леммаларының ешлыгы (Исем) (txt).
Татар теле леммаларының ешлыгы (Ялгызлык исем) (txt).
Татар теле леммаларының ешлыгы (Фигыль) (txt).
Татар теле леммаларының ешлыгы (Ярдәмче фигыль) (txt).
Татар теле леммаларының ешлыгы (Сыйфат) (txt).
Татар теле леммаларының ешлыгы (Рәвеш) (txt).
Татар теле леммаларының ешлыгы (Алмашлык) (txt).
Татар теле леммаларының ешлыгы (Бәйлек) (txt).
Татар теле леммаларының ешлыгы (Пострәвеш) (txt).
Татар теле леммаларының ешлыгы (Сан) (txt).
Татар теле леммаларының ешлыгы (Рәвеш-теркәгеч) (txt).
Татар теле леммаларының ешлыгы (Тезүче теркәгеч) (txt).
Татар теле леммаларының ешлыгы (Ияртүче теркәгеч) (txt).
Татар теле леммаларының ешлыгы (Ымлык) (txt).
Татар теле леммаларының ешлыгы (Копула) (txt).
Татар теле леммаларының ешлыгы (Детерминатив) (txt).
Татар теле леммаларының ешлыгы (Аваз ияртеме) (txt).
Татар теле леммаларының ешлыгы (Кыскартылма) (txt).
Татар теле леммаларының ешлыгы (Apertium морфологик анализаторының без кулланган версиясе тарафыннан танылмаган сүзләр) (txt).

Сүзләр:
Татар телендә иң еш кулланыла торган 5000 сүзформа исемлеге (txt).
Татар телендә иң еш кулланыла торган 200 "2-грамма" (сүзләр) исемлеге.
Татар телендә иң еш кулланыла торган 200 "3-грамма" (сүзләр) исемлеге.
Татар телендә иң еш кулланыла торган 200 "4-грамма" (сүзләр) исемлеге.
Татар телендә иң еш кулланыла торган 200 "5-грамма" (сүзләр) исемлеге.
Татар телендә иң еш кулланыла торган 200 "6-грамма" (сүзләр) исемлеге.

Хәрефләр:
Татар телендә хәрефләрнең кулланылу ешлыгы исемлеге.
Татар телендә иң еш кулланыла торган 200 "2-грамма" (хәрефләр) исемлеге.
Татар телендә иң еш кулланыла торган 200 "3-грамма" (хәрефләр) исемлеге.
Татар телендә иң еш кулланыла торган 200 "4-грамма" (хәрефләр) исемлеге.
Татар телендә иң еш кулланыла торган 200 "5-грамма" (хәрефләр) исемлеге.
Татар телендә иң еш кулланыла торган 200 "6-грамма" (хәрефләр) исемлеге.

Хәрефләр (сүз башында):
Татар телендә иң еш кулланыла торган 200 "2-грамма" (хәрефләр, сүз башында) исемлеге.
Татар телендә иң еш кулланыла торган 200 "3-грамма" (хәрефләр, сүз башында) исемлеге.
Татар телендә иң еш кулланыла торган 200 "4-грамма" (хәрефләр, сүз башында) исемлеге.
Татар телендә иң еш кулланыла торган 200 "5-грамма" (хәрефләр, сүз башында) исемлеге.
Татар телендә иң еш кулланыла торган 200 "6-грамма" (хәрефләр, сүз башында) исемлеге.

Хәрефләр (сүз азагында):
Татар телендә иң еш кулланыла торган 200 "2-грамма" (хәрефләр, сүз азагында) исемлеге.
Татар телендә иң еш кулланыла торган 200 "3-грамма" (хәрефләр, сүз азагында) исемлеге.
Татар телендә иң еш кулланыла торган 200 "4-грамма" (хәрефләр, сүз азагында) исемлеге.
Татар телендә иң еш кулланыла торган 200 "5-грамма" (хәрефләр, сүз азагында) исемлеге.
Татар телендә иң еш кулланыла торган 200 "6-грамма" (хәрефләр, сүз азагында) исемлеге.

Фонемалар (ритмик төркем кысаларында):
Татар телендә фонемаларның кулланылу ешлыгы исемлеге.
Татар телендә иң еш кулланыла торган 100 "2-грамма" (фонемалар) исемлеге.
Татар телендә иң еш кулланыла торган 100 "3-грамма" (фонемалар) исемлеге.
Татар телендә иң еш кулланыла торган 100 "4-грамма" (фонемалар) исемлеге.
Татар телендә иң еш кулланыла торган 100 "5-грамма" (фонемалар) исемлеге.
Татар телендә иң еш кулланыла торган 100 "6-грамма" (фонемалар) исемлеге.

Фонемалар (сүзләр кысаларында):
Татар телендә иң еш кулланыла торган 100 "2-грамма" (фонемалар) исемлеге.
Татар телендә иң еш кулланыла торган 100 "3-грамма" (фонемалар) исемлеге.
Татар телендә иң еш кулланыла торган 100 "4-грамма" (фонемалар) исемлеге.
Татар телендә иң еш кулланыла торган 100 "5-грамма" (фонемалар) исемлеге.
Татар телендә иң еш кулланыла торган 100 "6-грамма" (фонемалар) исемлеге.

Төрлесе:
Грамматик формаларның Корпуста очрау ешлыгы (txt). Апертиум проектының теглар системасы.
Грамматик тамгаларның Корпуста очрау ешлыгы. Апертиум проектының теглар системасы.