Комп’ютерна лінгвістика

Студенти програми філології, які обирають курси з комп’ютерної лінгвістики, щороку долучаються до розвитку таких проєктів:

  • Великий електронний словник української мови (ВЕСУМ, близько 400 тис. слів, понад 6 млн словоформ)
  • Генеральний регіонально анотований корпус української мови (ГРАК, понад 500 млн токенів)
  • Програма перевірки орфографії, граматики й стилю «Правописник LanguageTool»
  • Браунський корпус української мови (БрУК)

Низка успішно захищених курсових і бакалаврських робіт присвячені розробленню цих та інших проєктів, зокрема створенню чатбота-терапевта  та автоматичне розміщення на політичному компасі на основі аналізу твітів.