Студенти програми філології, які обирають курси з комп’ютерної лінгвістики, щороку долучаються до розвитку таких проєктів:
- Великий електронний словник української мови (ВЕСУМ, близько 400 тис. слів, понад 6 млн словоформ)
- Генеральний регіонально анотований корпус української мови (ГРАК, понад 500 млн токенів)
- Програма перевірки орфографії, граматики й стилю «Правописник LanguageTool»
- Браунський корпус української мови (БрУК)
Низка успішно захищених курсових і бакалаврських робіт присвячені розробленню цих та інших проєктів, зокрема створенню чатбота-терапевта та автоматичне розміщення на політичному компасі на основі аналізу твітів.