Томские разработчики совместно с крупной нефтегазовой компанией и крупной технологической компанией из США разрабатывают набор инструментов для анализа естественного русского языка и синтеза текста на нём. Об этом сообщает региональный инновационный портал.

«Системы анализа текстов в каждом языке предполагают свой набор инструментов для работы. Русский относится к синтетическим языкам: грамматические значения в нём передаются за счёт высокой степени изменяемости слов, что создаёт дополнительные сложности по сравнению, например, с обработкой английского языка»,
– говорится в сообщении.
Обработка естественного языка — это направление в разработке искусственного интеллекта, которое изучает возможности компьютерного анализа и синтеза языков. Главная задача здесь — автоматизировать обработку больших массивов текста и сделать общение человека и компьютера более удобным. Рутинную работу вроде консультирования по распространённым вопросам за человека смогут выполнять боты.
По итогам проекта разработчики планируют разработать набор инструментов универсального назначения для анализа и синтеза русского языка.