В Новосибирском государственном университете ввели новый модуль в открытую систему "Писец". О том, что ученые усовершенствовали алгоритм распознавания речи, корреспонденту "Интерфакса" рассказал разработчик системы, научный сотрудник лаборатории прикладных цифровых технологий Механико-математического факультета НГУ Иван Бондаренко.
Собеседник агентства добавил, что ученые ввели модерацию неопределенности, благодаря которой система помечает слово, в котором она не уверена. Для пользователя такое сомнительное слово станут выделять серым цветом.
"Писец", добавил Иван Бондаренко, реализуется как довольно компактная языковая модель с перспективой установки на различные девайсы. Кроме того, на базе китайской системы новосибирские ученые собираются сделать большую мультимодальную модель для русского языка, чтобы она могла одновременно воспринимать русский текст, русскую речь, неречевые акустические события и определять количество говорящих.
Добавим, изначально "Писца" разрабатывали для автоматического стенографирования звукозаписей интервью или защит диссертаций. Даже 20-30% ошибок в расшифрованных текстах - это уже тот уровень, который позволяет человеку быстрее подготовить чистовой текст стенограммы, чем если бы он писал его "с нуля".