Рубрика «Стартап дня» на AIN.UA — это трибуна для основателей проектов, на которой можно познакомить потенциальных клиентов и инвесторов со своим продуктом. Редакция сохраняет прямую речь спикера. Рассказать о своем стартапе можно, заполнив анкету по ссылке.
Speech Recognition for Ukrainian — первый бесплатный движок для распознавания украинской речи. На его основе все желающие могут создать собственный умный дом, колонку Алекса или просто распознавать записанные интервью/видео и так далее.
Основатели и команда стартапа
Основатели стартапа — Лахаев Тарас, Иевлев Алексей и Смоляков Егор. На протяжении всего времени над проектом работали около 10-15 человек.
О чем стартап
Мы создали первый бесплатный движок для распознавания украинской речи. Этот движок позволяет переводить украинскую речь в текст. На его основе все желающие могут создать собственный умный дом, колонку Алекса или просто распознавать записанные интервью/видео и так далее.
Помимо движков мы еще собрали 1200 часов украинской речи (аудио) с текстом самих записей и выложили их как торрент, это позволяет всем желающим создать распознавание на своих собственных технологиях.
Какая модель монетизации
Она отсутствует. Тут дело в том, что мы не компания как таковая, просто люди заинтересованные собрались и сделали.
Мы создали основу/инфрасткрутную часть для будущих стартапов которые будут распознавать украинскую речь.
Сколько времени ушло на MVP? Какие ошибки допустили?
4 месяца.
Как появилась идея создать стартап?
Идея сделать распознавание у каждого сооснователя уже сформировалась отдельно от других. Алексей хотел приложить распознавание в своем бизнесе, Тарас хотел сделать умный дом, а я (Егор) хотел создать распознавание звонков (я работал в телеком-компании и один бизнес-запрос был в этом).
Я нашел ребят просто по их сообщениям в похожей Telegram группе и создал общую группу, где мы начали общаться на тему «Как достичь желаемого».
Тарас занимался сбором данных, Алекс информационной поддержкой, тестированием и помогал Тарасу с железом, а я занимался развитием связей с разными людьми, которые тренировали модели машинного обучения на основе собранных данных, созданием ботов и делал примеры как использовать созданные движки.
В итоге сейчас 3 готовых к использованию движка доступных всем желающим.
Как вы оцениваете рынок для вашего продукта?
Рынок применения очень широк. От голосовых ассистентов до систем речевой аналитики. Весь мир сейчас активно занимается распознаванием аудио и нам, как IT-стране, нельзя отставать.
Сколько денег/времени инвестировано?
Никаких денег, кроме оплаты сервера для ботов не было потрачено. Всё на энтузиазме и желании получить качественный движок распознавания.
Чего удалось добиться?
Например, недавно один участник нашей группы добавил нашу модель в своё Android-приложение для автоматического создание субтитров в видео. Проверить работу приложения можно скачав его по ссылке.
Другой участник делал голосовое управление в звонках. Я, например, планирую делать речевую аналитику для звонков.