The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Mozilla свернула проект DeepSpeech, развивавший движок распознавания речи"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Mozilla свернула проект DeepSpeech, развивавший движок распознавания речи"  +/
Сообщение от opennews (ok), 26-Июн-25, 00:45 
Компания Mozilla перевела в архивных режим репозиторий с открытым движком распознавания речи DeepSpeech. Последним изменением в кодовой базе стало исправление файла README, в который была добавлена информация о прекращении разработки проекта.  До этого последний коммит был датирован 2021 годом...

Подробнее: https://www.opennet.me/opennews/art.shtml?num=63469

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по времени | RSS]


2. "Mozilla свернула проект DeepSpeech, развивавший движок распо..."  +1 +/
Сообщение от Аноним (2), 26-Июн-25, 01:29 
Даже начинать не стоило . Это из числа функций где ии-модели абсолютно вне конкуренции .
Ответить | Правка | Наверх | Cообщить модератору

5. "Mozilla свернула проект DeepSpeech, развивавший движок распо..."  +2 +/
Сообщение от morphe (?), 26-Июн-25, 03:16 
> Это из числа функций где ии-модели абсолютно вне конкуренции .

У whisper слишком много галлюцинаций, особенно у третьей версии: https://deepgram.com/learn/whisper-v3-results

Любая тишина/странный шум их официальным декодером определяется как "Like and subscribe" и прочим мусором что оно подцепило из обучающей выборки

Это всё можно обработать и обрезать перед кормлением, но там вскрывается куча других проблем, вроде того что whisper очень сложно заставить работать в режиме реального времени, ни одна из готовых реализаций не умеет нормальный батчинг, и т.д

Всё это делает whisper для многих задач хуже чем некоторые более алгоритмические модели

Решение? Обучать свой декодер, желательно на базе llama, а не как встроенный gpt2, переписывать whisper нормально для реализации нужных фич, либо вовсе перейти на коммерческие решения

То что coqui закрылся это плохо, потому что он вполне мог конкурировать с условным гугловым TTS в некоторых языках, и из коробки имел всё то о чём я выше написал как о минусах whisper.

Ответить | Правка | Наверх | Cообщить модератору

6. "Mozilla свернула проект DeepSpeech, развивавший движок распо..."  +/
Сообщение от фыва (?), 26-Июн-25, 03:26 
А из существующих моделей нет более подходящей?
https://alphacephei.com/nsh/2025/04/18/russian-models.html
Ответить | Правка | Наверх | Cообщить модератору

9. "Mozilla свернула проект DeepSpeech, развивавший движок распо..."  +/
Сообщение от morphe (?), 26-Июн-25, 05:44 
> А из существующих моделей нет более подходящей?
> https://alphacephei.com/nsh/2025/04/18/russian-models.html

Vosk тоже неплохой, но всё же чем больше альтернатив - тем лучше

Ответить | Правка | Наверх | Cообщить модератору

11. "Mozilla свернула проект DeepSpeech, развивавший движок распо..."  +/
Сообщение от Аноним (-), 26-Июн-25, 06:49 
Это классическая бритва Оккама. https://ru.wikipedia.org/wiki/%D0%9F%D1%...

Правильно, что свернули.

Ответить | Правка | К родителю #6 | Наверх | Cообщить модератору

3. "Mozilla свернула проект DeepSpeech, развивавший движок распо..."  +1 +/
Сообщение от Аноним (3), 26-Июн-25, 01:41 
И где же Mozilla свернула не туда?...
Ответить | Правка | Наверх | Cообщить модератору

4. "Mozilla свернула проект DeepSpeech, развивавший движок распо..."  +2 +/
Сообщение от Аноним (4), 26-Июн-25, 02:07 
Когда вместо допиливания FF на десетопы и мобилки они потратили все деньги и время на разные сторонние проекты. Уже не за горами время когда FF превратится в нескучный скин для chromium
Ответить | Правка | Наверх | Cообщить модератору

7. Скрыто модератором  +/
Сообщение от безразницы (?), 26-Июн-25, 04:28 
Ответить | Правка | К родителю #3 | Наверх | Cообщить модератору

13. Скрыто модератором  +/
Сообщение от Аноним (13), 26-Июн-25, 07:50 
Ответить | Правка | Наверх | Cообщить модератору

12. "Mozilla свернула проект DeepSpeech, развивавший движок распо..."  +2 +/
Сообщение от User (??), 26-Июн-25, 07:21 
На самом деле примерно "нигде" - война была проиграна в тот момент, когда на рынок вышел google с "бесконечными деньгами". "Дергайся" mozilla более энергично - google chrome выглядел бы чуть-чуть иначе, более похоже на ФыФы, но и только. Теоретически, наверное, была возможность продацца-с-потрохами (chrome как "шкурка" для ФыФы) - но mozilla'е легче от этого бы не стало (Как, в общем, не стало легче khtml от вот этого вот всего с webkit\blink'ом).
Те-о-ре-ти-чес-ки как раз таки была возможность сконвертировать userbase в какой-то сторонний и менее интересный google'ю продукт не связанный напрямую на "точку входа в глобальную сеть" (Те самые "сторонние проекты" mozilla foundation) - но в эту лотерею они не выиграли и ИИ смастерил OpenAI...
Ответить | Правка | К родителю #3 | Наверх | Cообщить модератору

8. "Mozilla свернула проект DeepSpeech, развивавший движок распо..."  +1 +/
Сообщение от Аноним (8), 26-Июн-25, 04:49 
Эффективные менеджеры эффективно освоили/распилили средства. Проект успешно завершен. А что, кто-то думал, что будет как-то иначе?
Ответить | Правка | Наверх | Cообщить модератору

10. "Mozilla свернула проект DeepSpeech, развивавший движок распо..."  +/
Сообщение от Аноним (-), 26-Июн-25, 06:16 
>Два года назад стартап прекратил своё существования и пользователям было рекомендовано перейти на открытую систему распознавания речи Whisper от компании OpenAI.

Инструментарий STT имеет лицензию Мозилла, она вообще-то тоже открыта.

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2025 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру