Подскажите, как использовать эту модель с установленной F5-TTS cli

#1
by aboinpace - opened

Подскажите, пожалуйста, как использовать эту модель с установленной F5-TTS cli
куда её положить, где указать, какие параметры, если можно с примером?

Попробуйте это:
https://colab.research.google.com/drive/1r3uaBggiM_U4ank3yalM6paiXRbjVbct#scrollTo=7HGgBQ_js3MR

Замените содержимоеmodel_idнаhotstone228/F5-TTS-Russian,
затем замените содержимоеckpt_fileнаckpts/model_last.pt,
а содержимоеvocab_fileзамените наckpts/vocab.txt.

После этого вы сможете изменить некоторые настройки для запуска F5-TTS.

у меня локальная установка, скачал вашу модель, синтез отрабатывает но результат явно не русский, редкие слова проскакивают. Подскажите, пожалуйста, может какие настройки еще надо сделать?

image.png

Попробуйте safetensors вариант

спасибо, получилось

Нужна Ваша помощь.
Установил локально https://github.com/swivid/F5-TTS/
Запустилось, на английском работает.
Запускается f5-tts_finetune-gradio (для обучения) или f5-tts_infer-gradio (для использования).
Скачал данную модель, но никак не могу понять как ее подключить.
Пожалуйста дайте немного информации.
Большое спасибо.

Добрый вечер, в инфер градио сверху выберите пункт custom

К сожалению у меня нет такого пункта, вы можете показать где он находится?

приложите скришот

image.png
Могу предположить что я мог что то сломать.
Попробую завтра все сделать с нуля.

обновите клонированный репозиторий и переустановите пакет в pip. у вас старая версия

Большое спасибо. У меня все получилось. Спасибо за Ваш труд и удачного развития проекта.

Здравствуйте! Нужна Ваша помощь.
Установил локально F5-TTS, всё запустилось, на английском работает.
Установил вашу модель и установил как custom. Текст ref аудио распознаёт, но в синтезе получается просто набор звуков.
Пожалуйста дайте знать что я делаю не так?(
Большое спасибо.
67890.png

Может быть у вас не поменялся Ref text после предыдущего синтеза?

Благодарю за ответ!
Сегодня попробовал всё заново и снова нет удовлетворительно результата (набор звуков в синтезе)
Вот что происходит в cmd
ыыы.png

Быть может новая версия f5 что-то ломает? Или файл модели не тот, стоит проверить контрольные суммы

Понял, то есть мне стоит попробовать более старую версию f5, ну и поэкспериментировать, да?
Спасибо вам, буду пробовать!

Салют! У меня та же проблема. Установил модель custom, текст распознаёт, но в синтезе получается просто набор звуков. Та же проблема что и у KEnK1. И та же самая ошибка

E:\AI\Pinokio\api\e2-f5-tts.git\app\env\lib\site-packages\gradio\processing_utils.py:741:
User Warning: Trying to convert audio automatically from float32 to 16-bit int format.
warnings.warn(warning.format((data. type))

Подскажите как решить? Или где найти старую версию F5?

Добрый день. Это у вас не ошибка, а предупреждение о конвертации аудио. Проблема где-то в другом месте, попробуйте более старую версию репозитория

Всем привет! Подтверждаю, проблема в новой версии, я выбрал версию 0.6.2 с ней русская модель заводится

Всем привет, тестил с русским на последней версии (1.1.7). Сначала не работало (копировала звучание голоса, но говорила на китайском), но потом поменял базовую модель с "F5TTS_v1_Base" на "F5TTS_Base" всё заработало. Но конечно всё ещё имеются большие проблемы с ударениями. Надеюсь скоро новая версия :)

Sign up or log in to comment