hotstone228/F5-TTS-Russian · Подскажите, как использовать эту модель с установленной F5-TTS cli

Dec 16, 2024

Подскажите, пожалуйста, как использовать эту модель с установленной F5-TTS cli
куда её положить, где указать, какие параметры, если можно с примером?

None1145

Dec 17, 2024

Попробуйте это:
https://colab.research.google.com/drive/1r3uaBggiM_U4ank3yalM6paiXRbjVbct#scrollTo=7HGgBQ_js3MR

Замените содержимоеmodel_idнаhotstone228/F5-TTS-Russian,
затем замените содержимоеckpt_fileнаckpts/model_last.pt,
а содержимоеvocab_fileзамените наckpts/vocab.txt.

После этого вы сможете изменить некоторые настройки для запуска F5-TTS.

aboinpace

Dec 17, 2024

у меня локальная установка, скачал вашу модель, синтез отрабатывает но результат явно не русский, редкие слова проскакивают. Подскажите, пожалуйста, может какие настройки еще надо сделать?

hotstone228

Owner Dec 17, 2024

Попробуйте safetensors вариант

aboinpace

Dec 17, 2024

спасибо, получилось

ysamsonov

Jan 17

Нужна Ваша помощь.
Установил локально https://github.com/swivid/F5-TTS/
Запустилось, на английском работает.
Запускается f5-tts_finetune-gradio (для обучения) или f5-tts_infer-gradio (для использования).
Скачал данную модель, но никак не могу понять как ее подключить.
Пожалуйста дайте немного информации.
Большое спасибо.

hotstone228

Owner Jan 17

Добрый вечер, в инфер градио сверху выберите пункт custom

ysamsonov

Jan 17

•

edited Jan 17

К сожалению у меня нет такого пункта, вы можете показать где он находится?

hotstone228

Owner Jan 17

приложите скришот

ysamsonov

Jan 17

Могу предположить что я мог что то сломать.
Попробую завтра все сделать с нуля.

hotstone228

Owner Jan 17

обновите клонированный репозиторий и переустановите пакет в pip. у вас старая версия

ysamsonov

Jan 18

Большое спасибо. У меня все получилось. Спасибо за Ваш труд и удачного развития проекта.

KEnK1

Mar 30

Здравствуйте! Нужна Ваша помощь.
Установил локально F5-TTS, всё запустилось, на английском работает.
Установил вашу модель и установил как custom. Текст ref аудио распознаёт, но в синтезе получается просто набор звуков.
Пожалуйста дайте знать что я делаю не так?(
Большое спасибо.

hotstone228

Owner Mar 30

Может быть у вас не поменялся Ref text после предыдущего синтеза?

KEnK1

Mar 30

Благодарю за ответ!
Сегодня попробовал всё заново и снова нет удовлетворительно результата (набор звуков в синтезе)
Вот что происходит в cmd

hotstone228

Owner Mar 30

Быть может новая версия f5 что-то ломает? Или файл модели не тот, стоит проверить контрольные суммы

KEnK1

Mar 30

Понял, то есть мне стоит попробовать более старую версию f5, ну и поэкспериментировать, да?
Спасибо вам, буду пробовать!

GearStarter

Apr 12

Салют! У меня та же проблема. Установил модель custom, текст распознаёт, но в синтезе получается просто набор звуков. Та же проблема что и у KEnK1. И та же самая ошибка

E:\AI\Pinokio\api\e2-f5-tts.git\app\env\lib\site-packages\gradio\processing_utils.py:741:
User Warning: Trying to convert audio automatically from float32 to 16-bit int format.
warnings.warn(warning.format((data. type))

Подскажите как решить? Или где найти старую версию F5?

hotstone228

Owner Apr 13

Добрый день. Это у вас не ошибка, а предупреждение о конвертации аудио. Проблема где-то в другом месте, попробуйте более старую версию репозитория

evrsml

Apr 23

Всем привет! Подтверждаю, проблема в новой версии, я выбрал версию 0.6.2 с ней русская модель заводится

Wirtual

Jul 18

Всем привет, тестил с русским на последней версии (1.1.7). Сначала не работало (копировала звучание голоса, но говорила на китайском), но потом поменял базовую модель с "F5TTS_v1_Base" на "F5TTS_Base" всё заработало. Но конечно всё ещё имеются большие проблемы с ударениями. Надеюсь скоро новая версия :)