Czy ktosia z Was ma z tym praktyczne doświadczenia? Większość modeli wymaga więcej niż 12 GB na karcie grafiki, by generować tekst z modeli głosu. Czy ktosia działa na starszym sprzęcie?
Niskie wymagania sprzętowe i sporo dostępnych modeli ma Piper.
Niestety jakością wyraźnie ustępuje dużym modelom. Nie radzi sobie zbyt dobrze z czytaniem liczb i skrótów.
Do czytania krótkich komunikatów może wystarczyć, ale słuchanie audiobooka wygenerowanego tym TTS byłoby chyba męczące.
dzięki, ja na tej zasadzie używałem programu Balabolka i polskich “głosów” z githuba. Konwertnąłem sobie tak “Podróż do kresu nocy” i niezbyt się jednak dało słuchać, dlatego pytam o Wasze doświadczenia z łączeniem AI z TTS
Kiedyś szukałem bezpłatnego TTSa do prostego projekciku mającego działać na śmieciowym sprzęcie i znalazłem coś takiego: github.com/coqui-ai/TTSBrzmiało zrozumiale i działało na zwykłym laptopie bez większych problemów. Ale testowałem tylko na krótkich komunikatach.
Dodaj komentarz