Używacie AI/TTS do tworzenia audiobooków z PDFów?
Czy ktosia z Was ma z tym praktyczne doświadczenia? Większość modeli wymaga więcej niż 12 GB na karcie grafiki, by generować tekst z modeli głosu. Czy ktosia działa na starszym sprzęcie?
Czy ktosia z Was ma z tym praktyczne doświadczenia? Większość modeli wymaga więcej niż 12 GB na karcie grafiki, by generować tekst z modeli głosu. Czy ktosia działa na starszym sprzęcie?
fleg, Kilka ładnych lat temu miałem czytnik Boox ze zingegrowaną Ivoną. Tak więc był to TTS, a nie AI, natomiast działało na naprawdę bieda sprzęcie.
Czy brzmiało naturalnie? Nie, doskonale było słychać, że to TTS. Ale było bardziej niż zrozumiałe, i w sumie kilka książek tak przesłuchałem.
deck5955, dzięki, ja na tej zasadzie używałem programu Balabolka i polskich “głosów” z githuba. Konwertnąłem sobie tak “Podróż do kresu nocy” i niezbyt się jednak dało słuchać, dlatego pytam o Wasze doświadczenia z łączeniem AI z TTS
fleg, Kiedyś szukałem bezpłatnego TTSa do prostego projekciku mającego działać na śmieciowym sprzęcie i znalazłem coś takiego: github.com/coqui-ai/TTSBrzmiało zrozumiale i działało na zwykłym laptopie bez większych problemów. Ale testowałem tylko na krótkich komunikatach.
deck5955, dziękuję, chociaż na oficjalnej stronie piszą, że projekt się zamknął https://szmer.info/pictrs/image/96d85213-651b-4dc1-97d3-0abd76608791.png
naur,
Dodaj komentarz