Używacie AI/TTS do tworzenia audiobooków z PDFów?

Czy ktosia z Was ma z tym praktyczne doświadczenia? Większość modeli wymaga więcej niż 12 GB na karcie grafiki, by generować tekst z modeli głosu. Czy ktosia działa na starszym sprzęcie?

Obraz

Alternatywny tekst opisujący obraz

fleg, rok temu

Kilka ładnych lat temu miałem czytnik Boox ze zingegrowaną Ivoną. Tak więc był to TTS, a nie AI, natomiast działało na naprawdę bieda sprzęcie.

Czy brzmiało naturalnie? Nie, doskonale było słychać, że to TTS. Ale było bardziej niż zrozumiałe, i w sumie kilka książek tak przesłuchałem.

odpowiedz

zgłoś

aktywność

kopiuj link

kopiuj link (fediwersum)

open original url

Loading...

deck5955, rok temu

dzięki, ja na tej zasadzie używałem programu Balabolka i polskich “głosów” z githuba. Konwertnąłem sobie tak “Podróż do kresu nocy” i niezbyt się jednak dało słuchać, dlatego pytam o Wasze doświadczenia z łączeniem AI z TTS

odpowiedz

zgłoś

aktywność

kopiuj link

kopiuj link (fediwersum)

open original url

Loading...

fleg, rok temu

Kiedyś szukałem bezpłatnego TTSa do prostego projekciku mającego działać na śmieciowym sprzęcie i znalazłem coś takiego: github.com/coqui-ai/TTSBrzmiało zrozumiale i działało na zwykłym laptopie bez większych problemów. Ale testowałem tylko na krótkich komunikatach.

odpowiedz

zgłoś

aktywność

kopiuj link

kopiuj link (fediwersum)

open original url

Loading...

deck5955, rok temu

dziękuję, chociaż na oficjalnej stronie piszą, że projekt się zamknął https://szmer.info/pictrs/image/96d85213-651b-4dc1-97d3-0abd76608791.png

odpowiedz

zgłoś

aktywność

kopiuj link

kopiuj link (fediwersum)

open original url

Loading...

naur, rok temu

Niskie wymagania sprzętowe i sporo dostępnych modeli ma Piper.
Niestety jakością wyraźnie ustępuje dużym modelom. Nie radzi sobie zbyt dobrze z czytaniem liczb i skrótów.
Do czytania krótkich komunikatów może wystarczyć, ale słuchanie audiobooka wygenerowanego tym TTS byłoby chyba męczące.

odpowiedz

zgłoś

aktywność

kopiuj link

kopiuj link (fediwersum)

open original url

Loading...

Dodaj komentarz