harcesz,
!deleted269 avatar

W sumie by mi się przydało, więc zaraz odpalę do testów Speech Note; github.com/mkiol/dsnote

Można zainstalować przez ‘sklep’ z aplikacjami w Ubuntu/Debianie wyszukując po nazwie, albo jak chcesz się poczuć bardziej hakersko - instalacja w terminalu:
flatpak install flathub net.mkiol.SpeechNote

Jeśli masz komputer z oddzielną kartą graficzną (GPU nvidia albo AMD) to warto doinstalować elementy do tego i tego i ją wykorzystać, bo to na pewno znacznie przyśpieszy działanie. Program Open Source, działa w całości lokalnie, ma nic nie wysyłać do internetu, więc znacznie bardziej prywatne niż używanie czegokolwiek online. Teoretycznie polski jest tam w pełni wspierany.

https://szmer.info/pictrs/image/59091a5e-fb8e-4671-bf97-6235c10b378c.png

harcesz,
!deleted269 avatar

Na lekko złomotawym komputerze bez karty graficznej prędkością nie powala, dyktując powyższy komentarz musiałem poczekać ze 2 minuty aż go przemieli, ale wynik zaskakująco dobry. Jestem pod wrażeniem.

https://szmer.info/pictrs/image/4466d75a-cd33-4972-bfaf-7904756b271c.png

Po instalacji trzeba wejść w języki wyszukać polski i wybrać model językowy do ściągnięcia. Pierwszy z góry dał słabe efekty, ale faster whisper large v3 daje bardzo dobre wyniki.

dj1936,
!deleted2556 avatar

Dzięki harc! Nawet udało mi się zainstalować po hakersku :D

ergast,

Ja używałem capcut jak miałem dzwięk w wideo, ale znalazłem takie narzędzie. nie testowałem: speechnotes.co

dj1936,
!deleted2556 avatar

Hej! Taki mały update:

dziękuję szmerze, że istniejesz, bo bardzo mi pomogliście z tym!

Używam Speech Note z językiem faster whisper large v3 i jest nieźle (sporo trzeba edytować), ale pomaga. A może ktoś inny język polski wybrał w ustawieniach i jest lepiej?

Lubię podgrupę “zapytajszmer” tutaj <3

wacpan,
@wacpan@szmer.info avatar

Korzystałem z rozwiązania chmurowego (czyli bez gwarancji prywatności):

– w wersji free-bez rejestracji – limit 10 min per kawałek, limit dobowy oraz brak rozróżniania rozmówców; za to jakość dla jęz. polskiego – co najmniej dobra.

Analogicznie można użyć YouTube’a z autotranscript, tylko trzeba mieć tam konto.

  • Wszystkie
  • Subskrybowane
  • Moderowane
  • Ulubione
  • zapytajszmer@szmer.info
  • muzyka
  • Spoleczenstwo
  • fediversum
  • test1
  • krakow
  • FromSilesiaToPolesia
  • rowery
  • Technologia
  • slask
  • lieratura
  • informasi
  • retro
  • sport
  • Blogi
  • nauka
  • Gaming
  • esport
  • Psychologia
  • Pozytywnie
  • motoryzacja
  • niusy
  • tech
  • giereczkowo
  • ERP
  • antywykop
  • Cyfryzacja
  • zebynieucieklo
  • warnersteve
  • Wszystkie magazyny