Od dawna nie rozwijam tego projektu w tym repo
Obecnie pracuję nad tym, ale z wykorzystaniem VueJS oraz python FastAPI do backendu
Ta aplikacja ma na celu wesprzeć transkrypt i kategoryzację plików nieuporządkowanych
Obecnie, jest to wczesna alfa i nie wszystko działa jak należy
Do działania wymaga ffmpeg.exe
Ogólnie aplikacja jest uruchamiana w środowisku deweloperskim ReactJS, więc wymaga pakietu react-scripts
F2 - Zatrzymaj / Wznów audio
- Zaimplementować
trzecidrugi poziom eksportu, czyli wsparcie dla treningu modeli multi_speaker tj. Flowtron lub Uberduck Tacotron - Zautomatyzować proces wstępnej konfiguracji bazy (obecnie istnieje on w oparciu o istnienie pliku status.json)
- Zaimplementować opcjonalne formatowanie plików przy finalizacji
- Dodać wsparcie dla innnych wersji językowych
- Dodać ciemny styl
- Rekursywne przeszukiwanie folderów (w folderach szuka w folderze wavs)
- Więcej opcji finalizacji (osobny panel) - Wymaga zmian w API w klasach finalizacji
- Konfiguracja aplikacji z poziomu interfejsu - Wyłącznie kategorie podlegają modyfikacji
- Zaimplementować skróty klawiszowe
- Ogólnie dostosować aplikację do ułatwienia rozproszonego development
- Rozwiązazć problemy wycieku pamięci
- Użytkownik decyduje o tym, co jest w linijce - Wymaga zmian po stronie klas finalizacji. Na ten czas tylko TacotronFinalise wspiera to.
W ogromnym skrócie, uczynić aplikację user friendly i dev friendly
- Przetestować framework Electron
- Przetestować chmurowe systemy bazodanowe
- Przepisać API na nowo, żeby ułatwić implementację na inne systemy bazodanowe
- Zaimplementować wsparcie auto-tranksrypcji
- Startowanie nie byłoby automatyczne jak teraz, tylko z GUI
Jako iż to wczesna alfa, to też nie udzielam wsparcia technicznego w problemach jakie mogą nastąpić