Streaming STT → Translate → TTS

Webseite v0.4.5-B — Browserseitige Soft-Korrektur (sicher, schaltbar) + Vergleich Roh/Korrigiert

Test-Steuerung (Block A–C)

Status: Bereit – bitte verbinden.
Phase:
Countdown:
Anleitung: Verbinden → Audio aktivieren → Test starten.

Referenztext v1.0 (immer exakt gleich sprechen)

„Moderne Elektroautos führen zunehmend zu Engpässen in der Lieferkette. Gleichzeitig steigen die Anforderungen an Ladeinfrastruktur, Netzstabilität und intelligente Steuerungssysteme im urbanen Raum.“
Regel: In Phase „Sprechen“ den Text genau einmal normal, ruhig, natürlich sprechen. Keine Zusatzwörter.

Phase-Messwerte (automatisch)

Phase RMS-EMA (Hold) Peak-Hold Bewertung
Stille (Block A)
Sprechen (Block B)
Nachlauf-Stille

Richtwerte (grob): Sprache RMS-EMA-Hold typ. ~0.10–0.18 bei gutem Gain. Peak-Hold ideal <0.85.

Browser-Audio Einstellungen

Hinweis: Für Focusrite/sauberes Signal sind oft alle drei AUS besser. Für Laptop-Mic ggf. AN.

Soft-Korrektur (Browser)

z.B. lade[- ]infrastruktur → Ladeinfrastruktur; netz[- ]stabilität → Netzstabilität
Lesbarkeit, bessere Übersetzung
z.B. „gleich.“ / „halt.“ (nur am Satzende)
?? → ?, .. → . usw.
Zeilen zu einem Satz verbinden (konservativ)
nur wenn davor kein echtes Fragewort
sehr vorsichtig; standardmäßig AUS
Mehrfach-Leerzeichen entfernen

Diese Regeln verändern nur Form (Orthografie/Format), nicht die Bedeutung. Audio bleibt unverändert.

Audio-Diagnose (Live)

Diagnose: —

Snapshot / Protokoll

VU-Meter (geglättet) + Skala + Peak-Hold (2s)
Skala: 0.00 … 1.00. Peak-Hold markiert den höchsten Ausschlag der letzten ~2s.
RMS
Peak
Interim (DE): —

Final (DE) – Roh (vom Server)

Final (DE) – Korrigiert (Browser)

Translation (EN) – vom Server

Audio (EN) – vom Server

Audio-Queue: 0 | Playing: no

Log