top of page

FAQ

Hier findest du Antworten auf deine Fragen zur vocca-App. 

Warum setzt ihr eine synthetische Stimme ein?

Die neuen Möglichkeiten der Künstlichen Intelligenz (KI) bzw. Text-to-Speech (TTS) spielen auch im Journalismus zunehmend eine wichtige Rolle. Durch den Einsatz der automatischen Vertonung durch eine Computerstimme können Inhalte in größerer Zahl und schneller veröffentlicht werden. Außerdem hat die menschliche Redaktion so mehr Zeit, um passende Qualitätsinhalte zu finden und die kreative Weiterentwicklung voranzutreiben. vocca ist also bewusst ein Zusammenspiel aus Mensch und Maschine.

Warum spricht die synthetische Stimme manche Wörter falsch aus?

Künstliche Intelligenz (KI)-Systeme, insbesondere TTS (Text-to-Speech)-Modelle, basieren auf riesigen Mengen an Textdaten, die im Laufe der Zeit aus dem Internet gesammelt wurden. Diese Modelle lernen, indem sie diese Daten analysieren und Muster in der menschlichen Sprache erkennen. Es gibt jedoch mehrere Gründe, warum KI-Systeme manchmal Wörter oder Sätze falsch aussprechen können:


1. Unvollständige oder fehlerhafte Daten: Die KI-Modelle lernen aus den Textdaten, die ihnen zur Verfügung stehen. Wenn diese Daten unvollständig oder fehlerhaft sind, können die Modelle inkorrekte Aussprachen erlernen.
2. Abweichungen in der Aussprache: In der menschlichen Sprache gibt es viele Dialekte, Akzente und regionale Variationen. KI-Modelle haben möglicherweise Schwierigkeiten, die richtige Aussprache für bestimmte Wörter oder Ausdrücke zu erlernen, insbesondere wenn sie auf Daten beschränkt sind, die aus einer bestimmten Region stammen.
3. Neologismen und Fachbegriffe: Neue Wörter und Fachbegriffe tauchen ständig auf, und KI-Modelle können Schwierigkeiten haben, sie korrekt auszusprechen, wenn sie nicht ausreichend trainiert wurden.
4. Kontextabhängigkeit: Die Aussprache eines Wortes kann je nach dem umgebenden Text variieren. KI-Modelle können Schwierigkeiten haben, den richtigen Kontext für die Aussprache eines Wortes zu verstehen.
5. Technische Begrenzungen: Die Qualität der Text-zu-Sprache-Technologie hängt auch von der Qualität der verwendeten Stimmen und der technischen Umsetzung ab. Bei bestimmten Worten oder Klängen können technische Begrenzungen auftreten. Um die Aussprache unserer synthetischen Stimme zu verbessern, sind ständige und Aktualisierungen erforderlich, um auf Veränderungen in der menschlichen Sprache und neue Datenquellen zu reagieren.

Wie sorgt ihr dafür, dass die synthetische Stimme besser wird und lernt?

Die Verbesserung synthetischer Stimmen in KI-Systemen erfordert eine Kombination aus Technologieentwicklung, Datenqualität und maschinellem Lernen. Hier sind einige Schritte, die wir unternehmen, um unsere synthetischen Stimmen zu verbessern und sie besser lernen zu lassen: Wir benutzen immer die aktuellsten KI-Modelle und sind somit immer auf dem neuesten Stand. Fortschritte im maschinellen Lernen ermöglichen es, Modelle zu verfeinern und besser auf verschiedene Aussprachevarianten zu trainieren. Wir erweitern ständig das Vokabular, auf das unsere Systeme zugreifen können. Dies umfasst auch das Hinzufügen von Fachbegriffen und neologischen Ausdrücken. Die Verbesserung synthetischer Stimmen ist ein fortlaufender Prozess, der sowohl technische als auch datengesteuerte Anstrengungen erfordert. Daher ist es uns wichtig, Feedback von unseren Benutzern und externen Experten zu sammeln und dieses dann in die Entwicklung und Aktualisierung unserer Sprachsynthesesysteme zu integrieren, um die Qualität der Aussprache kontinuierlich zu steigern.

Kann ich dabei helfen, die KI besser zu machen?

Es ist uns wichtig, Feedback von unseren Benutzer*innen und externen Experten zu sammeln und dieses dann in die Entwicklung und Aktualisierung unserer Sprachsynthesesysteme zu integrieren, um die Qualität der Aussprache kontinuierlich zu steigern. Wenn die synthetische Stimme ein Wort oder einen Satz falsch ausspricht, werden unsere Benutzer*innen bald die Möglichkeit haben, dies zu melden, damit das System verbessert werden kann.

Warum sind manche Artikel menschlich vertont und andere durch den Computer?

Aus Erfahrung und auch Nutzer*innen-Befragungen wissen wir, dass vor allem kurze Nachrichtenbeiträge von einer Computerstimme angenehm zu hören sind - trotz der ein oder anderen Ungenauigkeit in der Aussprache. Bei längeren Inhalten wie Zeitungsartikeln oder Online-Artikeln dagegen sind menschliche Stimmen auf Dauer angenehmer zu hören. Hierzu freuen wir uns auch jederzeit über Feedback.

Wie werden die Nachrichten ausgesucht?

Zum jetzigen Zeitpunkt der Beta-2-Lernphase laufen die journalistischen Inhalte auf unterschiedliche Arten in unsere App ein. Die Lokalnachrichten der NRW-Lokalradios werden automatisch über eine Schnittstelle von Radiosendern in unser Content-Manegement-System eingespielt und von dort nach der automatischen Synthetisierung veröffentlicht. Bei anderen Content-Partnern wie WDR Kultur oder den Zeitungsverlagen dagegen nutzen wir das Prinzip der Kuration. Die Redaktion prüft alle publizierten Inhalte und wählt die besten aus, um sie dann passend zu den Vorlieben der User*innen in der App auszuspielen.

Wieso habt ihr nur Lokal-Nachrichten aus NRW in der App?

vocca hat seinen Ursprung in NRW. Somit war es naheliegend, von hier aus zu starten und schließlich immer weiter zu wachsen. Die erste Testphase (Beta 1) im Frühjahr 2023 bestand somit primär aus Lokalnachrichten der Region Ostwestfalen-Lippe, da hier die Sender des vocca-Gründungsmitglieds ams beheimatet sind. Ergänzt wird das Angebot von Beginn an und bis heute u.a. durch Artikel des Redaktionsnetzwerks Deutschland, das Nachrichten aus Deutschland und der Welt zuliefert sowie vielseitigen Produktionen von ARD Kultur. vocca setzt auf Wachstum, weitere Content-Partner werden ständig integriert und erweitern somit das Angebot.

Wie werden die Inhalte-Anbieter ausgesucht?

Unser Ziel ist es, dich bestmöglich mit Nachrichten und anderen interessanten Inhalten aus deiner Heimat zu versorgen. Dazu kooperieren wir zum einen mit Content-Partnern, die direkt vor deiner Tür zuhause sind, z.B. den Lokalradiosendern oder der Lokalzeitung.
Wir möchten dir aber auch die Möglichkeit bieten, dich über das Nachrichtengeschehen in der ganzen Welt zu informieren. Hierzu haben wir Partnerschaften mit international vernetzten Nachrichtenagenturen wie RND (Redaktionsnetzwerk Deutschland) oder euranet geschlossen. Hinzu kommen noch Inhalte ausgewählter Content-Partner zu besonderen Themenfeldern wie Wetter, Horoskop oder Kultur. Wir arbeiten daran, das Inhalte-Angebot stetig zu erweitern, um dir das zu liefern, was dich interessiert.

Wer bekommt welche Inhalte ausgespielt?

Als vocca-User*in erhältst du automatisch aktuelle Lokal- und Regionalnachrichten sowie einen Radiosender ausgespielt, anhand der Postleitzahl, die du bei der Registrierung angibst. Dabei kann es sich um deinen Wohnort handeln - oder auch um das Ziel für deinen nächsten Wochenendtrip. Du entscheidest. Wichtig: Momentan kann unsere App ausschließlich Postleitzahlen aus NRW verarbeiten.
Alle weiteren ausgespielten Inhalte richten sich nach deinen persönlichen Interessen und Vorlieben. Du kannst sie bei der Registrierung angeben und nachträglich jederzeit in den App-Einstellungen anpassen.

Wieso “muss” ich mir regionale/ lokale Inhalte anhören/ durchlesen?

Die Möglichkeit, lokale und regionale Inhalte personalisiert ausgespielt zu bekommen, ist die Grundidee von vocca. Aus diesem Grund hat sich die Redaktion entschieden, diese Inhalte als Basis zu nehmen. Weitere Inhalte können nach Interessengebieten hinzugefügt oder abgewählt werden.

Wieso muss ich mich für die App-Nutzung mit meiner E-Mail-Adresse registrieren?

Wir möchten, dass die vocca-App sich deinen Wünschen und Bedürfnissen anpasst. Hierzu erstellst du mit der E-Mail-Registrierung ein User-Profil, indem die von dir angegebenen Interessen hinterlegt werden, um dir ein personalisiertes Nachrichtenerlebnis zu ermöglichen. Außerdem können wir dich über diese Adresse bei Problemen direkt persönlich kontaktieren. Wir arbeiten DSGVO-konform. Unsere Datenschutzbestimmungen kannst du hier einsehen. Wir arbeiten daran, bald noch weitere Registrierungsmethoden anbieten zu können.

Wenn du noch mehr Fragen hast, erreichst du uns hier.

bottom of page