wavekat
stimme docs blog
← zurück zum Blog

Hallo, Welt — WaveKat ist da

· Eason Guo
#Ankündigung #Open-Source #Sprach-KI

Wir haben WaveKat aus einer einfachen Überzeugung heraus gegründet:

Jedes kleine Unternehmen verdient die Stimme eines großen.

Kleine Unternehmen verpassen Anrufe. Sie können sich weder einen Empfang noch einen rund um die Uhr besetzten Telefondienst leisten. Große Konzerne hingegen setzen ausgefeilte Sprach-KI ein, die Tausende von Anrufen am Tag bewältigt. Diese Kluft sollte es nicht geben.

Was wir bauen

WaveKat entwickelt Werkzeuge für Echtzeit-Sprach-KI. Wir beginnen mit einer Reihe quelloffener Bibliotheken:

Auf diesen Bibliotheken aufbauend entwickeln wir wavekat-voice — ein KI-gestütztes Telefonannahmesystem, das sich an gängige SIP/RTP-Infrastruktur anschließt. Es nimmt das Telefon ab, führt ein echtes Gespräch und wickelt den Anruf ab — damit die Inhaberin oder der Inhaber es nicht selbst tun muss.

Warum mit Open Source beginnen?

Wir sind überzeugt, dass die grundlegende Technologie — VAD, Sprecherwechselerkennung, Audioverarbeitung — offen, überprüfbar und frei nutzbar sein sollte. Diese Bausteine sollten nicht hinter Unternehmensverträgen weggesperrt sein.

Wie es weitergeht

Wir sind voll im Entwicklungsmodus. Folgen Sie uns auf GitHub oder schauen Sie hier wieder vorbei — wir werden über die Technik hinter Echtzeit-Sprache schreiben, über die Abwägungen, die wir treffen, und über das, was wir unterwegs lernen.

← zurück zum Blog