Tüm Projeler
AI

Voice Agent

Diş klinikleri için uçtan uca randevu yönetimi yapan telefon asistanı. Bu süreci Deepgram (hızlı sesten metne dönüşüm), ElevenLabs (doğal ses sentezi) ve WebSocket (kesintisiz çift yönlü iletişim) teknolojilerini kullanarak, insan doğallığında ve gecikmesiz çalışacak şekilde kurguladık.

Voice Agent

Teknolojiler

PythonFastAPIDeepgram API (STT)ElevenLabs API (TTS)Ollama (LLM)WebSocketBase64JSONHTML5
#Voice AI Agent#Sesli Yapay Zeka#Randevu Yönetimi#Diş Kliniği#NLU/NLG#Speech-to-Text#Text-to-Speech#Doğal Dil İşleme#WebSocket#Düşük Gecikme

Sesli AI Ajanı / Voice Agent (Operasyon İstasyonu): Uçtan Uca Randevu Yönetimi

Sistem Mimarisi ve Tasarım Akışı

Geliştirdiğimiz mimari, gelişmiş bir sesli işlem hattına (audio processing pipeline) dayanmaktadır. Tüm süreç, tarayıcı veya telefon hattı üzerinden gelen konuşma sesinin yakalanmasıyla başlar. Sistem akışı şu şekildedir:

- Gerçek Zamanlı Sesten Metne Dönüşüm (STT): Yakalanan konuşma sesi verileri, kesintisiz veri paketleri (streaming) halinde Deepgram API (STT) uç noktasına gönderilir. Deepgram, sesi saniyenin altında yüksek doğrulukla metne çevirir.

- Akıllı NLU ve NLG İşleme (llm_agent.py): Deepgram'dan dönen kesin metin çıktısı, FastAPI Sunucusu (server.py) üzerinden Ollama (llm_agent.py) modülüne iletilir. Ollama, klinikler için optimize edilmiş sistem promptuna göre hafızayı kontrol eder, randevu durumunu sorgular (Gerekirse text-to-sql kullanarak) ve bağlama en uygun asistan cevabını Türkçe olarak üretir.

Voice Agent | Intera