Voice Agent
Diş klinikleri için uçtan uca randevu yönetimi yapan telefon asistanı. Bu süreci Deepgram (hızlı sesten metne dönüşüm), ElevenLabs (doğal ses sentezi) ve WebSocket (kesintisiz çift yönlü iletişim) teknolojilerini kullanarak, insan doğallığında ve gecikmesiz çalışacak şekilde kurguladık.

Teknolojiler
Sesli AI Ajanı / Voice Agent (Operasyon İstasyonu): Uçtan Uca Randevu Yönetimi
Sistem Mimarisi ve Tasarım Akışı
Geliştirdiğimiz mimari, gelişmiş bir sesli işlem hattına (audio processing pipeline) dayanmaktadır. Tüm süreç, tarayıcı veya telefon hattı üzerinden gelen konuşma sesinin yakalanmasıyla başlar. Sistem akışı şu şekildedir:
- Gerçek Zamanlı Sesten Metne Dönüşüm (STT): Yakalanan konuşma sesi verileri, kesintisiz veri paketleri (streaming) halinde Deepgram API (STT) uç noktasına gönderilir. Deepgram, sesi saniyenin altında yüksek doğrulukla metne çevirir.
- Akıllı NLU ve NLG İşleme (llm_agent.py): Deepgram'dan dönen kesin metin çıktısı, FastAPI Sunucusu (server.py) üzerinden Ollama (llm_agent.py) modülüne iletilir. Ollama, klinikler için optimize edilmiş sistem promptuna göre hafızayı kontrol eder, randevu durumunu sorgular (Gerekirse text-to-sql kullanarak) ve bağlama en uygun asistan cevabını Türkçe olarak üretir.