Привет, друзья! Сегодня я расскажу вам, как настроить голосового ИИ-агента с использованием платформ ElevenLabs Voice AI и Make, чтобы он мог записывать встречи прямо в календарь. Погнали разбираться!
ElevenLabs Voice AI: Голосовые возможности на максимум
ElevenLabs Voice AI — это мощная платформа для генерации синтезированной речи и работы с голосами. С её помощью можно:
- Генерировать естественную речь,
- Клонировать голоса,
- Переводить на другие языки.
Особенно популярна платформа в создании голосовых агентов, которых теперь можно легко интегрировать на сайты благодаря недавно добавленному функционалу. Также их можно подключать к телефонным системам. Правда, после сентября 2023 года доступ из России возможен только с IP не из РФ.
Пример работы: Агент для фитнес-клуба
Представьте, что вы создаёте голосового помощника для фитнес-клуба. Агент отвечает на вопросы, записывает клиентов на пробные тренировки и проверяет доступные временные слоты в календаре. Вот как это устроено:
- Настройка промта: Задаём агенту роль и контекст. Например: “Вы — голосовой помощник фитнес-клуба. Ваша задача — записывать клиентов на тренировки и предоставлять информацию о клубе.”
- Выбор голоса: На платформе ElevenLabs Voice AI доступно множество голосов. Вы можете выбрать готовый или даже клонировать собственный голос. Для тестов я выбрал голос Джессики — приятный и профессиональный.
- Интеграция с Make:
- Используем webhook для передачи данных между агентом и календарём.
- Настраиваем Make для обработки запросов. Например, переводим текстовые команды (“завтра”) в формат, понятный Google Календарю.
- Работа с календарём:
- Сценарий в Make проверяет доступные временные слоты и отвечает агенту.
- Если время занято, агент сообщает об этом. Если свободно — записывает клиента.
Цены и возможности
Работа с ElevenLabs Voice AI не самая дешёвая, но доступна. Минимальный тариф — $5 в месяц за 30,000 кредитов. Если у вас небольшая нагрузка, этого хватит с головой.
Make тоже имеет стартовый бесплатный план с 10,000 операций, что позволяет протестировать интеграции без лишних затрат.
Преимущества и подводные камни
- Плюсы:
- Высокое качество синтезированной речи,
- Гибкость настроек,
- Возможность интеграции с различными системами.
- Минусы:
- Задержка в обработке запросов может быть заметна,
- Некоторые функции требуют дополнительных затрат.
Как это выглядит на практике?
Когда клиент звонит или пишет, агент отвечает, собирает данные (имя, время) и проверяет доступность через Make. Например:
- Клиент: “Хочу записаться на завтра.”
- Агент: “Доступны слоты с 11:00 до 15:00. Какой выбрать?”
- Клиент: “12:00.”
- Агент записывает время в календарь и подтверждает бронь.
Вывод
Интересный функционал, хотя пока не идеально работает: агент не всегда записывает данные с первого раза, а иногда диалог может прерваться. Но в связке с Make это особенно мощное решение. Как только разработчики допилят и исправят шероховатости, это станет отличным вариантом для коммерческих проектов.
Если у вас остались вопросы или хотите поделиться своим опытом — пишите в комментариях. А ещё приглашаю вас в наше сообщество исследователей нейросетей Neyrocommunity, где можно задать вопросы и пообщаться с единомышленниками. Инвайт: https://neyrohub.ru/community.
Ну а я пошёл тестировать новые сценарии. До связи!
Ваш Андрей Плешков, организатор нейросаммитов и фанат автоматизации.