ElevenLabs Voice AI: Как создать голосового ИИ-агента с помощью 11Labs и Make

Привет, друзья! Сегодня я расскажу вам, как настроить голосового ИИ-агента с использованием платформ ElevenLabs Voice AI и Make, чтобы он мог записывать встречи прямо в календарь. Погнали разбираться!

ElevenLabs Voice AI: Голосовые возможности на максимум

ElevenLabs Voice AI — это мощная платформа для генерации синтезированной речи и работы с голосами. С её помощью можно:

  • Генерировать естественную речь,
  • Клонировать голоса,
  • Переводить на другие языки.

Особенно популярна платформа в создании голосовых агентов, которых теперь можно легко интегрировать на сайты благодаря недавно добавленному функционалу. Также их можно подключать к телефонным системам. Правда, после сентября 2023 года доступ из России возможен только с IP не из РФ.

Пример работы: Агент для фитнес-клуба

Представьте, что вы создаёте голосового помощника для фитнес-клуба. Агент отвечает на вопросы, записывает клиентов на пробные тренировки и проверяет доступные временные слоты в календаре. Вот как это устроено:

  1. Настройка промта: Задаём агенту роль и контекст. Например: “Вы — голосовой помощник фитнес-клуба. Ваша задача — записывать клиентов на тренировки и предоставлять информацию о клубе.”
  2. Выбор голоса: На платформе ElevenLabs Voice AI доступно множество голосов. Вы можете выбрать готовый или даже клонировать собственный голос. Для тестов я выбрал голос Джессики — приятный и профессиональный.
  3. Интеграция с Make:
    • Используем webhook для передачи данных между агентом и календарём.
    • Настраиваем Make для обработки запросов. Например, переводим текстовые команды (“завтра”) в формат, понятный Google Календарю.
  4. Работа с календарём:
    • Сценарий в Make проверяет доступные временные слоты и отвечает агенту.
    • Если время занято, агент сообщает об этом. Если свободно — записывает клиента.

Цены и возможности

Работа с ElevenLabs Voice AI не самая дешёвая, но доступна. Минимальный тариф — $5 в месяц за 30,000 кредитов. Если у вас небольшая нагрузка, этого хватит с головой.

Make тоже имеет стартовый бесплатный план с 10,000 операций, что позволяет протестировать интеграции без лишних затрат.

Преимущества и подводные камни

  • Плюсы:
    • Высокое качество синтезированной речи,
    • Гибкость настроек,
    • Возможность интеграции с различными системами.
  • Минусы:
    • Задержка в обработке запросов может быть заметна,
    • Некоторые функции требуют дополнительных затрат.

Как это выглядит на практике?

Когда клиент звонит или пишет, агент отвечает, собирает данные (имя, время) и проверяет доступность через Make. Например:

  • Клиент: “Хочу записаться на завтра.”
  • Агент: “Доступны слоты с 11:00 до 15:00. Какой выбрать?”
  • Клиент: “12:00.”
  • Агент записывает время в календарь и подтверждает бронь.

Вывод

Интересный функционал, хотя пока не идеально работает: агент не всегда записывает данные с первого раза, а иногда диалог может прерваться. Но в связке с Make это особенно мощное решение. Как только разработчики допилят и исправят шероховатости, это станет отличным вариантом для коммерческих проектов.

Если у вас остались вопросы или хотите поделиться своим опытом — пишите в комментариях. А ещё приглашаю вас в наше сообщество исследователей нейросетей Neyrocommunity, где можно задать вопросы и пообщаться с единомышленниками. Инвайт: https://neyrohub.ru/community.

Ну а я пошёл тестировать новые сценарии. До связи!


Ваш Андрей Плешков, организатор нейросаммитов и фанат автоматизации.