Инфраструктура + зачатки бота + определяемся с входными данными
В Zeppelin делаем то же, что должно делать приложение, определяемся с форматом и составом данных на выходе, генерируем тестовые данные, на них тестируем бота
Запускаем hive-скрипт на кластер, смотрим, что получилось
Общая идея MVP