Datafold создает платформу для мониторинга аналитических данных, которая помогает дата-саентистам и дата-инженерам быстрее находить нужные данные и разбираться в их устройстве, а также тестировать и отслеживать качество данных. Продукт включает в себя поиск по данным с анализом зависимостей (lineage), Data Diff для сравнения таблиц и регрессионного тестирования и мониторинг аномалий в метриках с помощью ML.

Наша штаб-квартира находится в Сан-Франциско, команда с первого дня работает удаленно и включает в себя 15 человек в США, России и Европе. В числе наших инвесторов YCombinator и NEA. Спустя всего год после запуска продукта, в числе наших клиентов уже есть несколько юникорнов, включая Patreon и Thumbtack.

Весь бэкэнд продукта написан на Python. Из интересных особенностей нашей архитектуры: чтобы обнаруживать зависимости внутри данных, мы написали собственный парсер SQL, чтобы эффективно хранить и анализировать связи между данными мы используем графовую БД Neo4j, а почему мы переехали с Flask на FastAPI вы узнаете из нашего доклада на Moscow Python!

Предложение

Присоединяйся к команде Datafold! Мы ищем Senior Python Engineer, которому интересно работать над созданием инновационного продукта в динамичной и быстро растущей ALL-REMOTE команде!

Контакты

hello@datafold.com