очистка данных

Стек для Больших Данных

Все сегодня говорят о Больших Данных, но мало кто знает, как с ними работать. Похоже, что соответствующие технологии уже вышли из юношества, но еще не повзрослели, а стек решений, что бы ни заявляли ведущие игроки, представляет собой весьма аморфное, хотя и динамичное образование.

Инструменты для «ковбоев»

«Выпас данных» — так можно перевести название новой специальности data wrangling, в задачу представителей которой входит подготовка больших массивов данных для последующего их анализа.

Особенности очистки адресных данных

Бытует мнение, что стандартизация почтовых адресов — задача тривиальная. Однако это не так: часто ее вполне можно отнести к области искусственного интеллекта. Распознавание, кластерный анализ и машинное обучение — это лишь неполный перечень направлений, с которыми приходится иметь дело при очистке адресных данных.

Проблемы автоматизации аналитики: как избежать распространенных ошибок

Для автоматизации аналитики часто применяют no-code /low-code ETL-инструменты. Однако у этих инструментов есть недостаки. Правильный ли это выбор?