Большие данные

Опубликован стандарт на состав ядра Hadoop — ODPi Runtime Specification

ODPi была учреждена в прошлом году в целях сдерживания фрагментации рынка Hadoop. В рамках инициативы планировалось подготовить стандарт, включив в него проверенные технологии из числа проектов Apache Software Foundation.

TechVision Research: Если не исправить основы управления информацией, Большие Данные обречены

Прежде чем браться за прогнозный анализ, машинное обучение и другие новшества, обещанные Большими Данными, компаниям необходимо «исправить дефектные основы управления информацией» — к такому выводу пришли авторы доклада, подготовленного компанией TechVision Research.

«Открытые системы» провели Пятый Российский форум BIG DATA 2016

Для отечественных предприятий и организаций на первый план выходит задача извлечения ценных знаний из накопленных объемов данных, использование продвинутой аналитики для создания новых продуктов и сервисов.

CrowdFlower: специалисты по данным выполняют работу «цифровых дворников»

Для совершенствования алгоритмов и построения обучающих выборок времени у обладателей одной из самых дефицитных профессий почти не остается.

PROMT представляет решение для анализа неструктурированных данных

Новый инструмент предназначен для поиска, извлечения, обобщения и структуризации информации из практически любого текстового контента на разных языках как в корпоративных системах, так и во внешних источниках.

SAP HANA Vora прокладывает мост между традиционными хранилищами данных и Hadoop

Особенность Vora — возможность использования традиционных методов оперативной аналитической обработки и языков программирования для анализа всех доступных на предприятии данных.

Фонд Apache запустил новый проект с открытым кодом для Больших Данных

По утверждениям участников проекта Apache Arrow, он позволит увеличить производительность при решении аналитических задач в сто с лишним раз.

План Обамы обещает революцию в здравоохранении

Программа Precision Medicine Initiative предусматривает разработку масштабной базы данных пациентов, которая позволит исследователям получать дополнительную информацию о заболеваниях и находить индивидуальные способы лечения.

План Обамы обещает революцию в здравоохранении

Программа Precision Medicine Initiative предусматривает разработку масштабной базы данных пациентов, которая позволит исследователям получать дополнительную информацию о заболеваниях и находить индивидуальные способы лечения.

Hortonworks и HPE вместе работают над повышением производительности Apache Spark

Проект уже принес первые плоды: усовершенствованный механизм перестановок, ускорение сортировок и вычислений в оперативной памяти, более оптимальное использование доступной памяти и улучшение масштабируемости.

Призрак Uber

В современном мире выживает не сильнейший, но быстрейший — интенсивные изменения окружающего мира могут угрожать любому бизнесу.

Бизнес настороженно воспринимает Большие Данные как сервис

На рынке Больших Данных наблюдается типичная ситуация «курицы и яйца» – клиенты не готовы платить за неизвестный результат, а поставщикам нужны деньги для приобретения данных и реализации качественных проектов.

Машинное обучение для Больших Данных

Теоретические основы машинного обучения появились практически одновременно с первыми компьютерами, однако при его практическом применении всегда приходится учитывать специфику конкретных систем. Работа с Большими Данными средствами Hadoop требует инструментов адаптации алгоритмов машинного обучения к этой платформе, например с помощью механизмов из стека IBM BigInsights.

451 Research: бизнес-руководители по-прежнему не уверены в безопасности облаков

При этом 85% участников опроса сообщили, что либо намереваются разместить в облачной среде конфиденциальные данные, либо уже сделали это.

EMA: ключ к осуществлению стратегии, основанной на данных, — автоматизация

Одновременно с увеличением числа проектов в области Больших Данных растут и сложности. Чаще всего ИТ-руководители называют главным препятствием неэффективное управление данными, отсутствие адекватной стратегии и недостаточное внимание со стороны руководителей.

Teradata и CleverDATA расширяют партнерство

Подразделение Teradata Marketing Applications переходит от прямой модели работы в России к работе через посредников, а CleverDATA становится единственным поставщиком решений и услуг для всех существующих заказчиков маркетинговых приложений Teradata.

IBM Watson Health покупает Truven Health Analytics

Это четвертое значимое приобретение корпорации, связанное с вопросами здравоохранения, за последний год, которое должно сделать когнитивную платформу одним из крупнейших мировых хранилищ данных, связанных со здоровьем.

В бесплатную версию платформы Databricks включен курс по Apache Spark

Как объясняют в Databricks, бесплатный вариант оптимален для разработчиков, ученых и специалистов по данным, а также для любых ИТ-специалистов, желающих освоить Spark.

Большие Данные расскажут о вовлеченности персонала

Большие Данные во многом меняют предприятия. В частности, появляются инструменты, позволяющие кадровым службам по-новому организовать контроль вовлеченности персонала.

Большие Данные помогли создать пиво, передающее новогоднее настроение

Чтобы составить рецепт для пива, которое отвечало бы этим эмоциям, в Havas Helia с помощью сервиса на базе IBM Watson, проанализировали 2800 существующих рецептов, обработав в системе списки ингредиентов, описания оттенков вкуса и отзывы потребителей.

Проблемы автоматизации аналитики: как избежать распространенных ошибок

Для автоматизации аналитики часто применяют no-code /low-code ETL-инструменты. Однако у этих инструментов есть недостаки. Правильный ли это выбор?