Опубликован стандарт на состав ядра Hadoop — ODPi Runtime Specification
ODPi была учреждена в прошлом году в целях сдерживания фрагментации рынка Hadoop. В рамках инициативы планировалось подготовить стандарт, включив в него проверенные технологии из числа проектов Apache Software Foundation.
TechVision Research: Если не исправить основы управления информацией, Большие Данные обречены
Прежде чем браться за прогнозный анализ, машинное обучение и другие новшества, обещанные Большими Данными, компаниям необходимо «исправить дефектные основы управления информацией» — к такому выводу пришли авторы доклада, подготовленного компанией TechVision Research.
«Открытые системы» провели Пятый Российский форум BIG DATA 2016
Для отечественных предприятий и организаций на первый план выходит задача извлечения ценных знаний из накопленных объемов данных, использование продвинутой аналитики для создания новых продуктов и сервисов.
CrowdFlower: специалисты по данным выполняют работу «цифровых дворников»
Для совершенствования алгоритмов и построения обучающих выборок времени у обладателей одной из самых дефицитных профессий почти не остается.
PROMT представляет решение для анализа неструктурированных данных
Новый инструмент предназначен для поиска, извлечения, обобщения и структуризации информации из практически любого текстового контента на разных языках как в корпоративных системах, так и во внешних источниках.
SAP HANA Vora прокладывает мост между традиционными хранилищами данных и Hadoop
Особенность Vora — возможность использования традиционных методов оперативной аналитической обработки и языков программирования для анализа всех доступных на предприятии данных.
Фонд Apache запустил новый проект с открытым кодом для Больших Данных
По утверждениям участников проекта Apache Arrow, он позволит увеличить производительность при решении аналитических задач в сто с лишним раз.
План Обамы обещает революцию в здравоохранении
Программа Precision Medicine Initiative предусматривает разработку масштабной базы данных пациентов, которая позволит исследователям получать дополнительную информацию о заболеваниях и находить индивидуальные способы лечения.
План Обамы обещает революцию в здравоохранении
Программа Precision Medicine Initiative предусматривает разработку масштабной базы данных пациентов, которая позволит исследователям получать дополнительную информацию о заболеваниях и находить индивидуальные способы лечения.
Hortonworks и HPE вместе работают над повышением производительности Apache Spark
Проект уже принес первые плоды: усовершенствованный механизм перестановок, ускорение сортировок и вычислений в оперативной памяти, более оптимальное использование доступной памяти и улучшение масштабируемости.
Призрак Uber
В современном мире выживает не сильнейший, но быстрейший — интенсивные изменения окружающего мира могут угрожать любому бизнесу.
Бизнес настороженно воспринимает Большие Данные как сервис
На рынке Больших Данных наблюдается типичная ситуация «курицы и яйца» – клиенты не готовы платить за неизвестный результат, а поставщикам нужны деньги для приобретения данных и реализации качественных проектов.
Машинное обучение для Больших Данных
Теоретические основы машинного обучения появились практически одновременно с первыми компьютерами, однако при его практическом применении всегда приходится учитывать специфику конкретных систем. Работа с Большими Данными средствами Hadoop требует инструментов адаптации алгоритмов машинного обучения к этой платформе, например с помощью механизмов из стека IBM BigInsights.
451 Research: бизнес-руководители по-прежнему не уверены в безопасности облаков
При этом 85% участников опроса сообщили, что либо намереваются разместить в облачной среде конфиденциальные данные, либо уже сделали это.
EMA: ключ к осуществлению стратегии, основанной на данных, — автоматизация
Одновременно с увеличением числа проектов в области Больших Данных растут и сложности. Чаще всего ИТ-руководители называют главным препятствием неэффективное управление данными, отсутствие адекватной стратегии и недостаточное внимание со стороны руководителей.
Teradata и CleverDATA расширяют партнерство
Подразделение Teradata Marketing Applications переходит от прямой модели работы в России к работе через посредников, а CleverDATA становится единственным поставщиком решений и услуг для всех существующих заказчиков маркетинговых приложений Teradata.
IBM Watson Health покупает Truven Health Analytics
Это четвертое значимое приобретение корпорации, связанное с вопросами здравоохранения, за последний год, которое должно сделать когнитивную платформу одним из крупнейших мировых хранилищ данных, связанных со здоровьем.
В бесплатную версию платформы Databricks включен курс по Apache Spark
Как объясняют в Databricks, бесплатный вариант оптимален для разработчиков, ученых и специалистов по данным, а также для любых ИТ-специалистов, желающих освоить Spark.
Большие Данные расскажут о вовлеченности персонала
Большие Данные во многом меняют предприятия. В частности, появляются инструменты, позволяющие кадровым службам по-новому организовать контроль вовлеченности персонала.
Большие Данные помогли создать пиво, передающее новогоднее настроение
Чтобы составить рецепт для пива, которое отвечало бы этим эмоциям, в Havas Helia с помощью сервиса на базе IBM Watson, проанализировали 2800 существующих рецептов, обработав в системе списки ингредиентов, описания оттенков вкуса и отзывы потребителей.