Большие данные

Машинное обучение в «Яндексе»

Объемы данных, обрабатываемых современными информационными системами, постоянно растут, а логика бизнес-приложений усложняется, что исключает какое-либо участие человека и вызывает потребность в адаптивных алгоритмах, способных учитывать изменения окружающей среды. Машинное обучение сегодня переживает бурный рост, и такие компании, как «Яндекс», уже почувствовали это в своей работе.

Безопасность Больших Данных

Сегодня очевидно, что только технических средств для противодействия новым типам информационных угроз недостаточно — необходимы адекватные инструменты киберразведки на основе аналитики Больших Данных.

Новая эра работы с данными: «большая семерка» ОС, версия 2013

В 2013 году сенсаций ждать не стоит — продолжится развитие технологий, с которых началось нынешнее десятилетие, однако все ярче будут проявляться черты наступившей новой эры работы с данными.

Коробка номер 5

ИТ на пороге качественных перемен: Большие Данные, мобильность, беспроводной доступ к Всемирной паутине — все эти веяния времени вряд ли будет правильным рассматривать только с точки зрения технологий и пытаться решать порождаемые ими задачи путем установки очередного ящика в серверную комнату. Скорее всего, речь идет, пусть и не буквально, о новом измерении, дополняющем имеющиеся четыре.

Проблемы анализа Больших Данных

Сегодня для анализа Больших Данных пытаются использовать подходы и методы, разработанные еще при создании технологий информационных хранилищ, и хотя при этом делаются поправки с учетом количественных показателей, в них не учитываются принципы сбора, обработки и анализа данных. Вместе с тем некоторые особенности традиционных операций могут противоречить специфике обработки Больших Данных.

Аналитики и мобильность

Как построить ИТ-инфраструктуру мобильного предприятия, обеспечивающую обработку больших объемов данных разнообразных типов, без деградации скорости и с поддержкой мобильного доступа? Компания SAP/Sybase расширила спектр своих традиционных продуктов средствами поддержки мобильных платформ.

Платформа для Больших Данных

«Большие Данные» — понятие достаточно общее и размытое, это и большие объемы данных, и средства аналитики, и параллельная обработка, и распределенное хранение, и обработка со скоростью поступления данных. Компания IBM предложила платформу обработки Больших Данных, решающую все эти задачи.

Администрация США и Большие Данные

Инициатива федерального правительства США «Большие данные: исследования и разработки» носит административный характер и полностью игнорирует личностный фактор. Что за этим стоит?

В авангарде Больших Данных

После пяти лет работы по созданию системного ПО для устройств хранения исследовательское подразделение корпорации EMC в России расширило поле своей деятельности на решение проблем обработки Больших Данных.

Аналитика для Больших Данных

Проблема Больших Данных вызвана не столько большими объемами, сколько неспособностью традиционных методов справиться с потоками разнообразных данных, поступающих из огромного числа внешних и внутренних источников, имеющих различную структуру и схемы индексации. Для работы с Большими Данными требуются новые решения, например, такие как пакет SAS High-Performance Analytics.

Двигатель индустрии

Развитие ИТ-индустрии за ее относительно короткую историю определялось различными факторами, а сегодня индустрию двигает индивидуализация.

К свободе от проблемы Больших Данных

Проблема Больших Данных вечна и призрачна — на всем протяжении истории технологии управления данными всегда имелись данные, которые хотелось бы эффективно хранить и обрабатывать, но их объемы делали эту задачу непосильной для существующих СУБД. Однако иногда удается найти решение частных случаев проблемы Больших Данных — например, для категорий данных, управляемых традиционными СУБД.

Смутное время СУБД

Под влиянием роста объемов данных в бывшей совсем недавно стабильной области СУБД начались подвижки, выразившиеся, в частности, в появлении двух движений — NoSQL и NewSQL.

Хранилище данных на кодах Рида – Соломона

Выполненная по заказу ЦРУ, разработка компании Cleversafe может быть востребована в ряде сугубо гражданских приложений.

Большие Данные — новая теория и практика

Символами первой промышленной революции были чугун и пар, второй — сталь и поточное производство, третьей — полимерные материалы, алюминий и электроника, а очередная революция пройдет под знаком композитных материалов и данных. Big Data —это ложный след или будущее индустрии?

Письмо деду морозу

Многочисленные исследования аналитиков и игроков ИТ-рынка свидетельствуют, что одна из главных нынешних проблем компаний и организаций — переизбыток информации, причем высказывается даже мнение, что человечество производит сейчас данных больше, чем может хранить. Что значит для общества проблема Больших Данных и какие пути ее решения предлагают сегодня субъекты индустрии ИТ?

О Больших Данных с четырех сторон

Технические руководители крупнейших ИТ-компаний: Hitachi Data Systems, Teradata, EMC/Greenplum и Fujitsu рассказывают о своих взглядах на Большие Данные, облака и аналитику.

Большие Данные крупным планом

В течение последних лет корпорация IBM планомерно выстраивала на базе собственных и приобретенных технологий платформу управления информацией, охватывающую все средства, необходимые предприятиям для работы с данными, однако сейчас эта картина будет неполной без включения в цепочку поставки средств работы с Большими Данными.

СУБД для анализа Больших Данных

Виртуализация значительно изменила ИТ, за исключением сегмента высоконагруженных приложений и серверов больших баз данных, где этот подход неэффективен. Однако сегодня и здесь наступает время революционных изменений, но совершенно иного плана.

Файловые системы для Больших Данных

Сегодня решение проблемы больших данных связывают с облаками и технологиями категории MapReduce, однако востребованы и традиционные подходы, основанные на распределенных файловых системах, надежно работающих с неограниченными объемами данных.

Проблемы автоматизации аналитики: как избежать распространенных ошибок

Для автоматизации аналитики часто применяют no-code /low-code ETL-инструменты. Однако у этих инструментов есть недостаки. Правильный ли это выбор?