Машинное обучение — мощный инструмент обработки больших объемов данных, требующий, однако, выбора между качеством полученных моделей и временем их расчета. В то же время использование графических ускорителей позволяет распараллелить многие алгоритмы — в частности, обучения ранжированию в поисковой машине «Яндекс».
За последнее десятилетие наметился прогресс в области обработки текстов на естественном языке, однако многие задачи по-прежнему остаются нерешенными, хотя появляются новые, связанные с мониторингом социальных сетей и обработкой преднамеренно искаженных текстов. Все это заставляет по-иному взглянуть на системы обработки текстов.
В дискуссии вокруг достоинств и недостатков тех или иных продуктов для резервного копирования виртуальных сред одним из спорных моментов является применение технологии программных агентов или, напротив, отказ от нее. Насколько же обоснованны доводы вендоров? Чем вызвано непонимание специалистов? Попробуем расставить точки над i.
Разработчики систем управления вузами используют сегодня различные технологии автоматизации, позволяющие решать проблемы учета и хранения данных, организации коммуникации участников учебного процесса и т. д., но не собственно задачу управления вузом, требующую аппарата математического моделирования. Возможно, мультиагентные системы позволят решить задачу управления.
Несмотря на движение в сторону Semantic Web, для которой содержание обязательно снабжается атрибутами и значениями, основной объем текстов в Сети пока остается неструктурированным, а единственным способом организации текста является внешнее форматирование, слабо способствующее пониманию его смысла. Как же можно из «сырых» текстовых данных извлечь максимум пользы?
Спустя 150 лет после изобретения телефона электронные коммуникации, судя по всему, переходят в новое измерение виртуального взаимодействия. Теперь ключевая роль отводится инструментам и средствам, обеспечивающим полноту зрительного восприятия: видеосвязи, визуальным эффектам, виртуальным визуальным средам и аватарам. При этом визуальная коммуникация посредством протоколов IP и SIP внедряется в телефонные системы и унифицированные коммуникации, в том числе и в мобильные устройства — смартфоны и планшетные компьютеры. В качестве завершающего штриха стоит отметить, что такая многомерная коммуникация наследует простоту управления и поддержку сторонних приложений в стиле iPhone.
Проблема Больших Данных вызвана не столько большими объемами, сколько неспособностью традиционных методов справиться с потоками разнообразных данных, поступающих из огромного числа внешних и внутренних источников, имеющих различную структуру и схемы индексации. Для работы с Большими Данными требуются новые решения, например, такие как пакет SAS High-Performance Analytics.
Современные информационные системы, как правило, основываются на трехзвенной архитектуре, в которой протоколирование выполняемых пользователями операций решается на уровне сервера приложений с помощью журнала событий, регистрируемых в терминах предметной области, а не на уровне SQL-операций. Однако бывают события, которые в таком журнале не отражаются, но способны нарушить целостность критически важной для бизнеса информации, что делает необходимым аудит изменений на уровне базы данных.