Data Science

Извлечение полезной информации и методы анализа данных изучает наука о данных (Data science). В противоположность традиционной аналитике, при анализе больших данных полный массив данных обрабатывается в режиме реального времени по мере их поступления, а не частями и не постепенно. Кроме того, цель такого анализа — поиск корреляций, связей между данными, а не проверка предположений относительно полученной информации.

Data Science — наука, которая изучает извлечение полезной информации и методы анализа данных.





С учетом того, что информации становится больше, и она нужна все большему количеству организаций, растет потребность в экспертах в области данных — дата-аналитиках, дата-инженерах и дата-сайентистах.

Data Analyst
Аналитики данных отвечают за очистку и организацию данных, их анализ, создание визуализации, предположение о закономерностях и представление результатов команде или клиенту.
Data Engineer
Инженеры данных работают с инфраструктурой больших данных: разрабатывают, поддерживают ее и обеспечивают бесперебойную работу. Как следствие, они очищают, подготавливают и оптимизируют данные для их дальнейшей обработки.
Data Scientist
Специалисты по изучению данных не только добывают и обрабатывают большие данные программными инструментами. Они тоже занимаются анализом информации, но еще разрабатывают модели и алгоритмы машинного обучения, которые подтверждают или опровергают гипотезы аналитиков. Они в итоге создают прикладной продукт, программное обеспечение, благодаря которому выполняется оптимизация бизнеса.

Вопросы для самопроверки

Данные, которые используются исключительно для научных исследований
Информация, которую невозможно обработать традиционными методами
Данные огромного объема, генерируемые с высокой скоростью, разнообразные, достоверные и имеющие ценность
Информация, которая хранится на небольших устройствах
1. Что такое большие данные?
Информация, которая хранится на небольших устройствах
Данные огромного объема, генерируемые с высокой скоростью, разнообразные, достоверные и имеющие ценность
Информация, которую невозможно обработать традиционными методами
Данные, которые используются исключительно для научных исследований
Все перечисленное
Изучение глубин космоса
Предотвращение преступлений
Распределение энергии и продовольствия на планетарном уровне
2. Какие задачи помогают решить технологии обработки больших данных?
Распределение энергии и продовольствия на планетарном уровне
Предотвращение преступлений
Изучение глубин космоса
Все перечисленное
Специалисты, отвечающие за безопасность хранения больших данных
Ученые, использующие большие данные для своих исследований
Разработчики программного обеспечения для работы с большими данными
Специалисты, занимающиеся обработкой и анализом больших данных
3. Кто такие дата-аналитики?
Специалисты, занимающиеся обработкой и анализом больших данных
Разработчики программного обеспечения для работы с большими данными
Ученые, использующие большие данные для своих исследований
Специалисты, отвечающие за безопасность хранения больших данных