Знакомимся со свежей IT-дисциплиной
Data Science (в переводе с английского — наука о данных) — молодое, но амбициозное IT-направление, которое предполагает обработку большого количества данных, поиск аномалий в имеющейся базе и принятие некоторых решений на основе этих данных. Непонятно? Давайте еще раз.
Любая информация может быть закодирована и представлена в виде цифр. В свою очередь любая цифра — это двоичный код. Отсюда и появляется термин «данные», который по факту представляет собой просто числа.
Специалист в этой области, он же Data Scientist, обрабатывает объемы информации, подсчитывает статистику, выявляет ошибки и аномалии в базе и приводит данные в нормальный вид. Все еще не до конца ясно? Давайте рассмотрим конкретный пример.
Предположим, студенты обучаются на определенной онлайн-платформе. Так вот, Data Scientist может проанализировать их поведение в сети и, опираясь на определенные параметры, предсказать оценку на экзамене. Для этого он будет смотреть, включает ли студент ускорение при просмотре записей уроков, проматывает ли видеролики, равномерно ли посещает систему или появляется в ней только перед самым дедлайном, и еще многие другие параметры.
Мечтаете о высокой зарплате? Вы по адресу
Одна из причин, почему к Data Science сейчас приковано особое внимание, — суммы, которые зарабатывают специалисты в этой области. Для наглядности мы проанализировали средние зарплаты представителей разных профессий в Москве на популярном российском сервисе hh.ru (к сожалению, в Татарстане многие вакансии размещены с пометкой «з/п не указана»). Получили следующее: зарплата у Data Scientist в столице в среднем составляет 186 тыс. рублей, что в три раза выше, чем, например, у школьного педагога или химика-технолога. Впечатляет, правда?
«У зарплаты хороший порядок. Эти специалисты на вес золота. Цифры точно составляют пять нулей вне зависимости от региона. То есть начиная от 100 тысяч работник будет зарабатывать»директор ИТИС КФУ Михаил Абрамский
Надо приручить питона и владеть матаном
С зарплатой разобрались. Теперь следующий вопрос: какие знания необходимы, чтобы стать квалифицированным (и не забываем, что обеспеченным!) специалистом в Data Science? Стартер пак (набор для новичка, с англ. starter pack) выглядит следующим образом: математический анализ, линейная алгебра, комбинаторика, теория вероятностей, математическая статистика и программирование — вот области, знания в которых необходимы для успешной карьеры.
«Надо сказать, что Data Science в каком-то смысле воскресила математического специалиста. Она вернула актуальность математики для бизнеса, потому что какое-то время назад мы всех убеждали, что математика нужна, а теперь такой вопрос вообще не встает»директор ИТИС КФУ Михаил Абрамский
Что касается программирования, то специалисты этой области используют Python (произносится питон) либо R (произносится эр). R практически для каких-то других целей почти не применяется, а Python используют, например, для разработки сайтов или системного администрирования. Кстати, Абрамский добавил про этот язык забавную ремарку: «Python — достаточно забавный язык, потому что если учиться программировать только на нем, сложно будет переключиться на другие языки».
Нужна ли все-таки «вышка» или хватит онлайн-курсов?
Нужно ли высшее образование, что пробиться в IT-индустрии? И реально ли освоить все математические дисциплины самостоятельно? Ответ нашего собеседника прост — всё возможно, если есть усидчивость и мотивация, но важен бэкграунд.
Если у вас какое-то техническое или естественное образование, то вы фактически счастливчик и обладаете хорошей базой для получения необходимых навыков. В случае экономического образования вам тоже повезло, так как вы овладели азами математики и информатики на начальных курсах.
Но учебу на онлайн-занятиях нельзя назвать схемой, гарантирующей стопроцентный успех. Все-таки преимуществом в IT-сфере будет обладать тот специалист, который получил высшее образование.
«В IT-индустрии высшее образование нужно. Но не потому, что в университете даются исчерпывающие знания, а потому, что во время учебы возможность попрактиковаться в группе над проектом. Этого не даст ни один онлайн-курс. Он даст индивидуальные компетенции, но чтобы работать, нужно иметь опыт прикладной проектной работы в команде» директор ИТИС КФУ Михаил Абрамский
Регулярная практика в проектной работе, социализация и прокачка soft skills — вот преимущества, которые предоставляет «вышка» и не может дать пока ни один онлайн-курс. Университет больше нельзя рассматривать лишь как источник знаний, сейчас идет переосмысление его роли.
Data Science применяется везде, и это только начало
Data Science набирает обороты и реально проникает во все отрасли. Молодое IT-направление уже активно применяется в следующих сферах:
- Образование
Пример использования для мониторинга успеваемости студентов мы уже рассмотрели.
- Охрана и безопасность
Благодаря данным, полученным с контрольно-пропускных устройств, можно определить длительность обеда, частоту перекуров, систематические опоздания и другие интересные факты о сотрудниках. Страшный сон офисного планктона!
- Медицина
Анализ данных применяют, например, при работе с холтером (его используют для функциональной диагностики, при которой осуществляется круглосуточная запись ЭКГ) и изучении полученной кардиограммы.
- Бизнес-аналитика
Для любых продаж важно анализировать, какие методы «выстреливают», как маркетинговая стратегия влияет на прибыль, что формирует спрос и другие нюансы.
- И многое другое
Кстати, искусственный интеллект (ИИ) — это смежная область с Data Science, где с помощью данных можно воспроизвести какую-то функцию, свойственную человеку. Чаще всего ИИ учат распознавать и квалифицировать что-либо, а затем принимать решения.
Резюмируем: типичный Data Scientist — специалист с хорошим математическим аппаратом, который обрабатывает большое количество данных и зарабатывает на этом большое количество денег. Индустрия реально перспективная и нужная всем. Так что если вы загорелись и все-таки захотели попробовать укротить питона, то смело дерзайте, а знание математики вам в этом поможет!
Нет комментариев-