Вчені з питань даних: чому їх так дорого наймати?

Що ви уявляєте, коли чуєте назву посади «Data Scientist»? Напевно, це не пошарпаний вигляд білокомірців із суворим поглядом на обличчі. Правда?

Можливо, саме тому Harvard Business Review створив «Вчених з питань даних» як «найсексуальнішу роботу 21 століття». Вони написали: “Якщо” сексуальність “означає володіння рідкісними якостями, які користуються великим попитом, науковці даних вже є. Їх важко і дорого наймати, і, враховуючи дуже конкурентний ринок їх послуг, важко утримати “.

‍Данні вчені – це технічні професіонали, які мають підготовку та цікавість робити відкриття у світі даних. Хоча термін «Data Scientist» – нещодавно популярний вибір у LinkedIn для тих, хто працює з даними, саме поле не є новим. На той час, коли HBR публікувала свою статтю, тисячі науковців з даних вже працювали в стартапах та компаніях. Більше того, мета зробити комп’ютери такими ж розумними, як люди, переслідується майже чверть століття. Існує безліч причин, чому науковці з питань даних стали настільки популярними останнім часом. По-перше, компанії збирають все більші обсяги даних роками з тих пір, як це стало в моді робити, головним чином завдяки успіху великих технологічних компаній в отриманні прибутку від даних, які вони збирають, а по-друге, від прогресу в технології, який дозволило збору даних стати економічним.

Зараз доступні величезні обсяги даних, які чекають аналізу:

Зараз величезна кількість даних доступна для більшості великих компаній у всіх галузях, але багато хто не використовує це ефективно та продуктивно. Однак зараз компанії прокидаються з усвідомленням того, що їм потрібно скористатися цим величезним обсягом даних, які зараз доступні для них через їхні корпоративні бази даних. Скільки даних? 44 трильйони гігабайт до 2020 року проти лише 4,4 трильйона в 2013 році.

Обсяг та різноманітність даних створили можливість як для тих, хто має навички користуватися ними, так і для підприємств, які їх збирали. Однак галузь стикається з нестачею навичок та знань, необхідних для задоволення зростаючого попиту з боку компаній, які прагнуть використати свої багаті дані. Настільки, що навіть людей, які навчалися в університетах з питань інформатики та технічних програм, змушують виконувати вимогливі аналітичні посади на робочому місці.

Структурний дефіцит людей, які володіють навичками в галузі даних:

Згідно зі статистикою Каліфорнійського університету, Ріверсайд, 1/3 американських звітів «Новини та світ» провідних 100 світових університетів пропонують ступінь з науки про дані. З цих 29 університетів лише шість пропонують програми з обробки даних на рівні бакалавра; решта – аспірантура. Середній розмір класу цих програм з обробки даних – лише 23 студенти. Університет Каліфорнії прогнозує, що малий розмір класів у і без того обмеженій кількості університетів, що пропонують програми Data Science, навряд чи призведе до “значущого втручання у подолання глобального розриву талантів у галузі даних”. Говорячи простими економічними термінами, попит перевершує пропозицію, і в цьому випадку із значним відривом. У 2017 році IBM передбачила, що річний попит на нових науковців, розробників даних та інженерів даних досягне майже 700 000 відкриттів до 2020 року. Отже, лише 23 студентські класи в одному університеті та приблизно 700 випускників усіх університетів, що пропонують дані наукові програми не будуть задовольняти швидко зростаючий попит на людей, що володіють навичками інформатики.

У 2018 році середня заробітна плата для молодшого наукового співробітника становить 115 000 доларів, а ті, хто керує командою з 10–15 членів, можуть вимагати зарплати до 350 000 доларів. Тим часом середній досвід роботи вченого з даних зменшився з 9 років у 2014 році до 6 років у 2015 році. У цілому по прогнозу попит на фахівців з обробки даних перевищить пропозицію більш ніж на 50% до 2019 року. Більше 40% компаній вважаючи, що їхня нездатність набирати науковців з даних заважає їхній конкурентоспроможності, не дивно, що понад 60% підприємств навчають своїх співробітників власними силами.

Ендрю Нг, що просуває курс Coursera

‍дві рішення для заповнення прогалини:

Існує два основних підходи, що допомагають зменшити цей дефіцит навичок. По-перше, і одним із захисників суперзірки AI Ендрю НГ є підготовка більшої кількості науковців з даних за допомогою нетрадиційних методів, таких як MOOC (Massive Open Online Courses). Хоча це блискучий спосіб для сучасних розробників та інших співробітників, орієнтованих на дані, “Навички”, це ще не рішення більшої проблеми. Я кажу „ще”, бо це принципово вимагає змін у поведінці. Роботодавці ще не приділяють достатньої цінності цьому типу освіти; багато роботодавців досі при прийомі на роботу дивляться виключно на фірмові університети. Хоча ця ментальність повільно змінюється, вона не настільки швидка, щоб вирішити проблему на короткий та середній термін.

Другий підхід полягає в тому, щоб дозволити більшій кількості людей, які не володіють навичками вивчення даних, легко застосовувати ці складні методи до даних компанії. По суті, нехай штучний інтелект та машинне навчання вирішують власні проблеми. Використовуючи методи, розроблені (в тому числі тут, на MindsDB) за останні кілька років, можна імітувати дослідника даних таким чином, що навіть нетехнічна особа може виконувати аналіз даних лише за допомогою декількох рядків коду або декількох клацань .

Ці два рішення не є взаємовиключними, і в тандемі допоможуть компаніям використовувати свої дані більш значущим чином, сприяючи економії витрат та / або стимулюванню зростання та доходів. Для того, щоб це відбулося ефективно, в організаціях повинні відбутися культурні зміни, що призведуть до кращої політики найму, а також до кращого використання інструментів та програмного забезпечення, яке може вирішити багато проблем із даними, з якими вони стикаються, без необхідності розширювати штат працівників та наймати дорогого вченого з питань обробки даних. .

Адам Карріган є співзасновником MindsDB – простого у використанні інструменту для додавання машинного навчання до ваших проектів та завдань з обробки даних. Слідуйте за мною у Twitter

Ви також можете стежити за нашим проектом на GitHub та Twitter

Спочатку ця публікація була опублікована за адресою https://www.linkedin.com/pulse/data-scientists-why-so-expensive-hire-adam-carrigan/.

Adam Carrigan люб’язно дозволив нам перекласти і опублікувати цю статтю.

Leave a comment