Aa Aa Aa
Aa Aa Aa
Pročytaty vgolos
Zupynyty čytannja

Data Scientist — hto ce takyj i čy varto obyraty cej fah

Data Scientist — хто це такий і чи варто обирати цей фах

Profesiju specialista z obrobky ta doslidžennja danyh — Data Scientist — nazvano «najseksuaľnišoju» sered intelektualiv. Ale jak nym (čy neju) staty i zrozumity, čy ce tvoje?
Професію спеціаліста з обробки та дослідження даних — Data Scientist — названо «найсексуальнішою» серед інтелектуалів. Але як ним (чи нею) стати і зрозуміти, чи це твоє?
Читати кирилицею

Speciaľni možlyvosti

Pročytaty vgolos
Zupynyty čytannja
Kontrastna versija
  Дані скрізь — їх збирають пошуковики, соціальні мережі, різні сервіси навіть відстежують траєкторію вашого переміщення і читають приватну переписку. Знаючи, за якими ключовими словами ви шукаєте інформацію в інтернеті та на які сайти заходите, вам легко запропонувати вибір взуття до смаку чи освітній курс, який відповідає вашим інтересам і потребам. Реклама, яку ви бачите у браузері або соцмережі, підлаштована під вас завдяки грамотній обробці даних. HBR називає роботу спеціаліста з обробки даних (або Data Scientist) найсексуальнішою професією XXI століття. Відділи кадрів різних компаній часто розводять руками й не розуміють, де шукати цих фахівців з відповідною освітою та досвідом роботи. Традиційно, програмісти намагаються потрапити на цю стежину, аби підвищити собі зарплатню й піднятися вгору карєрними сходами — а в інтернеті більшає курсів  про те, як перетворитися на спеціаліста з обробки даних у найкоротші терміни. То хто ж такі Data Scientists — і чи складно ними стати? — Хто такий Data Scientist?. Це — спеціаліст із ґрунтовними знаннями у сфері математичної статистики, програмуванні та у певній сфері застосування цих теоретичних знань на практиці (готельний бізнес, процес прийняття рішень у політиці тощо). Головне — бажання і вміння виявляти найнеочікуваніші закономірності у великому масиві даних на основі статистичних моделей. — Як зрозуміти, чи це ваше покликання?. Один із тих, кому вдалося ступити на цей шлях й успішно закріпитися у когорті фахівців із обробки даних, поділився низкою порад з виданням Hackernoon. За його словами, важливо розуміти, що це міждисциплінарна сфера роботи, причому доволі нова. Отже, однією лише теорією з книг і курсами  в інтернеті не обійтися. Діяти слід покроково: Оберіть мову програмування — R чи Python — перша краще підійде для тих, хто технічно не надто підготований, друга — для технарів. Зрозумійте базові поняття цих мов програмування — типи даних, функції, цикли тощо. Поглиблюйте знання на основі онлайн-курсів на EDX чи Datacamp. Вивчіть основи аналізу даних: це найважливіший, але й найскладніший етап на шляху до становлення профі. Але наявність якісних пакетів та модулів для R та Phyton полегшують цей процес. На даному етапі вам буде корисним знайомство, наприклад, з Jupyter Notebooks — зручним інструментом для створення аналітичних звітів, який дозволяє зберігати код, зображення, коментарі, формули та графіки. Також ознайомтесь із можливостями Rstudio — це середовище для розробки програмного забезпечення з відкритим кодом для мови програмування R, що призначене для статистичної обробки даних та роботи з графікою. Для R це — dplyr, tidyr, stringr, reshape2. Для Python це — Numpy, Pandas. — Що робити коли теорію засвоєно і вивчено основи?. Наступний етап — візуалізація даних. Для цього варто ознайомитися з ggplot2, rbokeh для R. Або matplotlib для інтерактивної візуалізації. Ще один важливий елемент — статистика. Для цього, щоб освоїти основні концепції зі статистичної обробки даних можна скористатися наступними курсами: An introduction to statistical learning with applications in R — дає огляд роботи зі статистичними методами аналізу та їх застосуванні за допомогою мови програмування R. Курс підійде й для фахівців не-математичних спеціальностей. Open Intro Statistics — загальний курс із відеоматеріалами, форумами та відповідним програмним забезпеченням, що дозволить засвоїти і зрозуміти основи роботи з даними. Заключний крок — навчитися будувати моделі, які найчастіше використовується при аналізі даних: лінійна регресія, логістична регресія, дерева рішень, метод k-найближчих сусідів, аналіз споживчого кошика тощо.

Dani skriź — їh zbyrajuť pošukovyky, sociaľni mereži, rizni servisy naviť vidstežujuť trajektoriju vašogo peremiščennja i «čytajuť» pryvatnu perepysku. Znajučy, za jakymy ključovymy slovamy vy šukajete informaciju v interneti ta na jaki sajty zahodyte, vam legko zaproponuvaty vybir vzuttja do smaku čy osvitnij kurs, jakyj vidpovidaje vašym interesam i potrebam. Reklama, jaku vy bačyte u brauzeri abo socmereži, pidlaštovana pid vas zavdjaky gramotnij obrobci danyh.

HBR nazyvaje robotu specialista z obrobky danyh (abo Data Scientist) «najseksuaľnišoju profesijeju XXI stolittja». Viddily kadriv riznyh kompanij často rozvodjať rukamy j ne rozumijuť, de šukaty cyh fahivciv z vidpovidnoju osvitoju ta dosvidom roboty. Tradycijno, programisty namagajuťsja potrapyty na cju stežynu, aby pidvyščyty sobi zarplatnju j pidnjatysja vgoru kar’jernymy «shodamy» — a v interneti biľšaje kursiv  pro te, jak «peretvorytysja» na specialista z obrobky danyh u najkorotši terminy. To hto ž taki Data Scientists — i čy skladno nymy staty?

— Hto takyj Data Scientist?

Ce — specialist iz ğruntovnymy znannjamy u sferi matematyčnoї statystyky, programuvanni ta u pevnij sferi zastosuvannja cyh teoretyčnyh znań na praktyci (goteľnyj biznes, proces pryjnjattja rišeń u polityci toščo). Golovne — bažannja i vminnja vyjavljaty najneočikuvaniši zakonomirnosti u velykomu masyvi danyh na osnovi statystyčnyh modelej.

— Jak zrozumity, čy ce vaše poklykannja?

Odyn iz tyh, komu vdalosja stupyty na cej šljah j uspišno zakripytysja u kogorti fahivciv iz obrobky danyh, podilyvsja nyzkoju porad z vydannjam Hackernoon. Za jogo slovamy, važlyvo rozumity, ščo ce miždyscyplinarna sfera roboty, pryčomu dovoli nova. Otže, odnijeju lyše teorijeju z knyg i kursamy  v interneti ne obijtysja. Dijaty slid pokrokovo:

  • Oberiť movu programuvannja — R čy Python — perša krašče pidijde dlja tyh, hto tehnično ne nadto pidgotovanyj, druga — dlja «tehnariv».
  • Zrozumijte bazovi ponjattja cyh mov programuvannja — typy danyh, funkciї, cykly toščo.
  • Poglybljujte znannja na osnovi onlajn-kursiv na EDX čy Datacamp.
  • Vyvčiť osnovy analizu danyh: ce najvažlyvišyj, ale j najskladnišyj etap na šljahu do stanovlennja profi. Ale najavnisť jakisnyh paketiv ta moduliv dlja R ta Phyton polegšujuť cej proces. Na danomu etapi vam bude korysnym znajomstvo, napryklad, z Jupyter Notebooks — zručnym instrumentom dlja stvorennja analityčnyh zvitiv, jakyj dozvoljaje zberigaty kod, zobražennja, komentari, formuly ta grafiky. Takož oznajomteś iz možlyvostjamy Rstudio — ce seredovyšče dlja rozrobky programnogo zabezpečennja z vidkrytym kodom dlja movy programuvannja R, ščo pryznačene dlja statystyčnoї obrobky danyh ta roboty z grafikoju.

Slid oznajomytysja z bazovymy koncepcijamy obrobky danyh, jaki dozvoljať pravyľno strukturuvaty dani dlja podaľšogo їhńogo opracjuvannja, vizualizaciї i modeljuvannja.

Dlja R ce — dplyr, tidyr, stringr, reshape2.
Dlja Python ce — Numpy, Pandas.

— Ščo robyty koly teoriju zasvojeno i vyvčeno osnovy?

Nastupnyj etap — vizualizacija danyh. Dlja ćogo varto oznajomytysja z ggplot2, rbokeh dlja R. Abo matplotlib dlja interaktyvnoї vizualizaciї.

Šče odyn važlyvyj element — statystyka. Dlja ćogo, ščob osvoїty osnovni koncepciї zi statystyčnoї obrobky danyh možna skorystatysja nastupnymy kursamy:

  • An introduction to statistical learning with applications in R — daje ogljad roboty zi statystyčnymy metodamy analizu ta їh zastosuvanni za dopomogoju movy programuvannja R. Kurs pidijde j dlja fahivciv ne-matematyčnyh speciaľnostej.
  • Open Intro Statistics — zagaľnyj kurs iz videomaterialamy, forumamy ta vidpovidnym programnym zabezpečennjam, ščo dozvolyť zasvoїty i zrozumity osnovy roboty z danymy.

Zaključnyj krok — navčytysja buduvaty modeli, jaki najčastiše vykorystovujeťsja pry analizi danyh:

  • linijna regresija,
  • logistyčna regresija,
  • dereva rišeń,
  • metod k-najblyžčyh susidiv,
  • analiz spožyvčogo košyka toščo.
Džerelo: Hackernoon

Jakščo vy znajšly pomylku, buď laska, vydiliť fragment tekstu ta natysniť Ctrl Enter.

Dodaty komentar

Takyj e-mail vže zarejestrovano. Skorystujtesja Formoju vhodu abo vvediť inšyj.

Vy vkazaly nekorektni login abo paroľ

Vybačte, dlja komentuvannja neobhidno uvijty.
Šče
Vy čytajete sajt ukraїnśkoju latynkoju. Podrobyci v Manifesti
Hello. Add your message here.

Povidomyty pro pomylku

Tekst, jakyj bude nadislano našym redaktoram: