Învățarea automată știe ce este și diferențele dintre tipurile sale

învățare automată sau învățarea automată constă practic în automatizarea, utilizând diferiți algoritmi, a identificării tiparelor sau tendințelor „ascunse” în date. Din acest motiv, este foarte important nu numai să alegeți cel mai potrivit algoritm (și parametrizarea ulterioară a acestuia pentru fiecare problemă specifică), ci și să aveți un volum mare de date de o calitate suficientă.

În ultimii ani, învățare automată a devenit foarte important în lumea afacerilor, deoarece utilizarea inteligentă a analizei datelor este cheia succesului în afaceri. Previziunile Gartner pentru 2020 dezvăluie că, pe lângă beneficiile sale în domenii precum luarea deciziilor inteligente, robotică, vehicule autonome și hiper-automatizare, domeniul securității se dezvoltă cu mare forță. În special, aplicațiile de inteligență artificială pentru protecția sistemelor conectate IoT.

În acest post vom explica în ce constă învățarea automată, ce tipuri de învățare există, cum funcționează și pentru ce sunt folosite.

Într-adevăr, ce este învățarea automată?

Este o ramură a inteligenței artificiale care a început să capete importanță în anii 80. Este un tip de AI care nu mai depinde de reguli și de un programator, ci mai degrabă computerul își poate stabili propriile reguli și poate învăța de la sine.

Învățarea automată are loc prin algoritmi. Un algoritm nu este altceva decât o serie de pași ordonați luați pentru a efectua o sarcină.

Obiectivul învățare automată este de a crea un model care ne permite să rezolvăm o sarcină dată. Atunci știu tren modelul folosind cantități mari de date. Modelul aflați din aceste date și este capabil să facă predicții. În funcție de sarcina pe care doriți să o efectuați, va fi mai potrivit să lucrați cu un algoritm sau altul.

Alegerea algoritmului nu este ușoară. Dacă căutăm informații pe internet, putem găsi o adevărată avalanșă de articole foarte detaliate, care uneori, mai degrabă decât să ne ajute, ne încurcă. Prin urmare, vom încerca să oferim câteva linii directoare de bază pentru a începe să lucrăm.

Există două întrebări fundamentale pe care trebuie să ni le punem. Primul este:

Ce vrem să facem?

Faptul este că definește clar obiectivul. Atunci, pentru a ne rezolva problema, ne vom întreba ce fel de sarcină va trebui să ne asumăm. Poate fi, de exemplu, din:

Probleme de clasificare, cum ar fi detectarea spamului sau a mesajelor nedorite.
Probleme de grupare, cum ar fi recomandarea unei cărți unui utilizator pe baza achizițiilor anterioare (sistem de recomandare) f
Probleme de regresie, cum ar fi aflarea cât de mult va folosi un anumit client un serviciu (determinarea unei valori)

Dacă luăm în considerare problema clasică a păstrarea clientului, Vedem că o putem aborda din diferite abordări. Vrem să facem o segmentare a clienților, da, dar care strategie este cea mai potrivită? Este mai bine să o tratați ca pe o problemă de clasificare, grupare sau chiar regresie? Indiciul cheie va fi dat punându-ne a doua întrebare.

Ce informații am pentru a-mi atinge scopul?

Dacă mă întreb: „Clienții mei, sunt grupați într-un fel, în mod natural?”, Nu am definit niciun obiectiv (țintă) pentru grupare.

Cu toate acestea, dacă pun întrebarea în acest alt mod: putem identifica grupuri de clienți cu o mare probabilitate de a solicita rezilierea serviciului de îndată ce contractul lor se încheie? ţintă perfect definit: clientul va fi dezabonat? și dorim să acționăm în funcție de răspunsul pe care îl primim.

În primul caz, ne confruntăm cu un exemplu de învățare nesupravegheat, în timp ce al doilea este din învățare supravegheată.

În fazele inițiale ale procesului de știință a datelor, este foarte important să se decidă dacă „strategia de atac” va fi supravegheată sau nesupravegheată și, în acest din urmă caz, să se definească cu precizie care va fi strategia de atac. variabilă țintă. Pe măsură ce decidem, vom lucra cu o familie de algoritmi sau cu alta.