Explorem la diferència entre data science i data analytics, dues disciplines relacionades, però que compleixen funcions diferents.
El món de les dades és complex i difícil d'entendre, especialment per a aquelles persones no expertes en el tema. A mesura que les possibilitats de creació i innovació a partir de les dades augmenten, la dificultat per a mantenir-se al dia dels termes i rols relatius al seu tractament es multiplica. En aquesta ocasió, parlem de la diferència entre data science i data analytics.
Una de les principals confusions en relació amb la terminologia del món de les dades està relacionada amb els conceptes data science i data analytics, dues àrees professionals estretament vinculades que es poden arribar a superposar, si bé en general compleixen funcions diferents.
Tot i que tant el data science com el data analytics apliquen l'estadística, les matemàtiques i la programació, ho fan amb propòsits diferents. Amb la qual cosa, els perfils professionals d'aquestes dues disciplines vinculades a les dades també estan clarament diferenciats i no requereixen les mateixes aptituds, coneixements i habilitats.
Què és data science?
El data science o ciència de dades és una disciplina vinculada al data, la significació del qual ha anat evolucionant amb el temps. No obstant això, avui en dia es considera que la funció principal del data science és el tractament de grans quantitats de dades recopilades per les empreses per tal que puguin ser analitzades (data analytics) o empleades en altres accions de l'activitat empresarial, normalment relacionades amb el busieness intelligence.
És a dir, bàsicament, els científics de dades són els encarregats de transformar les dades "en brut" en "material" comprensible, de qualitat i aprofitable per al desenvolupament d'accions empresarials.
En aquest sentit, el data science inclou múltiples ciències i activitats com el machine learning i el deep learning, la integració de dades, el desenvolupament d'algoritmes basats en les matemàtiques, etc. A més de ser els encarregats de procurar que les dades puguin ser usades i posteriorment transformades en insights de negoci que serviran de base per a la presa de decisions estratègiques, els científics de dades també treballen en la transformació i càrrega de les dades a través de processos com ETL o ELT.
Al cap i a la fi l'objectiu de les dades és exercir de base del procés de presa de decisions empresarials perquè els executius puguin prendre data-driven decisions (decisions informades basades en les dades). No obstant, per tal que això passi, les dades han d'haver estat prèviament tractades. Com sempre repetim en aquest blog, per si soles, les dades no són informació.
En termes generals la ciència de dades es pot dividir en tres branques: preparació de dades, neteja de dades i anàlisi de dades. Per tant, el data analytics s'inclou dins del data science.
Què és data analytics?
El data analytics és un vessant de la ciència de dades o data science particularment centrada en l'anàlisi de les dades. És a dir, un analista de dades és, en certa manera, un científic de dades expert en analitzar dades a través d'eines d'anàlisi i BI. Si el científic de dades transforma i habilita les dades recopilades perquè aquestes puguin ser emprades en operacions empresarials (com l'anàlisi de dades), l'analista de dades s'encarrega de trobar tendències entre els conjunts de dades, transformar les dades en mètriques de mesurament i avaluació del rendiment, identificar aspectes rellevants, treure conclusions, etc.
En l'ecosistema empresarial actual l'anàlisi de dades és essencial per al bon funcionament de qualsevol organització, ja que les companyies i els alts càrrecs encarregats de decidir requereixen de cada vegada més informació, de manera cada vegada més immediata, per a la presa de decisions.
Així, mentre el científic de dades transforma les dades en arxius que contenen informació, els analistes de dades transformen les dades en informació i la informació en insights de negoci que han de fomentar la presa de millors decisions estratègiques per part dels alts càrrecs d'un negoci.
No obstant això, tot i que els perfils professionals experts en business intelligence duen a terme tasques similars, no hem de confondre data analytics amb BI. Els consultors de business intelligence treballen amb quantitats de dades molt més petites, normalment ja establertes, ordenades i referenciades; i tenen una capacitat analítica més concreta i delimitada.
En aquest sentit, un analista de dades pot treballar per a aconseguir una infinitat de metes empresarials: millorar l'eficiència operativa, identificar oportunitats de negoci, trobar ineficiències en la productivitat, optimitzar l'experiència de client, optimar el model de negoci, etc.
Diferència entre data analytics i data science
Com ja hem vist, data analytics és una vessant de data science o ciència de dades. Així, la principal diferència entre les dues és el seu enfocament. Mentre que la ciència de dades té un enfocament global i engloba qualsevol acció relativa al tractament de les dades amb perspectiva de descobriment, el data analytics es focalitza en l'anàlisi de dades per a l'obtenció d'insights de negoci que serveixin de suport als encarregats de prendre decisions empresarials, partint d'una perspectiva enfocada en la resolució de problemes existents.
Una altra de les diferències més significatives entre totes dues disciplines és que la ciència de dades planteja preguntes i els analistes de dades són els encarregats de respondre-les.
A continuació, esmentem algunes de les tasques i competències concretes de cada perfil professional:
- Tasques i competències de data science:
- Tractament, transformació i neteja de dades.
- Descobriment de problemes, anomalies i/o tendències.
Anàlisi predictiva / Forecasting. - Data mining (mineria de dades).
- Desenvolupament d'algoritmes.
- Desenvolupament de models de machine learning i deep learning.
- Presentació de resultats, plantejament de preguntes i anàlisis ad hoc.
- Tasques i competències de data analytics:
- Resoldre problemes de negoci i ineficiències en l'activitat empresarial.
- Analitzar la informació que contenen les dades per a l'obtenció d'insights.
- Assegurar la qualitat i fiabilitat de les dades (data quality).
- Rastreig i mapatge de la ruta de les dades.
- Càlcul de mètriques i indicadors (anàlisi estadística).
- Donar resposta a preguntes específiques.
Conclusió
En definitiva, el data analytics és un vessant del data science. Així, la ciència de dades és una disciplina molt més global i menys específica que l'anàlisi de dades. Mentre una s'encarrega d'habilitar les dades perquè puguin ser utilitzades, la funció del data analytics és analitzar-les per a ajudar els càrrecs directius a prendre millors decisions.