Metodologia de la ciència de dades i arbres de decisió

Bloc

Metodologia de la ciència de dades i arbres de decisió

Una metodologia es defineix com una forma de sistema i mètodes utilitzats en una àrea particular d’estudi o activitat.

La metodologia Data Science pretén respondre a les 10 preguntes següents en aquesta seqüència prescrita:

DEL PROBLEMA A L'APROXIMACIÓ:

  1. Quin és el problema que intenteu resoldre?
  2. Com podeu utilitzar les dades per respondre a la pregunta?

TREBALLANT AMB LES DADES:

3. Quines dades necessiteu per respondre a la pregunta?

4. D’on provenen les dades (identifiqueu totes les fonts) i com les obtindreu?

5. Les dades que heu recollit són representatives del problema per resoldre?

6. Quina feina addicional és necessària per manipular i treballar amb les dades?

DERIVAR LA RESPOSTA:

7. De quina manera es poden visualitzar les dades per obtenir la resposta que es requereix?

8. El model utilitzat respon realment a la pregunta inicial o cal ajustar-lo?

9. Es pot posar en pràctica el model?

10. Podeu obtenir comentaris constructius per respondre a la pregunta?

Diagrama de blocs de metodologia de ciència de dades:

Metodologia de la ciència de dades

Comprensió empresarial: en aquesta etapa es descriu quin és el problema que intenteu resoldre ?.

Enfocament analític: aquesta etapa és important, ja que ajuda a identificar quin tipus de patrons seran necessaris per abordar la qüestió de manera més eficaç. Com podeu utilitzar les dades per respondre a la pregunta ?.

Requisits de dades: aquesta etapa es realitza per identificar quan, on, com, qui, per què i quins són els requisits de dades per resoldre el problema.

Recopilació de dades: recopilar dades adequades és essencial per proporcionar la solució necessària.

Comprensió de dades: és essencial entendre les dades, accedir a la qualitat i descobrir informació preliminar interessant.

Preparació de dades: aquesta etapa descriu quines són les maneres possibles de preparar les dades.

Modelització: en aquesta etapa es tracta de la visualització de dades. De quina manera es poden visualitzar les dades per obtenir la solució necessària.

Avaluació: aquesta etapa comprova el model que s’utilitza per respondre realment a la pregunta inicial o cal ajustar-lo.

El model i l'avaluació poden tenir dues fases principals:

- una fase de mesures diagnòstiques

com eliminar truekey

- proves de significació estadística

Nota: Per dur a terme la metodologia de la ciència de les dades en temes del món real com ara hospitals, targetes de crèdit, sector bancari, etc., podeu descriure com podem aplicar metodologies a partir de les dades detallades.

#metodologia # arbre de decisions # ciència-de-dades # aprenentatge-automàtic # classificació

medium.com

Metodologia de la ciència de dades i arbres de decisió

Una metodologia es defineix com una forma de sistema i mètodes utilitzats en una àrea particular d’estudi o activitat. La metodologia Data Science pretén respondre a les 10 preguntes següents en aquesta seqüència prescrita