Exploració d’estadístiques descriptives mitjançant pandes i Seaborn

Bloc

Exploració d’estadístiques descriptives mitjançant pandes i Seaborn

Estadístiques descriptives a Python

Les estadístiques descriptives inclouen aquelles que resumeixen la tendència central, la dispersió i la forma de la distribució d’un conjunt de dades.

  1. Mesura de tendència central
  2. Mesura de propagació / dispersió
  3. Mesura de simetria [la guardarà per a la publicació futura]

Conjunt de dades

S'han importat totes les biblioteques necessàries per a trames estadístiques i s'ha creat un marc de dades a partir del conjunt de dades donat al fitxer bmi.csv

Aquest conjunt de dades conté columnes Altura, Pes, Edat, IMC i Gènere. Calculem les estadístiques descriptives d’aquest conjunt de dades.

El codi utilitzat en aquest projecte està disponible com a Portàtil Jupyter a GitHub .

import numpy as np import pandas as pd import matplotlib.pyplot as plt % matplotlib inline df=pd.read_csv('bmi.csv') df

Imatge per publicar

DataFrame

Mesura de tendència central

La mesura de tendència central s’utilitza per descriure el valor mig / central de les dades.

Mean, Median, Mode són mesures de tendència central.

1. Mitjana

  • La mitjana és el average value del conjunt de dades.
  • La mitjana es calcula afegint tots els valors del conjunt de dades dividits pel nombre de valors del conjunt de dades.
  • Podem calcular la mitjana només per a les variables numèriques

Fórmula per calcular la mitjana

Imatge per publicar

#programació # python3 #pandas #python # data-science

cadena javascript a matriu json

medium.com

Exploració d’estadístiques descriptives mitjançant pandes i Seaborn

Exploració d’estadístiques descriptives mitjançant pandes i Seaborn. Enfocament quantitatiu i enfocament visual