This is a manifest of passengers from on the doomed Titanic cruise. It was downloaded from the Kaggle Machine Learning Challenge in 2014 by Catherine D'Ignazio.

891 filas de datos agrupados en 12 columnas.
Aqui hay metadata sobre cada columna

.

PassengerId

  • Esta columna tiene numbers
  • El número 1.0
  • El número más grande es 891.0
  • El total es 397386.0
  • El promedio es 446.0
  • La media es 446.0
  • La desviación estándar es 257.21
  • There are 891 unique values
valor frecuencia
1 - 90 89
90 - 179 89
179 - 268 89
268 - 357 89
357 - 446 89
446 - 535 89
535 - 624 89
624 - 713 89
713 - 802 89
802 - 891 89

PassengerId

  • Esta columna tiene numbers
  • El número 1.0
  • El número más grande es 891.0
  • El total es 397386.0
  • El promedio es 446.0
  • La media es 446.0
  • La desviación estándar es 257.21
  • There are 891 unique values

Survived

  • Esta columna tiene numbers
  • Los valores mas frecuentes en esta columna son:
    • 0.0 (549)
    • 1.0 (342)
valor frecuencia
0.0 549
1.0 342

Survived

  • Esta columna tiene numbers
  • Los valores mas frecuentes en esta columna son:
    • 0.0 (549)
    • 1.0 (342)

Pclass

  • Esta columna tiene numbers
  • Los valores mas frecuentes en esta columna son:
    • 1.0 (216)
    • 2.0 (184)
    • 3.0 (491)
valor frecuencia
1.0 216
2.0 184
3.0 491

Pclass

  • Esta columna tiene numbers
  • Los valores mas frecuentes en esta columna son:
    • 1.0 (216)
    • 2.0 (184)
    • 3.0 (491)

Name

  • Esta columna tiene text
  • The longest string has 82 characters
  • There are 891 unique values
valor frecuencia
mr 521
miss 182
mrs 129
william 64
john 44
master 40
henry 34
george 24
james 24
charles 24
thomas 21
mary 20
edward 18
anna 17
joseph 16
johan 15
frederick 15
elizabeth 15
samuel 13
richard 13

Name

  • Esta columna tiene text
  • The longest string has 82 characters
  • There are 891 unique values

Sex

  • Esta columna tiene text
  • Los valores distintos en esta columna son:
    • male (577)
    • female (314)
valor frecuencia
male 577
female 314

Sex

  • Esta columna tiene text
  • Los valores distintos en esta columna son:
    • male (577)
    • female (314)

Age

  • Esta columna tiene numbers
  • El número 0.42
  • El número más grande es 80.0
  • El total es 21205.17
  • El promedio es 29.7
  • La media es 28.0
  • La desviación estándar es 14.52
  • Hay 177 filas de datos faltantes
  • There are 88 unique values
valor frecuencia
0 - 8 54
8 - 16 46
16 - 24 177
24 - 32 169
32 - 40 118
40 - 48 70
48 - 56 45
56 - 64 24
64 - 72 9
72 - 80 1

Age

  • Esta columna tiene numbers
  • El número 0.42
  • El número más grande es 80.0
  • El total es 21205.17
  • El promedio es 29.7
  • La media es 28.0
  • La desviación estándar es 14.52
  • Hay 177 filas de datos faltantes
  • There are 88 unique values

SibSp

  • Esta columna tiene numbers
  • Los valores mas frecuentes en esta columna son:
    • 0.0 (608)
    • 1.0 (209)
    • 2.0 (28)
    • 3.0 (16)
    • 4.0 (18)
    • 5.0 (5)
    • 8.0 (7)
valor frecuencia
0.0 608
1.0 209
2.0 28
3.0 16
4.0 18
5.0 5
8.0 7

SibSp

  • Esta columna tiene numbers
  • Los valores mas frecuentes en esta columna son:
    • 0.0 (608)
    • 1.0 (209)
    • 2.0 (28)
    • 3.0 (16)
    • 4.0 (18)
    • 5.0 (5)
    • 8.0 (7)

Parch

  • Esta columna tiene numbers
  • Los valores mas frecuentes en esta columna son:
    • 0.0 (678)
    • 1.0 (118)
    • 2.0 (80)
    • 3.0 (5)
    • 4.0 (4)
    • 5.0 (5)
    • 6.0 (1)
valor frecuencia
0.0 678
1.0 118
2.0 80
3.0 5
4.0 4
5.0 5
6.0 1

Parch

  • Esta columna tiene numbers
  • Los valores mas frecuentes en esta columna son:
    • 0.0 (678)
    • 1.0 (118)
    • 2.0 (80)
    • 3.0 (5)
    • 4.0 (4)
    • 5.0 (5)
    • 6.0 (1)

Ticket

  • Esta columna tiene numbers
  • El número 693.0
  • El número más grande es 3101298.0
  • El total es 172070561.0
  • El promedio es 260318.55
  • La media es 3101265.0
  • La desviación estándar es 471252.39
  • There are 514 unique values
valor frecuencia
693 - 310754 389
310754 - 620814 256
620814 - 930874 0
930874 - 1240935 0
1240935 - 1550996 0
1550996 - 1861056 0
1861056 - 2171116 0
2171116 - 2481177 0
2481177 - 2791238 0
2791238 - 3101298 15

Ticket

  • Esta columna tiene numbers
  • El número 693.0
  • El número más grande es 3101298.0
  • El total es 172070561.0
  • El promedio es 260318.55
  • La media es 3101265.0
  • La desviación estándar es 471252.39
  • There are 514 unique values

Fare

  • Esta columna tiene numbers
  • El número 0.0
  • El número más grande es 512.3292
  • El total es 28693.95
  • El promedio es 32.2
  • La media es 14.45
  • La desviación estándar es 49.67
  • There are 248 unique values
valor frecuencia
0 - 51 732
51 - 102 106
102 - 154 31
154 - 205 2
205 - 256 11
256 - 307 6
307 - 359 0
359 - 410 0
410 - 461 0
461 - 512 0

Fare

  • Esta columna tiene numbers
  • El número 0.0
  • El número más grande es 512.3292
  • El total es 28693.95
  • El promedio es 32.2
  • La media es 14.45
  • La desviación estándar es 49.67
  • There are 248 unique values

Cabin

  • Esta columna tiene text
  • Los valores mas frecuentes en esta columna son:
    • B96 B98 (4)
    • C23 C25 C27 (4)
    • G6 (4)
    • C22 C26 (3)
    • D (3)
  • The longest string has 15 characters
  • Hay 687 filas de datos faltantes
  • There are 147 unique values
valor frecuencia
B96 B98 4
C23 C25 C27 4
G6 4
C22 C26 3
D 3
Otro 186

Cabin

  • Esta columna tiene text
  • Los valores mas frecuentes en esta columna son:
    • B96 B98 (4)
    • C23 C25 C27 (4)
    • G6 (4)
    • C22 C26 (3)
    • D (3)
  • The longest string has 15 characters
  • Hay 687 filas de datos faltantes
  • There are 147 unique values

Embarked

  • Esta columna tiene text
  • Los valores distintos en esta columna son:
    • S (644)
    • C (168)
    • Q (77)
  • Hay 2 filas de datos faltantes
valor frecuencia
S 644
C 168
Q 77

Embarked

  • Esta columna tiene text
  • Los valores distintos en esta columna son:
    • S (644)
    • C (168)
    • Q (77)
  • Hay 2 filas de datos faltantes

¿Qué hago ahora?

Comprender los datos en su archivo csv es la primera etapa de analizarlo. Mirar columnas le puede ayudar identificar preguntas divertidas de sus datos. Por ejemplo, ¿le sorprende que "0.0" ocurre con la mayor frecuencia en la columna SibSp? ¿Tiene sentido comparar la columna Survived con la columna Name? ¿Hay más colecciones de datos que puede encontrar para hacer preguntas interesantes de la columna SibSp?

Hacer estos tipos de preguntas es la primera etapa de entender los datos que tiene, y las historias que contienen. Echa un vistazo a nuestras guías de activdades para más ayuda en hacer preguntas buenas de sus datos.

Try these other tools to do more full-fledged analysis: