Панды .describe (), возвращающие только 4 статистики для int dataframe (count, unique, top, freq) ... без min, max и т. Д.

python pandas

1948 просмотра

2 ответа

332 Репутация автора

Почему это может быть? Мои данные кажутся довольно простыми и понятными, это фрейм данных из 1 столбца в целых числах, но .describe возвращает только count, unique, top, freq ... not max, min и другие ожидаемые результаты.

(Примечание. Функциональность .describe () такая же, как и в других проектах / наборах данных)

Автор: user1318135 Источник Размещён: 18.07.2016 09:53

Ответы (2)


5 плюса

1323 Репутация автора

Кажется, панды не распознают ваши данные как int.

Попробуйте сделать это явно:

print(df.astype(int).describe())
Автор: frist Размещён: 18.07.2016 09:56

0 плюса

810 Репутация автора

Пытаться:

df.agg(['count', 'nunique', 'min', 'max'])

Вы можете добавить или удалить различные функции агрегирования в этот список. И когда у меня довольно много столбцов, мне лично нравится переносить это:

df.agg(['count', 'nunique', 'min', 'max']).transpose()

Чтобы уменьшить агрегации на подмножестве столбцов, у вас есть разные способы сделать это.

  • Содержа слово: пример 'ID'

    df.filter (like = 'ID'). agg (['count', 'nunique'])

  • По типу данных:

    df.select_dtypes (include = ['int']). agg (['count', 'nunique'])

    df.select_dtypes (exclude = ['float64']). agg (['count', 'nunique'])

Автор: miguelfg Размещён: 17.09.2018 12:03
Вопросы из категории :
32x32