pandas | python | data science
@pandaspyБез лишних слов о библиотеке pandas Админ: @antongauzer
Посты канала (20)
- Работаешь с большими CSV? Не загружай всё! Используй параметр usecols в read_csv(), чтобы подгружать только необходимые… 09.09.2025
- Вместо добавления колонок по одной используйте assign() для цепочек методов (method chaining). Обычный способ: df['tota… 05.09.2025
- Визуально: если кто-то обрабатывает DataFrame построчно, это сродни мытью машины зубной щёткой — медленно и неэффективн… 04.09.2025
- Чтобы отобрать только числовые столбцы без ручного указания их имен, используй select_dtypes(): import pandas as pd df … 03.09.2025
- pd.crosstab() — мощный инструмент для анализа категориальных данных. Например, сколько покупателей в разных городах куп… 02.09.2025
- Иногда нужно выгрузить несколько DataFrame в один Excel-файл, распределив их по разным листам. Это легко сделать с помо… 01.09.2025
- Если у вас есть папка с множеством CSV, вы можете объединить их в один DataFrame буквально в несколько строк кода. Это … 12.08.2025
- Метод transform() позволяет выполнять агрегирующие операции для каждой группы и возвращать результат той же длины, что … 11.08.2025
- Вместо громоздкого .apply() можно использовать np.where() для быстрого создания новых столбцов с условиями. Это значите… 09.08.2025
- Когда нужно быстро увидеть, где в DataFrame есть пропуски, используйте визуализацию. Один из популярных способов — тепл… 08.08.2025
- pandas позволяет применять стили для форматирования данных — например, выделять цветом значения выше или ниже определён… 07.08.2025
- Хотите узнать, сколько оперативной памяти реально занимает ваш DataFrame? Метод .memory_usage() покажет это по каждому … 07.08.2025
- Метод eval() позволяет выполнять выражения быстрее, чем обычные операции pandas, особенно при работе с большими таблица… 04.08.2025
- Метод query() позволяет фильтровать строки таблицы с помощью строкового выражения, похожего на SQL. Это читаемее и коро… 03.08.2025
- Метод apply() часто используют для построчной обработки, но он медленный, особенно на больших таблицах. Лучше использов… 02.08.2025
- По умолчанию pandas может загружать данные с неэффективными типами. Например, int64 и float64 занимают больше памяти, ч… 01.08.2025
- Управление категориями: добавление, удаление, переупорядочивание Когда вы работаете с категориальными данными, важно ум… 04.07.2025
- Категориальные данные = ускорение работы с большими таблицами Если в колонке повторяются значения (например, страны, го… 03.07.2025
- Используй .dt вместе с DatetimeIndex для работы со временем Если вы установили дату как индекс (DatetimeIndex), у вас о… 02.07.2025
- Мощные строковые операции с .str Если в столбце хранятся строки (object), Pandas предоставляет целый набор векторизован… 01.07.2025