Представьте, что у вас есть набор данных погоды в вашем городе за последние 10 лет: это более 3500 тысяч наблюдений по нескольким показателям! Чтобы ответить на вопрос «стали ли зимы теплее», вам нужно оценить изменение температуры за сотни записей во времени. Просматривать 3500 строк поштучно неэффективно, но вы можете сделать агрегацию — посчитать среднюю температуру за каждый год и отследить ее динамику.
Чаще всего используются следующие виды агрегаций:
- сумма – суммирование всех наблюдений
- среднее – подсчет арифметического среднего
- минимум / максимум – наименьшее или наибольшее наблюдение в данных
- количество – сколько раз встречается то или иное значение