Задавайте вопросы, мы ответим
Вы не зашли.
День добрый,
хотел бы услышать мнение опытных товарищей.
В общем система немного похожая на баннерную сеть - то есть те кто контент размещает у себя на сайте и те кто собственно контент предоставляет. и тем и другим естественно нужны отчеты.
В общем сейчас это делается через аггрегационные таблицы (по умному это типа называется шардирование как я понимаю) - то есть из логов суммируется и складывается по дням, некоторые данные еще дополнительно по месяцам аггрегируются в другие таблицы для тех отчетов где единица измерения времени - месяц.
Отчеты не сказать что уж очень сложные - но Joins естественно есть (некоторые таблицы специально денормализованы чтобы поменьше жойнов было) - несколько таблиц по нескольку миллионов записей в каждой.
но вот счастья нет все равно кажется такая система не очень удобной ну и чем дальше и больше данных тем сложнее поддержка ну и подтормаживать начинает периодически.
Может быть есть какие-то альтернативные подходы к решению данной проблемы?
Спасибо,
Алексей
Неактивен
Шардирование — это другое. Шардирование — это когда Вы разбиваете таблицу горизонтально
на несколько машинок. Грубо говоря, проекты, начинающиеся с А, живут на этой машинке, а
с Б — на другой. Но структура данных и алгоритмы на этих машинках одинаковые. Вот шар-
дирование Вам как раз поможет
Неактивен
спасибо большое. шардировать тогда видимо придется по дате....
по идее в этом случае можно просто сначала с partitions попробовать?
это попроще наверно чем разносить по разным машинам.
Неактивен
Ну, если к этому подойти разумно, то может помочь, конечно.
Неактивен