Задавайте вопросы, мы ответим
Вы не зашли.
Страниц: 1
Есть интересная задача: как загнать csv файл (38GiB) в mysql?
А самое главное как загонять последующую информацию из тех же csv (10-20 GiB).
К сожалению данная операция в большинстве случаев весьма нетороплива.
Ситуация ослажняется тем, что необходимо использовать индексы на таких объемах данных. Что приводит к тому, что последующая загрузка занимает продолжительное время.
Какое у меня железо?
PowerEdge R610. HT отключен. Соответвенно имеем 8 ядер. RAM в колличестве 70Gb
База живет на Intel SSD 750.
Что за база?
mysql Ver 15.1 Distrib 10.1.7-MariaDB, for Linux (x86_64) using readline 5.1
Я создаю такую таблицу и заливаю туда данные
Отредактированно sv (20.10.2015 17:59:43)
Неактивен
> Ситуация ослажняется тем, что необходимо использовать индексы на таких объемах данных. Что приводит к тому, что последующая загрузка занимает продолжительное время.
Попробуйте отключать индексы на время загрузки:
ALTER TABLE `table` DISABLE KEYS;
LOAD DATA
ALTER TABLE `table` ENABLE KEYS;
MyISAM в один поток - недостаточно быстро?
Неактивен
rgbeast написал:
> Ситуаци� о� лажн� ет� � тем, что необходимо и� пользовать индек� ы на таких объемах данных. Что приводит к тому, что по� ледующа� загрузка занимает продолжительное врем� .
Попробуйте отключать индек� ы на врем� загрузки:
ALTER TABLE `table` DISABLE KEYS;
LOAD DATA
ALTER TABLE `table` ENABLE KEYS;
MyISAM в один поток - недо� таточно бы� тро?
С отключенными индек� ами отлично заливает� � .
Первый csv дамп в 25G заливает� � - 30 min 58.17 sec
Потом отключаем индек� ы.
Второй csv дамп в 14G заливает� � 18 min 51.23 sec.
Индек� ы по� ле включени� � тро� т� � 1 hour 9 min 52.03 sec.
� езультаты хорошие. � о е� ть опа� ение ка� ательно объема таблиц. MyISAM помнит� � � большими таблицами работал крайне не � табильно. Aria конечно по заверени� м Монти более � табильна. � о как мне кажет� � InnoDB при таблицах в не� колько � отен гиг более предпочтительный вариант. � о только он заливает� � довольно долго в один поток. Я наверное попробую отключение индек� а и � InnoDB. � о даже е� ли � коро� ть � уще� твенно повы� ит� � хотело� ь бы в� е равно лить в не� колько потоков. � то довольно гру� тно � мотреть в top и видеть как грузит� � лишь одно � дро из 8. � Е� ли их 16 или 32?
� у и вопро� . � а� колько корректно вообще заливать в mysql не� колько потоков? Как � пи� ал выше, mysql по крайней мере � о � тати� тикой � ходит � ума. Хот� таблицы по� ле заливки вроде как кон� и� тентны.
Неактивен
На моей проактике не было никаких проблем с MyISAM при больших объемах. Что для него опасно для производительности - много одновременных операций записи.
По записи в несколько потоков опыта нет, так как препочитаю делать это в один поток. Все будет зависеть от того, как алгоритмы среагируют на конкретные данные.
Неактивен
У мен� были регул� рные проблемы � MyISAM - тиблицы крашили� ь каждую неделю. Правда то при и� пользовании репликации.
Проблема решала� ь переводом на InnoDB. � о в данном � лучае � то не актуально, так как репликаци� не и� пользует� � .
P.S. Кака� -то ерунда � форумом. Отправл� ешь � ообщение и он его режит до первых не� кольких букв. � едактируешь его и вновь втавл� ешь тек� т и на некоторых � имволах ромбики. � аботаю в linux � браузерами chrome и firefox.
Отредактированно sv (29.10.2015 16:47:25)
Неактивен
Странно, тоже в linux и firefox. Все проблемы имеют очень частный характер, поэтому в каждой ситуации рекомендуется тестировать. Не могу априори сказать в чем была проблема с MyISAM при репликации.
Неактивен
Страниц: 1