понедельник, 16 декабря 2013 г.

Архиваторы

       Проводил небольшое исследование архиваторов, в так сказать шкурных интересах. "Редкоземельные" не рассматривались - по причине "а будет оно завтра работать или нет ??" Тестировал на mini instance амазона, на CSV файлике размером с пол гигабайта - именно такие мне надо будет сжимать. Тестировалось одновременно степень сжатия и время сжатия - оба показателя для меня одинаково важны. Результаты получились следующие:
  1. zip -9, время: 1m6394s, степень сжатия - 84%
  2. zip -6, время: 0m16s, степень сжатия - 84% 
  3. zip -3, время: 0m8087s, степень сжатия - 80%      
  4. 7z -mmt, время: 2m17s, степень сжатия - 93%
  5. gzip, время: 0m17s, степень сжатия - 84% 
  6. bzip2, время: 1m31s, степень сжатия - 89.3%

Самым лучшим с точки зрения степени сжатия оказался 7z, но он же и самый медленный. Теоретически он должен работать быстрее на более серьезных серверах, за счет того что он поддерживает сжатие в несколько потоков(-mmt). Вторым оказался bzip2 - но он же оказался вторым по медленности. Это наталкивает на мысль что степень сжатия все-таки оказывается пропорциональной скорости сжатия. Поэтому я свой выбор остановил на zip -6, с точки зрения скорости/степени сжатия - самое то. Плюс к тому - zip формат как правило везде поддерживается, а вот 7z в официальных репозиториях присутствует не всегда. 

Комментариев нет:

Отправить комментарий