Еще немного поковырялся. Наибольшие тормоза вызывает вот эта оптимизация -Xbcj x86. От 2,5 до 4 раз по итогам нескольких тестов. Выигрыш есть, но не значительный 1-2%. Предлагаю вынести это за ключик (спецом для разрабов и прочих жадных до дискового пространства индивидуумов), а Xz и размер блока оставить по умолчанию как есть. Аналогично сделать в pfsmerge и pfsmerge-dir.
З.Ы. Если есть интерес к lz4 (скорость сжатия в разы больше, чтения вроде тоже выше), можно добавить так же как gzip ключиком.