Зачем удалять пустые страницы из PDF?
Пустые страницы проникают в PDF десятками способов. Двусторонние сканеры захватывают пустые обороты каждого одностороннего документа. Драйверы принтеров добавляют завершающую страницу, если задание заканчивается в середине страницы. Шаблоны слияния Office оставляют случайную пустую страницу, если у записи нет тела. PDF книг и отчётов содержат разделительные страницы между главами, которые вам, возможно, не нужны в цифровой версии. Совокупный эффект: раздутое число страниц, увеличенный размер файла, медленная печать и менее профессиональный вид документа.
Инструмент remove blank pages PDF от PdfDocShift исправляет всё это за секунды. Загрузите файл, выберите предустановку чувствительности, просмотрите предпросмотр и скачайте очищенный результат. Без установки, без подписки Adobe Acrobat, без инструментов командной строки — только браузер.
Как работает обнаружение пустых страниц
Каждая страница PDF отрисовывается в браузере с помощью pdf.js как полутоновое изображение низкого разрешения. Затем инструмент считает, сколько пикселей темнее порогового значения (240/255) — они считаются «чернилами». Общая доля чернил сравнивается с порогом, заданным выбранной чувствительностью. Страницы ниже порога помечаются как кандидаты на удаление.
Три пресета охватывают типичные случаи:
- (≤ 0,05% чернил): удаляются только полностью пустые страницы. Самая безопасная настройка — даже единственный номер страницы или нижний колонтитул сохранит страницу.
- (≤ 0,5% чернил, по умолчанию): улавливает страницы со случайными точками сканера, следами пыли или отдельными мелкими артефактами. Рекомендуется для большинства сканов.
- (≤ 2% чернил): также удаляет страницы, единственное содержимое которых — лёгкий водяной знак, едва различимый номер страницы или одна строка колонтитула. Внимательно проверьте превью — на этом уровне может быть помечено и настоящее содержимое.
Удаляйте пустые страницы из сканированных PDF
Этот инструмент создан в первую очередь для сканированных документов, где пустые страницы — правило, а не исключение. Поскольку обнаружение основано на пикселях, а не на тексте, оно работает на сканах, к которым OCR никогда не применялся, на сканах с бессмысленным результатом OCR и на сканах с очень выцветшими чернилами. Каждая страница оценивается только по визуальному содержимому, поэтому результат совпадает с тем, что человек интуитивно назвал бы «пустой» страницей.
Если вы хотите, чтобы сохранившиеся страницы также были доступны для поиска, пропустите их через OCR PDF после очистки. Если вы хотите объединить очистку с меньшим размером файла, сочетайте этот инструмент с Compress PDF.
Очистка сканированного PDF без потери качества
Некоторые онлайн-сервисы, удаляющие страницы, повторно рендерят или сжимают весь PDF — это может ухудшить качество изображений и увеличить размер файла. Инструмент удаления пустых страниц PdfDocShift внутри использует pdf-lib: он без потерь копирует уцелевшие страницы из исходного PDF в новый документ. Векторная графика, встроенные шрифты и изображения высокого разрешения остаются побайтно идентичны оригиналу. Меняется только количество страниц.
Когда использовать «Удалить пустые страницы» вместо «Организация PDF»?
Используйте Удалить пустые страницы, когда вы просто хотите, чтобы каждая пустая или почти пустая страница автоматически обнаруживалась и удалялась без раздумий. Ваш PDF обычно становится на 10–40% меньше в зависимости от количества пустых страниц. Если вам важно, какие страницы удаляются, загрузите свой PDF, и инструмент сначала покажет вам предпросмотр каждой страницы, которую он планирует удалить — вы можете снять выбор с любой, которая фактически является содержимым (например, одинокая титульная страница или страница, намеренно оставленная пустой для двусторонней печати).