Dlaczego usuwać puste strony z PDF?
Puste strony zakradają się do PDF-ów na dziesiątki sposobów. Skanery dwustronne wciągają puste tyły jednostronnych dokumentów. Sterowniki drukarek dodają stronę końcową, gdy zadanie kończy się w środku strony. Szablony korespondencji seryjnej Office zostawiają pustą stronę, gdy rekord nie ma treści. PDF-y książek i raportów zawierają strony rozdzielające pomiędzy rozdziałami, których możesz nie chcieć w wersji cyfrowej. Skumulowany efekt to przerośnięta liczba stron, większe pliki, wolniejszy druk i mniej profesjonalny wygląd dokumentu.
Narzędzie remove blank pages PDF PdfDocShift rozwiązuje to wszystko w kilka sekund. Prześlij swój plik, wybierz preset czułości, przejrzyj podgląd i pobierz oczyszczony wynik. Bez instalacji, bez subskrypcji Adobe Acrobat, bez narzędzi wiersza poleceń — tylko przeglądarka.
Jak działa wykrywanie pustych stron
Każda strona PDF jest renderowana jako obraz w niskiej rozdzielczości w skali szarości w Twojej przeglądarce za pomocą pdf.js. Następnie narzędzie liczy, ile pikseli jest ciemniejszych od progu (240/255) — są one traktowane jako „tusz". Łączny współczynnik tuszu porównuje się z progiem wynikającym z wybranej czułości. Strony poniżej progu są oznaczane jako kandydaci do usunięcia.
Trzy ustawienia pokrywają najczęstsze przypadki:
- (≤ 0,05% tuszu): usuwane są tylko zupełnie puste strony. Najbezpieczniejsze ustawienie — nawet pojedynczy numer strony lub stopka zachowuje stronę.
- (≤ 0,5% tuszu, domyślnie): wykrywa strony ze sporadycznymi punktami skanowania, śladami kurzu lub pojedynczymi drobnymi artefaktami. Zalecane dla większości skanów.
- (≤ 2% tuszu): usuwa też strony, których jedyną zawartością jest jasny znak wodny, ledwie widoczny numer strony lub pojedynczy nagłówek. Uważnie przejrzyj podgląd — przy tym poziomie może zostać oznaczona również realna treść.
Usuń puste strony ze zeskanowanych PDF
To narzędzie zostało stworzone przede wszystkim z myślą o skanowanych dokumentach, gdzie puste strony są raczej regułą niż wyjątkiem. Ponieważ wykrywanie opiera się na pikselach, a nie na tekście, działa na skanach, które nigdy nie przeszły OCR, na skanach z bełkotliwym OCR i na skanach z bardzo wyblakłym tuszem. Każda strona oceniana jest wyłącznie na podstawie zawartości wizualnej, więc wynik odpowiada temu, co człowiek intuicyjnie nazwałby „pustą" stroną.
Jeśli chcesz, aby pozostałe strony były również przeszukiwalne, przepuść je przez OCR PDF po oczyszczeniu. Jeśli chcesz połączyć oczyszczanie z mniejszym rozmiarem pliku, połącz to narzędzie z Compress PDF.
Czyść zeskanowane PDF bez utraty jakości
Niektóre narzędzia online, które usuwają strony, renderują lub kompresują cały PDF ponownie — może to obniżyć jakość obrazów i zwiększyć rozmiar pliku. Narzędzie do usuwania pustych stron PdfDocShift korzysta pod spodem z biblioteki pdf-lib: kopiuje pozostałe strony bezstratnie z oryginalnego PDF do nowego dokumentu. Grafiki wektorowe, osadzone czcionki i obrazy w wysokiej rozdzielczości pozostają bajt-do-bajta identyczne z oryginałem. Zmienia się jedynie liczba stron.
Kiedy używać Usuń puste strony, a kiedy Organize PDF?
Użyj Usuń puste strony, gdy chcesz po prostu, aby każda pusta lub prawie pusta strona była automatycznie wykrywana i usuwana bez zastanawiania się nad tym. Twój PDF jest zwykle 10–40% mniejszy w zależności od liczby pustych stron. Jeśli zależy ci na tym, które strony zostaną usunięte, prześlij swój PDF, a narzędzie najpierw pokaże ci podgląd każdej strony, którą zamierza usunąć — możesz odznaczyć każdą, która jest faktycznie treścią (jak samotna strona tytułowa lub strona celowo pozostawiona pusta dla druku dwustronnego).