Dostępność, UX i Ty logo

Dostępność, UX i Ty

Archiwum
5 Maj 2026

PDF, czyli Prawie Dodupny Format

Dlaczego PDF to nie jest najlepszy format do publikacji w Internecie? I co z tym zrobić?

Uwaga! Przeczytaj

Zamierzam zacząć rozsyłać ten newsletter częściej. Dodaj “wojtek@wojtekkutyla.pl” do swojej książki adresowej, proszę. W ten sposób nie będzie lądować w klopie. Dzięki! A dzisiaj:

tl;dr Pliki PDF są często niedostępne. Opowiadam, dlaczego. Użyj HTML albo naucz się robić PDF dobrze.

Podróż w czasie

Kiedyś, kiedy większość informacji dystrybuowano na papierze, istniał elektroniczny format PostScript. Istnieje on zresztą do dzisiaj. Pozwala na przekazywanie informacji w taki sposób, że urządzenia zajmujące się drukiem nie dostają kręćka. PostScript nie nadaje się jednak do uniwersalnej dystrybucji dokumentów cyfrowych. Powodów jest kilka i zaśmiecanie Ci nimi głowy nie ma sensu. Tak czy inaczej, mądrzy ludkowie z Adobe, w czasach, kiedy nie było ono jeszcze takie krwiożercze, zastanawiali się, co z tym zrobić. Potrzeba było formatu, który pozwalałby przenosić coraz bardziej skomplikowane treści cyfrowe w taki sposób, by nawet skomplikowany układ stron, tabel, grafik i czcionek śmigał jako-tako i w drukarce, i na monitorze wujka Staszka. Tak narodził się standard PDF - Portable Document Format.

Po raz wtóry oszczędzę Ci skomplikowanych szczegółów technicznych i wyjaśnię w skrócie, że aby coś stało się plikiem PDF, którym potem można zaśmiecić internet, najpierw musi być czymś innym. Na przykład, plikiem Worda. Albo plikiem Adobe InDesign czy Affinity Publisher. Lub też, na przykład, stroną internetową w standardzie HTML. Zalety PDF są niepodważalne; każdy kreatywny wygibas płaczącego pisarza, graficzki czy profesorki można wypluć do pliku, który wygląda mniej więcej tak samo wszędzie. Osoby piszące regulaminy korzystania z usług lub podręczniki obsługi odkurzacza dostają wypieków! Tyle że, jak wiemy (i o czym pisałem już nie raz), w Internecie panuje obsesja na punkcie wyglądu. Czyli estetyki. W miarę upływu lat niejako zapomniano o pierwszej funkcji PDF — czyli o tym, że ma on przenosić informacje w sposób między-platformowy. Skupiono się natomiast na dwóch innych zagadnieniach: na możliwościach szybkiego tworzenia PDFów za pomocą technologii parsujących (czyli przerabiających jedne dane na drugie) i na tym, że można w nich upchać foty, filmy, dziwactwa 3D, formularze, grafikę wektorową i rastrową i jeszcze podlać to tekstem w Comic Sans. I będzie tak samo dla wszystkich. Niech rzuci kamieniem osoba, która nie ściągnęła kiedyś z netu instrukcji obsługi nowej pralki po to, by odkryć, że wygląda ona dokładnie tak samo jak zgubiona książeczka, co była do niej przyklejona, jak ją wnieśli, ale chomik zjadł.

I byłoby pięknie! To wszystko brzmi jak sen. Jeden dokument, wiele platform, wszystkie osoby zadowolone. Oczywiście, tak to nie działa. Gdzie się zgina dziób jamnika? Jak zwykle: na dostępności.

95% PDFów w sieci nie jest dostępne

Niezła sraka. Możesz o tym poczytać, na przykład, w raporcie PDF Accessibility Index. Dlaczego tak jest? Odpowiedź tkwi w nieświadomości osób i organizacji wypluwających te dokumenty, ale także w braku edukacji. Oraz przede wszystkim w starej zasadzie: shit in, shit out. Czyli: nie da się gówienka zamienić w miód. Jeśli przygotujemy dokument bez dbałości o dostępność, to nie ma co na nią liczyć.

Czy to się w ogóle da zrobić?

Pewnie, że się da. W3C ma na ten temat fajny manual. Adobe też pisze, jak zrobić to w Acrobatcie. Trzeba jednak się przyłożyć. Dostępny PDF ma:

  1. W całości “otagowaną”, czyli oznaczoną strukturę treści, która płynie w logicznej kolejności,

  2. Oznaczoną semantyczną strukturę - nagłówki, listy, tabele i tak dalej,

  3. Zero nieuporządkowanych nagłówków, użytego bez sensu koloru, sparciałego JavaScriptu, użycia wtyczek 3D, nieopisanych video i tak dalej,

  4. Opisy alternatywne dla treści nietekstowych,

  5. Ustawienia bezpieczeństwa, które pozwalają technologiom wsparcia dostępności na “trawienie” PDF (te pliki można zaszyfrować, zabezpieczyć przed drukiem, etc.),

  6. Czcionki, które są zmapowane do tabeli kodowej Unicode i osadzone w dokumencie,

  7. I parę innych rzeczy, w zależności od poziomu zgodności ze standardem PDF/UA, bo tak się nazywa standard opisujący dostępne PDF.

Jak zapewne widać, to są wymagania, których nie spełnia w ogóle 95% szajsu w sieci, a co dopiero pliki, które do poprawnego przygotowania wymagają całego dodatkowego bagażu wiedzy i naprawdę dobrej znajomości WCAG (i narzędzi takich jak Adobe Acrobat, zresztą dość drogi i, pod względem edycji PDF, absolutnie obleśny w użyciu).

A jakie mamy alternatywy dla PDF?

Szczerze mówiąc, to nawet poprawnie skonstruowany plik Micro$oft Word często lepiej poddaje się technologiom wsparcia dostępności. Ale tutaj kolejne schodki - osób, które potrafią poprawnie przygotować takie pliki też jest stosunkowo nie dużo, bo tego się ludzi nie uczy. Takie zasady jak separacja prezentacji od treści to coś, co zawsze otwiera szeroko oczy urzędnikom na szkoleniach. Tak więc, nie. Word to nie jest w pełni sensowna alternatywa. Spójrz zresztą na wskazówki od Małego Miękkiego; już tam jest napisane np. żeby “unikać tworzenia tabel”. No proszę Cię. Toć to średniowiecze.

Istnieje jednak coś, co jest super, działa zawsze, na wszystkim, daje się drukować, czytać, oglądać, jest dostępne i wygodne! A przynajmniej takie być powinno, gdy jest używane z głową… O Boże, czyli znowu to samo. Ale dajmy się ponieść entuzjazmowi choć na chwilę. Co to jest? No co? Ty już to wiesz! Tak! To…

Stary, dobry semantyczny HTML!

Tak. Pomimo upływu lat, HTML wciąż jest najlepszą metodą do publikacji treści w sieci. Dobrze opisana struktura o poprawnej architekturze informacji zawsze się obroni. Będzie przepływać (jej flow będzie pozwalał na wygodne “łamanie” się w zależności od wielkości ekranu), będzie ładować się szybko, będzie wygodnie współpracować z klawiaturą, czytnikami ekranowymi i całą resztą naszego kochanego badziewia. Cud-miód, po prostu!

Jaka wypływa z tego nauka?

  1. Jeśli masz zastosować standard PDF do przekazywania informacji, to zastanów się dwa razy. Podaj lepiej HTML i dobry CSS, zadbaj o CSS do druku i pozwól osobie samej podjąć decyzję, co dalej.

  2. Jeśli już musisz podawać PDF, bo tego wymaga od Ciebie praca, to zaoferuj alternatywę w postaci HTML albo np. pliku CSV (jeśli to, na przykład, wydruk konta z banku). Wtedy osoba będzie mogła sama sięgnąć po to, co jej wygodnie. W międzyczasie tłumacz bossom, dlaczego trzeba się ogarnąć.

  3. Dodatkowo, jeżeli PDF, to dostępny i zgodny ze standardem PDF/UA. To oznacza konieczność nauki narzędzi, które mogą taki PDF stworzyć (od Worda, Adobe InDesign w zestawie z Acrobatem, Affinity Publisher w zestawie z Acrobatem, czy Foxit PDF Editor). To oznacza również konieczność skumania, jak takie coś przetestować. Do tego są narzędzia takie jak PAC PDF Accessibility Checker (za darmo, nie poprawisz baboli, tylko przetestujesz) czy wspomniany wiele razy Adobe Acrobat (NIE darmowy Reader, ups). Robi się duszno.

  4. Dokumenty PDF muszą być dostępne, by Twoja strona wypełniła założenia Europejskiego Aktu o Dostępności (jeśli podeń podpada).

To powoduje wiele problemów. Największym chyba jest to, że większość PDFów generowanych jest automatycznie i to w sposób autentycznie skandaliczny. A producenci parserów danych zapewniają o tym, że umożliwiają one tworzenie plików PDF w poszanowaniu PDF/UA, co w praktyce rzadko kiedy się dzieje. Poza tym, shit in, shit out, pamiętasz? Co oznacza, że jeśli Twoje dokumenty i treść nie są odpowiednio zaplanowane i opisane, to nie dadzą się też ładnie przetworzyć na PDF. Pliki PDF sprawiają też problemy w aktualizacjach, żrą prąd, zalegając na serwerach… Błe. Serio. O ile do druku wciąż się je stosuje i to jest naprawdę dobry pomysł, o tyle w sieci powinniśmy używać czegoś innego.

Podobało się? Jak masz pytania, to dawaj!

Spróbuję odpowiedzieć na nie w kolejnym newsletterze. Jeśli w ogóle coś Cię ciśnie, to odpisz na tego maila, może podasz mi pomysł na kolejny wpis.

Bo wracamy do newslettera!

Blog. LinkedIn. Newsletter. Cholera wie, co jeszcze. Za dużo tego. Nie ogarniam. A pisać lubię, lubię wciąż mimo nagromadzenia obowiązków tatusiowskich. Toteż wracam do pisania na newsletterze. I niech nam rośnie duży. Ha! A ten wpis jest odpowiedzią na pytania i prośby osób, które uczestniczą teraz w kursie “WCAG krok po kroku” (i nie tylko). Pozdrawiam Pawła i Sławka!

A Ty spodziewaj się nieregularnych, ale ciekawych newsletterów. Postaram się do tego przyłożyć. Przekaż linka do zapisu znajomym. Im nas tu więcej, tym weselej!

Nie przegap kolejnych wiadomości. Zasubskrybuj Dostępność, UX i Ty:
Podziel się tym e-mailem:
Podziel się tym na LinkedIn Podziel się tym przez e-mail
LinkedIn
Ten newsletter fruwa na Buttondown - najprostszej maszynce do takich publikacji.