Opravil jsem jak "ostrou" verzi přímo na stránkách, tak i tu novou experimentální.
Původní pro Linux x86_64
Původní pro Windows x86_64
Původní pro Windows x86
Původní pro Linux ARMv7
Původní pro Linux aarch64
Experimentální pro Linux x86_64
Experimentální pro Windows x86_64
Experimentální pro Windows x86
Experimentální pro Linux ARMv7
Experimentální pro Linux aarch64
Pro zajímavost... na RPi 3 trvá načtení 16Mpix 16bit snímku v původní aplikaci 5 vteřin (aarch64; 6,5 vteřiny na ARMv7) a v experimentální 1 vteřinu (aarch64 i ARMv7). Pětinásobné zrychlení.

Do budoucna ještě plánuji optimalizace, takže to možná ještě trochu zrychlím. Pak nejspíš původní verzi pošlu k ledu.