30.5.2004

JAK ZKONVERTOVAT NEZNÁLKA DO PALMA

Filed under: Linux — nax @ 12:03

Už je tomu asi rok, co jsem si do palma nahrál první díl knihy mého mládí Neználka od Nikolaje Nosova. Tedy abych byl přesný nenahrál jsem ho tam ani tak proto, že bych chtěl já, ale protože moje přítelkyně chtěla abych jí před spaním (při zhasnutém světle jen s příjemnou nazelenalou září podsvíceného displaye) četl něco roztomilého.

No a NeznĂĄlek se přímo nabĂ­zel. Pamatuji si, Ĺže jsem pomocĂ­ svĂŠho oblĂ­benĂŠho GNU offline prohlĂ­Ĺžeče html strĂĄnek Pluckera (dokonce jsem si do něj kdysi dopsal podporu navigace pomocĂ­ HW tlačítek – vlastně takovĂ˝ typickĂ˝ GNU přístup: chybĂ­ ti nějakĂĄ funkce? Tak si jĂ­ dopiĹĄ) neměl se stĂĄhnutĂ­m do palmu ŞådnĂŠ problĂŠmy.

No a před pár dny moje drahá polovička dočetla první díl a chtěla druhý. Tak předně jsem zjistil nemilou věc, že Neználek který dřív sídlil na dnes již neexistující web hostingové službě kgb.cz

Nakonec jsem ho ale našel a zjistil jsem další nemilou věc: kódování už není windowsí, ale utf8. Já používám v palmu totiž windowsí 1250 kódování a to z praktického důvodu: pokud je nějaká aplikace v il2 (většinou jen GNU aplikace) tak je autor natolik uvědomělí, aby měl i verzi pro 1250. Autoři, kteří dělají komerční aplikace ovšem tak uvědomělí nejsou. Navíc je pořád víc stránek v windowsím kódování, takže prostě z tohoto důvodu mám na palmu 1250.

No a tak jsem potřeboval zkonvertovat stránky z utf8 na 1250. Nejdřív jsem si je stáhl hezky na disk:

wget -p -r -l2 -k -Dwww.narod-sobe.cz http://www.narod-sobe.cz/Literatura/Autori_RU/Nosov_Nikolaj/Neznalek/Neznalek_ve_Slunecnim_meste_-_obsah.htm

kde -p je aby stahoval i obrĂĄzky a vĹĄe co k strĂĄnce patří, -r je recursive, -l je hloubka vnořenĂ­ a -k je aby překonvertoval nelokĂĄlnĂ­ odkazy na lokĂĄlnĂ­. No jenĹže pak jsem zjistil, Ĺže moje obstaroĹžnĂ­ verze jinak sqělĂŠho perlovĂŠho skriptu cstocs bohuĹžel neumĂ­ utf8 🙁

Netrvalo vĹĄak dlouho a naĹĄel jsem oznĂĄmenĂ­ o novĂŠ verzi, kterĂĄ utf8 uĹž umĂ­. StĂĄhl jsem si (dokonce jeĹĄtě o jednu verzi vyĹĄĹĄĂ­) nejnovějĹĄĂ­ verzi z domovskĂŠ strĂĄnky cstocs (mimochodem jsou tam i jinĂŠ moc zajĂ­mavĂŠ projekty – určitě si je jeĹĄtě někdy projdu aĹž budu mĂ­t vĂ­c času.

No a teď jsem to potřeboval zkonvertovat. Ještě jsem si všiml, že v Neználkovi se pro odsazení odstavců používají tvrdé mezery pomocí ampersand sekvencí. Ty jsem chtěl také odstranit. Nejprve jsem si ve for cyklu (tak jak sem se to teprve nedávno naučil v předmětu unix) přejmenoval všechny soubory:

for FIL in *.htm ; do mv $FIL ${FIL}.utf8; done

a pak po chvilce pokusů jsem dal dohromady tenhle příkaz:

for FIL in *.utf8
do cstocs utf8 1250 $FIL > ${FIL%.utf8}
sed ‘s/&[^;]*;//g’ ${FIL%.utf8} > ${FIL%.utf8}.zk && mv ${FIL%.utf8}.zk ${FIL%.utf8}
done

No a potom jsem si samozřejmě všiml, že to nové cstocs má navíc přepínač -i, který způsobí, že ta změna se projeví přímo v tom souboru bez nutnosti něco někam kopírovat.

————————————————————————–

No a nakonec jsem si nechal ještě jedu lahůdku z úplně jiného soudku. Včera večer, když jsem evince chtěl ukázat 2 různé režimy Zauruse C700 (display nastojato a naležato) jsem narazil na naprosto drsnou emoční lampu, jež v útrobách skrývá linuxe. Je to dost zajímavý nápad: lampa je připojená na internet přes wifi a můžete si jí nakonfigurovat tak, že vám když vylezete ráno z postele podle intenzity, frekvence a barvy blikání dá najevo, jaké bude třeba dnes počasí venku, jestli na vaší obvyklé trase není zrovna dopravní zácpa, nebo jestli akcie vaší firmy na burze šli nahoru nebo dolu. Prý to umí do určité míry spolupracovat i smskami a emaily, takže vaše přítelkyně vám může pomocí barvy světla dávat najevo jakou má zrovna v práci náladu.

Docela zajĂ­mavĂ˝ nĂĄpad a je na dlouhou debatu jestli to k něčemu je a nebo je to jen takovĂ˝ mĂłdnĂ­ vĂ˝střelek (vymysleli to Francouzi) pro bohatĂŠ (no drahĂŠ to je pěkně – stojĂ­ to zhruba stejně jako lepĹĄĂ­ modely ZaurusĂ­ku).

No ale co se jim musĂ­ nechat, Ĺže to hezky vypadĂĄ.

Comments are closed.

Powered by WordPress