Siirry pääsisältöön

Ääkköset ja merkistömuunnokset

Jos sivustosi vanha palvelin käytti jotain muuta merkistöä kuin UTF-8 saatat löytää tarkoituksettomia ääkkösiä tiedostoistasi.

Päivitetty eilen

Jos tiedostojen nimisissä on seassa ääkkösiä voi se johtua siitä että vanhalla palvelimella oli käytössä jokin muu merkistö kuin UTF-8. Tällöin tiedostonimet voi muuntaa convmv-komennolla. Yleisiä vanhoja merkistöjä ovat Windows-1255, ISO-8859-1 ja ISO-8859-15. Riippuen siitä mikä oli käytössä vanhalla palvelimella, tulee ajaa jompi kumpi alla olevista komennoista:

convmv -f ISO-8859-15 -t UTF-8 -r *

tai

convmv -f windows-1255 -t UTF-8 -r *

Komento ajetaan WordPressin pääkansiossa /data/wordpress ja parametrin -r ansiosta muunnos tehdään kaikille tiedostoille alahakemistoissakin. Yllä oleva komento kertoo mikä olisi muunnoksen tulos mutta ei vielä tee sitä. Väärin tehtynä muunnos voi sekoittaa tiedostonimien merkistön täysin. Kun on varmuus, että merkistömuunnos menee oikein, pitää yllä olevaan komentoon vielä lisätä parametri --notest jotta muunnos todella tapahtuu.


Ääkköset sekaisin tekstitiedostojen sisällä

Tällaisessa tapauksessa tiedostojen sisällön merkistön voi muuntaa recode-komennolla. Tiedoston nykyisen merkistön näkee file-komennolla esimerkiksi näin:

file example.php

Muunnoksen voi tehdä ajamalla esimerkiksi:

recode ISO-8859-15..UTF-8 *.php
Vastasiko tämä kysymykseesi?