Menghilangkan short tag Wordpress dengan GNU Sed
Pasca migrasi, setelah saya chek beberapa tulisan di blog ini, ternyata masih tercemar dengan short tag dari wordpress, terutama [caption]
.
Saya mencoba menghilangkan short tag tersebut dengan fitur find and replace, tetapi masalahnya short tag tersebut bermacam macam pola nya, find and replace hanya bisa melakukan replace dengan pola yang sama. Dalam kasus ini hanya bisa menghapus akhiran short tag aja ([/caption]
)
Solusi
Solusinya menggunakan GNU Sed. Dengan pencarian regex di sed sangat memungkinkan sekali melakukan replace dengan pola yang dinamis seperti
[caption id="" align="aligncenter" width="551" caption="Ilustrasi DropBox, Lucu Juga.. hehehe"]
Eksekusi
Saya cukup menjalankan 2 perintah dibawah ini
sed -i '' -E 's/\[caption(.*)"]//g' *.md
sed -i '' -E 's/\[\/caption]//g' *.md
Dan short tag dalam ratusan file artikel saya sudah bersih.
Referensi
Dalam eksekusi ini saya mencari cari referensi di internet, berikut ini beberapa tautan yang saya gunakan untuk belajar regex dan sed.