Menghilangkan short tag Wordpress dengan GNU Sed

Pasca migrasi, setelah saya chek beberapa tulisan di blog ini, ternyata masih tercemar dengan short tag dari wordpress, terutama [caption].

Saya mencoba menghilangkan short tag tersebut dengan fitur find and replace, tetapi masalahnya short tag tersebut bermacam macam pola nya, find and replace hanya bisa melakukan replace dengan pola yang sama. Dalam kasus ini hanya bisa menghapus akhiran short tag aja ([/caption])

Solusi

Solusinya menggunakan GNU Sed. Dengan pencarian regex di sed sangat memungkinkan sekali melakukan replace dengan pola yang dinamis seperti

[caption id="" align="aligncenter" width="551" caption="Ilustrasi DropBox, Lucu Juga.. hehehe"]

Eksekusi

Saya cukup menjalankan 2 perintah dibawah ini

sed -i '' -E 's/\[caption(.*)"]//g' *.md
sed -i '' -E 's/\[\/caption]//g' *.md

Dan short tag dalam ratusan file artikel saya sudah bersih.

Referensi

Dalam eksekusi ini saya mencari cari referensi di internet, berikut ini beberapa tautan yang saya gunakan untuk belajar regex dan sed.