Salve, mi trovo nella situazione di dover salvare in database del testo generato in una HTMLArea. Vorrei strippare tutti i caratteri speciali ma salvare i tag html (altrimenti che uso a fare uan HTMLArea...). Ossia, se per esempio avessi

codice:
<div id="header"><h1>Viaggio in città</h1></div>
Vorrei codificare la sola "à" di città in & agrave; e lasciare gli altri caratteri -delimitatori di tag e doppi apici di attributi di tag stessi- che altrimenti verrebbero trasformati nella relativa entità se usassi un semplice htmlentities per trasformare il tutto.

Credo che mi servirebbe una regex che riconosca il contenuto dei tag html e a questo applicare htmlentities... il problema che ho è che sono una pippa colossale nello scrivere regex (così come in molte altre cose, ma sorvoliamo... ) e non so da che parte cominciare.