Con FILE_GET_CONTENTS(), leggi la pagina HTML che passi come argomento in una stringa.
All'interno della stringa, con opportune espressioni regolari, fai lo scraping delle informazioni di cui necessiti.
È un metodo un po' brutale ma con le giuste regexp funziona a dovere.
Ovviamente, per parole di uso comune come NEWS, SPORT o che so io, rischieresti di trovare dei falsi positivi... quindi dei riscontri su parti della pagina che non fanno parte del testo di un articolo del blog.
![]()