direi invece che qualcosa puoi fare: io ad esempio in puro Js riesco a leggere un XML fare la scansione dei nodi e leggerne il contenuto. E funziona con tutti i recenti browser.
ad esempio se la tua immagine è identificata tramite un id
potresti creare un xml in cui un nodo ha lo stesso nome dell'id della foto e leggi il contenuto del nodo che contiene la descrizione.
Si fa con un approccio tipo ajax.![]()