ciao.
Ho iniziato a studiare la programmazione multicore , ho scelto tbb principalmente perchè è portabile.
Ho guardato anche ppl e tutte queste librerie multicore si basano su function object o qualcosa che gli assomiglia molto.
Per adesso ho studiato il parallel for e il prarallel reduce.
prima cosa che ho notato:
1)Per semplificare :se la funzione che viene chiamata n volte dal parallel for ha all' interno una computazione piu' o meno espensiva(come si dice correttamente? ) dal punto di vista dei calcoli e dell'impiego della cpu, effettivamente ottengo dei grandi vantaggi di performance.
altrimenti addirittura la versione seriale è piu veloce.
2)Il parallel reduce è molto semplice , volevo solo sapere se è possibile un controllo,
per es : se voglio sommare una serie di tre numeri anzichè di 2 e sommare successivamente i risultati dei gruppi di tre numeri , lo posso fare o tbb decide su tutto ?
Questo perchè ho visto un po di versioni del parallel reduce di cuda con diversi approcci e diversi risultati, cuda sembra offrire una personalizazione molto piu' profonda, anche se è chiaramente molto piu a basso livello ed è per le gpugpu che capisco sono tutta un altra cosa dal punto di vista della programmazione..
grazie.