Premiers tests avec OpenCL
par Christophe Laporte le 31.08.2009 à 00:02
OpenCL est une jeune technologie très prometteuse. Afin d'avoir une idée du gain qu'est susceptible d'apporter cette nouveauté apparue dans Snow Leopard, Andreas Michalak a mis au point un logiciel appelé OpenCL Benchmark. L'intérêt de cet outil, c'est qu'il lance le même algorithme optimisé pour OpenCL deux fois : une fois avec le processeur, une autre avec le GPU.
Bien évidemment, le gain varie en fonction de la configuration de votre ordinateur. Ainsi, sur un MacBook Pro Unibody, le bench est effectué en 2,8 secondes lorsque l'on fait appel à la GeForce 9600M GT, en 3,08 secondes lorsque l'on fait appel à la GeForce 9400M et en 15,45 secondes avec un processeur Intel Core 2 Duo à 2,4 GHz. Sur cette configuration, le gain de performances est donc flagrant.
Sur un MacBook Pro Penryn doté d'une GeForce 8600M GT, le gain l'est beaucoup moins. Le GPU achève la tâche en 15,28 secondes alors que le processeur cadencé à 2,4 GHz l'effectue en 16,05 secondes.
On comprend mieux pourquoi Apple a réservé cette technologies aux dernières générations de GPU.
Sur le même sujet :
- Hydra est jusqu'à 2,5 fois plus rapide sous Snow Leopard
- Snow Leopard vs Leopard : tests de performances
Bien évidemment, le gain varie en fonction de la configuration de votre ordinateur. Ainsi, sur un MacBook Pro Unibody, le bench est effectué en 2,8 secondes lorsque l'on fait appel à la GeForce 9600M GT, en 3,08 secondes lorsque l'on fait appel à la GeForce 9400M et en 15,45 secondes avec un processeur Intel Core 2 Duo à 2,4 GHz. Sur cette configuration, le gain de performances est donc flagrant.
Sur un MacBook Pro Penryn doté d'une GeForce 8600M GT, le gain l'est beaucoup moins. Le GPU achève la tâche en 15,28 secondes alors que le processeur cadencé à 2,4 GHz l'effectue en 16,05 secondes.

On comprend mieux pourquoi Apple a réservé cette technologies aux dernières générations de GPU.
Sur le même sujet :
- Hydra est jusqu'à 2,5 fois plus rapide sous Snow Leopard
- Snow Leopard vs Leopard : tests de performances
| |
3
2
1
Vos réactions (35 réactions)
wolverine
[31/08/2009 00:10]
salut
moi avec mon mac pro ca donne ca !
Number of OpenCL devices found: 2
OpenCL Device # 0 = GeForce 8800 GT
Device 0 is an: GPU with max. 1500 MHz and 112 units/cores
Now computing - please be patient....
time used: 0.689 seconds
OpenCL Device # 1 = Intel(R) Xeon(R) CPU E5462 @ 2.80GHz
Device 1 is an: CPU with max. 2800 MHz and 8 units/cores
Now computing - please be patient....
time used: 3.273 seconds
Now checking if results are valid - please be patient....
:) Validate test passed - GPU results=CPU results :)
logout
[Opération terminée]
salut
moi avec mon mac pro ca donne ca !
Number of OpenCL devices found: 2
OpenCL Device # 0 = GeForce 8800 GT
Device 0 is an: GPU with max. 1500 MHz and 112 units/cores
Now computing - please be patient....
time used: 0.689 seconds
OpenCL Device # 1 = Intel(R) Xeon(R) CPU E5462 @ 2.80GHz
Device 1 is an: CPU with max. 2800 MHz and 8 units/cores
Now computing - please be patient....
time used: 3.273 seconds
Now checking if results are valid - please be patient....
:) Validate test passed - GPU results=CPU results :)
logout
[Opération terminée]
tmeritan
[31/08/2009 00:16]
Vivement les premières applications qui en tireront parti
Vivement les premières applications qui en tireront parti
biniou
[31/08/2009 00:18]
Il faut voir comment c'est implémenté, mais avec Cuda j'avais des gains de performance bien plus important avec ma GeForce 8600 GT que le benchmark que vous avez passé.
Il faut voir comment c'est implémenté, mais avec Cuda j'avais des gains de performance bien plus important avec ma GeForce 8600 GT que le benchmark que vous avez passé.
misterbrown
[31/08/2009 00:21]
Si c est vrai et qu ils ont passé à la trappe l optimisation des 8600GT pour favoriser que les derniers GPU sur les derniers portable, je vais être énervé.
On dirait une sorte de prime à la casse ce Snow Léopard.
Si c est vrai et qu ils ont passé à la trappe l optimisation des 8600GT pour favoriser que les derniers GPU sur les derniers portable, je vais être énervé.
On dirait une sorte de prime à la casse ce Snow Léopard.
alushta
[31/08/2009 00:21]
Tiens, encore une application qui n'ont pas fini de traduire :o
Tiens, encore une application qui n'ont pas fini de traduire :o
ispeed
[31/08/2009 00:23]
Genre de test qui ne veut rien dire. Il faudra juger sur pièce
Genre de test qui ne veut rien dire. Il faudra juger sur pièce
françois bayrou
[31/08/2009 01:01]
"Sur un MacBook Pro Penryn doté d'une GeForce 8600M GT, le gain l'est beaucoup moins. Le GPU achève la tâche en 15,28 secondes alors que le processeur cadencé à 2,4 GHz l'effectue en 16,05 secondes."
HUM !
Plus que la vitesse de calcul GPU vs. CPU .... L'important n'est il pas que le programme soit capable de s'executer sur le GPU, tout simplement ? la 8600M a beau être plus lente, tant qu'elle décharge le CPU c'est super, non ? Ou alors j'ai rien compris à l'avantage de l'openCL.
Parce que s'il faut un GPU plus rapide que le CPU ben on est pas sorti de l'auberge, avec les prochains CPU qui arrivent sur le marché :
"Sur un MacBook Pro Penryn doté d'une GeForce 8600M GT, le gain l'est beaucoup moins. Le GPU achève la tâche en 15,28 secondes alors que le processeur cadencé à 2,4 GHz l'effectue en 16,05 secondes."
HUM !
Plus que la vitesse de calcul GPU vs. CPU .... L'important n'est il pas que le programme soit capable de s'executer sur le GPU, tout simplement ? la 8600M a beau être plus lente, tant qu'elle décharge le CPU c'est super, non ? Ou alors j'ai rien compris à l'avantage de l'openCL.
Parce que s'il faut un GPU plus rapide que le CPU ben on est pas sorti de l'auberge, avec les prochains CPU qui arrivent sur le marché :
Liam128
[31/08/2009 01:20]
A vue de nez je dirais que la 8600 GT ne profite purement et simplement pas d'OpenCL... Il n'y a donc rien à "comprendre" sur les choix d'Apple. C'est pas parce que c'est lent sur 8600GT qu'Apple a fait son choix, mais parce qu'Apple a fait son choix que c'est lent sur une 8600GT.
Évidemment ya de quoi s'inquiéter d'un probable retour aux Intel GMA l'année prochaîne après des tests pareils. La 9400M en a dans le ventre, mine de rien.
A vue de nez je dirais que la 8600 GT ne profite purement et simplement pas d'OpenCL... Il n'y a donc rien à "comprendre" sur les choix d'Apple. C'est pas parce que c'est lent sur 8600GT qu'Apple a fait son choix, mais parce qu'Apple a fait son choix que c'est lent sur une 8600GT.
Évidemment ya de quoi s'inquiéter d'un probable retour aux Intel GMA l'année prochaîne après des tests pareils. La 9400M en a dans le ventre, mine de rien.
shirm
[31/08/2009 01:30]
Sur mon MacBook Alu Late 2008 (Core 2 Duo 2Ghz, NVidia 9400M 16 coeurs à 1.1GHz):
12.65 s sur GPU contre 25.517 s sur CPU.
Notoire donc.
Et comme l'a bien fait remarqué françois bayrou, quand bien même le gain ne serait pas significatif, cela libère le CPU de cette tache là, et il peut s'occuper d'autre chose pendant ce temps là. C'est déjà ça de pris ;)
L'algorithme (présenté dans le readme) est une addition vectorielle membre à membre:
c(i) = a(i) + b(i), le tout pour i allant de 0 à 4999.
Cet algo est assez "CPU friendly" (instructions SSE etc..) et j'ose espérer qu'il l'exécute plus d'une fois (voir meme plusieurs centaines de fois), parce que 25 secondes pour faire 5000 additions, ce serait un bond de 50 ans en arrière dans l'histoire de l'informatique!!!!
Bref, un test un peu plus complet serait le bienvenu (avec du calcul matriciel, si cher à l'image et la vidéo)!
(edit)
Je constate aussi un "freeze" général de 1 à 2 secondes au lancement du programme (compilation du programme à la volée???). Si ça freeze comme ça à chaque envoi de programme sur le GPU, ça risque d'être emm****. Ca donnerait un large avantage à Cuda qui lui, compile les kernels offline avec le reste du programme...
Sur mon MacBook Alu Late 2008 (Core 2 Duo 2Ghz, NVidia 9400M 16 coeurs à 1.1GHz):
12.65 s sur GPU contre 25.517 s sur CPU.
Notoire donc.
Et comme l'a bien fait remarqué françois bayrou, quand bien même le gain ne serait pas significatif, cela libère le CPU de cette tache là, et il peut s'occuper d'autre chose pendant ce temps là. C'est déjà ça de pris ;)
L'algorithme (présenté dans le readme) est une addition vectorielle membre à membre:
c(i) = a(i) + b(i), le tout pour i allant de 0 à 4999.
Cet algo est assez "CPU friendly" (instructions SSE etc..) et j'ose espérer qu'il l'exécute plus d'une fois (voir meme plusieurs centaines de fois), parce que 25 secondes pour faire 5000 additions, ce serait un bond de 50 ans en arrière dans l'histoire de l'informatique!!!!
Bref, un test un peu plus complet serait le bienvenu (avec du calcul matriciel, si cher à l'image et la vidéo)!
(edit)
Je constate aussi un "freeze" général de 1 à 2 secondes au lancement du programme (compilation du programme à la volée???). Si ça freeze comme ça à chaque envoi de programme sur le GPU, ça risque d'être emm****. Ca donnerait un large avantage à Cuda qui lui, compile les kernels offline avec le reste du programme...
RickDeckard
[31/08/2009 01:35]
Sur Macrumors, les 8600GT font des aussi bons scores que le reste, le bench de la news est foireux.
Sur mon MB Late 2K8 C2D 2,4
Number of OpenCL devices found: 2
OpenCL Device # 0 = GeForce 9400M
Device 0 is an: GPU with max. 1100 MHz and 16 units/cores
Now computing - please be patient....
time used: 3.493 seconds
OpenCL Device # 1 = Intel(R) Core(TM)2 Duo CPU P8600 @ 2.40GHz
Device 1 is an: CPU with max. 2400 MHz and 2 units/cores
Now computing - please be patient....
time used: 15.065 seconds
Sur Macrumors, les 8600GT font des aussi bons scores que le reste, le bench de la news est foireux.
Sur mon MB Late 2K8 C2D 2,4
Number of OpenCL devices found: 2
OpenCL Device # 0 = GeForce 9400M
Device 0 is an: GPU with max. 1100 MHz and 16 units/cores
Now computing - please be patient....
time used: 3.493 seconds
OpenCL Device # 1 = Intel(R) Core(TM)2 Duo CPU P8600 @ 2.40GHz
Device 1 is an: CPU with max. 2400 MHz and 2 units/cores
Now computing - please be patient....
time used: 15.065 seconds
shirm
[31/08/2009 01:49]
Quoi? Il y a une c****** dans le potage!
RickDeckard et moi avons la même GPU et les résultats varient du simple au quadruple!!!
Number of OpenCL devices found: 2
OpenCL Device # 0 = GeForce 9400M
Device 0 is an: GPU with max. 1100 MHz and 16 units/cores
Now computing - please be patient....
time used: 12.648 seconds
OpenCL Device # 1 = Intel(R) Core(TM)2 Duo CPU P7350 @ 2.00GHz
Device 1 is an: CPU with max. 2000 MHz and 2 units/cores
Now computing - please be patient....
time used: 24.028 seconds
Quoi? Il y a une c****** dans le potage!
RickDeckard et moi avons la même GPU et les résultats varient du simple au quadruple!!!
Number of OpenCL devices found: 2
OpenCL Device # 0 = GeForce 9400M
Device 0 is an: GPU with max. 1100 MHz and 16 units/cores
Now computing - please be patient....
time used: 12.648 seconds
OpenCL Device # 1 = Intel(R) Core(TM)2 Duo CPU P7350 @ 2.00GHz
Device 1 is an: CPU with max. 2000 MHz and 2 units/cores
Now computing - please be patient....
time used: 24.028 seconds
dipdip11
[31/08/2009 02:27]
...........................................................
.................. OpenCL Bench V 0.25 by mitch ...........
...... C2D 3GHz = 12 sec vs Nvidia 9600GT = 0,93 sec ......
... time results are not comparable to older version! .....
...........................................................
Number of OpenCL devices found: 2
OpenCL Device # 0 = GeForce 8800 GS
Device 0 is an: GPU with max. 1250 MHz and 64 units/cores
Now computing - please be patient....
time used: 0.933 seconds
OpenCL Device # 1 = Intel(R) Core(TM)2 Duo CPU E8435 @ 3.06GHz
Device 1 is an: CPU with max. 3060 MHz and 2 units/cores
Now computing - please be patient....
time used: 12.124 seconds
J'ai hâte qu'ils sortent des programme codés pour OpenCL ...
...........................................................
.................. OpenCL Bench V 0.25 by mitch ...........
...... C2D 3GHz = 12 sec vs Nvidia 9600GT = 0,93 sec ......
... time results are not comparable to older version! .....
...........................................................
Number of OpenCL devices found: 2
OpenCL Device # 0 = GeForce 8800 GS
Device 0 is an: GPU with max. 1250 MHz and 64 units/cores
Now computing - please be patient....
time used: 0.933 seconds
OpenCL Device # 1 = Intel(R) Core(TM)2 Duo CPU E8435 @ 3.06GHz
Device 1 is an: CPU with max. 3060 MHz and 2 units/cores
Now computing - please be patient....
time used: 12.124 seconds
J'ai hâte qu'ils sortent des programme codés pour OpenCL ...
jabial
[31/08/2009 02:42]
8600M = très bon résultat au contraire. La carte testée par le rédacteur n'aurait-elle pas un problème?
...........................................................
.................. OpenCL Bench V 0.25 by mitch ...........
...... C2D 3GHz = 12 sec vs Nvidia 9600GT = 0,93 sec ......
... time results are not comparable to older version! .....
...........................................................
Number of OpenCL devices found: 2
OpenCL Device # 0 = GeForce 8600M GT
Device 0 is an: GPU with max. 940 MHz and 32 units/cores
Now computing - please be patient....
time used: 2.953 seconds
OpenCL Device # 1 = Intel(R) Core(TM)2 Duo CPU T7700 @ 2.40GHz
Device 1 is an: CPU with max. 2400 MHz and 2 units/cores
Now computing - please be patient....
time used: 15.977 seconds
Now checking if results are valid - please be patient....
:) Validate test passed - GPU results=CPU results :)
logout
8600M = très bon résultat au contraire. La carte testée par le rédacteur n'aurait-elle pas un problème?
...........................................................
.................. OpenCL Bench V 0.25 by mitch ...........
...... C2D 3GHz = 12 sec vs Nvidia 9600GT = 0,93 sec ......
... time results are not comparable to older version! .....
...........................................................
Number of OpenCL devices found: 2
OpenCL Device # 0 = GeForce 8600M GT
Device 0 is an: GPU with max. 940 MHz and 32 units/cores
Now computing - please be patient....
time used: 2.953 seconds
OpenCL Device # 1 = Intel(R) Core(TM)2 Duo CPU T7700 @ 2.40GHz
Device 1 is an: CPU with max. 2400 MHz and 2 units/cores
Now computing - please be patient....
time used: 15.977 seconds
Now checking if results are valid - please be patient....
:) Validate test passed - GPU results=CPU results :)
logout
MrSoul
[31/08/2009 02:50]
Sur un machine ancienne c'est moins flagrant ?
J'ai un MacBook Pro avant Penryn (3,1) et c'est tout aussi flagrant :
Number of OpenCL devices found: 2
OpenCL Device # 0 = GeForce 8600M GT
Device 0 is an: GPU with max. 1040 MHz and 32 units/cores
Now computing - please be patient....
time used: 2.409 seconds
OpenCL Device # 1 = Intel(R) Core(TM)2 Duo CPU T7700 @ 2.40GHz
Device 1 is an: CPU with max. 2400 MHz and 2 units/cores
Now computing - please be patient....
time used: 16.441 seconds
Sur un machine ancienne c'est moins flagrant ?
J'ai un MacBook Pro avant Penryn (3,1) et c'est tout aussi flagrant :
Number of OpenCL devices found: 2
OpenCL Device # 0 = GeForce 8600M GT
Device 0 is an: GPU with max. 1040 MHz and 32 units/cores
Now computing - please be patient....
time used: 2.409 seconds
OpenCL Device # 1 = Intel(R) Core(TM)2 Duo CPU T7700 @ 2.40GHz
Device 1 is an: CPU with max. 2400 MHz and 2 units/cores
Now computing - please be patient....
time used: 16.441 seconds
Spart
[31/08/2009 05:25]
Sur un iMac 2,93 avec une ATI Radeon HD 4850
Number of OpenCL devices found: 2
OpenCL Device # 0 = Radeon HD 4850
Device 0 is an: GPU with max. 503 MHz and 4 units/cores
Now computing - please be patient....
time used: 6.221 seconds
OpenCL Device # 1 = Intel(R) Core(TM)2 Duo CPU E8335 @ 2.93GHz
Device 1 is an: CPU with max. 2930 MHz and 2 units/cores
Now computing - please be patient....
time used: 12.303 seconds
Tout ça ne me semble pas cohérent, mais bon. On verra bien
Sur un iMac 2,93 avec une ATI Radeon HD 4850
Number of OpenCL devices found: 2
OpenCL Device # 0 = Radeon HD 4850
Device 0 is an: GPU with max. 503 MHz and 4 units/cores
Now computing - please be patient....
time used: 6.221 seconds
OpenCL Device # 1 = Intel(R) Core(TM)2 Duo CPU E8335 @ 2.93GHz
Device 1 is an: CPU with max. 2930 MHz and 2 units/cores
Now computing - please be patient....
time used: 12.303 seconds
Tout ça ne me semble pas cohérent, mais bon. On verra bien
3
2
1
Réagir
Cinq consignes avant de réagir :
- Rester dans le cadre de la dépêche. Pour des discussions plus générales, vous pouvez utiliser nos forums.
- Développer son argumentation. Les messages dont le seul but est de mettre de l'huile sur le feu seront modifiés ou effacés sans préavis par la rédaction.
- Respecter les acteurs de l'informatique et les autres lecteurs. Les messages agressifs, vulgaires, haineux, etc. seront modifiés ou effacés sans préavis par la rédaction.
- Pour toute remarque concernant le contenu de l'article, pour nous signaler une erreur, une faute d'orthographe, une omission, merci de nous contacter exclusivement par e-mail.
- Relisez-vous, et pour les utilisateurs de Safari profitez de l'aide du navigateur : activez le menu édition > Orthographe > Vérifier l'orthographe lors de la frappe.





Février 2012