|
Тема |
Re: ОпенЦълъ [re: |] |
|
Автор |
gat3way (altered mind) |
|
Публикувано | 07.11.10 02:07 |
|
|
Самият модел няма как, трябва да се изпълнява два пъти, ако не - наистина ще стане като CPU. Но латентността при превключване на wavefront-овете може да се подобри.
Ммм от друга страна, на 4670 съм установил, че когато мога да избирам между бавен достъп до __global памет (lookup таблици в случая) и между branch-ване, второто работи по-бързо, колкото и да е странно. По-новите карти имат доста по-бърз достъп до паметта и сигурно е различно, но да - ако искат нещата да стават по същият начин, branch-ването винаги ще е лайняна работа.
EOF
|
| |
|
|
|