VEX(SIMD) VS OPENCL(GPU&CPU)
3230 단어 HOUDINI
조금 공유하고 싶습니다.
실행 환경은 ...
우분투 16.04 LTS
Houdini16.0.633
VEX(SIMD) VS OPENCL(GPU&CPU)
이번에는 Sphere를 움직이는 처리를 테스트하고 싶습니다.
Test_Hip 파일도 이번에는 공유합니다.
내용은 이런 느낌이 되고 있습니다.
SIMD나 병렬/병행 처리에 조금 익숙해 왔기 때문에..조금 비교해 보아~라고 생각했습니다.
sin,cos로 원운동을 간단하게 구현시킨 것을 각각 50f M_Play로 내보냅니다.
GPU 프로그래머 분들의 출력을 보면 ...
CL의 성능을 체험할 수 있는 것은
조건에 따라 상당히 달라질 것입니다 ...
프로그램에 따라 꽤 바뀌는 것 같습니다.
앞으로 RnD하는 목표를 정확하게 만드는 목적도 있습니다.
이번 tips를 썼습니다.
OpenCL은 ...
: CPU
: GPU
각각 비교해 보았습니다.
OPEN_CL_TYPE = CPU
: CPU_VEX (wrangle)
Total : 16.298s
Viewport : 15.746s
Node : 0.552s
: CPU OPEN_CL
Total:16.145s
Viewport :14.189s
Node : 1.956s
: CPU_Compiled OPEN_CL
Total : 17.188s
Viewport : 14.180s
Node : 3.008s
OPEN_CL_TYPE = GPU
:GPU_VEX(wrangle)
Total:14.866s
Viewport :14.331s
Node : 0.534s
: GPU OPEN_CL
Total:16.280s
Viewport :14.611s
Node : 1.669s
: GPU_Compiled OPEN_CL
Total:15.954s
Viewport :14.265s
Node : 1.688s
ViewCock이 불안정하고별로 도움이되지 않지만
NodeCock에 주목해보십시오.
정리해 보겠습니다.
50fps Anim_NodeCock
: CPU
VEX - 0.552s
OpenCL - 1.956s
Comed OpenCL - 3.008s
: GPU
VEX - 0.534s
OpenCL - 1.669s
Comed OpenCL - 1.688s
VEX (SIMD) 강합니다.
실행 환경, PC 사양
내 자신의 커널 프로그램이 안 될지도 모르지만 ...
결과만 보면
Main 오퍼레이션은 SIMD가 베스트라는 결론이 되네요 www
병렬/병렬 처리를 잘 사용하려면
모델, 실행 환경, 프로그램이 잘 얽히지 않으면 성능이 잘 나오지 않습니다 ...
OpenCL의 MasterClass가 좀처럼 나오지 않는 이유를 알게 된 것 같습니다.
어렵습니다.
Reference
이 문제에 관하여(VEX(SIMD) VS OPENCL(GPU&CPU)), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/ts_bros/items/cf87fb9ffa26d12ccf74텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)