VEX(SIMD) VS OPENCL(GPU&CPU)

3230 단어 HOUDINI
Houdini의 실행 처리에 대해 다양한 RnD 할 기회가 있었기 때문에
조금 공유하고 싶습니다.

실행 환경은 ...
우분투 16.04 LTS
Houdini16.0.633

VEX(SIMD) VS OPENCL(GPU&CPU)

이번에는 Sphere를 움직이는 처리를 테스트하고 싶습니다.
Test_Hip 파일도 이번에는 공유합니다.

내용은 이런 느낌이 되고 있습니다.



SIMD나 병렬/병행 처리에 조금 익숙해 왔기 때문에..조금 비교해 보아~라고 생각했습니다.

sin,cos로 원운동을 간단하게 구현시킨 것을 각각 50f M_Play로 내보냅니다.

GPU 프로그래머 분들의 출력을 보면 ...
CL의 성능을 체험할 수 있는 것은
조건에 따라 상당히 달라질 것입니다 ...
프로그램에 따라 꽤 바뀌는 것 같습니다.

앞으로 RnD하는 목표를 정확하게 만드는 목적도 있습니다.
이번 tips를 썼습니다.

OpenCL은 ...
: CPU
: GPU
각각 비교해 보았습니다.

OPEN_CL_TYPE = CPU



: CPU_VEX (wrangle)


Total : 16.298s
Viewport : 15.746s
Node : 0.552s

: CPU OPEN_CL


Total:16.145s
Viewport :14.189s
Node : 1.956s

: CPU_Compiled OPEN_CL


Total : 17.188s
Viewport : 14.180s
Node : 3.008s

OPEN_CL_TYPE = GPU



:GPU_VEX(wrangle)


Total:14.866s
Viewport :14.331s
Node : 0.534s

: GPU OPEN_CL


Total:16.280s
Viewport :14.611s
Node : 1.669s

: GPU_Compiled OPEN_CL


Total:15.954s
Viewport :14.265s
Node : 1.688s

ViewCock이 불안정하고별로 도움이되지 않지만
NodeCock에 주목해보십시오.

정리해 보겠습니다.

50fps Anim_NodeCock

: CPU
VEX - 0.552s
OpenCL - 1.956s
Comed OpenCL - 3.008s

: GPU
VEX - 0.534s
OpenCL - 1.669s
Comed OpenCL - 1.688s

VEX (SIMD) 강합니다.
실행 환경, PC 사양
내 자신의 커널 프로그램이 안 될지도 모르지만 ...

결과만 보면
Main 오퍼레이션은 SIMD가 베스트라는 결론이 되네요 www

병렬/병렬 처리를 잘 사용하려면
모델, 실행 환경, 프로그램이 잘 얽히지 않으면 성능이 잘 나오지 않습니다 ...

OpenCL의 MasterClass가 좀처럼 나오지 않는 이유를 알게 된 것 같습니다.

어렵습니다.

좋은 웹페이지 즐겨찾기