시각 slam 상용 핵심 알고리즘 빠 른 입문
4595 단어 알고리즘
레이저 레이 더 를 바탕 으로 하 는 2D SLAM 은 상대 적 으로 성숙 하 다. 2005 년 에 Sebastian Thrun 등의 명작 인 는 2D SLAM 연구 와 정 리 를 매우 투철 하 게 하여 레이저 레이더 SLAM 의 구 조 를 대체적으로 확정 했다.현재 상용 되 는 Grid Mapping 방법 도 10 여 년 의 역 사 를 가지 고 있다.2016 년 에 구 글 은 레이저 레이더 SLAM 프로그램 인 Cartographer 를 개 원 했 는데 IMU 정 보 를 융합 시 켜 2D 와 3D SLAM 을 통일 적 으로 처리 할 수 있다.현재 2D SLAM 은 청소 로봇 에 성공 적 으로 적용 되 고 있다.
RGBD 카메라
딥 카 메 라 를 기반 으로 한 RGBD SLAM 도 지난 몇 년 간 급성 장 했다.마이크로소프트 의 Kinect 출시 이후 RGBD SLAM 의 연구 열풍 이 일 었 고 짧 은 몇 년 동안 몇 가지 중요 한 알고리즘 이 연이어 나 타 났 다. 예 를 들 어 KinectFusion, Kintinuous, Voxel Hashing, DynamicFusion 등 이다.마이크로소프트 의 Hololens 는 RGBD SLAM 을 통합 하여 깊이 센서 가 작 동 할 수 있 는 장소 에서 매우 좋 은 효 과 를 거 둘 수 있 을 것 이다.
vSLAM
시각 센서 는 단목 카메라, 쌍 안 카메라, 어 안 카메라 등 을 포함한다.시각 센서 의 가격 이 저렴 하고 실내 실외 에서 모두 사용 할 수 있 기 때문에 vVLAM 은 연구 의 큰 이 슈 이다.초기 vVLAM, 예 를 들 어 monoSLAM 은 로봇 분 야 를 이 어 가 는 필터 방법 이 더 많 았 다.현재 더 많은 것 을 사용 하 는 것 은 컴퓨터 시각 분야 의 최적화 방법 이다. 구체 적 으로 말 하면 운동 회복 구조 (structure - from - motion) 중의 광속 법 평 차 (bundle adjustment) 이다.vVLAM 에 서 는 시각 적 특징의 추출 방식 에 따라 특징 법, 직접 법 으로 나 눌 수 있다.현재 vSRAM 의 대표 알고리즘 은 ORB - SLAM, SVO, DSO 등 이 있 습 니 다.
VIO
시각 센서 는 무늬 가 없 는 지역 에 대해 일 을 할 방법 이 없다.관성 측정 장치 (IMU) 는 내 장 된 자 이 로 와 가속도 계 를 통 해 각 속도 와 가속 도 를 측정 해 카메라 의 자 세 를 추산 할 수 있 으 나 추 산 된 자 세 는 누적 오차 가 있다.시각 센서 와 IMU 는 상호 보완 성 이 크기 때문에 양자 측정 정 보 를 융합 한 VIO 도 연구 이 슈 다.정보 융합 방식 에 따라 VIO 는 필 터 를 바탕 으로 하 는 방법, 최적화 에 기반 한 방법 으로 나 눌 수 있다.VIO 의 대표 알고리즘 은 EKF, MSCKF, preintegration, OKVIS 등 이 있다.구 글 의 탱고 태 블 릿 은 효과 가 좋 은 VIO 를 실현 했다.
일반적인 특징 점 추출 알고리즘
흔히 볼 수 있 는 특징 점 추출 알고리즘. 성능 은 대체로 SIFT > SURF > ORB > FAST 라 고 볼 수 있 으 며, 효율 적 으로 FAST > ORB > SURF > SIFT (번호 왼쪽 보다 큰 것 이 더 우수 하 다 고 볼 수 있다. 성능 은 주로 정밀도, 특징 점 의 수량 과 공간 분포 등 을 포함한다).성능 과 효율 성 을 절충 하기 위해 서 는 보통 FAST 나 ORB 를 사용 하 며, 성능 이 더 좋 은 SIFT, SURF 등 을 버 릴 수 밖 에 없다.
일치 점 의 이미지 좌표 와 공간 좌표 간 의 관 계 는 비 선형 이다. 예 를 들 어 2D - 2D 점 의 대응 은 극 기하학, 2D - 3D 점 에 대한 대응 을 만족 시 키 고 PnP 제약 을 만족시킨다.이런 매 칭 수량 이 비교적 많 고 앞 뒤 두 프레임 의 이미지 에는 보통 몇 십 에서 수백 의 매 칭 이 있다.이러한 매 칭 은 많은 제약 관 계 를 도입 하여 예상 변수의 관 계 를 복잡 하 게 만 들 것 이다.비교적 좋 은 평 가 를 얻 기 위해 서 는 보통 최적화 문 제 를 구축 하고 전체적으로 여러 변 수 를 최적화 해 야 한다.말하자면 이것 은 비 선형 최소 2 곱 하기 최적화 문제 일 뿐만 아니 라 실현 하기 가 쉽 지 않다. 비 선형 제약 이 존재 하고 제약 수량 이 많 으 며 오차 와 야 치 점 이 존재 하 며 계산 시간 을 허용 범위 에서 통제 해 야 하기 때문이다.현재 관건 적 인 프레임 기술 을 광범 위 하 게 사용 하고 많은 방법 을 통 해 문제 의 규 모 를 통제 하고 문제 의 희소 성 을 유지 하 는 등 이다.
vSRAM 의 핵심 알고리즘
예비 단 계 는 센서 의 선택 과 각종 표 시 를 포함한다.Visual SLAM 은 PTAM 알고리즘 이후 프레임 워 크 가 기본적으로 고정 되 어 있다.보통 3 개의 스 레 드, 전단 tracking 스 레 드, 백 엔 드 mapping 최적화 스 레 드, 폐쇄 검사 (loop closure) 스 레 드 를 포함 합 니 다.전단 tracking 스 레 드 는 주로 특징의 추출, 특징의 일치 와 관련된다.다 중 보기 기하학 적 지식 은 극 기하학, PnP, 강체 운동, 이대 수 등 을 포함한다.백 엔 드 최적화 스 레 드 는 비 선형 최소 2 곱 하기 최적화 와 관련 되 고 수치 최적화 내용 에 속한다.폐쇄 적 인 검 측 스 레 드 는 장소 인식 과 관련 되 고 본질 적 으로 이미지 검색 문제 이다.VIO 에 대해 서 는 필터 링 알고리즘, 상태 추정 등 도 다 루 고 있다.SLAM 알고리즘 을 분해 해 보 니 사용 하 는 기술 은 전통 적 인 편 이다.현재 핫 한 딥 러 닝 '블랙 박스 모델' 과 달리 SLAM 의 각 부분 은 기본적으로 화이트 박스 로 매우 명확 하 게 설명 할 수 있다.그러나 SLAM 알고리즘 은 상기 각종 알고리즘 의 간단 한 중첩 이 아니 라 시스템 공학 으로 그 안에 tradeoff 가 많다.오픈 소스 프로그램 만 뛰 면 핵심 경 쟁 력 이 없다.제품 을 만 들 든 학술 연 구 를 하 든 각종 기술 을 익 혀 야 창조 할 수 있다.
SLAM 의 미래 발전 추세
VSLAM 의 발전 감각 은 중간 정도 이 고 각 부분 은 앞 사람 을 바탕 으로 조금씩 최적화 되 는 동시에 다른 방향의 최신 성 과 를 계속 흡수 하 는 것 이다.당분간 은 기 존 틀 에서 끊임없이 개선 할 것 이다.장기 적 인 추세 에 대해 IEEE TRO 2016 은 Past, present, and future of SLAM: towards the robust - perception age 를 종합 적 으로 서술 한 글 이 있다.몇몇 명망 있 는 학자 들 은 문장에서 SLAM 의 추세 에 대해 매우 좋 은 총 결 을 하 였 다.여 기 는 단지 자신 이 흥 미 를 느끼 는 점 에 대해 개인 적 인 소감 을 말 할 뿐이다.신형 센서 의 출현 은 끊임없이 SLAM 에 활력 을 불 어 넣 을 것 이다.만약 우리 가 고 품질의 원시 정 보 를 직접 얻 을 수 있다 면 SLAM 의 연산 압력 은 매우 줄 어 들 수 있 을 것 이다.예 를 들 어 최근 몇 년 동안 SLAM 에서 낮은 전력 소모 와 높 은 프레임 율 을 사용 하 는 이벤트 카메라 (dynamic vision system, DVS 라 고도 부른다) 가 점차적으로 사용 되 고 있다.이런 센서 의 원가 가 떨 어 지면 SLAM 의 기술 구조 에 많은 변 화 를 가 져 올 것 이다.깊이 있 는 학습 이 여러 분야 에서 무 너 지면 서 많은 연구자 들 이 깊이 있 는 학습 에서 end - to - end 의 사상 으로 SLAM 의 절 차 를 재 구성 하려 고 한다.현재 일부 업 무 는 SLAM 의 일부 부분 을 심도 있 는 학습 으로 대체 하려 고 한다.그러나 이런 방법 들 은 압도 적 인 우 위 를 나타 내지 못 했 고 전통 적 인 기하학 적 방법 은 여전히 주류 이다.딥 러 닝 열풍 속 에서 SLAM 이 다 루 는 각 부분 은 딥 러 닝 의 성 과 를 점차 흡수 하고 정밀도 와 노 스틱 성도 높 아 질 것 으로 보인다.아마도 앞으로 SLAM 의 일부 부분 은 전체적으로 심도 있 는 학습 으로 대체 되 어 새로운 틀 을 형성 할 것 이다.SLAM 은 원래 환경의 기하학 적 정보 에 만 관심 을 가지 고 있 었 기 때문에 미래 와 의미 정보 가 더 많이 결합 되 어야 한다.깊이 있 는 학습 기술 을 통 해 현재 의 물체 검 측, 의미 분할 기술 의 발전 이 빠 르 고 이미지 에서 풍부 한 의미 정 보 를 얻 을 수 있다.이러한 의미 정 보 는 기하학 적 정 보 를 보조 적 으로 추정 할 수 있다. 예 를 들 어 이미 알 고 있 는 물체 의 사 이 즈 는 중요 한 기하학 적 단서 이다.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
【Codility Lesson3】FrogJmpA small frog wants to get to the other side of the road. The frog is currently located at position X and wants to get to...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.