침착하게 하세요.

세상의 대부분 일은 순조롭지 못하다.약간의 소음과 교란으로 원활하게 진행되지 못하는 경우가 많다.

1. 최소 2승법이 아닌 RANSAC을 사용한다.


함수의 조합은 최소 2승법으로 고등학교 수학에서 유명하지만 제 경험에는 최소 2승법이 업무를 감당할 수 있는 수준에 이르지 못했습니다.
우선, 최소 2승법은 소음으로 인해 편차치의 영향을 너무 많이 받는다.따라서 입력 데이터 그룹을 그릴 때 편차 값으로 여겨지는 것은 의도적으로 배제되고 자로 다시 선을 그릴 때가 있다.
자동화를 원할 때 나는 우선 최소 2승법을 사용할 수 없다고 생각한다.그 대신 써야할 수법은 RANSAC이다.RANSAC은 오디션뿐만 아니라 입체 이미지의 대응점 매칭 등 다른 다양한 용도로도 활용된다.
  • Wikipedia RANSAC(Random sample consensus)
  • scikit-learn Robust linear model estimation using RANSAC

  • qiita [배워 보았습니다] RANSAC 사연.
  • scikit-image Robust matching using RANSAC
  • keypoint matching; RANSAC 사용 예OpenCV panorama stitching
  • 2. 기계 학습은 일반 성능을 중시해야 한다.


    배운 데이터의 성능만 좋지만 배우지 않은 데이터는 순조롭게 진행되지 못할 수도 있다.
    범화 성능이 있는지 자주 주의하여 기계 학습 성능의 테스트를 진행하세요.
    자유도가 높은 모델보다 자유도가 낮은 모델이 더 좋은 결과를 얻을 수 있다.
    qiita 기계 학습 성능을 정확하게 평가하는 검증 방법
    "저 모형 정밀도가 너무 높은 거 아니에요?"학습, 범용 성능, 교차 검증을 거친 화제

    3. 다변량 분석에서도 변수의 수량을 너무 많이 설명하지 않는 것이 좋다.


    간단하게 말하면'변수가 연관된 파라미터를 사용할 수 없다는 것을 설명한다'는 것이다.
    데이터를 분석할 때 키와 몸무게는 설명 변수로 삼을 수 없다.키와BMI면 사용 가능합니다.
    변수의 수량이 너무 많다는 것은 변수가 관련 조합을 포함한다는 것을 의미한다.
    다변량 분석에서의 이러한 지식은 기계 학습 데이터에 대한 예처리로서도 유용한 지식을 포함하고 있다.
     

    4. 제어할 때 방해받지 않는 제어 방식을 사용한다.


    통제에 있어서는 항상 외란이 발생하는 것을 전제로 일을 고려해야 한다.센서의 점검(전압 레벨 전환 임계값 수준 시 빈번하고 짧은 시간에 ON/OFF를 반복하는 현상) 대책도 그중 하나다.
    신호선을 사용할 때도 반드시 신호선이 끊어지는 것을 고려해야 한다.
    센서의 특성도 일괄적으로 편차가 있을 가능성을 고려해야 한다.
    시뮬레이션 신호의 경우 측정 대상 이외의 소음을 혼입하는 것을 고려해야 한다.
    카메라 이미지의 경우 이득을 최대한 높여 누적 시간을 늘릴 때는 암전류의 성질을 고려해야 한다.
     
    제어를 목적으로 할 때 제어 실패를 초래하는 여러 가지 요소를 고려하여 순조롭게 제어할 수 있는 방식과 파라미터를 선택한다.(리모컨이 순조롭게 진행되는 것은 디자이너가 이미 우리를 위해 이런 일을 했기 때문이다.)
    제어 시스템의 모델은 실제 시스템의 값과 달리 크거나 작은 오차가 있다.이 오차는 시스템의 동작에 대해 시스템상의 오차를 일으킬 수 있다.
    "제어 대상과 모델 사이의 오차가 제어 시스템 설계에 중대한 문제를 일으킨다. 앞의 예에서 시간 낭비 요소를 소홀히 하는 것은 오차의 원인이지만 다른 여러 가지 원인으로 인해 제어 대상과 모델 사이에 오차가 발생한다. 이런 오차는'모델의 불확실성'또는'모델링 오차'이다.”"루팡 제어 시스템 설계 입문"
    ・모델 집합에 포함된 모든 전달 함수에 대해 폐쇄 시스템을 안정적(안정적이고 안정적)으로 하고 가능한 한 고성능을 실현한다
    ・특히 피드백 보상기에 대해 방해의 영향을 제거하고 모델링 오차의 영향을 줄여야 한다.
    이런 구조를 채택함으로써 노봉의 통제를 실현할 수 있다.
    피드백이 없으면 안정적으로 제어할 수 없다.
    또한 회로 안정 증폭기증폭기의 반전 증폭 회로를 연산하다는 피드백도 포함하여 일정한 증폭률을 실현할 수 있다.
    연산 증폭기 회로의 기본 설계 방법

    5. 소음과 방해의 영향을 받지 않는 시스템 설계를 한다.


    이런 방식이 계속 순조롭게 진행될 것이라고 믿지 마라."이런 방식은 △△이럴 때는 제대로 할 수 없는 한계가 있다는 것을 잘 알고 있다. 따라서 ○○이런 방식은 100% 순조롭게 진행되는 전제에서 시스템을 설계하지 않는다. 그러나 □범위 내에서는 □□확실하기 때문에 □□□□□□을 사용하면 문제를 피할 수 있다."따라서 그 문제에 대해 상세한 사람은 말하고자 하는 내용을 주의하세요.
    '□ 범위 내 ▲ 일은 확실하다' 범위 내에서 목적을 충분히 달성하기 위해 상위 방면의 설계를 해야 한다.
    매사에 외란을 피할 수 없다.그때라도 잘해야 돼.
    이 글의 목적은 강인한 방법의 필요성을 논술하는 것이며, 각 분야에서 어떤 방법을 취해야 하는지에 대해서는 별도로 조사해 주십시오.

    추기(2019.6.11)


    평균을 사용하지 않습니다.중간값을 사용합니다.


    낮은 수치는 한계가 있고 높은 수치의 분포는 한계가 없는 통계량이라면 평균치는 소수의 수치가 높은 데이터에 의해 끌릴 수 있다.
    이 그룹의 특성을 나타내는 데이터는 평균치보다 중앙치를 사용하는 것이 좋다.
    소득의 분포와 금융자산의 분포 등이 이런 예죠.이런 통계에서 평균치는 중앙치보다 높은 경향이 있다.
    ■ 가구 평균소득 약 560만엔...가구당 평균소득 탐색

    최대값과 최소값을 사용하지 않습니다.백분율 또는 95퍼센트를 사용합니다.


    최대치와 최소치는 모두 노봉성이 결여된 지표다.그에 비해 5개의 구역 값이나 95개의 구역 값을 사용하면 편차 값의 영향을 받기 쉽다.

    기계 학습을 전부 의뢰할 수는 없다.선견지명이 있는 지식도 활용해야 한다


    매일 기계 학습, 심층 학습이 만능이라고 말하지만, 기계 학습과 심층 학습은 이전의 선험 지식이 무의미하다고 말하는 것은 아니다.
    경험에 따라 충분히 확인할 수 있는 규칙이 있을 때는 그것을 안전하게 확인하고 이용하는 방법이 있다.
    기계 학습과 심층 학습은 학습 데이터에 의존한다.따라서 학습 데이터가 적은 분야에서는 학습 정밀도가 떨어지기 쉽다.(예: 검은 양을 양으로 판정하기는 어렵다. 양의 학습 데이터에 검은 양의 데이터가 먼저 포함되지 않는다. 검은 양의 이미지가 수차례 들어갔지만 검은 양과 양이 함께 공부할 수 없다예제 기계학습 시스템을 사용해도경험적인 수법은 정밀도와 처리 속도를 얻을 수 있는 분야로 그 이전부터 시작된 수법을 사용할 수 있을 것이다.
    기존의 방법으로 착수할 수 없는 분야에서 지금보다 더 좋은 판단을 할 수 있다면 기계학습, 심층학습은 가치가 있다.

    좋은 웹페이지 즐겨찾기