Skip to content

Instantly share code, notes, and snippets.

@sailfish009
Last active January 28, 2020 16:08
Show Gist options
  • Save sailfish009/0779b1cacc4e3f19b0185d7d24fab811 to your computer and use it in GitHub Desktop.
Save sailfish009/0779b1cacc4e3f19b0185d7d24fab811 to your computer and use it in GitHub Desktop.
메타 러닝과 뉴로 볼 루션
발렌티나 알토
2019 년 7 월 9 일
머신 러닝은 입력 데이터에 대한 통계 모델을 훈련하여 스스로 최적화하고 보이지 않는 새로운 데이터를 예측할 수 있도록하는 연구 분야입니다.
기본적으로 알고리즘은 데이터를 통해 배우도록 요청합니다.
그러나 알고리즘에 배우라고 요청하면 어떻게 배우는가? 이것은 메타 학습이 해결을 목표로하는 종류의 작업입니다.
ML의이 하위 필드의 핵심 아이디어는 원시 데이터를 제공하는 대신 알고리즘이 이전 알고리즘의 교육 과정에서 발생하는 메타
데이터를 입력으로 사용한다는 것입니다. 새로운 알고리즘이 목표로하는 것은 학습 프로세스를 캡처 한 다음 이전 알고리즘은 새로운
데이터로 일반화 하고 (첫 번째 알고리즘의 입력으로 사용 된 것과는 다른)이를 개선합니다.
나는 동사의 '일반화'를 자발적으로 강조했다. 모든 ML 작업에서 궁극적 인 목표는 예측 모델을 알려지지 않은 새로운 데이터에 적용하는 것임을
명심해야한다. 열차 세트에서 100 % 정확도를 얻을 수 있지만 예측값이 실제 값과 거리가 멀다면…
메타 학습은 무엇보다도 훈련 된 샘플 데이터로 인해 모델이 편향되는 것을 방지하는 것을 목표로합니다. 그러나 어떻게 구체적으로 그렇게합니까?
다윈의 진화론의 과정에 대해 생각해보십시오. 간단히 말하면, 생물학적 시스템이 대부분 '긍정적 특징'을 유지했기 때문에 새로운
세대의 생명체가 부모와 어떻게 다른지 보여줍니다. (구세대는 실패를 경험했기 때문에) '네거티브'를 대체했습니다.
Meta-Learning의 개념은 상당히 동일하며 Neuroevolution 알고리즘 (해당 분야에서 사용 된 알고리즘)에 대해 생각하면
이것이 정확히 작동하는 방식임을 알 수 있습니다.
실제로 전체 절차는 다음 그림으로 나타낼 수 있습니다.
여기에는 샘플 데이터에 대해 개별적이고 독립적으로 훈련 된 몇 가지 신경망이 있습니다. 각 단계를 살펴 보자.
우리는 무작위로 선택된 알고리즘을 초기화하는 것으로 시작합니다. 그들 중 일부는 정확하고 다른 일부는 다소 적을 수 있습니다.
그러나 이들 각각은 다른 (그리고 아마도 편향된) 데이터 집합에 대해 훈련되었습니다.
각 알고리즘은 목적 함수에 따라 점수 (피트니스 함수)를받습니다. 최고 점수를 나타내는 알고리즘 만이 새로운 환경에 유지됩니다.
그러나 일부 '빈약 한'알고리즘은 로컬 최대 값에 갇히지 않기 위해 유지 될 수 있습니다. 그들은 매우 다윈의 자연 선택에서 곧 사라질 것입니다.
마지막으로 최고의 알고리즘은 교차하는 기능과 무작위 변이로 생성 된 새로운 세대에 그대로 복제되어 더욱 강력한 모델을 만들 수 있습니다.
이 절차는 당신에게 친숙하게 들릴 것입니다 : 랜덤 포레스트는 같은 방식으로 작동하지 않습니까? 개별 알고리즘은 NN이 아니라 의사 결정 트리이지만
절차는 기본적으로 동일합니다.
더 일반적으로, Ensembling 방법은 약한 알고리즘의 조합에서 새롭고 더 강력한 모델을 얻을 수 있다는 아이디어를 기반으로합니다.
그럼에도 불구하고 Ensembling Method와 Meta-Learning 간에는 중요한 차이점이 있습니다. 전자는 일반적으로 동일한 버전의 동일한 버전
(즉, Decision Trees)을 결합하지만 후자는 서로 다른 알고리즘을 결합합니다.
새로운 최종 학습 방법은 최고의 신경망, 의사 결정 트리 또는 SVM 등의 결과 일뿐 아니라 모든 알고리즘 중에서 가장 좋은 학습 방법이며
모든 종류의 알고리즘에 적용 할 수 있습니다. 부모가 다른 알고리즘이기 때문에 데이터는 다른 입력 데이터에 대해 훈련되어 왔습니다.
비록 그 기술 뒤에있는 수학과 통계에 대해서는 다루지 않았지만이 새로운 분야의 잠재력을 강조하고 싶었습니다. 이것은 인공 지능의 다음 단계로 간주됩니다.
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment