Youngsoo Kim znxkznxk1030

중간고사 예상 문제

A goal-directed learning from interaction

$$ 딥러닝 \subset 머신러닝 \subset 인공지능$$3

인공지능은 인간처럼 사고하고 행동하는 기계를 만드는 기술 전반을 의미한다.

2025451021

인공지능학과

김영수

Entropy란 어떤 확률 변수에 대해 정보의 양을 측정하는 개념이다. 여기에서 정보는 불확실성을 의미하고 해당 확률 변수의 불확실성의 정도를 의미한다.

단어	원어	설명	표기
확률 변수	Random Variable, Stochastic Variable	측정 값이 변할 수 있는 확률이 주어진 변수	X
확률 분포	Probability Distribution	확률 변수가 특정한 값을 가질 학률을 나다내는 함수
기대값	Expected Value	어떤 확률을 가진 사건을 무한히 반복했을 경우 얻을 수 있는 값의 평균으로서 기대할 수 있는 값. 이산 확률 분포에서는 확률 질량 함수(PMF, Probability Mass Function), 연속 확률 분포에서는 확률 밀도 함수(PDF, Probability Density Function) 이다.	$E = \sum_x x f(x) \ E = \int_{-\infty}^{\infty} x f(x)$
평균값	Mean	확률/통계에서 기댓값을 (모)평균 (Population Mean)이라고도 부른다. 기대값 $\simeq$ 평균값	$E(X)$ 또는 $\mu$

	import random

	import numpy as np

	from visualize_train import draw_value_image, draw_policy_image

	# left, right, up, down
	ACTIONS = [np.array([0, -1]),
	np.array([0, 1]),
	np.array([-1, 0]),

	import numpy as np
	from numpy.linalg import inv
	from visualize_train import draw_value_image, draw_policy_image

	# left, right, up, down
	ACTIONS = [np.array([0, -1]),
	np.array([0, 1]),
	np.array([-1, 0]),
	np.array([1, 0])]

	"""Showcase of flying arrows that can stick to objects in a somewhat
	realistic looking way.
	"""

	import sys
	from typing import List

	import pygame

	import pymunk

	import torch
	from torch import initial_seed

	directs = [(1, 0), (-1, 0), (0, 1), (0, -1)] # [down, up, right, left]
	inf = int(1e9)

	def initialize_policy(width, height, terminals):
	policy = torch.full((height, width, 4), 0.0)
	for y in range(height):
	for x in range(width):