ShigekiKarita · December 11, 2017 17:42
diff --git a/gmm_gibbs_sampler.py b/gmm_gibbs_sampler.py
 %matplotlib notebook
 from matplotlib import pyplot
 import torch
 import math
 import numpy

 from torch.nn import Parameter, Module

 def dirichlet_log_pdf(pi, alpha):
    numel = torch.lgamma(alpha.sum(0)) + torch.sum(torch.log(pi) * (alpha - 1.0))
    denom = torch.sum(torch.lgamma(alpha))
    return numel - denom


 def normal_log_pdf(xs, means, cov):
    n_batch, n_dim = xs.size()
    n_component = means.size(0)
    assert isinstance(cov, float)
    xs_ms = xs.unsqueeze(1) - means.unsqueeze(0)
    coeff = - n_dim * math.log(2 * math.pi) - math.log(cov)
    xms = xs_ms.view(n_batch * n_component, n_dim, 1)
    pdfs = coeff + (-0.5 * xms.transpose(1, 2).bmm(xms) / cov)
    return pdfs.view(n_batch, n_component)


 class GMMSampler(Module):
    def __init__(self, n_dim, n_component):
        super().__init__()
        self.n_dim = n_dim
        self.n_component = n_component
        self.means = Parameter(torch.randn(n_component, n_dim))
        self.cov_of_mean = 1.0
        self.mean_of_mean = Parameter(torch.zeros(n_dim))
        self.log_prior = Parameter(torch.log(torch.ones(n_component) / n_component))

    def select_k(self, xs, ids, k):
        mask = ids == k
        mask = mask.expand(self.n_dim, xs.size(0)).transpose(0, 1)
        return torch.masked_select(xs, mask).view(-1, self.n_dim)

    def joint_prob(self, xs, ids):
        px = normal_log_pdf(xs, self.means.data, 1.0).exp()
        px_k = px[torch.arange(0, xs.size(0), out=xs.new().long()), ids]
        log_pxz = torch.sum(px_k.log() + self.log_prior.data.index_select(0, ids), dim=0)
        p_mean = normal_log_pdf(self.means.data,
                                self.mean_of_mean.data.unsqueeze(0),
                                self.cov_of_mean)
        log_p_mean = torch.sum(p_mean, dim=0)
        return (log_pxz + log_p_mean)[0]

    def sample(self, xs, n_iter=1):
        assert xs.size(1) == self.n_dim
        for i in range(n_iter):
            pdfs = normal_log_pdf(xs, self.means.data, 1.0).exp()
            pdfs /= pdfs.sum(dim=1, keepdim=True)
            component_ids = torch.multinomial(pdfs, 1).squeeze(1)
            for k in range(self.n_component):
                x_k = self.select_k(xs, component_ids, k)
                n_k = 0 if x_k.dim() == 0 else x_k.size(0)
                x_mean_k = torch.mean(x_k, dim=0)
                self.means.data[k] = torch.normal(n_k / (n_k + 1) * x_mean_k, 1.0 / (n_k + 1))
            print(self.joint_prob(xs, component_ids))

 def test_select_k_th():
    n_dim = 2
    gmm = GMMSampler(n_dim, 3)
    n_batch = 10
    xs = torch.randn(n_batch, n_dim)
    ids = torch.zeros(n_batch)
    ids[0] = 1
    ids[2] = 1
    ids[-1] = 1
    ys = gmm.select_k(xs, ids, 1)
    assert torch.equal(ys[0], xs[0])
    assert torch.equal(ys[1], xs[2])
    assert torch.equal(ys[2], xs[-1])

 test_select_k_th()

 use_cuda = False
 n = 10
 x1 = torch.randn(n, 2) + torch.FloatTensor([[0.0, 5.0]])
 x2 = torch.randn(n, 2) + torch.FloatTensor([[5.0, 0.0]])
 x3 = torch.randn(n, 2) + torch.FloatTensor([[0.0, -5.0]])
 for x in [x1, x2, x3]:
    pyplot.scatter(x[:, 0].numpy(), x[:, 1].numpy())

 xs = torch.cat([x1, x2, x3], dim=0)

 gmm = GMMSampler(2, 3)
 if use_cuda:
    gmm.cuda()
    xs = xs.cuda()
 gmm.sample(xs, 10)
 for m in gmm.means:
    pyplot.scatter(m[0], m[1])
	%matplotlib notebook
	from matplotlib import pyplot
	import torch
	import math
	import numpy

	from torch.nn import Parameter, Module

	def dirichlet_log_pdf(pi, alpha):
	numel = torch.lgamma(alpha.sum(0)) + torch.sum(torch.log(pi) * (alpha - 1.0))
	denom = torch.sum(torch.lgamma(alpha))
	return numel - denom


	def normal_log_pdf(xs, means, cov):
	n_batch, n_dim = xs.size()
	n_component = means.size(0)
	assert isinstance(cov, float)
	xs_ms = xs.unsqueeze(1) - means.unsqueeze(0)
	coeff = - n_dim * math.log(2 * math.pi) - math.log(cov)
	xms = xs_ms.view(n_batch * n_component, n_dim, 1)
	pdfs = coeff + (-0.5 * xms.transpose(1, 2).bmm(xms) / cov)
	return pdfs.view(n_batch, n_component)


	class GMMSampler(Module):
	def __init__(self, n_dim, n_component):
	super().__init__()
	self.n_dim = n_dim
	self.n_component = n_component
	self.means = Parameter(torch.randn(n_component, n_dim))
	self.cov_of_mean = 1.0
	self.mean_of_mean = Parameter(torch.zeros(n_dim))
	self.log_prior = Parameter(torch.log(torch.ones(n_component) / n_component))

	def select_k(self, xs, ids, k):
	mask = ids == k
	mask = mask.expand(self.n_dim, xs.size(0)).transpose(0, 1)
	return torch.masked_select(xs, mask).view(-1, self.n_dim)

	def joint_prob(self, xs, ids):
	px = normal_log_pdf(xs, self.means.data, 1.0).exp()
	px_k = px[torch.arange(0, xs.size(0), out=xs.new().long()), ids]
	log_pxz = torch.sum(px_k.log() + self.log_prior.data.index_select(0, ids), dim=0)
	p_mean = normal_log_pdf(self.means.data,
	self.mean_of_mean.data.unsqueeze(0),
	self.cov_of_mean)
	log_p_mean = torch.sum(p_mean, dim=0)
	return (log_pxz + log_p_mean)[0]

	def sample(self, xs, n_iter=1):
	assert xs.size(1) == self.n_dim
	for i in range(n_iter):
	pdfs = normal_log_pdf(xs, self.means.data, 1.0).exp()
	pdfs /= pdfs.sum(dim=1, keepdim=True)
	component_ids = torch.multinomial(pdfs, 1).squeeze(1)
	for k in range(self.n_component):
	x_k = self.select_k(xs, component_ids, k)
	n_k = 0 if x_k.dim() == 0 else x_k.size(0)
	x_mean_k = torch.mean(x_k, dim=0)
	self.means.data[k] = torch.normal(n_k / (n_k + 1) * x_mean_k, 1.0 / (n_k + 1))
	print(self.joint_prob(xs, component_ids))

	def test_select_k_th():
	n_dim = 2
	gmm = GMMSampler(n_dim, 3)
	n_batch = 10
	xs = torch.randn(n_batch, n_dim)
	ids = torch.zeros(n_batch)
	ids[0] = 1
	ids[2] = 1
	ids[-1] = 1
	ys = gmm.select_k(xs, ids, 1)
	assert torch.equal(ys[0], xs[0])
	assert torch.equal(ys[1], xs[2])
	assert torch.equal(ys[2], xs[-1])

	test_select_k_th()

	use_cuda = False
	n = 10
	x1 = torch.randn(n, 2) + torch.FloatTensor([[0.0, 5.0]])
	x2 = torch.randn(n, 2) + torch.FloatTensor([[5.0, 0.0]])
	x3 = torch.randn(n, 2) + torch.FloatTensor([[0.0, -5.0]])
	for x in [x1, x2, x3]:
	pyplot.scatter(x[:, 0].numpy(), x[:, 1].numpy())

	xs = torch.cat([x1, x2, x3], dim=0)

	gmm = GMMSampler(2, 3)
	if use_cuda:
	gmm.cuda()
	xs = xs.cuda()
	gmm.sample(xs, 10)
	for m in gmm.means:
	pyplot.scatter(m[0], m[1])
No results found