Công nghệ tổng hợp tiếng nói, thường được gọi là chuyển văn bản thành tiếng nói, đã phát triển nhanh chóng trong những năm qua. Tuy nhiên, để xây dựng một hệ thống tổng hợp giọng nói của một người cần chi phí rất lớn. Voice cloning là một kĩ thuật giải quyết vấn đề trên, có thể tổng hợp tiếng nói của một người bất kỳ chỉ với 5 - 10 câu thu âm giọng người đó.
Nhóm đã tìm hiểu và tái hiện lại một công trình nghiên cứu về Voice Cloning. Để ứng dụng mô hình, nhóm đã xây dựng một hệ thống web cho người dùng tổng hợp văn bản, cụ thể là truyện cổ tích để đọc cho trẻ em. Qua dự án này, nhóm đã tìm hiểu được cách cấu trúc một dự án AI cũng như cách tương tác với mô