jones2126 · November 25, 2025 14:19
diff --git a/utube_transcript_readme.md b/utube_transcript_readme.md
diff --git a/youtube_transcript_download.py b/youtube_transcript_download.py
 #  youtube_transcript_download.py
    
 from youtube_transcript_api import YouTubeTranscriptApi
 import yt_dlp  # New import for metadata

 def get_transcript(video_url, include_timestamps=False):
    """
    Download transcript from a YouTube video, with optional title.
   
    Args:
        video_url: Full YouTube URL
        include_timestamps: If True, include [MM:SS] timestamps (default: False)
   
    Returns:
        Transcript as a string (with title header if available)
    """
    # Extract video ID from URL
    video_id = video_url.split("v=")[1].split("&")[0]
   
    # Fetch title using yt-dlp
    title = None
    try:
        ydl_opts = {'quiet': True}  # Minimal output
        with yt_dlp.YoutubeDL(ydl_opts) as ydl:
            info = ydl.extract_info(video_url, download=False)
            title = info.get('title', 'Unknown Title')
    except Exception as e:
        print(f"Warning: Could not fetch title: {e}")
        title = 'Unknown Title'
   
    # Fetch transcript
    ytt_api = YouTubeTranscriptApi()
    # transcript = ytt_api.fetch(video_id)

    try:
        transcript = ytt_api.fetch(video_id)
    except Exception as e:  # Or specifically TranscriptsDisabled, NoTranscriptFound
        return f"Error fetching transcript: {e}"

    if include_timestamps:
        lines = []
        for snippet in transcript.snippets:
            mins, secs = divmod(int(snippet.start), 60)
            timestamp = f"[{mins:02d}:{secs:02d}]"
            lines.append(f"{timestamp} {snippet.text}")
        full_text = "\n".join(lines)
    else:
        full_text = "\n".join([snippet.text for snippet in transcript.snippets])
   
    # Prepend title as header
    full_text_with_title = f"Title: {title}\n\n{full_text}"
   
    return full_text_with_title, video_id

 # === CONFIGURATION ===
 # url = "https://www.youtube.com/watch?v=eRhw-TYEKy4"
 url = "https://www.youtube.com/watch?v=kE3hPpAanXg"

 include_timestamps = False

 # === RUN ===
 text, video_id = get_transcript(url, include_timestamps)
 print(text)

 # Save to file
 filename = f"{video_id}_transcript.txt"
 with open(filename, "w", encoding="utf-8") as f:
    f.write(text)
    print(f"\nSaved to {filename}")
	# youtube_transcript_download.py

	from youtube_transcript_api import YouTubeTranscriptApi
	import yt_dlp # New import for metadata

	def get_transcript(video_url, include_timestamps=False):
	"""
	Download transcript from a YouTube video, with optional title.

	Args:
	video_url: Full YouTube URL
	include_timestamps: If True, include [MM:SS] timestamps (default: False)

	Returns:
	Transcript as a string (with title header if available)
	"""
	# Extract video ID from URL
	video_id = video_url.split("v=")[1].split("&")[0]

	# Fetch title using yt-dlp
	title = None
	try:
	ydl_opts = {'quiet': True} # Minimal output
	with yt_dlp.YoutubeDL(ydl_opts) as ydl:
	info = ydl.extract_info(video_url, download=False)
	title = info.get('title', 'Unknown Title')
	except Exception as e:
	print(f"Warning: Could not fetch title: {e}")
	title = 'Unknown Title'

	# Fetch transcript
	ytt_api = YouTubeTranscriptApi()
	# transcript = ytt_api.fetch(video_id)

	try:
	transcript = ytt_api.fetch(video_id)
	except Exception as e: # Or specifically TranscriptsDisabled, NoTranscriptFound
	return f"Error fetching transcript: {e}"

	if include_timestamps:
	lines = []
	for snippet in transcript.snippets:
	mins, secs = divmod(int(snippet.start), 60)
	timestamp = f"[{mins:02d}:{secs:02d}]"
	lines.append(f"{timestamp} {snippet.text}")
	full_text = "\n".join(lines)
	else:
	full_text = "\n".join([snippet.text for snippet in transcript.snippets])

	# Prepend title as header
	full_text_with_title = f"Title: {title}\n\n{full_text}"

	return full_text_with_title, video_id

	# === CONFIGURATION ===
	# url = "https://www.youtube.com/watch?v=eRhw-TYEKy4"
	url = "https://www.youtube.com/watch?v=kE3hPpAanXg"

	include_timestamps = False

	# === RUN ===
	text, video_id = get_transcript(url, include_timestamps)
	print(text)

	# Save to file
	filename = f"{video_id}_transcript.txt"
	with open(filename, "w", encoding="utf-8") as f:
	f.write(text)
	print(f"\nSaved to {filename}")
No results found