indiejoseph’s gists

indiejoseph / yale_to_jyutping.py

Created January 27, 2026 15:00

indiejoseph / svs.py

Created October 25, 2025 20:48

	from glob import glob
	import os
	import argparse
	from tqdm import tqdm
	from pathlib import Path
	from PolUVR.separator import Separator
	import torch

	separator1 = None
	separator2 = None

indiejoseph / yt.py

Created July 7, 2025 15:11

Youtube API client

	from dataclasses import dataclass
	import yt_dlp
	import librosa
	import xml.etree.ElementTree as ET
	import asyncio
	from typing import List, Optional, Dict, Any
	import httpx
	import logging
	import subprocess
	import os

indiejoseph / prompt

Created June 26, 2025 08:15

	分析以下幾篇文章內容，以分析員角度分析，歸納成一份學術性文章。

	- 畀出主題、主體同概念
	- 必須用廣東話書寫
	- 為主體人物或概念提供簡介
	- 為主題作總結

	文章內容：

	# 香港電影業新聞與動態

indiejoseph / cosyvoice_inference_func.py

Created June 7, 2025 08:13

	import queue
	import time
	import threading
	from transformers.generation.logits_process import (
	TopPLogitsWarper,
	RepetitionPenaltyLogitsProcessor,
	)

	@torch.inference_mode()
	def inference_v2(

indiejoseph / docker-compose.yml

Created October 25, 2024 09:53

Label Studio

	version: "3.9"
	services:
	app:
	image: heartexlabs/label-studio:latest
	restart: unless-stopped
	depends_on:
	- db
	expose:
	- "8080"
	environment:

indiejoseph / gist:b1f04b4f71b77ad7bce8b9379fc72e29

Created September 5, 2024 11:03

Register Conda environment as Ipython kernel

	$ conda activate ml
	(ml) $ conda install ipykernel
	(ml) $ ipython kernel install --user --name=<any_name_for_kernel>
	(ml) $ conda deactivate

indiejoseph / gist:fe6abdfe2a0625f3185a1a573445da80

Created July 9, 2024 15:39

Whisper perplexity

	import torchaudio

	def eval(audio, text):
	# convert audio to 16000 sample rate
	audio = torchaudio.transforms.Resample(orig_freq=44100, new_freq=16000)(torch.tensor(audio).unsqueeze(0)).squeeze()
	# process text
	tokenized_seq = torch.tensor([processor.tokenizer(text, add_special_tokens=True).input_ids]).to(device)
	decoder_input_ids = tokenized_seq[:, 1:]
	decoder_input_ids_right_shifted = tokenized_seq[:, :-1]
	# process audio

indiejoseph / missing_symbols.csv

Last active June 28, 2024 09:11

indiejoseph / audioBuffer.ts

Created June 8, 2024 15:14

	const resampling = (audioBuffer: AudioBuffer, targetSampleRate: number): Promise<AudioBuffer> => {
	const offlineAudioContext = new OfflineAudioContext(1, audioBuffer.length, targetSampleRate);

	const source = offlineAudioContext.createBufferSource();
	source.buffer = audioBuffer;

	source.connect(offlineAudioContext.destination);
	source.start();

	return offlineAudioContext.startRendering();

Joseph Cheng indiejoseph