KexinFeng · February 1, 2025 21:14 · codeoflife · Jul 19, 2023
diff --git a/readme.md b/readme.md
diff --git a/BertTranslator.java b/BertTranslator.java
 import ai.djl.modality.nlp.DefaultVocabulary;
 import ai.djl.modality.nlp.Vocabulary;
 import ai.djl.modality.nlp.bert.BertToken;
 import ai.djl.modality.nlp.bert.BertTokenizer;
 import ai.djl.modality.nlp.qa.QAInput;
 import ai.djl.ndarray.NDArray;
 import ai.djl.ndarray.NDList;
 import ai.djl.ndarray.NDManager;
 import ai.djl.translate.Batchifier;
 import ai.djl.translate.Translator;
 import ai.djl.translate.TranslatorContext;

 import java.io.IOException;
 import java.nio.file.Path;
 import java.nio.file.Paths;
 import java.util.List;

 public class BertTranslator implements Translator<QAInput, String> {
    private List<String> tokens;
    private Vocabulary vocabulary;
    private BertTokenizer tokenizer;

    @Override
    public void prepare(TranslatorContext ctx) throws IOException {
        Path path = Paths.get("src/main/resources/bert-base-cased-vocab.txt");
        vocabulary = DefaultVocabulary.builder()
                .optMinFrequency(1)
                .addFromTextFile(path)
                .optUnknownToken("[UNK]")
                .build();
        tokenizer = new BertTokenizer();
    }

    @Override
    public NDList processInput(TranslatorContext ctx, QAInput input) throws IOException {
        BertToken token =
                tokenizer.encode(
                        input.getQuestion().toLowerCase(),
                        input.getParagraph().toLowerCase());

        // get the encoded tokens that would be used in processOutput
        tokens = token.getTokens();
        NDManager manager = ctx.getNDManager();
        // map the tokens(String) to indices(long)
        long[] indices = tokens.stream().mapToLong(vocabulary::getIndex).toArray();
        long[] attentionMask = token.getAttentionMask().stream().mapToLong(i -> i).toArray();
        long[] tokenType = token.getTokenTypes().stream().mapToLong(i -> i).toArray();
        NDArray indicesArray = manager.create(indices);
        NDArray attentionMaskArray =
                manager.create(attentionMask);
        NDArray tokenTypeArray = manager.create(tokenType);
        // The order matters
        return new NDList(indicesArray, attentionMaskArray, tokenTypeArray);
    }

    @Override
    public String processOutput(TranslatorContext ctx, NDList list) {
        NDArray startLogits = list.get(0);
        NDArray endLogits = list.get(1);
        int startIdx = (int) startLogits.argMax().getLong();
        int endIdx = (int) endLogits.argMax().getLong();
        return tokenizer.tokenToString(tokens.subList(startIdx, endIdx + 1));
    }

    @Override
    public Batchifier getBatchifier() {
        return Batchifier.STACK;
    }
 }
diff --git a/build.gradle b/build.gradle
 plugins {
    id 'java'
 }

 repositories {
    mavenCentral()
 }

 dependencies {
    implementation "org.apache.logging.log4j:log4j-slf4j-impl:2.17.1"
    implementation platform("ai.djl:bom:0.16.0")
    implementation "ai.djl:api"
    runtimeOnly "ai.djl.pytorch:pytorch-engine"
    runtimeOnly "ai.djl.pytorch:pytorch-model-zoo"
 }


 test {
    useJUnitPlatform()
 }
diff --git a/HuggingFaceQaInference.java b/HuggingFaceQaInference.java
 import ai.djl.ModelException;
 import ai.djl.inference.Predictor;
 import ai.djl.modality.nlp.qa.QAInput;
 import ai.djl.repository.zoo.Criteria;
 import ai.djl.repository.zoo.ZooModel;
 import ai.djl.training.util.ProgressBar;
 import ai.djl.translate.TranslateException;

 import java.io.IOException;
 import java.nio.file.Paths;

 public class HuggingFaceQaInference {
    public static void main(String[] args) throws IOException, TranslateException, ModelException {
        String question = "When did BBC Japan start broadcasting?";
        String paragraph =
                "BBC Japan was a general entertainment Channel. "
                + "Which operated between December 2004 and April 2006. "
                + "It ceased operations after its Japanese distributor folded.";
        QAInput input = new QAInput(question, paragraph);
        
        String answer = HuggingFaceQaInference.qa_predict(input);
        System.out.println("The answer is: \n" + answer);
    }

    public static String qa_predict(QAInput input) throws IOException, TranslateException, ModelException {
        BertTranslator translator = new BertTranslator();
        Criteria<QAInput, String> criteria = Criteria.builder()
                .setTypes(QAInput.class, String.class)
                .optModelPath(Paths.get("src/main/resources/trace_cased_bertqa.pt"))
                .optTranslator(translator)
                .optProgress(new ProgressBar()).build();

        ZooModel<QAInput, String> model = criteria.loadModel();
        try (Predictor<QAInput, String> predictor = model.newPredictor(translator)) {
            return predictor.predict(input);
        }
    }
 }
	import ai.djl.modality.nlp.DefaultVocabulary;
	import ai.djl.modality.nlp.Vocabulary;
	import ai.djl.modality.nlp.bert.BertToken;
	import ai.djl.modality.nlp.bert.BertTokenizer;
	import ai.djl.modality.nlp.qa.QAInput;
	import ai.djl.ndarray.NDArray;
	import ai.djl.ndarray.NDList;
	import ai.djl.ndarray.NDManager;
	import ai.djl.translate.Batchifier;
	import ai.djl.translate.Translator;
	import ai.djl.translate.TranslatorContext;

	import java.io.IOException;
	import java.nio.file.Path;
	import java.nio.file.Paths;
	import java.util.List;

	public class BertTranslator implements Translator<QAInput, String> {
	private List<String> tokens;
	private Vocabulary vocabulary;
	private BertTokenizer tokenizer;

	@Override
	public void prepare(TranslatorContext ctx) throws IOException {
	Path path = Paths.get("src/main/resources/bert-base-cased-vocab.txt");
	vocabulary = DefaultVocabulary.builder()
	.optMinFrequency(1)
	.addFromTextFile(path)
	.optUnknownToken("[UNK]")
	.build();
	tokenizer = new BertTokenizer();
	}

	@Override
	public NDList processInput(TranslatorContext ctx, QAInput input) throws IOException {
	BertToken token =
	tokenizer.encode(
	input.getQuestion().toLowerCase(),
	input.getParagraph().toLowerCase());

	// get the encoded tokens that would be used in processOutput
	tokens = token.getTokens();
	NDManager manager = ctx.getNDManager();
	// map the tokens(String) to indices(long)
	long[] indices = tokens.stream().mapToLong(vocabulary::getIndex).toArray();
	long[] attentionMask = token.getAttentionMask().stream().mapToLong(i -> i).toArray();
	long[] tokenType = token.getTokenTypes().stream().mapToLong(i -> i).toArray();
	NDArray indicesArray = manager.create(indices);
	NDArray attentionMaskArray =
	manager.create(attentionMask);
	NDArray tokenTypeArray = manager.create(tokenType);
	// The order matters
	return new NDList(indicesArray, attentionMaskArray, tokenTypeArray);
	}

	@Override
	public String processOutput(TranslatorContext ctx, NDList list) {
	NDArray startLogits = list.get(0);
	NDArray endLogits = list.get(1);
	int startIdx = (int) startLogits.argMax().getLong();
	int endIdx = (int) endLogits.argMax().getLong();
	return tokenizer.tokenToString(tokens.subList(startIdx, endIdx + 1));
	}

	@Override
	public Batchifier getBatchifier() {
	return Batchifier.STACK;
	}
	}
	plugins {
	id 'java'
	}

	repositories {
	mavenCentral()
	}

	dependencies {
	implementation "org.apache.logging.log4j:log4j-slf4j-impl:2.17.1"
	implementation platform("ai.djl:bom:0.16.0")
	implementation "ai.djl:api"
	runtimeOnly "ai.djl.pytorch:pytorch-engine"
	runtimeOnly "ai.djl.pytorch:pytorch-model-zoo"
	}


	test {
	useJUnitPlatform()
	}
	import ai.djl.ModelException;
	import ai.djl.inference.Predictor;
	import ai.djl.modality.nlp.qa.QAInput;
	import ai.djl.repository.zoo.Criteria;
	import ai.djl.repository.zoo.ZooModel;
	import ai.djl.training.util.ProgressBar;
	import ai.djl.translate.TranslateException;

	import java.io.IOException;
	import java.nio.file.Paths;

	public class HuggingFaceQaInference {
	public static void main(String[] args) throws IOException, TranslateException, ModelException {
	String question = "When did BBC Japan start broadcasting?";
	String paragraph =
	"BBC Japan was a general entertainment Channel. "
	+ "Which operated between December 2004 and April 2006. "
	+ "It ceased operations after its Japanese distributor folded.";
	QAInput input = new QAInput(question, paragraph);

	String answer = HuggingFaceQaInference.qa_predict(input);
	System.out.println("The answer is: \n" + answer);
	}

	public static String qa_predict(QAInput input) throws IOException, TranslateException, ModelException {
	BertTranslator translator = new BertTranslator();
	Criteria<QAInput, String> criteria = Criteria.builder()
	.setTypes(QAInput.class, String.class)
	.optModelPath(Paths.get("src/main/resources/trace_cased_bertqa.pt"))
	.optTranslator(translator)
	.optProgress(new ProgressBar()).build();

	ZooModel<QAInput, String> model = criteria.loadModel();
	try (Predictor<QAInput, String> predictor = model.newPredictor(translator)) {
	return predictor.predict(input);
	}
	}
	}