developersharif · January 23, 2025 16:17
diff --git a/README.md b/README.md
diff --git a/example-use.html b/example-use.html
 <!DOCTYPE html>
 <html lang="en">
  <head>
    <meta charset="UTF-8" />
    <title>OCR Web Client</title>
    <style>
      body {
        font-family: Arial, sans-serif;
        max-width: 800px;
        margin: auto;
      }
      #imagePreview {
        max-width: 100%;
      }
      #extractedText {
        width: 100%;
        min-height: 200px;
      }
    </style>
  </head>
  <body>
    <h1>OCR Text Extraction</h1>

    <div>
      <h2>Upload Image</h2>
      <input type="file" id="imageUpload" accept="image/*" />
      <input type="text" id="imageUrl" placeholder="Or paste image URL" />
      <button onclick="extractText()">Extract Text</button>
    </div>

    <div>
      <h2>Preview</h2>
      <img id="imagePreview" src="" alt="Image Preview" />
    </div>

    <div>
      <h2>Extracted Text</h2>
      <textarea id="extractedText" readonly></textarea>
    </div>

    <script>
      async function extractText() {
        const fileInput = document.getElementById("imageUpload");
        const urlInput = document.getElementById("imageUrl");
        const preview = document.getElementById("imagePreview");
        const textArea = document.getElementById("extractedText");

        const formData = new FormData();

        // Handle file upload
        if (fileInput.files.length > 0) {
          formData.append("image", fileInput.files[0]);
        }
        // Handle URL input
        else if (urlInput.value) {
          formData.append("image_url", urlInput.value);
        } else {
          alert("Please upload an image or provide an image URL");
          return;
        }

        try {
          const response = await fetch("http://localhost:5000/extract-text", {
            method: "POST",
            body: formData,
          });

          const data = await response.json();

          if (data.image) {
            preview.src = `data:image/png;base64,${data.image}`;
          }

          textArea.value = data.text;
        } catch (error) {
          console.error("Error:", error);
          alert("Failed to extract text");
        }
      }
    </script>
  </body>
 </html>
diff --git a/server.py b/server.py
 from flask import Flask, request, jsonify
 from flask_cors import CORS
 import cv2
 import numpy as np
 import pytesseract
 import base64

 app = Flask(__name__)
 CORS(app)


 @app.route('/extract-text', methods=['POST'])
 def extract_text():

    if 'image' not in request.files and 'image_url' not in request.form:
        return jsonify({"error": "No image provided"}), 400

    try:

        if 'image' in request.files:
            image_file = request.files['image']

            image_np = cv2.imdecode(np.frombuffer(
                image_file.read(), np.uint8), cv2.IMREAD_GRAYSCALE)

        elif 'image_url' in request.form:
            import urllib.request
            image_url = request.form['image_url']

            with urllib.request.urlopen(image_url) as url:
                image_np = cv2.imdecode(np.frombuffer(
                    url.read(), np.uint8), cv2.IMREAD_GRAYSCALE)

        languages = request.form.get('languages', 'ben+eng')
        ocr_config = request.form.get('config', '--psm 6 --oem 3')

        extracted_text = pytesseract.image_to_string(
            image_np,
            lang=languages,
            config=ocr_config
        )

        _, buffer = cv2.imencode('.png', image_np)
        encoded_image = base64.b64encode(buffer).decode('utf-8')

        return jsonify({
            "text": extracted_text,
            "image": encoded_image
        }), 200

    except Exception as e:
        return jsonify({"error": str(e)}), 500


 if __name__ == '__main__':
    app.run(debug=True, port=5000)
	<!DOCTYPE html>
	<html lang="en">
	<head>
	<meta charset="UTF-8" />
	<title>OCR Web Client</title>
	<style>
	body {
	font-family: Arial, sans-serif;
	max-width: 800px;
	margin: auto;
	}
	#imagePreview {
	max-width: 100%;
	}
	#extractedText {
	width: 100%;
	min-height: 200px;
	}
	</style>
	</head>
	<body>
	<h1>OCR Text Extraction</h1>

	<div>
	<h2>Upload Image</h2>
	<input type="file" id="imageUpload" accept="image/*" />
	<input type="text" id="imageUrl" placeholder="Or paste image URL" />
	<button onclick="extractText()">Extract Text</button>
	</div>

	<div>
	<h2>Preview</h2>
	<img id="imagePreview" src="" alt="Image Preview" />
	</div>

	<div>
	<h2>Extracted Text</h2>
	<textarea id="extractedText" readonly></textarea>
	</div>

	<script>
	async function extractText() {
	const fileInput = document.getElementById("imageUpload");
	const urlInput = document.getElementById("imageUrl");
	const preview = document.getElementById("imagePreview");
	const textArea = document.getElementById("extractedText");

	const formData = new FormData();

	// Handle file upload
	if (fileInput.files.length > 0) {
	formData.append("image", fileInput.files[0]);
	}
	// Handle URL input
	else if (urlInput.value) {
	formData.append("image_url", urlInput.value);
	} else {
	alert("Please upload an image or provide an image URL");
	return;
	}

	try {
	const response = await fetch("http://localhost:5000/extract-text", {
	method: "POST",
	body: formData,
	});

	const data = await response.json();

	if (data.image) {
	preview.src = `data:image/png;base64,${data.image}`;
	}

	textArea.value = data.text;
	} catch (error) {
	console.error("Error:", error);
	alert("Failed to extract text");
	}
	}
	</script>
	</body>
	</html>
	from flask import Flask, request, jsonify
	from flask_cors import CORS
	import cv2
	import numpy as np
	import pytesseract
	import base64

	app = Flask(__name__)
	CORS(app)


	@app.route('/extract-text', methods=['POST'])
	def extract_text():

	if 'image' not in request.files and 'image_url' not in request.form:
	return jsonify({"error": "No image provided"}), 400

	try:

	if 'image' in request.files:
	image_file = request.files['image']

	image_np = cv2.imdecode(np.frombuffer(
	image_file.read(), np.uint8), cv2.IMREAD_GRAYSCALE)

	elif 'image_url' in request.form:
	import urllib.request
	image_url = request.form['image_url']

	with urllib.request.urlopen(image_url) as url:
	image_np = cv2.imdecode(np.frombuffer(
	url.read(), np.uint8), cv2.IMREAD_GRAYSCALE)

	languages = request.form.get('languages', 'ben+eng')
	ocr_config = request.form.get('config', '--psm 6 --oem 3')

	extracted_text = pytesseract.image_to_string(
	image_np,
	lang=languages,
	config=ocr_config
	)

	_, buffer = cv2.imencode('.png', image_np)
	encoded_image = base64.b64encode(buffer).decode('utf-8')

	return jsonify({
	"text": extracted_text,
	"image": encoded_image
	}), 200

	except Exception as e:
	return jsonify({"error": str(e)}), 500


	if __name__ == '__main__':
	app.run(debug=True, port=5000)