이 문서의 내용은 자연어 처리기 라이브러리 설치/설정/시험구동 결과다.
라이브러리 사용 목적은 아래와 같다.
- 독자가 입력한 검색 문자열에서 검색어 추출
- 기사에서 인덱스용 검색어 추출
- 한국어를 지원
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 3.2 Final//EN"> | |
<html><head> | |
<meta http-equiv="content-type" content="text/html; charset=UTF-16LE"><title>Devices List</title></head> | |
<body> | |
<h3>Devices List</h3> | |
<br><h4>Created by using <a href="http://www.nirsoft.net/" target="newwin">DevManView</a></h4><p><table border="1" cellpadding="5"><tbody><tr bgcolor="E0E0E0"> | |
<th>Device Name | |
</th><th>Manufacturer | |
</th><th>Service | |
</th><th>Device Type Code |
출처: http://www.quora.com/How-do-you-print-a-python-unicode-data-structure
# coding=utf-8
import pprint
_escape = dict((q, dict((c, unicode(repr(chr(c)))[1:-1])
for c in range(32) + [ord('\')] +
(ns da | |
(:use [clojure repl pprint]) | |
(:require [clojure string xml zip]) | |
(:require [clojure.data json]) | |
(:require [clojure.java jdbc]) | |
(:require [net.cgrand enlive-html]) | |
(:require [incanter core io excel]) | |
(:import [java.net URL])) | |
;;; utility |