GIZA++ は、統計的機械翻訳に使われるアライメントツールで、 IBM Model 1-5 と HMM を実装しています。今回は、Europarl Parallel Corpus で配布されている英独対訳コーパスのアライメントの尤度を推定させてみます。
# GIZA++ の準備
$ git clone https://github.com/moses-smt/giza-pp.git
$ cd giza-pp
$ make
GIZA++ は、統計的機械翻訳に使われるアライメントツールで、 IBM Model 1-5 と HMM を実装しています。今回は、Europarl Parallel Corpus で配布されている英独対訳コーパスのアライメントの尤度を推定させてみます。
# GIZA++ の準備
$ git clone https://github.com/moses-smt/giza-pp.git
$ cd giza-pp
$ make
#!/bin/bash | |
if [ $TERM_PROGRAM = 'vscode' ]; then | |
code $* | |
else | |
exec emacsclient -t -a "" $* | |
fi |
# In advance, tabs.json have to be extracted via ADB by following way. (See https://android.stackexchange.com/a/199496/340082 for detail.) | |
# adb forward tcp:9222 localabstract:chrome_devtools_remote | |
# wget -O tabs.json http://localhost:9222/json/list | |
import json | |
with open('tabs.json') as f: | |
tabs = json.load(f) | |
with open('tabs.md', 'w') as f: | |
f.write(f"# {len(tabs)} tabs in your Android Chrome\n\n") |
#!/bin/bash | |
# For Mac (Homebrew), use aliases below | |
#alias find=gfind | |
#alias sed=gsed | |
function count_files () { | |
num_files=$(gfind "$1" -maxdepth 1 -type f | wc -l) | |
echo "$1 ${num_files}" | |
#!/usr/bin/env python | |
# -*- coding: utf-8 -*- | |
""" | |
フレームワークとして Flask(http://flask.pocoo.org/) を、OAuth ライブラリとして oauth2(http://pypi.python.org/pypi/oauth2/) を利用したサンプルプログラムです。 | |
下のコードを保存して (oauth_consumer.py とします)、YOUR_CONSUMER_KEY, YOUR_CONSUMER_SECRET となっている部分を自分の consumer_key, consumer_secret で置き換えます。(settings.pyに保存してください) | |
$ python oauth_consumer.py | |
... で起動してから http://localhost:5000 に Web ブラウザでアクセスして下さい。 | |
+ 2015/10/25 python3用に書き換えました。 | |
""" |
import requests | |
import time | |
from tqdm import tqdm | |
base_url = 'http://xxxxx.xxx/{image_id}.jpg' | |
def get_image(image_id): | |
r = requests.get(base_url.format(image_id=image_id)) | |
with open(f"{image_id}.jpg", 'wb') as f: | |
f.write(r.content) |