chansen · December 26, 2011 22:22
diff --git a/fix_latin.pl b/fix_latin.pl
 #!/usr/bin/perl
 use strict;
 use warnings;

 use Encode        qw[find_encoding];
 use Unicode::UTF8 qw[decode_utf8];

 {
    my $encoding = find_encoding('Windows-1252')
      or die q/Couldn't find Windows-1252 encoding/;

    my $fallback = sub {
        my ($octets, $is_usv) = @_;
        return $is_usv ? "\x{FFFD}" : $encoding->decode($octets);
    };

    sub fix_latin {
        @_ == 1 || die q/Usage: fix_latin($octets)/;
        no warnings 'utf8';
        return decode_utf8($_[0], $fallback);
    }
 }

 my $octets = "\x91 Foo \xE2\x98\xBA \x92";

 printf "<%s>\n", 
  join ' ', map { sprintf 'U+%.4X', ord $_ } split //, fix_latin($octets);
	#!/usr/bin/perl
	use strict;
	use warnings;

	use Encode qw[find_encoding];
	use Unicode::UTF8 qw[decode_utf8];

	{
	my $encoding = find_encoding('Windows-1252')
	or die q/Couldn't find Windows-1252 encoding/;

	my $fallback = sub {
	my ($octets, $is_usv) = @_;
	return $is_usv ? "\x{FFFD}" : $encoding->decode($octets);
	};

	sub fix_latin {
	@_ == 1 \|\| die q/Usage: fix_latin($octets)/;
	no warnings 'utf8';
	return decode_utf8($_[0], $fallback);
	}
	}

	my $octets = "\x91 Foo \xE2\x98\xBA \x92";

	printf "<%s>\n",
	join ' ', map { sprintf 'U+%.4X', ord $_ } split //, fix_latin($octets);
No results found