ミャンマー語Webサイト作成で文字の表示に大いに悩む

2月頃から、東京にある日本語学校、TIJ 東京日本語研修所 のWebサイト作成に関わっています。

外国人のためのの日本語学校 TIJ 東京日本語研修所

実際にアクセスして頂けましたら、日本語・英語・中国語だけでなく、ベトナム語やタイ語といった東南アジア圏の向けのページや、フランス語やスペイン語など、アフリカ・南米向けのページもあります。

このサイトは最初に日本語と英語サイトを作成し、その後に中国語や韓国語などを作っています。もう半年くらい関わっており、ようやくゴールが見えてきました。

Unicode 準拠の文字データとフォント

これまで、他の言語ページ作成は、Unicode に準拠した文字フォントで入力されたWORDデータから、文字列を抜き出していました。

MacOS X には、タイ語のフォント「Thonburi」がインストールされており、フォントウェイトも Regular / Bold と2種あります。

ベトナム語のラテン文字やロシア語のキリル文字などは、どれも全て「Myriad pro」フォントの各ウェイトに格納されており、字体もUnicodeに準拠しています。基本的には、送られてきた文字列をコピペすることで、Webへの流し込みも、Fireworks での画像作成もできていました。

ミャンマー語のデータがUnicode準拠ではない

最後まで作り残していたミャンマー語に取りかかっているのですが、ここで文字コードに起因する厄介な問題にぶちあたりました。以下はミャンマー語に関するレポートで「ミャンマー語によるコンピュータ環境構築の提案」からの引用です。

Myanmar Post & Telecommunications が UnicodeTeamを作って政府としてMicrosoftやAppleと共同開発をした。 2011年10月17日〜19日の Internationalization & Unicode Conference で最終の決定としてMicrosoft社とApple社とでミャンマー語のUnicodeが出来た。

──渡辺恭人(千葉商科大学)
「ミャンマー語によるコンピュータ環境構築の提案」
※PDF

ミャンマー語のUnicodeが、Myanmar Post & Telecommunications(ミャンマー郵便電気通信局)とOSメーカーによって策定されたのは、2011年とわりと最近の話だったのです。

実は、この仕事をこなすために、ミャンマー語に対応していなかった MacOS X のバージョン 10.6 SnowLeopard を、対応している 10.8 MountainLion にアップグレードしたのですが、このとき、私は「OS実装が遅れるのは、よくある事だろう」と軽く考えていました。

MacOS X 10.8 には、3種類のミャンマー語フォントがインストールされています
MacOS X 10.8 には、3種類のミャンマー語フォント「Myanmar MN」などインストールされています(クリックすると拡大表示)

 

しかし、問題はもう少し根深いものでした。翻訳者から送られてきたPDFはきちんと表示されるのですが、Wordデータはきちんと表示できません。PDFを解析したところ、Zawgyi-One というフォントが使用されています(下図)。

Zawgyi-One というフォントが埋め込まれている

このフォントについては、先ほどのレポートにも引用がありました。

mmfont2

図3−3:のようにフォントの種類の中でZawgyiフォントが圧倒的に多かったことが分かった。そこで問題としてはZawgyiフォントはUnicodeに従っていないフォントである。

──渡辺恭人(千葉商科大学)
「ミャンマー語によるコンピュータ環境構築の提案」
※PDF

また、エーヤーワディブログでも、文字コード問題について触れられています。

日本語ではゴシック体で書いた文字をフォントだけ明朝体に変えてもおかしくはならない。しかし、ビルマ語はフォント毎に規格が違うので一度そのフォントで文章を入力したら他のフォントに変えられないという、奇妙な状況になっていた。
──エーヤーワディ ブログ(2011年9月12日のエントリ)

※注:ミャンマーの国名は1989年まで「ビルマ」だったので、年配の方は「ビルマ」「ビルマ語」と呼ぶ事が多い(東内)

ミャンマーで一般的に使われているフォントはUnicodeではない

つまり、ミャンマー語のUnicode策定があまりにも遅く、日本の Shift-JIS のようなローカル規格もなかったので、すでにフォントそれぞれの独自な文字コードが普及してしまっている、ということらしいのです。

それならば、という事で、CSSのフォント指定で Zawgyi-One を指定し、Macに Zawgyi-One.ttf をインストールしてWebページ作成をしています。タブレット端末などがミャンマーでも普及してくれば、いつかWebの文字コードを Unicode 化させる必要に迫れるのでしょうが、今は最も普及している方式で進めることにしました。

ところが、またもや問題がみつかりました。

改行の位置でグリフが変わる

Fireworks CS6 を使い、 Zawgyi-One フォントで文字を組んでいたら、表示トラブルを見つけてしまいました。

ミャンマー語の文字列は、改行位置がかわるとグリフが変わってしまいます。
ミャンマー語の文字列は、改行位置がかわるとグリフが変わってしまいます。

これはどうにも解決方法がありません。グリフが変わってしまわないように改行位置を調整したり、トラブルがおきてないか PDF原稿 と見比べてチェックするしかないようです。

欧文は「リガチャ(合字)」、日本語にも「行頭禁則文字」など、グリフを変更したり文字の位置を調整する仕組みが、OSやアプリのテキストエンジンに備わっています。しかし、このトラブルは、そういった調整の域を超えています。

これはOSが持つUnicodeに準拠した文字処理と、Zawgyiフォントの文字コード体系が違うためなのではないか、と思います。

しばらく、ミャンマー語の作成については最新の注意が必要のようですね。

コメントを残す

メールアドレスが公開されることはありません。