知のパラダイムシフト

正字って、何? 外字って、何?

新訳、『シャーロック・ホームズの冒險』

特定非営利活動法人文字文化協會(※註)は2015年3月、翻訳家兼武 進氏がコナン・ドイルの『シャーロック・ホームズの冒險』を正字・正假名を使い新訳した日本語テキストを、EPUB3を使った電子書籍として刊行した

正字・正假名を電子書籍に表現するには「外字」問題が立ちはだかるが、それを文字文化協會は「文字鏡SVG画像フォント」を用いることにより各電子書籍ストアの読書端末で表示させることに成功したのだ。

協会としては、現代文を「正字」で表現する活動(決して「旧字」といった名称から連想されるようなお蔵入りの文字ではないことの証明)の第三弾ということになる。

第一弾は協会の主張をまとめた『外字・異体字のバリアフリーを目指して―漢字研究7年の軌跡』。これは紙の本とKinoppyでの電子書籍。第二弾は電子書籍のみで、『〔福田恆存語録〕日本への遺言  言葉 言葉 言葉』。

今回は「正字」が単に現代に生きているだけでなく、古典に分類される翻訳文に適用した場合、独特の雰囲気を伝える道具として使えることを証明した点に意義がある。ちょうど映画やテレビドラマの場合、時代考証を担当する人物が衣装や背景、小道具について入念なチェックを入れ、その時代の雰囲気を伝えるよう努力する、それと同じ機能を、「正字」が果たせた、というわけだ。

今から百二三十年もの昔、英國で書かれた物語である。譯者としては讀者に、その時間の隔りを輕視するのではなくむしろ強く意識しながら物語を愉しんでもらふための方途として、古風な語彙や文體を散りばめてみた。(略)文章の表記で歴史的假名遣に從ひ、漢字は正字を用ゐたことも、譯文を古風に見せるのに一役買ふであらうと思ふ。
(「譯者あとがき」より http://society-zero.com/chienotane/archives/746


日本語対応したEPUB3で、正字・正假名をSVG表示
http://society-zero.com/chienotane/archives/746


では一体、正字とは何か、外字とは何か、簡単解説を試みてみよう。

 

正字は勘違いされやすい概念

日本で有名なナショナル書店チェーンである「きのくにやしょてん」は、紀伊屋書店と書かれていて、紀伊屋書店ではない。また丸善書店グループで発行されているPR誌、「がくとう」は学と書かれていて、学ではない。

(2015年春号)

この場合の「」、「」が正字、すなわち正統な(正規の)文字。それでは国、灯は何かというと、「俗字」「略字」だ。ただし、国も灯も常用漢字であって学校で教えている。だから、「俗字」「略字」であっても決して「間違った文字」ではない。

正字は、間違っているかどうかではなく、日本語のもともとの文字か、正統な(正規の)文字かという判断軸から生まれる概念。対義語は「俗字」「略字」。正しい文字の対義語は「間違った文字」。

もうひとつ。丸善書店の会社設立は明治2年で「學鐙」は明治30年(1897)3月の創刊。日本最古のPR誌だ。「ああ、それでは「正字」は昔の人が使う字ね」、と勘違いしてはいけない。紀伊國屋書店は個人商店としての前身、創業は昭和2年だが、株式会社設立は戦後、1945年なのだから。

古いか新しいか、間違っているか正しいか。そのいずれの範疇でもなく、あくまで正統かどうかが、正字かどうかの判断軸。

 

戦後、学校で教えなくなった

正統性の根拠として、明治以降の日本で活字の標準となった文字(など)は基本的に『康煕字典(こうきじてん)』の字体を基にしている。それで正字を「康煕字典体」と呼ぶこともある。これは幕末以降、活版印刷が日本に流入、日本でも鋳造活字が作られるようになったのだが、鋳造活字の主流書体は明朝体だった。明朝体を作るときに、字体の参考にしたものが『康熙字典』だったのが「康煕字典体」が生まれた背景。

とにかく第二次世界大戦前までの日本において当たり前の字、それが正字で、公文書や新聞・書籍などはすべてこの文字で記述、表現され、人々はその中で生活をしてきた。

ところが戦後、戦時中のもの、また戦争に連なってきたものとして「戦前」が否定される傾向が充満する中、文字と日本語、つまり国語についても見直しが行われた。

一連の戦後改革、平和憲法の制定、絶対主義的天皇制の象徴天皇制への転換、財閥解体、農地改革などともに、教育の民主化が掲げられた。この教育の民主化との関連で一時は、漢字の廃止と簡単な音標文字(ローマ字)の採用が議論された。

私は60年前、森有礼が英語を国語に採用しようとしたことをこの戦争中、度々想起した。若しそれが実現してゐたら、どうであつたらうと考へた。日本の文化が今よりも遥かに進んでゐたであらうことは想像出来る。そして、恐らく今度のやうな戦争は起つてゐなかつたらうと思つた。我々の学業も、もつと楽に進んでゐたらうし、学校生活も楽しいものに憶ひ返す事が出来たらうと、そんな事まで思つた。
(志賀直哉「国語問題」、『改造』1946.4 )

 

漢字を廃止するとき、われわれの脳中に存する封建意識の掃蕩が促進され、あのてきぱきとしたアメリカ式能率にはじめて追随しうるのである。文化国家の建設も民主政治の確立も漢字の廃止と簡単な音標文字(ローマ字)の採用に基く国民知的水準の昂揚によって促進されねばならぬ。
(讀賣報知新聞社説、1945.11.12)

文字は音を表しさえすればそれで日常の会話を表現できる、そのことが「民主化」につながっていくという発想だ。さすがに漢字の全廃に一挙に進むわけにはいかず、「当面の用に供する漢字」、「当用漢字」が制定された。

1946年9月21日、国語審議会第11回総会に「現代かなづかい」が提出され、過半数の賛成を得て可決・答申。さらに同年11月5日には「当用漢字表」1850字が国語審議会第12回総会に提出され、こちらも過半数の賛成を得て可決・答申された。そして早くも同月16日、「当用漢字表」と「現代かなづかい」は内閣総理大臣吉田茂の名前で内閣訓令・告示公布されたのである。

これ以降「正字」は、学校で教える対象から外されてしまった。

 

現代文と正字

そしてもうひとつ、この「当用漢字表」1850字が制定されて以降、慣習として正字のことを「旧字」という言い方が定着し始める。ところがこのことが「正字」に、さらなる混乱を与えた。

たとえば中学校、高等学校の授業に「国語」と「古典」がある。国語は主に現代文を扱い、「古典」は古文を扱う。この連想で、「当用漢字」が現代文、「旧字(=正字)」が古文という間違った通念が流布してしまった。

しかしあくまで正字は明治代以降に整理された文字の体系で、当時の「現代文」、そして第二次世界大戦前までの「現代文」を担ってきていた。だから、21世紀のいまの「現代文」も当然「正字」で表現できる。

特定非営利活動法人文字文化協會はそのことを主張し、今回はさらに正字ならではの機能、効用を創出し、しかもそれを電子書籍にしてみせたのだ。

さてこの電子書籍化という段階に、実は「外字」問題という厄介なものが存在する。

 

PCで表示できる文字と表示できない文字

そもそも人間が文字を読めても、機械は文字を読めない。文字コードで表現されてはじめて機械はそれを認識し、文字を文字として表示することが可能になる。

表示するにはあらかじめ文字コードを格納しておく必要がある。英語のアルファベットが26文字なのに対し、日本語は数万のあるいはそれ以上の文字を有する。だがパソコンの文字格納の容量には物理的な制約がある。技術の進化で格納できる文字数が飛躍的に拡大したといっても、漢字辞典に収められている漢字をすべて格納するわけにはいかない。

どの漢字が日常生活に、また普段の知的活動をするうえで、必須な漢字かについて研究がなされ、現在は、「Unicode(JISX0213:2004)」の範囲がパソコンその他の情報端末に実装されるようになった。しかしそれでも、「Unicode(JISX0213:2004)」に掲載されている以外の漢字を使いたい人はいるし、使う場面はある。そういった漢字を含む文章を電子書籍にし、PCやその他スマホなどの情報端末、また読書専用端末で表示するには、「外字」を使わざるを得ない。

だから「外字」とは、PCで表現できない文字、つまり特定の文字集合、文字セット(文字コードなど)に含まれない文字のことを言い、「外字問題」とは、ではそれらの「外字」をどうやって表示するかの技術上の課題のこと。そしてこれまで「画像化」するのが当たり前の手法、対処方法だった。

 

外字をSVGで

つまり文章の中に「外字」があれば、文字コードと文字コードの間に、画像データを埋め込むことで対処してきた。

ところで最近のビューアーの機能として「文字拡大(もちろんその逆の縮小も含む)」がついている。いわゆるピンチアウトをすると文字が拡大する。この時、外字が「画像処理」してあると、残念ながら文字は拡大しても画像は拡大されず、この結果、文章の姿、見た目がいびつな形になってしまう。

この点、広い意味で画像データの一種ではあるのだがSVGを使うと、ピンチアウトの際一緒に拡大され電子書籍の読み手に違和感がない。それが特定非営利活動法人文字文化協會が使用した、「文字鏡SVG画像フォント」。

SVGそのものは目新しい技術ではない。しかし電子書籍の作成の文脈であまり意識されてこなかった。とりわけ外字をSVGで、というのはあまり普及してこなかった。電子書籍を発注する出版社の側にもそういう知見を有する人材があまりいなかったこともこういう事態を助長したかもしれない。

加えて外資系電子書籍配信サイトが日本に登場した当初、SVG対応が実装されていないビューア、読書専用端末があった。和製サイトのビューアでも同様。その後日本の電子書籍市場の拡大に合わせビューアーや端末も改善、状況は変化をしている。今回たとえば、Kinoppyサイト、koboサイトには次のような注記が施されている。

ファイル: EPUB形式/1MB iPhone、iPod touch、iPad、Android、Windows、Mac OS X
・ご利用方法
この書籍は Kinoppy for iOS、Kinoppy for Android、Kinoppy for Windows または Kinoppy for Mac(いずれも最新版)でお読みください。
対応していない Kinoppy では、「ライセンスの取得に失敗しました」 と表示され、お読みになれません。
*ご利用のバージョンによっては、無料お試し版を閲覧できない場合があります。
(シャーロック・ホームズの冒險 / アーサー・コナン・ドイル/兼武 進 <電子版> - 紀伊國屋書店ウェブストア https://www.kinokuniya.co.jp/f/dsg-08-EK-0241298

 

対応端末: 電子ブックリーダー, Android, iPhone, iPad, デスクトップアプリ
( シャーロック・ホームズの冒險 - アーサー・コナン・ドイル - 5292100001501 http://books.rakuten.co.jp/rk/c3bad755ee96386392ffd4da948b5828/

端末やビューアの面で課題はクリアされた、とみていいのだろう。今後この正字・正假名を使った新訳、『シャーロック・ホームズの冒險』の成功により、「外字をSVGで」が日本の電子書籍市場の当たり前のひとつになっていくものと考えられる。

これが可能になった背景のひとつに、特定非営利活動法人文字文化協會の「文字図形情報共有基盤」があったことを忘れてはいけない。

なお、新訳、『シャーロック・ホームズの冒險』は章単位の分売も行われている。

 


※註:
特定非営利活動法人文字文化協會が特に力を入れているのは、デジタル公共財としての「文字図形番号」の構想と、その印刷出版現場での活用。文字図形を表わす「画像フォント」に固有の番号を付け、それを「文字図形情報共有基盤」として、公開・共有する活動。

文字図形番号http://www.pcc.or.jp/mojizukei/index.html

その標準化のため、すでにISO/IEC 10036による登録、JIS X 4165:2002「フォント関連識別子の登録手続き」、情報処理学会試行標準という形での公表を実施済み。

●ISO/IEC 10036 Registration Authority for Font-related Objects http://10036ra.org/
●文字図形識別情報 | IPSJ/ITSCJ https://www.itscj.ipsj.or.jp/hasshin_joho/hj_shiko_hyojun/hj_sh_list/hj_sh_list_02/index.html


 

◇関連クリップ

●戦後の国語改革 http://d.hatena.ne.jp/jmaki/20040115
●正字のルーツ http://www.tonan.jp/moji/13seiji/

●EPUB3 で旧漢字など「外字」を正確に表示できる電子書籍を発売 http://internetcom.jp/allnet/20140625/4.html
外字のバリアフリーを提唱する本を、「文字図形番号」、文字鏡SVG画像を活用することで、「EPUB3でちゃんと外字が表現できるぞ」と、kinoppyで自ら実践。

●外字の無い世界を実現する - JEPA http://www.jepa.or.jp/keyperson_message/201408_408/
モノのインターネット、が流行語になっているが、この概念は「文字を機械が認識できる、読める」ということが前提になっている。ユーザーが情報を読む前に、機械が文字データを認識し、そのうえで表示している。機械が認識できる、また表示できるその範囲を「文字セット」と呼ぶ。「文字セット」にない文字は「外字」であって、仕方ないので、文字データではなく「画像」で表示することになる。画像でも人間は読める。つまり、ユーザーは読めるが機械は読めていない、それが「外字」だが、画像対応の「外字」は検索の対象にはならないしリフロー(ピンチアウト等への対応)もしない。
●EPUB3と文字 | 電書魂 http://densyodamasii.com/tag/epub3%E3%81%A8%E6%96%87%E5%AD%97/
あまりも多様な漢字の字形差全てを、電子書籍上で再現しようとすることは、制作コストが嵩み、かえって足かせ。
●DTPデータから電子書籍を制作する際の「外字」問題 http://densyodamasii.com/wp-content/uploads/downloads/2012/07/DTP2ebook_gaijitajima.pdf
電子書籍では読者の環境によってフォントや組版が変わる。つまり書店次第で、本文のフォントは変わる。だからマスタデータの確保が版元にとって重要。

●電子行政における外字問題の解決に向けて~人間とコンピュータの関係から外字問題を考える http://jp.fujitsu.com/group/fri/downloads/report/research/2013/no400.pdf
デジタル化による、情報の流通、そのことによる社会全体の生産性の向上。アルファベット諸国が普通に享受しているこのメリットに、「漢字かな交じり文」の壁が大きく立ちはだかる日本社会。とりわけ、「外字」は小骨のようでいて、実は最大の障害。

●‘外字’ タグのついている投稿 http://bit.ly/W2k9GU
JEPA(日本電子出版協会)での外字をはじめとする、「文字」のデジタル化に関連するセミナーがよくまとめられている。電子書籍で外字を使うということについて/EPUB3と文字、など。

●印刷データ→電子書籍で外字化が必要な文字のまとめ http://bit.ly/M3GFbV
3種類を分類:確実に外字化が必要になると思われる文字/現時点では外字化した方が無難と思われる文字/外字にするかどうか出版社サイドの判断が必要になる文字。

●近代語文献を電子化するための文字セット http://www.ninjal.ac.jp/corpus_center/cmj/doc/03takada.pdf
歴史的な日本語文献については、現代の本を電子化するのとは違う配慮が必要。
●日本語は特殊な言語か?  外から見た日本語 言語科学総論 資料(3) http://lapin.ic.h.kyoto-u.ac.jp/LangScience/handout4.pdf
●JIS拡張漢字(全コード表) - CyberLibrarian http://www.asahi-net.or.jp/~ax2s-kmtn/ref/jisx0213/

●ようこそ今昔文字鏡の世界へ! http://www.mojikyo.com/
●外字・異体字の バリアフリーを目指して http://pcc.or.jp/mojizukei/20140703.pdf
●コンテンツ配信型・ハイブリッドビジネスモデル実証事業(デジタル・ネットワーク社会における出版物の利活用推進のための外字・異体字利用環境整備調査) http://www.meti.go.jp/meti_lib/report/2011fy/E001484.pdf