「大賞」選定の必然 電子出版アワード2021

2021年は日本における、知の流通とインターネット、というテーマにとって節目になる年でした。Wikipedia登場から20年目、EPUB3.0リリースから10年目。さらに遡ると、著作権切れの有名文学作品をデジタル化し、ネット上で公開する「Project Gutenberg(グーテンベルグ・プロジェクト)」が始まったのが1971年。今年2021年はその50周年にあたります。
Free eBooks | Project Gutenberg

この節目の年の「電子出版アワード2021」の「大賞」に、国立国会図書館(以下NDL)の事業計画書である「ビジョン2021-2025」が選ばれたのはとても象徴的な出来事だったと思います。

ビジョン2021-2025 国立国会図書館のデジタルシフト
・情報資源と知的資源をつなぐ7つの重点事業


JEPA|日本電子出版協会 電子出版アワード2021(第15回)大賞は「ビジョン2021-2025」

・デジタル・インフラ賞 ビジョン2021-2025 (国立国会図書館) 【大賞】
・スーパー・コンテンツ賞 会社四季報 業界地図デジタル  (株式会社 東洋経済新報社)
・エクセレント・サービス賞  ピッコマ  (株式会社カカオピッコマ)
・チャレンジ・マインド賞   FanTop  (株式会社メディアドゥ)
・エキサイティング・ツール賞  Romancer  (株式会社ボイジャー)



目次:
電子書籍、デジタルアーカイブ、電子図書館
Wikipedia(ウィキペディア)は20周年
EPUB3.0リリースから10年
国立国会図書館デジタル化資料の公開から10年目
知の流通とインターネット ビジョン2021-2025
デジタルシフトとmachine readableな本のデータ
machine readableな本に関連する記事


 

■電子書籍、デジタルアーカイブ、電子図書館

マイケル・ハートが「Project Gutenberg」を始めた1971年というと大型コンピュータの時代で、パソコンのアイデアなど皆無なころです。かろうじてインターネットの祖型である「ARPANET」と呼ばれる米国国防総省の軍事ネットワークがあっただけ。

ARPANETは世界初のパケット通信ネットワークとして誕生し、その最初の通信を実施したのが1969年10月29日で、この日がインターネットの始まりといわれています。

当初の公開はプレーンテキストで行われ、その後ボランティアによる投稿が盛んになると、HTML形式が活用されるようになりました。現在6万点の書物が、無償で誰でも読めます。

プロジェクトのミッションに「ebook」の文字があることから、マイケル・ハートは電子書籍の父とも言われ、サイトは最初のデジタルアーカイブ、また最古の電子図書館と呼ばれています。

The mission of Project Gutenberg is simple: To encourage the creation and distribution of eBooks.
Mission Statement | Project Gutenberg


50 years of eBooks 1971-2021 | Project Gutenberg
Which is the oldest digital library? | Trivia Answers | QuizzClub


 

■Wikipedia(ウィキペディア)は20周年

「Project Gutenberg」はボランティアによる投稿で成り立っていますが、ボランティアによる集合知型百科事典がWikipediaです。

ハワイ語のwikiwiki(速い)に由来する編集システムである「Wiki(ブラウザを利用してウェブサーバ上のHTML文書を書き換えるツール)」と、encyclopedia(百科事典)とを合わせた造語がWikipedia。2001年1月に米国で英語版が開設(日本語版は2002年9月からスタート)。インターネットの申し子的サイトに成長していて、今年は20周年にあたります。

Wikipediaをはじめ、インターネット上のページ、あるいはウェブ文書は、HTMLという規格にのっとって記述されることで、だれでもアクセスできる情報、知識となります。そして電子書籍の標準規格EPUBもこのHTMLの延長線上にあるものなのです。

 

■EPUB3.0リリースから10年

電子書籍は現在、国際的な標準化規格であるEPUBで制作されるのですが、それは上述のHTML、そしてCSSを基本要素としています。日本語特有の縦書きをも可能にした2011年のEPUB3.0リリース以降、日本でも浸透し始めました。

2011年というと日本は「3.11(東日本大震災)」の年に当たります。世情騒然としており、日本語に適用しやすいよう精緻化された「3.0」だったわけですが、だからといってすぐに各社がその新規格で電子書籍を作り始める、という状況ではなかったのでした。

しかし日本に電子書籍市場を開拓しようとの高い志をもって、果敢に2011年にスタートしたサービスもありました。

 

1.電子書籍ビューア BinB

「読書システムBinB」はWebブラウザがあれば、読書用アプリケーションをインストールすることなく、電子書籍を読むことができるサービス。開発したのは株式会社ボイジャー。日本で真っ先にデジタル出版に取り組んだ会社です。12月8日(水)で、BinBはリリースから10周年を迎えました。
読書システムBinB10周年記念 シナリオ準備稿『虎 虎 虎』公開|株式会社ボイジャーのプレスリリース

ちなみに電子出版アワード2021で、この会社の電子書籍作成ツールであるRomancer(2014年7月より提供)がエキサイティング・ツール賞を受賞しています。

 

2.電子書籍ポータルサイト Kinoppy

Kinoppy(キノッピー)は、株式会社紀伊國屋書店が提供する無料電子書籍アプリケーション。キャッチコピーが「電子書籍に端末選択の自由を」で、マルチデバイス対応によるサービス提供が特徴。

Kinoppy には3つの顔・機能があります。ひとつは紙の本と電子書籍の両方を購入できる「ストア」、次に電子書籍を読むための「ビューア」、そして購入した電子書籍を本棚に好きなように整理できる「ライブラリ」。

2011年5月から始まっていて、翌年の2012年、第六回電子出版アワードでデジタル・インフラ賞を受賞しています。今年2021年は10周年。

Kinoppy10周年記念キャンペーン|紀伊國屋書店Kinoppy電子書籍ストア

 

3.自社電子書籍販売サイト Gihyo Digital Publishing

Kinoppyが多数の版元の電子書籍販売ポータルサイトであるのに対し、自社の電子書籍を扱うのが、株式会社技術評論社が運営する電子出版サイト「Gihyo Digital Publishing」。2011年8月29日にオープン。

・EPUBとPDFのセット発売(1つの価格で2つのフォーマットが入手可能)
・SocialDRM

このふたつが最大の特徴。ほぼ新刊と同時に電子版がでるサイマル出版でも有名です。

Gihyo Digital Publishingサービス開始10周年記念キャンペーン実施のお知らせ:ニュースリリース|gihyo.jp … 技術評論社


ちなみに技術評論社のクロスメディア事業室室長、馮 富久氏によるJEPAセミナーの内容は下記から確認できます。
専門書出版社が取り組んできた電子出版事業の現場10年とその先 【セミナー備忘録】 | ちえのたね|詩想舎


以上EPUBを前提にした、3つの電子書籍関連サービスはあくまで私企業のもので、有償の世界。「Project Gutenberg」のような、無償の、電子書籍のデジタルアーカイブ、電子図書館は日本国内にないのでしょうか。

じつは国立国会図書館(NDL)がその事業を担っています。しかも書籍だけでなく、画像、音声、映像なども提供。2000年以降、収集活動が始まってはいたのでしたが、これを加速させ、統合したのは長尾真館長の時代になってからでした。

 

■国立国会図書館デジタル化資料の公開から10年目

NDLは2000~11年の「貴重書画像データベース」、2002~16年の「近代デジタルライブラリー」、2003~11年の「児童書デジタルライブラリー」など、種々のサービスを提供してきていました。

これを「国立国会図書館デジタルコレクション」の名の下に統合したのが2011(平成23)年4月。このとき電子書籍を突貫工事で加え(※)、国立国会図書館館内で提供するデジタル化資料の総数が100万点を超えたのでした。

※2010年、改正著作権法が施行され、国立国会図書館において資料の保存を目的としたデジタル化を著作権者の許諾なく行うことが可能となった。
国立国会図書館デジタルコレクションの歩み

長尾真氏は京大総長を経て、2007年に当時衆議院議長の河野洋平氏の意向により国立国会図書館長に就任。「知識は我らを豊かにする(Through knowledge we prosper)」というキャッチフレーズを掲げ、図書館界の改革を推進。2009年度127億円というかつてない高額予算のデジタルアーカイブ事業「大規模デジタル化事業」を実施、二年間で図書66万点、雑誌22万点、古典籍7万点、さらに博士論文14万点、官報等をデジタル化しました。
・電子書籍、電子雑誌等を後世に

オンライン資料の収集|国立国会図書館―National Diet Library

 

■知の流通とインターネット ビジョン2021-2025

「ビジョン2021-2025 国立国会図書館のデジタルシフト」の背景にあり、核となる思想は、「人と機械が読む時代」の知識基盤の確立です。

2021年4月21日に行われたJEPAセミナーで、田中久徳国立国会図書館 副館長は、「デジタルシフト」について、次のような方針を説明していました。

「人」と「機械」という二種類の「読者」(利活用のチャンネル)を想定し、オープンで広く信頼され、レジリエンスを備えた国の知識基盤の整備
②全文テキスト化等を視野に入れたデジタル化の戦略的推進、著作権処理の加速化、アクセスの容易化
③原資料のデジタルデータ収集、存続困難なデジタルアーカイブ、研究データ等の承継

そしてこういった方針を実現するため、

1.資料デジタル化の加速(デジタルで全ての本が読める未来へ
~向こう5年間で100万冊以上の所蔵資料をデジタル化します。テキスト化も行い、検索や機械学習に活かせる基盤データとする。
2.デジタル資料の収集と長期保存(デジタルで生まれた新しいかたちの資料を残す
~有償の電子書籍・電子雑誌の制度収集を開始し、著作者や出版者の協力を得て、安定的収集を実現。
3.デジタルアーカイブの推進と利活用(多様な文化資源をつなぎ、活かす
~図書館の領域を超えて幅広い分野のデジタルアーカイブを連携させる「ジャパンサーチ」を通じて、多様な情報・データがオープン化され、活用が促進される環境づくりを支える。

といった施策を進める、とのことでした。

思い返せば、「検索や機械学習に活かせる基盤データ」とは、「機械が読める」つまりmachine readable なデータを生成するということで、これは長年、「長尾構想」が指向してきたものです。

長尾氏が「本の知識の組織化」とも言い習わしてきた、machine readable なデータを生成すると、たとえば次のような機能の実現、利便性の提供を準備することができるのではないでしょうか。

・目次を利用した重み付け:
単純なデジタル化データ(本の総体)への検索では膨大な検索結果の表示に戸惑うだけかもしれないから。

・この本を読めば、関連するこのような本も読んではどうかという、本の内容分析から自動的に提案するシステム。

・自動的に本に抄録を付けたり、新聞や雑誌にのった書評を探し出して付ける。

・本を図書館分類体系のどこに位置づけるか、主題コードとして何を付与するか、の自動化。
(以上「本の知識の組織化と長尾構想 」より)

 

■デジタルシフトとmachine readableな本のデータ

NDLが「デジタルシフト」でいう、「人」と「機械」という二種類の「読者」を想定する、という方向性こそは、これまで出版業界や図書館業界の視野から、ともすると抜け落ちがちな視点でした。そして今後出版活動上重要になってくる知恵であり経営課題です。

具体的には、machine readable なデータを生成する準備ですが、難しい話ではありません。さしあたり、次の3つです。

A:リフロー型EPUBを作成する
B:HTMLとCSSを使った新機能の工夫や新しい本のカタチの考案
C:アクセシビリティへの対応

 

●Aのリフロー型EPUBについて

複雑なレイアウトを使った専門書や実用書では、フィックス型EPUBやPDF作成で、電子化対応はおしまい、となりがちです。

この点に関しては技術評論社の工夫が参考になります。

・リフロー部分と固定部分との再構成

・追加要素で情報構造を同一にする

Gihyo Digital Publishing10年の歩み〜専門書・専門雑誌の電子出版の過去・現在・未来 2021-11-20 C-7 - YouTube

 

●BのHTMLとCSSを使った新機能の工夫について

JEPAの電子出版アワード選考委員のひとり、落合早苗氏は文字もの電子書籍について、「アワード」の会場で次のようなコメントをしていました。

「ある市場がブレイクして拡大していく閾値が500億円ではないか」と考えているとし、2020年度の「文字もの」は500億円を超えてきているので、来年以降、さらに飛躍していくのでは、との見通しを披露したのです。

その趨勢を後押しできるかもしれない工夫として編集者が「切る」、「話読み(わよみ)」の作成があります。楽天Koboでの工夫です。「立ち読み」からより、「話読み」からのほうが購買に結びつきやすい、というのです。

「立ち読み」は本の頭から何%といった風に、機械的に「切る」のですが、「続きが読みたくなるような箇所で切る」「編集部が読み手の心理を考えて切る」ことでKoboの「話読み」は成功したという話。

たとえば、この編集者目線での「切る」をHTMLとCSSで実現すれば、それは「HTMLとCSSを使った新機能の工夫」ということになります。
・落合早苗氏の講演 (動画)

 

以上のような観点から、「電子出版アワード2021」の「大賞」に、NDLの事業計画書である「ビジョン2021-2025」が選ばれたのは、EPUB3.0リリースから10年目の節目の年にふさわしい出来事だったと考えられるのです。

「人と機械が読む時代」へ向けた、machine readableな本のデータの準備は、2022年の出版社の最重要課題です。

 


■machine readableな本に関連する記事

日本語のハンデと人工知能とGoogleBooks訴訟
Google検索の結果得られる情報や知識は、検索対象となるようあらかじめ準備されていてはじめて検索の対象となる。つまり「機械が読める」状態に加工が施されていてはじめて、検索の対象となり、検索結果として表示される。

 

W3C Publishing Summit APL活動報告会から 【セミナー備忘録】
human readable だけを考えていればよかった20世紀型出版から、machine readableにも目配りした、発想の転換を迫られる21世型出版への模索について。

 

日本人は読書しない? する?
4.情報行動のデジタルトランスフォーメーションの中で「読書」は
凋落する出版市場に変化を起こすためには、デジタルトランスフォーメーションを果たしつつある「読書」に呼応した、「出版のデジタルトランスフォーメーション」が必要だ、ということになるのだろう。具体的には、「組版」に関するノウハウから「CSS+HTML」の知識とノウハウへのシフト。

 

WEBTOONが見せつける、出版のIT化とDXの違い
■CSSは「組方指定書」
HTMLとはざっくりHPのことです。いまではどの社内でも自社HPを担当する社員がいて、すでに経営上の知識の一部となっていることでしょう。CSSはしかしHTMLのようにはいかないかもしれません。ですが、要は電子出版の「組み方指定書」のことです。

 

日本人の情報行動の変化と<本>の未来
漱石はこの要請に応えるため、新聞紙上での縦の文字数と行数に合わせた特注の原稿用紙を自ら準備した。それはいまでいえば、Webという勃興してきたメディアとそのプラットフォームに最適化されたCSSを新聞社が考案、著者がそのエディターを準備する行為に似ている。