Vol.256 結城浩/出版分析とお金の話/ヴィジョンを描けはしないけど/

結城浩の「コミュニケーションの心がけ」2017年2月21日 Vol.256

はじめに

おはようございます。結城浩です。

いつも結城メルマガをご愛読ありがとうございます。

今回はVol.256です!

コンピュータ関係者にとって256は「キリのいい数」になります。 それは、256が「2の8乗」だからです。 十進法でいえば「100」は「10の2乗」でキリがいいし、 「100000」は「10の5乗」でキリがいいですね。 それの二進法版ということです。

 * * *

それはさておき……先週後半は、 家庭内の事情でたいへん忙しいときを過ごしました。 親族の介護関連で大きなイベントがあり、 心身共に疲労しました。

この「はじめに」を書いているのは月曜日ですが、 久しぶりにキーボードに向かい、 何といいますか、ほっと一息ついて仕事をしています。

疲労はしたのですが、 この結城メルマガのタイトルでもある「コミュニケーション」 について学ぶことがたくさんありました。 自分で経験することというのは、とても大きな意味を持ちますね。 自分の中でうまく咀嚼できたなら(いくぶん抽象化した上で)、 この結城メルマガでも展開してみたいと思います。 いわば「高齢社会に向けてのコミュニケーション問題」ですね。

 * * *

謎の「ボ」の話。

結城は、「自炊」した書籍PDFをDropboxのディレクトリに集めて利用しています。 たくさんのPDFから目的の書籍を見つけるためのスクリプトを自作し、 コマンドラインから、

 book キーワード

と入力すると「キーワード」 を含むファイル名のPDFがさっと表示されるようにしています。

たとえば、

 book 統計

のように入力すれば、 ファイル名に「統計」が含まれているPDFの一覧が番号付きで表示され、 さらに、

 book 統計 3

と入力するとその一覧の三番目のPDFが表示されます。 コマンド一発(二発)で目的の本が開けるのでたいへん便利です。

でも以前から「何だか検索がうまくいってないのでは?」と感じていました。

先日、ようやくその謎が解けました。

ボイヤー著『数学の歴史』のPDFのファイル名は、

 数学の歴史(ボイヤー).pdf

としています。 ところが、「book ボイヤー」と入力しても見つからないのです。

調べて驚いたことに、

 ・ファイル名の「ボイヤー」の「ボ」
 ・キーボードから入力した「ボイヤー」の「ボ」

の二つが異なるエンコードになっているのです(驚愕!)。

 ◆見た目が同じ「ボ」のエンコードが異なる

2017-02-20_utf8.jpg

調べてみますと、

 ・ファイル名由来のボは「e3 83 9b」(ホ)+「e3 82 99」(濁点)
 ・キーボード由来のボは「e3 83 9c」(ボ)

になっていたのです。 これまで「検索がうまくいってない」というのも、 濁点や半濁点を含むファイル名がおかしかったようです。

さらに調べてみますと、この現象は有名なものらしく、 UTF-8とUTF-8-MACという二つのエンコードに関連した話題のようです。

 ◆UTF-8-MAC
 http://macwiki.osdn.jp/wiki/index.php/UTF-8-MAC

UTF-8のエンコードにはNFCとNFDという二つのやり方があり、 ふだんはシステムがうまく同一視してくれるのですが、 Macのlsなどの出力ではNFDでエンコードされたものが出てしまうらしいです。

結局、bookの中で、

 nkf --ic=UTF-8-MAC --oc=UTF-8

というコマンドを途中に入れ、NFCに統一して解決しました。 これで正しく「ボイヤー」を検索できるようになりました。

なお、今回の修正を加えた book スクリプトは以下で公開しています。

 ◆タイトルでPDFを検索して開くRubyスクリプト
 https://snap.textfile.org/20160701151217/

今回の問題解決には約一時間ほど掛かりましたが、 地味に作業環境が改善したことになりますね。

 * * *

クラウド時代の蔵書の話。

先日、読者さんから、 Web連載に対するちょっとしたご指摘をいただきました。

そのとき結城はたまたま電車に乗っていたのですが、 PDFにしてDropboxに入れておいた参考書をiPhoneで確認し、 すぐに指摘事項の確認をすることができました。 こういう経験をすると「クラウド時代、すばらしいな!」と感じます。

ここで「すばらしい」というのは、

 ネットが繋がってさえいれば、
 自分が持っている本を、
 自分の現在地によらず見ることができる

という意味です。 それは、クラウド(を初めとする)技術が、

 自分が仕事をする場所・時間・持ち物に、
 大きな自由度を与えてくれる

ことを意味しています。

外出しているときに受けた指摘は、 自宅に帰ってから調べることにしてもかまいません。 でも移動のちょっとした時間を使って解決することもできる。 自分に与えられた選択肢が増えている。 その意味で「自由度」とは「選択肢の豊かさ」ともいえるでしょう。

現在結城がDropboxに入れてる本(PDF)は約1000冊あります。 すでにiPhoneにダウンロードしており、 オフラインで参照できる本も120冊ほどあります。

ネットがあれば約1000冊にアクセスできるし、 アクセスできなくても約120冊を読める。 ポケットに本を120冊持って歩いてるなんて愉快ですよね。

クラウド時代の蔵書はとっても軽くて素敵。

 * * *

日本国語大辞典の話。

iPhoneアプリで『日本国語大辞典(精選版)』を買ってから、 あれこれ遊んでいます(以下「日国」と略します)。

Web連載で「いにしえの数学」シーズンを書いているので、 「いにしえ」という単語を改めて調べてみました。 「いにしえ」というのは「往にし方」なので、 時間の経過という概念を含むそうです。

「いにしえ」は「連続的に今と繋がった過去をとらえる」のに対し、 「むかし」は「今と対立的に過去をとらえる」とのこと。 おもしろいですね。

日国は検索機能が充実しています。 たとえば、

 「*ばれん*」

のようにすると、 単語の途中に「ばれん」が入るものが見つかります。 たとえば、

 「あばれんぼう」

のように。

あるいはまた、

 「い@い@い」

を検索すると、 「@」のところが「かな一文字」になるものが見つかります。

では、クイズ。科学用語で、

 「い@い@い」

になるもの、あなたは思いつきますか。

別のクイズ。工作・工芸に関わる用語として、

 「@あ@か@な」

というのはいかがでしょう。 あなたはこんな単語を見つけられますか。

 「バレンタインデー」

に似た単語を見つけるため、

 「@れんた*」

を検索したところ、

 「未練たらしい」

 「愚連隊」

が出てきて苦笑してしまいました。 日国をながめていると、時間がどんどん過ぎていきますね。

さっきのクイズの答え。

 「い@い@い」は「異性体」(あるいは「一意性」)
 「@あ@か@な」は「仕上げかんな」

でした! わかりましたか?

 * * *

言葉の話。

言葉といえば、先日Twitterで結城はこんなツイートをしました。

 --------
 「萩野さん」って、
 はぎやさん、
 おぎやさん、
 はぎのさん、
 おぎのさん、
 の全部のパターンありえますよね?
 --------

しばらくしてTwitterを見ると、いきなりたくさんのリプがついていてびっくり! フォロワーのみなさんから、

 結城さん、「萩」(はぎ)と「荻」(おぎ)は違う文字ですよ

というご指摘をいただいたのでした。

正直に告白しますと、この歳になるまで、 「萩(はぎ)」と「荻(おぎ)」が違う漢字だとは知りませんでした!

ちなみに、「萩(はぎ)」は「秋の七草」に入っているので「くさかんむりに秋」 と覚えるといいですよと教えていただきました。

 * * *

句点の話。

「毎日ことば」という、日本語の話題が書かれているブログ記事を見ました。 その記事では、「なぜ新聞は閉じカッコの前に句点を付けないのか。」 という話題が書かれていました。

 ◆「なぜ新聞は閉じカッコの前に句点を付けないのか。」
 http://www.mainichi-kotoba.jp/2017/02/blog-post_11.html

結城も、会話文を書くとき、閉じかっこ(」)直前では句点(。)を付けません。 たとえば、

 「うーん。よくわからないな。」

とは書かずに、

 「うーん。よくわからないな」

と書くという意味です。

それほど強いこだわりがあってそのように書いているわけではありません。 ただ、最近の小説では、閉じかっこ直前の句点は書かない流儀が多いと認識しています。 たとえばいま、森博嗣と西尾維新と村上春樹の小説をぱらぱら見てみると、 どちらも書いていませんでした。

どちらが正しい/誤りという話ではないと思っています。 あえていうなら、

 A「なるほど。」
 B「なるほど」

という二つの書き方を比較すると、 Aの方がやや古めかしいと感じ、Bの方がスピーディで軽く感じますけれど、 まあ、個人的な感覚にすぎません。

あなたはどんなふうに書きますか。

 * * *

亜人(デミ)ちゃんの話。

毎週日曜日の夜、 アマゾンプライムビデオで「亜人(デミ)ちゃんは語りたい」を観ています。

先週の第7話「サキュバスさんはいぶかしげ」もおもしろかった!

このアニメ、 結城は「物語を構成する方法」としても興味深く見ています。 今回は新しいキャラクタが登場しました。

新しいキャラクタが登場すると、物語の世界が広がります。 特に今回登場したキャラクタは学園外の人でもあり、 また登場人物の過去を知る人でもあるので、 空間的にも時間的にも広がる感じを受けました。

新しいキャラクタの登場タイミングは重要だと思います。 メインの登場人物にフォーカスが当たる前に新しいキャラクタを出してしまうと、 話が散漫になってしまうし、メインの登場人物の影が薄くなるからです。 第6話までで、登場人物に一渡りフォーカスがあたった後で、 新キャラを出すのはちょうどいいなあと感じました。

新キャラを出すのはいいのですが、きちんと描こうとすると、 メインキャラの描写が少なくなってしまう危険性があります。 第7話では、新キャラと軽く絡ませることでその問題をうまく回避していたようです。 なるほど……とたいへん勉強になりました。

来週も楽しみです!

 ◆『亜人ちゃんは語りたい』(アマゾンビデオ)
 https://www.amazon.co.jp/exec/obidos/ASIN/B01N4KENHZ/hyam-22/

 * * *

それでは、今回の結城メルマガを始めましょう。

どうぞ、ごゆっくりお読みください!

目次

  • はじめに
  • 出版分析とお金の話 - 仕事の心がけ
  • 「文章を読まない人」について
  • ヴィジョンを描けはしないけど
  • おわりに