サードウェーブ系哲学的ゾンビ

知る。考える。感じる。想像する。

ブログでよく使うダッシュ記号について

SPONSORED LINK

f:id:sky-y:20160815134157p:plain

私はブログタイトルにダッシュ記号 を多用します。ただ、「どの記号を使うべきか?」について無頓着だったので、改めて整理してみます。

例えば、私はこの記事のタイトルにもダッシュ記号を使いました:

ブログで大事なことは、おすそ分けの心と楽しむ心—8/6 ブロガー大文化祭@神田 レポート - サードウェーブ系哲学的ゾンビ

この「楽しむ心」と「8/6」の間にある記号こそが、ダッシュ記号です。

ただし、日本語執筆について学習されていない方にとっては、いわゆる「長音(伸ばし棒)」や「ハイフン」と区別が付かないと思います。

この記事では、(私が使う範囲で)ダッシュ記号の使い方を紹介します。

注意:もし内容が間違っていれば、コメントやTwitterなどでご指摘ください。

忙しい人へ

以下、すごく些細でマニアックな話が続くので、手っ取り早く「ブログライティングにおけるダッシュ記号の使い方」を知りたい方は、下記で「まとめ」へジャンプしてください。

「まとめ」へ飛ぶ

ダッシュ記号とは何か

まず、「記号の見た目と区別」だけの話をします。その前に、少しだけ前置きを話します。


現在のPCやスマートフォンでは、9割ぐらいが「Unicode」*1という文字コード(電子媒体における文字の規約)が使われています。*2

目安として、

  • 顔文字(😀など)
  • いわゆる「特殊顔文字」(ヾ(。>﹏<。)ノ゙✧*。 ←こんなやつ)

が正しく表示されていれば、あなたが今見ているブラウザは「Unicodeを正しく解釈している」といえます。


さて、ダッシュ記号の話をしましょう。

見た目には区別しにくい記号は、基本的にUnicodeの符号位置(コードポイント)で区別することになっています。

というわけで、似たような記号を並べてみました。どーん!!

文字 Unicodeの符号位置 説明
- U+002D ASCIIのハイフン
U+30FC 全角の長音
U+2010 別のハイフン
U+2011 改行しないハイフン
U+2013 ENダッシュ
U+2014 EMダッシュ
U+2015 全角のダッシュ
U+2212 全角のマイナス
U+FF70 半角カナの長音

(引用元: ハイフンに似てる文字の文字コード - Qiita

何が違うんだ・・・(´Д⊂ヽ

「ダッシュ記号っぽい記号」の違い

マイナーな記号は省略します。

ダッシュ記号以外のもの

  • - U+002D 「ASCIIのハイフン」
    • 欧米圏で使用する。欧米圏では、似た記号をこれで代用することも多い。
  • U+30FC 「全角の長音」
    • いわゆる「伸ばし棒」。カタカナの「アート」「マーカー」とかで使う記号。
  • U+2212 「全角のマイナス」
    • 数学記号のマイナス。
    • 日本においても、理系の研究者がよく使う組版ソフト(LaTeX)では「ASCIIのハイフン」をマイナス記号として使うので、プロの出版社や編集者以外はほとんど使うことはない。

ダッシュ記号

ここで重要なのは、欧米組版における「enダッシュ」と「emダッシュ」の違いです。

(CSSにおいても重要な概念なので、ここだけはしっかり理解するとお得です。)

原則としては

  • en: アルファベットの「n」と同じ幅
  • em: アルファベットの「m」と同じ幅

という意味です。enの方が短く、emの方が長いです。よって

  • U+2013 「enダッシュ」
  • U+2014 「emダッシュ」

の違いは、見た目としては「長さの違い」であることが分かるはずです。

(えっ、見た目では分からない?心で感じるんだ!!!

それとは別に

  • U+2015 「全角のダッシュ」

もありますが、これは「emダッシュ」と同義と考えても構いません。

(じゃあ、なんで違う符号が割り当てられているんだ・・・)

以上が、「ダッシュ記号っぽい記号」の見た目の違いについてでした。長かった・・・。

ダッシュ記号の役割

ここからやっと、ダッシュ記号の役割や意味について説明します。

ダッシュ記号はいくつかの役割があります。

emダッシュ1: タイトルにおける主題と副題の区別

「emダッシュ 」(U+2014)の用例その1。

例えば、タイトルとして

「ぶどう—夏の思い出」

というフレーズがあったとき、

  • 主題:ぶどう
  • 副題:夏の思い出

という意味になります。私が最もよく使う用法です。

ちなみに、ダッシュの数は1個だったり2個だったりします。論文提出の際には規約やルールや慣習があるので、適宜合わせてください。ブログのタイトルに使うならお好みで。

emダッシュ2: 説明(括弧とほぼ同じ役割)

「emダッシュ 」(U+2014)の用例その2。

心の中での科白や描写などに使ったり、説明の省略や言葉の付け足しの際に使います。 含みを持たせる時なんかにも。

(出典: 文章作成の基本ルール)

注意としては、この用法では「ダッシュ記号を2個使う」ことが原則です。 ブログ程度であれば1個でもよいと(個人的に)思いますが、書籍や「小説家になろう」「カクヨム」などで作品を発表される方は、特に注意して下さい。

例:

[心の中での科白]

──撃った、こいつ本当に撃ったぞ。

[説明の省略]

「――というわけで、私は遠路はるばるこのユーにやってきたの。この気持ち分かる?」

(出典: 文章作成の基本ルール)

enダッシュ: 区間や範囲を表す

enダッシュ (U+2013)は、区間や範囲を表すのに使います。

例えば、ページ数。英語論文では「pp.10–20」と書かれている場合が多く、これに使うのが(本来は)enダッシュです。

ちなみに、

  • 上記の表でいう「別のハイフン」(U+2010): (10‐20) なら「10の20」という意味
  • 上記の表でいう「全角のマイナス」(U+2212): (10−20) なら「10引く20」という意味

ということらしいです。(出典: ダッシュ (記号) - Wikipedia))

ただし、ちゃぶ台を返すような話をすると、しばしば欧米圏でもネット上では、enダッシュもマイナスも「ASCIIのハイフン -」(U+002D)で代用されます。

つまり

  • 「ASCIIのハイフン -」(U+002D)でおk
  • 文脈を読め

ということです・・・。

ダッシュ記号をIMEで出したい

実際にブログを書くとなると、「どうやって望みのダッシュ記号をだすのか?」が問題になります。

Mac(ことえり)の場合

下記を参照してください。

Macのことえりで日本語のダッシュ「—」を入力する方法

ATOKの場合

「だっしゅ」と変換してみてください。(おそらくWindows/Mac共通だと思います。)

f:id:sky-y:20160815134157p:plain

画像のように、単語の右側に「ダッシュ」という注釈が出ると思います。どちらも「emダッシュ」です。念のため、「同音語情報」ウインドウで確認すると確実です。

MS Wordの場合

下記の方法があるそうです(おそらくWindowsの場合)。

ちなみに、「MS IMEでemダッシュを変換で出す方法」が見つからなかったので、Windows派の皆様からの情報をお待ちしております・・・。

まとめ

ブログライティングにおいては、下記だけを気を付ければよいかと思います:

  • 長音 (U+30FC)は、日本語の長音(伸ばし棒)としてのみ使う。
  • タイトルの主題と副題を分ける記号には、emダッシュ (U+2014)を使う。
  • 修辞的にダッシュを使いたい場合も、emダッシュ (U+2014)で。ただし、ダッシュの数は2個。
  • 以下は、「ASCIIのハイフン -」(U+002D)でも差し支えない。
    • 区間や範囲: 本来はenダッシュ (U+2013)
    • 数学のマイナス: 本来は全角のマイナス (U+2212)

本題は以上です。


加えて、さらに技術的なこぼれ話もしたいので、興味のある方のみ下記もお読みいただければ幸いです。

プログラマ向けのおまけ:半角と全角について

古参のプログラマの方でこのように仰る方がたまにいらっしゃいます。

「「全角」「半角」という言い方は間違っている。「1バイト文字」「2バイト文字」と言うべき」

昔は正しかったのですが、Unicodeが主流の今において、残念ながらそれは間違った知識です。

まず、「半角」「全角」という区別は、本来は印刷や組版の用語です。 なので、字形の問題であり、符号化やバイト数の問題ではありません。

次に、過去で主流だったShift JISにおいては、確かに「半角=1バイト」「全角=2バイト」という関係はありました。

しかし、Unicode(特にUTF-8)においては「文字符号によって文字のバイト数が変わる」という、全く違う前提があります。

ASCII文字と互換性を持たせるために、ASCIIと同じ部分は1バイト、その他の部分を2-6バイトで符号化する。

UTF-8 - Wikipedia

よって、Unicodeを前提にした文字列処理を行う場合は、「文字のバイト数は固定である」という仮定を絶対に置いてはいけません。

素直に、各言語に標準で備わっているはずの、文字列の長さを計る関数やメソッド(Pythonのlen()、RubyのString#size、JavaのString.length()など)を使いましょう。


今度こそ以上です。こんなに長い記事になる予定じゃなかったのに・・・。

藤原 惟

*1:UTF-8はUnicodeのうちの一つの符号化方式です。日常的には同じと考えても差し支えないですが、プログラミングの際は厳密に区別する必要があります。

*2:Windowsにおける文書では「Shift JIS」という文字コードも頻繁に(かつ暗黙に)使われていることも多いです。