テキストをhtml化する
今回の入力済みテキストは章タイトルの前には「#」、節タイトルの前には「##」とタグ付けを行っている。このタグ付けにしたがってhtmlの「見出し」タグを付せば良い。
また見出し以外の文はさしあたり「段落」と見なす。
正規表現を用いた文字列の置換
特定の文字を置換するだけなら簡単だが、特定の文字から始まる行末に文字を足したりするのは簡単ではない。こうした複雑な条件で文字列の置換を行うときには正規表現を用いる。
. | 任意の1文字 |
---|---|
* | 直前の文字を0回以上繰り返す |
+ | 直前の文字を1回以上繰り返す |
(?!■) | ■を含まない |
^ | 行の先頭 |
$ | 行の末尾 |
\r\n注 | 改行コード(Windows) |
\ 注 | エスケープ文字(正規表現で使用する記号を普通の文字として用いる) |
注 日本語キーボードでは\は¥を入力する |
- #で始まる行
- ^#.*
- #で始まらない行
- ^(?!#).*
正規表現を使用できるテキストエディタとして「サクラエディタ」がある。今回はこのサクラエディタを用いて、タグ付けを行ってみよう。
セクション・章タイトル・節タイトル・段落のタグ付けを行う。
- テキストファイルをサクラエディタで開く。
- Ctrl + Rキーを押すと「置換」ダイアログボックスが開く。
サクラエディタの「置換」ダイアログボックス - 「正規表現」にチェックを入れる。
- 「置換対象」を適宜切り替える。
- 「置換前」に正規表現を用いた置き換え対象文字列を指定する。
- 「置換後」にhtmlタグを指定する。
- 「置換対象」を必要に応じて切り替える。
- 置換に失敗したときには慌てずCtrl + Zでやり直しができる。
- 「表題」などは手動で書き換える。