mots quotidiens. | |
Daichi Mochihashi (持橋大地) daichi <at> ism.ac.jp | by hns, version 2.10-pl1. |
|
|||||||||||||||||||||||||||||||||||||||||||||||
troff はKernighanが書いているように, タイプセットのアセンブラのようなもの
なのだと思う。
troff のコマンドは下のように, 必ず行頭の . から始まる小文字で, これをマクロ化したものが
.TL や .NH のような大文字のマクロ。
これは TeX と LaTeX の関係に似ているが, troffはよりミニマリズムに徹して
いて, .sp や .ft のようにコマンドが最小限なのが特徴。
実際, もし自分でタイプセットのプログラムを書け, と言われたら,
まず確実にこういうコマンド体系を考えると思うので, それを完全なシステムに
しているという意味でも貴重だと思う。
*1
実際に使えるかというと,
\(*S(\(*a\(mu\(*b)\u\s-22\s0\d \(-> \(ifと書く必要がありますが, わかりにくいのと, 現代で使うような複雑な式は 恐らく不可能, という問題がありそうです。
ソース: % groff -ms -Tps alice.rf > alice.ps
.ps 12 .DS C .ps +2 .ft B Alice in Wonderland .ft .sp 0.4 Lewis Carroll .ps -2 .DE .sp -2.5 .ps 12 .vs 13p .in +0.6i .ll -0.3i .ti -0.4i \v'1'\s36A\s0\v'-1' lice was beginning to get very tired of sitting by her sister on the bank, and of having nothing to do: once or twice she had peeped into the book her .in -0.4i sister was reading, but it had no pictures or conversations in it, `and what is the use of a book,' thought Alice `without pictures or conversation?' .sp So she was considering in her own mind (as well as she could, ...
家に帰って junet 時代のドキュメントを眺めていたら,
吉田茂樹さん
*1
が書かれた「msマクロを使用した文書の書き方」
という文書があるのを発見した。(1988年)
これは今探すと,
http://ftp.riken.jp/pub/misc/Japan/JUNET-DB/troff/
などに置いてある模様。
この中から必要なファイルを取ってきて make を実行すると, ms.tut.ms が処理
されて文書が得られます。結果を ps->pdf 化したものが
こちら。
(pdf)
これは日本語でmsの各種マクロの意味が解説されており, 特殊文字の一覧や
必要になる troff コマンドの解説も含まれているので, troff についてはかなり役に
立ちそうです。
言うまでもないですが, roff,tbl,eqn 等については "The Unix Super Text"(下)の48章に
簡単な解説が含まれています。
*2
他に, me マクロパッケージについては, /usr/share/doc/groff-1.18.1/ の下に
meintro.ms が置いてあって(私の環境の場合), % troff -me -Tps meintro.ms でタイプセット
して読めるようです。me の方が, 現代のLaTeXの文書に近いような感じです。
また, メモ代わりですが, ベル研のテクニカルレポートのページ
http://cm.bell-labs.com/cm/cs/cstr.html
にも各種文書が集まっている模様。
上の junet の文書は前に
はらださん
に教えてもらったものですが,
僕もそれまで聞いたことがなかったし, かなり知られていないような気がします。
「コアラ大将のTCP/IP入門」とか昔は有名だったらしいですが, 今も役に立つかは
微妙。
「おヒマならMHを使ってよネ!」は
このへん
に置いてありました。w
言語モデルでは, 一般に文頭と文末に特殊な文字があると考えるので,
途中の文字の省略も含めて, 言語モデルでデコードしてやると高確率で元に戻せる
のではないかと思う。(追加と違って本質的に情報が落ちているので, 確実な復元は
無理ですが..。)
ずっと前に書いた
似非中国語化
ではないですが, 「常考」とか「感感俺俺」とか, 実際に省略が起きている例は
あるかもしれない。
「石こは無か」って何だろう, と思っていたら, 突如
「流石にこれは無理か」の省略だとわかった。人間恐るべし。(笑)
僕の原稿は伊庭さんからいただいたタイトルはこの日記の通り,
「生きたことばをモデル化する」だったのですが, 最後に編集部の要望で
「言葉」に直すように押し切られてしまって, 今でも激しく後悔。
本文の冒頭も下の画像のように本当は全部「ことば」で, もっと読みやすく,
イメージの湧きやすい表現でした。
*1
漢字になったことで, "言語に限定した話"という印象を与えなければ
いいのですが..。;
雑誌記事というと, 前に
工藤君
が月刊「言語」にcabochaの紹介を書いたのを思い出しますが,
同じ chasen.org でも, 書く雑誌といい, 内容の方向性といい,
いい意味で対照的だなぁと思います。
考えてみると, 去年のこの時期もNC研招待講演→CS研所長面接で大変だったので, そういう時期なのかもしれません。
体感的にはかなりの速度で(というか, 車内の音がうるさいというか),
最高速度は130km/hだそうですが,
所要時間は「たまたま」45分だったのではなく,
45分で行けるようにせよ, という至上命題があって, それに合わせて
速度や路線等を調節したのではないか, と想像。
実際, 都心からの所要時間が45分から60分程度になるにつれて, その土地の価値が
ロジスティック曲線のように急速に減少するはずで,
*1
このリミットを守るのは非常に大事だったのではないかと思う。
それより気になったのは, TXのイメージカラーが赤だということ。
赤は車体だけでなく, 駅名のプレートの背景など各種表示に使われているのですが,
イメージに合わないし, 気分的に疲れる色です。
北関東の原野を走る電車なのだから, 緑を全体のイメージカラーにして,
駅名などの背景は薄いグリーンにした方が絶対に合っているし,
上品で沿線のイメージも上がると思うのですが,
どうして赤色にしたのか理解に苦しみます。
常磐線の緑と重なってもいいと思いますし, つくばエクスプレスの
概要のページ
を見ても「環境共生鉄道」と謳っているのだから, それと最も遠い色である
赤を選ぶというセンスはどうか, と。沿線の住民にとっては非常によく目にし,
人々の生活意識に大きく影響を与えることになる色だけに,
充分な考慮や説明もないまま選ばれているように見えるのは
残念な感じがします。
ちなみに貞光君が教えてくれたTX音頭
(youtube)
っていったい..(笑)。
G_0 ~ DP(β,H)とDPからサンプルされたもの。
G_j ~ DP(β,H) (j = 1,..,∞)を stick-breaking で混ぜ合わせた G_0 からGをサンプルする。 イメージ的には, HDPで一つしかなかった共通の base measure をスペクトル分解して グループ毎のDPに分ける, というようなこと。 G ~ DP(α,G_0), G_0 〜 DP(β,H) なので, 合わせると G ~ DP(α,DP(β,H)) になり, Nested DPになる。 ここではサンプルした各G毎に, 使ったbase measureの混合要素 G_j が決まり, Gを使ったDPのクラスタリングに加え, G自体がクラスタリングされることになる。
nDPは数ヶ月前に自分で読んだ時には, HDPとの違いが全然分からなかったのですが,
これで理解できるようになった。
ていうかこれだけノンパラメトリックベイズをやってきても分からなかったなんて,
テクニカルすぎだろ常識的に考えて‥(笑)。
タイトル一覧 |