コマンド
$0 datafile
$0 < datafile
cat datafile | $0
オプションに関して
[入力に関係するオプション]
-= : 先頭行をヘッダ(列名の並びなどでありデータでは無い)と見なして処理
-@ num : 入力ファイルを読む際に、何行毎に標準エラー出力に報告を出すか。未指定なら1000万行毎。
-l ファイル名 : 個数を数える文字列の対象を含んだファイル名を指定する。出力順序がファイルの各行に記載の順序になる。
-l は、プロセス置換 <( ) を使うと便利。; -l により、メモリを節約できる。; -l と -@ が共にあると、見つかった行数しかざたない。
-i str ; 入力区切り文字
[出力のオプション]
-f : 出現数で整列する
-j : 出力表の列名を英語から日本語にする。
-k : キー文字列で整列する
-n : キー文字列を数と見なして整列する
-~ : 上記を逆順にする。
-y 数値範囲 : 頻度が指定回数のもののみ出力。例 -y 1..3 なら3以下。 3.. なら3以上。2,4,6..8 なら2と4と6,7,8。
-a : 累和を出力 (accumulative sum)
-% : データ件数全体に対する割合を出力
-0 0 : 出力の先頭行に変数名の並びなどを出力しない。
-1 : 個数を出力しない。出現したキー文字列のみ出力。
-2 0 : 最後の二次情報を出力しない。
-, 0 ; 3桁区切りのコンマを消す。
-: ; 文字列の出現行の位置の範囲を出力するようにする。
-q char ; 元の文字列をchar で囲む。\'や\"を使って指定するか、"'"か'"'を使う。
[派生のオプション]
-x N,G ; Nはカラムの切断位置(左から何番目の区切りで切るか), Gは残った文字列を何通り取り出すか。Gが未指定なら12。
その他: * freqfreq のような、頻度の頻度を出力するオプションを作りたい。オプションは -F で表したい。 * Ctrl+Cの挙動を文書化したい。 * -1 で動作ミスがある疑いがあったが、-100(-1 -0 0)とオプションを与えると解消した。 * -x で、右側文字列のランキングについて、十分なオプションを設計する必要がある。 * -x で [..]xN の書式の出力の仕方について、もっと柔軟にしたい。