単項マイナスと構文解析
単項マイナスとは 単項マイナスと括弧 括弧なし単項マイナスを許容する場合のBNF calcの場合
if〜elsif〜・・・〜else〜endは皆さん良く使うでしょうか? これは場合分けで良く使われる方法です。 これと同様の制御構造にcase文があります。 Cのswitch文に似ていますが、より強力な機能を持っています。 if-else-endよりも高い能力があるといえます。
case文は次のような構造で使います。
case [式]
[when 式 [, 式] ...[, `*' 式] [then]
式..]..
[when `*' 式 [then]
式..]..
[else
式..]
end
===
メソッドを使う(==
ではない)。
===
メソッドのレシーバはwhen節の式の値となるオブジェクトである。
case文の後の式は===
メソッドの引数となるこれより、次のcase文とif-else文はほぼ同等です。
case x
when 1 then p "x is 1."
when 2 then p "x is 2."
else p "x is not 1 or 2."
end
if 1 === x then p "x is 1."
elsif 2 === x then p "x is 2."
else p "x is not 1 or 2."
end
なお、when節の式の前にアスタリスク(*
)を付けると、式は展開されます。
when *[1,2,3] => when 1,2,3 となる
case文のような構造を条件分岐ともいいます。 条件分岐はプログラムで最も良く現れる構造です。
==
と===
はオブジェクトごとにメソッドとして定義されています。
ほとんどのメソッドの祖先であるObjectクラスでは、===
は==
の別名になっていますので、その子孫クラスで===
を独自に定義していなければ===
と==
は同じ動作をします。
===
が==
と違うのはビルトイン・クラスでは次のものです。
==
はオブジェクトとして等しいかどうかを返す。
===
は右辺を引数にメソッドオブジェクトを実行した結果を返す==
は同じモジュールかどうかを返す。
===
は右辺がそのモジュールのサブクラス(子だけでなく子孫すべて)のインスタンスであるときtrueを返す。
すなわち、A===b
とb.kind_of?(A)
は同じ値を返す。
なお、ClassクラスはModuleのサブクラスで===
メソッドを継承しており、同様に使うことができる
RefinementクラスもModuleのサブクラスで===
メソッドを継承しているが、このクラスを使うのはライブラリなどに限ると思われる==
はオブジェクトとして等しいかどうかを返す。
同じ手続きを表すProcオブジェクトでも異なるインスタンスはfalseになる。
p proc{|x| x*x} == proc{|x| x*x} #=> false
。
実際問題として==
はほとんど役に立たない。
===
は右辺を引数にProcオブジェクトを実行した結果を返す。
Methodクラスの実装と考え方は全く同じ==
は同じ範囲を表していればtrueを返す。
すなわち、それぞれの端が同じ(==
)であり、端の含み方が同じ(..
なのか...
なのか)ときにtrue。
===
は引数がRangeオブジェクトの範囲の中にあればtrue。==
は正規表現として同じであればtrueを返す。
===
は引数の文字列またはシンボルがマッチすればtrueを返す。
if文では良く=~
が用いられるが、=~
と===
はほとんど同じ(ただ返し値は異なる)。===
はcase文専用です。
ですので、完全なイコールでなく、マッチに近いメソッドになっています。
特にProcは非常に柔軟なマッチを可能にしています。 Methodも同様ですが、Procの方がよく使われるのではないかと思います。
Rubyの変数は任意のオブジェクトを代入できます。 これは変数自体には型がないということです。 そのため、コンパイル時にメソッドの引数の型をチェックすることができません。
※ Rubyはソースを中間コードにコンパイルしてから実行しています
C言語は変数に型があり、パラメータに対しても型を指定できます。
int square (int x) {
return x*x
}
このCの関数のパラメータは整数型です。 コンパイル時にこの関数を整数型以外の引数で呼び出している文があれば、エラーになります。
Rubyでは、このようなチェックは実行時に行うしかありません。 メソッドの最初に引数のオブジェクトがどのようなクラスのオブジェクトかを調べます。 次の例は引数を2乗して返すメソッドです。
# 引数を2乗して返すメソッド
def square x
case x
when Numeric
x*x
else # impossible to calculate, return nil
return nil
end
end
p square("abc") #=> nil (文字列は数字でない)
p square(2) #=> 4
p square(1.2) #=> 1.44
p square(Complex("1+2i")) #=> (-3+4i) 複素数も計算できる
p square(Rational("2/3")) #=> (4/9) 分数(有理数)も計算できる
数字のクラスInteger(整数)、Float(浮動小数点数)、Complex(複素数)、Rational(有理数)はすべてNumeric(数)のサブクラスです。
when Numeric
の節では、上記の4つのオブジェクトであるかをひとつのチェックで済ましています。
else
(それ以外)のときはnilを返すことにします。
これは積極的なエラー対策ではなく、呼び出し側にエラー処理を任せるやり方です。
squareを呼び出したとき、文字列ではnilが返り、整数、浮動小数点数、複素数、有理数では2乗された値が返されています。
このような引数のクラスチェックは特にライブラリでは重要です。 ライブラリの作成者と使用者は異なるのが普通であり、作成者に予想外の使われ方をするかもしれません。 そのためこのようなチェックは非常に重要になります。
Procオブジェクトを使うと複雑な条件を作ることができます。
次の例は配列の各要素を2乗するメソッドsquare_elements
です。
各要素を2乗するだけなら、配列のmapメソッドで簡単に実現できますが、要素に数以外のものが入っているとエラーが起こります。 そこで、配列の要素がすべてNumericのサブクラスのインスタンスかどうかを調べます。 そのためにProcオブジェクトを使います。
@is_array_of_Numeric = lambda do |a|
return false unless a.instance_of? Array # lambdaではreturnで手続きオブジェクトを抜けることができる
b = a.map{|e| e.kind_of?(Numeric)}.uniq #要素のクラスの配列を作り、重複を除く
case b.size
when 0 then false # 空の配列だった
when 1 then b[0] # true(Numericクラス)かfalse(そうでない)を返す
else false # Numericとそうでない要素が混じっていた
end
end
def square_elements a
case a
when @is_array_of_Numeric
a.map{|x| x*x}
else
a
end
end
p square_elements([1,2,3]) #=> [1, 4, 9]
p square_elements([1.0, 2,Complex("2+3i"),Rational("5/7")]) #=> [1.0, 4, (-5+12i), (25/49)]
p square_elements(["a","b","c"]) #=> ["a", "b", "c"]
p square_elements([[1,2],[3,4],[5,6]]) #=>[[1, 2], [3, 4], [5, 6]]
p square_elements([[1,"2",3.0]]) #=> [[1, "2", 3.0]]
インスタンス変数(@つき変数)をProcオブジェクト名に使っているのは、メソッド定義の中で参照できるようにするためです。 型チェックはかなり複雑です
これをメソッドの中で書くこともできますし、例のようにメソッドの外でProcオブジェクトにすることもできます。 もちろん、メソッドの中でProcオブジェクトを生成しても良いのですが、メソッドがコールされるたびにProcオブジェクトが生成され、効率が悪くなります。 このチェックが複数のメソッドで必要ならば、このようにメソッド外でProcオブジェクトを作るのが有効なやり方です。
字句解析は、主にプログラミング言語の処理系で行われます。 例えば、次のようなRubyプログラムをrubyが処理することを考えてみましょう。
ab = 10 * cd
このとき、これを次のように解析します。
文字列 | タイプ |
---|---|
ab | 識別子 |
= | 等号 |
10 | 整数 |
* | 掛け算 |
cd | 識別子 |
この表はruby処理系の実際の動作を説明するものではありません。 あくまでも、字句解析の例として提供するものです。
「識別子」は定数名、変数名やメソッド名などに用いられる文字列です。
字句解析は頭から順にその言語の要素になるもの(トークンという)を取り出し、そのタイプと内容を返していくものです。
ここでは、簡単な電卓プログラムの字句解析を考えてみましょう。 電卓には、変数、整数、四則、代入、表示ができるとします。
トークン | タイプ | 内容 |
---|---|---|
英文字列 | :id | 変数名 |
数字の文字列 | :num | 整数 |
+ | :’+’ | 加算記号 |
- | :’-‘ | 減算記号 |
* | :’*’ | 乗算記号 |
/ | :’/’ | 除算記号 |
( | :’(‘ | 左括弧 |
) | :’)’ | 右括弧 |
= | :’=’ | 代入 |
表示命令 |
全部で10種類のタイプのトークンがあります。 入力文字列を分析し、トークンの列の配列resultを返すメソッド「lex」を作ってみます。
例えば、入力が
abc = (2+3)*6
print abc
であったとき(つまり文字列"abc = (2+3)*6\nprint abc\n"
であったとき)、lexの出力は
[[:id, "abc"], [:"=", nil], [:"(", nil], [:num, 2], [:+, nil], [:num, 3], [:")", nil], [:*, nil], [:num, 6], [:print, nil], [:id, "abc"]]
になります。 字句解析の流れは、入力の最初の文字に対するcase文の条件分岐が主になります。
def lex(s)
result = []
while true
break if s == ""
case s[0]
when /[[:alpha:]]/
m = /\A([[:alpha:]]+)(.*)\Z/m.match(s)
if m[1] == "print"
result << [:print, nil]
else
result << [:id, m[1]]
end
s = m[2]
when /[[:digit:]]/
m = /\A([[:digit:]]+)(.*)\Z/m.match(s)
result << [:num, m[1].to_i]
s = m[2]
when /[+\-*\/()=]/
result << [s[0].to_sym, nil]
s = s[1..-1]
when /\s/
s = s[1..-1]
else
raise "Unexpected character."
end
end
result
end
p lex("abc = (2+3)*6\nprint abc\n")
/[[:alpha:]]/
は英字(大文字小文字の両方可)にマッチする正規表現。/\A([[:alpha:]]+)(.*)\Z/m
において、\A
と\Z
はそれぞれ文字列の先頭と末尾にマッチ。
[[:alpha:]]+
は1文字以上の英字の繰り返しにマッチ。
.*
は任意の文字の0個以上の繰り返しにマッチ。
.
はデフォルトでは改行にマッチしないが、正規表現の最後にmオプションがつくときは、改行にもマッチする。
()
が2箇所にあるので、MatchDataオブジェクトの[1]
と[2]
でマッチした部分文字列を参照できるm[1]
がprintであれば、予約語なので[:print, nil]
を配列result
に加える。
printでなければ、変数なので[:id, m[1]]
、すなわち識別子タイプを表す:id
と変数名の文字列をセットにしてresultに加える。
s = m[2]
でsにはマッチした文字列を除いた残りを代入する/[[:digit:]]/
は数字(0-9)にマッチ。
変数のときと同様に数字の並びを取り出し、:num
タイプと整数値をセットにしてresultに加える/[+\-*\/()=]/
は四則、括弧とイコールのどれかにマッチする。
それぞれの記号を表すシンボルをタイプとし、nilとセットにし、resultに追加する。
`s[1..-1]は先頭の1文字を削除し、次の文字から最後の文字までを返す/\s/
は空白文字にマッチ。
空白文字にはタブや改行も含まれる。
この文字は区切りとしての意味しかない。
resultに付け加えるものは何もないこの例では、正規表現をcase文に使いました。
===
は正規表現のマッチを意味するので、このようにwhen節に使うことができます。
以上case文を見てきましたが、if-else-end文よりも条件のチェック部分に工夫があります。
これは具体的には===
メソッドで実現されています。
もし、新たにクラスを作成する時に、そのオブジェクトがwhen節で使える可能性があれば、かならず===
メソッドを定義してください。
単項マイナスとは 単項マイナスと括弧 括弧なし単項マイナスを許容する場合のBNF calcの場合
パーサ・ジェネレータとは 少し複雑な文法 四則(加減乗除)計算のBNF Racc で実装 クラス定義、BNFの記述部分 ヘッダー、インナー、フッター コンパイルと実行 演算子の優先順位と結合における左右の優先順位 まとめ
StrScanライブラリのドキュメント 字句解析とは StrScanライブラリ StrScanライブラリを使った字句解析 実例
lbtというgemを作って公開してみた lbtはどんなgemか ファイルの配置 lbt.gemspec Rakefile gemのビルド RubyGems.orgへのアップロード 補足・・rake/gempackagetaskサブライブラリについて
文字列のエンコーディングに頭を悩ませることはほとんどなくなりました。 なぜなら、どのアプリ、システムもUTF-8を使うようになったからです。 Rubyでもエンコーディングの問題が起こることはまず無いでしょう。 ですが、今回はエンコーディングの考え方を整理してみたいと思います。
Fiberを書いたときから、次はスレッドを書こうと思っていましたが、時間がかかってしまいました。 その理由は、期待したとおりのスレッドの効果がなかったためです。 今回はそのことを書きますが、これはRubyのスレッドの抱えている問題なのか、自分のやり方が悪いのかははっきりしていません。
Fiberは「ノンプリエンプティブな軽量スレッド」とRubyのマニュアルに記載されています。
今回はRubyプログラムから自動的にドキュメントを作成するRDocについて書きたいと思います。 私はこのことについて、エキスパートではありません。 この記事も、初心者の体験談だと考えてください。
Ruby/Gtkの記事を先日書いたときに、「これはかなり使える」という手応えを感じたので、WordBook(Railsで作った単語帳プログラム)のGTK 4版を作りました。 プログラムは「徒然なるままにRuby」のGitHubレポジトリに置いてあります。 レポジトリをダウンロードし、ディレクトリ_example/...
今回はGTK 3とGTK 4をRubyで使うライブラリについて書きたいと思います。
今回もRubyとGUIのトピックです。 Glimmerを取り上げます。
Rubyはグラフィックについて弱い印象があります。 しかし、グラフィックはデバイスに関することなので、言語そのものには直接の関係はないはずで、あるとすればライブラリです。 今後グラフィック関係のgemが開発されることに期待しましょう。
Rails7におけるシステムテストについて書きます。
前回作ったWordbook(リソースフル)のテストを書いてみます。 RailsのテストはminitestをRails用に拡張したものです。
今回はRailsの慣例に沿った形でWordbookを作り直します。
今回はWordBookの検索と削除についてです。
今回はRailsにおけるデータの作成と保存、そして変更について説明します。 そのベースになるモデルとデータベースの話から始め、appendとchangeの動作について詳しく説明します。
一般に、HTMLは文書の構造を表し、CSSはその体裁(見栄え)を表します。 Railsは最終的にCSSを含むHTML文書を出力するので、この2つについての理解が必須です。 この記事ではとくにCSSの人気ライブラリであるBootstrapを紹介します。 BootstrapはJavascriptも含んでいます。
Rubyの最も人気のあるアプリケーションであるRuby on Railsを取り上げようと思い、書き始めました。 予想してはいましたが、相当な分量になってしまいました。 そのため、何回かに分けて記事にすることにします。 また、対象となる読者のレベルをどうしようかと考えましたが、「徒然Ruby」が基礎的な内容から始ま...
Rubyのライブラリ管理システムのRubygemsとコマンドgemおよびbundlerについて説明します。
minitestについて連続して2回書いてきました。 「minitestはドキュメントが少ない」という人がいますが、私も同感です。 例えば、モックとスタブの説明も少ないです。 そこで、今回はmock.rbのソースコードを参考に、モックの私的ドキュメントを書いてみました。 あくまで私個人の考えであり、minites...
今回もminitestの話です。 mockとstubに焦点をあて説明します。
アプリ作成の記事でminitestを使いました。 今回はminitestについて、また一般にテストについて、私の考えを書こうと思います。
今回はメソッドの呼び出し制限ついて説明します。 呼び出し制限にはpublic、private、protectedの3つがあります。
今回は特異メソッド、特異クラス定義、名前空間、モジュール関数について説明します。
2023/10/29 追記:この記事は新しく書き直しました。 古い記事で使っていたGitHubのCalcが大幅にアップデートされたためです。 そこで、この記事に合うようなプログラムsimple_calcを新たに作りました。 このプログラムは本レポジトリの_example/simple_calcにあります。
if〜elsif〜・・・〜else〜endは皆さん良く使うでしょうか? これは場合分けで良く使われる方法です。 これと同様の制御構造にcase文があります。 Cのswitch文に似ていますが、より強力な機能を持っています。 if-else-endよりも高い能力があるといえます。
Procオブジェクトを生成するメソッドlambdaについて説明します。
今回はブロックを一般化したオブジェクトProcを説明します。
ブロック付きメソッドの作り方を説明します。
モジュールには名前空間とミックスイン(Mix-in)の2つの機能があります。 ここではミックスインについて説明します。
クラスの親子関係
Rubyの演算子とその再定義について書きます。
今回からクラスとインスタンスを定義、生成する方法を説明します
Kernelモジュールのメソッドはどこでも使うことができます。 そのメソッドの中には便利で有用なものが多いです。
ここでは私が便利だと思ったメソッドを紹介します。
実数
今回はシンボルとハッシュについて説明します。
文字列は最も使うオブジェクトのひとつです。 特にウェブ・アプリケーションでは、コンテンツだけでなくHTMLのタグやCSSを含めすべてが文字列です。 Rubyは文字列オブジェクトのメソッドが充実しており、またパターンマッチのための正規表現も充実しています。
配列は、どのプログラミング言語にもあると思います。 複数の要素を一括して扱うことができるのが配列です。 Rubyの配列はメソッドが充実しているので、プログラムを効率的、機能的に書くのに役立ちます。
今回の目標はインスタンスです。 インスタンスを説明するために、ローカル変数と文字列オブジェクトを事前に扱います。
今回はメソッド定義です。 メソッド定義はRubyの核心ですが、今回はトップレベルに限って説明します。 この限定によって、内容はかなり易しくなっています。
ブロックはRubyの特長です。 ブロックのおかげで記述が非常にすっきりと分かりやすくなります。 今回はブロックをイテレータの本体として使う方法を説明します。
ここではRubyの最も基本的なオブジェクトである整数について説明します。
「徒然なるままに」をネットで調べてみると、「することもなく、手持無沙汰なのにまかせてという意味」とありました。 まさに、自分の現状を言い当てた言葉。 しかも、ブログに書くネタもなかなか思いつかない日々。